Index Bloat
Index Bloat ist der Zustand, in dem minderwertige, doppelte oder geringwertige Seiten in solchen Mengen in Googles Index landen, dass sie die Qualitätsbewertung der gesamten Website nach unten ziehen. Es tritt bei Blogs, E-Commerce- und Unternehmensseiten auf, wenn URLs unbeabsichtigt in die Tausende explodieren, und es ist einer der heimtückischsten Ranking-Killer in der technischen SEO.
Index Bloat ist der Zustand, in dem minderwertige, doppelte oder geringwertige Seiten in solchen Mengen in Googles Index landen, dass sie die Qualitätsbewertung der gesamten Website nach unten ziehen. Es tritt bei Blogs, E-Commerce- und Unternehmensseiten auf, wenn URLs unbeabsichtigt in die Tausende explodieren, und es ist einer der heimtückischsten Ranking-Killer in der technischen SEO.
Warum es wichtig ist
Google behandelt die durchschnittliche Qualität der gesamten Website als Ranking-Signal. Wenn 100 starke Beiträge neben 5.000 bedeutungslosen URLs indexiert werden, schließt Google daraus: "Die durchschnittliche Qualität dieser Website ist niedrig" — und die Rankings sinken sogar für Ihre guten Beiträge. Dieser Effekt hat sich seit dem Helpful Content Update von 2024 verschärft. Bloat verschwendet außerdem Crawl-Budget für wertlose URLs und verzögert das Crawling und die Indexierung neuer Beiträge.
Häufige Ursachen
Filter- und Sortierparameter: URLs wie ?sort=price_asc oder ?color=red&size=m aus der Faceted Navigation werden indexiert.
Interne Suchergebnisseiten: /search?q=keyword-Seiten, die Google ausgesetzt sind. Google empfiehlt offiziell, interne Suchergebnisse auf noindex zu setzen.
Wucherung von Tags und Kategorien: Hunderte oberflächlicher Tag-Seiten mit nur jeweils 2 bis 3 Beiträgen.
Paginierungs-Duplikate: /blog?page=2, /blog?page=3 werden unabhängig als dünne Listenseiten indexiert.
UTM- und Tracking-Parameter: ?utm_source=...-URLs werden als separate Seiten behandelt.
Automatisch generierte Seiten: Vorlagenbasierte Seiten, die pro Nutzer, Produkt oder Region mit geringer Einzigartigkeit ausgespuckt werden.
Rückstände alter Domains: Alte URLs, die nach einem Redesign ohne 301-Weiterleitungen verbleiben.
Exponierte Dev-/Staging-URLs: staging.- oder dev.-Subdomains, die ohne noindex öffentlich sind.
So diagnostizieren Sie es
Search-Console-Abdeckungsbericht: Vergleichen Sie die "indexierte" Anzahl mit der tatsächlichen Anzahl Ihrer Kernseiten. Eine Lücke von mehr als dem Zehnfachen signalisiert Bloat.
site:-Abfrage: Führen Sie site:example.com aus, um eine Stichprobe der URL-Typen zu erhalten, die Google indexiert hat.
Screaming-Frog-Crawl: Crawlen Sie Ihre Website und vergleichen Sie die Anzahl der crawlbaren URLs mit der indexierten Anzahl.
Logdatei-Analyse: Ermitteln Sie, welche URL-Muster die Anfragen von Googlebot aufzehren.
So beheben Sie es
Noindex anwenden: Fügen Sie <meta name="robots" content="noindex"> auf Seiten hinzu, die nicht indexiert werden sollten (Suchergebnisse, oberflächliche Tags, spätere paginierte Seiten). Wichtig — noindex erfordert, dass die Seite in der robots.txt crawlbar ist.
Canonicals konsolidieren: Richten Sie die Canonicals von Parameter-URLs auf die repräsentative URL aus.
robots.txt Disallow: Blockieren Sie wiederkehrende Muster (?sort=, ?utm=) vollständig vom Crawling.
301-Weiterleitungen: Leiten Sie veraltete Seiten auf die am besten passende übergeordnete Seite weiter.
Content-Pruning: Löschen oder vereinen Sie wertlose Beiträge — setzen Sie die "Löschen"-Kennzeichnungen aus Ihrem Content-Audit um.
Parameter-Normalisierung: Standardisieren Sie auf Serverebene die Parameterreihenfolge und verwenden Sie Pfade in Kleinbuchstaben, um die Entstehung doppelter URLs zu verhindern.
Hinweise zur Umsetzung
Schrittweise vorgehen: Das Deindexieren tausender Seiten auf einmal kann als strukturelle Änderung gewertet werden und die gesamte Website-Autorität erschüttern. Rollen Sie es nach Kategorie oder Monat aus.
Erneutes Crawling anfordern: Nutzen Sie die URL-Prüfung der Search Console, um wichtige Änderungen zu beschleunigen.
Backlinks prüfen: Wenn eine Seite, die Sie löschen möchten, externe Backlinks hat, leiten Sie sie per 301 weiter, damit Sie die Link-Power nicht verlieren.
Sources: