SEO

インデックスの肥大化

インデックスの肥大化とは、低品質・重複・低価値なページが大量に Google のインデックスに入り込み、サイト全体の品質評価を引き下げてしまう状態です。URL が意図せず数千件に膨れ上がると、ブログ、EC サイト、エンタープライズサイトで発生し、テクニカル SEO において最も気づきにくいランキングキラーの 1 つです。

インデックスの肥大化とは、低品質・重複・低価値なページが大量に Google のインデックスに入り込み、サイト全体の品質評価を引き下げてしまう状態です。URL が意図せず数千件に膨れ上がると、ブログ、EC サイト、エンタープライズサイトで発生し、テクニカル SEO において最も気づきにくいランキングキラーの 1 つです。

なぜ重要なのか

Google はサイト全体の平均品質をランキングシグナルとして扱います。100 件の優れた投稿が 5,000 件の無意味な URL と並んでインデックスされていると、Google は「このサイトの平均品質は低い」と結論づけ、優れた投稿でさえ順位が下がります。この影響は 2024 年のヘルプフル コンテンツ アップデート以降、いっそう顕著になっています。肥大化はまた、価値のない URL にクロールバジェットを浪費し、新しい投稿のクローリングインデックス登録を遅らせます。

よくある原因

フィルタとソートのパラメータ: ファセットナビゲーションによる ?sort=price_asc?color=red&size=m のような URL がインデックスされます。

サイト内検索の結果ページ: /search?q=keyword のページが Google に公開されています。Google はサイト内検索結果を noindex にすることを公式に推奨しています。

タグとカテゴリの乱立: それぞれ 2〜3 件の投稿しかない、薄いタグページが何百も存在します。

ページネーションの重複: /blog?page=2/blog?page=3 が、薄い一覧ページとして個別にインデックスされます。

UTM とトラッキングパラメータ: ?utm_source=... の URL が別ページとして扱われます。

自動生成ページ: ユーザー、商品、地域ごとにテンプレートから量産された、独自性の低いページ。

旧ドメインの残骸: リニューアル後に 301 リダイレクトされずに残った古い URL。

公開された開発/ステージング URL: staging.dev. のサブドメインが noindex なしで公開されています。

診断の方法

Search Console のカバレッジレポート: 「インデックス登録済み」の件数を実際のコアページ数と比較します。10 倍以上の差があれば肥大化のサインです。

site: クエリ: site:example.com を実行し、Google がどの種類の URL をインデックスしているかをサンプル確認します。

Screaming Frog でのクロール: サイトをクロールし、クロール可能な URL 数とインデックス登録数を比較します。

ログファイル分析: どの URL パターンが Googlebot のリクエストを消費しているかを特定します。

修正の方法

noindex を適用する: インデックスすべきでないページ(検索結果、薄いタグ、後続のページネーションページ)に <meta name="robots" content="noindex"> を追加します。重要 — noindex には、ページが robots.txtクロール可能であることが必要です。

canonical を統合する: パラメータ付き URL の canonical を、代表となる URL に向けます。

robots.txt の Disallow: 繰り返しのパターン(?sort=?utm=)をそもそもクロールさせないようにブロックします。

301 リダイレクト: 不要になったページを、最も適合する親ページにリダイレクトします。

コンテンツの剪定: 価値のない投稿を削除または統合します。コンテンツ監査でつけた「削除」ラベルを実行します。

パラメータの正規化: サーバーレベルでパラメータの順序を統一し、パスを小文字に揃えて、重複 URL が生成されないようにします。

実行時の注意点

段階的に進める: 数千ページを一度にインデックス解除すると、構造的な変更と受け取られ、サイト全体の権威性を揺るがしかねません。カテゴリ別または月別に展開しましょう。

再クロールをリクエストする: Search Console の URL 検査を使い、重要な変更を早く反映させます。

バックリンクを確認する: 削除したいページに外部バックリンクがある場合は、301 リダイレクトしてその評価を失わないようにします。

Sources: