サイトマップ
サイトマップとは、ウェブサイト上のページ、画像、動画、その他のコンテンツのURL一覧を検索エンジンに提供する、構造化されたファイルです。検索エンジンのクローラーがサイトをより効率的に探索しインデックスするのを助ける「地図」として機能します。
サイトマップとは、ウェブサイト上のページ、画像、動画、その他のコンテンツのURL一覧を検索エンジンに提供する、構造化されたファイルです。検索エンジンのクローラーがサイトをより効率的に探索しインデックスするのを助ける「地図」として機能します。
なぜ重要なのか
検索エンジンはリンクをたどってウェブページを発見します。しかし、新しく作成されたページ、内部リンクが不十分な深いページ、数十万ページにおよぶ大規模サイトでは、クローラーがすべてのページを自然に発見するのが難しい場合があります。サイトマップはこれらのページを検索エンジンに直接伝え、クロール効率を改善し、インデックスの漏れを防ぎます。
サイトマップは特に、以下のような状況で不可欠です。
- 500ページ以上の大規模サイト
- 外部被リンクが非常に少ない新規サイト
- 画像や動画などのリッチメディアコンテンツが豊富なサイト
- コンテンツが頻繁に更新されるニュースサイト
サイトマップは発見と再クロールのヒントであり、インデックス登録を保証するものではありません。Googleはサイトマップ内のURLをクロールしても、品質、重複、カノニカルの選択、noindex指示、レンダリングの問題などを理由に、インデックスしないことを選ぶ場合があります。
種類
サイトマップには、目的に応じていくつかの種類があります。
XMLサイトマップ: 最も基本的で広く使われている形式です。<url>、<loc>、<lastmod> などのタグを使って、各ページのURLとメタデータを構造化します。
画像サイトマップ: 画像コンテンツを検索エンジンに特化して伝える形式です。画像検索での可視性を最大化したい場合に役立ちます。
動画サイトマップ: 動画コンテンツのタイトル、説明、再生時間などのメタデータを含み、Googleが動画をよりよく理解するのを助けます。
ニュースサイトマップ: ニュースパブリッシャー向けの特殊な形式で、過去2日以内に公開された記事のみを含めるべきです。
サイトマップインデックス: 単一のサイトマップファイルが50,000 URLまたは50MBを超える場合、複数のサイトマップをグループ化し、単一のインデックスファイルで管理します。
HTMLサイトマップ: 検索エンジンではなくユーザー向けに設計されたサイトマップです。サイトの主要なページへのリンクを集約したページで、ナビゲーションの利便性を高めます。
設定ガイド
ステップ1: サイトマップの生成
サイトマップを生成する方法は3つあります。1つ目は、CMSやフレームワークの組み込み機能、またはプラグイン(例: WordPressのYoast SEO)を使う方法です。2つ目は、Screaming Frogのようなクロールツールで自動生成する方法です。3つ目は、XMLファイルを手動で記述する方法で、小規模サイトに適しています。
ステップ2: 必須ルールの順守
- 1ファイルあたりのURLは50,000以下、ファイルサイズは50MB以下に保つ
- UTF-8エンコーディングを使用する
- URLは絶対パスで記述する(例:
https://example.com/page) - カノニカルURLのみを含める。リダイレクトするURLや重複ページは除外する
<lastmod>は、タイムスタンプが意味のあるコンテンツの変更を反映している場合にのみ使用する。不正確なタイムスタンプは、検索エンジンにそのシグナルを無視させる原因になります。
ステップ3: 配置と送信
サイトマップファイルをサイトのルートディレクトリ(例: https://example.com/sitemap.xml)に配置します。robots.txt ファイルに Sitemap: https://example.com/sitemap.xml を追加し、Google Search Consoleの「サイトマップ」メニューからURLを送信します。
ステップ4: 自動更新の設定
コンテンツが追加、変更、削除されるたびにサイトマップが自動的に更新されるよう設定します。<lastmod> タグに正確な更新タイムスタンプを使用し、検索エンジンが変更されたページの再クロールを優先するよう促します。
非常に大規模なサイトでは、URLを投稿、カテゴリー、画像、動画などの論理的な子サイトマップに分割し、サイトマップインデックスから参照します。Bingなどのエンジンは、より速い発見のためにIndexNowをサポートする場合もありますが、これはクリーンなXMLサイトマップと内部リンクを置き換えるものではなく、補完するものとして使うべきです。
よくある間違い
noindexページをサイトマップに含める: noindex タグの付いたページや robots.txt でブロックされたページをサイトマップに追加すると、検索エンジンに矛盾したシグナルを送ることになります。サイトマップには、インデックスしてほしいページのみを含めましょう。
リンク切れ(404)を含める: 削除されたページのURLがサイトマップに残っていると、Google Search Consoleが「送信されたURLが見つかりませんでした(404)」エラーを報告します。サイトマップを定期的に監査し、無効なURLを削除しましょう。
リダイレクトまたは非カノニカルURLを含める: サイトマップのURLは、最終的なカノニカルの移行先であるべきです。古いURL、トラッキングパラメータ付きURL、別のカノニカルバージョンを送信すると、クロールバジェットを浪費し、診断を煩雑にします。
日付形式のエラー: SEMrushの調査によると、XMLサイトマップのエラーの約62%は日付形式の問題に起因します。<lastmod> はW3C Datetime形式(例: 2026-03-17 または 2026-03-17T09:00:00+09:00)に従う必要があります。
URL形式の不統一: https と http、または www と非 www を混在させると、検索エンジンが同じページを別々のエンティティとして扱う原因になります。サイトマップ内のすべてのURLは、1つの一貫した形式を使うべきです。
サイトマップを生成したが送信しない: サイトマップファイルを作成しても、Google Search ConsoleやBing Webmaster Toolsに送信しなければ、検索エンジンがそれを発見するまでにかなりの時間がかかることがあります。
Sources:
- サイトマップとは | Google検索セントラル
- XMLサイトマップ: 何であり、どう生成するか - Semrush
- XMLサイトマップの作成方法(およびGoogleへの送信方法) - Ahrefs
- IndexNowドキュメント - Bing Webmaster Tools
関連するinblogの記事
inblogがどう役立つか
inblogは、投稿の公開や削除を自動的に反映するXMLサイトマップを動的に生成します。