ソフト404
ソフト404とは、サーバーがHTTP 200(OK)を返しているにもかかわらず、Googleがページのコンテンツを分析し、そのページは実質的に存在しないと判断する状態です。ページはブラウザで開けますが、Googleはそれを検索結果から除外し、Search Consoleのカバレッジレポートで「ソフト404」とマークします。
ソフト404とは、サーバーがHTTP 200(OK)を返しているにもかかわらず、Googleがページのコンテンツを分析し、そのページは実質的に存在しないと判断する状態です。ページはブラウザで開けますが、Googleはそれを検索結果から除外し、Search Consoleのカバレッジレポートで「ソフト404」とマークします。
なぜ重要なのか
ソフト404はグレーゾーン、すなわち「技術的には問題ないが、SEO的には壊滅的」な状態です。サイト所有者は「ページが読み込まれるから大丈夫」と思い込みがちですが、Googleはこれらのページをインデックスしないうえに、クロールバジェットの消費もやめません。これはドメイン全体のクロールとインデックスの効率を損ないます。Ahrefsによる大規模サイトの監査では、全URLの2〜8%がソフト404として日常的に分類されます。
ソフト404 vs ハード404 vs 200
| 状態 | HTTPコード | Googleの判断 | ユーザー体験 |
|---|---|---|---|
| 正常なページ | 200 | インデックス済み | コンテンツあり |
| ハード404 | 404 | インデックスから削除 | エラーページ |
| ソフト404 | 200 | インデックスから除外 | 薄い、または空のコンテンツ |
Googleの明確なガイダンス: 「ページが存在しない場合は404を返す。存在する場合は、実際のコンテンツを提供する」。ソフト404は、どちらの条件も満たされていない状態です。
よくある原因
在庫切れの商品ページ: 販売終了した商品のEコマースページが、200ステータスで「在庫なし」という一行のメッセージを返している場合。
空の検索結果ページ: サイト内検索が、200ステータスで「結果なし」というテキストを返している場合。
薄いコンテンツ: タイトルだけで本文がほとんどない投稿や、1枚の画像だけの投稿。
リダイレクトの欠如: 削除されたページが、本来の404ではなく、200ステータスで「ページが見つかりません」というテキストを返している場合。
JavaScriptレンダリングの失敗: SPAが、JSの読み込み前にGooglebotへ空の <body> を配信している場合。
ログインが必要なコンテンツ: 200ステータスで「アクセス拒否」というテキストを返しているページ。
テンプレートの乱立: ほぼ同じテンプレートで固有のコンテンツがほとんどない、地域別やカテゴリー別の数千ページ。
診断方法
Search Consoleのカバレッジレポート: 「除外」タブが「ソフト404」URLを直接フラグ付けします。
URL検査: 特定のURLをGoogleがどうレンダリングするかを、想定と比較します。
Screaming Frog: レスポンスコードでフィルタリングし、薄いコンテンツの200ページを見つけます。
HTTPコード + コンテンツ長のマトリクス: 200ステータスで本文テキストが閾値を下回るURLをフラグ付けするカスタム監査。
修正方法
本来の404を返す: ページが存在しない場合は、404(永続的な削除の場合は410)を返すようサーバーを設定します。これが最も確実な修正です。
301リダイレクト: 削除したページに価値のある被リンクがある場合は、エクイティを保全するため、最も関連性の高い親ページへ301リダイレクトします。
コンテンツの強化: 薄いページを実際の価値で埋めます。在庫切れページには、類似商品のおすすめを含めることができます。
noindex: サイト内検索の結果や薄いフィルターの組み合わせには、noindex メタタグを追加し、Googleの手を煩わせないようにします。
SSR/SSGへの切り替え: JSレンダリングの遅延が原因の場合は、サーバーサイドレンダリングへ移行します。
テンプレートページの削減: 自動生成された薄いページを統合または削除します。
Sources: