SEO

ソフト404

ソフト404とは、サーバーがHTTP 200(OK)を返しているにもかかわらず、Googleがページのコンテンツを分析し、そのページは実質的に存在しないと判断する状態です。ページはブラウザで開けますが、Googleはそれを検索結果から除外し、Search Consoleのカバレッジレポートで「ソフト404」とマークします。

ソフト404とは、サーバーがHTTP 200(OK)を返しているにもかかわらず、Googleがページのコンテンツを分析し、そのページは実質的に存在しないと判断する状態です。ページはブラウザで開けますが、Googleはそれを検索結果から除外し、Search Consoleのカバレッジレポートで「ソフト404」とマークします。

なぜ重要なのか

ソフト404はグレーゾーン、すなわち「技術的には問題ないが、SEO的には壊滅的」な状態です。サイト所有者は「ページが読み込まれるから大丈夫」と思い込みがちですが、Googleはこれらのページをインデックスしないうえに、クロールバジェットの消費もやめません。これはドメイン全体のクロールとインデックスの効率を損ないます。Ahrefsによる大規模サイトの監査では、全URLの2〜8%がソフト404として日常的に分類されます。

ソフト404 vs ハード404 vs 200

状態HTTPコードGoogleの判断ユーザー体験
正常なページ200インデックス済みコンテンツあり
ハード404404インデックスから削除エラーページ
ソフト404200インデックスから除外薄い、または空のコンテンツ

Googleの明確なガイダンス: 「ページが存在しない場合は404を返す。存在する場合は、実際のコンテンツを提供する」。ソフト404は、どちらの条件も満たされていない状態です。

よくある原因

在庫切れの商品ページ: 販売終了した商品のEコマースページが、200ステータスで「在庫なし」という一行のメッセージを返している場合。

空の検索結果ページ: サイト内検索が、200ステータスで「結果なし」というテキストを返している場合。

薄いコンテンツ: タイトルだけで本文がほとんどない投稿や、1枚の画像だけの投稿。

リダイレクトの欠如: 削除されたページが、本来の404ではなく、200ステータスで「ページが見つかりません」というテキストを返している場合。

JavaScriptレンダリングの失敗: SPAが、JSの読み込み前にGooglebotへ空の <body> を配信している場合。

ログインが必要なコンテンツ: 200ステータスで「アクセス拒否」というテキストを返しているページ。

テンプレートの乱立: ほぼ同じテンプレートで固有のコンテンツがほとんどない、地域別やカテゴリー別の数千ページ。

診断方法

Search Consoleのカバレッジレポート: 「除外」タブが「ソフト404」URLを直接フラグ付けします。

URL検査: 特定のURLをGoogleがどうレンダリングするかを、想定と比較します。

Screaming Frog: レスポンスコードでフィルタリングし、薄いコンテンツの200ページを見つけます。

HTTPコード + コンテンツ長のマトリクス: 200ステータスで本文テキストが閾値を下回るURLをフラグ付けするカスタム監査。

修正方法

本来の404を返す: ページが存在しない場合は、404(永続的な削除の場合は410)を返すようサーバーを設定します。これが最も確実な修正です。

301リダイレクト: 削除したページに価値のある被リンクがある場合は、エクイティを保全するため、最も関連性の高い親ページへ301リダイレクトします。

コンテンツの強化: 薄いページを実際の価値で埋めます。在庫切れページには、類似商品のおすすめを含めることができます。

noindex: サイト内検索の結果や薄いフィルターの組み合わせには、noindex メタタグを追加し、Googleの手を煩わせないようにします。

SSR/SSGへの切り替え: JSレンダリングの遅延が原因の場合は、サーバーサイドレンダリングへ移行します。

テンプレートページの削減: 自動生成された薄いページを統合または削除します。

Sources: