コンテンツシグナル
コンテンツシグナル(Content Signals)とは、robots.txtを拡張し、クローラーが取得したコンテンツを検索(search)・AI回答(ai-input)・AI学習(ai-train)のうちどの用途で使うことを許容するかを、機械が読める形式で宣言するポリシー標準です。Cloudflareが2025年9月24日に発表しました。
コンテンツシグナル(Content Signals)とは、robots.txtを拡張し、クローラーが取得したコンテンツを検索(search)・AI回答(ai-input)・AI学習(ai-train)のうちどの用途で使うことを許容するかを、機械が読める形式で宣言するポリシー標準です。Cloudflareが2025年9月24日に発表しました。
なぜ重要なのか
従来のrobots.txtは「どのクローラーがどのパスにアクセスできるか」を表現できるだけで、取得したコンテンツがどう使われるかは扱えませんでした。問題は、1つのクローラーが複数の用途を兼ねる点です。たとえばGoogleは検索インデックスとAI機能に同じクローラーを使うため、AIクローラーを丸ごとブロックする方法では、「検索の露出は維持しつつAI学習だけ拒否する」という選択ができませんでした。コンテンツシグナルは、アクセス主体ではなく使用用途の単位で許諾を宣言できるようにして、この空白を埋めます。AI時代にコンテンツの所有者がどのようにコントロールを取り戻すか、という議論の一角を占める標準です。
3種類のシグナルと書き方
- search: 検索インデックスの構築と検索結果の提供。AIが生成する要約は含みません。
- ai-input: コンテンツをAIモデルに入力し、リアルタイムの回答生成に活用すること(グラウンディング、RAGなど)。
- ai-train: AIモデルの学習またはファインチューニングに使用すること。
robots.txtの中に、カンマで区切ったyes/no形式で記述します。
Content-Signal: search=yes, ai-input=yes, ai-train=no
User-Agent: *
Allow: /
シグナルを省略すると、その用途について許諾を表明していないものとみなされます。Cloudflareは、マネージドrobots.txtを使う380万以上のドメインにsearch=yes、ai-train=noをデフォルトとして適用し、ai-inputは運営者が自分で決められるよう空欄にしています。
限界とGEO視点
コンテンツシグナルは許諾の宣言であって技術的な遮断手段ではないため、これを無視するクローラーを止めることはできません。ただし、機械可読な形式での明示的な意思表示である点で、今後コンテンツ使用をめぐる紛争で根拠になりうるものであり、Cloudflareもボットブロックやペイパークロールといった強制手段とあわせて使うことを前提に設計しています。GEOの観点での核心は、ai-inputが諸刃の剣だという点です。AI回答に引用されることが目標なら、ai-inputを拒否した瞬間にAIクローリングを経て回答に引用される機会そのものが失われます。そのため、ブランドの可視性が目的のサイトはsearch=yes、ai-input=yesを維持し、ai-trainだけを選択的に拒否する構成が一般的です。
Sources:
How inblog Helps
inblogで発行するブログは、ほとんどが検索とAI回答の両方での露出を目的とするため、コンテンツシグナルを適用するなら、searchとai-inputを開けておく構成が自然です。inblogの自社アナリティクスでAIチャネル経由の流入を確認すれば、ai-inputを許可した選択が実際の流入につながっているかをデータで検証でき、GSC連携で検索の露出まで一つの画面で管理できます。