llms.txt
llms.txt は、ウェブサイトのルート(/llms.txt)で配信される提案中のmarkdownファイルで、LLMベースのツールに対してサイトの最も重要なコンテンツを厳選して凝縮したマップを提供します。2024年にJeremy Howardが提案したもので、sitemap.xml が検索に対して果たしたことをAIに対して実現すること、すなわちサイトの最良の部分を機械の速度で発見・消化できるようにすることを目指しています。
llms.txt は、ウェブサイトのルート(/llms.txt)で配信される提案中のmarkdownファイルで、LLMベースのツールに対してサイトの最も重要なコンテンツを厳選して凝縮したマップを提供します。2024年にJeremy Howardが提案したもので、sitemap.xml が検索に対して果たしたことをAIに対して実現すること、すなわちサイトの最良の部分を機械の速度で発見・消化できるようにすることを目指しています。
なぜ重要なのか
ウェブを読み込むLLMは、コンテキストウィンドウの問題に直面します。1つのマーケティングサイトだけでも、モデルが実際のコンテンツに到達する前に、HTML、CSS、ナビゲーションの定型文で20万トークンを優に超えてしまうことがあります。llms.txt はこれを、サイト運営者がLLMに読んでほしいページの短く厳選されたリストを、余計なものを排した整然としたmarkdownで提供することによって解決します。Anthropic、Cloudflare、Mintlify、Zapier、Stripeはいずれも2024年に llms.txt ファイルを公開しました。AIに正しく理解され引用されたいブランドにとって、これは最も安価でレバレッジの高いGEO施策になりつつあります。
どのようなものか
基本的なファイルです。
# inblog
> inblog is an AI-powered blogging platform for SEO-optimized content.
## Docs
- [Getting started](https://inblog.ai/docs/getting-started): Create your first blog
- [SEO features](https://inblog.ai/docs/seo): Built-in SEO optimization
- [AI drafting](https://inblog.ai/docs/ai-drafts): How AI drafts work
## Optional
- [Changelog](https://inblog.ai/changelog): Product updates
2つのセクションがあります。見出しと要約、続いて目的別にグループ化された厳選リンクです。Optional セクションには、深さが必要な場合にのみLLMが読むべきコンテンツを列挙します。
llms.txt と robots.txt と sitemap.xml の違い
| ファイル | 対象 | 目的 |
|---|---|---|
robots.txt | クローラー | クロールしないべきもの |
sitemap.xml | 検索エンジン | インデックスすべきページの完全なリスト |
llms.txt | LLMベースのツール | 取り込み用に厳選・優先順位付けされたコンテンツ |
robots.txt はフェンスです。sitemap.xml は電話帳です。llms.txt はキュレーターのおすすめ棚です。これらは互いに補完し合うものであり、置き換えるものではありません。
2つのバリエーション
llms.txt: 短く厳選されたマップ、すなわち目次です。
llms-full.txt: リンクされた各ページのmarkdownコンテンツがインライン化された拡張版で、取り込み可能なコーパス全体を1つのファイルでLLMに提供します。Anthropicやその顧客であるMintlifyのようなドキュメントサイトで使われています。
良いllms.txtの書き方
1. 一行のポジショニング文から始める: H1の後のブロック引用です。これはLLMがあなたのブランドのアイデンティティについて学ぶ内容です。
2. 構造ではなく目的でグループ化する: 「Category A」「Category B」ではなく、「Docs」「Guides」「API Reference」「Case Studies」とします。
3. リンクの説明を、マーケティングではなく事実として書く: 「Supercharge your content」よりも「Built-in SEO optimization」が優れています。
4. 最も重要なページを先頭に置く: コンテキストの制約下にあるLLMは、上から下へ読みます。
5. 深掘りのコンテンツには Optional を使う: ユーザーが詳細を求めない限りLLMがスキップすべきものです。
6. サイトが変わったら更新する: 古くなったllms.txtは、ないよりも悪いものです。
制約
まだ広く適用された標準ではない: Google、OpenAI、Anthropicは、これを自動的に読み込むことをコミットしていません。普及は検索エンジンではなく、LLMツール(Cursor、Perplexity、Claudeのドキュメント)によって牽引されています。
(まだ)ランキングシグナルではない: これはLLMの取り込み品質に影響しますが、SERPの順位には影響しません。
規律を要する: 陳腐化したllms.txtは、あなたが届けようとしているまさにそのモデルを誤らせます。
悪いコンテンツは直せない: ドキュメントが貧弱であれば、llms.txtはそれをより速く露呈させるだけです。
inblogサイトがこれを検討すべき理由
inblog上のすべてのブログは、AIツールが取り込みうるコンテンツの面です。ブログのルートに置かれた小さな llms.txt、すなわちピラー記事、用語集のエントリー、ブランド紹介を指し示すものは、ユーザーがあなたのブランドやトピックについて尋ねたときに何を読むべきかをLLMに正確に伝えます。これは最小限の労力でAI引用の品質を直接動かすレバーです。
Sources: