コンテキストウィンドウ
コンテキストウィンドウとは、LLMが1回のリクエストで処理できる入力トークンと出力トークンの最大数です。ユーザープロンプト、システムプロンプト、過去の会話、RAGで取得したドキュメント、そして生成された回答を、すべて同時に保持します。
コンテキストウィンドウとは、LLMが1回のリクエストで処理できる入力トークンと出力トークンの最大数です。ユーザープロンプト、システムプロンプト、過去の会話、RAGで取得したドキュメント、そして生成された回答を、すべて同時に保持します。
なぜ重要なのか
コンテキストウィンドウはLLMの「短期記憶」です。AI検索エンジンがクエリに答えるときにどれだけ多くのウェブページを考慮できるか、どれだけ長いドキュメントを要約できるかを決定します。2023年には4K〜8Kトークンが標準でしたが、2026年には100万トークン以上が標準となり、LLMが参照する情報源の幅と深さを根本的に変えています。GEOにとってこれは、AI検索が今や多くの競合ページを一度に比較してどれを引用するかを決めることを意味し、ドキュメントの構造とセクションの品質が決定的な要因になります。
モデル別のコンテキストウィンドウ(2026年)
| モデル | コンテキストウィンドウ |
|---|---|
| Claude Opus 4.6 | 100万トークン |
| Gemini 3 | 100万〜200万トークン |
| GPT-5 | 40万トークン |
| Llama 4 | 12.8万〜100万トークン |
100万トークンはおよそ75万語の英単語、つまり400〜500ページの書籍に相当します。
単語ではなくトークン
コンテキストウィンドウは単語ではなくトークンで測定されます。英語は1単語あたり平均で約1.3トークンですが、韓国語や日本語のような言語は1文字あたり約1.5〜2トークンを使うため、同じページの長さでも非英語のコンテンツは予算をかなり多く消費します。
GEOへの示唆
ドキュメント全体が処理される: かつてLLMは上位のスニペットしか見ませんでしたが、今はページ全体を読んで引用する最良のセクションを選びます。ドキュメント全体にわたる構造の明確さが重要です。
競合との直接比較: 大きなコンテキストウィンドウにより、モデルは同じクエリに対して多くの競合ページを一度に比較できます。勝つことは「優れている」ことではなく、他の選択肢よりも構造的に引用しやすいことです。
前置きがより重要に: LLMは前方のトークンをより重視します。核心となる定義と回答を、ドキュメントの最上部に置きましょう。
「ロスト・イン・ザ・ミドル」: 大きなコンテキストのモデルでさえ、ドキュメントの中間に埋もれた情報については劣化します。重要なコンテンツは、中間ではなく冒頭か末尾の近くに置くべきです。
Sources: