Context Window
Context window (контекстное окно) - это максимальное количество входных и выходных токенов, которое LLM может обработать за один запрос. Оно вмещает промпт пользователя, системный промпт, предыдущий диалог, документы, извлечённые через RAG, и сгенерированный ответ - всё сразу.
Context window (контекстное окно) - это максимальное количество входных и выходных токенов, которое LLM может обработать за один запрос. Оно вмещает промпт пользователя, системный промпт, предыдущий диалог, документы, извлечённые через RAG, и сгенерированный ответ - всё сразу.
Почему это важно
Контекстное окно - это "кратковременная память" LLM. Оно определяет, сколько веб-страниц поисковая система AI-поиска может учесть при ответе на запрос и насколько длинный документ она может суммировать. В 2023 году нормой было 4K-8K токенов; в 2026 году 1M+ токенов является стандартом, что фундаментально меняет широту и глубину источников, на которые опираются LLM. Для GEO это означает, что AI-поиск теперь сравнивает множество конкурирующих страниц одновременно и решает, какую из них процитировать, делая структуру документа и качество разделов решающим фактором.
Контекстные окна по моделям (2026)
| Модель | Контекстное окно |
|---|---|
| Claude Opus 4.6 | 1M токенов |
| Gemini 3 | 1M-2M токенов |
| GPT-5 | 400K токенов |
| Llama 4 | 128K-1M токенов |
1M токенов - это примерно 750K английских слов, около книги в 400-500 страниц.
Токены, а не слова
Контекстные окна измеряются в токенах, а не в словах. В английском в среднем приходится около 1,3 токена на слово, но такие языки, как корейский или японский, используют примерно 1,5-2 токена на символ, а значит неанглоязычный контент расходует существенно большую часть бюджета при той же длине страницы.
Значение для GEO
Обрабатываются документы целиком: раньше LLM видели только верхние сниппеты; теперь они читают целые страницы и выбирают лучший раздел для цитирования. Структурная ясность всего документа имеет значение.
Прямое сравнение с конкурентами: большие контекстные окна позволяют моделям сравнивать множество конкурирующих страниц по одному запросу сразу. Победа заключается не в том, чтобы быть "хорошим", а в том, чтобы быть структурно проще для цитирования, чем альтернативы.
Вынос важного в начало значит больше: LLM придают больший вес ранним токенам. Помещайте ключевое определение и ответ в самое начало документа.
"Lost in the middle": даже модели с большим контекстом деградируют на информации, погребённой в середине документа. Критически важный контент должен находиться ближе к началу или концу, а не в середине.
Источники: