GEO

Context Window

Context window (контекстное окно) - это максимальное количество входных и выходных токенов, которое LLM может обработать за один запрос. Оно вмещает промпт пользователя, системный промпт, предыдущий диалог, документы, извлечённые через RAG, и сгенерированный ответ - всё сразу.

Context window (контекстное окно) - это максимальное количество входных и выходных токенов, которое LLM может обработать за один запрос. Оно вмещает промпт пользователя, системный промпт, предыдущий диалог, документы, извлечённые через RAG, и сгенерированный ответ - всё сразу.

Почему это важно

Контекстное окно - это "кратковременная память" LLM. Оно определяет, сколько веб-страниц поисковая система AI-поиска может учесть при ответе на запрос и насколько длинный документ она может суммировать. В 2023 году нормой было 4K-8K токенов; в 2026 году 1M+ токенов является стандартом, что фундаментально меняет широту и глубину источников, на которые опираются LLM. Для GEO это означает, что AI-поиск теперь сравнивает множество конкурирующих страниц одновременно и решает, какую из них процитировать, делая структуру документа и качество разделов решающим фактором.

Контекстные окна по моделям (2026)

МодельКонтекстное окно
Claude Opus 4.61M токенов
Gemini 31M-2M токенов
GPT-5400K токенов
Llama 4128K-1M токенов

1M токенов - это примерно 750K английских слов, около книги в 400-500 страниц.

Токены, а не слова

Контекстные окна измеряются в токенах, а не в словах. В английском в среднем приходится около 1,3 токена на слово, но такие языки, как корейский или японский, используют примерно 1,5-2 токена на символ, а значит неанглоязычный контент расходует существенно большую часть бюджета при той же длине страницы.

Значение для GEO

Обрабатываются документы целиком: раньше LLM видели только верхние сниппеты; теперь они читают целые страницы и выбирают лучший раздел для цитирования. Структурная ясность всего документа имеет значение.

Прямое сравнение с конкурентами: большие контекстные окна позволяют моделям сравнивать множество конкурирующих страниц по одному запросу сразу. Победа заключается не в том, чтобы быть "хорошим", а в том, чтобы быть структурно проще для цитирования, чем альтернативы.

Вынос важного в начало значит больше: LLM придают больший вес ранним токенам. Помещайте ключевое определение и ответ в самое начало документа.

"Lost in the middle": даже модели с большим контекстом деградируют на информации, погребённой в середине документа. Критически важный контент должен находиться ближе к началу или концу, а не в середине.

Источники: