GEO

Context Engineering

Context engineering - это практика осознанного проектирования того, какую информацию, в каком порядке и в каком формате видит LLM при генерации ответа. Она включает в себя prompt engineering, которое шлифует отдельный промпт, и расширяет его на всё, что попадает в контекстное окно: системные промпты, извлечённые документы, историю диалога, метаданные пользователя, схемы инструментов и многое другое. Simon Willison, Tobi Lütke и Andrej Karpathy начали публично использовать этот термин в 2025 году, а к 2026 году он стал стандартным словарём в инженерии продуктов на основе LLM.

Context engineering - это практика осознанного проектирования того, какую информацию, в каком порядке и в каком формате видит LLM при генерации ответа. Она включает в себя prompt engineering, которое шлифует отдельный промпт, и расширяет его на всё, что попадает в контекстное окно: системные промпты, извлечённые документы, историю диалога, метаданные пользователя, схемы инструментов и многое другое. Simon Willison, Tobi Lütke и Andrej Karpathy начали публично использовать этот термин в 2025 году, а к 2026 году он стал стандартным словарём в инженерии продуктов на основе LLM.

Почему это важно

Большинство сбоев LLM-продуктов в продакшене происходит из-за того, что "мы дали модели неверный контекст", а не из-за того, что "модель плохая". Даже при контекстных окнах в 1 млн токенов случайный сброс информации вредит производительности - хорошо задокументированный эффект "Lost in the Middle". Context engineering рассматривает составной ввод (RAG, память, инструменты, история) как проектную переменную, и одна и та же модель может работать в 2-10 раз лучше при более качественном построении контекста.

Из чего состоит контекст

Системный промпт: фиксированные инструкции - роль, ограничения, тон, цели.

Промпт пользователя: ввод пользователя для этого хода.

История диалога: предыдущие ходы.

Результаты RAG: релевантные документы и фрагменты из векторной БД.

Определения инструментов: имена, описания и схемы вызываемых функций.

Результаты вызова инструментов: данные, возвращённые предыдущими вызовами инструментов.

Метаданные пользователя: язык, часовой пояс, тарифный план, история поведения.

Конституция / guardrails: правила безопасности, запрещённые темы, фильтры вывода.

Всё это сливается в единое контекстное окно, которое отправляется в LLM.

Context Engineering против Prompt Engineering

АспектPrompt EngineeringContext Engineering
ЕдиницаОдно предложение промптаВсё контекстное окно
Предмет внимания"Как спросить?""Что показать?"
УровеньТактический (уровень предложения)Системный (уровень пайплайна)
ПримерДобавить "думай шаг за шагом"Решить, сколько фрагментов RAG, в каком порядке, какая суммаризация

Prompt engineering - это мастерство написания хороших предложений; context engineering - это мастерство проектирования всей структуры ввода, в которой эти предложения живут.

Ключевые принципы

Включайте только нужное: более длинный контекст означает больше "потерь в середине" и более высокую стоимость. Безжалостно отсекайте нерелевантную информацию.

Упорядочивайте осознанно: LLM придают больший вес началу и концу. Помещайте самые важные инструкции и данные по краям.

Структурированная разметка: оборачивайте внешние документы в <source>…</source>, примеры в <example>…</example>, чтобы модель знала роль каждой части.

Динамический отбор: разные типы запросов заслуживают разных списков инструментов, результатов RAG и системных промптов. Универсальный подход впустую тратит токены.

Суммаризируйте и сжимайте: суммаризируйте длинную историю, чтобы экономить токены. Такие функции, как артефакты Claude, - канонический пример.

Управляйте циклами агента: для многошаговых рассуждений очищайте и перестраивайте контекст между шагами.

Практические сложности

Бюджет токенов: контекстные окна не бесплатны. Заполнение 1 млн токенов резко увеличивает стоимость и задержку.

Ранжирование по релевантности: решите, сколько фрагментов RAG извлекать и насколько сильно переранжировать.

Стратегия памяти: долгосрочная память в векторной БД, краткосрочная память через суммаризацию.

Отладка: когда качество вывода падает, найдите, какая часть контекста виновата. Логирование и воспроизводимость необходимы.

Значение для GEO

Поисковые системы AI-поиска сами по себе являются пайплайнами context engineering. Контент, структурированный так, чтобы "хорошо ложиться в контекст", цитируется чаще. В частности: ① каждый раздел должен быть независимо суммируемым, ② первое предложение должно нести ключевой ответ, ③ метаданные и источники должны быть явными. Это и есть "удобное для context engineering письмо" для блогеров.

Источники: