Context Engineering
Context engineering - это практика осознанного проектирования того, какую информацию, в каком порядке и в каком формате видит LLM при генерации ответа. Она включает в себя prompt engineering, которое шлифует отдельный промпт, и расширяет его на всё, что попадает в контекстное окно: системные промпты, извлечённые документы, историю диалога, метаданные пользователя, схемы инструментов и многое другое. Simon Willison, Tobi Lütke и Andrej Karpathy начали публично использовать этот термин в 2025 году, а к 2026 году он стал стандартным словарём в инженерии продуктов на основе LLM.
Context engineering - это практика осознанного проектирования того, какую информацию, в каком порядке и в каком формате видит LLM при генерации ответа. Она включает в себя prompt engineering, которое шлифует отдельный промпт, и расширяет его на всё, что попадает в контекстное окно: системные промпты, извлечённые документы, историю диалога, метаданные пользователя, схемы инструментов и многое другое. Simon Willison, Tobi Lütke и Andrej Karpathy начали публично использовать этот термин в 2025 году, а к 2026 году он стал стандартным словарём в инженерии продуктов на основе LLM.
Почему это важно
Большинство сбоев LLM-продуктов в продакшене происходит из-за того, что "мы дали модели неверный контекст", а не из-за того, что "модель плохая". Даже при контекстных окнах в 1 млн токенов случайный сброс информации вредит производительности - хорошо задокументированный эффект "Lost in the Middle". Context engineering рассматривает составной ввод (RAG, память, инструменты, история) как проектную переменную, и одна и та же модель может работать в 2-10 раз лучше при более качественном построении контекста.
Из чего состоит контекст
Системный промпт: фиксированные инструкции - роль, ограничения, тон, цели.
Промпт пользователя: ввод пользователя для этого хода.
История диалога: предыдущие ходы.
Результаты RAG: релевантные документы и фрагменты из векторной БД.
Определения инструментов: имена, описания и схемы вызываемых функций.
Результаты вызова инструментов: данные, возвращённые предыдущими вызовами инструментов.
Метаданные пользователя: язык, часовой пояс, тарифный план, история поведения.
Конституция / guardrails: правила безопасности, запрещённые темы, фильтры вывода.
Всё это сливается в единое контекстное окно, которое отправляется в LLM.
Context Engineering против Prompt Engineering
| Аспект | Prompt Engineering | Context Engineering |
|---|---|---|
| Единица | Одно предложение промпта | Всё контекстное окно |
| Предмет внимания | "Как спросить?" | "Что показать?" |
| Уровень | Тактический (уровень предложения) | Системный (уровень пайплайна) |
| Пример | Добавить "думай шаг за шагом" | Решить, сколько фрагментов RAG, в каком порядке, какая суммаризация |
Prompt engineering - это мастерство написания хороших предложений; context engineering - это мастерство проектирования всей структуры ввода, в которой эти предложения живут.
Ключевые принципы
Включайте только нужное: более длинный контекст означает больше "потерь в середине" и более высокую стоимость. Безжалостно отсекайте нерелевантную информацию.
Упорядочивайте осознанно: LLM придают больший вес началу и концу. Помещайте самые важные инструкции и данные по краям.
Структурированная разметка: оборачивайте внешние документы в <source>…</source>, примеры в <example>…</example>, чтобы модель знала роль каждой части.
Динамический отбор: разные типы запросов заслуживают разных списков инструментов, результатов RAG и системных промптов. Универсальный подход впустую тратит токены.
Суммаризируйте и сжимайте: суммаризируйте длинную историю, чтобы экономить токены. Такие функции, как артефакты Claude, - канонический пример.
Управляйте циклами агента: для многошаговых рассуждений очищайте и перестраивайте контекст между шагами.
Практические сложности
Бюджет токенов: контекстные окна не бесплатны. Заполнение 1 млн токенов резко увеличивает стоимость и задержку.
Ранжирование по релевантности: решите, сколько фрагментов RAG извлекать и насколько сильно переранжировать.
Стратегия памяти: долгосрочная память в векторной БД, краткосрочная память через суммаризацию.
Отладка: когда качество вывода падает, найдите, какая часть контекста виновата. Логирование и воспроизводимость необходимы.
Значение для GEO
Поисковые системы AI-поиска сами по себе являются пайплайнами context engineering. Контент, структурированный так, чтобы "хорошо ложиться в контекст", цитируется чаще. В частности: ① каждый раздел должен быть независимо суммируемым, ② первое предложение должно нести ключевой ответ, ③ метаданные и источники должны быть явными. Это и есть "удобное для context engineering письмо" для блогеров.
Источники: