Что такое Chain-of-Thought-промптинг? | Глоссарий GEO

Chain-of-Thought (CoT, цепочка рассуждений) - это техника промптинга, побуждающая LLM генерировать пошаговый процесс рассуждений перед итоговым ответом. Формализованная Wei и соавторами в Google Research в 2022 году, она стала стандартной техникой для повышения точности LLM в сложных задачах рассуждения.

Почему это важно

Ранние LLM плохо справлялись с арифметикой, логикой и многошаговыми рассуждениями. В исходной статье Wei модель PaLM 540B решала лишь 17,9% задач на школьном математическом бенчмарке GSM8K при базовом промптинге, но 56,9% с Chain-of-Thought. Та же модель, те же вопросы, в 2-3 раза выше точность - просто за счёт того, что модели дали "пространство подумать". С тех пор Claude, GPT и Gemini усвоили CoT как основной паттерн промптинга.

Как это работает

Ключевая идея CoT - заставить LLM сначала выписать свои рассуждения, а затем сформулировать вывод, вместо того чтобы сразу переходить к ответу. Поскольку трансформеры обусловливают каждый токен предыдущими токенами, вывод промежуточных рассуждений помещает их в контекст и повышает качество итогового ответа. Больше "токенов размышления" даёт модели больше "пространства для рассуждения".

Основные разновидности

Zero-Shot CoT: добавьте одну строку вроде "Давай рассуждать шаг за шагом" без примеров. Предложенный Kojima и соавторами в 2022 году, это самая простая и на удивление эффективная форма.

Few-Shot CoT: включите в промпт 2-3 примера задач с их пошаговыми рассуждениями, чтобы модель имитировала структуру.

Self-Consistency: сэмплируйте несколько ответов CoT на один и тот же вопрос и выберите наиболее частый итоговый вывод - "голосование" по путям рассуждения, точнее одиночного CoT.

Tree of Thoughts (ToT): исследуйте рассуждения как дерево, а не как линию, разворачивая только высокооценённые ветви. Хорошо подходит для сложного планирования и головоломок.

ReAct: Reasoning + Acting (рассуждение + действие). Объединяет CoT с вызовами инструментов в цикле "подумать → действовать → наблюдать → снова подумать". Стандартный паттерн промптинга для агентов ИИ.

Когда CoT помогает

CoT помогает не одинаково во всех задачах.

Очень эффективен: математика, логические головоломки, многошаговые рассуждения, сложное принятие решений, отладка кода.

Менее эффективен: простая классификация, анализ тональности, суммаризация и перевод - там, где ответ и так очевиден сразу, и CoT в основном лишь добавляет задержку.

Тренд 2026 года: передовые модели теперь поставляются со встроенными "режимами рассуждения" (OpenAI o1, расширенное мышление Claude Opus), которые запускают CoT автоматически, поэтому пользователям больше не нужно писать CoT-промпты вручную. Внимание смещается к другим подсказкам, повышающим качество.

Значение для GEO

CoT - не техника, которую авторы контента применяют напрямую, но она формирует то, какой контент LLM проще цитировать. Если статья в блоге разбирает сложные концепции с явной пошаговой логикой, LLM проще использовать этот раздел как grounding для собственных рассуждений. Объяснения, раскрывающие "почему это следует", превосходят однострочные выводы, когда AI-поиск выбирает, что процитировать.

Источники: