Chain-of-Thought
Chain-of-Thought (CoT, цепочка рассуждений) - это техника промптинга, побуждающая LLM генерировать пошаговый процесс рассуждений перед итоговым ответом. Формализованная Wei и соавторами в Google Research в 2022 году, она стала стандартной техникой для повышения точности LLM в сложных задачах рассуждения.
Chain-of-Thought (CoT, цепочка рассуждений) - это техника промптинга, побуждающая LLM генерировать пошаговый процесс рассуждений перед итоговым ответом. Формализованная Wei и соавторами в Google Research в 2022 году, она стала стандартной техникой для повышения точности LLM в сложных задачах рассуждения.
Почему это важно
Ранние LLM плохо справлялись с арифметикой, логикой и многошаговыми рассуждениями. В исходной статье Wei модель PaLM 540B решала лишь 17,9% задач на школьном математическом бенчмарке GSM8K при базовом промптинге, но 56,9% с Chain-of-Thought. Та же модель, те же вопросы, в 2-3 раза выше точность - просто за счёт того, что модели дали "пространство подумать". С тех пор Claude, GPT и Gemini усвоили CoT как основной паттерн промптинга.
Как это работает
Ключевая идея CoT - заставить LLM сначала выписать свои рассуждения, а затем сформулировать вывод, вместо того чтобы сразу переходить к ответу. Поскольку трансформеры обусловливают каждый токен предыдущими токенами, вывод промежуточных рассуждений помещает их в контекст и повышает качество итогового ответа. Больше "токенов размышления" даёт модели больше "пространства для рассуждения".
Основные разновидности
Zero-Shot CoT: добавьте одну строку вроде "Давай рассуждать шаг за шагом" без примеров. Предложенный Kojima и соавторами в 2022 году, это самая простая и на удивление эффективная форма.
Few-Shot CoT: включите в промпт 2-3 примера задач с их пошаговыми рассуждениями, чтобы модель имитировала структуру.
Self-Consistency: сэмплируйте несколько ответов CoT на один и тот же вопрос и выберите наиболее частый итоговый вывод - "голосование" по путям рассуждения, точнее одиночного CoT.
Tree of Thoughts (ToT): исследуйте рассуждения как дерево, а не как линию, разворачивая только высокооценённые ветви. Хорошо подходит для сложного планирования и головоломок.
ReAct: Reasoning + Acting (рассуждение + действие). Объединяет CoT с вызовами инструментов в цикле "подумать → действовать → наблюдать → снова подумать". Стандартный паттерн промптинга для агентов ИИ.
Когда CoT помогает
CoT помогает не одинаково во всех задачах.
Очень эффективен: математика, логические головоломки, многошаговые рассуждения, сложное принятие решений, отладка кода.
Менее эффективен: простая классификация, анализ тональности, суммаризация и перевод - там, где ответ и так очевиден сразу, и CoT в основном лишь добавляет задержку.
Тренд 2026 года: передовые модели теперь поставляются со встроенными "режимами рассуждения" (OpenAI o1, расширенное мышление Claude Opus), которые запускают CoT автоматически, поэтому пользователям больше не нужно писать CoT-промпты вручную. Внимание смещается к другим подсказкам, повышающим качество.
Значение для GEO
CoT - не техника, которую авторы контента применяют напрямую, но она формирует то, какой контент LLM проще цитировать. Если статья в блоге разбирает сложные концепции с явной пошаговой логикой, LLM проще использовать этот раздел как grounding для собственных рассуждений. Объяснения, раскрывающие "почему это следует", превосходят однострочные выводы, когда AI-поиск выбирает, что процитировать.
Источники: