GEO

思维链

思维链(Chain-of-Thought,CoT)是一种提示技术,让 LLM 在给出最终答案之前先生成一段逐步推理的过程。它由 Wei 等人于 2022 年在 Google Research 正式提出,如今已成为提升 LLM 在复杂推理任务上准确率的标准技术。

思维链(Chain-of-Thought,CoT)是一种提示技术,让 LLM 在给出最终答案之前先生成一段逐步推理的过程。它由 Wei 等人于 2022 年在 Google Research 正式提出,如今已成为提升 LLM 在复杂推理任务上准确率的标准技术。

为什么重要

早期的 LLM 在算术、逻辑和多步推理上举步维艰。在 Wei 的原始论文中,PaLM 540B 在 GSM8K 小学数学基准上使用基础提示时仅解出了 17.9% 的题目,而使用思维链时则达到 56.9%。同样的模型、同样的题目,仅仅是给了模型"思考的空间",准确率就提高了 2 至 3 倍。从那以后,Claude、GPT 和 Gemini 都已把 CoT 内化为一种核心提示模式。

它如何运作

CoT 的核心思路是让 LLM 先把推理写出来,再陈述结论,而不是直接跳到答案。由于 Transformer 在生成每一个 token 时都以之前的 token 为条件,把中间推理输出出来就会让这部分内容进入上下文,从而提升最终答案的质量。更多的"思考 token"给了模型更大的"推理空间"。

主要变体

Zero-Shot CoT:只加一句类似"让我们一步一步思考"的话,不带任何示例。由 Kojima 等人于 2022 年提出,是最简单却出人意料地有效的形式。

Few-Shot CoT:在提示中包含 2 至 3 个带有逐步推理的示例题,让模型模仿这种结构。

自一致性(Self-Consistency):对同一个问题采样多条 CoT 答案,再选出最常见的最终结论,相当于在多条推理路径之间"投票",比单条 CoT 更准确。

思维树(Tree of Thoughts,ToT):把推理探索成一棵树而非一条线,只扩展得分高的分支。适合复杂的规划和谜题。

ReAct:推理 + 行动(Reasoning + Acting)。它把 CoT 与工具调用结合在一个"思考 → 行动 → 观察 → 再思考"的循环中。这是 AI 智能体的标准提示模式。

CoT 在什么情况下有帮助

CoT 并不会对所有任务都同等地有帮助。

非常有效:数学、逻辑谜题、多步推理、复杂决策、代码调试。

效果较弱:简单分类、情感分析、摘要和翻译,这些任务的答案本就是即时的,CoT 大多只会增加延迟。

2026 年趋势:前沿模型现在都自带内置的"推理模式"(OpenAI o1、Claude Opus 的扩展思考),会自动运行 CoT,因此用户不再需要手动撰写 CoT 提示。注意力转向了其他能提升质量的提示技巧。

对 GEO 的影响

CoT 并不是内容写作者会直接应用的技术,但它会影响 LLM 觉得哪类内容最容易引用。如果一篇博客文章用明确的逐步逻辑把复杂概念讲清楚,LLM 就更容易把这部分内容当作自身推理的 grounding(事实依据)。当 AI 搜索 挑选要引用的内容时,把"为什么能由此推出"展开讲明白的解释,胜过一句话的结论。

Sources: