灰帽 SEO

护栏

幻觉是指[大语言模型](/glossary/large-language-model)生成不真实或无依据的内容，却以高度自信的姿态呈现，例如编造引用、捏造统计数据，或陈述根本不存在的事实。它是对 AI 生成搜索答案可信度的最大单一威胁。

### 为什么重要

2024 年 Stanford / Vectara 幻觉排行榜显示，即便是前沿模型，在摘要任务中仍有 2–15% 的概率产生幻觉。到 2026 年，当用户高度依赖 [AI 搜索](/glossary/ai-search)时，一处虚构的引用就可能严重损害品牌信任。对 GEO 而言，挑战不仅在于被引用，更在于被*正确地*引用。

### 幻觉为何发生

**概率式生成**：LLM 预测的是最可能的下一个 token，而非真相。“训练分布中最可能的延续”与“事实”并不相同，因此当模型并不真正知道答案时，就会编造看似合理的内容。

**训练数据局限**：近期事件、小众领域和非英语内容的覆盖稀疏，留下了空白。

**含糊的提示**：模糊的问题会诱使模型靠猜测来填补空白。

**薄弱的 [RAG](/glossary/rag) 上下文**：当检索没有返回相关段落时，模型会退而依赖自身的“记忆”，这是幻觉风险最高的情形。

### 幻觉的类型

**内在型（Intrinsic）**：直接与来源相矛盾。文档写的是“1000 万美元营收”，模型却说成“1 亿美元”。

**外在型（Extrinsic）**：添加了来源中没有的事实。模型在毫无出处的情况下编造信息。

**事实型（Factual）**：无论来源如何都客观错误，比如虚构的人物、日期或数字。

### GEO 防范措施

**明确、无歧义的事实**：陈述式语句不给模型留下误读的空间。“inblog 成立于 2020 年”胜过含糊的措辞。

**为数字附上来源**：每条统计数据都应带上来源和年份，以便 RAG 流程锁定该引用。

**避免含糊的量词**：“许多”“大多数”“显著”会被模型替换成杜撰的数字。请使用具体数据。

**品牌名称保持一致**：统一产品和公司名称。混用“inblog”“Inblog”和“In Blog”会导致模型把它们当作不同或混淆的实体。

**结构化 FAQ**：问答块能大幅提升引用准确率。

**Schema.org 标记**：Organization、Article 和 FAQPage 等[结构化数据](/glossary/structured-data)有助于 LLM 明确无误地识别实体。

Sources:
- [减少幻觉 - Anthropic](https://docs.anthropic.com/en/docs/test-and-evaluate/strengthen-guardrails/reduce-hallucinations)
- [Vectara 幻觉排行榜](https://github.com/vectara/hallucination-leaderboard)
- [什么是 AI 幻觉？ - IBM](https://www.ibm.com/think/topics/ai-hallucinations)

幻觉是指 LLM 自信地生成虚假信息。了解它为何发生、主要类型，以及在 GEO 中如何防范。