GEO

幻觉

幻觉是指大语言模型生成不真实或无依据的内容,却以高度自信的姿态呈现,例如编造引用、捏造统计数据,或陈述根本不存在的事实。它是对 AI 生成搜索答案可信度的最大单一威胁。

幻觉是指大语言模型生成不真实或无依据的内容,却以高度自信的姿态呈现,例如编造引用、捏造统计数据,或陈述根本不存在的事实。它是对 AI 生成搜索答案可信度的最大单一威胁。

为什么重要

2024 年 Stanford / Vectara 幻觉排行榜显示,即便是前沿模型,在摘要任务中仍有 2–15% 的概率产生幻觉。到 2026 年,当用户高度依赖 AI 搜索时,一处虚构的引用就可能严重损害品牌信任。对 GEO 而言,挑战不仅在于被引用,更在于被正确地引用。

幻觉为何发生

概率式生成:LLM 预测的是最可能的下一个 token,而非真相。“训练分布中最可能的延续”与“事实”并不相同,因此当模型并不真正知道答案时,就会编造看似合理的内容。

训练数据局限:近期事件、小众领域和非英语内容的覆盖稀疏,留下了空白。

含糊的提示:模糊的问题会诱使模型靠猜测来填补空白。

薄弱的 RAG 上下文:当检索没有返回相关段落时,模型会退而依赖自身的“记忆”,这是幻觉风险最高的情形。

幻觉的类型

内在型(Intrinsic):直接与来源相矛盾。文档写的是“1000 万美元营收”,模型却说成“1 亿美元”。

外在型(Extrinsic):添加了来源中没有的事实。模型在毫无出处的情况下编造信息。

事实型(Factual):无论来源如何都客观错误,比如虚构的人物、日期或数字。

GEO 防范措施

明确、无歧义的事实:陈述式语句不给模型留下误读的空间。“inblog 成立于 2020 年”胜过含糊的措辞。

为数字附上来源:每条统计数据都应带上来源和年份,以便 RAG 流程锁定该引用。

避免含糊的量词:“许多”“大多数”“显著”会被模型替换成杜撰的数字。请使用具体数据。

品牌名称保持一致:统一产品和公司名称。混用“inblog”“Inblog”和“In Blog”会导致模型把它们当作不同或混淆的实体。

结构化 FAQ:问答块能大幅提升引用准确率。

Schema.org 标记:Organization、Article 和 FAQPage 等结构化数据有助于 LLM 明确无误地识别实体。

Sources: