AI 大模型为什么会“胡说八道”

用普通人能听懂的方式解释大模型幻觉：它擅长生成像答案的文字，却不天然等于知道事实。

2026-06-062 minwhy-ai-large-language-models-hallucinate

很多人第一次用 AI，会有一种矛盾感：它写得很像那么回事，语气也很自信，可偶尔会编出不存在的人名、论文、政策、链接，甚至把事实说反。这种现象通常叫“大模型幻觉”。

要理解它，先不要把大模型想成一个装满事实的数据库。更准确的比喻是：它像一个超级熟练的语言续写器。你给它一句话，它会根据训练中见过的大量文本模式，预测后面最可能出现什么词、什么句子、什么结构。

这件事很厉害，因为很多知识本来就藏在语言模式里。比如你问“水的化学式是什么”，它很容易接出“H2O”。但问题在于，像答案和真答案不是一回事。

为什么会幻觉

第一，训练目标不是“保证事实正确”，而是“生成符合语境的文本”。如果上下文里缺少关键信息，模型会倾向于补全一个听起来合理的答案。

第二，模型没有天然的实时记忆。它不知道某个公司今天换没换 CEO，也不知道一个网页刚刚改版，除非它能接入检索或你把最新信息给它。

第三，语言里有大量相似模式。一本书名、一个作者名、一个学术术语，如果在结构上很像真实内容，模型可能会把它们拼成一个并不存在的组合。

第四，问题越模糊，幻觉越容易发生。比如“给我找几个权威数据”比“请只根据这份报告第 3 页的数据总结”更容易出错，因为前者给了模型太多自由发挥空间。

普通用户可以用三个办法。

第一，让问题更具体。说明背景、范围、时间和你需要的格式。

第二，要求它区分“已知事实”和“推测”。比如让它标注哪些内容需要核验。

第三，重要事情必须查来源。法律、医疗、金融、新闻、价格、政策这些高风险信息，不能只看 AI 的一句回答。

工程上也有办法，比如让模型先搜索资料再回答，这叫检索增强；或者让它调用数据库、计算器、代码执行工具，用外部系统补足事实能力。

所以，大模型不是没用，而是要用对。它非常适合帮你起草、整理、解释、改写、生成思路；但当你需要事实结论时，最好把它当成一个聪明的助手，而不是最后的裁判。