大宾的私人知识杂志

AI 大模型为什么会“胡说八道”

用普通人能听懂的方式解释大模型幻觉:它擅长生成像答案的文字,却不天然等于知道事实。

2026-06-062 min

很多人第一次用 AI,会有一种矛盾感:它写得很像那么回事,语气也很自信,可偶尔会编出不存在的人名、论文、政策、链接,甚至把事实说反。这种现象通常叫“大模型幻觉”。

要理解它,先不要把大模型想成一个装满事实的数据库。更准确的比喻是:它像一个超级熟练的语言续写器。你给它一句话,它会根据训练中见过的大量文本模式,预测后面最可能出现什么词、什么句子、什么结构。

这件事很厉害,因为很多知识本来就藏在语言模式里。比如你问“水的化学式是什么”,它很容易接出“H2O”。但问题在于,像答案真答案不是一回事。

为什么会幻觉

第一,训练目标不是“保证事实正确”,而是“生成符合语境的文本”。如果上下文里缺少关键信息,模型会倾向于补全一个听起来合理的答案。

第二,模型没有天然的实时记忆。它不知道某个公司今天换没换 CEO,也不知道一个网页刚刚改版,除非它能接入检索或你把最新信息给它。

第三,语言里有大量相似模式。一本书名、一个作者名、一个学术术语,如果在结构上很像真实内容,模型可能会把它们拼成一个并不存在的组合。

第四,问题越模糊,幻觉越容易发生。比如“给我找几个权威数据”比“请只根据这份报告第 3 页的数据总结”更容易出错,因为前者给了模型太多自由发挥空间。

怎么减少幻觉

普通用户可以用三个办法。

第一,让问题更具体。说明背景、范围、时间和你需要的格式。

第二,要求它区分“已知事实”和“推测”。比如让它标注哪些内容需要核验。

第三,重要事情必须查来源。法律、医疗、金融、新闻、价格、政策这些高风险信息,不能只看 AI 的一句回答。

工程上也有办法,比如让模型先搜索资料再回答,这叫检索增强;或者让它调用数据库、计算器、代码执行工具,用外部系统补足事实能力。

所以,大模型不是没用,而是要用对。它非常适合帮你起草、整理、解释、改写、生成思路;但当你需要事实结论时,最好把它当成一个聪明的助手,而不是最后的裁判。