幻觉与上下文工程

你有没有这样的体验：问 ChatGPT 一个问题，它回答得头头是道、引经据典，你差点就信了——直到你发现它引用的那篇论文根本不存在。

这就是所谓的”幻觉”（Hallucination）。

围绕幻觉，业界有各种各样的解释：训练数据有噪音、模型参数不够大、RLHF 没对齐好……这些说法都对，但都没有触及最本质的那一层。

今天我想聊聊，大模型幻觉到底是怎么回事，以及一个正在被越来越多人重视的解决思路——上下文工程（Context Engineering）。

先搞清楚一件事：大模型在干什么

要理解幻觉，得先理解大模型的工作原理。

大模型本质上是一个条件概率机器。给定前文，它预测下一个 token 出现的概率分布，然后从中采样。整个生成过程，就是一连串的”下一个词最可能是什么”的概率接龙。

注意，是最可能，不是最正确。

这两者的区别，恰恰就是幻觉的根源。

林黛玉倒拔垂杨柳

我们来做一个思想实验。

假如你问模型：”请描述林黛玉倒拔垂杨柳的情节。”

这句话里有两个强信号：林黛玉和倒拔垂杨柳。前者指向《红楼梦》里那个弱柳扶风、多愁善感的少女，后者指向《水浒传》里鲁智深酒后逞威的经典桥段。这两个信号指向截然不同的语义空间，把它们拼在一起，就构成了一个信息熵极高的上下文。

什么是信息熵高？简单说就是”不确定性大”。模型拿到这个 prompt 后，陷入了纠结：到底该往《红楼梦》的方向生成，还是往《水浒传》的方向生成？两边的概率势均力敌，上下文没有提供足够的约束来把不确定性降下来。

但模型不能不回答，它必须输出点什么——因为自回归语言模型的本质就是”给定前文，生成续文”，它没有”我不知道”这个内建选项。

于是它开始做最擅长的事情：统计补全。

它会综合两边的语义，编出一段看上去合理但事实上荒谬的文字。比如它可能写出：”林黛玉走到大观园的垂杨柳前，气运丹田，双手抱住树干，一声娇叱之下连根拔起……”——语言通顺，文笔甚至还不错，但内容纯属一本正经地胡说八道。

这就是幻觉的本质：在信息熵高或信噪比低的上下文中，模型为了完成概率语言建模而进行的统计补全。

它不是”故意骗你”，也不是”太笨了不知道”。它只是一台概率机器，在信号不明确的时候，依然忠实地执行自己的使命——生成统计上最合理的下文。

再看几个日常例子

理解了这个本质，你会发现生活中大量的幻觉案例都可以用这个框架解释。

例一：捏造论文引用

你让模型”列出近五年关于xxx的重要论文”。模型的训练数据里确实见过大量论文标题、作者名和期刊名，但这些信息是碎片化的——它知道”Attention Is All You Need”是 Vaswani 等人写的，也知道 Nature 和 Science 发过很多文章，但它并没有一个结构化的论文数据库。当你要求它生成一个它不确定的引用时，它会把”看起来像论文标题的词组”+”看起来像作者名的人名”+”看起来像期刊名的名词”拼在一起。每一个局部都符合统计规律，但组合起来就是一篇不存在的论文。

这就是典型的信噪比低的场景：模型脑子里有大量关于论文的”噪声”，但缺少指向具体某篇论文的”信号”。

例二：信誓旦旦地算错数

问模型”17 × 24 等于多少”，它可能回答 able 408（正确答案），也可能回答 388 或者 418。因为乘法运算在语言模型的概率空间里本身就是一个高熵事件——从纯语言统计的角度看，”17 × 24 = 408”和”17 × 24 = 418”在 token 概率上并没有天壤之别。模型从来就不是在”算”，它是在”猜一个看起来像答案的数字”。

例三：编造 API 参数

你让模型写一段调用某个冷门 SDK 的代码。主流的 SDK 它见过足够多的示例，能写对；但遇到冷门的，训练数据里可能只出现过寥寥几次，信号极弱。于是它根据”类似 SDK 通常长这样”的统计规律，编造出一组似是而非的 API 签名。函数名像那么回事，参数顺序看着合理，但跑起来就是报错。