揭秘大语言模型中的外部幻觉：原因与解决方案

Lilian Weng 研究入门影响力: 8/10

本文探讨了大语言模型中的外部幻觉现象，分析其原因及检测方法，并提出了减少幻觉的有效策略，强调了知识更新的风险。

核心要点

外部幻觉指模型输出与预训练数据不一致的内容，需确保输出真实且可验证。
预训练数据的质量直接影响模型的表现，过时或错误的信息会导致幻觉。
微调新知识时，模型对未知信息的学习速度较慢，增加了产生幻觉的风险。
采用检索增强评估等新方法可以更好地量化和检测幻觉现象。

深度解读

在当前大语言模型（LLMs）快速发展的背景下，幻觉现象已成为一个不容忽视的问题。这种现象通常指模型生成不真实、虚构或不一致的内容，尤其是外部幻觉（extrinsic hallucination），即模型的输出与其预训练数据不一致。理解幻觉的根源以及如何减少这种现象，对于提升模型的实用性和可靠性至关重要。

首先，外部幻觉的产生与预训练数据的质量密切相关。大语言模型的预训练数据通常来自互联网上的公开信息，这些信息可能已经过时、不完整或错误。因此，模型在训练过程中可能会错误地“记忆”这些信息，导致在生成回答时出现幻觉。为了确保模型的输出真实且可验证，我们需要关注预训练数据的选择和处理。

其次，微调过程中的知识更新同样面临挑战。研究表明，当模型在微调阶段引入新知识时，学习这些未知信息的速度远低于已知信息，这就增加了模型产生幻觉的风险。例如，Gekhman et al. 的研究显示，模型在学习大部分未知示例后，幻觉的产生显著增多。这一发现提醒我们在进行知识更新时，必须谨慎处理微调数据。

为了应对幻觉问题，研究者们提出了一系列检测和减少幻觉的方法。其中，检索增强评估（Retrieval-Augmented Evaluation）是一种新兴的量化模型幻觉的工具。通过引入外部知识库，模型不仅可以生成更准确的回答，还能在不确定时承认自身的局限性。这种方法在评估幻觉的同时，提升了模型的知识更新能力和准确性。

总的来说，减少大语言模型中的外部幻觉现象，既需要对预训练数据进行严格把控，也需要在微调阶段采取有效策略来更新知识。此外，采用新技术如检索增强评估，可以为模型的真实输出提供支持。这些努力将进一步推动大语言模型的应用，提升其在实际场景中的表现。我们作为开发者和研究者，应该密切关注这些动态，持续优化和提升模型的性能。通过更深入的理解和创新的解决方案，我们能够更好地应对幻觉问题，为用户提供更可靠的智能服务。

原文地址: Extrinsic Hallucinations in LLMs

大语言模型幻觉现象知识更新模型微调