LLM之幻觉(二):大语言模型LLM幻觉缓减技术综述

技术

picture.image

   LLM幻觉缓减技术分为两大主流,  **梯度方法****非梯度方法**

梯度方法是指对基本LLM进行微调; 而非梯度方法主要是在推理时使用Prompt工程技术。LLM幻觉缓减技术,如下图所示:

picture.image

LLM幻觉缓减技术值得注意的是:

当大模型语言 生成 功 能应用在要求严格的应用程序 时 ,LLM幻觉 就变得非常令人担忧,例如:

  1. 总结医疗记录;

  2. 客户支持对话;

  3. 财务分析报告,并提供错误的法律建议。

一、幻觉缓解分类法

   这项研究对LLM幻觉缓解技术进行了总结,分类为:  **梯度方法****非梯度方法**

梯度方法 包括 复杂和不透明的解码策略知识图谱微调策略 等。

非梯度方法 包括 RAG自我优化Prompt微调

值得注意的是,RAG方法分为四个部分;

  • 生成之前;

  • 生成 期间;

  • 生成后;

  • 端到端

Prompt工程缓解幻觉的原理在于定义:

  • 特殊上下文&;

  • 预期输出

二、最佳预防幻觉

预防幻觉的最佳方法不是单一的方法,需要综合多种方法。

缓减幻觉需要考虑以下因素:

  1. 在多大程度上依赖标签数据?

  2. 引入无监督或弱监督学习技术以提高可扩展性和灵活性的可能性是什么?

  3. 考虑梯度和非梯度方法,以产生连贯和上下文相关的信息。

  4. 收集到的缓解幻觉的工作揭示了一系列不同的策略,每种策略都有助于解决LLM中幻觉的细微差别。

  5. 通过反馈和推理的自我完善会产生有影响力的策略。

  6. 结构化比较推理引入了一种结构化的文本偏好预测方法,增强了连贯性,减少了幻觉。

  7. 监督微调可以通过知识注入和师生方法进行探索。

  8. 特定领域的知识被注入到较弱的LLM和使用反事实数据集来提高真实性的方法中。

参考文献:

[1] https://cobusgreyling.medium.com/large-language-model-hallucination-mitigation-techniques-a75b6f873318

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
VikingDB:大规模云原生向量数据库的前沿实践与应用
本次演讲将重点介绍 VikingDB 解决各类应用中极限性能、规模、精度问题上的探索实践,并通过落地的案例向听众介绍如何在多模态信息检索、RAG 与知识库等领域进行合理的技术选型和规划。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论