ConvRAG:通过细粒度检索增强和自我检查提升大模型对话式问答能力

火山方舟向量数据库大模型

检索增强生成(Retrieval-Augmented Generation, RAG)旨在通过结合外部庞大且动态的知识库,增强大型语言模型(Large Language Models, LLMs),以生成更可靠和准确的回答。大多数先前的工作集中在使用RAG进行单轮问答上, 而对于如何将RAG适应于复杂的对话环境,其中问题与之前的上下文相互依赖 ,这一问题尚未得到充分研究。

为解决上述问题,提出了一种对话级别的RAG方法( ConvRAG ),它结合了细粒度检索增强和自我检查机制,用于对话式问答(Conversational Question Answering, CQA)。具体来说,由三个组件构成,即对话式问题精炼器、细粒度检索器和基于自我检查的响应生成器,这三个组件协同工作,以在对话环境中理解问题并获取相关信息。

ConvRAG方法的整体架构

picture.image

ConvRAG包含的三个关键组件:

  • 对话式问题精炼器 :通过问题重构和关键词提取,使问题意图更加明确,以便更好地理解与上下文相关联的问题。
  • 细粒度检索器 :利用问题重构和关键词从网络中检索最相关的信息,以支持响应生成。检索过程包括文档级检索、段落级召回和段落级重排,以确保获取到最有用的信息片段。
  • 基于自我检查的响应生成器 :在生成响应之前,先对检索到的信息进行自我检查,以确保使用的是有用的信息,从而提高响应的准确性。

通过在标准基准数据集上的广泛实验,ConvRAG方法在多个自动评估指标上均优于现有技术。具体来说, ConvRAG在测试集(包括已见和未见主题的测试集)上取得了显著的性能提升

自动评估的结果,∗ 表示该模型使用重构的问题作为输入

picture.image

picture.image


          
Boosting Conversational Question Answering with Fine-Grained Retrieval-Augmentation and Self-Check
          
https://arxiv.org/pdf/2403.18243.pdf
      

推荐阅读


欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论