检索增强生成(Retrieval-Augmented Generation, RAG)旨在通过结合外部庞大且动态的知识库,增强大型语言模型(Large Language Models, LLMs),以生成更可靠和准确的回答。大多数先前的工作集中在使用RAG进行单轮问答上, 而对于如何将RAG适应于复杂的对话环境,其中问题与之前的上下文相互依赖 ,这一问题尚未得到充分研究。
为解决上述问题,提出了一种对话级别的RAG方法( ConvRAG ),它结合了细粒度检索增强和自我检查机制,用于对话式问答(Conversational Question Answering, CQA)。具体来说,由三个组件构成,即对话式问题精炼器、细粒度检索器和基于自我检查的响应生成器,这三个组件协同工作,以在对话环境中理解问题并获取相关信息。
ConvRAG方法的整体架构
ConvRAG包含的三个关键组件:
- 对话式问题精炼器 :通过问题重构和关键词提取,使问题意图更加明确,以便更好地理解与上下文相关联的问题。
- 细粒度检索器 :利用问题重构和关键词从网络中检索最相关的信息,以支持响应生成。检索过程包括文档级检索、段落级召回和段落级重排,以确保获取到最有用的信息片段。
- 基于自我检查的响应生成器 :在生成响应之前,先对检索到的信息进行自我检查,以确保使用的是有用的信息,从而提高响应的准确性。
通过在标准基准数据集上的广泛实验,ConvRAG方法在多个自动评估指标上均优于现有技术。具体来说, ConvRAG在测试集(包括已见和未见主题的测试集)上取得了显著的性能提升 。
自动评估的结果,∗ 表示该模型使用重构的问题作为输入
Boosting Conversational Question Answering with Fine-Grained Retrieval-Augmentation and Self-Check
https://arxiv.org/pdf/2403.18243.pdf
推荐阅读
- • 对齐LLM偏好的直接偏好优化方法:DPO、IPO、KTO
- • 2024:ToB、Agent、多模态
- • TA们的RAG真正投产了吗?(上)
- • Agent到多模态Agent再到多模态Multi-Agents系统的发展与案例讲解(1.2万字,20+文献,27张图)
欢迎关注我的公众号“ PaperAgent ”, 每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。