ConvRAG：通过细粒度检索增强和自我检查提升大模型对话式问答能力 - 文章 - 开发者社区

检索增强生成（Retrieval-Augmented Generation, RAG）旨在通过结合外部庞大且动态的知识库，增强大型语言模型（Large Language Models, LLMs），以生成更可靠和准确的回答。大多数先前的工作集中在使用RAG进行单轮问答上， 而对于如何将RAG适应于复杂的对话环境，其中问题与之前的上下文相互依赖 ，这一问题尚未得到充分研究。

为解决上述问题，提出了一种对话级别的RAG方法（ ConvRAG ），它结合了细粒度检索增强和自我检查机制，用于对话式问答（Conversational Question Answering, CQA）。具体来说，由三个组件构成，即对话式问题精炼器、细粒度检索器和基于自我检查的响应生成器，这三个组件协同工作，以在对话环境中理解问题并获取相关信息。

ConvRAG方法的整体架构

picture.image

ConvRAG包含的三个关键组件：

对话式问题精炼器 ：通过问题重构和关键词提取，使问题意图更加明确，以便更好地理解与上下文相关联的问题。
细粒度检索器 ：利用问题重构和关键词从网络中检索最相关的信息，以支持响应生成。检索过程包括文档级检索、段落级召回和段落级重排，以确保获取到最有用的信息片段。
基于自我检查的响应生成器 ：在生成响应之前，先对检索到的信息进行自我检查，以确保使用的是有用的信息，从而提高响应的准确性。

通过在标准基准数据集上的广泛实验，ConvRAG方法在多个自动评估指标上均优于现有技术。具体来说， ConvRAG在测试集（包括已见和未见主题的测试集）上取得了显著的性能提升 。

自动评估的结果，∗ 表示该模型使用重构的问题作为输入

picture.image


          
Boosting Conversational Question Answering with Fine-Grained Retrieval-Augmentation and Self-Check
          
https://arxiv.org/pdf/2403.18243.pdf