QA-Expand提升RAG检索性能13%

发布时间：2025 年 02 月 12 日

RAG

QA-Expand: Multi-Question Answer Generation for Enhanced Query Expansion in Information Retrieval

查询扩展在信息检索领域被广泛应用，通过为查询添加额外的上下文信息来提升搜索效果。尽管基于 LLM 的方法能够通过多个提示生成伪相关内容和扩展项，但这些方法往往产生重复且范围狭窄的扩展，缺乏多样化的背景信息，难以检索到所有相关结果。本文提出了一种新颖且有效的查询扩展框架——QA-Expand。该框架首先从初始查询生成多个相关问题，随后为这些问题生成对应的伪答案作为替代文档。通过反馈模型进一步优化和筛选这些答案，确保仅保留最有价值的补充信息。在 BEIR 和 TREC 等基准测试中的大量实验证明，与现有最优方法相比，QA-Expand 将检索性能提升了高达 13%，为应对现代检索挑战提供了有力的解决方案。

https://arxiv.org/abs/2502.08557

picture.image

添加请注明RAG

如遇无法添加，请+ vx: iamxxn886

一、查询扩展的困境与突破

在搜索引擎与智能问答系统领域，精准把握用户查询意图始终是亟待攻克的关键难题。传统查询扩展方法存在明显局限，就如同只会依赖同义词词典的图书管理员，虽然能够增添检索关键词，但难以洞悉问题蕴含的深层语义。

传统查询扩展方法具体涵盖以下几种：

• Q2D ：借助少量示例提示来生成伪文档，随后利用这些生成的伪文档对查询进行扩展，以此拓宽检索范围，期望获取更多相关结果。
• Q2C ：运用思维链（CoT）提示，引导查询发生重写，通过改变查询的表述方式，尝试挖掘不同角度的信息，提升检索的精准度和全面性。
• GenQREnsemble ：采用零示例指令释义的方式生成多组关键词，然后将这些关键词组与初始查询进行拼接，整合后的查询内容有望涵盖更多潜在相关信息，增强检索效果。
• GenQRFusion ：针对每个初始查询以及每组关键词的组合分别进行文档检索，之后对所得到的排序结果进行融合，通过综合考量不同组合的检索情况，提升整体检索性能，力求呈现更贴合用户需求的结果。

然而，当大语言模型（LLM）取得突破性进展后，开发者们却遭遇了新的难题 —— 生成的扩展内容往往重复且单一。这种情况就如同使用不同颜色的笔反复描绘同一幅简笔画，无论怎样涂抹，都无法完整、立体地呈现出用户信息需求的全貌，极大地限制了搜索引擎和智能问答系统对用户真实意图的理解深度与广度，影响了用户体验与系统性能的进一步提升。