DeepRAG 让 AI 学会"按需思考",准确率暴涨 21.99%

大模型向量数据库机器学习
DeepRAG 让 AI 学会"按需思考",准确率暴涨 21.99%

发布时间:2025 年 02 月 03 日

RAG

DeepRAG: Thinking to Retrieval Step by Step for Large Language Models

大型语言模型(LLMs)在推理方面展现了巨大潜力,但受限于参数知识的时效性、准确性和覆盖范围,它们仍面临严重的事实幻觉问题。同时,将推理与检索增强生成(RAG)结合也颇具挑战,任务分解无效和冗余检索可能引入噪声,降低响应质量。本文提出 DeepRAG 框架,将检索增强推理建模为马尔可夫决策过程(MDP),实现战略性和自适应的检索。通过迭代分解查询,DeepRAG 在每一步动态决定是检索外部知识还是依赖参数推理。实验表明,DeepRAG 在提升检索效率的同时,将答案准确率提高了 21.99%,展现了其在优化检索增强推理方面的卓越效果。

https://arxiv.org/pdf/2502.01142

picture.image

扫码加入社群讨论,注明RAG

如遇无法添加,请+ vx: iamxxn886


为什么需要 DeepRAG?大模型的"幻觉症"有救了!

当 ChatGPT 将 2024 年世界杯冠军说成中国队时,我们见识到了大语言模型(LLM)的"幻觉"——因知识时效性、准确性和覆盖范围不足导致的"一本正经胡说八道",已经成为 AI 应用的致命伤。检索增强生成(RAG)技术应运而生,它给 AI 装了个"移动硬盘",需要时随时调取外部知识库。

但现有 RAG 就像个"强迫症患者":面对"梅西获得过几次世界杯冠军?"这类简单问题,也要先拆解成多个子问题,每个步骤都机械式检索。这不仅浪费时间,更会引入大量无关信息,反而让回答质量下降。数据显示,这种冗余检索会使准确率暴跌 30%以上!

DeepRAG 是什么?让 AI 学会"按需思考"的智慧引擎

picture.image

中科院团队提出的 DeepRAG 框架,首次将人类思维方式植入 AI 检索过程。就像我们查资料时会先思考"这个问题是否需要上网搜索",DeepRAG 通过两个组件实现AI检索:

1. 检索叙事(Retrieval Narrative) 像写侦探小说般构建推理链条,每个子问题的提出都基于前序检索结果。例如要回答"2023 年诺贝尔经济学奖得主的主要贡献",它会自动分解为:

    1. 2023 年获奖者是谁?→ 需检索
    1. 该学者的代表理论是什么?→ 可能直接调用模型已有知识
    1. 这个理论如何影响现实经济?→ 混合推理与检索

2. 原子决策(Atomic Decisions) 每个推理节点都像有个"智能开关",动态决定是否启动检索。这背后是马尔可夫决策过程(MDP),通过二叉搜索树探索最优路径。实验显示,这种机制能减少 47%的不必要检索。

picture.image

三大技术突破:比传统方法强在哪?

突破 1:知识边界校准技术 传统方法像"蒙眼找路",要么全盘检索要么完全自信。DeepRAG 通过校准链(Chain of Calibration),让 AI 清楚知道自己的知识边界。就像学霸能准确判断哪些题需要查资料,哪些可以直接作答。

突破 2:模仿学习+强化学习双引擎 先用 2 万组"问题-最优检索路径"数据教会 AI 正确的思考模式,再通过强化学习不断优化决策。这种训练方式使 HotpotQA 数据集上的准确率从 68%跃升至 89%。

突破 3:端到端自适应架构 不同于需要额外训练分类器的方案,DeepRAG 直接基于现有大模型改造。就像给汽车换装智能导航系统,无需更换发动机就能实现自动驾驶级的检索优化。

实测表现:准确率暴涨的奥秘

在涵盖热点问答、跨领域知识库等 5 大测试场景中,DeepRAG 交出了惊艳答卷:

  • • 多跳推理准确率提升 21.99%
  • • 检索效率提升 3.8 倍
  • • 时间敏感问题处理正确率 92.7%
  • • 知识库异构查询成功率 85%

更令人振奋的是,在处理"新冠疫情对 2023 年全球经济影响"这类复杂问题时,DeepRAG 能自动识别需要检索最新 GDP 数据,而直接调用模型已有的经济学原理知识。

AI 进化的新方向

本篇论文给出了三大启示:

    1. 认知智能新范式 :将人类决策思维编码进 AI,而不仅是数据驱动
    1. 成本革命 :减少冗余计算可为单个大模型节省百万级算力成本
    1. 可信 AI 突破 :通过精确控制知识来源,大幅降低事实性错误

正如论文作者所言:"未来的 AI 不应该是个全知全能的'神',而应该是个懂得'何时需要查资料'的智者。"DeepRAG 标志着大模型正在从"知识搬运工"向"智慧决策者"进化。

目前,该项目没有开源,以下地址是错误地址 https://github.com/facebookresearch/DPR。


picture.image

0
0
0
0
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论