SuperRAG, 百川也开源了。

向量数据库大模型机器学习

强化学习用于RAG 检索增强推理

六小虎-百川 开源 ReSearch,一个 RL 框架,从零开始教 LLMs 使用搜索进行推理。

picture.image

简单概括,ReSearch框架,它不是教AI怎么思考或怎么搜索,而是让AI自己学会何时该搜索、搜什么、如何利用搜索结果继续推理。

naive RAG -> agentic RAG

整体没有太大新的地方,先思考问题 -> 决定需要查询什么 -> 获取搜索结果 -> 基于搜索结果继续思考或调整查询方向

picture.image

reward 规则如下,训练数据使用musique,一个为多跳问答设计的19938个样本。 grpo训练。

picture.image

所以,就这? 嗯, 就这。 好像有点赶不上以前分享的一些类似工作。

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论