SuperRAG, 百川也开源了。

向量数据库大模型机器学习

强化学习用于RAG 检索增强推理

六小虎-百川 开源 ReSearch,一个 RL 框架,从零开始教 LLMs 使用搜索进行推理。

picture.image

简单概括,ReSearch框架,它不是教AI怎么思考或怎么搜索,而是让AI自己学会何时该搜索、搜什么、如何利用搜索结果继续推理。

naive RAG -> agentic RAG

整体没有太大新的地方,先思考问题 -> 决定需要查询什么 -> 获取搜索结果 -> 基于搜索结果继续思考或调整查询方向

picture.image

reward 规则如下,训练数据使用musique,一个为多跳问答设计的19938个样本。 grpo训练。

picture.image

所以,就这? 嗯, 就这。 好像有点赶不上以前分享的一些类似工作。

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论