o1/r1的风吹到了多模态,R1-V开源!

大模型机器学习数据库

R1-V开源,使用可验证奖励的强化学习(RLVR),2B 模型在仅 100 个训练步骤内,OOD 测试中优于 72B 模型,成本低于3刀。

代码、模型、数据集、更多细节以及所有开源资源都将共享。果然大佬是没有休息时间的~

picture.image

项目地址:https://github.com/Deep-Agent/R1-V

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论