文档备案控制台登录立即注册

首页文章活动镜像站

发布

o1/r1的风吹到了多模态，R1-V开源！

大模型机器学习数据库

R1-V开源，使用可验证奖励的强化学习（RLVR），2B 模型在仅 100 个训练步骤内，OOD 测试中优于 72B 模型，成本低于3刀。

代码、模型、数据集、更多细节以及所有开源资源都将共享。果然大佬是没有休息时间的~

picture.image

项目地址：https://github.com/Deep-Agent/R1-V

picture.image

0

0

0

0

关于作者

关于作者

文章

0

获赞

0

收藏

0

相关资源

CV 技术在视频创作中的应用

本次演讲将介绍在拍摄、编辑等场景，我们如何利用 AI 技术赋能创作者；以及基于这些场景，字节跳动积累的领先技术能力。

相关产品

推荐阅读

DeepSeek私有部署最全攻略：异构多机分布式、满血版、蒸馏版，国产GPU支持，总有一款适合你！

WebThinker：赋予推理模型深度研究能力

Firecrawl 网站内容优化器，提高网站转化率。

微软发布 Playwright MCP 正式版。

字节复刻了一个manus，还开源了~

评论

未登录

看完啦，登录分享一下感受吧～

暂无评论