o1/r1的风吹到了多模态,R1-V开源!

大模型机器学习数据库

R1-V开源,使用可验证奖励的强化学习(RLVR),2B 模型在仅 100 个训练步骤内,OOD 测试中优于 72B 模型,成本低于3刀。

代码、模型、数据集、更多细节以及所有开源资源都将共享。果然大佬是没有休息时间的~

picture.image

项目地址:https://github.com/Deep-Agent/R1-V

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
基于 ByteHouse 引擎的增强型数据导入技术实践
ByteHouse 基于自研 HaMergeTree,构建增强型物化 MySQL、HaKafka 引擎,实现数据快速集成,加速业务数据分析性能与效率,本次 talk 主要介绍物化 MySQL 与 HaKafka 数据导入方案和业务实践。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论