阿里左手打右手,Qwen2.5 VL 72B 被自家 34B打败了~

大模型数据库机器学习

阿里巴巴 AIDC 团队开源ovis2 多模态 LLM 系列模型。

1B/2B/4B/8B/16B/34B

picture.image

模型地址:https://huggingface.co/collections/AIDC-AI/ovis2-67ab36c7e497429034874464

特点:

  1. 通过优化训练策略使小模型,有更高的能力密度,展现出跨层级的领先优势。
  2. 通过指令调整和偏好学习的结合,显著强化了思维链推理能力。
  3. 将视频和多图像数据纳入训练中,以增强处理跨帧和图像的复杂视觉信息的能力。
  4. 增强英语和中文以外的多语言 OCR,并改进从复杂视觉元素(如表格和图表)中提取结构化数据。

picture.image

模型性能,34B可以打Qwen2.5 VL 72B!

picture.image

picture.image

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
在火山引擎云搜索服务上构建混合搜索的设计与实现
本次演讲将重点介绍字节跳动在混合搜索领域的探索,并探讨如何在多模态数据场景下进行海量数据搜索。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论