Qwen3开源前菜,补全2.5VL系列模型空缺,开源32B模型

大模型向量数据库机器学习

Qwen,汪峰属性是直接拉满了!

在Qwen3开源之前,Qwen先把之前的视觉理解多模态大模型补齐了,之前有3B、7B、72B三种尺寸,可能7B有点小,72B消耗资源有太多,32B真是个甜点尺寸。

HF link: https://huggingface.co/Qwen/Qwen2.5-VL-32B-Instruct

之前测试并介绍过Qwen2.5-VL的模型,见Qwen2.5-VL系列模型正式开源,千问永远不会让你失望 | 附实测结果

32B这个模型,从指标上来看,没有比72B差很多,见图2-3。

由于晚更新于其他2.5VL模型,还通过强化学习进一步增强了数学和问题解决能力,回复风格更符合人类偏好。

最后,DeepSeek-V3也更新版本了,开源了v3-0324版本模型,依旧超大,代码效果提升很多,审美也变好了。那么Qwen热度是否可以超过,拭目以待~

NLP工作站 4群 成立啦!欢迎入群交流!

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
大模型解决方案白皮书;社交陪伴场景全流程落地指南
随着大模型技术持续突破,AI正加速重塑社交娱乐的形态与体验。其中,陪伴式聊天因用户黏性强、互动频次高,成为大模型商业化落地的关键赛道。随着模型能力跃升至万亿参数级,AI从工具属性正迈向情感交互生态,现象级产品的诞生条件逐渐成熟。 本白皮书聚焦AI陪伴聊天应用开发,面向“从何起步、如何落地”的新手困惑,系统拆解从需求定义到产品上线的关键流程。我们结合工程化实践路径,打造模块化知识体系与渐进式开发框架,帮助开发者在30天内完成从技术认知到产品原型的跃升,快速构建具备基础交互能力的Web或App应用,迈出大模型
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论