朋友跟我说,他们已经“全面换成Qwen3”了!

大模型向量数据库云安全
朋友跟我说,他们已经“全面换成Qwen3”了!

,

,

,

前两天一个搞AI应用开发的朋友突然跟我说:“我们已经把底座模型换成Qwen3了。”\x0a\x0a我完全认同,这话最近已经不是第一次听到。\x0a\x0a基本达成共识了,经过半个月的微调,我部分业务上的模型也已经替换成了Qwen3的模型,并且最新的MoE模型,线上并发,真是爽YY。\x0a\x0a突然想到,我4月29号那天,熬了一个通宵,就是为了等Qwen3的发布(吐槽一下,Qwen下次白天开源好不好)。一直肝到了早上7点多,一宿没睡直接去上班。\x0a\x0a\x26lt;a href=\x26quot;https://mp.weixin.qq.com/s?\_\_biz=Mzg5MTU1NTE1OQ==\x26amp;amp;mid=2247494242\x26amp;amp;idx=1\x26amp;amp;sn=ee46d0e074d62e0d4a2f062df4608a0c\x26amp;amp;scene=142#wechat\_redirect\x26quot; target=\x26quot;_blank\x26quot; data-itemshowtype=\x26quot;0\x26quot;\x26gt;Qwen3 一手肝帝实测! 附示例,涉及推理、创作、数学和代码!\x26lt;/a\x26gt;\x0a\x0a但这个夜,真没白熬!\x0a\x0a说实话,之前2023年、2024年,大家在选基座模型的时候,还能在武器库里挑一挑。\x0a\x0a现在,越来越多人的共识是:整个武器库,最锋利的一把剑就是Qwen。\x0a\x0a之前复现推理模型的,基本上都是再用Qwen系列模型就不多说了(见图3),前两天也是看到英伟达开源的全新代码推理模型—OpenCodeReasoning,也是以Qwen为基座进行训练,见图4。\x0a\x0a对行业技术人员来讲,Qwen基本上已经成为了首选Base模型,主要是从1.5b-72b各种尺寸的模型都有,特别好做一系列的对比试验。而且Qwen的预训练很扎实,最新的Qwen3系列模型预训练数据已经达了36T Tokens。\x0a\x0a并且我觉得Qwen受欢迎的核心点还是配套服务做的比较好,比如Qwen3还专门进行agent的训练,还有配套的Qwen-Agent框架等,当然每一次模型发布时,推理框架也都是同步适配好的。魔搭社区、swift微调框架等等等,简直是保姆级服务~\x0a\x0a到了2025年,开源模型圈已经“内卷至死,剩者为王”,国外一个不剩,哈哈哈!\x0a\x0a今天又是当Qwen吹的一天!\x0a\x0aPS:不知道大家发没发现一个小问题,好像Qwen3在指令遵循没有Qwen2.5好,不知道是不是因为混合推理导致的,欢迎大家讨论!\x0a\x0a附:\x26lt;a href=\x26quot;https://mp.weixin.qq.com/s?\_\_biz=Mzg5MTU1NTE1OQ==\x26amp;amp;mid=2247494326\x26amp;amp;idx=1\x26amp;amp;sn=c6bf3f48e4f901ab0aaea45923052c68\x26amp;amp;scene=142#wechat\_redirect\x26quot; target=\x26quot;_blank\x26quot; data-itemshowtype=\x26quot;0\x26quot;\x26gt;Qwen3技术报告解读\x26lt;/a\x26gt;

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
在火山引擎云搜索服务上构建混合搜索的设计与实现
本次演讲将重点介绍字节跳动在混合搜索领域的探索,并探讨如何在多模态数据场景下进行海量数据搜索。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论