朋友跟我说，他们已经“全面换成Qwen3”了！ - 文章 - 开发者社区

朋友跟我说，他们已经“全面换成Qwen3”了！

前两天一个搞AI应用开发的朋友突然跟我说：“我们已经把底座模型换成Qwen3了。”\x0a\x0a我完全认同，这话最近已经不是第一次听到。\x0a\x0a基本达成共识了，经过半个月的微调，我部分业务上的模型也已经替换成了Qwen3的模型，并且最新的MoE模型，线上并发，真是爽YY。\x0a\x0a突然想到，我4月29号那天，熬了一个通宵，就是为了等Qwen3的发布（吐槽一下，Qwen下次白天开源好不好）。一直肝到了早上7点多，一宿没睡直接去上班。\x0a\x0a\x26lt;a href=\x26quot;https://mp.weixin.qq.com/s?\_\_biz=Mzg5MTU1NTE1OQ==\x26amp;amp;mid=2247494242\x26amp;amp;idx=1\x26amp;amp;sn=ee46d0e074d62e0d4a2f062df4608a0c\x26amp;amp;scene=142#wechat\_redirect\x26quot; target=\x26quot;_blank\x26quot; data-itemshowtype=\x26quot;0\x26quot;\x26gt;Qwen3 一手肝帝实测！附示例，涉及推理、创作、数学和代码！\x26lt;/a\x26gt;\x0a\x0a但这个夜，真没白熬！\x0a\x0a说实话，之前2023年、2024年，大家在选基座模型的时候，还能在武器库里挑一挑。\x0a\x0a现在，越来越多人的共识是：整个武器库，最锋利的一把剑就是Qwen。\x0a\x0a之前复现推理模型的，基本上都是再用Qwen系列模型就不多说了（见图3），前两天也是看到英伟达开源的全新代码推理模型—OpenCodeReasoning，也是以Qwen为基座进行训练，见图4。\x0a\x0a对行业技术人员来讲，Qwen基本上已经成为了首选Base模型，主要是从1.5b-72b各种尺寸的模型都有，特别好做一系列的对比试验。而且Qwen的预训练很扎实，最新的Qwen3系列模型预训练数据已经达了36T Tokens。\x0a\x0a并且我觉得Qwen受欢迎的核心点还是配套服务做的比较好，比如Qwen3还专门进行agent的训练，还有配套的Qwen-Agent框架等，当然每一次模型发布时，推理框架也都是同步适配好的。魔搭社区、swift微调框架等等等，简直是保姆级服务~\x0a\x0a到了2025年，开源模型圈已经“内卷至死，剩者为王”，国外一个不剩，哈哈哈！\x0a\x0a今天又是当Qwen吹的一天！\x0a\x0aPS：不知道大家发没发现一个小问题，好像Qwen3在指令遵循没有Qwen2.5好，不知道是不是因为混合推理导致的，欢迎大家讨论！\x0a\x0a附：\x26lt;a href=\x26quot;https://mp.weixin.qq.com/s?\_\_biz=Mzg5MTU1NTE1OQ==\x26amp;amp;mid=2247494326\x26amp;amp;idx=1\x26amp;amp;sn=c6bf3f48e4f901ab0aaea45923052c68\x26amp;amp;scene=142#wechat\_redirect\x26quot; target=\x26quot;_blank\x26quot; data-itemshowtype=\x26quot;0\x26quot;\x26gt;Qwen3技术报告解读\x26lt;/a\x26gt;