4月30日,小米悄然丢下一个“重磅炸弹”——首个开源推理大模型 MiMo 正式上线,背后不仅是技术突破,更是一次全方位的AI战略落子。
更有意思的是,本周五,小米的股价也轻轻往上翘了下—— 单日涨幅高达6% 。感看起来,资本市场对“小米搞AI”这事儿,开始认真了。
感谢雷总,我的小米已经收益40%。
01 | 小米也要“ALL IN AI”了?
小米创始人雷军不久前在演讲中激情表态:“我们是全球最早在手机上跑通大模型的公司。”
同时透露,小米正在自建 万卡级GPU集群 ,并已手握 6500张GPU资源 ,这已经不是“试试水”了,而是正式开卷!
更关键的信号,是前 DeepSeek-V2 核心人物、“MLA技术”主要开发者 罗福莉 加盟小米,主导大模型研发。这位技术大牛曾操刀业内领先的轻量化方案——MLA(Multi-head Latent Attention),让大模型“飞入寻常百姓家”的速度大大加快。
02 | MiMo模型:参数不大,能耐却不小
这次发布的 Xiaomi MiMo-7B ,参数量只有7B,却在两个重量级测试集上表现惊艳:
- 数学推理测试 AIME 24-25
- 编程能力测试 LiveCodeBench v5
MiMo 竟然 超越了OpenAI的o1-mini(闭源)和阿里Qwen QwQ-32B(开源) !
你没看错:7B干翻32B,真的有点“以小博大”的味道。
为何能做到这一点?小米官方提到了两项核心创新:
1. 预训练阶段:
选取大量“富推理性”的语料,合成了 200B tokens 推理数据,并进行“三阶段递进训练”,累计训练了25T tokens,保证模型在“见识”和“思维深度”上的成长。
2. 后训练阶段(RL):
提出了两个非常关键的强化学习机制:
- Test Difficulty Driven Reward:奖励设计更加“聪明”,难题更能被模型识别和突破;
- Easy Data Re-Sampling:提高了训练稳定性,解决RL过程中的“崩盘”问题。
再加上自研的“Seamless Rollout”框架,让训练加速2.29倍,验证速度提升1.96倍。
一句话总结:不是“大力出奇迹”,而是“巧劲出奇迹”。
03 | 小爱同学,正在悄悄变身“小米版ChatGPT”
如果你已经用过小爱同学,接下来可能会感受到一些“不一样”的地方。
现在的小爱已经集成了大模型能力, 你可以和她自然对话,还能指定“角色扮演”对象 ,比如让她变身成“英语老师”或“恋爱顾问”。体验更像是在和一个“懂你的AI朋友”聊天。
这次的升级版小爱同学,虽然入口设计更隐蔽(或许是为了让AI更“融入”体验中),但一旦唤醒,整个人机交互的感觉就不同了——
以前的AI是“你问一句,我答一句”;
现在的小爱,是“你刚张嘴,她就懂你要说什么,还能给你多个选项”。
这种从“工具”到“助手”甚至“伙伴”的转变,本质上就是 AI能力跨越的体现 。
04 | 为什么是现在?小米的“迟到”或许刚刚好
2023年,小米曾明确表示“不做OpenAI式大模型”。但到了2025年,态度来了个180度大转弯,开源模型、自建集群、引入大牛,节奏拉满。
为何突然“变心”?
答案或许正如小米官方在MiMo推文中坦言:“2025看似是大模型逐梦的后半程,但我们坚信AGI征途仍漫长。”
行业正在从“卷参数”“卷算力”,进入“卷落地”“卷本地部署”的下半场,而小米这时候入场,恰好具备了以下优势:
- 手机是天然的AI应用落地终端;
- 小米生态(家电、IoT、汽车)提供了最宽广的AI应用场景;
- 自研+合作两手抓,战略灵活且资源齐全。
晚一点不代表慢,小米或许押中了“AI真正进入消费生活”的临界点。
05 | 写在最后:小米的AI野心,才刚开始
开源MiMo只是起点,接下来,小米还会持续发布MiMo的衍生模型、优化版本,进一步提升小爱同学、小米手机、甚至智能家居和汽车的AI能力。
未来你可能会看到这样的场景:
- 拿起手机对着小爱说:“帮我写一份请假邮件”;
- 车载系统秒懂你说的“带我去没那么堵的星巴克”;
- 家里的米家电器自动联动,基于你说的“我累了”调暗灯光、泡一杯咖啡。
小米的大模型,是在讲一个新的故事—— 不仅是技术,还是体验升级的引擎。
📌 点赞+关注,我们持续追踪中国大模型新势力,小米能否成为下一个AI巨头?评论区聊聊你的看法。