小米大模型发布，股票悄悄涨了6个点，小爱AI就要来了？ - 文章 - 开发者社区

4月30日，小米悄然丢下一个“重磅炸弹”——首个开源推理大模型 MiMo 正式上线，背后不仅是技术突破，更是一次全方位的AI战略落子。

更有意思的是，本周五，小米的股价也轻轻往上翘了下—— 单日涨幅高达6% 。感看起来，资本市场对“小米搞AI”这事儿，开始认真了。

picture.image

感谢雷总，我的小米已经收益40%。

01 | 小米也要“ALL IN AI”了？

小米创始人雷军不久前在演讲中激情表态：“我们是全球最早在手机上跑通大模型的公司。”

同时透露，小米正在自建 万卡级GPU集群 ，并已手握 6500张GPU资源 ，这已经不是“试试水”了，而是正式开卷！

更关键的信号，是前 DeepSeek-V2 核心人物、“MLA技术”主要开发者 罗福莉 加盟小米，主导大模型研发。这位技术大牛曾操刀业内领先的轻量化方案——MLA（Multi-head Latent Attention），让大模型“飞入寻常百姓家”的速度大大加快。

picture.image

这次发布的 Xiaomi MiMo-7B ，参数量只有7B，却在两个重量级测试集上表现惊艳：

MiMo 竟然 超越了OpenAI的o1-mini（闭源）和阿里Qwen QwQ-32B（开源） ！

你没看错：7B干翻32B，真的有点“以小博大”的味道。

picture.image

为何能做到这一点？小米官方提到了两项核心创新：

1. 预训练阶段：
选取大量“富推理性”的语料，合成了 200B tokens 推理数据，并进行“三阶段递进训练”，累计训练了25T tokens，保证模型在“见识”和“思维深度”上的成长。

2. 后训练阶段（RL）：
提出了两个非常关键的强化学习机制：

再加上自研的“Seamless Rollout”框架，让训练加速2.29倍，验证速度提升1.96倍。

一句话总结：不是“大力出奇迹”，而是“巧劲出奇迹”。

picture.image

如果你已经用过小爱同学，接下来可能会感受到一些“不一样”的地方。

现在的小爱已经集成了大模型能力， 你可以和她自然对话，还能指定“角色扮演”对象 ，比如让她变身成“英语老师”或“恋爱顾问”。体验更像是在和一个“懂你的AI朋友”聊天。

这次的升级版小爱同学，虽然入口设计更隐蔽（或许是为了让AI更“融入”体验中），但一旦唤醒，整个人机交互的感觉就不同了——

以前的AI是“你问一句，我答一句”；
现在的小爱，是“你刚张嘴，她就懂你要说什么，还能给你多个选项”。

picture.image

这种从“工具”到“助手”甚至“伙伴”的转变，本质上就是 AI能力跨越的体现 。

2023年，小米曾明确表示“不做OpenAI式大模型”。但到了2025年，态度来了个180度大转弯，开源模型、自建集群、引入大牛，节奏拉满。

为何突然“变心”？

答案或许正如小米官方在MiMo推文中坦言：“2025看似是大模型逐梦的后半程，但我们坚信AGI征途仍漫长。”

行业正在从“卷参数”“卷算力”，进入“卷落地”“卷本地部署”的下半场，而小米这时候入场，恰好具备了以下优势：

晚一点不代表慢，小米或许押中了“AI真正进入消费生活”的临界点。

开源MiMo只是起点，接下来，小米还会持续发布MiMo的衍生模型、优化版本，进一步提升小爱同学、小米手机、甚至智能家居和汽车的AI能力。

未来你可能会看到这样的场景：

小米的大模型，是在讲一个新的故事—— 不仅是技术，还是体验升级的引擎。

picture.image

📌 点赞+关注，我们持续追踪中国大模型新势力，小米能否成为下一个AI巨头？评论区聊聊你的看法。