小米大模型发布,股票悄悄涨了6个点,小爱AI就要来了?

大模型GPU机器学习

4月30日,小米悄然丢下一个“重磅炸弹”——首个开源推理大模型 MiMo 正式上线,背后不仅是技术突破,更是一次全方位的AI战略落子。

更有意思的是,本周五,小米的股价也轻轻往上翘了下—— 单日涨幅高达6% 。感看起来,资本市场对“小米搞AI”这事儿,开始认真了。

picture.image

感谢雷总,我的小米已经收益40%。

01 | 小米也要“ALL IN AI”了?

小米创始人雷军不久前在演讲中激情表态:“我们是全球最早在手机上跑通大模型的公司。”

同时透露,小米正在自建 万卡级GPU集群 ,并已手握 6500张GPU资源 ,这已经不是“试试水”了,而是正式开卷!

更关键的信号,是前 DeepSeek-V2 核心人物、“MLA技术”主要开发者 罗福莉 加盟小米,主导大模型研发。这位技术大牛曾操刀业内领先的轻量化方案——MLA(Multi-head Latent Attention),让大模型“飞入寻常百姓家”的速度大大加快。

picture.image


02 | MiMo模型:参数不大,能耐却不小

这次发布的 Xiaomi MiMo-7B ,参数量只有7B,却在两个重量级测试集上表现惊艳:

  • 数学推理测试 AIME 24-25
  • 编程能力测试 LiveCodeBench v5

MiMo 竟然 超越了OpenAI的o1-mini(闭源)和阿里Qwen QwQ-32B(开源)

你没看错:7B干翻32B,真的有点“以小博大”的味道。

picture.image

为何能做到这一点?小米官方提到了两项核心创新:

1. 预训练阶段:
选取大量“富推理性”的语料,合成了 200B tokens 推理数据,并进行“三阶段递进训练”,累计训练了25T tokens,保证模型在“见识”和“思维深度”上的成长。

2. 后训练阶段(RL):
提出了两个非常关键的强化学习机制:

  • Test Difficulty Driven Reward:奖励设计更加“聪明”,难题更能被模型识别和突破;
  • Easy Data Re-Sampling:提高了训练稳定性,解决RL过程中的“崩盘”问题。

再加上自研的“Seamless Rollout”框架,让训练加速2.29倍,验证速度提升1.96倍。

一句话总结:不是“大力出奇迹”,而是“巧劲出奇迹”。

picture.image

03 | 小爱同学,正在悄悄变身“小米版ChatGPT”

如果你已经用过小爱同学,接下来可能会感受到一些“不一样”的地方。

现在的小爱已经集成了大模型能力, 你可以和她自然对话,还能指定“角色扮演”对象 ,比如让她变身成“英语老师”或“恋爱顾问”。体验更像是在和一个“懂你的AI朋友”聊天。

这次的升级版小爱同学,虽然入口设计更隐蔽(或许是为了让AI更“融入”体验中),但一旦唤醒,整个人机交互的感觉就不同了——

以前的AI是“你问一句,我答一句”;
现在的小爱,是“你刚张嘴,她就懂你要说什么,还能给你多个选项”。

picture.image

这种从“工具”到“助手”甚至“伙伴”的转变,本质上就是 AI能力跨越的体现

04 | 为什么是现在?小米的“迟到”或许刚刚好

2023年,小米曾明确表示“不做OpenAI式大模型”。但到了2025年,态度来了个180度大转弯,开源模型、自建集群、引入大牛,节奏拉满。

为何突然“变心”?

答案或许正如小米官方在MiMo推文中坦言:“2025看似是大模型逐梦的后半程,但我们坚信AGI征途仍漫长。”

行业正在从“卷参数”“卷算力”,进入“卷落地”“卷本地部署”的下半场,而小米这时候入场,恰好具备了以下优势:

  • 手机是天然的AI应用落地终端;
  • 小米生态(家电、IoT、汽车)提供了最宽广的AI应用场景;
  • 自研+合作两手抓,战略灵活且资源齐全。

晚一点不代表慢,小米或许押中了“AI真正进入消费生活”的临界点。


05 | 写在最后:小米的AI野心,才刚开始

开源MiMo只是起点,接下来,小米还会持续发布MiMo的衍生模型、优化版本,进一步提升小爱同学、小米手机、甚至智能家居和汽车的AI能力。

未来你可能会看到这样的场景:

  • 拿起手机对着小爱说:“帮我写一份请假邮件”;
  • 车载系统秒懂你说的“带我去没那么堵的星巴克”;
  • 家里的米家电器自动联动,基于你说的“我累了”调暗灯光、泡一杯咖啡。

小米的大模型,是在讲一个新的故事—— 不仅是技术,还是体验升级的引擎。

picture.image


📌 点赞+关注,我们持续追踪中国大模型新势力,小米能否成为下一个AI巨头?评论区聊聊你的看法。

0
0
0
0
关于作者
关于作者

文章

0

获赞

0

收藏

0

相关资源
CV 技术在视频创作中的应用
本次演讲将介绍在拍摄、编辑等场景,我们如何利用 AI 技术赋能创作者;以及基于这些场景,字节跳动积累的领先技术能力。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论