Grok 3.0 即将发布！将成为世界上最强大的 AI。预训练现已完成，计算能力比 Grok 2 强 10 倍。 - 文章 - 开发者社区

🍹 Insight Daily 🪺

Aitrainee | 公众号：AI进修生

Hi，这里是Aitrainee，欢迎阅读本期新文章。

Grok 3的消息越来越多了。

每隔几天就有新模型发布：DeepSeek-R1与o1竞技，「星际之门计划」启动，投5000亿美元布局AGI，现在又是Grok-3。我们就像一个孩子，每天都能收到新玩具。但这些"玩具"，都在改变世界。从SpaceX的Brent Mayo透露，他们在集群1和集群2之间优化了30%的性能，但还不够。

xAI的工作风格，很特斯拉：

" 我们能完成不可能的任务，但即使这样也觉得太慢了。在SpaceX和xAI，延迟从来就不被接受。所以我们继续向前，进入第三阶段。Grok 3即将火热发布。"

picture.image

硬件配置很惊人：Colossus超算集群，10万块NVIDIA H100 GPU。预训练算力是Grok 2的10倍。DogeDesigner说这将是"世界上最强大的AI"。

picture.image

Elon Musk 在 X 上说 .. 现在他们正在测试int4推理。

picture.image

这个细节很有意思，说明团队在追求更高性能的同时，也在考虑部署效率。 xAI团队的工作风格很特别：每天更新进展，对外保持透明，同时又在默默推进。就像一个网友说的："他们不躲在幕后，而是让我们看到努力的过程。" 还有网友这句话说的挺厉害，演都不演了 picture.image ：

picture.image

此外，他们还有个新动作很有意思：他们正在开发模型选择器。目前只有"grok-2-latest"，但这个设计很有远见。未来可能会加入Grok 3，以及专门的图像生成模型Aurora。

picture.image

Grok已经有实时信息、图像生成、PDF理解等能力。现在他们瞄准了更高目标：用10万块H100 GPU打造Grok 3，要在推理能力、多模态处理、运算速度上都有突破。

xAI的这步棋 .. 他们把Grok从X平台独立出来，不是简单的产品调整。这让Grok有了更大的发展空间，不再受限于社交媒体的框架。还有时机选得也好。就在Grok 3即将发布的关键时刻，为新模型预留了完整的发展空间。这让人想起特斯拉从单一产品线到全面布局的转变。xAI似乎也在走向更开放、更全面的发展道路。

还有网友展示一个测试的结果：Grok 3 和 OpenAI 的 o1 pro 模型在特定任务上首次并排性能对比。

在一个正方形空间里模拟一个会弹跳的黄色小球，包括碰撞检测和旋转。

picture.image

编程对AI来说一直是个难题。它需要抽象思维,而AI更擅长具体任务。即使投入海量数据和算力,AI也难以像人类那样灵活适应。

目前的AI编程助手,比如GPT-4,虽然能写简单代码、修bug,但遇到复杂应用就力不从心了。往往需要人工重写和调试,反而比自己写更费时。

就连顶级模型在处理"方块内的弹跳球"这样的任务时也会出错 - o1 Pro连弹跳都实现不了,DeepSeek R1的碰撞检测也有问题。

这个测试引发了热议。

有人惊讶于它的物理碰撞模拟能力，可能和特斯拉AI的加入有关。DeepSeek R1虽然算力小得多，但表现也很出色。

picture.image

争议也不少。有人说o1的表现其实没错，因为没有明确指定球的大小、质量和旋转力。

picture.image

有趣的是，有用户指出Grok 2就能完美完成这个任务。

picture.image

这让人更期待Grok-3到底会带来什么突破。

这听起来可能不算特别，但接下来发生的事情让我屏住了呼吸 —— 当被要求将球放在一个超立方体（tesseract，一个四维空间中的立方体）中时，Grok-3 一下子完成了这个任务。

picture.image

这个演示的深意远超表面。它不仅展示了 Grok-3 能写代码，更重要的是展示了它对物理规律的理解和跨维度的推理能力。

从二维平面到四维空间，这种跨越不是简单的代码生成，而是需要深刻理解空间、运动和物理定律。

AI的进化速度，让人既兴奋又感慨。这可能真的是一个特殊的时代，我们都在见证历史。

最后，测试Grok3的这段对话很有意思。

picture.image

它不是在机械回答，而是展现出了独特的幽默感和自嘲能力。当被问"subtard vs retard"时，它给出了一个半开玩笑的定义。

更妙的是后面的互动。当用户说"subtard grok"时，它回应"That is me!"，被改成"groktard"时，还能接梗说"That is even better!"

最后那个转折更是点睛之笔。用户问"what am I"，它直接回答"You are a retard"。整个对话充满了戏谑感，却又不失逻辑。

这种对话风格，让Grok显得更像一个有个性的对话者，而不是一个冰冷的AI。连马斯克看到都忍不住发笑。

这可能就是Grok的与众不同：它不只是在回答问题，而是在真正地对话。

有网友辣评：我和Grok3交谈就像是小丑到小丑的对话

picture.image

有人已经把宝押在了Grok上，认定它一年内会成为最强AI。"Nothing will compete"。

有网友表示，Grok3会成为新的SOTA模型。

picture.image

Grok背后的团队实力同样令人瞩目。XAI的Igor Babushkin的履历很亮眼：DeepMind的Gopher、AlphaStar、AlphaCode，OpenAI的GPT-4和Codex。和Alec Radford、Ilia的合作经历，说明这是顶级AI专家在操刀。从一份名为《What's in Grok》的独立报告中，我们可以看到从 Grok-0 到 Grok-5 的清晰发展规划，

picture.image

Grok的故事，不只是AI模型的迭代。从Grok-0到Grok-5的规划，展现了xAI的野心。Grok-3选在2025年1月发布，这个时间点很有意思。它和特斯拉机器人、Neuralink的发展节奏形成了共振。这是一个立体的布局：AI的思维（Grok）、物理世界的交互（特斯拉机器人）、人机接口（Neuralink）。他们不是在造一个聊天工具，而是在构建通向AGI的桥梁。 Grok-3的物理模拟能力，让人看到了更深的可能。真正的智能，需要理解多维世界的规律。当AI能在不同维度间自如切换，能模拟复杂物理规律时，我们就离AGI更近了。从2025年的Grok-3，到年底的Grok-4，再到2026年的Grok-5。每一步都在向着更完整的AI生态系统迈进。这不是终点，而是一个新起点。AI的进化，正在从表象走向本质。我们在等待Grok3的降临：

picture.image

🌟 知音难求，自我修 炼亦艰，抓住前沿技术的机遇，与我们一起成为创新的超级个体（把握AIGC时代的个人力量）。

参考链接：
[1] https://www.testingcatalog.com/xai-developing-new-model-selector-for-grok-hinting-at-grok-3-launch/

[2] https://tereza-tizkova.medium.com/which-llm-is-really-the-best-3920b5af2ae6