Grok 3.0 即将发布!将成为世界上最强大的 AI。预训练现已完成,计算能力比 Grok 2 强 10 倍。

大模型向量数据库机器学习

🍹 Insight Daily 🪺

Aitrainee | 公众号:AI进修生

Hi,这里是Aitrainee,欢迎阅读本期新文章。

Grok 3的消息越来越多了。

每隔几天就有新模型发布:DeepSeek-R1与o1竞技,「星际之门计划」启动,投5000亿美元布局AGI,现在又是Grok-3。 我们就像一个孩子,每天都能收到新玩具。但这些"玩具",都在改变世界。 从SpaceX的Brent Mayo透露,他们在集群1和集群2之间优化了30%的性能,但还不够。

xAI的工作风格,很特斯拉:

" 我们能完成不可能的任务,但即使这样也觉得太慢了。在SpaceX和xAI,延迟从来就不被接受。所以我们继续向前,进入第三阶段。Grok 3即将火热发布。"

picture.image

硬件配置很惊人:Colossus超算集群,10万块NVIDIA H100 GPU。预训练算力是Grok 2的10倍。DogeDesigner说这将是"世界上最强大的AI"。

picture.image

Elon Musk 在 X 上说 .. 现在他们正在测试int4推理。

picture.image

这个细节很有意思,说明团队在追求更高性能的同时,也在考虑部署效率。 xAI团队的工作风格很特别:每天更新进展,对外保持透明,同时又在默默推进。就像一个网友说的:"他们不躲在幕后,而是让我们看到努力的过程。" 还有网友这句话说的挺厉害,演都不演了picture.image

picture.image

picture.image

此外,他们还有个新动作很有意思: 他们正在开发模型选择器。目前只有"grok-2-latest",但这个设计很有远见。未来可能会加入Grok 3,以及专门的图像生成模型Aurora。

picture.image

Grok已经有实时信息、图像生成、PDF理解等能力。现在他们瞄准了更高目标:用10万块H100 GPU打造Grok 3,要在推理能力、多模态处理、运算速度上都有突破。

xAI的这步棋 .. 他们把Grok从X平台独立出来,不是简单的产品调整。这让Grok有了更大的发展空间,不再受限于社交媒体的框架。 还有时机选得也好。就在Grok 3即将发布的关键时刻,为新模型预留了完整的发展空间。这让人想起特斯拉从单一产品线到全面布局的转变。xAI似乎也在走向更开放、更全面的发展道路。

还有网友展示一个测试的结果:Grok 3 和 OpenAI 的 o1 pro 模型在特定任务上首次并排性能对比。

在一个正方形空间里模拟一个会弹跳的 黄色小球,包括碰撞检测和旋转。

picture.image

编程对AI来说一直是个难题。它需要抽象思维,而AI更擅长具体任务。即使投入海量数据和算力,AI也难以像人类那样灵活适应。

目前的AI编程助手,比如GPT-4,虽然能写简单代码、修bug,但遇到复杂应用就力不从心了。往往需要人工重写和调试,反而比自己写更费时。

就连顶级模型在处理"方块内的弹跳球"这样的任务时也会出错 - o1 Pro连弹跳都实现不了,DeepSeek R1的碰撞检测也有问题。

这个测试引发了热议。

有人惊讶于它的物理碰撞模拟能力,可能和特斯拉AI的加入有关。DeepSeek R1虽然算力小得多,但表现也很出色。

picture.image

picture.image

争议也不少。有人说o1的表现其实没错,因为没有明确指定球的大小、质量和旋转力。

picture.image

有趣的是,有用户指出Grok 2就能完美完成这个任务。

picture.image

这让人更期待Grok-3到底会带来什么突破。

这听起来可能不算特别,但接下来发生的事情让我屏住了呼吸 —— 当被要求将球放在一个超立方体(tesseract,一个四维空间中的立方体)中时,Grok-3 一下子完成了这个任务。

picture.image

这个演示的深意远超表面。它不仅展示了 Grok-3 能写代码,更重要的是展示了它对物理规律的理解和跨维度的推理能力。

从二维平面到四维空间,这种跨越不是简单的代码生成,而是需要深刻理解空间、运动和物理定律。

AI的进化速度,让人既兴奋又感慨。这可能真的是一个特殊的时代,我们都在见证历史。

最后,测试Grok3的这段对话很有意思。

picture.image

它不是在机械回答,而是展现出了独特的幽默感和自嘲能力。当被问"subtard vs retard"时,它给出了一个半开玩笑的定义。

更妙的是后面的互动。当用户说"subtard grok"时,它回应"That is me!",被改成"groktard"时,还能接梗说"That is even better!"

最后那个转折更是点睛之笔。用户问"what am I",它直接回答"You are a retard"。整个对话充满了戏谑感,却又不失逻辑。

这种对话风格,让Grok显得更像一个有个性的对话者,而不是一个冰冷的AI。连马斯克看到都忍不住发笑。

这可能就是Grok的与众不同:它不只是在回答问题,而是在真正地对话。

有网友辣评:我和Grok3交谈就像是小丑到小丑的对话

picture.image

有人已经把宝押在了Grok上,认定它一年内会成为最强AI。"Nothing will compete"。

有网友表示,Grok3会成为新的SOTA模型。

picture.image

picture.image

Grok背后的团队实力同样令人瞩目。XAI的Igor Babushkin的履历很亮眼:DeepMind的Gopher、AlphaStar、AlphaCode,OpenAI的GPT-4和Codex。和Alec Radford、Ilia的合作经历,说明这是顶级AI专家在操刀。 从一份名为《What's in Grok》的独立报告中,我们可以看到从 Grok-0 到 Grok-5 的清晰发展规划,

picture.image

Grok的故事,不只是AI模型的迭代。 从Grok-0到Grok-5的规划,展现了xAI的野心。Grok-3选在2025年1月发布,这个时间点很有意思。它和特斯拉机器人、Neuralink的发展节奏形成了共振。 这是一个立体的布局:AI的思维(Grok)、物理世界的交互(特斯拉机器人)、人机接口(Neuralink)。他们不是在造一个聊天工具,而是在构建通向AGI的桥梁。 Grok-3的物理模拟能力,让人看到了更深的可能。真正的智能,需要理解多维世界的规律。当AI能在不同维度间自如切换,能模拟复杂物理规律时,我们就离AGI更近了。 从2025年的Grok-3,到年底的Grok-4,再到2026年的Grok-5。每一步都在向着更完整的AI生态系统迈进。 这不是终点,而是一个新起点。AI的进化,正在从表象走向本质。 我们在等待Grok3的降临:

picture.image

🌟 知音难求,自我修 炼亦艰, 抓住前沿技术的机遇,与我们一起成为创新的超级个体 (把握AIGC时代的个人力量)。

参考链接:
[1] https://www.testingcatalog.com/xai-developing-new-model-selector-for-grok-hinting-at-grok-3-launch/

[2] https://tereza-tizkova.medium.com/which-llm-is-really-the-best-3920b5af2ae6

0
0
0
0
关于作者
相关资源
字节跳动 XR 技术的探索与实践
火山引擎开发者社区技术大讲堂第二期邀请到了火山引擎 XR 技术负责人和火山引擎创作 CV 技术负责人,为大家分享字节跳动积累的前沿视觉技术及内外部的应用实践,揭秘现代炫酷的视觉效果背后的技术实现。
相关产品
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论