你能看得懂的解读:英伟达发布史上最强GPU

技术

产品二姐

读完需要

3分钟速读仅需 1 分钟

昨晚 AI 的重头戏无疑是英伟达发布最强芯片,视频很长(138 分钟),里面的数字太抽象,今天和大家聊一下我能看得懂的部分(我不是专业做芯片的)。篇幅不同以往,比较短,但足以体现我对未来趋势的坚定。

1

为什么 GPU 这么重要

解读之前你需要了解之所以 GPU 在今天比 CPU 获得更广泛的关注,背后的原因就是:

2017 年 Transformer 架构将神经网络的串行计算转变为并行计算,而 GPU 远比 CPU 更擅长并行计算。这个概念就意味着:在计算上只要有足够的卡,计算不再会有瓶颈。

而在Transformer之前,以 RNN 为代表的神经网络计算必须要等上一个大脑(CPU)计算完,下一个大脑才能开始计算,这里的瓶颈就是单个大脑的计算量。一旦计算可以被并行后,N 个大脑(GPU)同时进行计算,只要 N 足够大,算力就会足够强。不过 GPU 在并行计算中也遇到两个挑战:

1.芯片之间的通讯能力:对应的芯片指标是带宽,并行计算需要多个卡之间频繁进行通讯。

2.芯片的存储能力:对应的芯片指标是 Memory(显存),这是因为并行计算出来的大量数字需要一个存储空间。

这两个指标加上计算能力,就构成了芯片的三个关键指标。

  • 计算能力:单位是 FLOPS(FLoating-point Operations Per Second) 每秒浮点计算次数

  • 带宽: 单位是 GB/秒。

  • Memory:单位是 GB

2

A100 vs B100指标对比

我们来对比一下 2 年多以前 openAI 使用的 Nvidia A100 和昨天 BlackWell 100( 以首位入选美国国家科学院的非洲裔学者命名 ) 在单卡上的指数,几乎每一个指标都有数量级的上升。

picture.image

既然可以并行,与英伟达就把一堆 GPU 组装在一起形成了超级的并行计算系统(32000张GPU),让我非常震惊地看到了“并行的力量”。

picture.image

想要感受 Nvidia 并行力量的请观看视频:36 分 40 秒 —39 分 20 秒 之间

3

回顾历史

我们再来回顾一下历史上的 PC 机扩张时代:

曾经在 PC 机繁荣的时代,有一句话说:what intel creates, taken by Bill gates(不管英特尔能生产多强的芯片,总能被盖茨吃掉),形容当年 PC 机在 CPU 的硬件技术之上全速前进的景象。今天我们可以说: What Nvidia creates, Taken by Sam Altman ,OpenAI等一众公司也早已预约了这款史上最强GPU, 也许 Sora 的公开发布就是下一个吃掉 GPU 算力的 Giant Monster。

另一个角度,今天这种以 GPU 为载体的并行计算时代,也可以被理解为分布式计算。2006 年,美林证券的一份报告预测 2025 年全球将进入 distributed intelligence 阶段。今天我借用这个理念,希望我们从内心能深刻感受到从中心化的 CPU 到分布式的 GPU 计算对人工智能的深刻影响,甚至这也可以理解为一种哲学信仰。

picture.image

历史不会重复,但历史总是相似的,趋势已经非常确定,并且已经开始创造新的价值了。

在放眼世界之时,作为一个普通的创业者,脚踏实地做点事情是我所向往的,也是我们能做和正在做的事情。目前我们正在和已经帮助几家企业客户在加速落地 AI 应用的实现,我们的业务包含:

  • 企业 AI 应用的定制开发。

  • AI 应用落地加速服务(咨询,培训,方案设计,答疑,代码 review,代码交付等)。

需要商务合作公众号直接点击联系我。


我是关注 AI 产品的产品二姐,致力于带来丰富的 AI 学习分享、体会,欢迎你和我一起学习,如果你觉得文章有用,欢迎关注、点赞、转发。

0
0
0
0
评论
未登录
看完啦,登录分享一下感受吧~
暂无评论