产品二姐
读完需要
3分钟速读仅需 1 分钟
昨晚 AI 的重头戏无疑是英伟达发布最强芯片,视频很长(138 分钟),里面的数字太抽象,今天和大家聊一下我能看得懂的部分(我不是专业做芯片的)。篇幅不同以往,比较短,但足以体现我对未来趋势的坚定。
1
为什么 GPU 这么重要
解读之前你需要了解之所以 GPU 在今天比 CPU 获得更广泛的关注,背后的原因就是:
2017 年 Transformer 架构将神经网络的串行计算转变为并行计算,而 GPU 远比 CPU 更擅长并行计算。这个概念就意味着:在计算上只要有足够的卡,计算不再会有瓶颈。
而在Transformer之前,以 RNN 为代表的神经网络计算必须要等上一个大脑(CPU)计算完,下一个大脑才能开始计算,这里的瓶颈就是单个大脑的计算量。一旦计算可以被并行后,N 个大脑(GPU)同时进行计算,只要 N 足够大,算力就会足够强。不过 GPU 在并行计算中也遇到两个挑战:
1.芯片之间的通讯能力:对应的芯片指标是带宽,并行计算需要多个卡之间频繁进行通讯。
2.芯片的存储能力:对应的芯片指标是 Memory(显存),这是因为并行计算出来的大量数字需要一个存储空间。
这两个指标加上计算能力,就构成了芯片的三个关键指标。
计算能力:单位是 FLOPS(FLoating-point Operations Per Second) 每秒浮点计算次数
带宽: 单位是 GB/秒。
Memory:单位是 GB
2
A100 vs B100指标对比
我们来对比一下 2 年多以前 openAI 使用的 Nvidia A100 和昨天 BlackWell 100( 以首位入选美国国家科学院的非洲裔学者命名 ) 在单卡上的指数,几乎每一个指标都有数量级的上升。
既然可以并行,与英伟达就把一堆 GPU 组装在一起形成了超级的并行计算系统(32000张GPU),让我非常震惊地看到了“并行的力量”。
想要感受 Nvidia 并行力量的请观看视频:36 分 40 秒 —39 分 20 秒 之间
3
回顾历史
我们再来回顾一下历史上的 PC 机扩张时代:
曾经在 PC 机繁荣的时代,有一句话说:what intel creates, taken by Bill gates(不管英特尔能生产多强的芯片,总能被盖茨吃掉),形容当年 PC 机在 CPU 的硬件技术之上全速前进的景象。今天我们可以说: What Nvidia creates, Taken by Sam Altman ,OpenAI等一众公司也早已预约了这款史上最强GPU, 也许 Sora 的公开发布就是下一个吃掉 GPU 算力的 Giant Monster。
另一个角度,今天这种以 GPU 为载体的并行计算时代,也可以被理解为分布式计算。2006 年,美林证券的一份报告预测 2025 年全球将进入 distributed intelligence 阶段。今天我借用这个理念,希望我们从内心能深刻感受到从中心化的 CPU 到分布式的 GPU 计算对人工智能的深刻影响,甚至这也可以理解为一种哲学信仰。
历史不会重复,但历史总是相似的,趋势已经非常确定,并且已经开始创造新的价值了。
在放眼世界之时,作为一个普通的创业者,脚踏实地做点事情是我所向往的,也是我们能做和正在做的事情。目前我们正在和已经帮助几家企业客户在加速落地 AI 应用的实现,我们的业务包含:
企业 AI 应用的定制开发。
AI 应用落地加速服务(咨询,培训,方案设计,答疑,代码 review,代码交付等)。
需要商务合作公众号直接点击联系我。
我是关注 AI 产品的产品二姐,致力于带来丰富的 AI 学习分享、体会,欢迎你和我一起学习,如果你觉得文章有用,欢迎关注、点赞、转发。