江南体育官网新的B200 GPU提供高达20petaflops的FP4算力,可以为大模型提供高达30倍性能。相比H100,它将成本和能耗大幅降低。以前训练一个1.8万亿参数模型需要8000个Hopper GPU和15兆瓦的电力。如今2000个Blackwell GPU可以做到,同时只消耗4兆瓦的电力。
芯片界有一个摩尔定律,只是目前它已经快要到头了,芯片里面的最小单元晶体管的最小尺寸已经到了 4nm以下,几乎是逼近原子的直径啊,已经到达了一个极限,已经小无可小了江南体育。
黄仁勋在这次发布会上表示发展人工智能需要更大的GPU,如果不能更大,那我们就把更多的GPU组合在一起,变成更大的虚拟GPU。再结合芯片间的一个互联技术,一步一步去构建出大型的 AI超算集群,英伟达新一代AI超级芯片Blackwell的新架构就是如此。
新架构第一步是把两个B200芯片合在一起,以每秒10 TB的带宽互联组成B200 GPU,这个G200 GPU总计包含了2080亿个晶体管,这在晶体管的集成度上是一个新的纪录,它的内存也直接翻倍江南体育,高速内存高达192 GB。
接下来两个B200 GPU再和 Grace GPU结合,就构成了GB200超级芯片,它们之间是通过每秒900 GB的超低功耗的一个叫NVL link的互联技术连接在一起的江南体育。
最后两个GB200的超级芯片一起组装到一个主板上,这就成了一个Blackwell架构的计算节点,然后18个这样的计算节点连在一起,一共是36个CPU加72个GPU,这就组成了一个更大的虚拟的GPU,进而成为新一代计算单元GB200 NVL72。
这样子的计算单元它训练 AI的算力就高达720 PF loPs,这个性能就直逼上一代英伟达H100芯片时代一整个超级计算机集群,这也是这一次很多媒体说一个机柜顶一个集群的意思。
分析师认为英伟达 B200芯片的硬件成本约为6000美元,预计英伟达B200芯片今年年内会发货,定价大概在3万到4万美元之间。虽然价格昂贵,但现在全世界的科技大厂都在排队下订单,还不一定每家公司都能买到,所以英伟达被称之为 AI时代的顶级军火商,真的是实至名归。