在2023年的最新处理器排行榜中,全球首款3D晶圆级封装处理器IPU发布,以其突破7nm制程极限的能力引领了社会科技发展的新纪元。Graphcore公司,这家总部位于英国的AI芯片制造商,在本周四宣布了其第三代IPU系统Bow的发布。这款Bow IPU不仅面向客户发货,而且实现了与上一代相比性能提升40%、能耗比提升16%,电源效率也提高16%。
值得注意的是,Bow IPU并没有采用更先进的制程,而是通过采用和台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)来达到性能和能耗比的提升。这种创新封装技术使得Bow成为世界上第一款基于台积电7nm工艺制程的3D WoW处理器,证明了芯片性能提升从依赖先进制程向依赖先进封装转移的一种可行性。
Graphcore成立于2016年,由英特尔创始人之一Hermann Hauser赞誉为“计算机历史上的第三次革命”。经过六年的发展,Graphcore在金融、医疗、通信、机器人、云服务和互联网等多个领域取得了一系列成果。本次推出的第三代产品Bow IPU,又一次展现了Graphcore在AI芯片领域的地位优势。
在图像识别方面,无论是经典CNN网络还是近期热门的人文Transformer网络,以及深层文本到图片转换网络,与上一代相比,Bow IPU都有30%到40% 的性能提升。在BERT训练模型这一自然语言应用中,其表现尤为出色。“我们可以看到,这些模型在我们的最新硬件形态上都有很大的性能提升。” Graphcore中国工程副总裁兼AI算法科学家金琛表示。
除了图像识别外,在实际应用中的吞吐量与IPU POD64相比,在计算机视觉ResNet50 和 EifficientNet-B4 训练模型中,Bow Pod64 能够达到34%和39% 的吞吐量增益。在自然语言方面,如BERT-Large Ph1 预训练模型以及语音识别Conformer Large 训练模型,都有36% 吞吐量增长。此外,将 Bow Pod16 与DGX-A100进行对比显示EfficientNet-B4 backbone 在DGX-A100 上需70小时训练,而在 Bow Pod16 上只需14小时左右。
对于如何实现如此接近理论极限的性能提升,一直以来都是业界关注的话题。从芯片规格来看,Bow IPU拥有超过600亿个晶体管,是上一代MK2 IPU的一个半倍,同时保持0.9GB内存容量,但增加到了65TB吞吐量。尽管没有改变至5nm或更高工艺节点,但通过3D封装技术,可以获得同样程度甚至更高程度的心理效果。
卢涛大中华区总裁兼全球首席营收官解释道:“变化主要体现在,它是一个3D封装的处理器,晶体管规模增加,使得算力和吞吐量均得到提升。而且,因为摩尔定律逐渐失效,我们不得不寻找新的技术方向,比如这类结合制造与封装的一种方式。”
此外,对于选择改变封装而非更进一步工艺升级的问题,卢涛指出,从7nm到5nm所带来的收益已经不再显著,因此通过其他手段获得同样的收益更加经济有效。他还强调,即便是价格保持不变,本次更新也为老用户提供无需修改代码即可享受改善后的设备使用经验。
目前,该产品已经被美国国家实验室Pacific Northwest用于一些基于Transformer模型及图神经网络等应用,并给出了正面的反馈。这只是一个开始:Graphcore正在开发名为Good Computer的大型超级智能机器,其将包含8192个IPU,为人脑超越之举提供10 Exa-Flops AI算力,并支持500万亿参数规模的人工智能模式开发。预计该产品将以每个配置不同的价格介于100万美元至1.5亿美元之间出售。