在英国的AI芯片公司Graphcore于本周四宣布了其第三代IPU产品Bow,这款新产品即将面向客户发货,性能提升40%,能耗比提升16%,电源效率也相应提高。值得注意的是,Bow IPU并未采用更先进的制程,而是通过台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)实现性能和能耗比的提升。
Bow作为全球首款3D WoW处理器,其设计成为了从先进制程向先进封装转移范式的一次成功验证。这一突破不仅证明了新的封装技术可以带来显著的性能和能效改善,而且还为其他芯片制造商提供了一条可能逃脱摩尔定律限制的手段。
经过六年的发展,Graphcore已经在金融、医疗、通信、机器人、云计算和互联网等领域取得了一定的影响力。现在,该公司又推出了第三代IPU产品,这一更新进一步扩展了其在这些领域内的地位。
据Graphcore介绍,第三代IPU相对于上一代M2000,在图像处理方面表现出色,无论是典型CNN网络还是近期流行的Vision Transformer网络,以及深层文本到图片模型,与上一代相比都有30%到40%的性能提升。在BERT训练模型方面,也有显著提升。这些数据表明,即使是在同样的7nm工艺制程下,通过3D封装技术也能够实现显著性能增强。
此外,对于实际应用中的吞吐量进行测试时,与上一代POD64相比,在ResNet50 和 EifficientNet-B4 训练模型中,Bow Pod64显示出34%和39%的大幅度提高。此外,还有36%吞吐量增长在BERT-Large Ph1 预训练模型和语音识别Conformer Large 训练模型中观察到了。
与英伟达A100竞争对手DGX-A100进行对比实验发现,即便是EfficientNet-B4 backbone训练所需时间由70小时缩减至14小时左右,也充分说明了Bow Pod16 在AI算力的快速迭代方面具有优势。
尽管5nm工艺已成为业界追求的一大目标,但Graphcore选择保持在7nm,并且通过采用3D WoW技术实现了相同级别或更高水平的人工智能计算能力。这意味着未来AI芯片行业可能会更加注重创新而非单纯追逐更小尺寸,以满足不断增长的人工智能需求。