在英国的AI芯片公司Graphcore于本周四宣布了其第三代IPU产品Bow,这款新产品不仅性能提升40%,而且能耗比提升16%,电源效率也增加了16%。值得一提的是,尽管采用了与上一代相同的台积电7nm制程,但通过采用先进硅晶圆堆叠技术(3D Wafer-on-Wafer),Bow IPU实现了显著的性能和能效提升。
作为全球首款3D WoW处理器,Bow证明了从先进制程向先进封装转移是可行的这一新范式。Graphcore自2016年成立以来,一直致力于开发全新的处理器架构IPU,并已在金融、医疗、通信、机器人、云计算和互联网等多个领域取得成功。
Bow IPU相对于上一代M2000,在图像识别任务中表现出色,无论是CNN网络还是近期流行的Vision Transformer网络,以及深层文本到图片模型,与上一代相比,性能提升30%至40%。此外,在BERT训练模型方面,也有明显提高。
Graphcore中国工程副总裁兼AI算法科学家金琛表示:“我们可以看到,这些模型在我们的最新硬件形态上都有很大的性能提升。”同时,对于实际应用中的吞吐量增强,Bow Pod64相比IPU POD64,在ResNet50和EfficientNet-B4训练中分别提供34%和39%的增强。此外,还对自然语言方面进行测试,比如BERT-Large Ph1预训练模型以及语音识别Conformer Large 训练模型,都显示出了36%吞吐量上的提升。
与英伟达A100竞争时,实验数据表明,在DGX-A100上需要70小时来完成EfficientNet-B4 backbone训练,而在Bow Pod16上只需14小时左右。这意味着Graphcore Bow IPU实现接近理论极限的性能增长。
尽管没有采用更先进的5nm工艺,而是选择以7nm工艺为基础并采取3D封装技术,从而实现高性价比,同时保持价格不变。这种变化主要体现在它是一个3D封装处理器,其晶体管数量增加,同时算力和吞吐量也有所提升。而且,由于行业对更小规模工艺节点收益需求减少,因此Graphcore选择这种策略,以获得同样的收益水平。
未来,Graphcore正在开发一个超级智能机器Good Computer,它将使用类似的3D WoW设计,并计划包含8192个IPU,为人工智能提供超过10 Exa-Flops算力。此设备预计价格将介于100万美元到1.5亿美元之间,是为了支持500万亿参数规模的人工智能模型开发,并模仿大脑计算方式结合存储功能。