在英国的AI芯片公司Graphcore于本周四宣布了其第三代IPU产品Bow,这款新产品是面向客户直接发货的。与前一代相比,Bow IPU性能提升40%,能耗比提升16%,电源效率也得到了16%的提高。这一次性能提升并非主要依赖更先进的制程技术,而是通过采用台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)实现。
值得注意的是,这次Bow IPU作为全球首款3D WoW处理器,证明了芯片性能提升从先进制程向先进封装转移的可行性。Graphcore自成立以来,一直致力于开发全新的类型处理器架构IPU,并在金融、医疗、电信、机器人、云和互联网等领域取得了一定的成效。
Graphcore给出了不同垂直领域中Bow IPU的性能表现。在图像方面,无论是典型CNN网络还是近期比较热门的Vision Transformer网络,以及深层次文本到图片网络,与上一代产品相比,Bow IPU都有30%到40%的性能提升。在BERT训练模型方面,本次升级也有显著效果,其中Bert-Large Ph1预训练模型和语音识别Conformer Large 训练模型,都有36%吞吐量提升。
此外,Graphcore还将其最新发布的一款AI处理器与英伟达DGX-A100进行了对比实验数据显示,在同等条件下,EfficientNet-B4 backbone训练所需时间在DGX-A100上为70小时,而在Graphcore Bow Pod16上仅需14小时左右。这样的性能提升表明,即使不使用最尖端工艺制程,如5nm或更小,比起之前从28nm到14nm时获得的大幅度收益,现在从7nm到5nm只是20%,可以通过其他手段获得类似的收益。
尽管如此,图形核心仍然选择改变封装方式而不是更换至更先进工艺,因为他们发现,从7nm到5nm之间,只能带来20%以上收益,而之前从28nm到14nm时能够带来的百分之几十现在已经难以达到。此外,他们认为通过3D堆叠Die增加晶体管数量,可以实现有效时钟加速,同时保持软件兼容性,不需要用户做任何适配工作,而且价格保持不变。
总之,这些创新都代表着一个重要转折点,它展示了即便是在摩尔定律逐渐失效的情况下,也有可能找到新的技术路径来推动计算能力和能源效率双重增长。而且这些改进都是基于现有的7纳米工艺制程,没有采取更加激进的手段去更新这个数字,使得这种突破具有广泛意义,并且未来看似还会继续发生更多这样的变化。