在英国的AI芯片公司Graphcore于本周四宣布了其第三代IPU产品Bow,这款新产品不仅性能提升40%,而且能耗比提升16%,电源效率也增加了16%。值得注意的是,Bow IPU并没有采用更先进的制程,而是通过台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)来实现性能和能耗比的提升。这使得Bow成为全球首款采用这种技术的处理器。
Graphcore成立于2016年,其IPU架构被誉为计算机历史上的第三次变革。经过六年的发展,Graphcore在金融、医疗、通信、机器人等领域取得了一定的成效。本次发布的第三代IPU相对于上一代M2000,性能提高40%,每瓦性能提升16%,即能耗比实现16%的提升。
在图像处理方面,无论是典型CNN网络还是近期热门的Vision Transformer网络,以及深层文本到图片网络,与上一代产品相比,Bow IPU都有30%到40%的性能提升。在BERT训练模型方面,如OpenAI提出的GPT-1、GPT-2、GPT-3等模型,在最新硬件形态下都有很大的性能提升。
作为英伟达竞争对手,Graphcore自然不忘将 Bow Pod16 与DGX-A100进行对比。实验数据表明,在EfficientNet-B4 backbone训练上,只需14小时,而DGX-A100则需要70个小时。
接近理论极限的性能提升是如何实现?主要体现在它是一个3D封装处理器,上述两个Die增加了晶体管数量,其中一个Die用于提高跨Colossus Die 的电源功率传输,从而转化为有效时钟加速。此外,由于工艺制程已经接近物理极限,因此业界不得不寻找新的技术方向来延续摩尔定律,其中3D封装就是被广泛看好的技术方向。
虽然封装方式有所变化,但Bow IPU开箱即用,与前一代产品百分之百软件兼容,不用修改任何代码,使老用户无需做任何软件适配工作就能获得性能提升,同时价格保持不变。
未来,Graphcore正在开发一种超级智能机器命名为Good Computer,一方面希望计算机能够为这个世界带来正面的影响,另一方面致敬著名计算机科学家Good。基于3D WoW 预计将包含8192个IPU 提供超过10 Exa-Flops 的AI算力,并支持超过500万亿参数规模的人工智能模型开发。取决于不同的配置,将价格从100万美元到1.5亿美元之间变化。