在英国的AI芯片公司Graphcore于本周四宣布了其第三代IPU产品Bow,这是该公司面向客户发货的新一代IPU。与前一代相比,Bow IPU性能提升40%,能耗比提升16%,电源效率也增加了16%。值得注意的是,Bow IPU并未采用更先进的制程,而是通过台积电共同开发的3D Wafer-on-Wafer技术实现性能和能耗比的提升。
Bow作为世界上首款3D WoW处理器,证明了从先进制程到先进封装为芯片性能提升提供了一条可行路径。这表明,在芯片设计师是否能够干一辈子这个问题上,他们需要不断适应行业发展,不断寻找新的技术方向来推动摩尔定律。
Graphcore成立于2016年,以其创新型架构IPU而闻名。经过六年的发展,该公司已在金融、医疗、通信、机器人、云计算和互联网等多个领域取得实质性成果。本次发布的第三代IPU不仅保持价格稳定,而且无需用户进行任何软件调整,即可获得性能提升。
Graphcore中国工程副总裁金琛表示,“我们可以看到,这些模型在我们的最新硬件形态上都有很大的性能提升。” Graphcore的大中华区总裁兼全球首席营收官卢涛进一步解释说,“变化主要体现在,它是一个3D封装的处理器,晶体管的规模有所增加,算力和吞吐量均得到提升。”
虽然图像识别和自然语言处理方面表现出色,但实际应用中的吞吐量也有显著提高。在ResNet50 和 EifficientNet-B4 训练模型中,比起前一代POD64,有34%到39% 的吞吐量增强。此外,对于BERT-Large Ph1 预训练模型和语音识别Conformer Large 训练模型,都实现了36% 的吞吐量增长。
针对英伟达A100 GPU对比测试结果显示,在EfficientNet-B4 backbone训练时,从DGX-A100降至Bow Pod16,只需14小时完成,而原来的70小时训练时间大幅缩短。这说明尽管5nm工艺仍然是业界追求的一种高端解决方案,但通过3D Wafer-on-Wafer技术,可以在7nm工艺基础上实现类似的或更好的效果,同时具有成本优势。
Graphcore正在探索更多可能性以超越人脑级智能机器,其即将研发的人工智能处理器Good Computer预计配备8192个IPU,将提供超过10 Exa-Flops AI计算能力,并支持500万亿参数规模的人工智能模型开发。这项工作意味着尽管现有的设计师可能会继续使用他们熟悉的地图,但他们必须准备好适应未来更加复杂、高效且集成化的人工智能解决方案。