在2022年,全球进口芯片金额的增长被认为是技术创新和产业发展的重要体现。英国AI芯片公司Graphcore在这一年推出了其第三代IPU系统Bow IPU,这一产品不仅性能提升40%,能耗比提高16%,而且电源效率也获得了16%的提升。值得注意的是,这些性能提升并非主要依赖于更先进的制程,而是通过采用台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)实现。
Bow IPU作为世界首款3D WoW处理器,证明了从先进制程向先进封装转移的可行性。这一突破为社会各界提供了新的思路和可能性,让人们能够更好地理解如何通过技术创新来驱动经济增长和社会发展。
Graphcore成立于2016年,其IPU逐渐在金融、医疗、电信、机器人、云和互联网等领域取得成效。Bow IPU相对于上一代M2000,每瓦性能提升16%,即能耗比实现16%的提升。不过,AI芯片真实性能还需要放在不同的应用领域中讨论,为此,Graphcore也给出了在不同垂直领域中Bow IPU表现的情况。
在图像方面,无论是典型CNN网络还是近期比较热门的Vision Transformer网络,以及深层次文本到图片模型,与上一代产品相比,Bow IPU都有30%到40%甚至接近理论极限值。在BERT训练模型方面,也有显著改善。此外,对实际模型中的吞吐量进行测试显示,在计算机视觉ResNet50 和 EifficientNet-B4 训练模型中,Bow Pod64 的吞吐量能够达到34%到39%'s performance improvement.
Graphcore Bow Pod16 与DGX-A100对比实验数据表明,在EfficientNet-B4 backbone训练时,从70小时缩短至14小时左右。而且,不同应用场景下的bow ipu表现均显示出其强大的计算能力。
关于如何实现如此高性能,同时保持价格不变的问题,上述文章提到了使用3D封装以及新增Die等因素。尽管工艺制程没有改变,但通过3D堆叠增加了晶体管数量,其中一个Die用于提高跨Colossus Die之间电源功率传输,并优化Colossus Die操作节点,从而转化为有效时钟加速。
最后,该公司正在研发的一款超级智能机器Good Computer预计将包含8192个IPU,可以提供超过10 Exa-Flops AI算力,并支持500万亿参数规模的人工智能模型开发。如果成功,它将标志着人类科技的一个重大飞跃,为社会带来前所未有的便利与创造力。