在英国的AI芯片公司Graphcore,近日宣布了他们的新一代IPU产品Bow,这是其第三代IPU系统,发布之初即面向客户提供。与上一代IPU相比,Bow IPU性能提升40%,能耗比提升16%,电源效率也提升16%。
值得注意的是,这次性能和能效的改进并非主要依赖于更先进的制程技术,而是通过采用台积电共同开发的先进硅晶圆堆叠技术(3D Wafer-on-Wafer)实现。
Bow作为全球首款3D WoW处理器,不仅证明了性能提升范式从先进制程向先进封装转移的可行性,也展示了社会对更高效能计算设备需求的一种新的应答方式。
新一代 IPU 性能大幅提升40%,价格保持不变
2016年,Graphcore成立并开创了全新类型处理器架构IPU,因其在架构上的创新曾被英国半导体之父Hermann Hauser称为计算机历史上的第三次革新。
经过六年的发展,Graphcore的IPU逐渐在金融、医疗、通信、机器人、云服务和互联网等领域取得显著成效。本周四,他们推出了第三代产品Bow IPU。
据Graphcore介绍,本次更新相对于上一代M2000,有着40%以上性能增强,每瓦功耗降低至16%,即每单位能源使用量减少16%。不过,对于AI芯片真正应用所需讨论还需放在不同行业中进行考察。
图像识别方面,无论是传统CNN网络还是近期流行的Vision Transformer网络,以及深度学习文本到图片模型,与前一代相比,Bow IPU都有30%-40%性能增长,在EfficientNet-B4这一项目中接近理论极限。
BERT训练模型是自然语言处理领域经典之一,其后续如GPT-1、GPT-2和GPT-3纵向扩展或横向拓展,使得模型性能及精度进一步提高。“我们看到这些模型在我们的最新硬件体系上表现出巨大的潜力。” Graphcore中国工程副总裁兼AI算法科学家金琛指出。
除了此外,将实际应用中的吞吐量与POD64比较,在ResNet50 和 EfficientNet-B4 训练任务中,Bow Pod64达到34%-39% 的吞吐量增加。在自然语言处理方面,如 BERT-Large Ph1 预训练模型以及语音识别Conformer Large 训练任务,都有36%-41% 的吞吐量加速。
对照英伟达DGX-A100,比试数据表明,对于EfficientNet-B4 backbone训练任务,在DGX-A100需要70小时,而同样的任务只需14小时完成在Bow Pod16上运行。这意味着 Bow IPU 在实践中的运用带来了显著优势。
那么.Graphcore Bow IPU 是如何实现如此卓越业绩?
5nm工艺不再领航,优选高性价比封装
从芯片规格角度观察,由于它采用台积电7nm工艺,并且是一款基于3D Wafer-On-Wafer结构设计,是目前最大的单个封装Die数超过600亿个晶体管,以350 TeraFLOPS的人工智能计算能力,是MK2 IPU的一个多倍级别增长。内置存储容量未变,但有效数据传输速度却翻倍,从47.5TB/秒升至65TB/秒。
“变化主要体现在,它是一个三维封装结构,更细致地安排了晶体管数量,加强了算力和数据传输能力。” Graphcore大中华区总裁兼全球首席营收官卢涛解释道。而对于制造过程而言,没有采纳更先进工艺节点,只坚持7nm制程标准继续前行。
理论上,一颗芯片性能改善很大程度取决于制造技术发展,但随着技术不断逼近物理极限时摩尔定律失去作用,因此寻找替换方案变得迫切。其中三维集成就是业界广泛看好的选择来延续摩尔定律效果。
中国工程院院士吴汉明曾提到,如果将芯片制作与封装结合,就可以以65nm水平实现类似40nm水平功耗要求。这正好验证了他提出的观点。
关于为什么偏离采用更尖端制程而不是改变封装方法?卢涛表示MK2IPI已经拥有594亿个晶体管,大约占823平方毫米空间,是7nm单Die生产范围内最精密可达到的尺寸。他进一步解释说:“我们评估不同节点如7nm到5nm之间可能带来的收益发现,从较小尺寸转移到更小尺寸所获得收益并不像从28mm到14mm时那样显著,即使只有20”。这时候,我们就可以通过其他手段获得类似的收益。”
借助三维堆叠结构,其中一个Die(Colossus Die)相同于之前版本另一个Die则用于增强跨Die间电源输出,同时优化操作节点以产生更多有效时钟加速。此举显示出BOW IPu如何利用新的技术支持来迈入新的高度发挥其功能模式,并同时满足台积电子合作伙伴关系需求,以确保两方共享资源和知识产权,为行业共同推动落地更加复杂但高价值项目解决方案提供关键支持。这一点尤为重要,因为AI处理器自身具有庞大的规模需求大量相关设备支持,而对未来发展趋势预见性的追求也成为市场驱动力的核心力量之一,所以这样的合作事例显示出对于商业成功起决定性作用的一些关键因素:开放协作精神、新兴科技探索以及战略投资策略实施能力等各项要素合理配置与整合的问题意识强化
尽管改变到了三维集成,但BOW IPu仍然保证无需用户代码修改就能轻松升级工作环境,而且价格保持稳定不变。一旦这个革命性的创新引领方向得到确认,它将彻底改变当前工业界所有关于如何最大化利用现有资源进行研发投入的事务,让整个产业链重新思考未来潜力的可能性——特别是在人工智能研究领域,那里涉及超越人类认知边界的大型、高通用的分布式神经网络系统设计和部署问题,以及针对它们挑战性的算法及其执行平台难题解决思路探究活动。不过这种想象虽然宏伟,却只是冰山一角,更远大的愿景始终牢记,要把这个概念融入社会生活中去促使人们接受这样一种全新的世界观念:通过持续探索,最终走向那些超越人类智慧边界的事情做到底—这便是BOW IPu背后的故事讲述者们希望塑造出来的一种未来场景形象—让一切成为过去,将一切变得可能。