专门为AI应用设计的IPU
时间:2022-03-23 02:45:01 | 来源:行业动态
时间:2022-03-23 02:45:01 来源:行业动态
如今,围绕AI市场英特尔和英伟达激斗正酣,虽然GPU在AI芯片赛跑中占据了主动,但这场赛跑还远未结束。赛场上除了英特尔、英伟达外还有众多参赛选手,很多新兴的AI芯片公司在成本、效率、性能以及应对深度学习和机器学习等负载的灵活性等方面各有优势。根据市场研究公司Global Market Insights的一份研究报告,AI芯片的全球市场规模预计每年增长速度为35%,将从2019年的80亿美元增长到2026年的700亿美元,这也说明AI芯片市场充满了各种机会。
Graphcore也是参赛的选手之一。Graphcore来自英国,成立于2016年,有着芯片独角兽之称,成立以来备受投资者青睐,到目前为止已经成功融资超过7亿美元。其推出的IPU(Intelligence Processing Unit,智能处理器)属于AI芯片,Arm联合创始人Hermann Hauser将IPU定义为计算机发展史上继CPU、GPU之后的第三次革命。
IPU采用的是完全不同于CPU和GPU的芯片架构。在Graphcore高级副总裁兼中国区总经理卢涛看来,CPU和GPU都不是专门为AI而设计。虽然GPU现在应用非常广泛,但当初是为图形渲染而不是为AI所设计,只是这种架构正好契合了部分AI应用。而IPU是专门为AI设计的,其强大的并行处理能力确保了快速训练模型的实现,并能进行实时操控。
CPU主要面向标量计算设计,长于控制和应用;GPU主要面向向量计算设计,长于图形计算;而IPU主要面向计算图设计,尤其是稀疏矩阵下计算效率最高。卢涛表示。
Graphcore高级副总裁兼中国区总经理 卢涛
IPU在架构上的一大创新是采用了MIMD(多指令流多数据流)众核架构,同时,IPU架构中具有大容量的分布式片上SRAM,片内高达900MB的SRAM相对于GPU的GDDR、HBM来说,可以做到数十倍的性能提升。为了解决片内众核之间的通信,IPU还采用了高效的通信技术BSP(Bulk Synchronous Parallel)。IPU是目前世界上第一款采用BSP通信的处理器。
去年6月,Graphcore发布了第二代IPUGC200(Colossus MK2 IPU)和相对应的IPU-M2000系统。GC200采用了7纳米制程,每个芯片在一个823平方毫米的裸片上包含高达594亿个晶体管,使其成为有史以来最精密的处理器。IPU-M2000系统配备了4个MK2 IPU。根据Graphcore的资料,8个IPU-M2000系统在运行FP32计算任务的时候性能要比8个Nvidia DGX A100系统高出12倍,而AI计算则要高出3倍,总成本却仅高出30%多。