AI训练处理器「Gaudi」:实现本地以太网扩展
时间:2022-04-13 23:24:01 | 来源:行业动态
时间:2022-04-13 23:24:01 来源:行业动态
再来看一下最新发布的人工智能训练处理器Gaudi。
Gaudi是一款完全可编程且可定制的处理器,搭载基于第二代Tensor处理核 (TPC) 并集成开发工具、库和编译器。基于ResNet-50,Gaudi可以提供每秒1650张的图片处理能力这是在业界单一处理器中最高的计算能力。同时,Gaudi的创新架构可以实现训练系统性能的近线性扩展,即使是在较小Batch Size的情况下,也能保持高计算力。这意味着,基于Gaudi处理器的训练性能可以实现从单一设备扩展至由数百个处理器搭建的大型系统的线性扩展。
还是和英伟达的V100相比,基于ResNet-50基准测试,Gaudi所表现出来的计算性能、功耗比和延迟时间仍然相当出色,在速度上要比V100快3.8倍。比如,在性能方面,V100单卡大概每秒处理600多张图片,而Gaudi单卡则可以处理1600多张;在功耗方面,V100处理600多张图片的功耗达到了300瓦,而Gaudi处理1600多张图片的功耗只有150瓦左右。在这方面,Gaudi创造了新的性能纪录。