18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 行业动态 > 前沿创新规模空前

前沿创新规模空前

时间:2022-03-08 14:45:01 | 来源:行业动态

时间:2022-03-08 14:45:01 来源:行业动态

OpenAI首席执行官Sam Altman表示:若要将AI发展成为通用智能,那么在某种程度上就需要强大的系统来训练日益强大的模型。如今我们终于拥有了所需的算力。Azure AI及其超算能力为我们提供了领先的系统,让我们能够加速创新进程。

通过不断创新,Azure宣布推出全新ND A100 v4虚拟机系列,这是我们迄今为止功能最强大、可扩展性最强的AI虚拟机。该虚拟机可根据需求,通过数百台虚拟机调用八至数千个互连NVIDIA GPU。

最基本的ND A100 v4虚拟机系列由一台虚拟机和八个NVIDIA Ampere A100 Tensor Core GPU组成。但如同人脑由相互连接的神经元组成一样,ND A100 v4集群可以扩展到数千个GPU,且每台虚拟机都具有1.6TB互连带宽,这是前所未有的。每个GPU均具有专属200GB/s NVIDIA Mellanox HDR InfiniBand连接,兼容所有拓扑结构。数十、数百甚至数千个GPU均可连接到同一个Mellanox InfiniBand HDR集群进行工作,从而实现任何级别的AI目标。由于专用的GPU互连带宽比任何其他公有云产品高16倍,因此可以更快地实现任何AI目标,如从零开始训练模型、继续使用自己的数据进行训练或针对特定任务进行微调等。

ND A100 v4虚拟机系列由内置全新Azure AMD Rome的平台提供支持,该平台所有主要系统组件均符合最新的硬件标准,如PCIe Gen4。PCIe Gen 4和NVIDIA第三代NVLINK架构可为每台虚拟机实现最快的GPU互连,使数据在系统中的传输速度提升2倍以上。

大多数客户无需开展任何技术工作,即可将其计算性能提升至基于上一代NVIDIA V100 GPU的系统的2至3倍。如果客户使用具备结构化稀疏加速、高精度Tensor Core核心和多实例GPU(MIG)功能的全新A100,可将性能提高多达20倍。

NVIDIA加速计算总经理兼副总裁Ian Buck表示:Azure利用NVIDIA最先进的计算和网络功能构建了一个令人难以置信的大型云端AI平台。其具备的弹性架构,可将NVIDIA A100 GPU上的单一分区扩展至数千个通过NVIDIA Mellanox InfiniBand互连的A100 GPU。得益于该弹性架构,Azure客户可运行全球最高要求的AI工作负载。

ND A100 v4虚拟机系列运用VM Scale Set等Azure核心可扩展模块,可对任何规模的集群进行自动、动态且透明的配置,让所有人在任何地方都可以实现各种规模的AI,甚至可以在数分钟内按需对AI超级计算机进行实例化。随后,便可使用Azure机器学习服务,独立访问虚拟机或启动、管理整个集群的训练任务。

ND A100 v4虚拟机系列和集群目前可供预览,之后将成为Azure产品组合中的标准产品,让所有人都能够在云端挖掘AI at Scale的潜力。

关键词:规模,创新,空前

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭