DDN A3I可扩展参考架构
时间:2022-03-24 15:12:02 | 来源:行业动态
时间:2022-03-24 15:12:02 来源:行业动态
企业AI系统市场最初由Pure建立,Pure将AIRI(https://www.theregister.co.uk/2018/03/27/pure_nvidia_ai_airi/)的FlashBlade阵列与DGC-1双响炮结合在一起。后来NetApp携其A700全闪存阵列/ FGX-1组合加入该市场,后来又推出更快的A800/ DGX-1装置(https://www.theregister.co.uk/2018/08/03/netapp_a800_pure_airi_flashblade/)。戴尔EMC则推出人工智能完备解决方案(Ready Solution for AI):深度学习(https://www.theregister.co.uk/2018/08/07/dell_emc_ai_deep_learning/ ),思科也推出了C480 AI /机器学习服务器(https://www.theregister.co.uk/2018/09/10/cisco_ai_server_nvlinked_tesla_gpu/)。
所有这些系统都涉及到全闪存,DDN则拥有AI200和AI400全闪存系统以及混合闪存/磁盘AI7990。二者都运行DDN的Exascaler软件,Exascaler是个基于Lustre的并行文件系统。
AI200是个容量高达360TB的24倍双端口NVMe闪存驱动器,置于2U机箱内,以4 x EDR InfiniBand(EDR IB)或100Gbit / s以太网(100 GbitE)连接到DGX-1。AI200可提供高达20GB/秒的文件系统顺序读取吞吐量和超过100万IOPS。
AI400使用相同的机箱,可提供高达40GB/秒的顺序读取吞吐量和高达300万IOPS。AI400具有8个EDR InfiniBand端口或100GbitE端口,闪存容量与AI200相同。
而较大的AI7990则置于4U机箱内,回归20Gb /秒的顺序读取性能,可提供高达700,000的IOPS。AI7990支持90 x 3.5英寸的插槽,可用于SSD和磁盘驱动器。最多可以有4个扩展机座,每机座有90个架,可提供高达5.6PB的容量。
DDN 的A
3I解决方案简介可从网上下载(https://www.ddn.com/?wpdmdl=42534ind=1538608827207),简介里提供了使用A
3I软件的示例,例如Resnet-50和Resnet-152,Caffe GoogleNet,Inception V3 。
A
3I解决方案指南(http://www.ddn.com/?wpdmdl=42573ind=1538599065785)提供了Tensorflow,Horovod,TensorRT,Torch,PyTorch提供具有9 x DGX-1服务器和系统性能的AI200及其他AI框架的配置示例。