算法算力协同优化创新
时间:2022-04-09 12:27:01 | 来源:行业动态
时间:2022-04-09 12:27:01 来源:行业动态
巨量模型训练本身是一个技术门槛特别高的研究工作,因为它不仅需要在大规模集群上进行训练,同时要求发挥大规模集群最好的性能。因此需要在模型分布式计算等各个层面上进行协同方面的一些设计、优化。
算法:解决了巨量模型训练不稳定的业界难题,提出了稳定训练巨量模型的算法,训练出2457亿参数的全球最大AI巨量模型;巨量模型推理方法创新,提升模型的泛化能力,让一个模型更好的服务不同应用。
数据:创新中文数据集生成方法,研制高质量文本分类模型,收集并清洗互联网文本数据,有效过滤垃圾文本,生成5000GB高质量数据集,是迄今业界最大的高质量中文数据集。
算力:算法算力协同优化,优化巨量模型结构,使模型更利于AI算力的性能发挥,实现计算效率大幅提升,在同比算力提升12%的情况下,参数集规模提升40%,达到业界第一训练性能的同时实现业界领先的精度。
刘军表示,巨量模型是一个复杂的系统工程。要做好巨量模型,实际要求算力、算法、数据三架马车协同创新。浪潮非常擅长把算力、算法、数据进行整合,源1.0在这三方面进行了积极探索。
浪潮一直活跃在AI前沿方向,在异构加速计算、深度学习框架、AI算法等领域取得了一定的成绩。目前,浪潮的AI服务器市占率已位居全球第一,连续四年中国市场占比超过50%;在深度学习框架领域,浪潮先后推出了深度学习并行计算框架Caffe-MPI、TensorFlow-Opt、全球首个FPGA高效AI计算开源框架TF2等等。
同时,浪潮在全球顶级的AI赛事上也不断取得好成绩,累计获得56个MLPerf全球AI基准测试冠军,近几年浪潮在CVPR、NIPS、GAIIC等国际大会大赛中,在多模态视觉问答、大场景多对象检测以及自动机器学习等领域都取得了非常不错的表现。
此外,浪潮连续三届担任国际基准评测组织SPEL ML技术委员会主席,推动国际开放AI基准评测的建立。2020年,浪潮在人工智能领域的专利贡献达到1174件,位居中国前列。
所以说,全球最大的中文AI巨量模型诞生,得益于浪潮在人工智能领域深厚的积累和不断的探索实践。刘军表示,持续创新是浪潮的本色,在产业层面,浪潮满足客户、市场和应用需求;在科研创新方面,浪潮探索科学前沿。