专访 | 中国移动齐骥:构建统一算网大脑,加速算网深度融合
时间:2023-05-27 06:00:02 | 来源:网站运营
时间:2023-05-27 06:00:02 来源:网站运营
专访 | 中国移动齐骥:构建统一算网大脑,加速算网深度融合:
Labs 导读“十四五”数字经济发展规划提出,推进云网协同和算网融合发展,加快构建算力、算法、数据、应用资源协同的全国一体化大数据中心体系。当前,算力已成为数字经济的核心生产力,也是全社会数字化转型的基石。近日,中国移动云能力中心云网管理产品部总经理齐骥在接受移动Labs采访时表示,在进一步深化云网融合应用实践的基础上,将在算网运营、组织、能力三个方面持续攻关,为算力网络发展贡献移动云力量。
一、各国“新基建”提速,算网融合成为重要趋势
各国纷纷加大对数字经济的战略布局和对新型数字化基础设施的规划建设。随着工业互联网、智慧城市、无人驾驶等新型业务场景的迅速发展,应用对计算、存储、网络提出了更高的要求。产业的发展和需求的演进推动了5G、物联网、大数据、云计算、人工智能、区块链等技术的加速创新,同时,分布式海量数据处理需求的爆发式增长,推动云边端充分协同的强大算力和泛在高效的网络连接成为下一代战略基础设施的核心要素。
为应对算网融合需求的快速增长,美国在2020年提出《引领未来先进计算生态系统战略计划》计划构建覆盖政产学研的国家级算力体系,巩固本国算力优势。欧盟于2021年发布 《2030数字指南针》,计划在2030年前累计部署1万个边缘计算节点。此外,日本和澳大利亚等国在云计算、人工智能等领域发展迅猛,南非、巴西、俄罗斯作为后发者,近期也纷纷加大算力建设投入。我国在十四五规划中提出了“新基建”、“东数西算”战略,以推动算力资源服务化为目标,优化算力资源需求结构,提升基础设施利用效能,构建国家算力网络体系。
二、构建全新算网大脑,开展核心技术攻关
算网大脑是中国移动算力网络顶层设计的关键模块,根据中国移动算力网络技术白皮书的规划,算网大脑是对算力和网络资源的统一编排/调度/管理/运维的核心系统,通过引入人工智能、数据湖、意图引擎、数字孪生等技术,向上实现各领域原子能力组合和算网一体化服务支撑,向下实现泛在算力的跨层跨区域融通和网络跨地域、跨专业拉通。
中国移动把算力网络的发展分为三个阶段,即
泛在协同、
融合统一和
一体内生。算网大脑作为算力网络的核心组成部分,分阶段使能多要素融合的一体化信息基础设施。
泛在协同阶段,是算力网络的起步阶段,算和网作为相对独立的个体,通过协同编排向用户提供一站式服务。在本阶段算网大脑尚未形成,工作重点聚焦在研究算网大脑整体规划和发展路径,同步开展算网大脑关键技术研究和原型验证等相关技术储备工作,在这个阶段移动云已有的一体编排能力可基本满足算+网+应用的一体化开通,同时也为向未来演进奠定技术基础。
融合统一阶段,“算”持续泛在化,与“网”在基础设施层面依然相互独立,算网大脑在本阶段开始发挥作用,在编排管理层面实现算和网的统一管理、编排、调度、运维和优化,通过资源业务建模、模型驱动、算力解构、泛在调度等技术,以平台化的方式协同调度算网各域资源,实现灵活高效的算网统一编排,一方面支撑算网业务深度融合,全局资源配置最优和端到端业务保障,另一方面实现三方算力能力纳入和服务构建生态。
一体内生阶段,算网边界被彻底打破,形成算网一体化基础设施,算网大脑通过与AI、大数据等技术深度融合,在算网自智、数字孪生、意图网络等新方向,不断增强算力网络自动化、智能化能力,并提供智能闭环的保障能力,逐步实现算力网络的智慧化。
齐骥在接受移动Labs专访时,介绍了中国移动算网大脑的构建思路与功能架构:
在
构建思路上,算网大脑可为内外部用户提供能力托管和开发平台,集团公司、各专业公司和省公司既是能力封装提供者,又是能力使用者,通过对多样化能力的一体编排构建丰富的算网产品和一体化解决方案,并通过统一运营门户对外部客户提供产品服务。同时基于算网大脑构建算网服务生态,一方面向合作单位开放服务化接口,支撑合作伙伴通过算网大脑灵活调用中国移动算网能力,满足行业应用资源按需、服务随选、一体服务的算网需求;另一方面合作伙伴可将自有应用和算力注册到算网大脑,供需求方调用,开拓深度合作、优势互补,合作共赢的新局面。
在
功能架构上,算网大脑对内统一算力与网络的资源管理,支持算力网络资源和能力的灵活组合,实现包括各算网融合类业务产品的一体化供给、一体化运维、端到端业务视图的统一呈现和自适应、自优化能力;对外实现对需求的意图拆解,通过算力网络资源与能力的组合调度,支撑用户实例的拉起和运行状态的自适应调整。主要包含:
(1)算网一体化视图:统一展示算网资源布局、业务发展态势、运行质量,支撑算力网络可视化管理。
(2)算网能力开放:向运营层提供端到端资源/性能视图呈现、告警指标上报等原子功能及服务。
(3)算网一体编排:对全网算力资源和网络资源进行统一编排、分配、调度、及全生命周期管理。
(4)算网一体化感知:基于租户业务实现端到端的资源、性能视图呈现,告警指标上报、SLA保障等。
(5)算网智能化:基于大规模实测数据,利用人工智能算法,实现一系列智能控制和决策。
(6)大数据平台:提供算网大数据存储、处理、分析能力。
(7)AI引擎:提供主流机器学习模型训练作业的开发平台。
构建全新的算网大脑,离不开关键技术的突破,目前中国移动依托原型开发、核心技术攻关、技术预研等多维度开展一系列探索,主要包含以下几点:
➤ 一体编排:针对多样化、定制化的算网融合服务需求,基于算力和网络的原子能力进行组合、一体编排,设计产品服务模型,以模板的形式固化所需资源、服务、配置,实现算网业务统一编排、部署和保障。
➤ 泛在调度:在云、边、端多级泛在的算力资源基础上,综合考虑网络的实时状态、用户的移动位置、数据流动等要素,实现算力、网络资源的统一管理、跨层调配、灵活部署和动态调整。
➤ 算网自智:感知业务各个链路上的网络、资源状况,基于算法模型生成网络质量、资源评估结果,智能优化 网络、算力布局和配置。
➤ 意图网络:可以在任何时间内完成算力选择、算网资源整合、持续交付服务意图的网络,从当前以人驱动为主实现网络管理自动化的模式,逐渐过渡到更加灵活的、可自愈的、零接触的意图驱动的管理模式。
➤ 数字孪生:通过构建算网数字孪生平台,可在数字空间进行建模、仿真、控制等操作,同时基于算网孪生平台的结果反馈,优化物理空间中各资源要素的配置,进而有效降低维优成本,提升算网运行可靠性。
➤ 算力解构:根据业务逻辑、资源需求、性能需求、服务持续性等因素将任务分解成小粒度的算力需求,实现业务的灵活部署,资源高效利用。
三、深化云网融合,探索绿色低碳、自主安全的算力网络
移动云一直把云网融合作为与其他云服务商的差异化竞争优势进行重点投入,在算力网络大战略之下,云网融合在算力网络建设中如何发挥作用?
齐骥介绍,
云网融合侧重云和网的协同,云是算的一种载体,算力网络是以算为中心、网为根基,网、云、数、智、安、边、端、链(ABCDNETS)深度融合的新型信息基础设施。相比云网融合,算力网络在管理对象、融合程度、运营模式和服务形式方进行了升级,因此认为“云网融合是算力网络的初级阶段、算力网络是对云网融合的深化和升级”。目前移动云已构建涵盖“接入组网、云上网络、运维管理、基础云网络组件”的云网融合产品体系,实现可售卖产品数超30款,为客户提供泛在化入云、云上云下智能组网、云网边协同的全场景一体化服务,云网无差别服务与体验的产品理念及在云网资源一体化编排控制、云网资源端到端感知和保障等方面的技术积累,为算力网络发展奠定了技术和产品基础;此外移动云的云网融合基础设施已具备超过300个城市的本地接入能力,直通“N+31+X”资源池体系,形成全国统一的可灵活调度的算力网络底座。
此外,构建绿色低碳、自主安全的算力网络也是中国移动在算力网络发展方面的核心目标,中国移动算网大脑进行了一系列的研发创新和技术探索:
- 在绿色低碳层面,在同等算力容量的情况下,西部节点在建设运行成本和能源消耗层面均比东部地区更低;通过算网大脑对算网资源协同控制,以网促算,调配西部算力供给东部渲染等业务需求,对于备份存储类、模型训练等业务场景优选部署在西部节点可以大幅降低设备的运行成本和能源消耗。此外通过智能感知资源利用率,支持客户动态开关机,可以减少部分闲置资源的无负载运行,倡导用户绿色节能,后期将推出云上企业碳使用量指数,助力全社会绿色双碳行动。
- 在自主安全层面,中国移动致力为客户提供算力、网络和数据层面一体化的内生安全保障,包括可信的基础设施安全,虚拟化、能力化和服务化的安全资源池,面向算网多要素融合算网大脑。基于算网大脑云原生平台架构一是支持安全资源池基于计算、存储、网络等基础算力构建安全资源池的高阶服务能力,满足用户数据流动的自适应、自主的安全内生能力;二是通过安全编排技术,基于AI分析和融合SASE和零信任,实现安全能力的纳管、编排、调度式,算网一体化服务提供安全服务,屏蔽算力节点安全水平差异化以及计算任务安全需求各异特点,形成主动、精准、纵深防御服务。
四、机遇与挑战并存,三方面推动算力网络发展
数字经济时代,算力网络是国家、社会、产业发展的战略要求,也是运营商转型发展的重要机遇。同样地,中国移动算力网络发展面临的机遇与挑战并存。
机遇方面算力网络是网络和算力两大技术领域的融合发展,中国移动作为全球最大运营商,在网络方面的优势不言而喻,同时,中国移动启动“云改”战略以来,移动云一直维持高速发展,2021年移动云在公有云市场份额国内增速稳居第一,今年也会迈入第一阵营,在数字经济时代,客户存在算网络一体化、一站式服务的诉求,中国移动兼具算和网的优势,天然具备“连接+算力+应用”的能力。
挑战方面今年杨杰董事长在两会期间战略又具象的描述了算力网络发展三大难,一是缺科技人才与创新团队(算力网络原创和核心技术亟待突破),二是异构计算和算网灵活调用能力不足(算力网络配套能力成熟度问题),三是算力需求场景探索不足。
对于接下来如何推动算力网络的发展,齐骥在采访中表示,将在运营、组织、能力三个方面持续攻关,为集团贡献移动云的力量。
1️⃣ 研究多层次的业务服务模式,打造由基础资源、标准产品、解决方案、新型任务服务四层产品形态;通过全面赋能应用和赋能自身,使得产品、解决方案不断提升竞争力。
2️⃣ 培养适应公司战略发展的创意精英团队,包括一揽子服务的设计和交付团队;持续打造算网大脑实现业务到系统的转化的业务赋能者;基于云原生的异构算力、网络灵活调度能力的建构者。
3️⃣ 在“云网、云数、云智、云边”四融差异化能力和云原生架构初步完成的基础上,移动云技术架构从分布式云向算力网络演进,制定“大->广->融”的演进思路,攻关异构算力纳管、软硬一体能力、算网原生、算网融合编排和算力交易市场等关键技术。