作者简介
张慷
桑洁丽
吴美希
论文引用格式:
张慷, 桑洁丽, 吴美希. 面向异构算力网络调度的研究[J]. 信息通信技术与政策, 2023,49(5):42-47.
面向异构算力网络调度的研究
张慷1,2 桑洁丽1 吴美希3
(1.中国电信股份有限公司上海分公司,上海 200120;2.天翼云科技有限公司上海分公司,上海 200085;3.中国信息通信研究院云计算与大数据研究所,北京 100191)
摘要:在“东数西算”工程背景下,算力基础设施迎来了飞速发展,产生了大量异构算力资源。云—边—端的算力与网络协同,能够满足多种异构算力资源与众多应用场景的高效匹配。基于异构算力网络调度展开研究,为异构算力网络融合调度技术提供研究思路,系统性地分析了技术发展现状、算力网络融合调度关键技术与挑战,提出了众多应用场景。但实际应用中异构算力网络调度更为复杂,仍面临许多不确定性挑战,需要不断完善。
关键词:异构算力;算力网络;高效调度;算力应用
0 引言
目前,数据处理对于算力的需求日益剧增,数据中心或终端设备已无法满足业务对算力的需求。通过协调广泛的云—边—端的算力与网络来满足日益增长的数据处理需求,成为算力网络协同发展的方向。借助算力网络来调度和纳管异构计算能力,构建云—边—端一体化的异构数据算力网络调度机制,更好地满足涵盖大部分场景的需要,如边缘计算、人工智能以及高性能计算。
1 算力网络调度内涵
在5G技术到来之前,大规模的算力应用集中出现在单点设备上[1]。一些具体的应用场景对数据中心的并发计算能力、网络吞吐量能力、存储能力提出了特定的要求[2]。随着5G、大数据、人工智能等新技术的发展,海量数据逐渐扩散到网络边缘[3],加速了算力从数据中心向网络边缘转移,甚至向终端设备扩散。
算力网络是一种根据业务场景需求,在云—边—端之间按需调度算力、网络和存储资源的新型信息基础设施。企业客户或者个人用户通过算力网络,灵活地进行算力调度。同时超级计算中心、人工智能计算中心、通用数据中心等都已融入算力网络,算力与网络正走向融合。
实现算力网络调度的重点在于算力调度与运营的结合,对用户的各种需求匹配合适的资源,根据不同业务场景对多样性算力资源进行自动的需求匹配和调度。同时,算力网络调度的场景和范围比较广泛,需要在多云之间、云和数据中心之间、云网之间进行协同,在跨行业、跨地区、跨层级等复杂场景中进行调度。
2 异构算力网络发展现状
2.1 异构算力发展奠定了算力网络调度的基础
近年来,由于边缘计算等新型计算业态的出现,数据中心的资源部署已经从传统的集中式中心云的模式,逐渐演变为云与边缘计算协同调度的模式。未来移动互联网的发展,将逐步推动包括终端在内的泛在计算与之协同发展。
以云—边—端为主的新型算力资源的协调发展,使得泛在计算构建了不同层级的算力结构,算力架构已经从通用架构转向了专门定制。异构算力融合了中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)、现场可编程门阵列(Field Programmable Gate Array,FPGA)、专用集成电路(Application Specific Integrated Circuit,ASIC)等多种芯片,可以满足不同类型、不同场景的算力需求。CPU作为通用芯片使用和部署,广泛应用于服务器和嵌入式终端;GPU多用于快速矢量图形数据处理;FPGA是一种可编程逻辑芯片,常用于逻辑控制方面;ASIC用于具体场景的处理。在市场需求的驱动下,算力的发展呈现多样性,打破传统单一架构的算力形态,从而实现异构算力协同以应对不同场景下的数据处理。
2.2 算力网络相关研究持续深入
算力网络从产业、标准、学术等方面持续展开研究,并形成了丰富的研究成果。
在产业方面,中国电信集团有限公司(简称“中国电信”)在《云网融合2030技术白皮书》中,将算力网络作为在云网一体阶段的重要技术,并指出算力网络技术重点考虑四个方面。中国联合网络通信集团有限公司(简称“中国联通”)发布了《中国联通算力网络白皮书》,对算力网络的架构、标准和产业生态等方面进行研究,后续又发布了《云网融合向算网一体技术演进白皮书》。中国移动通信集团有限公司(简称“中国移动”)联合华为技术有限公司(简称“华为”)发布了《算力感知网络(CAN)技术白皮书》,提出了算力感知网络分布式系统新架构,后续又发布了《算力网络白皮书》和《算网大脑白皮书》。2018年,电气与电子工程师协会(Institute of Electrical and Electronics Engineers,IEEE)发布了由中国电信、中国移动、中国信息通信研究院、华为、百度在线网络技术(北京)有限公司(简称“百度”)等联合撰写的白皮书《IEEE 802 Nendica报告:数据中心无损网络》(IEEE 802 Nendica Report: Lossless Networks for Data Centers)[4]。中国信息通信研究院联合华为提出“超融合数据中心网络”,将全无损以太架构和管控析一体进行管理融合,同时融合全场景服务化能力,实现通用计算、高性能计算、存储的融合[5]。
在标准制定方面,国内电信运营商纷纷牵头对相关标准进行立项。中国电信牵头的算力网络框架与架构标准(Y.2501)在国际电信联盟电信标准分局上获得通过,并研究支持算力网络的下一代网络演进编排增强要求和框架。中国电信、中国联通联合立项Y.ASA-CPN标准,重点研究算力网络的认证调度架构。中国移动在国际电信联盟牵头建立包含5个标准在内的算力网络国际标准体系。中国通信学会、中国通信标准化协会等开始制定算力网络相关标准。开放数据中心委员会已完成面向可编程算力路由网关的立项[6]。
在学术方面,持续开展算力网络相关的技术创新。2013年,Jain等开始对B4系统的算力网络展开研究[7],通过路由代理进行OpenFlow交换机和Qugga控制器的连接,完成路由和接口的更新,协议报文转发,实现跨数据中心的算力服务协作。随后,学术界又提出了算力网络层面的各项方案,包括网络底层路由协议扩展、覆盖层任务分解和算力映射、跨层的统一算力网络控制等方案。
2.3 算力网络技术创新加速
目前,算力网络在技术方面的创新主要包括新架构、新调度、新度量(见图1)。在架构方面,算力与网络逐渐走向融合,算力基础设施融合架构正在创新发展。在算力调度技术方面,计算能力调度从只支持网络的调度模式逐渐转变为算力与网络相匹配的调度模式,主要包括计算能力的跨区域和多层次调度、计算能力资源的统一调度、网络协议、可视化监控和智能运维。在算力度量方面,算力和网络度量的内涵不断扩展,算力度量由单一节点向一体化综合协同度量转变。
本文刊于《信息通信技术与政策》2023年 第5期
主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站已正式投入运行,欢迎投稿!
推荐阅读
你“在看”我吗?

