大数跨境
0
0

专题丨算网融合的泛在计算服务发展和演进趋势分析

专题丨算网融合的泛在计算服务发展和演进趋势分析 信息通信技术与政策
2021-04-13
0
导读:张婷婷,王升,李莹,张昊
※  信息社会政策探究的思想库  ※
※  信息通信技术前沿的风向标  ※


作者简介




 张婷婷 

中国移动通信研究院网络与IT技术研究所技术经理、高级研究员,ITU-T未来网络与新型计算研究组副报告人,长期从事公有云/私有云/NFV/边缘云方面云计算规划演进和方案标准制定工作,开展云效能评估评测、云原生、泛在计算等方向研究工作。



 王 升

中国移动通信研究院网络与IT技术研究所项目经理,长期从事NFV架构与演进、边缘云、异构硬件加速、泛在计算等方向研究工作。



 李 莹 

中国移动通信研究院网络与IT技术研究所项目经理,长期从事NFV/SDN架构与演进、泛在计算、网络管理等方向研究工作。



 张 昊 

中国移动通信研究院网络与IT技术研究所副所长,多年移动通信网络从业经验,精通NFV、SDN、云计算、VoLTE、EPC、5GC、新型计算技术等技术。


论文引用格式

张婷婷, 王升, 李莹, 等. 算网融合的泛在计算服务发展和演进趋势分析[J]. 信息通信技术与政策, 2021,47(3):19-25.


算网融合的泛在计算服务发展和演进趋势分析


张婷婷 王升 李莹 张昊


(中国移动通信研究院网络与IT技术研究所,北京100053)


摘要:在新基建背景下,算网融合ICT产业“云网边端”协同需求日益旺盛。分析计算服务演进趋势、对比计算服务行业技术架构、分析业界算力网络/分布式云/泛在计算服务化架构的特点,提出把泛在计算服务发展的新理念作为算网融合的一种演进思路,并介绍泛在计算服务涉及的关键技术。

关键词:泛在计算;算力网络;分布式云

中图分类号:TN929. 11    文献标识码:A

引用格式:张婷婷, 王升, 李莹, 等. 算网融合的泛在计算服务发展和演进趋势分析[J]. 信息通信技术与政策, 2021,47(3):19-25.

doi:10.12267/j.issn.2096-5931.2021.03.004


0  引言


在国家“新基建”战略指引下,互联网以新发展理念为引领,以技术创新为驱动,以数据为核心,以信息网络为基础,强调提供数字转型、智能升级、融合创新等服务融合基础设施。在算网融合成为必然趋势的背景下,业界为盘活通信网络基础设施和新技术服务基础设施、促进共享新型服务体系和架构演进开展了积极的探索。本文结合新兴信息计算服务的演进驱动,对业界算网融合的演进架构进行了全面分析对比,提出了泛在计算服务的架构设计理念,并介绍了其所涉及的关键技术,以期对现有算网融合体系架构的演进发展提供多种借鉴思路。


1  泛在计算服务的演进驱动力


1.1  架构驱动

纵观人类计算服务架构的演进历史不难发现,集中式计算与分布式计算呈螺旋式交替上升演进。20世纪六七十年代大型机出现,开始向人类提供集中式计算服务;20世纪八九十年代消费级PC占领用户桌面,使计算服务进入千家万户并广泛分布;2006年,以虚拟化、云化技术为基础的云计算出现,集中式的超大规模数据中心开始通过网络向千行百业提供敏捷弹性的计算服务;近些年来,随着5G与边缘计算加速发展,芯片制程工艺提升,端侧算力也将迎来提升,新兴应用驱动数据处理越来越向边端扩散,以获得更低的时延响应,这一阶段计算服务具备典型的分布式特征。未来,随着算力分布与网络连接的泛在化,算网融合已成趋势,计算服务的架构演进又将呈现算网一体的新特征,形成一个集中和分散统一协同的云网边端泛在化计算服务框架。


1.2 需求驱动

新型应用的不断涌现对算力精度、强度、时延转发等不同方面都提出了差异化需求,致使云数据中心出现了CPU、GPU、FPGA等多种硬件设施平台。与此同时,国内IT市场硬软件百花齐放,国产化芯片发展促使云平台资源异构化成为必然。但是,这种趋势也加速了芯片生态封闭、编程工具语言专用、一个应用需要基于多种异构芯片开发不同代码且无法跨芯片移植的局面。对开发者而言,硬件升级、应用迁移都需对代码进行更新,加重了应用开发的负担;对云服务商而言,采购各种异构硬件形成不同的池化环境,也会导致不同异构硬件利用率差异较大、硬件持有成本居高不下。统一的异构算力管理涉及不同芯片的加载、抽象、虚拟化、挂载、删除等一系列生命周期管理工作,需要较长时间演进成熟。因此,为简化应用开发,将异构算力架构进行屏蔽,实现一套代码在不同架构计算芯片上有效运转,是当前云服务商和云化应用关注的方向之一。


1.3 社会驱动

区块链正驱动网络从“信息互联网”到“价值互联网”变迁,作为互联网的第二次革命,区块链给数字世界带来了“价值表示”和“价值转移”两项全新的基础功能。区块链已经不仅仅是一项技术、一种工具,更是一种思维方式。区块链作为一种新型技术组合,其去中心化、难以篡改、不可抵赖、面向场景等特点可为泛在计算服务带来一种全新的信用模式,使其数字服务更具竞争力。在共享经济繁荣的社会背景下,区块链技术的使用可以激发算力服务提供方提供算力共享服务的积极性,并对算力消费者提供交易结算公开透明的账单,甚至还可以基于区块链的记块信息进行算力追溯和服务保障,使能可信的泛在计算服务。


1.4 产业驱动

在新基建背景下,截止到2020年,第三方数据中心服务商在建规划机柜总规模为1 484 981 个,占中国在建规划机柜总规模的44.8%;其次是运营商的在建规划机柜规模,占比为26.5%;互联网企业和其他跨界参与者在建规划机柜规模占比分别为11.8%、16.9%[1]。可见,第三方数据中心服务商已经成为未来新基建市场投资的主体,运营商更多将资金用于5G建设和云服务转型,数据中心上下游企业、能源/制造/房地产类跨界新进入者纷纷布局数据中心领域。因此,未来融合基础设施的提供者可以是云服务商、运营商甚至是中小企业的第三方数据中心服务者和设备商。随着泛在计算的云网边端架构融合,云服务商(如AWS、阿里云、腾讯云等)正在寻求5G网络服务的增强和加持,运营商也在依托强大的网络积极布局云计算服务向信息化服务商转型,而设备商(如华为、浪潮、Xilinx等)则正在依托各自的硬件技术栈和生态积极拓展服务化的平台能力。这个过程给一些中小企业算力提供者提供了机会,使之通过加入泛在共享算力交易服务提升自己的价值和售卖市场。因此,产业生态中不同产业角色的切入也在加速算网一体融合、促进可持续发展。


1.5 泛在计算服务的愿景概念

美国施乐公司首席科学家马克威瑟(Mark Weiser)博士在1988年首次提出了泛在计算(Ubiquitous Computing)的概念,认为泛在计算是要建立一个充满计算和通信能力的环境,同时使这个环境与人们逐渐融合在一起。在该定义中,泛在计算是一个强调和环境融为一体的计算概念,而不强调计算设备的存在。本文提出的泛在计算服务的愿景和理念正是泛在计算的一种具象化服务,是基于上述驱动力实现的一种促进算网融合的新型服务模式和架构。其核心概念即通过自动化、智能化调度,使人们可在任何时间/地点无感知地将计算(算力、存储、网络等)需求与云边端多级计算服务能力连接适配,通过多方算力贡献者和消费者共同参与,实现算力从产生、调度、交易到消费的闭环,形成算网一体、算随人选、算随人动的可信共享计算服务模式[2]


2 算网融合下计算服务架构演进分析


2.1 算力网络架构

算力网络是通过网络控制面分发服务节点的算力、存储、算法等资源信息,并结合网络信息和用户需求,提供最佳的计算、存储、网络等资源的分发、关联、交易与调配,从而实现整网资源的最优化配置和使用的新型网络[3]。算力网络架构提出的出发点是为解决边缘计算节点之间的协同问题,其实现机制是将算力与网络能力作为路由信息发布到网络层之上的算力路由层,并由算力路由节点基于虚拟的服务ID将计算任务报文路由到最合适的计算节点,以实现用户体验最优、计算资源利用率最优、网络效率最优(见图1)。算力网络架构的技术特征包括:是计算与网络深度融合的新型网络架构;包含新型算力网络路由协议,如基于边界网关协议/内部网关协议(BGP/IGP),设计算力路由标识、算力路由控制、算力状态网络通告、算力路由寻址、算力路由转发等。

图1 算力网络架构图

2.2 分布式云架构
分布式云架构是从云计算下沉角度进行设计延伸的,已成为云计算服务发展的新趋势。分布式云把云的类型分成核心云(Core Cloud)、区域云(Regional Cloud)、边缘云(Edge Cloud)三层逻辑(见图2)。ITU-T已发布的分布式云高层需求标准Y.3508[4]描述了结合典型云计算部署需求的3种配置模型,其中模型1要求在部署云的时候把核心云和区域云的配置进行统一协同;模型2是单纯的核心云和边缘云协同服务;模型3包含的边缘云更靠近区域云,需要逐层把云服务推到边缘,进行分层的低时延处理,例如一些大型AI训练推理应用场景需要在核心云基于大数据和高算力做模型训练,配合区域特性可把一些训练规则部署在区域云中,而真正要做推理和实施时,则会在边缘云上提高其实时性。
图2  分布式云中的边缘、区域、核心云配置模型(来源:ITU-T Y.3508)

在分布式云的协同管理上最复杂的第3种模型中会引入云—区域—边的协同调度和边边协同调度,以提高统一用户感知的服务,所有管理调度的前提是所有的云类型能力都来自于同一个云服务商(CSP)。可在核心云管理能力上升级全局调度,在边缘侧引入边缘云管理负责边缘云自治和边边协同(见图3)。目前,分布式云管理和架构类的标准正在ITU-T进行研究制定中。
图3  分布式云管理调度逻辑架构

2.3  泛在计算服务化架构
泛在计算服务化架构借鉴了NFV/SDN集中管理和云计算池化调度理念,通过集中化和分级化扁平平台实现对泛在计算设备的算力和网络信息收集、应用管理调度和部署分发,为用户提供最优的算力分配及网络连接方案。分级调度的泛在计算的逻辑架构由算力+网络基础设施层、算网管理调度层、计费运营层组成,这3层之间通过标准应用程序接口(Application Programming Interface,API)互通,完成算力生成、调度、交易的闭环(见图4)。其中,算网+基础设施层提供异构算力资源与确定性、无损的泛在网络连接,是泛在计算服务大厦的基柱;算网管理调度层负责底层算网资源的算力注册、智能调度、算力分解以及算法框架和应用部署等功能,是泛在计算服务大厦的顶梁;计费运营层实现算力分级、交互界面、应用商店、开发平台等运营功能,并利用区块链技术实现基于智能合约的算力记账,是泛在计算服务大厦的门户。泛在计算服务化架构具备3个特征:一是对社会泛在计算设备、云边端三层多级算力的集中管理调度,实现控制与数据平面的分离;二是不改变当前底层网络架构与IP协议实现,通过平台自身的多级调度能力实现互联协同,调度参数通过松耦合的平台调度逻辑实现;三是一方面可以兼容当前单体业务、应用的架构设计的组资源调度,同时也能支撑各类轻量化微服务架构的细粒度调度。
图4  泛在计算服务功能架构

2.4  架构对比分析
算力网络本质上是一种新型网络架构的分布式解决方案,其设计思想是从网络出发,将节点算力信息和网络信息附着在新型算力路由协议之中并在基础网络中进行扩散,同时利用各个算力路由节点上基于服务标识(Service ID)生成的路由转发表,将用户的算力请求转发到合适的算力节点。算力网络架构当前待解决的问题包括:一是基于算力路由的分布式转发机制在应用服务数量巨大、网络规模庞大时,每台路由器需针对每个应用服务在获取全网信息后再独立进行路径的计算,因此导致的网络维护工作量巨大,此问题需克服;二是目前算力网络协议关于汇聚、内部网关协议(Interior Gateway Protocol,IGP)、边界网关协议(Border Gateway Protocol,BGP)之间的交互以及不同网络自治域(Autonomous System,AS)之间的交互细节研究尚不成熟,需进一步加强[5];三是业务流粘性保持、算力节点业务指标的通告频率、准确性等问题尚无一致方案,需继续探讨。

泛在计算设计思想从云计算出发,通过集中化、分级化管理调度平台实现对泛在计算设备算力和网络信息的收集、管理编排、部署分发,并通过统一的运营门户对客户提供服务,本质上是一种集中式的解决方案。泛在计算属于叠加网络(Overlay)方案,不改变底层网络架构,应用设计方式,在对传统多方云边资源池进行纳管的同时,积极尝试对泛终端设备进行管理调度。由于引入多方算力提供者,因此在可信共识方案中将利用区块链技术促进云边网端链五维协同,实现全社会泛在算力的可信共享交易,达到算网一体、算随人选、算随人动的目标愿景。

上述3种架构的对比情况如表1所示,可见算力网络架构与分布式云架构、泛在计算服务化架构不同,其作为一种新型的网络架构,设计思想是从网络出发,利用分布式算力路由节点将用户的算力需求转发至最优节点,以此提升网络自身的服务能力,可解决应用在已知服务部署位置后帮助选取最优服务接入的问题。分布式云架构作为云计算发展的趋势,通过云边、边边协同机制,为用户提供更低的延迟、更快的算力响应速度,实现云计算技术的分布式下沉和整体云服务协同。当前其实现主要在单云服务商内部进行扩展。用户在应用分布式云架构时仍需先选取云服务商再进行单云内调度。泛在计算服务化架构作为分布式云发展的下一阶段,在架构设计理念上与分布式云架构高度一致,不同之处在于可纳管第三方云池甚至是端侧设备,并可将网络也作为调度考虑的重要因素之一,借助区块链提供可信共享的算网一体化计算服务,拓宽了计算服务的边界。对用户应用而言,其可直接使用“算力”淘宝模式,完全无须关注应用部署在何处。
表1 架构方案对比分析

3 泛在计算关键技术

3.1 算力抽象
算力抽象是算力基础设施层的关键技术之一。泛在计算基础设施层所提供的算力资源,包含多种不同类型指令集、不同体系架构异构硬件,比如CPU、GPU、FPGA等。算力抽象主要在异构基础设施上对算力进行抽象建模,通过在软件层面提供跨硬件、跨厂家的标准、开放的编程环境与编程接口,使得应用开发者无需了解底层硬件的具体信息,可以实现一套应用代码在任意底层硬件上执行。算力抽象能够提高算力基础设施层的通用性、易用性,实现应用基于算力而非硬件类型的部署,提升泛在算力的整体利用率,繁荣泛在计算生态。该技术可以从操作系统层面和异构硬件层面进行研究,制定相应的开发模型。

3.2 算力调度
算力调度是管理调度层的关键技术之一,为实现泛在计算的愿景,在云网边端之上需要构建多级的算力调度系统层以形成全网算力与网络的调度、匹配,成为一个“算力操作系统”,将整个社会的算力节点与网络管理纳入统一的体系。算力调度平台需要实时高效地获取云网边端各级算力节点资源信息,分析用户需求,通过自动化、智能化的调度方法及算法,提供最优化的应用部署及动态管理方案。算力调度包含算力注册、算力分解、算力调整与移动性管理、算力生命周期管理等多个能力,是泛在计算的核心技术之一。该技术需要突破的难点包括如何纳管异构基础设施设备、如何实现多级算力节点之间的网络互通、如何构建算随人选和算随人动的系统能力、如何实现算力调度系统的分级部署等。

3.3 可信交易
可信交易是计费运营层的关键技术之一,泛在计算的服务化可以考虑结合区块链来实现可信交易,促进共享经济式算力服务模式的商业模式实现。泛在计算的终端或云资源池都可以注册在链上,由泛在计算交易平台将这些算力源的使用情况记录上链,并给予算力源一定的“代币”或真实金额结算,链上的算力源都具备权限查阅自身的“代币”或交易账单,并可以使用“代币”兑换奖励。该技术需要突破算力节点评级、算力计费、算力记账等难关。

3.4 算力建模和分级
算力建模和分级是对应用进行细化拆解的基础技术,是指针对业务场景分类,将业务所需算力需求按照一定分级标准划分为多个等级,为算力提供者设计业务套餐提供参考,或作为其算力调度的输入参数依据。以智能应用为例,其算力诉求主要是浮点运算能力,因此可以浮点计算能力的大小作为算力分级的依据。针对目前应用的算力需求,超算类应用、大型渲染类业务对算力的需求是最高的,可达到高于1 PFLOPS(每秒所执行的浮点运算次数)以上的P级算力需求;AI训练类应用,根据算法的不同以及训练数据的类型和大小,其所需的算力从G级到T级不等,如一般训练模型算力需求为300 GFLOPS(10 亿次/s的浮点运算次数),tensorFlow算力需求达12 TFLOPS(1 万亿次/s的浮点运算次数);AI推理类业务对算力的需求稍弱,根据业务场景的不同,其所需算力一般在从几百GFLOPS到T级不等,如智能安防业务所需算力较高可达到几十TFLOPS。算力建模和分级有助于精确评估不同类型业务的服务能力需求,形成通用的算力服务,为客户的业务体验提供基础保障[6]

4 结束语

本文在算网融合背景下对泛在计算服务产生的驱动力及演进趋势进行了分析,提出了泛在计算服务的架构,并对当前算网融合演进目标架构进行了对比分析,最后还阐述了算力抽象、算力调度、可信交易、算力建模和分级4个泛在计算服务的关键技术。未来,泛在计算将影响更为广阔的生产与生活领域,如云游戏、高性能计算、电力生产管理、泛在感知领域等,将更大程度地提高生活品质、提高生产效率、促进社会算力流通交易。

参考文献

[1] 数据中心行业咨询机构DCMap. 2020中国IDC市场发展现状及趋势研究报告[R/OL]. (2020-09-16)[2021-02-09]. https://mp.weixin.qq.com/s/3M1yxt3EBrYZ9u2zbzc9Iw.
[2] 云计算开源产业联盟, 中国信息通信研究院, 中国移动通信集团有限公司研究院, 等. 泛在计算服务白皮书[R], 2020.
[3] 中国移动通信研究院, 华为技术有限公司. 算力感知网络技术白皮书[R], 2019.
[4] ITU-T. ITU-T Y.3508, Cloud computing -overview and high-level requirements of distributed cloud[S], 2019.
[5] 何涛, 曹畅, 唐雄燕, 等. 面向6G需求的算力网络技术[J]. 移动通信, 2020,44(6):131-135.
[6] 李建飞, 曹畅, 李奥, 等. 算力网络中面向业务体验的算力建模[J]. 中兴通讯技术, 2020,26(5):34-38+52.

Development and evolution of ubiquitous computing service based on computing and network convergence

ZHANG Tingting, WANG Sheng, LI Ying, ZHANG Hao

(Department of Network and IT Technology Research, China Mobile Research Institute, Beijing 100053, China)

Abstract: Under the background of new infrastructure construction and computing and network convergence, the requirement of “cloud, network, edge and device” collaboration in ICT industry is enhanced. This paper analyzes the evolution trend of computing services, compares the technical architecture of the industry including the characteristics of distributed cloud and computing power network architecture, to propose a new concept of ubiquitous computing services as an evolution idea of computing and network convergence. It also introduces the key technologies involved in ubiquitous computing services.
Keywords: ubiquitous computing; computing power network; distributed cloud


本文刊于《信息通信技术与政策》2021年 第3期



主办:中国信息通信研究院


《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”,聚焦信息通信领域技术趋势、公共政策、国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动5G、工业互联网、数字经济、人工智能、区块链、大数据、云计算等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。



《信息通信技术与政策》官网开通啦!


为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊于2020年11月18日起正式推出官方网站,现已进入网站试运行阶段。我们将以更专业的态度、更丰富的内容、更权威的报道,继续提供有前瞻性、指导性、实用性的优秀文稿,为建设网络强国和制造强国作出更大贡献!



http://ictp.caict.ac.cn/ 




   推荐阅读  



专题丨SDN/NFV技术演进趋势分析
专题丨算力网络关键技术及发展挑战分析
专题丨面向智慧工厂的工业互联网边缘智能协同计算技术研究
专题导读:下一代互联网技术


♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩
♫. ♪ ~ ♬..♩~ ♫. ♪..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩..♩~ ♫. ♪ ~ ♬..♩


“在看”我吗?


【声明】内容源于网络
0
0
信息通信技术与政策
工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”。
内容 986
粉丝 0
信息通信技术与政策 工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。定位于“信息通信技术前沿的风向标,信息社会政策探究的思想库”。
总阅读861
粉丝0
内容986