本文引自南京水利水文自动化研究所水利信息化2024年第06期 作者:梁志开,李梦柏,曹 阳,李甘,吴刚
引言
算力是数字孪生水利工程高效稳定运行的重要支撑与保障,包括计算、存储、通信、会商等硬件资源。数据中心是算力建设的重要环节之一,承担着数字孪生水利工程数据计算、存储等重要任务。传统信息系统的数据中心通常采用服务器 + 客户端系统的建设方式,各业务子系统独立运行。海量数据信息存储在不同地域、服务器及设备中,传统架构的数据中心硬件利用率低、数据孤岛问题严重、运维难度大,已不适用于数据计算存储量巨大的数字孪生系统建设。
随着全球数字化进程的加速,特别是云计算、大数据、人工智能等新兴技术的发展,国内外基于超融合架构的数据中心呈现蓬勃发展的态势。超融合架构数据中心在全球范围内得到了广泛应用,特别是在需要高性能、高可靠性和灵活性的业务场景中,如金融、制造、医疗等行业。随着工业和信息化部《新型数据中心发展三年行动计划(2021—2023 年)》等一系列文件先后出台,以及“东数西算”工程的启动建设,国内超融合架构数据中心建设需求正在持续稳定增长。
数字孪生九龙江北溪先行先试项目作为福建省数字孪生流域建设的试点项目之一,通过数字孪生构建流域监视与告警、防洪联合调度、水资源配置与调度管理、控制性工程综合运行管理、综合会商决策等应用,构建九龙江北溪流域具有“四预”功能的智慧化管理体系。本研究以数字孪生九龙江北溪数据中心为例,基于计算、存储、网络等虚拟化技术构建基于超融合架构的数字孪生水利工程数据中心,对数字孪生数据和业务进行有效重组、管理和资源调度,按需分配资源,对软件定义的超融合架构数据中心形成有效支撑,以满足数字孪生水利工程智慧业务应用对信息化基础设施数据中心的需求。
01
现状及需求概述
1.1 数字孪生现状及需求
数字孪生九龙江北溪总体架构包括实体工程、数字孪生工程、业务应用、网络安全体系、保障体系,数字孪生工程中的信息化基础设施是实现数字孪生的基础,总体架构如图 1 所示。
为实现数字孪生九龙江北溪虚拟场景下数字工程与真实物理工程同步运行,高效精准地对未来场景进行预演和动态模拟展示,需要支撑相关过程中海量数据处理、机理模型与数据驱动模型高速运算、大量高精度三维可视化模型实时渲染,以保障系统流畅运行。数字孪生九龙江北溪对数据中心的性能需求包括系统的高效性(包括信息处理、计算、存储和传输等能力),以及系统的实用性、可靠性、先进性、可维护性和可扩展性。
系统的高效性需求介绍如下:
1) 信息处理方面,具备多核心、高工作频率特点,能够应对多线程的系统工作任务,以最优化流程处理高强度计算任务。
2) 计算能力方面,能够为模型算法、数据分析和可视化,以及模拟和建模提供高性能处理平台和GPU加速功能。
3) 存储能力方面,应支持多用户并发访问,提供海量数据的存储空间,支持数据冗余备份等功能,并预留后续扩展空间,3 年存储量的存储空间大约需要20 TB。计算方面需要配置 16 核 32 GB 内存的应用服务器布署应用系统,配置 8 核 16 GB 内存的应用服务器布署移动 App 计算应用系统,配置 64 核 256 GB 内存的数据库服务器和 16 核 32 GB 内存的服务器布署 GIS 站点,后期根据实际需求再进行计算资源补充配置。
4) 传输能力方面,需要具备高带宽、低延迟、高可靠性、高安全性、可扩展性,以及多协议支持等特点。数字孪生九龙江北溪数据传输网络包括光纤网络、互联网、无线通信、政务外网等。
1.2 信息化基础设施现状及需求
九龙江北溪水闸现有工程信息管理系统数据中心由服务器、交换机、路由器通过网线连接组成,信息化基础设施架构如图 2 所示,具体内容如下:
1) IT 基础架构,包括服务器、磁盘阵列、备份存储、交换机、光缆等。
2) 网络安全架构,包括网关、网闸、防火墙、安管(安全管理)一体机、数据库审计等。
3) 数据云备份等。
九龙江北溪现有信息系统的数据中心采用分布式物理服务器架构,现有信息化基础设施计算和存储能力低下,信息设备老旧,不足以支撑数字孪生九龙江北溪建设。面对数字孪生九龙江北溪先行先试项目日益增长的海量数据存储、计算需求,现有的信息化基础设施架构已逐渐无法支撑数字孪生业务的正常开展,存在以下问题:
1) 服务器超期服役,宕机频发;
2) 存在数据孤岛现象,安全风险高;
3) 资源利用率低,无法共享;
4) 扩展性差,布署周期长;
5) 投资运维成本高,管理复杂度高。
因此,数字孪生九龙江北溪数据中心需要实现数据资源计算、存储的高度融合统一,具备共享程度高、安全性能强、扩展性能好、投资运维成本低等特点。
02
超融合架构技术方案
2.1 超融合架构
超融合架构是一种新型计算存储网络架构,以虚拟机为核心,基于标准通用的硬件平台,通过软件定义实现计算、存储、网络等融合并提升效能,最大程度地实现数据中心容量扩展与数据可用。基于超融合架构的数字孪生九龙江北溪数据中心能满足数字孪生九龙江北溪日益增长的海量数据存储、计算需求,支撑数字孪生九龙江北溪实现各项智慧业务应用。相比传统数据中心模式或虚拟化架构,超融合架构数据中心的优势包括:
1) 结构简单,利用率高,易布署;
2) 软硬件接口统一,资源统一,能够实现资源动态分配和负载均衡;
3) 不需要单独采购硬件设施,投资运维成本低且风险可控;
4) 运维方便,扩展性强,用户仅需对虚拟机堆叠添加节点,即可实现线性方式扩展。
2.2 关键技术
超融合架构技术将数据中心网络、存储、计算等资源虚拟化,实现统一管理、按需供给、弹性扩展的虚拟化资源池功能,大大提高了数据中心的架构灵活性。基于超融合架构的数据中心关键技术包括计算、存储、网络等虚拟化技术,具体分析如下:
1) 计算虚拟化技术。超融合架构通过服务器虚拟化实现计算资源池化,实现对服务器物理资源的抽象化处理,将服务器物理资源转化为可统一调度、管理、监控、服务的逻辑资源,每台物理服务器可生成多个虚拟机资源,大大提高了计算资源利用率。计算虚拟化资源池方案技术实现步骤如下:
a. 建设虚拟化计算节点。用于支撑流域防洪调度、水资源调配等“2 + N”业务应用系统布署,以及数据接收、汇聚、治理、发布与服务等。计算量方面,以业务应用对虚拟 CPU、内存的需求为指标,考虑适当冗余及资源预留,估算资源总量配置。
b. 建设高性能计算集群。用于水利专业、智能、可视化等模型算法的并行和分布计算及模拟仿真,主要包括通用计算、加速计算(GPU 计算节点)、登录、管理等节点及高速互联网络等。通过对相关模型算法、算力需求的梳理分析,得到集群实现模型算法目标须提供的算力总和。
c. 建设GPU计算节点。为智能遥感解译、视频图像识别分析等提供智能算力,提升问题发现、精准预测、科学决策的精度和效率。
d. 建设裸金属计算节点。主要用于布署数据库系统,确保资源独享、数据隔离、性能可靠、可监管及可追溯。
2) 存储虚拟化技术。存储虚拟化技术提高了存储资源利用率,实现了便捷布署与扩展。存储虚拟化资源池方案技术实现步骤如下:
a. 存储介质选择。根据数据存储量大小及访问时延要求将存储资源池划分为不同等级。对有较高 IOPS(每秒进行读写操作的次数)需求的结构化数据采用 SSD(固态硬盘)闪存盘存储;对虚拟机布署及使用频率较高的非结构化数据,根据重要程度选择 SSD 或较高转速的 SAS(服务器硬盘)存储;对使用频率较低的海量历史视频,以及遥感影像、归档、备份等数据,使用容量较大的 SATA 硬盘(串口硬盘)存储,并采用存储分层技术提升存储性能。
b. 存储空间计算。数字孪生海量数据的汇集会导致存储空间需求量大幅增加,因此需要按照不同数据类型分别计算存储空间需求量。根据存储空间确定存储虚拟化资源池规模,并预留后续扩展空间。
3) 网络虚拟化技术。网络虚拟化可理解为脱离网络硬件而抽象出的虚拟网络。底层硬件仅需提供基础的数据包转发服务,而网络虚拟化则要提供交换、路由和防火墙等虚拟网络服务,使网络体验与物理网络相同。网络虚拟化技术将网络路由、安全、交换等进行池化,相比传统网络硬件,虚拟化网络实现了快速、灵活、自动布署,运维与管理更便捷、高效,扩展性更强。基于多个服务器,通过网络聚合,实现模块化的无缝横向扩展,满足虚拟机的网络需求,实现不同业务应用的按需分配、灵活调度网络资源。应用网络虚拟化技术,具备传统物理网络在虚拟机环境中不具备的优势:
a. 隔离性。实现超融合架构下不同业务系统的网络隔离,不同业务系统可以独立规划 IP/MAC 地址(网络/物理地址)。
b. 可移动性。支持虚拟机迁移,涉及跨二层、三层,甚至跨广域网。实现逻辑网络与物理网络解耦,脱离物理网络限制,更灵活布署。
c. 可扩展性。网络虚拟化技术具有高度的可扩展性,逻辑网络规模与数量可扩展,能够满足不同业务场景对逻辑网络规模和数量的需求。
2.3 总体架构
以数字孪生九龙江北溪建设内容和目标为基础,结合数字孪生水利工程海量孪生数据服务,以及模型、知识等平台计算算据和算法服务需求,补充高性能计算、分布式存储、云网融合、资源池化等多元算力建设需求,构建基于超融合架构的数字孪生九龙江北溪数据中心,以适应数字孪生水利工程建设新形势对稳态、敏态、智能“2 + N”业务应用的需求,实现算力资源的高效、集约、弹性管理,总体架构自下而上分为 4 个层次,总体架构如图 3 所示。
具体内容介绍如下:
1) 物理资源层。物理资源层是超融合数据中心的基础,融合 X86/ARM(高级精简指令集机器)架构服务器和 CPU/GPU 等异构算力的计算设备,包含块、NAS(网络附属存储)、对象、分布式等多类型的存储设备,以及网络设备资源。
2) 虚拟资源层。基于虚拟化、集群管理等技术,利用超融合架构对底层物理设备硬件进行虚拟化,从而将服务器集群包含的计算、存储、网络资源进行池化,形成虚拟资源池,为数字孪生平台数据底板、模型平台、知识平台及业务应用提供统一资源服务。
3) 资源管理层。通过集中式资源管理软件,对底层硬件资源、虚拟资源池和实例,进行统一调度、管理、监控及服务,对上层应用提供统一的应用支撑及并行开发等环境,并为不同类型应用灵活分配资源。
4) 资源应用层。以虚拟机、容器、并行计算等多种形式提供资源运行环境,满足数据底板、模型平台、知识平台等的算据和算法搭建,以及防洪调度、水资源配置、监视告警、运行管理、综合会商决策等“2 + N”数字孪生业务应用运行。
2.4 布署架构
根据数字孪生九龙江北溪建设业务应用需求,遵循集约高效、共享开放、安全可靠、按需服务原则,数字孪生九龙江北溪各子系统分别布署在:
1) 核心业务区,主要布署防洪联合调度、水资源配置与调度、监测与告警、控制性工程综合管理、综合会商决策。
2) 互联网发布区,主要用于公众网站和移动 App 应用对外数据的中转缓冲。基于超融合架构的数字孪生九龙江北溪数据中心布署架构如图 4 所示。
03
应用效果
通过建设及运行超融合架构数据中心,数字孪生九龙江北溪大大提高了大规模海量数据处理能力,优化了存储与访问性能,提高了可扩展性,简化了运维管理,促进了实时决策且增强了安全性等,使得数字孪生九龙江北溪能够更加高效、可靠和安全地运行,为包括防洪联合调度、水资源配置与调度、监测与告警、控制性工程综合管理、综合会商决策等在内的各种应用场景提供强大的算力支持。超融合架构数据中心在数字孪生九龙江北溪中的应用效果主要体现在以下 3 个方面:
1) 提高了数据处理与仿真速度。超融合架构通过软件定义的方式,结合 X86/ARM 架构硬件,替代了传统架构中昂贵的专用硬件,从而提高了数据处理的速度。
结合数字孪生技术,超融合架构数据中心能够将感知、仿真、控制、可视等数据进行融合与计算,使算法更快,算力更强,从而保障了分析推演的速度与准确性。
2) 增强了数字孪生应用的扩展性。超融合架构以集群方式布署,通过不断扩大服务器集群数量持续提升性能,使数据中心的扩展变得更加灵活和便捷。
在数字孪生九龙江北溪中,随着模拟对象复杂度的增加、模拟精度的提高、业务场景的扩展,对数据中心的处理和存储等能力的要求也在不断提高。超融合架构数据中心的扩展性也使得数字孪生九龙江北溪业务应用的扩展性得以增强。
3)支持大规模仿真与实时决策。超融合架构数据中心具有强大的计算和存储等能力,支持大规模的宏观、中观、微观一体化仿真与实时决策。
超融合架构能够高效汇聚九龙江北溪流域的各类监测数据(包括水位、雨量、水质、流量、水工程信息等数据),且具备强大的数据处理能力,能够对海量监测数据进行快速分析,提取有价值的信息,构建九龙江北溪流域智慧化模型(包括洪水预报、水资源配置等模型),为数字孪生九龙江北溪防洪和水资源调配提供大规模仿真与实时决策。
04
结语
本研究详细阐述了基于超融合架构的数字孪生九龙江北溪数据中心建设方案,从现状与需求、技术优势、关键技术、建设架构方案、应用效果等方面,详细介绍了超融合和虚拟化等新技术在数据中心建设中的应用方案,对支撑数字孪生算力建设及智慧应用具有重要意义,对其他水利工程数字孪生建设具有较好的示范性与启示意义。
未来,基于超融合架构的数字孪生水利工程数据中心将围绕数据融合与集成、模型与算法创新、业务应用场景拓展、平台性能与稳定性提升,以及技术创新与标准化等方面展开研究,这些研究将不断提升超融合架构数据中心在数字孪生水利工程智能化、精细化、高效化发展中的重要地位。
声明:本公众号转载文章,若有来源标注错误或涉及版权问题,请于本公众号联系,我们将及时更正、删除。
关注我,获取更多资讯

