

国家能源集团：筑牢高质量数据基石，赋能 “AI+能源”加速前进

华为云和TA的朋友们

2025-11-24

导读：国家能源集团携手华为云，以高质量数据赋能AI，推动能源行业智能化转型

今年6月，国家能源集团（简称“国能集团”）发布了全球首个千亿级发电行业大模型——“擎源”，该模型是国能集团依托全球领先的风电、火电装机规模及海量数据资产打造而成，是将高质量数据集与AI深度融合，让数据释放潜能，让AI深入电力行业核心生产流程与系统，实现能源行业智能化转型的标杆性成果。

国能集团是中国五大电力集团之一，拥有全球领先的装机规模和行业数据资源，这为模型训练提供了海量的、真实的运行数据作为学习资料，让它可以不断成长、优化。可同时也面临着发电领域多源异构数据难整合、数据质量参差影响模型精度、行业场景适配数据集匮乏等问题。国能集团始终坚持从战略高度进行全局谋划，秉持“规划先行、谋定后动”的原则，以提高数据要素治理效能、提升数据资源价值创造力为目标，系统构建数智治理新体系，有力推动集团多元异构数据集中整合、共建共享与深度应用开发，加快数据由分散资源向战略资产转变。

多年来，国能集团坚持贯彻“统一规划、统一建设、统一平台、统一管理”的信息化建设思想，走出了一条从信息化筑基、数字化赋能到数智化跃升的战略进阶之路。目前，集团依托华为云Stack为数智化构筑了坚实的云底座，支撑工业互联网、司库管控平台、智慧管理平台、智慧运营平台、生态协作平台等业务平台，为数智国能全力培育高质量发展的新动能。

统一数据湖支持国能高质量数据集建设
赋能AI价值变现

以云底座为基础，构建统一数据湖，根据不同业务对数据的需求，针对不同数据源提供相应的数据采集、存储、加工和发布方案，同时通过Roma Connect与湖外应用系统集成，将数据提供给集团各业务应用使用。

基于统一数据湖，以业务场景需求为牵引，国能集团已完成发电行业超过700TB的行业资料梳理，覆盖了文本、图像、视频等多种类型，通过数据工程处理获得了450GB的高质量数据集，在结合大模型数据工程的深入实践中，进一步厘清数据集的层级演化、分类维度及内在关联关系，实现了行业数据从“原始数据集”到“基础数据集”，再到“高质量数据集”的加工链与递进关系。

现在，该数据集已与“擎源”大模型深度结合，聚焦能源行业的痛点、难点，在多业务场景域取得了显著成效：

在产调中枢域，针对新能源大规模并网带来的调度策略优化难题，大模型实现了燃煤采购方案生成时间从传统人工1天缩短至5分钟，配煤掺烧方案一键生成，决策效率提升95%；

在电力交易域，由于电力调度方式变革，从计划执行到市场驱动，给电力交易员的工作带来极大挑战，大模型实现了从气象感知到交易执行的全链条优化，实现了风速预测精度提升17%，新能源功率预测准确率提升2.8%，电价预测准确率提升6.2%；

在安全环保域，大模型有效解决了技术监督查评效率低等问题，查评时间从传统模式的7天缩短至4天，查评人员从14人缩减至6人，问题识别准确率达85%以上；

在设备检修域，大模型突破了传统检修模式主要依赖人工经验的局限。故障预警准确率提升5%，一次消除率提升60%，检修报告编制时间由数天、数周缩短至约10分钟。

实践的成果让数据蕴藏的巨大潜能有了更广阔的发挥空间，依托于行业的高质量数据集赋予了“AI+能源”高速前进的新动能。未来，国能集团将与华为云继续携手，以可信数据空间为关键突破，打通数据流通壁垒，促进行业数据共享与价值共创，真正实现数据供得出、用得好、流得动，共同打造一个开放、共享、共赢的行业数据生态。