今年6月,国家能源集团(简称“国能集团”)发布了全球首个千亿级发电行业大模型——“擎源”,该模型是国能集团依托全球领先的风电、火电装机规模及海量数据资产打造而成,是将高质量数据集与AI深度融合,让数据释放潜能,让AI深入电力行业核心生产流程与系统,实现能源行业智能化转型的标杆性成果。
国能集团是中国五大电力集团之一,拥有全球领先的装机规模和行业数据资源,这为模型训练提供了海量的、真实的运行数据作为学习资料,让它可以不断成长、优化。可同时也面临着发电领域多源异构数据难整合、数据质量参差影响模型精度、行业场景适配数据集匮乏等问题。国能集团始终坚持从战略高度进行全局谋划,秉持“规划先行、谋定后动”的原则,以提高数据要素治理效能、提升数据资源价值创造力为目标,系统构建数智治理新体系,有力推动集团多元异构数据集中整合、共建共享与深度应用开发,加快数据由分散资源向战略资产转变。
多年来,国能集团坚持贯彻“统一规划、统一建设、统一平台、统一管理”的信息化建设思想,走出了一条从信息化筑基、数字化赋能到数智化跃升的战略进阶之路。目前,集团依托华为云Stack为数智化构筑了坚实的云底座,支撑工业互联网、司库管控平台、智慧管理平台、智慧运营平台、生态协作平台等业务平台,为数智国能全力培育高质量发展的新动能。
统一数据湖支持国能高质量数据集建设
赋能AI价值变现
以云底座为基础,构建统一数据湖,根据不同业务对数据的需求,针对不同数据源提供相应的数据采集、存储、加工和发布方案,同时通过Roma Connect与湖外应用系统集成,将数据提供给集团各业务应用使用。
基于统一数据湖,以业务场景需求为牵引,国能集团已完成发电行业超过700TB的行业资料梳理,覆盖了文本、图像、视频等多种类型,通过数据工程处理获得了450GB的高质量数据集,在结合大模型数据工程的深入实践中,进一步厘清数据集的层级演化、分类维度及内在关联关系,实现了行业数据从“原始数据集”到“基础数据集”,再到“高质量数据集”的加工链与递进关系。
现在,该数据集已与“擎源”大模型深度结合,聚焦能源行业的痛点、难点,在多业务场景域取得了显著成效:
在产调中枢域,针对新能源大规模并网带来的调度策略优化难题,大模型实现了燃煤采购方案生成时间从传统人工1天缩短至5分钟,配煤掺烧方案一键生成,决策效率提升95%;
在电力交易域,由于电力调度方式变革,从计划执行到市场驱动,给电力交易员的工作带来极大挑战,大模型实现了从气象感知到交易执行的全链条优化,实现了风速预测精度提升17%,新能源功率预测准确率提升2.8%,电价预测准确率提升6.2%;
在安全环保域,大模型有效解决了技术监督查评效率低等问题,查评时间从传统模式的7天缩短至4天,查评人员从14人缩减至6人,问题识别准确率达85%以上;
在设备检修域,大模型突破了传统检修模式主要依赖人工经验的局限。故障预警准确率提升5%,一次消除率提升60%,检修报告编制时间由数天、数周缩短至约10分钟。
实践的成果让数据蕴藏的巨大潜能有了更广阔的发挥空间,依托于行业的高质量数据集赋予了“AI+能源”高速前进的新动能。未来,国能集团将与华为云继续携手,以可信数据空间为关键突破,打通数据流通壁垒,促进行业数据共享与价值共创,真正实现数据供得出、用得好、流得动,共同打造一个开放、共享、共赢的行业数据生态。


