经过系统性的实验验证,迁移优化后的模型在昇腾910b平台上模型训练速度与英伟达A100相当,差异小于5%。在保持高性能的同时,昇腾平台训练能耗降低约10-15%;曙光DCU在推理任务中的能效比提升超过30%,适合长时间、大规模的预测业务。在精度方面,模型在国产平台上的预测结果与原始版本基本一致,确保了科研与业务应用的可靠性。研究突破了模型跨框架迁移、算子适配、分布式训练优化等关键技术瓶颈,形成了一套完整的国产化适配方法论,为后续各类科学计算模型的移植工作提供了重要参考。研究成果验证了国产AI芯片及框架在复杂科学计算场景下的应用潜力,为国产硬件在高端计算市场的拓展提供了实证支持,有助于推动建立更加完善和健壮的国产AI计算生态。
基于不同国产芯片框架的大气和海洋AI模型迁移和优化框架
海洋大模型在不同芯片框架上的训练效率对比
核心PI
|
清华大学
|
1、地球系统数值模拟装置——超级模拟支撑与管理系统,国家发改委;
2、发展通用的地球系统模式高效并行计算框架,国家科学技术部高技术研究发展中心;
3、智能数值模式发展,国家自然科学基金;
4、高分辨率区域海洋模式软件子系统研制,国家科学技术部高技术研究发展中心;
5、高效自动并行的海洋模式计算框架研究,国家自然科学基金;
6、人工智能辅助数值天气预报关键技术研究,国家自然科学基金;
7、面向海洋模式的高效自动并行三维算子库研制,海洋科学与技术试点国家实验室;
8、三维海洋要素场智能化重构技术研究,海洋环境科学与数值模拟重点实验室;
9、高分辨率区域气候动力降尺度预报技术研发与应用,自然资源部北海预报中心;
10、全球大规模高效并行海浪数值模拟技术,自然资源部第一海洋研究所;
文章信息:
上述研究成果发表于人工智能会议《AAAI 2026 - Innovative Applications of AI Conference》。清华大学博士研究生孙语泽为文章第一作者,黄小猛教授为文章通讯作者。该研究受到国家重点研发计划和国家自然科学基金资助。
论文发表:
点击文末“阅读原文”可查看相关原文。

