随着以ChatGPT为代表的大语言模型的爆火,掀起生成式人工智能的热潮,2023年人工智能领域迎来了突飞猛进的发展。这一年领域内发生的事件可谓比前十年加起来还要多:有你追我赶的各领风骚,有蜂拥而至的百模混战,甚至也不缺乏吸引全球目光的大型吃瓜事件……2023年,因此也被看作大模型元年。
经历了这一年,想必大家对一个观点不会再抱有怀疑:不久的未来,AI将会成为像水电一样的底层能力,可以“即用即取”。那到底谁会成为大家喜闻乐见的AI水龙头、AI电闸,比拼的应该不仅仅是大数据、大参数、大算力,应用场景的丝滑落地才是检验成功与否的关键。
数慧时空作为山东土地发展集团控股的国家级高新技术企业,基于20年业务积累和四年的遥感技术沉淀,推出行业首个自然资源多模态大模型“长城”,以海量影像数据、自然资源变化图斑、自然资源法律法规、应用系统数据库、大规模行业知识、语料库标注为数据基础,训练生成语言大模型、处理大模型、解译大模型、分析大模型,支撑图斑智能判读、影像智能统筹、全要素变化提取、专题智能构建等应用需求。

数慧时空长城大模型架构图
“长城”大模型的语言大模型支持自然资源领域多种模态的数据,包括空间(即矢量)、文本、图像(包括影像、视频、照片等)、音频等,通过对不同模态数据的标注学习,能够理解和互相转换多种模态数据。
“长城”大模型通过对自然资源行业办事指南、政策法规、文献期刊、项目案例等数据的学习,建立起行业专业知识库,并在此基础上开发出自然资源要素监测识别、国土空间智慧规划和治理、智能审查审批、公共服务、决策支持等专用工具。用户经由AI智能体支撑的AI指挥台,通过对话形式即可开展政务审批、调查监测、国土空间规划定期体检、用途管制等业务相关工作,降低系统使用成本,大大提升工作效率。同时,大模型的推理过程完全透明可见,用户通过对话指令即可人工调整大模型知识库,以更好地满足业务需求。
“长城”大模型的处理大模型可以实现影像的自动统筹,也就是根据客户对范围、时相、监测目标的要求,自动选择最合适的影像组合,俗称挑片。对于统筹后的影像,能够实现免像控的几何精校正,使几何误差控制在1-2个像素内;能够在影像镶嵌过程中,自动避让建筑、道路等典型地物,让多景影像的拼接后效果更自然;借助AI算法,能够实现最佳的匀光匀色效果,使整体色调、色彩更加连续、更加一致。
“长城”大模型通过突破山体陡峭地形地貌几何校正难,参考底图精度不高、时效差等难题,实现了影像生产过程的高度自动化和智能化,使得一个人就是一个影像数据处理工厂成为现实。

“长城”大模型的解译大模型通过统筹现有卫星遥感、调查监测、执法举证、物联设备等数据,融合地学知识建立分层、分级、分类全国自然资源遥感综合解译样本库,提高相似地理环境下同质化解译精度。
深度学习网络与知识图谱的结合
地学知识图谱
结合不变点检测、基于先验知识剔除等技术,能够针对场景自动剔除伪变化,真变化准确率>80%。

基于上述能力,“长城”大模型构建涵盖地表覆盖、目标识别、定量反演、变化检测、场景理解智能解译算法模型体系,进一步提升解译自动化、定量化程度和判别识别精度,面向不同的监测场景,实现全域、全要素、高频次监测。

目前,大多数大模型都是以黑盒形式存在,其决策和推理过程难以被解释和理解。“长城”大模型的分析大模型在语言大模型、处理大模型、解译大模型基础上,结合标准规范体系和业务规则体系,实现趋势研判、变化机制分析、知识决策等。
值得一提的是,分析大模型结合AI Agent、视觉语言模型等技术,实现了推理过程的透明化,整个分析流程所使用的数据、技术逻辑和处理步骤均清晰可见,让用户有据可查。

2024 年,必定是大模型大规模落地的一年。数慧时空将继续坚持技术创新+业务研究双核驱动,进一步加强遥感AI 在耕地保护、国土空间规划实施监测网络、林草、矿产、海洋等自然资源行业,以及农业农村、应急管理、生态环境、水利、气象、住建等泛自然资源行业相关业务场景的快速落地,实现对千行百业的 AI 赋能,大大解放生产力,助力培育新质生产力,推动产业创新升级。

