大数跨境
0
0

2024数慧时空年度盘点(六):以AI为基石,构筑高度智能化的数字未来

2024数慧时空年度盘点(六):以AI为基石,构筑高度智能化的数字未来 数慧云脑
2025-01-17
1
导读:为数字未来的美好蓝图添砖加瓦

“科技创新能够催生新产业、新模式、新动能,是发展新质生产力的核心要素。”当前,数据成为关键生产要素,催生新的技术--经济范式,重塑产业发展方式,推动数字基础设施向数据基础设施延伸和拓展。


数慧时空作为业务驱动的AI数据基础设施服务商,在2024年积极投身于人工智能(AI)的怀抱,着重从AI基础能力建设、数据治理智能化升级、低代码赋能行业应用敏捷构建、国产化软硬件广泛适配等方面加速推进AI与传统业务深度融合,通过技术创新与安全可控双轮驱动,为客户提供更加智能、高效、安全可靠的服务体验。



在AI基础能力建设方面,从业务知识图谱、行业大模型到智能体以及具体的应用场景落地,数慧时空深入探索,卓有成效。

01

知识图谱助力行业升级,构建业务新生态

知识图谱通过结构化复杂信息,可提供智能搜索和推理能力,正成为多个行业提升业务效率和服务质量的利器,为行业带来全新变革。2024年数慧时空为解决实际业务问题,让知识图谱在行业产品中发挥最大价值,在图谱规范、构建、存储管理及与AI结合应用等方面进行了探索和实施。


(1) 图谱规范:统一定义,构建稳固的知识基石
图谱构建和使用需遵循一系列规范,以保障质量、一致性和可扩展性。我们对图谱节点和关系类别进行统一化定义,节点类别涵盖5类本体节点和1类实体节点;设计了6种节点之间的关系类型,形成统一规范,从而确保数据一致性和集成性,简化维护,促进跨平台应用。

(2) 图谱构建:多步协同,精准转化
构建知识图谱涉及数据收集、预处理、实体识别与链接、关系抽取与推理等环节。借助我司DIIF产品,利用自然语言处理(NLP)技术进行命名实体识别(NER)和关系抽取,将非结构化、结构化数据转化为知识图谱;引入机器学习和深度学习模型,自动发现新实体和关系,丰富图谱内容;业务专家参与建模,订正图谱,提升质量与可用度。


(3) 图谱存储与管理:高效存储,便捷检索
采用一体化向量库存储知识,设计高效索引策略和查询优化算法,支持快速检索和复杂查询。定期更新图谱以反映最新信息变化,并建立版本控制系统,便于回溯和审计,确保知识图谱的时效性和可追溯性。

(4) 图谱与AI结合应用:深度融合,智能升级
知识图谱与AI结合显著提升系统智能化水平。增强NLP,实现精准语义解析和智能搜索;利用图谱关联信息改进推荐系统效果;基于图谱规则和模式进行高级推理,辅助决策支持;借助图谱背景知识,训练更鲁棒的机器学习模型,提高泛化能力和准确性。融合技术为用户提供智能、个性化服务体验,推动行业数字化转型和技术进步。

02

自然资源行业大模型落地应用

对自然资源业务知识进行收集和加工,结合具体的应用场景需求进行大模型试点应用开发,探索其在自然资源管理决策中的实际应用落地。系统不仅强化了智能问答优化和多轮对话能力,还引入了全阶段训练和语音交互功能,确保了模型的先进性和实用性。从以下几个方向开展工作:


(1) 知识向量化加工:将自然资源领域知识向量化,构建行业知识库,解决大模型知识缺乏和更新延迟问题。

(2) 模型训练与优化:采用3D并行、ZeRO优化和混合精度训练等技术,提升模型训练效率和效果。

(3) 知识管理与应用:基于知识库的大模型自然语言问答功能,为用户提供精准的政策解读、技术支持及行业知识服务。

知识管理

知识问答

03

文档智能处理,助力业务审批智能化提升

在传统业务审批流程中,业务人员需要通过手工录入各种纸质档案并通过人工核对来完成申请事项的审批工作,整个过程耗时耗力,而且容易出错。为解决这一难题,数慧时空创新性地引入了AI+OCR技术,通过自动识别附件材料中的信息并且自动录入到系统,然后调度与该事项匹配的质检规则进行智能比对和校验,显著提高了审批效率,为客户提供更便捷高效的服务体系。关键过程如下:


(1) 基于版面识别技术定位文档关键区域
通过技术根据业务类型及规则从文档中识别定位出关键区域内容,定位其中的关键区域,如文字、标题、表格、图片等。

版面划分

(2) 通过AI智能体对区域内容关键信息进行提取
分析特定的业务类型和预设规则,设计并构建AI智能体,通过深入分析文档区域,精准提取关键信息,将文档内容转换为结构化数据,以便于后续的分析与利用。

信息提取

(3) 将结构化数据录入系统并根据预设规则进行审批

采用AI结合OCR技术对文档进行智能化分析与比对,显著提升了审批流程的速度与精确度。不仅优化了内部工作效率,更为广大民众提供了更为便捷、高效的政务服务体验,彰显了技术赋能政务升级的显著成效。

04

智能体探索与实践

智能体是一种能够感知周围环境并自主采取行动以实现特定目标的实体。它们不仅具备自主性、反应性和主动性,还可以是软件程序或物理机器人的形式。数慧时空积极探索智能体技术,采用后端即服务(Backend as Service)和LLMOps的理念,为开发者提供了快速搭建生产级生成式AI应用的强大支持。通过快速构建不同场景下的智能体,为客户管理运营提质增效。


其核心优势包括


支持数百个模型


直观的Prompt编排界面


高质量的RAG引擎


稳健的Agent框架


灵活的流程编排


基于上述平台能力,我司已经开发构建了一系列辅助办公的智能体。 

(1)低代码应用构建平台客服助手
通过对低代码应用构建平台的部署手册、使用手册、二次开发手册等文档与日常问题及解决方案的收集整理,快速解答开发构建人员在平台使用过程中遇到的一系列问题及推荐相关文档。

低代码应用构建平台客服助手

(2)工作总结报告生成助手
根据员工工作内容初步生成工作总结报告及总结建议。

工作总结报告生成助手图片 
(3) 新员工上岗助手
为新员工介绍岗位职责、工作指南、岗位画像、成长路线、学习资料等内容,辅助新员工快速了解公司相关制度、了解学习相关技术路线等。

新员工上岗助手

(4) 智能发票处理助手
智能发票是基于计算机视觉技术完成的对图片关键信息的提取,在公司财务报销模块中基于OCR技术实现对发票信息的提取,加快了财务报销数字化的进程。

智能识别火车票

智能识别发票



01

建设基于数据编织和网格技术的新一代智能数据治理平台

采用基于数据编织与数据网格的新一代数据治理架构,突破传统数据管理瓶颈,提供即连即算、虚拟存储、智能编目和服务编排等功能,简化了数据汇聚、融合、治理和应用流程,使得多源异构数据的统一汇聚和智能应用变得高效便捷,支持业务用户在多变的场景中自助取数,推动数据资产化,为数据资产运营建立坚实基础,加快释放数据价值。


新一代数据治理架构

(1)数据智能虚拟连接
使用数据虚拟化技术,支持在不改变原始数据物理存储位置的前提下,实现对海量、多源、异构数据的快速、全面连接,无需数据迁移即可实现数据的统一访问和管理,大幅提升数据访问效率。数据虚拟化技术创建逻辑数据层,建立基础视图来整合和抽象化不同来源、位置和格式的数据,实现跨域联合计算。

数据虚拟连接

(2)智能知识工程 
通过对各类结构化、半结构化和非结构化数据进行向量化加工和知识化处理,通过主动元数据技术自动追踪数据血缘,主动挖掘数据关联关系,帮助客户构建业务知识图谱,实现数据资产目录智能生成,最终形成业务智能知识库。 

主动元数据

(3) 智能融合应用
采用零编码、灵活拖拽的方式搭建业务数据处理流程,提供透明化数据处理网格服务。同时,结合了智能体技术,让数据消费者可以采用对话输入的方式,实现对数据网格的自动化、智能化搭建,满足在不同业务场景下对各类数据进行格式转换、数据提取、数据加工、数据分析和汇总统计等操作需求,有效解决“数据融合处理难”问题。

数据网格按需搭建

(4)智能数据目录
提供智能数据目录服务,在对数据资源进行主动元数据理解的基础上,依据生成的业务知识图谱,系统支持根据应用场景进行智能编目,降低业务用户编排并维护业务资产目录的成本,提高用户的用数效率。系统同时支持以对话的形式对智能目录进行修改完善,协助用户在用数过程中快速定位到所需数据以及即时生产新数据,提供对业务用户友好的支撑能力。

智能数据目录

02

建设数实共生的三维数据孪生底座

随着三维数据的可视化技术已经逐渐成为人们认知世界最自然的方式,行业应用对三维的需求也日益明显和加剧。数慧时空同步推出了基于数字孪生技术的三维数据底座平台,在数据处理、场景整合、云服务发布、数据共享、二三维可视化、编辑、跨平台二次开发、行业应用等方面,为用户提供从原始数据到最终三维呈现的无插件、跨平台、跨浏览器的完整解决方案。具备以下技术特点:

(1)支持丰富的三维数据类型
除了支持常见的三维模型格式外,还扩充支持了地下管线、地质体、激光点云模型的构建等能力。

(2) 三维模型轻量化能力
支持更高效的符号渲染技术,对3DTiles瓦片进行更新与检查,支持对纹理进行压缩。

(3) 三维场景展示能力增强
三维空间数据场景展示能力补齐,新增分屏展示、 ArcGIS 的矢量瓦片数据服务、Esri-I3S 的 OGC 三维标准数据服务接入。

(4) 云渲染三维场景构建
以程序化和参数化自动建模的方法,实现孪生模型的半自动化构建;通过将孪生模型与 GIS 应用相结合,高度提炼云渲染 API 接口;最终达到快速构建大规模城市三维场景的目标。

三维场景构建


01

应用全生命周期管理

随着云计算、大数据、5G等新技术加速创新,信息化系统的使用也越来越多,业务种类不断增多且复杂程度快速攀升。数慧时空搭建了云原生管理平台,支持各类业务系统统一上云部署和应用,平台对应用全生命周期进行监控和调度,持续保障业务的稳定性和使用效率。具备以下技术优势:


(1)提供了统一平台进行协作办公
平台提供统一的集成化环境,覆盖从代码提交到部署上线的每一个环节。支持开发者、测试人员、运维人员等在这个平台上进行高效的协作。

(2) DevOps支持
通过内置的Jenkins等工具,平台使得构建、测试和部署过程自动化变得简单。用户可以通过图形界面轻松配置CI/CD流水线。

(3) 微服务治理
平台支持多种微服务框架,提供包括服务网格在内的高级流量管理功能,如灰度发布、蓝绿部署等,帮助团队更灵活地控制应用程序的行为。

(4) 可观测性
提供强大的监控能力,可以实时查看集群、节点、容器和服务的状态。并且可以根据监控指标设置自定义告警规则。支持对应用日志进行集中管理,方便用户快速定位问题根源。结合Jaeger等工具,为用户提供分布式追踪能力,有助于理解复杂系统内部的工作流程。

(5) 资源管理与调度优化

平台可以帮助企业更好地管理计算资源,确保关键应用得到必要的资源保障,同时提高资源利用率。

02

组件库、模板市场和生态体系持续丰富

数慧时空低代码平台通过建立标准化的组件开发规范,实现组件库统一设计、规范接入、高效复用和持续优化,从而沉淀形成标准化的组件库和模板市场。同时,引入了云部署与容器编排技术,构建了高效、稳定且可持续的生态体系。


(1) 打造标准化行业组件库,赋能多领域高效开发
通过建立低代码行业组件库,满足自然资源、应急管理、农业农村等不同行业多元化的应用开发需求。传统的组件开发方式需要开发人员根据项目需求从头编写代码,编码、测试、部署的周期较长,可复用性较低,且出现缺陷的几率较大;而通过建立行业组件库,基于各大行业中的业务应用场景设计和封装可复用的组件,能够具有更高的稳定性、可靠性和可复用价值。

(2) 构建多元化模板市场,驱动业务快速构建与高效复用
数慧时空低代码平台采用模块化设计与场景化开发相结合的方式,提供丰富的模板资源,涵盖业务场景模板、组件模板和流程模板等多种类型。同时,模板市场基于功能分类提供大屏、报表、流程表单、台账、门户等多样化模板,满足不同应用的开发需求。

(3) 支持组件可扩展
低代码平台支持业务开发人员根据自身需求扩展开发业务组件,并通过平台提供的标准化接入机制将组件“安装”至低代码平台中供构建使用。平台提供组件注册、版本管理和权限控制等能力,确保组件在开发、测试和使用全流程中的安全性与稳定性。

03

智能工具

为落实《自然资源数字化治理能力提升总体方案》,助力构建开放数字生态体系,数慧时空积极开展智能工具建设,制定众筹工具技术标准用于指导工具设计和开发,同时开发了一批智能工具,包括基础算法和模型、数据治理、空间分析等通用工具,以及智能审查审批、公共服务数字化和自然资源决策支持等专用工具等共计20余个。这些工具结合在自然资源部、新疆生产建设兵团、甘肃省自然资源厅和江西省自然资源厅等各地实际业务需求,按照技术要求进行剥离改造,目前已经注册到自然资源部众筹工具中心,可方便各地自然资源用户进行使用。


04

智能BI

传统的商业智能(BI)依赖于数仓建设及指标设计,需要较长的响应周期以及高昂的成本,同时灵活性不足,难以满足客户即时调整需求。数慧时空打造了一款对话式智能BI工具,通过直观的问答对话界面,客户只需以自然语言的形式发出数据需求,系统进行智能理解,自动查找数据并呈现最合适的可视化图表,为客户开启便捷的数据问答之旅。


对话式智能BI

在当今数字化快速发展的背景下,加强推进国产软硬件的适配已成为推动信息技术应用创新(信创)产业智能化转型的关键。数慧时空积极响应国家关于推进信息技术应用创新(信创)产业智能化转型的号召,致力于国产软硬件适配的工作。通过一系列技术应对措施,我司产品在操作系统、数据库以及中间件适配等关键领域取得了显著进展。

(1) 操作系统适配方面,公司多款产品已成功完成了与国内主流操作系统的兼容性测试,如麒麟OS和统信UOS。

(2) 数据库层面,针对瀚高、人大金仓、达梦等国产数据库进行了适配改造,实现了高效的数据管理和处理能力。

(3) 中间件层面,与东方通、金蝶、普元等国内领先企业合作,确保了中间件产品的无缝集成,进一步提升了系统整体性能和安全性。

2024年,上述国产化适配工作已经在自然资源部、宁夏、新疆、甘肃、内蒙、山东、广东、青岛德州等部、省、市三级展开项目实践推广,并通过各地客户的检验,取得了较好的应用效果。


结语

























2025年,数慧时空将继续以AI为创新引擎,以业务为核心驱动,持续夯实数据基础设施,通过高速互联、高效调度、可信流通、安全可靠的体系化能力,持续赋能各行业数据融合与智能化发展,为数字未来的美好蓝图添砖加瓦。



往期回顾








【声明】内容源于网络
0
0
数慧云脑
自然资源领域标准制定的参与者、数据质量的把关者、信息工程的承担者,多年来坚持新技术研发投入和行业业务研究,不断为自然资源“业务数据化、数据业务化”提供最佳实践。
内容 71
粉丝 0
数慧云脑 自然资源领域标准制定的参与者、数据质量的把关者、信息工程的承担者,多年来坚持新技术研发投入和行业业务研究,不断为自然资源“业务数据化、数据业务化”提供最佳实践。
总阅读21
粉丝0
内容71