导语
在数字化转型的背景下,数字化思维成为推动业务发展的新引擎。数据,作为核心生产要素,在新质生产力的范畴内占据至关重要的地位。电网企业已建成两级数据中台和两级数据目录体系,初步实现数据汇聚和共享,但在面向实际业务应用需求中,多数基层人员无法直接看懂系统中的数据表、字段信息,无法了解跨专业业务与数据的关联关系,难以定位不同系统中的数据等问题。
随着电网业务发展以及创新要求,传统以数据关系进行管理等方式,数据可读性很差,越来越难以满足基层管理及业务人员对数据查询以及跨专业关联性挖掘分析的需求。
本文建立数据业务的关联映射关系,基于知识图谱技术形成数据一张图,探索创新应用场景,提供基于业务语义的数据应用方式,实现基层人员便捷查找数据、看懂数据、用好数据,提升中台数据业务化能力,进一步提升取数用数效率,辅助基层自主开展数据探索,提高业务效率,支撑各类跨专业创新应用、提质增效等,促进数字技术与实体经济深度融合。
业务现状和背景
随着新型电力系统建设和电力体制改革快速推进,数字技术发展迅猛,电网企业创新业务层出不穷,同时电网业务系统繁多,数据量庞大,整合应用却异常困难。基层员工及数据运营人员面临较多取数、用数痛点,具体如下:
(一)基层业务人员找数难
电网企业业务条线繁多,信息系统较多,数据分布在不同部门、不同专业,由不同厂商负责承建,当前部门间异构、孤立的数据体系缺乏统一视图,基层员工很难寻找到跨部门、跨专业完整、一致的数据;由于系统权限、跨平台人工查找跨系统数据效率很低,比如办电环节涉及工程一体化、物资、调度等系统各类数据,客户经理无法查询、获取不同环节数据情况,影响客户服务满意度。
(二)业务人员看不懂数据
传统从数据视角开展的资源目录建设,缺乏业务含义和逻辑信息的支撑,业务人员往往无法直观理解数据表、字段的业务含义和用途,导致业务人员看不懂数据,无法掌握业务与数据映射关系,更无法自主开展业务数据分析,查找潜在问题,阻碍业务协同创新发展,比如业务人员想自主分析不同环节时长,查找原因,提高业务处理效率,但连受理环节涉及具体哪一张表、具体数据字段以及关联关系都不清楚,看不懂一堆英文表与字段信息,无法开展业务数据分析工作。
整体设计思路
本文通过厘清各业务间的业务关系及业务与数据关系,按业务环节形成标准化业务链路,开展业务与数据表关系、表结构及表间关联关系、系统菜单功能点与表间关系等,建立数据与业务的关联,形成业务、数据链路。
依托知识图谱,将业务数据链路转化为数据业务“一张图”,以此帮助相关人员快速了解业务间关系,以及精准查找、定位业务关联的数据内容,最终实现让业务人员看清关系、理解数据的目标;
在此基础上,创新设计图谱应用场景:通过知识图谱、自然语言处理等技术,实现数据关系可视、智能检索、自助分析、问答等功能。这使得用户能根据任意关键字检索、咨询到所需的数据记录及关联内容,既提升了获取数据的能力与效率,也支持用户自主开展数据分析应用探索,从而让数据真正服务于基层人员,辅助业务分析与数据决策,推动跨业务发展和协同创新能力的提升。
图1 整体解决思路框架图过程
设计实现过程
营销领域作为电网公司市场前沿,具有业务覆盖广、数据关联复杂、沉淀数据丰富等特征,具备数据业务化潜能,且跨部门跨系统数据融合场景多、业务数据扩展性强。因此,以业扩报装为试点,构建低压业扩业务链路上的 “实体 - 关系 - 实体” 图谱模型,实现数据业务化呈现及轻量应用,辅助基层数据探索、业务监测分析,提升客户满意度。
(一)业务数据环节梳理
在本环节,根据电网企业相关业扩报装管理规则、电力营销业务应用系统业务流程以及营销业务应用系统数据库,提取低压业扩业务环节流程和低压业扩关联数据库表清单。
首先,通过自然语言解析管理规则文本,提取低压业扩报装环节及其对应的表单信息;其次,借助网页解析技术,从电力营销业务应用系统业务流程中提取低压业扩流程;此外,从电力营销业务应用系统数据库中获取宽表和字段信息。对于抽取到的多源知识,经过业务专家确认和运维专家界定后,进行统一整合。
图2 业务数据环节梳理
本阶段梳理低压业扩流程环节和库表字段明细,具体的业务环节与数据情况如下:
图3 低压业扩关键环节图
图4 低压数据表情况(示例)
(二)业务数据链路设计
通过业务数据环节梳理后,按照统一模板对各环节数据和表进行完整溯源与镜像映射。具体而言,全面梳理分析并对应低压业扩业务子类的业务流程、业务环节节点,以及部分业务功能所涉及的数据表、数据表关联关系和数据字段等,从而明确业务环节和数据之间的关联关系。
图5 业务数据链路溯源模板
依托已梳理的低压业扩业务链路,通过数模、专家经验、业务指引查询等方式,将业务节点与数据表之间的映射关系进行建模,形成业务与数据表的映射关系,为后续业务人员理解、使用数据奠定基础。以计量方案编制环节为例,根据业务指引,该环节共记录或修改采集点方案、计量点方案两个表单,由此,计量方案编制环节关联采集点方案、计量点方案两个数据表。通过中台数据溯源,在数据中台找到2个关联宽表,包含93个表字段。
如下图所示低压业扩业务共计11个环节,19条关键业务记录数据:
图6 业务数据关联图
(三)业务数据图谱构建
在完成业务数据链路的梳理之后,需要采用一种标准化的技术框架来存储这些链路信息,以便实现数据的可视化展示,并为后续的各类应用扩展同支持。鉴于业务和数据之间存在的密切“关联性”,构建“知识图谱”是一种合适的方法。
知识图谱本质上是一种语义网络,是基于图的数据结构,数据结构包括实体、关系、属性三个要素。构建过程通常被称为实体抽取、关系抽取和属性抽取。
表1 基本图数据结构要素
低压业扩业务数据图谱,主要抽取方法如下:
实体抽取:抽取具体的业务或数据对象。本示例将业扩流程中的环节定义为概念实体,包括用电申请、现场勘察等11个业务环节,作为11个概念实体存储;将业扩流程中产生的具体业务记录定义为数据实体,包括业务数据链路中用申请记录、用户档案记录等19个数据记录,存储为19个数据实体。
图7 实体抽取基本过程
关系抽取:抽取实体关系。本示例将业务环节流程定义为业务流程关系(概念实体→概念实体,在实际环境中可以根据需要进一步细化,如流程下发、关联工程等),用于表示具体业务过程(有向),例如用电申请指向现场勘察,表示业务的先后顺序;将业务环节关联数据表为定义为数据关联关系(概念实体→数据实体),表示具体业务过程涉及记录表(无向),例如计量方案编制指向采集点方案、计量点方案,表示计量方案产生采集点方案、计量点方案的业务记录。
图8 关系抽取基本过程
属性抽取:抽取实体和关系的属性。在概念实体属性方面,包括实体类型、流程定义、一般用时、主责部门等,如用电申请记录属性有关联业务岗位、业务部门等;数据实体属性方面,包括表英文名、所在库、字段等,如用电申请记录属性有宽表英文名、包含字段、主键字段等。关系属性主要为关系类型(业务流程关系、数据关联关系),如用电申请与现场勘察之间的关系为业务下发。
图9 属性抽取基本过程
在完成图谱数据映射后,本文将业务数据链路转化为一种图范式的数据结构,该结构通过实体、关系两个数据表,完整映射了实体、关系、属性的完整图谱数据。
图10 图谱数据基本样式表
业务数据图谱应用
形成基本图关系数据后,融合知识图谱、搜索引擎、BI、大模型等技术,实现关系可视、智能检索、问答系统、智能推荐、自助分析等功能场景应用,为用户提供清晰的业务与数据关系探查、便捷的数据关联查询检索获取、自助式的数据创建等服务能力。具体如下所示:
图11 图谱应用典型应用
(一)关系可视
通过图数据库(Neo4j)存储基本数据链路关系,构建低压业扩业务数据图谱浏览的web应用服务。构建后,可直观地查看各专业主线业务描述、跨专业间业务关联关系,实现图谱与业务链路联动。点击业务链路节点图标,会联动展示该节点下的模型,展示信息包括上下级节点、属性字段等,帮助基层和中台运维人员更好地理解数据的含义与业务的需求,将数据应用于业务分析和决策支持。
例如,营业员在图谱中输入客户的身份信息,图谱会立即展示与该客户相关的所有数据和业务流程。通过点击图谱中的节点或关系,能够快速定位到所在业务环节、字段信息(如用电需求、施工计划等数据),有助于及时发现和解决业务流程中的瓶颈问题,提高客户满意度。
图12 低压业扩数据可视示例
(二)智能检索
通过自然语言处理等技术开发智能检索工具,面向业务语义提供一键式精准搜索,使用户能够根据特定的业务需求和关键词搜索相关的数据以及关联的数据内容。比如业务人员通过输入具体业务环节(如供电方案编制),平台会自动检索出对应的数据表、字段记录信息,支撑导出目标用户在供电方案编制环节中涉及的数据信息(包括供电方案编制开始、结束时间等),从而提高数据获取与检索效率。
图13 低压业扩数据检索示例
(三)自助分析
基于业务数据关联关系,结合业务计算规则等,为业务人员、基层班组等用户自由选择所需数据字段的功能,支持按不同电压等级、日期、业务环节、供电公司等进行多维透视分析,输出业扩流程监测分析结果,以优化业务决策,释放数据价值。例如工单归档后,大客户经理可自主开展不同环节时长分析,推算接电工程合理工期,这有助于及时发现和解决业务流程中的瓶颈问题,缩短接电时间,辅助业务提升。
图14 低压业扩数据自助分析示例
(四)智能问答
结合大模型语义分析、多轮对话等能力,实现业务数据关系智能提取、AI 生成式精准搜索、对话式智能问答服务、数据场景化智能推荐等智能应用。用户通过提问可获取准确的业务数据含义,探索和发现数据之间的关系与模式。系统能根据用户的问题进行语义匹配和推理,为用户提供更便捷、个性化的数据查询体验和解释功能,并给出针对性的业务优化建议。比如,营销人员通过问答机器人询问办电业务中营销、物资、调度的业务现状及数据异常情况,机器人会告知异常可能原因,并结合历史数据给出提升建议,从而提高基层对数据业务的理解和工作效率。
结语
本文从基层实际痛点与需求出发,通过梳理数据和业务之间的关系,构建业务数据图谱。以营销低压业扩为例,厘清数据表间以及数据与业务的关系脉络,结合图谱三元组“实体-关系-实体”关系表达模式,完成数据业务图谱模型呈现,实现从数据出发理解业务,从业务出发理解数据的双向贯通。
同时,探索智能检索、智能问答、自助分析等后续应用场景,以此降低取数、用数的门槛,进一步提升基层员工数据与业务之间的理解能力和应用水平,特别是在跨专业、跨领域数据挖掘场景探索上,让数据更好地服务基层、赋能业务,辅助业务创新优化与提升,为数字化转型提供有力支撑。
审核:王平喜
作者:陈冬冬、杨扬
部门:朗新科技集团咨询业务部
END

