大数跨境
0
0

中国工商银行:知识图谱技术在信贷领域的应用

中国工商银行:知识图谱技术在信贷领域的应用 InfoQ数字化经纬
2024-06-12
1
导读:工行软开中心运用知识图谱技术助力银行在信贷领域达成战略目标。

作者 | 中国工商银行软件开发中心

当前,金融业正经历从“互联网 +”到“智能 +”的跃变,催化银行信息服务向智能化方向发展。知识图谱技术作为人工智能领域的重要研究方向,在信贷、普惠等业务领域的海量数据挖掘与关联分析有良好的应用前景。中国工商银行软件开发中心(以下简称“工行软开中心”)整合行内外数据与信息,运用知识图谱技术打造面向信贷全流程的数据处理与知识挖掘服务,提升信贷运营精细化、智能化水平,为银行风险防控、营销拓客等业务提供决策支持,助力银行在信贷领域达成战略目标。
现状和难点

信贷流程中存在客户数据维度多、分散且依赖人工收集,信息检索自动化程度和智能化能力不足,深度的数据与信息分析依靠专家经验,无法普及,影响整体的信贷风险决策水平。针对上述问题,工行软开中心在信贷领域引入知识图谱技术,通过整合客户风险交易数据、客户关联关系等数据,构建客户风险图谱与客户关系图谱,取得以下两方面业务成效:

1、降低信贷风险:通过对借款人的社交关系、资金流水、财务状况等多维度信息的分析,利用知识图谱技术构建风险控制模型,自动识别信贷流程中的欺诈行为、高风险交易等异常情况,降低信贷全流程风险。

2、提高营销获客效率:运用知识图谱图关联分析算法,在海量数据中挖掘潜在营销客户,结合客户画像数据,精准输出价值客户清单,极大减少人工营销过程,为业务获客活客黏客提供便捷。本文实践过程分为知识图谱能力建设与信贷领域知识挖掘两大步骤,其中知识图谱能力建设为信贷领域知识挖掘的前置条件,通过打造标准化知识图谱能力,构建流水线式的图谱应用,帮助高效快速地进行场景化知识挖掘。而信贷领域知识挖掘包含风险防控与精准营销两大场景应用,本文重点阐述其实现路径与算法挖掘过程。

知识图谱能力建设

知识图谱是一种语义网络,它以图的形式描述客观世界中的实体及其关联关系,以更贴近人类认知的视角将信息对外表达。通过知识图谱,我们可以从海量的非结构化数据中快速精准地提取价值信息,帮助我们更好地理解数据背后的逻辑与业务模式。

工欲善其事必先利其器,工行软开中心打造了标准化流程的知识图谱构建能力,包含数据加工提取知识抽取映射图谱查询推理三大步骤,赋能研发人员快速构建信贷领域场景化图谱应用。其中数据加工提取是数据采集、整合、加工的过程,需要从多个数据源采集相关数据,包括但不限于内部积累的业务数据、授权公开的征信数据、以及业务关系中分析出的社交属性数据等,通过标准化数据入湖操作后,为图谱分析需要的原始湖表数据提供前置条件。

知识抽取映射是知识图谱构建的核心步骤,将结构化、非结构化数据文件加工转换为图结构所需要的实体、关系文件,并将图 Schema 与实体关系文件进行映射的过程,其基本组成单元是“实体 - 属性 - 实体”三元组,实体间通过关系相互联结,构成网状的知识结构。

图谱查询推理是基于构建好的知识图谱,通过查询语言(如 Gremlin)可以查询特定实体的属性、关系以及实体间的关联信息。利用丰富的图算法实现知识推理与知识挖掘,包含基础图分析算法如社区发现、标签传播、PageRank、环路识别等,以及图神经网络算法如 GCN(图卷积神经网络)、GAT(图注意力网络)等;基于图神经网络的强大模式识别能力,分析借款人的社交网络、交易网络、信用网络等,有效识别潜在欺诈团伙或高风险客群;同时分析客户的消费行为、偏好或需求,挖掘潜在价值客户,提供个性化的产品服务。

信贷领域知识挖掘

工行软开中心基于标准化的知识图谱服务能力,结合信贷全流程场景,打造面向信贷全流程的数据处理与知识挖掘服务。以风控领域知识挖掘为例,通过整合客户事实数据,从风险源认定、定量定性衡量、传播路径输出服务四步骤,构建信贷领域风险知识全景视图。

在降低信贷风险方面,工行软开中心整合客户资金交易、票据背书、担保抵押、融资行为等数据,从资金饥渴风险贷款资金归集风险虚增流水风险 3 方面构建图谱模型。利用卷积图神经网络算法、egonet 算法,生成客户图谱风险因子,并将风险因子反馈至风险客户图谱。利用知识图谱社区发现、标签传播、环路识别算法,在征信报告未体现的小贷、消金业务中,挖掘出客户与融资机构的频繁融资、高额借贷等行为。快速识别风险交易链条,找出涉诈涉黑用户,并生成客户预警清单,在贷前、贷中、贷后提供决策预警,为客户经理实施授信冻结、贷款追回等风险缓释措施提供有力支撑。

在提高营销获客效率方面,工行软开中心整合行内外企业工商关系、股东关系、投资关系、押品关系、合同关系、票据背书关系、资金关系、自然人关系等大规模复杂关系网络,构建企业信贷领域关系图谱。在深层次隐性关联关系挖掘过程中,利用知识图谱 PageRank、K 层扩展、最短路径等图算法,支持企业多维度数据穿透式分析与关系探查,输出重要关联企业到目标企业的最短营销路径,自动生成潜客营销清单,为企业客户的管理和洞察提供有效数据支撑。同时在企业关系图谱服务端,抽象出配置化的探查服务能力,用户可以自主定义新接入的关系模型,完成实体 - 属性 - 边的配置,敏捷化上线新的企业关联探查服务,快速响应业务精准化营销的需求。

此外工行软开中心积极探索与建设产业链图谱,融合产业链上下游企业工商信息、信用信息、财报信息、担保信息、舆情信息、行情信息等;基于产业链的上中下游各个环节、对应的企业、地域分布等情况,结合企业评分、产品与公司关联度、产业布局深度等对企业进行分层,通过产业链图谱筛选优质企业,助力行内潜客挖掘营销。

总结和展望

知识图谱技术在银行信贷领域的应用具有重要的意义,通过应用知识图谱,银行可以更加全面、准确地评估借款人的信用状况和风险水平,提高信贷评估的准确性和效率。未来,工行软开中心将探索大模型与知识图谱融合,利用大模型强大的语义分析和理解能力,替换图谱构建中人工成本较高的实体挖掘、关系抽取等步骤。随着技术的不断进步,知识图谱将在银行信贷领域发挥更大的作用,推动金融行业的持续创新和发展。

专题征稿启事

InfoQ 数字化经纬正策划一项专题《央国企数智化转型与创新》,希望通过本专题,探讨央国企的数智化转型现状、挑战和路径,寻找变革路上的成功案例,为数字经济下的产业焕新提供样本参考,为未来智能产业发展探寻路径。

我们欢迎相关企业实践案例的投稿,或是希望接受我们采访的企业与个人主动联系我们


 内容推荐
《行知数字中国 - 数字化践行者年度力量榜特刊(第一期)》汇集了 2023 年在数字化转型中取得显著成果的标杆案例,涵盖企业、团队、个人三大维度,提供针对性的策略和实操指南,助力各行业深入理解并应用最新的数字化实践。关注「InfoQ 数字化经纬」公众号,回复「特刊」可免费下载。

 企业福利
极客时间数字化人才培养认证项目共设 15 个岗位,分为初、中、高三个等级,覆盖数字化及人工智能人才所需的主要技能方向,满足人才技能升级和适应产业发展需求,通过测评后可获得工信部颁发的《工业和信息化人才能力提升证书》,扫码添加小助手,回复「认证」可免费咨询并获得产品手册,一个锦囊、一个助力数字化人才培养的妙策!

 福利通道

  • 关注InfoQ数字化经纬公众号,回复案例领取 《行知数字中国数字化转型案例集锦》。
  • 关注InfoQ数字化经纬公众号,回复进群加入数字化读者群交流。
  • 关注InfoQ数字化经纬公众号,回复抽奖可以参与本周活动,有机会获得精美礼品。

今日好文推荐

企业该如何应对 AI 人才缺失的危机?

在这里,一起见证 AI 时代的数智化跃迁

可以借鉴、不能照搬,国央企数字化转型寻求“千企千面”

TCL 实业推动数智化转型:不仅输出产品,更注重能力的提升

AI 时代的人力资源战略转型:香港中华煤气的实践分享

【声明】内容源于网络
0
0
InfoQ数字化经纬
InfoQ极客传媒旗下官方账号。面向数字化管理者、从业者、洞察者,提供数字化企业案例、政策解读、研究报告,做数字时代的「记录者」。
内容 302
粉丝 0
InfoQ数字化经纬 InfoQ极客传媒旗下官方账号。面向数字化管理者、从业者、洞察者,提供数字化企业案例、政策解读、研究报告,做数字时代的「记录者」。
总阅读0
粉丝0
内容302