
数据的归集往往能够产生更大的价值,但难点在于归集之后,不同业务部门如何进行高效的取用。
在一些银行内部,正在构建一个通用的图数据库系统——“全行一张图”,通过系统性的建设图谱,提升整体图谱的应用能力,仅需提供一个统一的图数据服务窗口,就能对接不同业务部门的个性化需求。这不仅能够支持银行深度挖数据价值、沉淀数据资产,还可以促进跨团队的协同、减少同质知识图谱的重复建设、提高数据分析的效率、降低过去数据过分暴露而带来的数据安全问题。
近日,由厦门市地方金融监督管理局、人民银行厦门市中心支行、厦门银保监局、厦门证监局、两岸金融中心片区指挥部指导,厦门国际银行、厦门市地方金融协会与华为技术有限公司联合主办的2022第二届“厦门国际银行杯”厦门金融科技创新创业大赛决赛在厦举行。海致星图的“全行一张图--金融知识图谱数据仓库解决方案”摘得最佳主题创新奖。

据悉,本次大赛从4月份开始总共汇集全国70余支队伍参赛,经过海选、初赛、决赛三个环节进行评审。在决赛中,17名专家评审与29名大众评审从科技应用程度、创新性、应用前景、完整性及可落地性四个维度对参赛项目进行评审,经评审团队充分讨论和现场打分,海致星图获得了第二名,摘得“最佳主题创新奖”。
“全行一张图”指的是以图数据库的形式来管理、应用多源异构数据构建成的知识图谱,依托数据之间的关联关系,通过知识推理深层次挖掘数据的价值,提供更精准的个性化搜索、更直观的赋能业务场景应用,通过系统性的建设图谱,提升整体图谱的应用能力。
组委会在给海致星图的获奖评语中表示:“全行一张图-金融知识图谱数据仓库解决方案”是在总结银行同业近年来知识图谱项目建设经验基础上提出的全新概念和一个金融科技基础设施组建体系。
在大数据运算中,「数据量越多,模型表现就越好」是大家公认的规律,因为大的数据量可以避免个体差异所带来的偏差,数据归集的价值不言而喻。
过去,大数据计算越来越呈现出“量大质小”的现象,虽然“量”有了指数级别暴增,但数据之间缺乏关联,在对事务进行描述的时候会丢失关键的信息,导致大规模数据量的计算、查询和存储都变得低效且复杂,因此,在大数据时代很难建立一个统一的数据库同时去满足不同部门的需求,数据仍然以不同的结构、不同的模态被存储在不同的业务部门,不能被归集,不能被共享,不能被深度挖掘,更不能沉淀为企业真正的资产。
知识图谱技术提供了更好的解决方案,图模型可以建立数据之间的关联关系,点(数据实体)和边(数据关系)相连的形式交织成为一张巨大的数据网络,直观且清晰,人们可以从任意的点、边切入进行自由灵活的计算,数据也不会再因为过去固定的二维列表式的存储方式而产生信息的丢失或者冗余,跨部门的数据调用和共享也不需要进行模型转换和妥协。
图模型更加接近我们大脑中的事实模型,更容易为业务人员所理解。因此知识图谱一进入金融领域便发展迅速,在银行业,先后经历了“单个业务的应用试点--部门级的知识图谱--全行级的知识图谱--全行一张图”四个阶段,也完成了从技术应用层向基础软件产品层替代的全面发展。
“全行一张图”够起到对图数据“全生命周期管理”的核心作用,包含数据接入管理、加工管控、存储管理、对外服务等全流程,服务包含自主建模、数据服务、可视化服务和应用市集等综合的能力,其创新性还表现在:
技术分层:
“全行一张图”创新性提出了图数据三层架构,建设了应用图谱、领域图谱和图数据库,去满足不同的场景下截然不同的技术要求和建模要求;
统一标注:
设计了一套《金融知识图谱数据仓库-数据建模规范》、《金融知识图谱数据仓库-数据实施工艺》;
生态建设:
完成了从企业架构角度设计知识图谱的各种配套组件(图分析组件、图本体构建组件、图挖掘组件等),并率先实现全行图生态的可行性建设;
统一窗口:
建设开发了图数据库管理系统软件,进行统一的图谱数据应用,实现了跨团队的协同工作管理和直观的图数据资产分析统一窗口。
“全行一张图”的解决方案已经在一些银行进行了落地实践,在某国有大型银行的落地应用中,从数据服务和业务流程上进行了图谱项目建设的优化工作,服务于交易图谱、集团派系图谱等典型应用。
数据是从不同维度对世界的描述,而这些描述之间千丝万缕的联系才是世界真实存在的形态,图数据之间有意义的联系,是数据应用价值的关键,是使大数据成为宝藏的根本原因,海致星图将依托成熟的知识图谱技术,助力更多企业深挖数据价值,沉淀数据资产。