知识就是力量。——[英]弗兰西斯·培根
随着互联网特别是移动互联网的爆发式发展,全球数据量以几何级数增长。金融行业的数据增长量也十分惊人,据统计,国内大型商业银行和保险公司的数据量已经达到100TB以上,每年产生的结构化数据超过5PB,非结构化数据超过15PB。BCG曾有报告指出,银行业每创收100万美元,平均就会产生820GB的数据。
尽管人类的大脑是有着惊人的860亿个神经元的家园,但数据的增长速度已经远远超过了人类的理解和分析速度,大量数据静静地散落各处。
如何将这如同一盘散沙的数据,转化为知识甚至智慧为人类所用?以知识图谱技术为底层的人工智能,为海量数据应用带来了新的曙光。
从数据到信息,从信息到知识,从知识到智慧
如同人类大脑的认知过程:每个细胞织带在每个可能的方向都有几个连接,形成了一个超级巨大的蜂窝网络,无时不刻不在存储和处理各种信息,以此形成了我们的思想和意识,机器的认知过程同样遵循从数据到信息、从信息到知识、从知识到智慧的过程。
数据是知识阶层中最底层也是最基础的一个概念。数字、文字、图片、视频、音频等等都是数据。当数据被存储在“关系数据库”中时,天然地彼此之间并没有关系,除非赋予它们关系,而这种赋予给数据之间的“关系”,就是在建立数据之间的“连接”,如果一组或者一连串的“连接”是正确的,那么数据就生成了“信息”。
从1948年信息论创始人C.E.香农在研究广义通信系统理论时把信息定义为信源的不定度的代表性说法开始,到90年代,关于信息的定义不下百种,其中经典的定义是:信息是有一定含义的、经过加工处理的、对决策有价值的数据,即信息=数据+处理。
作为比数据、信息更高阶的“知识”又该怎么定义呢?西方20世纪60年代以来一直流行的说法是,知识就是知道是什么(Know-what)、知道为什么(Know-why)、知道怎么做(Know-how)、知道是谁(Know-who),概括为“知识的4个W”。人们通过对信息进行归纳、演绎、比较等操作,将信息中最具价值的部分沉淀了下来,为决策提供参考依据,并经过广泛深入地实践检验,成为了个人的信念和判断取向之后就成为了知识。
智慧是以知识为根基的,加上个人的运用能力、综合判断、创造力及实践能力来创造价值。智慧可以说是基于知识基础上的一种判断、谋略或行动。专家与大家有何不同?即专家能够基于更大量的知识基础作出更准确的判断或谋略。
知识图谱将数据整合成知识大厦
作为知识工程的分支之一,知识图谱在大数据的推动下收到了业界的广泛关注。
知识图谱本质上是语义网络,是一种基于图的数据结构,由节点和边组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。
通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。
知识图谱将复杂的知识通过数据挖掘、信息处理、知识计量和图形绘制等一系列方式表现出来,揭示了知识领域的动态发展规律,知识图谱提供了从“关系”的角度去分析问题的能力,让机器也能够像人一样理解世界,获取知识,再去做决策和行动。
运用知识图谱推进智能金融建设
目前,大多金融机构对于数据的应用处于“从信息到知识”的阶段,而知识图谱善于从信息中发掘和构建深度的关联,使得信息知识化,进一步提供更加智慧的决策支持。
在金融领域,建立知识图谱可分为几个步骤:
(1)从金融机构内部结构化数据、非结构化数据以及互联网采集数据、第三方合作数据中辨别金融实体;
(2)定义并挖掘金融实体间的各种关系,如企业与企业之间的集团关系、投资关系、上下游关系、担保关系,企业与个人之间的任职、实际控制、一致行动关系,从而生成知识图谱;
(3)定义并表达业务逻辑,在知识图谱构建的知识大厦中,可以实现各种具体任务,如企业股权关系、一致行动人、实际控制人等挖掘、担保圈、担保链、担保群挖掘、疑似欺诈交易发现及欺诈团伙追踪发现等,及时进行商机的发现和风险传导的识别。
知识图谱突破了现有的关系型数据库的限制,在金融行业中释放数据的价值。
举例知识图谱在金融领域的三大应用场景:
风控:当某一企业发生了风险事件,金融机构可以通过知识图谱及时预测未来有潜在风险的关联企业,从而可对相关企业的风险做出预判,尽早地发现并规避风险。
精准营销:基于现有VIP客户,挖掘相关联系人及其爱好,或在现有客户中去发现具有共同爱好的一个组织,从而可以有针对性地对某一部分或一类人群制定营销策略,提升营销的精准性和有效性。
反欺诈:通过对用户数据的采集和分析,建立企业级客户在资金链、法人、上下游投资、相似企业业务等关系上的知识图谱,挖掘出欺诈者数据的矛盾点和可疑点,从而识别、预防欺诈事件的发生。
知识图谱技术拓宽了包括商业银行在内的金融机构分析问题、挖掘知识的能力,正如海致金融业务副总裁杨娟所说:“商业银行正面临着大数据应用带来的巨大挑战和机会。作为人工智能的基础性技术,知识图谱可以发掘大数据的价值,将信息整合成知识。商业银行正在步入‘知识图谱时代’”。
数据是信息的源泉,信息是知识的子集,知识是智慧的基础和条件。大数据实现了数据向信息的转化,知识图谱则实现了信息的知识化,结合深度学习等技术,为金融行业提供智慧,推动着智能金融的发展进程。
---------------------------------------
人工智能、大数据的前沿资讯
深度的商业内容解析
更 多 精 彩
请 先 关 注
⏬
海致网络技术(北京)有限公司是国内领先的大数据技术与服务公司,自成立以来为三千多家企业提供了知识图谱、智能营销、用户画像及智能运维等大数据技术及解决方案,并获得了 “2016年中国人工智能领军企业” 、“2017新智造成长榜金融大数据领域最佳投资价值奖”、“2017新智造成长榜-金融科技最佳创新企业”、德勤2017“中国明日之星”称号、2017年度人工智能产业最佳应用“新金融”奖。

