大数跨境
0
0

BBD技术控 | 从标准体系化架构解析知识图谱

BBD技术控 | 从标准体系化架构解析知识图谱 BBD Data
2019-12-25
0
导读:以标准体系化建设、架构的视角,重新审视知识图谱的技术与应用


文丨任渝博士  BBD大数据标准化研究中心主任 


任渝博士,BBD大数据标准化研究中心主任,领导公司新一代信息技术标准体系化建设工作,2018年成都市高层次创新创业人才“顶尖创新创业团队”成员之一。西南财经大学博士研究生,国家技术标准创新基地(贵州大数据)数字经济专业委员会主任。国际技术标准大数据精准扶贫总体组成员、IEEE P2807、P2807.1国际标准参与专家、《知识图谱标准化白皮书》参与编撰者。

新一代信息技术的标准化是助推包括人工智能、大数据、区块链和云计算在内的信息技术行业与实体经济融合的思维格局建设与制度支撑体系。信息技术的标准化是为适应数字经济领域中,宏微观主体在科学决策、协同监管与宏观监测等方面的政务、商务以及公众服务的发展形势中,以信息技术“格物”推高万物互联致知“认知”水平,不可逆的时代潮流。


知识图谱(KG),笔者将其定义为以图的逻辑表现物理世界与数字世界客观链接的实体以及之间关系的知识体系。


图1 知识图谱发展史(《知识图谱标准化白皮书》2019[1]


以标准体系化建设、架构的视角,重新审视知识图谱的技术与应用,在科技词汇充斥、冲击的当下,数字经济高质量发展诉求中,知识图谱从技术试验走向创新应用合规化、规模化推广的必要路径与实施机制设计。


01.

逻辑框架---标准体系化建设溯源


春阴垂野草青青,

时有幽花一树明。


EA[2]框架是立足业务、明确绩效目标,优化信息架构,确定必要技术规范的全息要素(业务、信息、技术和绩效评价)松耦合总体架构。


图2 主要EA框架的发展历程[3]


将EA框架用于标准体系化建设,是确保信息技术与数字经济、实体经济有机融合的应用场景中,标准体系化建设的顶层设计;是践行组织战略目标与信息化建设之间的系统性工程。


图3 基于EA框架的信息技术标准体系化设计逻辑框架


如何展开标准体系化整体架构的设计?相关利益者(Stakeholder)模型是一个常用的立足点与落脚处,如大数据技术架构的“提供者(数据、框架和应用)—协调者—消费者”基础模型[4],再将各大数据利益相关者所包含的知识域(技术、业务、应用)进行模块耦合和相互关系确定,就能够将多维度信息技术的标准架构转化为二维“瀑布式”(waterfall)标准体系结构。


图4 大数据商业生态与大数据利益相关者


因此,“信息技术 人工智能 知识图谱”的标准框架设计中,基于EA框架的相关利益者模型(如下图5)的知识图谱标准体系框架如下:

图5 基于利益相关者模型的知识图谱标准体系结构[5]


再以知识域全面展现的要素融合,将每个组成部分必要要件转化而来的“瀑布式”标准体系,在国际、国内大数据工程应用的支撑下,得到了广泛的认可,如下图6,所示。


图6 知识图谱标准体系框架示意图(《知识图谱标准化白皮书2019》)[6]


02.

业务架构---EA架构三要素之一


重剑无锋,

大巧不工。


“离开业务谈标准,无的放矢;离开标准谈业务,事倍功半”,信息技术领域的业务架构,通常是应用场景所隶属的行业领域,如电子政务、金融、医疗、教育等业务、场景反应出对信息化建设的需求,是知识图谱应用主题/行业领域的业务逻辑。


以金融科技为例,根据图4,置于金融科技的应用业务体系可得出BBD四大业务板块之一的金融科技知识图谱业务生态要素,如图7所示,


图7 金融科技的金融要素分布图[7]


结合金融主体与金融科技知识图谱的业务应用模块标准参考架构,如下图8,所示:


图8 金融科技知识图谱(KG)业务/应用架构标准框架模块


03. 

技术架构---EA架构三要素之二


“科学技术体系本身是一种现代社会组织……”


一般认为,EA框架中的技术架构是业务架构在技术层面的落实,也是信息架构在系统设计上的实现。另外,在考虑了绩效架构的基础上,技术架构同时要在技术层面落实绩效评价标准模块。应该说,技术架构是架构体系中“骨架的骨架”,决定了架构体系是否能够落地践行的充分必要架构要件。


 从知识图谱技术角度来看,主要技术包括知识获取、知识表示、知识存储、知识建模、知识融合、知识理解、知识运维[8]等七个方面。其中,以知识图谱实现的关键技术,知识存储为例:知识图谱的呈现方式是图,知识是结构化的数据,知识图谱的存储方式则分为了表结构与图结构,表结构与图结构继续分解为本体模型中的三元组(实体-属性-关系),表结构代表方式是关系型数据库存储,图结构代表方式资源描述框架(RDF),则可将知识图谱中基于知识存储技术的标准框架确定为如下图9所示:


图9 基于知识存储技术架构的知识图谱存储标准模块[9]


再看知识计算,作为知识图谱核心技术环节,从功能上区分为知识统计与图挖掘、知识推理两大部分。知识统计与图挖掘重点研究的是知识查询、指标统计和图挖掘;知识推理重点研究的是基于图谱的逻辑推理算法,主要包括基于符号的推理和基于统计的推理。知识统计与图挖掘的方法(技术)则包括了社区计算、相似子图计算、链接预测与不一致检测等;知识推理则根据既定知识图谱推测出新的三元组图谱。


值得注意的是,技术架构构造的标准体系化建设的架构基础,并不等同于标准体系化架构,如知识计算输出的知识指标统计与知识推理出的新三元组,在知识图谱的知识计算标准模块中,就得以“裁剪(Pruning)”,退化后的知识计算标准体系化模块,具体如下图10所示:


图10 知识图谱知识计算技术标准体系架构


04.

信息架构---EA架构三要素之三


世界是一切发生的事情


信息架构是在EA逻辑框架下,当前任何一个主题/行业应用场景中不可或缺的三要素组件之一;应用于知识图谱标准体系设计中,既是IEEE P2807《Framework of Knowledge Graph》工作小组的创新设计之一,也是承继了全国信标委大数据工作组对“数据提供者”角色[11]的定位与诠释。


图11 知识图谱Ecosystem Partner中数据/信息标准体系化模块[12]


知识图谱的图谱逻辑或图谱表现形式,基础仍然是结构化的信息与数据,数据提供者等同于任何一个大数据应用场景的数据提供者,信息架构的标准框架对应了“数据共享”机制,即来自于行业、应用领域的数据采集,经过元数据标准、数据采集目录等统一规范后,数据从数据供应者转入KG知识图谱提供者,实现了知识图谱Ecosystem Partner中Data Supplier 到KG Supplier的关联关系转变,二者之间以知识图谱相关利益者(Stakeholder)为实体对象的数据、服务、咨询、安全、监管等交付任务则构造为知识图谱Ecosystem Partner中Data Supplier的标准内容。


图12 知识图谱Ecosystem Partner中数据/信息所使用的标准内容


05.

绩效架构---最容易忽视的EA绩效评估逻辑


苔花如米小,

也学牡丹开。


标准体系化建设的实际工作中,绩效评估架构模块在EA架构中不受重视或容易被忽视的问题,使得信息化建设的效率、有效性评估存在事后特征,忽略了信息技术在业务体系中的全流程式有效性评估;以业务为基础的标准体系化建设,绩效评估理念的滞后性,进一步造成了标准体系化建设的完备性缺失。


在知识图谱技术架构的全生命周期过程中,同样存在着对绩效架构定位不准、绩效评价穿透性不够的主客观因素约束,笔者在参与知识图谱标准体系架构过程中,十分强调绩效架构的穿透性特征,提出并与知识图谱工程应用领域的专家一致认为,即每一个模块都存在绩效架构存在的环节,理应将“评估”作为贯穿知识图谱技术应用始终的“支撑”保障。这也是不同于以往信息技术参考结构中,贯穿始终的“标准”与“安全”支撑范式,多出了“测试评估”[13]支撑体系的原因。


总之,践行知识图谱标准体系中,科学的绩效架构设计逻辑,路径是建立科学的价值导向型绩效架构。


本文将研究对象锚定作为“信息技术 人工智能”核心技术之一的知识图谱,从“知识图谱+标准化”双轮驱动机制视角,全面介绍数字经济步入高质量时代的新信息技术特征。回归于贯穿知识图谱与标准化共同认知领域的本体论(Ontology),作为具体实践中“三元组”实体模型的建构逻辑与理论基础;结合当前新一代信息技术中知识图谱工程应用的实践论据,从标准体系化建设的全认知生命周期视角,再探对知识图谱的认知。




参考文献:

[1] 《知识图谱标准化白皮书》2019,P1。

[2] Enterprise Architecture,EA,企业信息化领域的总体架构,于1996年,美国国会《克林格·科恩法案》(Clinger-Cohen Act,又称信息技术管理改革法案),概念上确定了EA在政府部门信息系统建设的架构。

[3] 《知识图谱标准化白皮书》2019,P1。

[4] 《信息技术 大数据 技术参考架构》GB/T 35589-2017。

[5] 注,由于该标准结构隶属于IEEE P2807.1的内容,仍在研制中。

[6] 《知识图谱标准化白皮书2019》,P173。

[7]BBD贡献于《知识图谱标准化白皮书2019》,P13。

[8]BBD参与贡献于《知识图谱标准化白皮书2019》,P47。

[9]BBD贡献于《知识图谱标准化白皮书2019》,P60。

[10] 《大数据标准化白皮书》(2018),P49。

[11]BBD思路,相较于研制中的IEEE P2807《Framework of Knowledge Graph》略有差异。

[12] 详见图11“测试评估”。


END / 


点击图片,查看往期精彩


【声明】内容源于网络
0
0
BBD Data
大数观天下,微言解疑难
内容 748
粉丝 0
BBD Data 大数观天下,微言解疑难
总阅读693
粉丝0
内容748