“ 知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组。”
知识图谱——Knowledge Graph近年来随着人工智能技术的发展,其影响力越来越大,但除了部分行业从业者之外,很多人对知识科普并没有一个完整的了解。
因此,今天我们就来简单了解一下什么是知识图谱,包括它的基本概念,作用,构建流程。
知识图谱
知识图谱(Knowledge Graph)是人工智能的重要分支技术,它在2012年由谷歌提出,是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系,其基本组成单位是“实体—关系—实体”三元组,以及实体及其相关属性—值对,实体间通过关系相互联结,构成网状的知识结构。
知识图谱的特点是结构化语义知识库,它和关系型数据库的共同点都是用来存储结构化的数据;但知识图谱的结构化和关系型数据库的结构化又有些不同。
关系型数据库是通过行列的二维表形式来记录数据,而知识图谱是通过实体-关系-实体,三元组的方式来表示数据;知识图谱注重的是关系的体现,由于关系型数据库在关系表示中的复杂性和效率问题,因此知识图谱被提了出来。
所以知识图谱能解决的问题,关系型数据库能不能解决?答案是关系型数据库能解决大部分知识图谱解决的问题,但会非常麻烦,效率很低;但有些问题,只能靠知识图谱来解决;因此,知识图谱和关系型数据库之间是互补的关系,而不是对立的关系。比如说针对这种三元组形式的数据,使用知识图谱会更简单,效率更高。
知识图谱有什么用?知识图谱的结构决定了知识图谱具有以下的特性:
统一的结构化的表现形式,机器可读,对人类友好。
含有丰富的语义信息,概念,属性,实体之间关系。
构建之后可以作为背景知识直接供下游应用使用。
丰富关联信息,天然具有图的各种特征,可以进行图的相关操作。
具体来看就是应用于搜索,问答,大数据分析等领域。
怎么构建知识图谱?
以下是构建知识图谱的全部流程,主要需要经过数据获取,信息抽取,知识融合和知识加工等多个步骤。
建立一个知识图谱首先要获得数据,这些数据就是知识的来源,它们可以是一些表格、文本、数据库等。根据数据的类型可以分为结构化数据、非结构化数据和半结构化数据。结构化的数据为表格、数据库等按照一定格式表示的数据,通常可以直接用来构建知识图谱。非结构化的数据为文本、音频、视频、图片等,需要对它们进行信息抽取才能进一步建立知识图谱。半结构化数据是介于结构化和非结构化之间的一种数据,也需要进行信息抽取才能建立知识图谱。
知识抽取
知识抽取可以分为实体识别、关系抽取、属性抽取等。目前结构化的数据是最主要的知识来源。针对结构化的数据,知识图谱通常可以直接利用和转化,形成基础数据集,再利用知识图谱补全技术进一步扩展知识图谱。
实体识别
关系抽取
属性抽取
知识融合
当我们想建立一个知识图谱,需要从多个来源获取数据,这些来源不同的数据可能会存在交叉、重叠,同一个概念、实体可能会反复出现,知识融合的目的就是把表示相同概念的实体进行合并,把来源不同的知识融合为一个知识库。
知识加工和存储
知识加工用来构建本体,进行知识推理和质量评估;知识存储:将处理后的知识以适当的格式进行存储,以便后续查询和使用。
总结
知识图谱作为一种重要的人工智能技术,正在不断发展和应用。它通过将复杂的信息结构化,帮助我们更好地理解和利用知识,推动各个领域的智能化进程。通过构建知识图谱,企业和个人能够更有效地管理和应用知识资源,从而提升工作效率和决策能力。

