大数跨境
0
0

《构建个人知识图谱》007:高效知识探索和知识漫游

《构建个人知识图谱》007:高效知识探索和知识漫游 数翼
2023-10-21
1
导读:这是这个系列的第七篇,从第一篇的知识图谱概念,以及第二篇的个人知识图谱选型, 一直到我们现在知识图谱的可用版本。这篇文章探讨如何进行高效的知识探索和知识漫游功能的设计。

这是这个系列的第七篇,从第一篇的知识图谱概念,以及第二篇的个人知识图谱选型, 一直到我们现在手动构建了一个还算像模像样的个人知识图谱 工具, 这几天天我一直在思考如何把个人知识图谱高效使用起来, 今天跟大家聊聊怎么高效地进行知识探索。

三维 vs 二维

首先从图谱 UI 展示形式说起,图谱表示一般有两种表现方式:二维平面表示和三维立体表示。

二维和三维的图表示

三维对设备要求比较高,渲染资源较大。在不考虑性能的前提下,两者仍然各有优缺点。

二维和三维图谱的优缺点

二维图谱

优点:

  • • 更容易理解和处理。

  • • 不易导致视觉混乱。

缺点:

  • • 不能更直观地表示知识图谱中的复杂关系

  • • 探索知识图谱中的知识可能不如三维表示方便。

  • • 用户体验可能不如三维表示身临其境

三维表示

二维知识图谱的缺点正是三维图谱的优点:

  • • 可以更直观地表示知识图谱中的复杂关系,例如空间关系和时间关系。

  • • 可以更容易地探索知识图谱中的知识。

  • • 可以为用户提供更身临其境的体验

而缺点同样也是二维图谱的优点:

  • • 更难理解和处理。

  • • 可能会导致视觉混乱

三维视觉优化

三维图谱可以有更好的用户体验,但是在视觉上更容易混乱, 如果数据量不大,展示效果不如二维的直观

由于我们展示图谱使用了三维的形式,我们主要谈谈怎么去优化三维图谱交互来放大优点、弥补缺点。

视觉问题当然也有一定的方法去优化。

调整字体大小

我们可以在不同的场景(根据数据多少、远景)来调整字体的大小,以便让信息更容易获取。

使用默认的字体大小,字号比较小:

小字体在场景中的展示

需要镜头拉近才能看的清楚:

小字体拉近才能看到

调大字体字号,可以在比较远就能看清:

大号字体的展示效果

字体深度

在三维场景中字体肯定也是由三维效果的,也就是近大远小:

默认3D场景中近大远小的显示效果

如果统一字体大小,那么就可以产生类似二维图表的效果:

三维场景中统一字体大小

关心全局数据的时候,可纵览全局数据,但是会有文字遮挡等问题。

keyi fangbian

颜色

一般我们使用固定的字体即可,因为实体球已经有颜色了:

默认的单色字体

也可以让字体的颜色和实体的颜色统一,实体之间有更好的区分。

隐藏多余信息

三维知识图谱一般展示更多的内容,优化还有一个重要的方向就是在不损失关键信息的情况下减少额外信息的展示。

默认的展示情况:

默认场景

隐藏实体圆球,界面内容清晰很多:

不显示球体

把连线调成一个像素,同时使用渐变色:

降低连线的干扰

甚至直接隐藏连线,展示出类似云此图:

不显示连线

知识探索的交互增强

刚才我们提到,三维展示的一个优点就是让用户更容易探索知识。三维展示探索知识主要有几个方面的表现。

镜头移动和缩放

我们可以在 3D 图谱场景中很容易的拖动镜头,以及拉近拉远镜头,来实现我们对于知识的探索和查看。

镜头拖动

节点的拖动

当然节点拖动也能给我们探索知识图谱知识提供便捷。

下面视频看到,我们对某个知识感兴趣的时候,可以直接把他拖到我们想放置的地方,快速粗略的调整布局。

节点拖动

节点点击自动定位

还有一个常用的技术技术点击节点自动居中,定位到镜头前面。这样你的目光就会聚焦在节点以及节点周边的内容。

视频:自动定位

颜色较多,我把球体颜色调暗好看清聚焦(聚焦我只是换个了黄色而已,未做过多的效果)。正常来说聚焦的节点应该有不同的特效区分让其更加明显。

漫游模式

用其他软件脑图软件的时候,对 The Brain 这款软件的漫游功能印象深刻。

简单来说漫游功能就是随机显示节点及其对应关系, 下面我哪一个软件功能(ServiceNow) 的图谱「漫游」一下给大家看下(为了展示每个节点的停留时长设置的比较短):

视频:TheBrain 漫游功能

人类关于知识最大的障碍不是学习,而是遗忘 每天我们每个人都有学习新知识(现在就连刷抖音博主也会拼命在短视频里灌输一些概念给你), 然而当我们 真正的在思考某个问题, 寻找某个解决方案的时候,你会发现你能使用的 知识并不多,大部分的都被你忘到九霄云外,有些甚至别人告诉你答案发现自己都已经不记得了。

遗忘曲线

说到遗忘,就不得不说遗忘曲线了,如下图(维基百科)艾宾浩斯遗忘曲线:

遗忘曲线

遗忘曲线揭示了人的 记忆过程:记忆的保持时间上是不同的,有短期记忆长期记忆两种。平时的记忆的过程是:

输入的信息在经过人的注意过程的学习后,便成为了人的短期的记忆,再经过进一步强化后成为长期记忆。长期记忆的保持时间有长有短,如果不经过及时的复习,这些记住过的东西就会遗忘, 而经过了及时的复习,长期记忆就会继续保持下去。

经过适当的复习,我们就可以用在知识没有忘记的时候快速延长记忆时间,缓解遗忘。

遗忘曲线

知识漫游是遗忘曲线的解药

知识漫游功能可让您以随机但以相互关联的顺序查看想法,以一种固定间隔时间重复的进行。

在知识图谱上,知识漫游就是遗忘曲线的解药。

这也就是说,通过探索个人知识图谱,您可以增加记住所记录的概念和注释的机会。

知识漫游提升知识连接

然而,仅仅通过观察随机想法的出现,加强你大脑的记忆,你只能获得部分价值。知识漫游的真正价值是给你你个沉浸的环境,让知识的闪回帮助你的大脑对知识(思想)进行迭代以及产生更多的连接, 也就是我们常说的灵感

你可以在知识漫游的时候,通过渐进式总结、更新知识类型、将该知识的想法与其他知识思考联系起来, 进而改进大脑对知识的认知

这个此时知识漫游更具创造力的功能,就是所谓『稳固而知新』。如果没有通过「温故」得到新的想法,那么漫游知识的旅程 将变得索然无味。

知识漫游实现

知识漫游的目的是为了加强和激发大脑对知识(思想)的连接。

将强连接好说,漫游的时候根据连接来进行漫游就好,以传统的二维图谱为例,主要分为三种动作:

  • • 节点和父节点或者父节点之间的跳转;

  • • 节点和关系节点之间的跳转;

  • • 节点和兄弟节点之间的跳转。

这三个基本就能满足我们漫游的需求,The Brain 主要就是这个模式, 这种漫游模式能根据『连接』这个基础进行流动,加强并一定程度激发连接。

这个模式下连接的激发主要是在「近亲」中。

The Brain 的漫游

智能漫游

上述方式解决了漫游的时候不东一榔头西一榔头这种「瞎跑」的问题,但是对于复杂图谱,比如图谱中有些独立的簇是就无法高效漫游。

有独立簇的知识图谱

鉴于知识图谱的三个特性:

  • • 节点

  • • 连接

  • • 属性

前面讲的都是通过「连接」漫游。在漫游时候可以对「节点」和「属性」漫游的支持。优化如下:

  • • 漫游的时候使用一定优先级进行节点漫游(节点名称近似

  • • 漫游的时候使用一定优先级进行属性漫游

    • • 同属性优先漫游(或者相反属性优先)

    • • 某一个属性在节点周围(3-5层)查找同属性值节点

    • • 某一个属性在节点周围(1-2层)查找不同属性值节点

基于上面的策略,我们大致可以实现一个「智能漫游」的功能,同时提供一个温度的选项, 类似 LLM 大模型的温度。

当温度值越大,漫游智能探索的力度越大,这个时候更容易产生创造性的想法。

当温度值越小,漫游智能探索的力度越小,这个时候更适合温故知识,加深某一领域的记忆。

漫游控制面板

国外很多公司很推崇「冥想」这个方法,来提升管理人员的思维能力,简单来说就是通过「冥想」来让人变得更有精力、更聪明。

中国道家也有很多关于冥想的修炼方法和著作,扯远了。

简单来说冥想就是通过排除外接干扰,让大脑休眠然后在自己唤醒自己工作,萌生一些不可思议的效果。

如果用知识图谱来模拟的话,大概如下:

todo从休眠到唤醒到漫游

而漫游功能很适合在配合着在冥想前后使用:人为去引导冥想。

这样如果你每天都抽出来一定时间进行知识漫游,在一个超大的图谱前其实会阶段性有不同的漫游需求。可以把影响智能漫游的因素,抽取出来做一个控制面板,以满足不同的需求,类似我们节点的控制面板。

节点的属性控制面板

随机漫游

当然在图谱比较小的时候,同时图谱内容都是自己维护的,我们完全没必要考虑那么多,一个随机的漫游就够了。

交互实现

虽然前面分析了很多,但是漫游功能在交互的实现最后很简单,就是一个漫游播放开关,以及后一个和上一个的手动漫游按钮。

漫游操作按钮

不足

最后我们再回顾一下图谱的效果:

图谱漫游模式

可以看到漫游的功能,但是 UI 上还有有不少优化的地方。一些基本的设计原则也没有很好的满足。

比如节点高亮的效果,偏远节点的隐藏等。


--- END ---


【声明】内容源于网络
0
0
数翼
专注 AIGC 人工智能知识传播和实践
内容 228
粉丝 0
数翼 专注 AIGC 人工智能知识传播和实践
总阅读61
粉丝0
内容228