知识工程专委会有幸邀请到清华大学精密仪器系博士、美国佛罗里达国际大学工业工程系博士后、达索系统中国大学校长、达索系统大中华区技术咨询部技术总监冯升华为大家作了题为《数字孪生与知识工程》的专题讲演。以下是根据录屏视频整理的讲演全文。
从古至今,人类都想把知识代代相传,然而三百六十行行行出状元,每一行里面都具备特有的知识和技能,到底怎么样才能更好地传承下去呢?这就是我们今天要讲的内容。
今天要讲三个方面的内容。第一个方面跟大家分享数字孪生,也就是我们怎么把知识用数字化的方式去表达。第二部分分享一些知识工程的案例。第三部分讲知识工程的进阶。
首先我们来思考一下,在人类早期怎么去设计一款产品?最早原始人时期没有书,那么他做一件事情就是在脑海里面构想。比如在树上造一个房子、打制一把石斧,首先在脑海里先有一个想法,一个大体上房子或石斧的样子,然后基于脑海里面的想法去实操构建,我们可以把这个脑海中产品的样子称为脑海孪生。
当然,造的房子也好,造的石斧也好,想把知识传递下去用什么样的方式呢?可以是语言孪生的方式,你需要告诉同一个部落的其他人,如何造房子和石斧。后来文明进化产生了文字,所有的知识都是用文字和书籍来表达的,这时候就进入到青铜器时代,包括咱们国家的甲骨文,再后来的铁器时代等都是用书的形式来表达的。
大约两三百年前,在工业革命时期出现了摄影术,人们可以通过摄影机去拍摄一个人做事的过程,把做事情的过程记录下来,其他人可以借助这个视频去学习。从上个世纪五六十年代开始的计算机时代,我们更进一步用数字化的方式来表达这些产品,标志着进入了数字孪生的时代。
这时候我们开始思考人类到底是怎么去认识世界和改造世界的?大体上可以总结为三种方式,第一种方式是直接用感官去体验,比如说我们摸一摸这个桌子,它的温度是什么样子的、它的硬度是什么样子的、用眼睛去看它的大小和形状等。这一类通过感官在大脑里重建的客观世界的物体,我们称之为体验孪生,它其实是真实世界在我们脑海里面的映射。
当然,人类通过感官去体验客观世界的时候并没有办法了解真实世界的全部信息。比如我们的视觉只能看到可见光的部分,我们看不见红外线、紫外线、无线电波。其他感官也是一样有一个阈值范围,所以说我们人类用体验的方式去了解这个世界是片面的结果。
第二种方式,我们人类发明了一系列的工具,比如说尺子、温度计等。人类用工具去测量世界,获取世界更准确的信息,借助于传感器、游标卡尺、钟表、三坐标测量仪等。但是我们用测量的方式获得数据也是一个碎片化的。为什么呢?
首先,世界上任意一个产品,它都有无穷多的属性,也就是所谓“一花一世界,一树一菩提”。人类只能测量其中有限的几个属性。其次,只要测了就会有误差。不管准确度是百分之多少个九,也是有误差的。第三,世界是瞬息万变的,测量之后,这个数据可能马上会发生变化,或者我们测量属性本身的过程也会有延迟。
用测量结果产生的数据来描述客观世界事物的方式,这种方式可以称之为数据孪生,跟体验孪生类似,数据孪生也是真实世界的一个局部性、碎片化、有误差的表达。
第三种方式,我们在电脑里面去建模,在电脑里创建飞机、汽车等产品的模型,在真正生产产品之前,我们可以在虚拟世界里面打造一个虚拟产品,称之为虚拟孪生。这个虚拟孪生里面承载的信息可以很丰富,承载多学科的信息。
在虚拟世界里,我们创建的产品其实是一个理想化的现实世界,为什么这么讲?比如我们在电脑里画一根轴,这个轴正好一米长,在实际的现实世界里面,却不可能造出正好一米的轴,它总是有一定误差的,有一点很重要,在虚拟世界的模型,承载了产品的定义,能表达出来,就说明我们掌握了这些知识。
那么稍微再细看一下数据世界我们采集的数据有哪些种类,包括几何计量、热学计量、力学的计量、电子学计量等。在工厂里面,如果有了生产线,我们就可以在每台设备每一道工序上测量数据,基于模型去承载这些数据,这就是工业大数据的来源。
从这个视频里面大家可以看到各行各业知识表达的另外一种方式,比如怎么造一个汽车、怎么造一个飞机、怎么生产一个产品、怎么演讲、怎么做音乐指挥,所有的这些信息也是知识的一种表达方式。
在虚拟世界,我们说的虚拟孪生是在电脑里创建模型,来表达产品知识。表达产品的知识是有不同的信息丰度级别的,最简单的是几何孪生,我们关注产品的外观和结构组成,也就是所见即所得。
第二个级别是在几何的基础上附加多学科的信息,然后再不断扩展产品演变成熟时间轴上的信息,直到全生命周期的信息都可以放上去,再接下来是塑造与产品相关的使用环境,最后把它扩展到整个世界。
为什么要以这样的次序呢,首先我们要描述产品知识,要描述它由什么组成,由哪些零部件组成,相当于是这个产品的几何孪生,它整体长什么样子,每一个零部件长什么样子,装配在一起是什么样子,还包括它的外观、颜色等。我们用眼睛看,可能汽车在动,轮胎在转等,这都是运动的体现,静几何和动几何、动现象就是我们眼睛能看到的所有的东西,这是第一个阶段。
第二个阶段我们称之为基于模型的多学科多专业的数字孪生。比如一架飞机我们在电脑里面把它造好了,能够起飞,当我们真实地把飞机造出来就应该能起飞。这就要求我们在电脑里面造出来的时候,包含的不仅仅是几何结构的信息,我们可以称之为多学科多专业的数字孪生。
因为这个时候要考虑附加在飞机上的全部信息,比如说结构力学的信息、热学的信息、流体的信息、电磁学控制、物理学、化学、生命科学等各个学科的信息。如果缺失了一个学科的信息,我们就没有办法保证飞机能够安全飞行。
我们看一些例子,比如波士顿动力机器人,这个复杂的机器人产品里面包含了哪些知识?我们在这里表达产品的知识就采用了系统工程的方式,它的系统架构是什么样子的,里面有哪些机械系统,有哪些电气管路,有哪些嵌入式的系统,有哪些软件等。
今年4月,美国毅力号火星探测飞船放了一个无人机在火星上,我们怎么样才能把这样的无人机造出来并且保证它能够在火星上起飞呢?这时候需要去做一个虚拟环境去验证,这个虚拟环境是多学科的,比如流体力学、热学、结构、材料等。我们需要知道火星上的大气压是多少、火星上的大气是什么样子的、什么成分、什么密度,无人机的旋翼旋转速度要达到每分钟多少转才能够起飞等。
在微观领域,我们每个产品都是由零部件组成的,而零部件最终是由材料组成的,材料是由分子和原子组成的,而我们了解的材料知识也可以用数字化的方式来表达。举个例子,2013年获得诺贝尔奖的马丁·卡普拉斯(Martin Karplus)说过很有意思的一句话,他说我们人类看到的灯红酒绿的世界只不过是原子的翩翩起舞而已。
这里有很多材料虚拟孪生的应用实例,比如大家手机屏幕用的是康宁的大猩猩玻璃,这个玻璃强度和硬度都非常高,不容易摔碎,它到底是用什么样的物质做出来的呢?这里就需要用到分子建模的方法。
我们关心一个产品,不仅仅关心一个产品的最终状态,还需要了解产品的整个生命周期,为什么呢?对于一个企业来讲,我们企业是造产品的,我们关注这个产品整个生命周期就是为了获得整个产品生命周期的最优化。产品生命周期包含哪些部分?产品的设计、产品的验证、优化、工厂的布局、工艺设计、制造运营、设备的使用与维护等。
在这里我们举一个挖掘机全生命周期的虚拟孪生的例子。想要把挖掘机设计出来,要知道它长什么样子,由什么零件组成,怎么动起来。这是产品的设计阶段的虚拟孪生。
挖掘机在实际场景中可能需要挖不同的东西,可能是在矿山用也可能在建筑工地上使用,我们需要根据不同的条件来进行配置,从而组成不同型号的产品,这就是产品配置的虚拟孪生。
接下来对它进行多学科仿真和优化,我们就要打造多学科多专业的虚拟孪生;再之后是建造制造工厂和工艺的虚拟孪生,最后是挖掘机维护和维修的虚拟孪生。
我们怎么知道一个产品的使用体验好不好呢?比如汽车最终是要在城市里面使用的,如果要验证这个车是不是好车,能否给我们带来最佳的使用体验,我们就要把城市的模型建造出来,让虚拟的汽车在虚拟的城市里面跑跑看看。最终我们就做到了从宏观到微观去表达整个城市各个尺度的知识。
这个时候我们其实就具备了这样的能力,从原子到星球或者从宏观到微观,我们可以在电脑里面表达一个产品的所有的知识。从星球规模、国家规模、城市规模、基础设施规模、产品和企业的规模、分子和原材料的规模。
再回到第三个世界,体验世界,就是我们人类感知的知识。我们人类到底是怎么获取这些外部世界的信息的,通常我们有五种感觉,就是五官作用所获得的。但实际上有些科学家在研究发现,其实人类的感觉要超过五种,有的科学家甚至总结成53种感觉。
如果我们设计一款产品想要知道它是不是最优的,我们就可以从虚拟世界里面把车的模型,甚至把人的模型建进去,我们来用虚拟世界里面的人去感受这个产品是不是最优的,这个时候我们就把人的体验和感知进行了数字化。
当然要把人研究明白是很不容易的,人体是由一个个系统组成的,不同系统里面分别有心脏、脾胃、肝等器官,器官里面有不同的组织,组织里面有细胞,细胞是由DNA分子、RNA分子、蛋白质分子等构成的。
人类最复杂的器官是我们的大脑,我们大脑由很多的神经元来组成,神经元之间是有信号的传递,我们要了解人的感受是什么,我们的思维是什么?就要去研究大脑的结构、大脑的生物电、人的思想过程和物理的大脑有什么样的关系等。
接下来我们来谈谈知识工程。
知识工程的概念是1977年费根鲍姆在第5届国际人工智能会议上提出来的,知识工程其实和人工智能有很大的关系,就是为了去模仿人的智能。
什么是知识工程?费根鲍姆做了一个简单的定义——知识工程是人工智能的原理和方法,原来只有专家具备那些知识才能做的事情,通过知识工程每个人都能够去执行,去求解。
人的智能到底有哪些呢?霍华德的一个理论说人体有八大智能,每个个体可能不太一样,但是每个人都可能在八大智能里面有某几项或者某一项比普通人好,比如音乐智能、空间智能等。
实际在知识工程应用中很大一部分用来设计产品,在产品的设计过程里面充斥着大量的知识,比如设计一个汽车或者飞机,它都有需要参考的各种标准和规范、设计手册、已有的设计模型基础、经验公式、专家知识等,怎么把这些知识用知识工程的方式做出来,帮助大家更便利的使用是我们需要思考的问题。
传统的设计方式是有一个需求规格作为设计前提,设计师知道要做一个什么样的产品,在电脑里进行设计,设计完之后做出来。
在很多企业里面真正去做的时候基本上已经实现了一定程度上基于知识工程的设计,虽然设计源头都是需求和规格,但是已经在系统里面建立好了各种设计规则,可以对设计完成的产品进行自动检查,看它是否符合工程的各种标准。为了方便使用,企业里面也都会建立特定的模板,比如齿轮的模板、装配件产品的模板等,在这些模板之上再进行全方面的优化。
这是基于知识工程的设计过程图。可以看到从需求开始,需要设计一个什么样的产品,经过知识工程把专家的知识、校核的知识变成一个自动化的过程,最后产生一个设计结果。
我们再来详细看一下到底有哪些设计过程可以用知识工程的方式来优化。第一个是变更,设计一个零件,比如齿轮,这个齿轮在设计的时候有15个齿,通过我们对其进行参数化,当我们需要一个20齿的齿轮时,则可以自动调整齿的宽度、高度布局等数据,生成新的设计成果,我们称之为对已有设计进行变更。
第二个是对已有设计的重用。我们把这个齿轮的知识做成一个模板,它的哪些参数变化使得齿的间距、分布、布局发生了哪些变化,用数学的方式来表达出来放到知识库里供大家使用,基于模板建立新的产品。
这个模板可大可小,最简单的只是一个复制粘贴,其次是基于特征的模板,再次是零件的模板,然后是装配件的模板,最后是产品的模板,甚至业务知识的模板。
比如在设计电子器件——PCB板时,我们可以做自动化校核来看设计完之后的PCB板有没有问题。对于半导体PCB板这个产品来讲,校核有几个常见指标,最通用的是三大指标。一个是电源完整性,比如电源是3伏或者5伏的,它送到每一个元器件上的时候电源都会产生一些衰竭,我们需要保证每一个元器件在特定的地方有足够的电压和电流,这是电源的完整性。
还有就是信号的完整性、电磁兼容的完整性。这些指标靠人去检查很复杂,基本上都是用知识工程的方式依据这些原则进行自动检查的。比如不能短路、线路不能交叉、每两个线之间的距离要超过一定的距离等。
通常我们在设计一个产品的时候希望它各个指标都是最优的,但实际上这是不可能的。比如设计一个汽车,我们既希望它的制动性能好,又希望它的动力好,我们希望它噪声小,我们希望它耐用,希望它更安全,希望它驾驶的舒适度好等,这都是我们想要的指标,实际上我们在造一个车的时候需要考虑这些指标的综合,我们会找到一个最优解,在各个指标之间做一个平衡。
这个多学科优化的过程,其实也是用知识工程的方式,大家可以看到在上面的流程图里面我们先做什么后做什么,用什么样的工具,这个流程嵌入的就是知识工程的模板。
通常这种多目标寻优的结果,单峰的是比较容易的,最终的结果就直接出来了,有时候是多峰的,多个指标的时候有几个峰值点,这个时候我们会找到一个工程化最好的点,比如说右上角这个图,a结果和b结果,这个a结果就是特别尖锐, b相对平滑很多,通常b的工程化程度就要高一些,当设计参数变化时,优化的结果对设计参数的变化不敏感,这才是一个好的工程化的结果。
再来看看设计流程的标准化定制。比如我们做汽车的总布置,第一步是建立整个新车型的总布置、装配的总体布置模板。第二步关联新车型的总体参数表,这个参数表包括轴距、轮距、车的高度等。第三步关联人体的布置模板,司机和乘客坐在车里的什么位置。第四步调入各种人体的模板,这个车未来司机要坐在哪里,乘客要坐在哪里,第五步关联详细的布置模板,比如前后视镜、外后视镜的布置、挂水器、雨刷的布置等。这样就实现了完整的设计流程。
接下来看看建筑行业。上海市政工程设计研究总院的例子,他们的工作是设计大桥、设计隧道。以前的时候他们设计大桥,每设计一次需要花很长的时间,哪怕是同一种类型大桥,变更需求后都需要重新设计。
后来他们采用了知识工程的方法,实现了同一种类型大桥设计过一次,未来大桥的某些参数产生变化的时候,其他参数就可以自动调整,实现牵一发而自动动全身。
那他们通过知识工程是怎么做的呢?首先建立桥的骨架和模板,然后再分解它由哪些部分组成,分析每一个部分根据桥的高度、桥的长度、桥的中心线变化会发生怎样的变化。
最终在骨架的基础上把这些模板都装配起来形成一个模型,当这个桥的长度、曲率、塔高等发生变化时,这个桥可以自动适应并生成,这就是采用知识工程设计的结果。
江西吉水赣江二桥就是一个真实案例,在这里我们可以看到它是一个斜拉桥,全长1750米,桥梁段1310米,右下角是它的参数化数值。
这里面是一个钢筋的设计,无论是造大桥还是造房子,使用钢筋的频率是非常高的,使用的数量也是非常多的。比如我们国家的港珠澳大桥就用了42万吨的钢材,一根钢筋差不多7公斤重,粗略计算一下,港珠澳大桥耗掉了将近6000万根钢筋,那么多钢筋如果一根根去画是很费劲的,如果用知识工程的方式就可以很方便地把它直接生成出来。
这是黄河勘测规划设计研究院的一个案例,他们把知识工程应用在水坝设计上。水坝通常有三种,拱坝、石坝和重力坝。重力坝主要靠自身的重量,是最高端的同时也是成本最高的。像我们国家三峡的水坝就是重力坝,重力坝设计是一个很复杂的过程,每次造一个大坝,都得重新去做一次设计,黄河勘测规划设计研究院就想能不能用知识工程的方式把重力坝设计好之后加上知识工程模板,只要修改一些参数,就可以自动生成新的设计,大幅度降低设计难度,提升标准化的应用程度。
大家可以看到这是一个应用实例,在一个山沟里,中间是河流,左右是山。在这里面设计人员可以做一些设置,比如坝段、边墩宽度、流道净宽、坝顶高程等,在设置好后可以自动生成重力坝的设计。
鸟巢是个很有意思的例子,大家初看这个东西乱糟糟的,是不是觉得特别容易设计,其实鸟巢的设计是非常不容易的,难在哪里呢?
第一点, 鸟巢整体是一个钢结构,钢结构造出的鸟巢是非常重的,不能过一段时间就变形了。第二点,鸟巢里面如果每一根钢材都不一样,最终鸟巢的造价将是非常昂贵的,我们应该尽可能去优化它,减少钢材的种类数量,最好是整个鸟巢都用一种钢材造型,然后在工厂里面统一造出来再装配,那是最简单的、成本最低的。
鸟巢的建造最终把钢材的类型降到了五种,这样相对就比较容易了。这其实就是用知识工程的方式去生成的,包括每根钢材之间是怎么连接的。
最早的设计中鸟巢是有盖儿的,后来没有盖儿了,这里面有两个考虑,第一是考虑到钢材的节省。第二是在04年初的时候法国戴高乐机场发生了钢架钢结构倒塌事件,这一事件引起大家的关注,后来去查全球建筑的钢结构发现上面加盖儿是有一定的安全风险的。
然而加盖儿和去盖儿的设计图是完全不一样的,如果是手工设计可能需要几个月的时间去修改完善,大量地变动会造成建筑施工的延迟,很可能奥运会就用不了这个体育场馆了。
好在当时鸟巢的设计是采用知识工程的方式进行的,去掉中间的部分很快系统就自动生成了新的设计,发给工厂进行打造,通过知识工程的方式不仅节省了30%的钢材而且提前1年竣工,这是一个了不起的成就。
相比雅典的奥林匹克体育场在奥运会之际就是没有竣工的,而是在奥运会开完的一年之后才竣工,由此可见知识工程对于未来的建筑施工是很必要的。
在第三部分为大家介绍知识工程的进阶。知识工程是1977年提出来的,后来经过了多年的发展,1980年的时候提出了本体论,也是对知识的一种描述。
1989年互联网之父蒂姆·伯纳斯·李定义了万维网,也就是我们的网络都是用链接来表达的,如何从这个点、这个知识跳到另外一个点、另外一个知识。1998年他提出一个新的理念叫语义网,也就是说这个链接不能只是链接,我们还要知道它的含义。
2012年,谷歌提出了知识图谱,这个概念就更复杂了。我们来看设计手段的进化过程。传统的设计都是所见即所得的模式,拿着鼠标在屏幕上画一个产品,画好了就把它制造出来,这就是所见即所得。
有了AR和VR设备之后,我们戴上数据手套或者拿着遥控器,眼睛戴上VR眼镜就可以在空间里面去比划,甚至通过比比划划这种方式把产品画出来。
另外一种是所想即所得。什么叫所想即所得?就是在大脑上戴一个聪明帽作为脑机接口,脑子里面想象一个产品应该长成什么样子,通过脑机接口自动把想象的产品在电脑里显示出来即所想即所得。
前面这几种方式的最终产品设计都是依赖于设计师本身的能力,比划也好、想象也好,都是个人能力的体现,并不能保证设计的产品是最优的。怎么才能设计出最优产品呢?那就需要用人工智能的方式来进行,直接获得,这里就有一个新的名词叫认知增强设计——CAD(Cognitive Augmented Design)。
它就是在一个设计空间里面,通过人工智能来进行拓扑优化,把所有的相关标准、规格变成知识,用人工智能的方式求解出来产品应该长什么样子。
传统的方式有设计、有优化、有拓扑、有模型重建、校核等,我们把它合成一个过程,用人工智能的方式把这个产品直接设计出来。
在这张图里右边是人工智能设计的最佳结果,是最节省材料的。有时候这种结果是理想化的只能用3D打印(增材制造)的方式做出来,用普通的加工方式是做不出来的,我们就会再生成一个中间的结果,用铣削制造可以造出来又可以实现减重来满足设计的要求。
这里有一个具体的例子,一辆车里面的某一个零件是怎么用人工智能设计出来的。通过限定外形设计空间,可以自动用知识图谱加上人工智能数据驱动做出满足要求的零件设计。
整车也是类似的思路,我们要用知识图谱的方式来表达汽车有哪些变量、哪些零件。比如车门、车轮、发动机、车身,它们之间是什么样的关系?现在汽车整车越来越复杂化,可变量已经达到了百万量级,靠人去设计一个最优产品已经是不太可能的事情了,无论是产品设计还是工厂设计都需要依靠人工智能。
人工智能不仅仅用于设计产品,这是人工智能帮助进行城市规划设计,城市里面的小区、城市里面的街道布局、地铁在哪个地方设置站点、地铁怎么规划线路等,都是需要进行规划,我们可以用知识图谱和机器学习实现人工智能的城市规划设计。
最近有一个新闻,DeepMind团队研发出了AlphaFold 2来预测蛋白质的折叠,准确率已经达到了90%。通过算法可以精准地从蛋白质的氨基酸序列,由计算机预测出其复杂的空间结构,甚至最终由结构决定其功能。
我们可以想象在不远的未来,如果人类要登陆火星并建立火星基地,人类赖以生存的植物、动物等如何才能适应火星的环境?植物的DNA需要怎么样设计才能在低氧、低大气压的环境下生存,这些是需要人工智能的手段在未来帮我们去实现的。

