大数跨境

元宇宙的全息社会:一切均可知

元宇宙的全息社会:一切均可知 数组智控产业发展科技院
2022-07-08
2
导读:文章来源《新硬件主义》元宇宙的前半场将充分释放人的创造力,在现实物理世界这一空间中,最重要的存在是人与物。传

文章来源《新硬件主义》


元宇宙的前半场将充分释放人的创造力,在现实物理世界这一空间中,最重要的存在是人与物。


传承这一走向,元宇宙在重塑现实物理世界时,最重要的重塑内核即重塑为真正智能化的硬件。


从现实物理世界交互的角度,AI让一切硬件能说话,即真正的智能化,以交互的方式真正满足用户的根本需要。


AI的走向,目前看将由感知到认知再到决策,基于感知、认知的决策等同于现实物理世界/现实物理世界的某个局部空间的人、物,一切均可知,没有不对称信息,近乎全息。


一、AI由感知走向认知


著名计算机科学家约翰·霍普克罗夫特(John Edward Hopcroft)认为人工智能发展三个核心关键:计算能力、大数据、互动交流能力。


人工智能的发展历史在一定程度上是这三个关键能力提升的过程。


1956年夏天,美国达特茅斯学院举行了历史上第一次人工智能研讨会,这次会议被认为是人工智能诞生的标志,在此后的很长一段时间里,人工智能经历了多次起起伏伏,始终没能迎来大的突破,背后主要的原因有两个方面:


一是早期的计算能力不足,以Control Data 6600为例,它是Control Data公司在1964年9月推出的旗舰型超级计算机系列,每秒可以处理3万条指令,相比IBM Stretch快了3倍,是当时最快的计算机,并且连续保持了5年的纪录。


[插图]但当时计算机能力确实不足以支撑大规模的数据处理。


二是数据量不足,计算机如果想要获得感知、认知能力,其基础是需要输入海量数据,特别是深度学习算法更是以大数据为核心,其运行机制是通过为其输入足够数量的数据,供其分析、处理并不断地进行推演、模拟(大数据是人工智能的燃料),得出一定的结论,然而当时的数据量也严重不足。


近年来,在更强大的算力支撑下,通过大规模训练数据喂养的深度学习算法模型表现出更优异的效果,推动计算机视觉、语音识别等领域取得了重大的技术突破,使计算机在感知智能、计算智能等一些具体问题上已经达到甚至超越人类水平,比如在语音识别与合成、图像识别等领域。


2014年,香港中文大学汤晓鸥教授团队发布DeepID系列人脸识别算法,准确率达到98.52%,全球首次超过人眼识别率,突破了工业化应用红线。根据易观数据,2009年深度神经网络算法被应用于语音识别领域时,语音识别准确率突破90%,至2016,年百度、搜狗等头部公司都先后宣布其语音识别率达到了97%。


这一阶段,人工智能开始呈现出一定的应用价值,逐步走向商业化。


在各行业人工智能发展进程中,AI +或AI赋能成为传统行业智能化升级与转型的一个基本模式,企业所面临的降低成本、提高效率、安全保障等,都将显著受益于人工智能技术。


人工智能被广泛应用于大数据研判、运筹优化、智能风控、人机交互等生产活动的各个环节,特别是在政府、金融、互联网、交通等行业的渗透率较高,人工智能所发挥的价值已被验证并且正在进入规模化的阶段;


在制造、能源等行业也已经产生了一些标杆案例,有效地帮助企业实现降本增效。


通过图像识别、语音识别等模式识别技术完成感知层面的人工智能,目前采用最多的算法是深度学习,深度学习算法是基于不同拓扑结构的深度(网络)架构,可以利用一些开源框架实现与部署深度学习算法,支持深度学习网络架构监督训练并催熟其训练。


深度学习必须具备五个条件:数据充足、确定性、完全的信息、静态、特定领域的单向任务


决定人工智能应用创新有赖于大数据、算法、算力及应用场景


近年来问世的深度学习算法已不止500个,从下列9个深度学习模型库所支持的深度学习模型来看,已多达1200个:


(1)脸书PH库支持26个模型;


(2)谷歌TH库148个模型;


(3)谷歌TM库200个模型;


(4)IBM MAX库32个模型;


(5)微软OMNX库45个模型;


(6)新加坡JingYK(个人)MZ库368个模型;


(7)OpenⅤIN库135个模型;


(8)Sebastian RK库86个模型;


(9)GLUON-CV库45个模型。


与过去传统的人工智能算法相比,深度学习算法能够训练更大规模的神经网络,从而解决更复杂的问题。


而且随着数据规模的提升,规模越大的神经网络,深度学习算法表现出的效果越显著,所以深度学习算法作为一种强大的数据分析工具,是实现人工智能的路径之一。


但是深度学习算法也存在明显的缺陷:


首先,深度学习算法模型高度依赖于数据,数据规模、采集质量等都会影响所构建的模型与结果,许多行业样本数据不足,很难发挥深度学习训练的效果;


其次,深度学习本质上是一项黑盒技术,其训练过程具有难以解释、不可控制的特点;


最后,随着人工智能应用复杂度增加,需求量呈指数级增长,深度学习未能很好地适应行业需求的增长,所训练的模型越发超出人类理解的控制范围,在快速进行过程中极易偏离预设的轨迹,体现出的缺陷可能会带来一些意想不到的后果。


当下深度学习可解决一些问题,但不少问题还不能靠它来解决,比如当前人工智能技术落地所面临的一些较为突出的挑战:数据安全、行业技术诀窍(know-how)等。


目前全球都在关注数据隐私、数据安全的问题,而深度学习算法模型则以数据为核心,如何保证数据易得但同时不会导致数据滥用的问题,是目前人工智能应用方需要解决的核心问题。


进一步地,以庞大的数据为基础,如何与繁杂的行业相结合?


这是人工智能发展至今所面临的核心问题,即对场景的理解和行业的know-how该如何与深度学习算法相结合。


具备顶尖人工智能技术的团队对行业的理解不够深刻,而具备行业理解的公司却无法保证技术的聚焦与领先性,两者的结合才是保证大规模商业化应用的核心,也是人工智能发展的前提与必备能力。


此外,由于深度学习所形成的最终模型具有不可解释性,但在某些行业的生产环境中需要符合业务逻辑,这也造成了人工智能在部分行业的推广较为缓慢。


根据计算机所具备的能力,我们可以将其发展阶段划分为计算智能、感知智能、认知智能这三个阶段。


(1)计算智能:计算机能够实现存储与计算,并作为传输信息的重要手段,比如在过去一段时间内,计算机最大的发展是将一切信息都尽可能地数字化,从早期的计算与文字,到发展至今的电商、娱乐等场景的数字化;


(2)感知智能:计算机开始看懂与听懂,并能够做出一些判断及行动,比如Siri语音助手等;


(3)认知智能:机器能够像人一样进行思考,并主动做出行动,比如在完全自动驾驶的场景下,汽车能够自己做出超车、转弯的行动等。


当前正处于以深度学习为代表,以语音、图像、视频识别预处理的感知智能,通过与产业进行深度融合,有望实现应用爆发式场景,从而激发更多技术与理论创新,促进人工智能努力走向具备理解、推理、解释的认知智能的阶段。


而且随着大数据红利消失,以深度学习为代表的机器智能—感知智能水平也正在日益接近天花板。


展望未来,人工智能如何突破深度学习算法走向新阶段?


人工智能在听、说、看等感知智能领域已达到或超越人类水准,但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。


实现认知智能是当下人工智能研究的核心,也是未来人工智能热潮进一步突破天花板、形成更大产业规模的关键。


认知智能将结合人脑推理过程,进一步解决复杂的阅读理解问题、少样本的知识图谱推理问题,协同结构化的推理过程与非结构化的语义理解,以及多模态预训练问题。


认知智能的出现使得AI系统可以主动了解事物发展的背后规律与因果关系,而不再只是简单的统计拟合,从而进一步推动实现下一代具有自主意识的AI系统。


目前人工智能专家正在努力探索的新算法也非常多样,比如脉冲神经网络硬件实现与类脑智能算法、将真脑(神经元)与脑外计算机相连的脑机接口算法、数据驱动与知识驱动相结合的认知算法、量子算法等。


基于新算法,目前有三条比较主流的探索路径:


第一,从深度神经网络(或机器学习/深度学习模型)出发。


深度学习是基于大数据的,需要将大量的数字输入机器供机器分析,而大脑是模拟的,所以将深度学习所产生的数字结论输入大脑,大脑是不识别的;


反过来说,将大脑模拟的思维逻辑传到计算机中,计算机也是不识别的,所以采用深度学习算法技术难以做到脑机交互。


这可能会导致深度人工智能所推演的逻辑将变得不可理解、不可解释,不能获得大脑的支持,很难创造出类似于人类的自主思维、创意与灵感。


所以,这是从深度学习算法出发,将感知智能推向认知智能所面临的关键问题之一。


在后深度学习时代,人工智能的发展需要知识,特别是符号化的知识,其核心为知识表示与确定性推理,未来将重点研发以知识驱动的机器智能—认知智能。


第二,从生物脉冲神经网络出发。


与深度学习算法不同,生物脉冲神经网络采用了与人类大脑神经元网络相似的工作原理,包括在结构、特征、功能、机制等方面都较为相似,这使其在处理人类大脑意识处理上具备先天的优势。


但是由于传统计算机主要采用的是冯·诺依曼计算架构,在神经形态计算出现后,必须把传统的冯·诺依曼计算架构转移到神经形态计算(类脑计算)架构上来,把目前采用的人工智能加速技术(AI芯片)转移到神经网络拟态技术(芯片)上来(神经拟态芯片模拟人脑运作机制,主要采用异步脉冲神经网络),将会导致计算架构的大规模调整。


此外,神经形态计算的研究和发展与神经科学紧密联系,研究人员需要结合神经科技的研究,进一步理解人类大脑神经元的生物特性与运作机制等,并设计出相应的传输机制与功效指标等。


因此,目前对生物脉冲神经网络的研究还处于初级阶段,未来还需要结合人工智能与神经科学等学科的发展持续向前探索。


第三,从知识表示、驱动、推理,建设大规模语义网络出发。


与深度学习算法基于数据不同,知识驱动的算法主要基于专家知识,建立在语义网络的基础之上。


语义网络的发展过程是从自然语言处理系统到自然语言理解系统,再到大规模语义网络。


20世纪80年代中期启动了知识工程,21世纪初又更新为新知识工程,新知识工程的重点是建设大规模语义网络(以提升知识图谱)。


IBM此前在医疗人工智能方向上走的就是这条路,IBM认为,对人工智能最重要的能力是知识而非数据,他们探索知识表示、驱动、推理,以期医疗人工智能从不可理解、不可解释的感知智能阶段推向可理解、可解释的认知智能阶段。


IBM创始人沃森主张,在以知识表示、驱动、推理的路上,由大规模语义网络支持的认知智能目标将得以实现。


但IBM在医疗方向上走的这条路未能成功,主要原因之一是大规模语义网络还不够完善,对于常识、专业知识、专家经验,机器是很难识别的。


后IBM强调人工智能专家必须与临床医生结合,在疾病诊断时要取得共识。


此外,要想通过知识推理达到人类智能还面临另一道难题:需要背景知识,这在学习与训练时是不可或缺的。


整体来看,目前由知识推理将人工智能推向认知阶段仍然有一段路要走。


此外,20世纪90年代以来,量子技术应用于信息的获取、存储、传递、处理、使用等过程中,形成了量子保密通信、量子计算模拟、量子精密测量等应用。


随着第二次量子革命的出现,量子信息技术将促进感知、计算、存储、通信、应用等过程的一体化融合,以量子信息系统形态推动人工智能的发展(量子计算可作为突破深度学习的新算法出现)。


2019年11月5日,英特尔研究院院长理查德·A.乌利格(Richard A.Uhlig)访华时谈到三大颠覆性技术:


一是新型计算方式——量子计算、神经拟态、图计算、概率计算,这些都是非常重要的新型计算方式;


二是硅光子技术;


三是内存技术。


二、感知需要深度学习,认知需要知识图谱


计算智能、感知智能、认知智能、决策智能,反映了机器智能化水平的不同发展阶段。


以基于数据驱动的深度学习为代表的感知智能水平,随着大数据红利的消失日益接近天花板。


下一阶段,人工智能的发展方向将是使机器从感知智能向认知智能升级演进。


所谓让机器具备认知智能,是指让机器能够像人一样思考,体现在机器能够解释数据、解释过程、解释现象,体现在提升推理、规划等一系列人类所独有的认知能力上。


若能进入认知阶段,类脑认知计算将具有人类自主思维、意念、理解、思考、创意、灵感方面的特征。


在人工智能感知阶段,单纯依靠数据驱动的深度学习算法技术,对于图形、图像、语音的识别,做的是比对;


在人工智能的认知阶段,有赖于与数学、脑科学等结合,以实现底层理论的突破,需要建立大规模的知识库、研究知识表示,以及把知识、推理、数据结合起来。


阿里巴巴达摩院也认为,在推动感知智能走向认知智能的过程中有两个要素非常关键,一个是算力与协同;


另一个是从认知心理学、脑科学以及人类社会的发展历史中汲取更多的灵感,并结合跨领域知识图谱、因果推理、持续学习等研究领域的发展进行突破。


因此,认知智能的实现需要知识驱动或者数据、知识双驱动。


知识图谱是知识驱动下实现认知智能的关键技术,有了知识图谱,就能进行计算机建模。


知识图谱即大规模高级的NLP,涉及知识抽取、表示、融合、推理、问答等关键问题,特别在理解、解释方面得到一定程度的解决与突破。


只有通过知识图谱技术(有希望成为“大脑”)才能真正达到认知层面的人工智能。知识图谱的发展始于20世纪50年代,分三个发展阶段:


第一阶段(1955—1977年)是知识图谱起源阶段;


第二阶段(1977—2012年)是知识图谱发展阶段,语义网络得到快速发展,开始对知识本体的研究,知识图谱吸收语义网、知识本体,在知识组织与表达方面的理念,使得知识更易在计算机之间以及计算机与人之间交互、流通与加工;


第三阶段(2012年至今)是知识图谱繁荣阶段,2012年谷歌提出Google Knowledge Graph,知识图谱才正式得名,谷歌通过知识图谱技术改善了搜索引擎性能,此后知识图谱得到了快速的发展。


知识图谱其实是知识工程的一种技术体系,而且是大数据时代知识工程的代表性进展。


20世纪七八十年代的知识表示也是知识工程的一种,它与今天的知识图谱有着本质差别,因此它们被大体划分为新旧知识工程两个阶段。


• 旧知识工程主要发展于20世纪七八十年代,它是通过在知识库提供资源或挖掘数据中的知识要素,或者对数据与知识进行转化;其算法、逻辑推理主要依靠深度学习算法或小规模语义网络(数理逻辑推理、持续线性)等。在这一阶段,知识工程的目标任务是使得机器实现感知智能。


• 新知识工程的发展是从2010年开始,它是通过知识库提供资源从中发掘知识与学习经验;在算法、逻辑推理的过程中,主要采用认知学习算法,或者大规模语义网络(沿NLP及BERT、MT-DNN、GPT2语言模型训练或经语料库微调,沿语义网络/语言模型新的逻辑推理,呈非线性、跳跃)。其核心目标任务是帮助机器完成的人工智能任务具有可理解、可解释能力或者进一步使其实现认知智能。


技术发展阶段不同,新老知识工程之间的区别也非常显著,其差异主要在于两个方面。


一方面,旧的知识工程是从已知数据中获得已产生的规则,脱离人的认知环境;


而新的知识工程是从新产生的数据中挖掘、调整规则,以知识为基础的规则是创造性、跳跃式的,新的知识工程是关注具身(embidument)的人工智能,即与身体场景有直接关系,要求关注人际关系,形成人际共识。


这一点在某些场景中非常重要,比如在医疗场景中,人工智能所研发出的新理论、新算法需要与临床医生在取得共识的基础上的处置相结合,也要处理好医患关系,比如要让患者参与决策。


另一方面,在算法、逻辑推理过程中,需要使用的语义网络规模差别较大,旧知识工程阶段主要是采用小规模的语义网络进行数理逻辑的推理等工作,进入新知识工程即知识图谱的阶段,则可以采用大规模语义网络,进行语言模型的逻辑推理。


所以,这也是2012年谷歌提出知识图谱以来,知识图谱技术发展很快的核心原因。


进一步地,我们从知识图谱的核心技术链来进行拆解,其主要包括以下几个步骤:


首先是从多元异构数据中获取知识,比如从数据中提取知识要素,如概念、实体及其关系等;


其次则是直接采集语言、文字、词句、篇章、网络、语义等自然语言,并完成数据与知识的融合、知识与实体的衔接,即完成知识融合;


最后是在前述基础上将知识进行表示(类似于人类得到一定的经验)与知识推理(将所得出的经验进行持续的验证),并最终应用于行为决策中,即进行知识赋能。


从对上述知识图谱的技术链进行分析可以看出,知识图谱能够推动机器实现认知智能的两个核心能力要素在于理解与解释。


因为人类是理解自然语言的,计算机是理解数字信号的,所以要想让计算机理解自然语言,就需要借助如NLP等函数来训练,提高机器对智能体的理解及解释能力。


即需要为机器建立起从数据到知识库中的知识要素(包括实体、概念、关系)映射的过程,使其理解数据,并以此为基础对知识进行解释,从而实现应用。


有了知识图谱,机器完全可以重现这种“理解”与“解释”的过程,也就是说,知识图谱完成从数据到知识的转化最终服务于智能应用的转变过程。


因此,知识图谱让人工智能进入可理解、可解释的新阶段,并将成为解决机器人工智能问题的主要方式之一。


从感知走向认知要解决业务问题,从单个业务场景、单点单向业务向全流程演进,要建立统一的知识图谱,来实现知识融合推进人工智能落地。


尽管NLP等技术已经取得了很大进步,但是其仍存在很明显的缺陷,即机器无法识别常识问题,要建立常识库非常困难。


比如IBM在建设知识工程时,要求研发人员与现场的临床医生(或现场操作人员)进行沟通取得共识,以补充解决机器无法识别的常识问题,使人工智能真正进入认知阶段。


三、AI赋能的仿生机器人、机器狗


随着感知智能向认知智能方向不断探索,目前也有各种仿生机器人不断涌现,呈现出不同的硬件样式,并且行为能力上开始朝着自主机器人的目标迈进,比如机器人、机器狗等。


  1. 机器人


仿生机器人有六大系统,分别为驱动系统、机械结构系统、感知系统、环境交互系统、人机交互系统、控制系统机器人的执行机构,大体上对应于人的肌肉、四肢、视觉与听觉等感知器官、说话等输出系统、人的大脑等。仿真机器人与真人极为相似主要在于它的皮肤、面部表情与如上的六大系统都模拟人类,越接近人类表明仿真机器人的技术能力越强。


近来,由人工智能赋能的仿生机器人发展很快,有美女机器人、情感机器人等,与真人愈加相似。


亚马逊的Alexa、苹果的Siri、谷歌的“米娜”、Facebook发布的“融合者”等是人工智能驱动下发展较快的一类仿生机器人,其中“融合者”发明的聊天机器人被称为“最像人类”的机器人。


美国《财富》杂志网站在2020年4月29日报道,Facebook研制了一种聊天机器人,可以进行长时间开放式对话,更像人类。


将这种聊天机器人称为“融合者”,是因为它能“融合”成功对话所需的各种技能,包括扮演角色、讨论几乎任何话题与表达感情。


它还可以利用谷歌的聊天机器人——“米娜”生成的对话进行测试,第三方评估者认为“融合者”比“米娜”优秀,因为“米娜”与亚马逊的Alexa、苹果的Siri等机器人只能熟练地围绕一系列具体任务展开对话,如告诉你天气,或告诉你最近的邮局怎么走,而“融合者”与之不同,它被称为“开放域聊天机器人”,能够就任何话题进行对话。


而且从对话效果来看,亚马逊的“土耳其机器人”服务平台招募的评委说:他们喜欢与“融合者”这款聊天机器人交谈,几乎与真人对话不相上下——这也表明这款机器人非常接近人类的水平。


2022年1月,机器人Ameca因为逼真的表情在2022年CES展览上走红,成为展览会上当之无愧的“网红”。


Ameca是由Engineered Arts设计推出的一款人形机器人,Engineered Arts是一家总部位于英国的类人机器人设计与制造商,有15年以上的类人机器人开发经验。


2021年,Engineered Arts在YouTube上发布的一段影片展示了其最新推出的全新人形机器人Ameca,视频中Ameca刚从睡梦中醒来,好奇地盯着自己的手臂,然后打量周围环境,像是刚来到这个世界,转过头发现有人居然在盯着自己,吃了一惊,然后友好地打招呼。


这一系列动作自然而流畅,而且表情非常逼真。


这段视频当时引起了全球的热议,很多网友都表示“西部世界又进了一步”。


当然目前它也还存在缺陷,比如并不能够支持行走等。


目前公司也暂未开放订购通道,预计它真正走入人群中还需要一些时间。


Ameca好奇地盯着自己的手臂,表情非常逼真


2.机器狗


波士顿动力公司成立于1993年,专注于生产能走、能跑、能运东西的机器人,是全球范围内著名的机器人公司,旗下有类人机器人Altas、大狗机器人Spot、四足机器人WildCat等。


波士顿动力公司成立几十年来曾三易其主,于2013年被谷歌母公司Alphabet收购,2017年被转卖给软银,又于2020年12月被韩国现代汽车公司收购。


波士顿动力公司旗下的机器人此前主要面向美国军方,2020年6月公司将大狗机器人Spot首次进行商用,售价为7.5万美元。


大狗机器人Spot能走、能跑、能上楼梯,在被踢之后仍然能够自行调整,恢复正常站立姿态,甚至能够为同伴开门。


根据媒体报道,2021年波士顿动力为机器狗升级了3.0软件版本,它可以帮助Spot机器狗在没有人为干预的情况下完成工作,比如即使有人在前进路线上放置大障碍物阻挡,Spot也能自动调整路线,平稳前进。


机器狗Spot开门


在国内,南京蔚蓝智能科技是目前在机器狗领域发展较为领先的公司之一。


公司于2019年向特定客户发布了世界上第一款四足机器人形态的个人机器人产品——阿尔法机器狗AlphaDog,这是世界上第一台行走速度超过3米每秒的量产四足机器人,也是世界上第一个定位为通用型四足形态的个人机器人产品。


2020年初,蔚蓝再次正式发布阿尔法机器狗的升级版C系列、E系列。


阿尔法机器狗采用先进的软硬件技术架构、机械设计、智能算法、运动控制算法,能够实现丰富的运动功能,目前可实现九种步态,包括平衡站立、常规行走、常规小跑、自由小跑、小步快走、小步快跑、踱步、跳跑、奔跑等,同时具备推动恢复、侧向移动、摔倒自动翻身等能力,是一款较为成熟的四足机器狗。


尽管“机器狗”的能力很强,但目前它们还无法与真实的动物相媲美,部分原因在于要直接从“真实的狗”身上学习或模仿,像它们一样做各种动作是很难的。


通常狗的动作会被捕捉到,但对脚、关节等关键点要进行仔细追踪,这要求在训练过程中,研究专家要具有高度洞察力,对每一个技能进行冗长、细致的观察,不断调整。


而且真实世界不是一个二维平面,也没有理想化的摩擦力规范,未经修正的模拟步态会让“机器狗”摔倒在地上,研究人员要在模拟中引入随机性元素,并通过学习适应这种随机性。


目前“机器狗”的研发取得了很大成绩,但研究工作还在继续。


如上面所介绍的,机器人与机器狗已经拥有非常接近人类的动作、行为与表情,但是从目前来看,上述各类机器硬件要完全达到人类的行为模式还有一段距离,其中最主要的原因是目前的机器硬件无法模仿人脑。


图灵奖得主朱迪亚·珀尔(Judea Pearl)在著文《为什么:关于因果关系的新科学》中谈到,对于人的三种不同层级的认知能力的区分:观察(seeing)、行动(doing)、想象(imagining)


第一层是观察能力(依靠强大的判断能力形成经验,目前的深度学习算法仍处于这三层认知能力的第一层),


第二层是干预能力(只有理解因果关系才能从第一层认知上升到第二层级),


第三层是反事实能力(涉及人类的想象与反思能力,构建人类大脑的思考体系)。



我们目前处于第一层观察能力提升的阶段,正在通过知识图谱等技术实现向第二层干预能力的跃迁,那么当前面临的问题是什么?


我们从信息输入与分析路径来看,首先信息的输入类型主要分为三种,分别是语言输入(包括词、句、文本)、图像输入(包括图像、视频)、数据输入(包括结构化数据、半结构化数据、非结构化数据)。


三类输入方式分别基于不同的输入路径:


(1)语言输入需要提炼知识要素,包括概念、对象及概念间的关系,进而抵达知识表示(节点、边、关联)。


(2)图像输入则需要通过图神经网络转化为知识表示。这时以知识表示的语言输入与图像输入将进入知识存储——基于图结构存储中。


(3)数据输入将进入知识存储——基于表结构存储中;


随后语言输入、图像输入、数据输入都将直抵知识表示(节点、边、关联),以知识表示的上述三类输入在合成后进入知识推理(知识工程的逻辑系统,含因果推理),再进入知识建模(构建模拟大脑思维过程的系统,即构建归纳、抽象、创意等仿脑的认知计算机制)。


自进入知识存储直至知识建模一直依托知识图谱(含机器学习 / 深度学习、大规模语义网络、因果推理、人机交互等)为平台。


所以从这个路径来看,现在的问题是:构建模拟大脑思维过程的系统,即构建归纳、抽象、创意等仿脑的认知计算机制尚未得到解决。


四、AI让硬件知彼知己,心中有底


潘云鹤院士认为:人工智能走向2.0的本质原因是人类世界由二元空间(P,H)变成三元空间(P,C,H),“知彼知己,心中有底”。


智能硬件是信息世界与物理世界互动的界面和工具,软件是最佳化算法训练下能够解决某一具体任务的神经网络架构。


1980年乔布斯时代以来,越来越多软件正在整合到硬件中。


当硬件不只是提供引擎功能,当软件不仅仅是运行的一个程序,硬件即走向普遍存在、情感感知、超连接性(连接其他设备、连接物理世界、连接各种通信渠道),即干掉屏幕,成为身体的衍生品,甚至独立成可以顺畅交互的独立产品。


在通用AI技术及平台的趋势下,AI让硬件说话,将走向万物皆可触景深析的时代——新硬件主义时代。


新硬件主义时代源自美国,是以强大的软件技术、互联网、大数据为基础,以极客与创客为主要群体,以硬件为表现形式的一种新产业形态。


区别于计算机硬件,新硬件主义是一切物理上存在的,在过去的生产与生活中闻所未闻、见所未见的人造事物。


全球科技巨头均有这一方向的些许思路或想法。


• 腾讯Robotics X实验室及腾讯AI Lab负责人张正友博士曾介绍:


腾讯将人工智能(AI)、机器人(RoBotics)和量子计算(Quantum Computing)的全新ABC组合,腾讯Robotics X的主要任务是攻克A到G的7大技术突破点:


一是攻克“ABC”基础能力,即人工智能(AI)、机器人本体(Body)与自动控制(Control);


二是探索“DEFG”机器智能,包括进化学习(Developmental Learning)、情感理解与拟人(EQ)、灵活弹性(Flexibility)等能力,最终实现成为人类守护天使(Guardian Angel)的终极目标。


腾讯Robotics X希望与学界和行业开放合作,共同创建人机共存、共创、共赢的未来,这个使命包括四个部分:增强人的智力,发挥人类体能潜力、关怀人的情感,最后通过人机协作,完成人类所需任务


其中,我们认为增强人的智力、关怀人的情感更多将实现于元宇宙的前半场;发挥人的体能潜力、实现人机协同预计更多显现于元宇宙的后半场。


• 微软AI发展致力于研究“可解释的AI”领域。


微软亚洲研究院副院长张益肇针对AI、AI+的诸多应用评价:AI技术不断发展重塑我们的生活与各行各业,并推动产业向数字化、智能化转变,通过与AI结合,金融、交通、医疗或为首批获利企业。


我们常说ABC,A——强大的算法(Algorithm),B——海量的数据(BigData),C——大规模的计算(Compute)


如何推动行业与AI结合?


AI赋能行业ABCDE(五大关键因素),D——专业的领域(Domain),E——生态链(Ecosystem)


ABC三大因素是AI的基石,也是数字化转型的基础,产业数字化转型还需D——专业领域与E——生态链两大关键因素,专业领域指任何AI落地的场景,需行业专家一起参与(如在A+医疗方向,微软很多应用是与辉瑞等医药企业一起共同完成的)。


除落地的场景之外,AI在行业的发展还需要一个完善的生态链。


• 2019年9月,谷歌声称已经达到“量子霸权”,打造出第一台能够超越当今最强大的超级计算机能力的量子计算机,能够在3分20秒内完成当今最强大的超级计算机Summit需要约10000年才能完成的计算量。


众所周知,当前人工智能产业发展的三大主要推动力为深度学习算法、大数据、云计算。


量子霸权的实现,不仅可以大大加快深度学习计算的速度,提高深度学习的实时性,拓展深度学习的应用领域,促进人工智能产业化纵深发展,而且可以加快类脑智能等新型算法与技术的研究进程,推动人工智能向更高层次的跃迁。


人工智能的发展可分为感知智能、认知智能、决策智能三个阶段,目前处于感知智能阶段,依靠深度学习算法,而欲进入认知智能阶段,则要依靠类脑计算,到未来决策智能阶段,业内判断需要量子计算来实现。


AI重塑硬件的前一步,是通用AI技术的成熟。


人工智能领域进行的整合,视觉、语音、自然语言、强化学习等是完全独立的,当下都是基于机器学习,尤其是神经网络,虽然架构多种多样,但类似之处是,都在利用大规模数据集,都在进行神经网络的优化,最近两年,几乎所有领域的神经网络架构开始统一到transformer,这一架构要么作为强大的基线,要么就是最先进水平,输入可以是词语序列、图块序列、语音片段、强化学习的(状态、行动、奖励)序列,可以接受任意种类的token,是一种极简又灵活的建模框架。


即使在同一领域(如视觉),过去在分类、分割、检测、生成等不同任务也有不小的差异,如今也都转到了同一框架。


大脑皮层对其各种输入模式也有一个高度统一的架构,也许自然界也碰巧找到了一种类似的强大架构,并以类似的方式进行着复制,只在细节稍微做出些变化。


这种神经网络架构上的整合,会反过来聚合、集成软件、硬件、基础设施,并进一步加快整个人工智能的进展。


倘若架构统一,芯片是可能做针对性优化的,类似图形计算针对OpenGL与DirectX的优化。科幻世界中的通用人工智能,可能距离我们真的不远了。


国际欧亚科学家院士、深圳市AI与机器人研究院副院长、IEEE Fellow李世鹏在《万物互联、集智过人》演讲中,谈到从IoT(物联网)到AIoT(人工智能物联网)再到IIoT(智物联网)的发展过程。


我们认为物联网是初级阶段,IIoT则是AI反向映射入现实物理世界时,AI重塑现实物理世界的必然结果。


在这个过程中,即元宇宙的后半场,AI显现为新硬件形态——包括机器人。


我们特别关注AI在情感感知方向的进展,人类有多种多样情绪,可通过面部肌肉与器官移动完美表达出来,人类的表情提供了解他们情绪的窗口。


但这种情感表达能力并非人类独有,根据外媒报道,美国加州理工学院神经学家大卫·安德森(David Anderson)等研究人员,使用机器学习算法,成功破译了实验室中老鼠看似难以理解的面部表情。


研究人员表示,这项研究将帮助揭开情绪的神秘面纱,以及它们在大脑中是如何表现的。


以此为例,人们在不断借助生物学、深度学习等方式的研究,去探索人类情绪变化的本质原因,因为只有在破解这种人类“情绪密码”的基础上,才能够更好地在新硬件形态上实现情绪表达能力的复现,从而使硬件更具有“人格”。


五、AI与新硬件驱动下的全息社会


元宇宙不是现实物理世界的镜像,它开启数字文明时代,且一定会囊括现实物理世界。


其囊括的具体路径,首先是以通用型硬件,将人承接入元宇宙这一新计算平台;


其次是AI由执行一项任务进化为竣工用户的根本需要,创造出人更多的新需求;


最后是AI以分布式的垂类新硬件显现在现实物理世界中,肢解通用型硬件的平台性地位。


社会是意志与行为的产物,元宇宙中的AI与现实物理世界中的新硬件,襄助甚至无限逼近于人的意志与行动。


为什么我们认为元宇宙会用AI与新硬件来重塑现实物理世界呢?


现实物理世界是三维世界。


元宇宙作为下一代计算平台,它脱胎于互联网、移动互联网这二维世界。


元宇宙的定义,即用划时代的通用型新硬件入口来开启的三维数字世界,基于此,元宇宙与当下的现实物理世界是平行、横向的关系;


互联网、移动互联网这二维的数字世界,是三维现实物理世界的投影。


元宇宙与现实物理世界并行,科技的需求会指向元宇宙对现实物理世界的叠加,这种叠加,我们认为是对现实物理世界的重塑,重塑的过程即虚拟数字人显现为机器人、AI显现为分布式垂类新硬件的过程。


重塑完毕后,现实物理世界的“物”会被彻底重塑,以满足机器人与AI(分布式垂类新硬件)在现实物理世界竣工用户(人)的根本需要;


重塑的过程也伴随着人在现实物理世界的需求,由机器人与AI(分布式垂类新硬件)的供给来决定。


此前论述中,我们已经深刻剖析了“供给决定需求”的成形脉络。


着眼于当下,人的需求只有现实物理世界的需求(当下互联网、移动互联网是现实物理世界的投影,人在互联网、移动互联网数字世界的需求,也是现实物理世界的投影);


进入元宇宙,习惯了供给决定需求的人,会被AI、感官体验的增加供给出更多的需求。


人习惯了更多的需求,AI作为科技最前沿的表现形式,它的需求则会反向映射入现实物理世界。


AI叠加于现实物理世界,一方面,用它显现为新硬件或机器人的供给,来满足人在未来现实物理世界的需求;


另一方面,AI真正适配的是智能化、智联网化的操作环境——未来的现实物理世界。


AI为何要叠加于现实物理世界?


我们在《元宇宙大投资》中剖析了科技的需求,我们认为AI会反向映射入现实物理世界;


从另一个角度看,有观点认为物质与信息均是能量波,而观测者是第三个能量波,来渲染物质与信息;


观测者的内在认知就是它的频谱,决定了它能渲染出跟它相应的图像、相应的现实存在。


当下现实物理世界的观测者是人本身,于是当下的物是人靠自己的认知渲染出来的现实物理世界的存在;


元宇宙后半场,AI反向映射入现实物理世界后,AI作为观测者,会基于AI的认知来渲染跟它相应的图像、相应的现实存在。


故,未来的现实物理世界是AI重塑过的,其中重塑的主要对象是“物”,重塑过程中的显现即分布式垂类新硬件(包括机器人)。


“全息宇宙理论”诞生于20世纪80年代。1982年,在巴黎大学的一个物理实验室,科学家们发现在特定的情况下,如果我们把基本粒子,比如说电子,同时向相反的方向发射,它们在运动的时候能够彼此互通信息。


这种现象让人感到惊讶的地方在于,粒子之间的通信联系几乎不需要时间间隔,这就违背了爱因斯坦的理论:没有任何通信速度能够超过光速,因为一旦超过了光速,就等于是能够打破时间的界限。


这个现象令很多物理学家着迷,他们都试图用复杂的方法来解释这个现象,其中美国量子物理学家与科学思想家戴维·玻姆(David Joseph Bohm)抛出了一个非常大胆的想法:客观现实并不存在,尽管宇宙看起来具体而坚实,但其实它只是一个幻象,是一张巨大而细节丰富的全息摄影相片。


这被称为“全息宇宙理论”


为了解释这一理论基础,我们可以尝试设想一下:当你在鱼缸中只放入一条金鱼,将鱼缸用不透明的罩子罩住,只在两侧面分别开一个小孔。


然后你透过这两个小孔观察鱼缸中的这条金鱼,可能在一个孔里,你会看到金鱼的尾巴,而在另一个孔中,你会看到金鱼的侧面。


如果在一个孔里,你看到鱼在水平游动,在另一个孔里鱼似乎是静止不动,那么这时你会认为这是两条毫不相关的金鱼。


但是如果继续观察这“两条”鱼,你会发觉二者之间存在着某种特定联系。当“一条鱼”转身时,“另一条”也会做出相应动作;


当“一条鱼”面对前方时,“另一条”总是面对侧方,你是否会以为这“两条鱼”在互相沟通传信,所以才做相对应的运动?


但事实显然并非如此,这“两条鱼”其实只是一条鱼的两个部分。


所以回到上述实验室中所产生的那个现象,两个不同的电子,就算在无限远的距离,也能违背已知物理规律,互通感应,协同运作,那么它们是不是也像我们看到的那“两条鱼”一样,其实就是一个整体呢?


透过这个实验进行大胆猜想,现实宇宙可能还有更高维度、更复杂的“超级宇宙”,我们其实都是宇宙中“无数条鱼”,阻止我们看到全貌的是那个不透明的“罩子”。


从这个“超级宇宙”里观看我们所处的宇宙,实际上一切事物都是相互关联的,所有的基本粒子都不是分离的“独立部分”,而是更大整体的一个小片段。


元宇宙进一步将世界推向三维立体化,并将借助AI这一强大的底层机制,更清晰地找出事物之间的关联。


尽管可能短期内其发掘的关联也是不可解释的,但是透过全息宇宙理论,我们能够发现不仅仅是整体中包含局部,局部中也可能包含整体,在不断抽丝剥茧的过程中,社会将变得越来越可知,越来越趋向于全息社会。


元宇宙之前的现实物理世界,人是观测者,人的认知决定了现实物理世界的呈现;


元宇宙是三维物理世界降维映射在互联网、移动互联网后又升维了人的其他感官体验,进而升维成三维。


互联网与移动互联网完成了人的需求由“需求决定供给”到“供给决定需求”的转变。


元宇宙中AI成为与人并肩的新生产要素,AI作为元宇宙中的观测者,反向映射入现实物理世界后,渲染现实物理世界中的物质与信息,重塑一遍现实物理世界中的“物”,显现为各类新硬件。


这时的新硬件只是显现形式,内核仍为AI,新硬件作为质点,具足元宇宙与现实物理世界中的信息与它们的相互关系。


当AI重塑了现实物理世界中的“物”,伴随着AI将从感知终将走向认知,社会运行将越来越趋于全息,即一切均可知、没有不对称。


如果说“以人为本”对个人的启示,是对“创造力与判断力”的重新认知,进而内化到个人的价值观与人生观中,去创作,去显现;


那么“全息社会”对企业家的启示,也是要内化到企业的管理理念中,重启企业家自身以及整个企业的管理理念。


2010—2014年制造业的“用工荒”,迫使大工厂五六十岁的厂长们,要经常组织并陪着年轻员工参加各式活动,增强认同感;


而当Z世代进入职场,“一言不合就离职”,不少管理者感慨“00后”比“90后”还难管。


一代代年轻人越来越个性化,背后有社会、科技进步的诸多因素。


在我们的框架中,新硬件主义是重塑现实物理世界,科技的进步会更快速,科技在元宇宙中会更加释放个人的个性化,进一步反向映射入现实物理世界并进一步迎合人的需求……直至全息社会的到来。


全息社会对企业家的挑战十分显著,一方面越来越多有创造力的个人会“企业化”,人才争夺的成本更高;


另一方面对企业的经营模式(企业所处的产业链各环节预计将有巨大变化)、组织管理带来巨大挑战。


全息社会听上去仍然“很远”,但全息社会到来之前,社会层面的运行基本会呈现出全息社会的轮廓。就像元宇宙尚未真正到来(多数人觉得“还早”),但元宇宙的部分特征已经呈现在当下的现实世界中。


如虚拟数字人在中国的发展如火如荼,如当下大品牌的代言人正在加速去选择有专业度、辨识度、影响力的“非明星”。


六、新硬件产业链未来的革新


根据定义,智能硬件是以平台性底层软硬件为基础,以智能传感互联、人机交互、新型显示及大数据处理等新一代信息技术为特征,以新设计、新材料、新工艺硬件为载体的新型智能终端产品及服务。


新材料驱动下的新工艺的巨大创新空间,将驱动硬件未来的产业链革新。


新材料方面,预计未来会有极大的创新空间,如研发某种具有活性的液态金属,并以其为载体发展机器人或智能产品。


清华大学刘静教授研发出一种具有某些“生命”特征的液态金属,如具有能“吃”(吞下铝箔),可“移动”(吃饱后就四处移动,动作还特别灵活,能转弯,能跳跃),还会“思考”(碰到拐弯或难以通过的地方还会停下来思考一下)等某些“生命”特征。


这种液态金属应用前景广阔,如制作智能马达、血管机器人等。


新工艺方面,预计有重塑的可能性,如3D打印这一增材制造的工艺。


3D打印的技术名称为“增材制造”(Additive Manufacturing),简单来说,是把数据与原料放进3D打印机,用程序控制物质的形状、构成,将材料逐层堆积后制造出实体物品。


传统制造业采用的材料加工技术多为“减材制造”,即通过切削原材料生成新产品。


1986年,美国科学家查克·赫尔(Chuck Hull)发明了第一台3D打印机,开启了该技术在业内的广泛应用。


2012年,《经济学人》杂志在封面报道中重点讨论了3D打印技术,并将其称为能引发“第三次工业革命”的众多突破之一。


2015—2016年是行业热度的最高峰,据市场调研机构艾媒咨询发布的数据,2016年,中国3D打印市场的规模约为109亿元,同比增长了38%。


但2015年这一轮的3D打印潮流,受限于精密程度,只能打印外壳等大物件,打印精密程度较高的内部构造则会有具体参数的明显错误。


2020年以来的新冠肺炎疫情让3D打印技术再次回归大众视野。


面对医护物资短缺问题,一些设计师、制造公司利用这项技术制作防护面罩、护耳夹、呼吸阀中的关键部件,3D打印一时成为救场奇兵。


与传统制造相比,3D打印更适合于机器人等硬件的制造,原因在于传统制造的优势在于规模化生产,通过将大规模的产品尽可能分割为标准化组件,然后在流水线上进行批量生产从而降低成本,但会产生一定的成本。


而3D打印采用增材制造方式,通过打印的方式直接成型,因此省去了传统制造业中原材料、零部件的生产运输与组装环节,能够节省劳动力与运输、物流成本,但每次开模可能面临较高的成本,因此适合生产个性化、定制化的产品以及高边际收益的产品。


新设计方面,是目前智能硬件正在发力的方向,尤其是未来的分布式垂类硬件,这也是我们本书所推演的核心关键。


我们认为随着元宇宙世界对人类情感需求的放大,将会衍生出非常多的垂类硬件来承接人类的情感需求或者是数字人的情感需求,这也是未来科技巨头可能面临的机遇与总决战的方向之一。


我们拭目以待的同时,呼吁中国企业特别关注分布式垂类硬件的创新,我们认为这是中国胜率更高的发展方向。


【声明】内容源于网络
0
0
数组智控产业发展科技院
以AI技术为底层能力,聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域,提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。
内容 986
粉丝 0
数组智控产业发展科技院 以AI技术为底层能力,聚焦智慧园区、城市公共安全、数智警务、健康医疗、能源电力、科研实验及平安校园等领域,提供从感知到决策的全流程软硬件一体化的国产装备智能体产品解决方案。
总阅读450
粉丝0
内容986