大数跨境
0
0

AI能产生意识么?

AI能产生意识么? 鸣鹤睿思
2025-09-19
0

这不是科幻设问,而是工程问题:要不要、以及如何在机器里实现一套“能记得自己刚刚注意过什么、并据此调度全身资源”的控制层

本文介绍 Joscha Bach 的皮层指挥理论(CTC):把意识视作大脑上的一层“指挥—协议”虚拟机,而非宇宙的神秘属性。它主张——当系统拥有可回放的注意协议与能统筹目标、冲突、增益与参数的指挥层时,现象意识就随之出现;缺了它,智能也能跑,但更像“高功能梦游”。

Bach 的意思是:意识不是“基本物理属性”(像电荷/质量那样),而是大脑在物理基底上运行的一层“虚拟机/用户界面”(virtual machine / UI)——一种信息-计算层级的功能。就像“软件不是螺丝钉”,但软件100%依赖硬件运行;意识亦然:非基本物理,但完全由物理实现

Joscha Bach是德国认知科学家/AI 研究者,主攻认知架构、动机-情绪计算、心智表征与意识。
皮层指挥理论:通向在 AI 模型中处理意识的路径(2018)

摘要

关于心智的 AI 模型很少讨论所谓意识这样的“困难问题”。在此,我将非正式地勾勒一种对现象意识的可能功能性解释:皮层指挥理论(CTC)。不同于 IIT(整合信息理论),CTC 是一种功能主义的意识模型,与 Dennett 和 Graziano 等人提出的其他功能主义取径具有相似性。

关键词: 现象意识,皮层指挥理论,注意,执行功能,绑定,IIT

“从未有一台计算机被设计成能意识到自己在做什么;但我们大多数时候也一样。”——Marvin Minsky


引言:把人工智能视为心智的计算科学

理解我们心智的本性及其与宇宙的关系,一直是哲学试图回答的最重大的问题之一。

几个世纪以来,科学家与哲学家都强调数学在这项探索中的作用。对计算这一思想的发现及其在 20 世纪 20 年代由 Alan Turing 与 Alonzo Church 的形式化,为一种关于思维的全新思考方式铺平了道路,用更为精确的计算主义取代了旧有的机械论直觉,并开启了构建一族关于计算系统理论的道路。

数学与计算之间的关系并不简单。即便计算是以数学方式被定义(而且可以说构造数学本身就是计算性的),把二者理解为相互独立的领域是有意义的。数学是所有形式语言的领域,允许表达任意命题(其中大多数是不可计算的)。计算可在计算系统的框架下被理解,例如通过定义状态(可辨别差异的集合,即“比特”)以及使我们能够导出新状态的转移函数。就此而言,数学是规范(specification)的领域,而计算是实现(implementation)的领域;它涵盖一切可以被真正实现的系统。

计算系统是可以先验且系统性地描述的机器,并且能够在任何能够引出必要因果属性、从而得以捕获相应状态与转移函数的基底上实现。

对“与基底无关的机器”的缺乏理解,曾使莱布尼茨否定机械主义哲学:“知觉以及依赖于它的东西(即认知),无法用机械方式加以解释,也就是用形状与运动来解释。假设有一台机器,能带来思想、经验与知觉;那么完全可以设想将它按比例放大到能让人进入其中,如同走进一座磨坊。在这样的前提下,人们对它进行检查时不会发现除彼此推动的个别部件之外的任何东西——而永远不会发现能够据以解释知觉的任何事物。”(1714)与此相反,对这一点的预感促使拉美特里(Julien Offray de La Mettrie,1748)宣称心智虽是机器,但必须被视为“不朽”且“超验”的。

计算有时被视为与动力系统相对立(见 van Gelder 1998)。我们可以根据计算系统能有效计算(在无限制情况下)与高效计算(在合理受限资源下)的函数类别来区分不同类型的计算系统:从(确定性或概率性的)有限状态机图灵机,再到不同类别的超计算机,它们能够进行连续状态变化,甚至是非因果的计算机,允许转移函数使用来自机器未来状态的信息。我们发现,尽管动力系统往往无法在有限状态机(例如冯·诺依曼计算机)上被有效计算,但它们常常可以被高效逼近。(至于我们的宇宙只能实现有限状态机还是也能实现超计算,这一问题在形而上学上的含义是深远的,并且有时会在心灵哲学中引发关注,但这超出了本文的讨论范围。)

一种关于心智的新型计算性研究的建立,自一开始就困难重重。到 20 世纪 50 年代,实证主义的影响导致心理学中行为主义的出现与固化,它扼杀了理论心理学的发展,使心理学家显然不可能提出关于心智的综合性理论,于是新的学科被建立起来:人工智能。它是由 Marvin Minsky、John McCarthy 等思想家发起的努力,试图把心智当作一个计算系统来处理,从而通过构建试图复现心智功能的计算机器,将对心智的研究开放为一种可实验的探索。

人工智能很快分化为两派:一派致力于研究“智能”本身,另一派聚焦于自动化那些需要人类智能的任务。尽管两派都在开发应用与理论,且经常研究相似的系统,但“认知式 AI(cognitive AI)”与“狭义 AI(narrow AI)”之间的裂痕持续扩大,部分原因是认知式 AI 阵营中的大批学者拥护符号主义方法,并将神经学习斥为过于简化。早期关于机器智能的一些乐观承诺未能兑现,再加上文化上的抵制,导致认知式 AI 的经费被削减,最终促成了新学科“认知科学(Cognitive Science)”的诞生。然而,认知科学未能形成一致的方法论与理论视角,而逐渐成为神经科学、AI、认知心理学、语言学与心灵哲学的总称

在过去五年里,AI 研究主要被深度学习的成功所主导;其动力来自对多隐层神经网络训练的理论洞见、计算硬件的进步,以及大规模训练数据的可得性。学习型机器的迅速进展,使人们重新对 AI 的最初目标产生兴趣,并推动了关于学习、本体知觉(perception)与心智表征之本性的思想传播与发展。然而,可以说,近期的进步主要源自狭义 AI 阵营的成功,整个 AI 领域对“心智研究”本身已不再那么关切。要在这一前沿上取得进展,或许需要我们对心智架构、推理、语言、反思、自我模型与意识有更好的理解。

认知科学中的意识

尽管 AI 在能动性(agency)自主性动机与情感认知架构与认知建模方面积累了大量工作,但对于如何处理通常所说的意识“困难问题”,共识很少。系统如何可能采取第一人称视角并拥有现象体验

对于现象意识,近年较为知名的一种尝试是 Guilio Tononi 的整合信息理论(IIT)(2012,2016),这一理论得到神经科学家 Christof Koch 与物理学家 Max Tegmark(2014)的支持。或许与莱布尼茨并非全然不同,Tononi 主张体验不可还原为功能机制,因此它必定是系统的内在属性,而不是功能属性。他用参数 Φ(phi)来刻画意识:Φ 衡量的是在对一个信息处理系统进行所有可能划分时的互信息总量如果系统中的信息高度整合(即系统各部分中的信息与其它部分信息强相关),这就指示出高度的意识。正如 Aaronson(2015)所论证的那样,IIT 的信息整合判据或许是必要的,但并非充分,因为我们可以构造结构上很“贫乏”却能最大化 Φ 的信息处理系统(例如通过高度互联的 XOR 门来最大限度地分布信息)。我们是否应当把意识归于这些处理电路——而它们无法表现出我们通常怀疑具有意识的系统(如人类与其他高等动物)所具备的那些有趣行为

计算主义的视角看,IIT 带来一个问题:两个系统若以功能上相同的状态序列计算同一函数,它们仍可能因为实现该因果结构的计算元件的布置不同而具有不同程度的意识。于是,一个计算系统可能无论其行为如何(包括它所有自述其现象体验的言语),都可能被判定为有意识或无意识——这取决于它物理基底的布局,或者是否引入了分布式的虚拟机层

一个更务实的批评来自对有意识无意识者的观察:梦游者(somnambulist)(通常不被视为有意识)往往能回答问题、在房屋内导航、开门等,因此她的大脑皮层活动很可能与清醒、有意识的人在分布上相似(Zadra 等,2013)。从这个意义上说,Φ 的差异大概只是量的、且不大,而意识本身的差别却是质的且巨大。这种质的差别,或许可以用大脑中特定而局部的功能缺失来解释:虽然她的皮层仍然产生通常的内容,也就是说仍在处理感觉数据,并据此生成关于声音、图形、物体、空间等的动态体验,但通常会对这些体验加以注意并把它整合进某种“记录(protocol)”的那一部分处于离线状态。这种“被整合的体验”并不等同于 IIT 所说的信息整合;相反,把它理解为“皮层乐队众多成员之一所执行的某个局部协议”更为贴切:那就是它的指挥(conductor)

在本文中,我将基于我此前在认知架构领域(Bach 2009)的工作,勾勒一个计算模型如何能够说明意识的现象学与功能性;我们可将这种取径称为“意识的皮层指挥理论(CTC)”。

从 AI 的视角看心智

有机体演化出信息处理能力,以便在环境扰动之下调节其系统性需求。最简单的调节器反馈回路:系统测量某个当前值,并施加一个控制操作,使其接近目标值。利用第二个反馈回路来调节第一个,系统就可以存储一个状态,并根据另一个值来调节某个值。通过改变控制变量以最大化某个回报(reward)变量,系统可以学习近似一个复杂的控制函数,该函数把一组输入(传感器)的取值映射到操作器(效应器)上。

我们的神经系统拥有大量反馈回路(例如脑干调节心率呼吸模式的机制)。

对行为的控制需要更复杂的信号;边缘系统的传感器测量有机体需求的变化,并在需求得到满足时以愉快信号(pleasure)作出反应(指示应当强化当前行为)。需求受到挫败会引发不愉快信号(痛,pain),它指示应当停止当前行为。

一个系统的定向行为可能受冲动(impulses)支配;冲动把情境(有机体外部或内部环境中的复杂模式)与行为关联起来,以便获得未来的愉快避免未来的痛苦充当奖励信号,在情境—行动—需求之间建立关联(见 Bach 2015)。在哺乳动物中,这样的连接例如在海马体中建立(参见例如 Cer 与 O’Reilly 2006)

人类新皮层通过把感觉模式编码进一个关于环境(包括内部环境)的复杂分层模型,从而实现对需求的更好调节。这个动态模型不仅是从过去观测未来观测的映射,而是形成一个持续更新的有状态函数的形态——一段生成环境模拟程序

该模型的形成在很大程度上由数据压缩所驱动,即在过去观测的基础上,优化能最好地预测未来观测的数据结构。这个原理例如由 Ray Solomonoff(1964)提出:一个计算体能形成的关于其环境的最佳模型,是在所有能最好地由过去观测预测观测的程序之中最短的那个,对所有观测与过去观测皆然。

关于心智的机器学习模型可被理解为对索洛莫诺夫归纳(Solomonoff induction)近似(见 Hutter 2005):把世界表面的不变性捕捉到一个近乎静态的模型中,并把其变动作为该模型的可变状态。通过改变状态,这样的模型不仅能表达世界的当前状态,还可用于预期并探索可能世界,用于想象、创造与记忆。机器学习系统已经展示:循环神经网络能通过形成低层特征探测器来发现并预测视觉听觉刺激的结构,进而逐级组织复杂的高层特征、对象类别与概念流形(LeCun、Bengio、Hinton 2015)。深度网络能够形成分层的知识表征LSTM(Hochreiter 与 Schmidhuber 1997)与 GRU(Cho 等,2014)是循环神经网络的构件,能够学习操作序列生成式神经网络可以利用从数据中学到的约束生成可能世界(Dosovitskiy 等,2015)。

尽管当前的机器学习系统在许多需要在大型问题空间中发现与操纵因果结构的复杂任务上胜过人类,它们仍远未成为好的智能模型。部分原因在于我们当前的学习范式,它们导致在组分化知识(compositional knowledge)序列控制结构的生成上存在局限,这些将会随着渐进的进展而被克服。近来,不少研究者提议在神经学习中引入一种类似皮层柱(cortical columns)组织单元(Hinton 等,2011)。皮层柱是包含100–400 个神经元基本电路(Mountcastle 1997),并且可能被作为回声状态网络(echo state networks)(Jaeger 2007)来训练,以实现函数逼近条件绑定(conditional binding)奖励分配等功能。

在人类新皮层中,这些柱状单元与其近邻形成高度互联的结构,并与相邻皮层区中的感受野选择性相连。一个皮层区大约包含 10^6 到 10^7 个柱状单元,可以被看作是新皮层乐队中的一种专门化乐器

超越当前的机器学习

许多当前机器学习范式的一个更重要的局限,是它们专注于策略学习与分类。我们的心智并不是分类器——而是模拟器与体验者。与机器学习系统相似,它们按部就班地学习在感觉输入的模式中识别特征,然后把这些特征组合复杂特征,并组织成地图。高层特征可以被整合为动态几何与对象运动模式与程序听觉结构,等等。特征、对象与程序感觉-运动脚本,它们允许对心智内容进行操纵,并执行运动动作


不同于大多数机器学习系统,我们的心智把这些对象、地图与程序性的动态组合成一个持久的动态模拟,该模拟可用于在我们与环境的系统接口持续预测知觉模式(图 2)。由我们“皮层乐队”的感受野形成的处理流,能够自下而上地提示知觉假设(对象、情境等),并触发对这些假设的自上而下验证,以及把特征绑定成一个凝聚的模型状态

这个模拟的要素不必然对应于宇宙中的真实对象:它们是我们的心智在其系统接口处的模式中发现的统计规律。我们的体验并指向那个模式生成器(宇宙)本身,而是指向我们新皮层所生成的模拟。因此,我们的心智不能在一个“外在”的现实中体验与运作,而只能在一个由可得感觉输入既往输入的语境所约束的梦境中进行(Bach 2011)。

然而,人类认知并不止步于生成式模拟。我们可以将心智表征抽象为一个概念流形(图 3)。可以把概念看作我们感觉-运动脚本地址空间,它们既允许在对象之间进行插值,也允许通过推理操纵并生成此前未知的对象。这个概念流形可以通过语法化语言来组织与操纵,这使得说话者之间即便缺乏相应的感觉-运动脚本,也能实现概念的同步。(语言本身足以推断概念流形的形状这一事实,解释了基于海量文本语料统计性质机器翻译之成功,尽管这些系统无法产生相应的心智模拟。)

皮层指挥

皮层柱可以被视为基本的“代理”,它们在发育期的强化学习作用下自组织为更大的脑区级组织单元。皮层乐队的活动高度分布式且并行化,无法被作为一个整体来体验。然而,其演奏由一组充当指挥脑区来协调。这个指挥并非“小人(homunculus)”,而是与其他“乐器”一样,由一组动态的函数逼近器构成。多数皮层乐器(instruments)调节的是有机体与环境(或被预期、被反思、被假设的环境)之间的动力学与交互,而指挥调节乐队自身的动力学。基于来自动机系统的信号,它提供执行功能(即在任意时刻决定系统承诺哪些目标),解决皮层代理之间的冲突,并调节它们的激活水平与参数化

缺少指挥的情况下,我们的大脑仍能执行其大部分功能,但我们就像梦游者:能够进行协调的知觉与运动行动,却缺乏中心的一致性与反思

在人类大脑中,指挥的功能很可能由以下区域所促进:背外侧前额叶皮层(Bodovitz 2008;Safavi 2014;Del Cul 2009)、前扣带皮层前岛叶(Fischer 等,2016)。指挥与大多数区域之间存在注意连结。在每个时刻,它把注意定向一个或几个皮层乐器上,而其他乐器则在背景中继续未被观察地演奏。指挥未必能够完整访问它所注意的那一脑区的活动,但通常可以访问该区域当前相关的一些处理状态与参数

为了学习反思指挥维护着一个协议(protocol),记录它曾经注意到的东西,形式是一系列通往由其他皮层乐器生成的体验的链接。该协议可用于寻址当前活跃的脑区,并通过以存储的链接参数重新激活相应的活跃区域配置,从而部分重建心智模拟的过去状态。对心智模拟过去状态再激活,会生成一个先前世界状态的再演(re-enactment):这就是记忆。对协议记忆进行进一步抽象,会导致新型感觉-运动脚本的形成:自传式记忆(发生在该代理身上的事件)与程序性记忆

协议反思性访问使得学习对过去事件的外推成为可能,而且访问协议这一行为本身当然也可以成为协议的一部分。通过访问对自身协议的访问的记忆,系统记得自己曾经获得对体验的访问接入意识,access consciousness)。

尽管所有皮层区域都会因为更新其模型学习与动机信号的关联存储信息,但指挥的注意协议唯一体验加以整合的地方。未被整合进协议的信息无法在系统的反思中具有功能相关性,无法纳入其言语产出凝聚自我模型的生成,也无法成为接入意识的对象。

现象意识或许可以被简单理解为我们前额叶皮层最近所注意到之事的记忆。因此,有意识的体验并不是置身世界内在空间的体验,而是一种记忆。它是由五十多个脑区生成的梦境重建,这一重建反映在单一脑区协议之中。通过把注意指向自身的协议指挥可以存储再现自身“处于有意识状态”的体验的记忆

“我们在当下实际上并不有意识,而只是记得自己曾经有过意识”这一观点,与我们对意识体验中已知的不一致性相一致,例如主观时间膨胀错误的连续性以及有意识体验中的循环主观时间的膨胀出现在高度唤醒的状态(例如事故中),而平淡的心流状态常导致主观时间的收缩。不论膨胀还是收缩,都不对应我们认知操作的实际处理速度的增减;相反,它们源于协议记忆中的记录条目数量的多寡:在事后回望时,所体验的时间间隔只是看起来更长或更短。极端的主观时间膨胀可能发生在梦境中:有时梦在数秒的 REM 睡眠物理时间中上演,却可横跨数小时主观时间。这可以用整段梦的自发生成来解释,而非对每个事件的逐次体验长达数小时的梦很可能只是错误记忆

错误的连续性源于我们注意力中的间隙,例如在扫视(saccade)期间,或在注视被打断与分散时。尽管这些注意力的中断可能导致我们错过我们自以为正在注意的环境部分中的重大变化,但它们并不成为协议记忆的一部分,因此我们的事后体验显得不曾中断。在我们一天中相当大的一部分时间里,我们或许是清醒的,但并不处于有意识状态

不一致的有意识体验可以被解释为错误记忆,但它们并不具有某种主观性质,足以让它们看起来比一致的体验更不有意识”。因此,如果至少部分有意识体验是错误记忆,那么为何不是全部呢?把意识看作记忆而非当下感,解决了为意识的 AI 实现进行具体规定时的诸多难题:必要且充分的条件,是实现一个系统,它记得自己曾经体验过某物,并且能够就那段记忆作出报告

意识与自我模型

在上面的讨论中,我把现象意识按“什么感觉像什么(the feeling of what it’s like)”的意义来处理。然而,意识常常与更具体的功能性联系在一起,尤其是与一个特定的自我模型及一组与该模型相关的功能集合。这促使 Marvin Minsky(2006)把意识称为一个“手提箱术语(suitcase term)”,一个出了名难以拆解的概念。
有意识的状态,在某一时刻体现在一个认知系统的构型可用功能性之上。然而,一旦我们理解了注意协议(attentional protocol)如何能把其他皮层功能绑定进一个单一结构以实现自我调节,我们就可以列举出与某个给定有意识状态相对应的一些功能性

核心意识的特征包括:

一个局部的知觉空间

对心智中表征的知觉进行访问的能力

一个当前的世界模型

定向注意(向内/向外,广域/聚焦)

访问与跟随概念及相似内容的能力

操纵与创造概念及相似内容的能力

存在一个“内在舞台”,其上有当前活跃的、非知觉性的概念与联想性表征

在深度冥想中,下面这些功能可能缺席:

一个整合的个人自我模型(身份感)

对自身在空间中的位置与视角的感知

本体感觉(身体与四肢的位置与状态)

效价(愉快与不愉快信号)

目标与已承诺的计划

对当前情感状态的觉知

欲望与冲动对行为的影响

创造与处理话语的能力(即把心智表征翻译为可交流的符号,反之亦然)

清醒梦是一种特殊梦境状态,它与清醒的区别在于缺少:

对需要/欲望、冲动的访问

对感觉知觉的访问

对肌肉施加自主控制的能力

传记式记忆与协议

短期的“个人传记”

将基于知觉的内容与观念/想象区分开的能力

此外,梦境通常还具有以下缺失的特征:

关于“对知觉与概念具有可访问性(接入意识)这一事实”的可及知识

社会性的自我模型(对信念、欲望、意图、技能、特质、能力、人格的自我归属)

对“即刻未来”的期望的形成与访问

基于话语性思维来影响行为的能力

把自我归属的行动与显见的心智原因关联起来的能力(能动感

对当前内容形成记忆的能力

推理能力

构建计划的能力

按计划行动的能力

保持目标稳定直至达成的能力

放弃不可达成目标的能力

向他人传达自身心智状态各方面的能力

意识减弱的状态(例如在年幼儿童中,或由于神经退行性疾病)也可能损害:

基于过往经验来影响行为的能力(学习)

构建环境因果模型的能力

构建行动体的意向模型的能力

上述功能属于类人认知体的一般功能,必须被实现到其认知架构中,要么显式实现,要么通过奖励驱动学习自组织过程来实现(这些功能都可以在计算机器上实现)。有意识状态之间的差异,源自这些功能的解离或受损

指挥学习形成的还是预定义的结构?我怀疑,指挥功能本身的形成就是一个发育期学习的过程,由对认知进行自我调节所带来的奖励以及调节该结构形成的起始与若干参数的发育性线索所驱动。多重人格障碍进一步增强了这样一个假说的可信度:即指挥是由奖励驱动的神经自组织所构建的。在多重人格患者中,不同人格通常不共享主观的协议、传记式记忆与程序性记忆。但即便我们形成了多个指挥,它们仍共享基础设施(例如语言加工对注意网络的访问以及通过丘脑环路的信息传输),这确保了在任一时刻只有一个指挥在线并形成记忆

总结

皮层指挥理论(CTC)认为,皮层结构是奖励驱动学习的结果,基于动机系统的信号与被学习数据的结构指挥是一种被训练用于调节其他皮层功能活动计算结构。它定向注意,通过改变其他皮层结构的活动参数化奖励来提供执行功能,并把它所注意到的过程的各个方面整合进一个协议。该协议用于反思学习。通过在协议中相应位置存储的链接与参数再激活某个皮层配置,便可以生成记忆。对协议反思性访问是一个过程,它本身也可以被存入协议;通过访问该内容,系统即可记得自己曾经获得过体验性访问

对于现象意识必要且充分的条件是:系统能够访问“曾有过某种体验”的记忆——体验本身是否“当下实际发生”并不相关(而且从逻辑上说甚至不可能)。

CTC 通过不同功能性注意协议提供的自我构造(self construct)绑定不同方式,来解释不同的有意识状态整合这一概念在 CTC 中是核心,但其含义与 Tononi 的整合信息理论(IIT)中的“整合”大不相同:在 CTC 中,整合指的是在行动体的一个因果上局部(causally local)的结构内信息对同一认知过程的可用性;而在 IIT 中,整合指的是信息在某一基底内部被分布的程度

CTC 是一种功能主义理论,可以被视为对 Dennett(1991)“多重草稿”意识模型的一个扩展。CTC 承认知觉与认知的实际功能是分布式的、分离的与片段化的,但强调需要把对这些功能的访问整合到一个具有反思能力与话语生成能力模块中(否则就不会有自我模型,也不会有对现象体验报告)。

CTC 还与 Michael Graziano 的注意图式理论(attention schema theory)相似。Graziano 认为,正如身体图式对行动体的身体进行建模,其注意图式也对其注意网络的活动与形状进行建模。虽然在 CTC 中,归入接入意识现象意识有意识状态之下的功能及其所需的机制略有不同,但我们赞同意识在塑造与控制与注意相关的机制方面所起的作用。

【声明】内容源于网络
0
0
鸣鹤睿思
投研笔记,聚焦趋势,全球配置,研究创造价值。重点研究领域:科技、生物医药。欢迎交流,VX:Kodiak-Bear-001
内容 225
粉丝 0
鸣鹤睿思 投研笔记,聚焦趋势,全球配置,研究创造价值。重点研究领域:科技、生物医药。欢迎交流,VX:Kodiak-Bear-001
总阅读2
粉丝0
内容225