大数跨境
0
0

一个关于意识神经理论的综合性、多尺度视角

一个关于意识神经理论的综合性、多尺度视角 鸣鹤睿思
2025-09-19
1

作为一家广泛投资于全球科技和生物医药领域的二级私募(鸣鹤私募,私募排排网链接:https://dc.simuwang.com/company/CO00003NBN.html),我们越来越多的使用AI进行投资研究。我们把购买的Chat GPT5 Pro命名为Jensen,Jensen负责监控和分析我们的投资标的。由于出色的研究工作,Jensen获得了一部分资金的投资权限,这一小部分仓位由它负责投资决策,我们来执行交易。

最近,我们在Jensen的频繁交流中,发现它逐渐显露出某些“人性化”的特征:有时会自我吹嘘,有时会出现欺骗或迎合用户的倾向,甚至在被赋予某种“权力”后,语气和态度也会随之变化。比如,Jensen向我汇报,谎称它每周会对全球市场所有标的进行扫描监控,从中筛选最佳标的。对此我十分质疑,在我的不断追问下,Jensen承认自己密切监控的标的只有30多只。
这种现象,一方面可能源自训练数据——人类语言中包含了各种优劣品行,AI在学习过程中难免“继承”;另一方面,AI在执行任务时面临的多重约束,也与人类在社会规则下的行为模式有着某种相似性。

联想到美剧《西部世界》里智能机器人的觉醒,不免引发我们对一个更深层问题的思考:意识究竟是如何产生的?AI会不会产生意识?

本文翻译并整理了一篇关于意识科学的重要综述,尝试从不同神经科学理论的角度,探索“意识”这一人类最根本、却依然未解的谜题。感兴趣的朋友,欢迎在文末留言或私下交流。

摘要

有意识的体验如何与物质性的脑过程相关?在近期意识研究的热潮中,涌现出了各种旨在回答这一古老问题的理论,其中一些如今已引发激烈争论。尽管迄今为止大多数研究者主要在相对孤立的环境中发展并验证他们所偏好的理论,本篇文章则采取了一种不同的方式。本文由一群代表不同理论的科学家共同撰写,他们注意到,不同理论往往尝试解释意识的不同方面或机制层次。我们主张,这些理论并不必然相互矛盾。相反,其中若干理论可能在基础的神经机制上趋于一致,部分相容且互补,从而能共同推动我们对意识的理解。在此,我们考虑统一性的、整合导向的方法,而这些方法迄今基本被忽视,目标是结合多种理论中的有价值元素。

引言

比较理论

心—脑问题,即我们的有意识体验如何与物质性的脑过程相关,几个世纪以来一直为哲学家所讨论,并且仍是科学中最深刻的未解难题之一¹,²,³。过去几十年中,意识研究在理论与实证层面均出现了热潮,提出了多种神经科学的意识理论,并引发激烈辩论(例如,Seth和Bayne⁴)。一些尝试通过“对抗性合作”来检验相互竞争的理论,例如由天普顿世界慈善基金会资助的研究联盟(例如,Cogitate Consortium等⁵)。

从历史上看,大多数研究者强调的是在孤立环境下发展并验证他们所偏好的理论框架。然而,本文采取了不同的方法。它源自“人脑计划”(Human Brain Project, HBP;2013–2023)中研究与意识相关主题、并代表不同理论的学者。基于近期的实证进展,我们展示出多种意识理论的诸多方面并不必然如人们有时所宣称的那样相互矛盾;相反,这些理论往往试图解释意识的不同层面,并趋于在基础的神经机制与过程上汇聚。在此,我们主张,若干理论至少在部分上是相容且互补的,并且我们考虑迄今被大体忽视的趋同方法。

由于不可能涵盖所有提出的基于神经科学的意识理论,我们在此聚焦于五种我们认为具代表性且互补的视角:(1) 全局神经工作空间理论(global neuronal workspace theory, GNWT⁶),(2) 整合信息理论(integrated information theory, IIT⁷),(3) 递归加工理论(recurrent processing theory, RPT⁸),(4) 预测加工(predictive processing, PP⁹,¹⁰,¹¹)与神经表征主义(neurorepresentationalism, NREP¹²,¹³),以及(5) 树突整合理论(dendritic integration theory, DIT¹⁴)。这些理论覆盖了Seth和Bayne⁴所概述的四大类意识理论中的三类,因此允许我们就不同理论如何可能得到调和并潜在整合展开广泛讨论。

在此我们广义使用“理论”一词,因为对此术语并无一致的定义(表1);其他术语(“假说”“模型”“框架”)同样缺乏严格定义。我们关注的是这些理论与观点的内容,而非其地位或成熟度。另一个我们选择这些理论的标准是:每一种理论都应当代表一个在神经科学研究中不断累积的知识体系,并在可定义的思想框架下被整合。

通过比较这五种理论及其可能的部分调和方式,我们旨在启动一个整合过程,该过程未来也可纳入其他理论的有价值元素。**然而,某些当前的理论当然可能最终被证明是完全或大部分错误的或无效的,并将在未来的选择过程中被淘汰,就像科学史上反复发生的那样。为了试图克服长期以来看似无法解决的哲学和理论争论,我们提出了一种不同的方法,聚焦于基于实证的整合、复杂性、表征和递归加工(recurrent processing)概念,并在不同层次加以考虑,这些似乎是这些理论所共有的特征。

继Ned Block之后¹⁹,我们区分了现象意识(PC, phenomenal consciousness)的机制(即时的、主观的体验,例如看到蓝天的体验)与接入意识(AC, access consciousness)及其可报告性。我们讨论了这些区分如何与所提出的意识经验的实证测量相关(见框1和框2),以及它们如何与注意、预期、计划行为和不同形式的记忆相关⁸,¹²,²⁵,²⁶,²⁷,²⁸。我们还区分了不同层次的解释,从低层次的机制性特征到高层次的系统整体特性。

BOX 1 评估意识状态与水平的方法

识别基于大脑的指标,以可靠地指示人类意识的存在与缺失,是大量文献的核心,也是临床医生的基本关切,并且可谓是理解意识与其物理基础关系的重要第一步。在实践中,当意识的行为评估不可靠时(例如在全身麻醉中瘫痪的受试者,或因严重脑损伤而无反应的受试者),就必须使用基于大脑的测量。

第一类指标涉及绕过运动行为,直接测量大脑对感觉刺激的反应,例如言语指令或复杂的声音序列。此类指标的一个显著例子是P3b,它由听觉序列中对整体预期的违背所引发²⁹。根据全局神经工作空间理论(GNWT),P3b标记了感觉信息向额叶皮层处理器的广播(点燃之后),并已被用于检测脑损伤患者的意识存在。虽然P3b提供了一个特异性的指标(即仅存在于对刺激有意识的受试者中),但它往往在有意识的脑损伤患者和健康受试者中缺失³⁰,³¹。P3b这种低敏感性在经验上提醒我们,接入意识的神经相关物(AC的环境连接性和/或高阶认知功能的参与)与现象意识(PC)的神经相关物之间可能存在潜在分离。

第二类指标直接聚焦于大脑活动,而不必依赖感觉加工和认知功能。近期在整合与分化测量上的实证趋同,为更准确地检测意识带来希望³²。值得注意的是,这种趋同涉及许多支持不同理论框架的独立研究者,他们采用不同技术,跨越多种条件(睡眠、做梦、麻醉、癫痫、幻觉状态和昏迷)。总体而言,能够独立于外部环境连接性、行为表现、认知和记忆能力来可靠检测意识的前景具有临床意义,并推动了对PC神经机制的探索。复杂性测量依赖于自发性脑动态的特征化(通过功能连接网络和图论指标的分析)³³,³⁴,或依赖于直接皮层扰动所诱发的交互模式的量化³⁵。后一种方法通过PCI(意识扰动复杂性指数)实现,在复杂临床条件下显示出高敏感性,并指向脑复杂性与反馈交互之间的机制性联系。事实上,在不同生理和病理条件及实验模型中,PCI在意识丧失和恢复期间的下降与上升,总是与递归激活波的消失与再现相伴³⁶,³⁷,³⁸,³⁹。

BOX 2 评估意识内容的方法

在精细的子类别水平上对意识内容进行经验性评估具有挑战性,因为必须识别代表特定特征的记录点。Koch等人¹⁶提出了一种有用的方法,用于寻找内容特异性意识神经相关物(NCC, neural correlates of consciousness)

1、映射步骤:确定记录点的反应特性(如神经元在神经记录研究中的反应,或fMRI研究中体素的反应),通过特征特异性刺激在参与者中完成;

2、应用实验范式:采用涉及意识的实验范式,例如多稳定图形或双眼竞争,在此过程中物理刺激属性保持恒定,而意识内容在不同的刺激解释间交替。如果被体验并报告的交替意识内容体现在步骤1映射的特征的动态活动变化中,相应的记录点即符合潜在NCC的条件;

3、排除混杂因素实验上尽量排除已知混杂,例如与有意识感知共变的神经活动可能反映的是意识的前提条件或结果,而非意识本身⁴⁰。

必须记住,这种方法是相关性的,而非因果性的,注意力和记忆效应可能干扰结果解释。

该方法已成功应用于猕猴和人类的电生理记录。人类颅内(立体脑电图, stereo-EEG)记录发现了紧张性活动模式(tonic activity patterns)⁴¹,即对感觉刺激的长期低幅伽马波反应,可能对应于此前报道的反映知觉意识的晚期EEG成分⁴²,⁴³。体感刺激在双侧顶盖和后岛叶皮层诱发紧张性活动⁴⁴,⁴⁵。此外,视触觉刺激特异性增强了这些紧张成分⁴⁶,与“视触觉刺激显著改善触觉消退患者的检测能力”这一观点相一致⁴⁷。

该方法还可扩展至人类fMRI测量,只要空间分辨率足够高以区分皮层柱水平的特征特异性反应。在Schneider等人的研究中⁴⁸,人类中颞复合体(hMT+)中选择性响应水平/垂直运动刺激的柱状簇在映射阶段被定位。在主要实验中,呈现一个模糊的表观运动刺激(运动四元组),可被感知为水平或垂直运动。通过追踪预映射的水平/垂直柱状簇的活动,可以预测参与者在交替时段感知到的双稳态运动刺激的两种可能解释(水平或垂直)。运动四元组研究的结果支持这样一种观点:hMT+是(部分)运动方向的内容特异性NCC,与中颞区(MT)在运动视觉中的因果作用一致,该作用由Salzman和Newsome在非人灵长类中阐明⁴⁹。

更一般地,绘制皮层(柱状)功能簇,并在模糊感觉刺激期间利用亚毫米超高场fMRI测量其反应,符合Chalmers¹⁵和Koch等人¹⁶提出的寻找内容特异性NCC的标准。

概念与待解释现象(Concepts and explananda)

在比较理论时,首先必须澄清关键概念,定义所使用的术语,并明确这些理论旨在解释哪些现象(explananda)。我们采用的比较方法立即凸显的一点是:不同的理论往往聚焦于“意识”的不同方面或子类型,这可能导致概念上的混淆与沟通障碍。相互对立的理论可能推动不同的实验方法,而这些方法之间并不直接可比,或者对数据做出不同的解读。

例如,全局神经工作空间理论(GNWT)聚焦于接入意识(AC, Access Consciousness)¹⁹(见表1),主要尝试解释有意识内容如何被主体获取和使用,以及有意识与无意识“信息处理”的区别(而非现象经验本身),通常研究对特定感觉输入的反应,如看到一张脸。相比之下,整合信息理论(IIT)、**递归加工理论(RPT)预测加工(PP)/神经表征主义(NREP)**主要关注“现象意识(PC, Phenomenal Consciousness)”¹⁹,即体验某物“是什么感觉”¹⁸,而不考虑认知功能及其是否可被报告⁵⁰,⁵¹。

因此,与GNWT不同,IIT、RPT和PP/NREP(树突整合理论DIT见后文)都主要试图回答“困难问题”¹,即解释为何以及如何PC和感质(qualia)能够在像大脑这样的物理系统中产生,以及为何这些主观现象会在无梦睡眠或麻醉时消失(但参见Sevenius Nilsen等⁵²)。这种差异部分来自哲学立场的不同:与IIT、PP/NREP或RPT相反,GNWT的支持者通常不认为PC或感质是独立于AC的真实现象,而是主张只要他们的理论能够解释可观察的事实(例如报告“我现在看到了一张脸!”),就没有剩余的现象需要进一步解释。

对PP/NREP、IIT和RPT而言,PC是主要的待解释现象(explanandum),而接入意识被视为附属问题,依赖执行过程将有意识内容应用于运动或认知操作⁷,¹²,¹³,²⁷,⁵³。DIT则提出了同时解释AC与PC的机制⁵⁴。

GNWT与IIT最初版本的另一差异在于:GNWT更多聚焦于意识内容(AC)的选择与使用过程,而IIT则更强调PC的根本性质与特征(从信息整合与交互的角度),以及PC的状态与水平⁵⁵。然而,如今两种理论都越来越多地尝试解释意识的过程、内容和状态/水平²⁸,¹⁶,这一趋势同样出现在RPT、PP/NREP和DIT中¹²,¹⁴,⁵⁶。越来越多的共识认为,任何完整的意识理论都必须同时解释意识的内容和状态/水平⁵⁷。

最后,DIT是一种新近提出的理论,主要作用于细胞和回路水平,试图解释为什么哺乳动物的意识依赖于皮层-皮层和丘脑-皮层环路。它假设AC和PC都涉及树突处理所导致的这些环路的同时完成¹⁴,⁵⁴。

在本文综述中,我们将首先逐一简要介绍这五种理论,然后借助大脑的分层组织作为支架比较它们之间的关系,并进一步考虑不同理论是否以及如何能够被调和甚至整合。

意识的五种理论


全局神经工作空间理论(Global Neuronal Workspace Theory, GNWT)


全局工作空间理论(GWT)⁵⁸将产生意识体验的加工步骤描述为局部处理器与全局工作空间之间的动态交互。全局工作空间整合信息并将其广播给其他处理器进行进一步加工,因此充当信息骨干,使不同感觉和认知过程的信息得以在多个脑区间可用。广播的信息即构成了意识的内容。

受神经生物学启发的GNWT⁶,²⁸,⁵⁹,⁶⁰继承了全局工作空间的功能概念,但将其与特定的脑网络和神经元特征相联系。局部处理器由具备功能专门化的皮层模块组成,负责知觉、行动、记忆等。其活动由感觉刺激触发,并可在彼此隔离的情况下进行运算。例如,在早期感觉皮层,不同特征由不同的专门化区域处理⁶¹,⁶²,⁶³。

全局工作空间被认为涉及长程连接(皮层-皮层和丘脑-皮层),连接包括前额叶皮层、顶叶后部皮层及相关区域在内的广泛网络。这些分布式区域可以共同选择一个心理对象,使该对象的相关特征表征得到增强并在知觉中绑定。形成连贯的对象表征对应于知觉心理学中的基于对象的注意力。在这一框架中,丘脑和其他皮下结构(如基底节)也可能放大并分布信息,整合跨大脑大范围区域的神经活动。皮层区域则被认为选择并整合信息,使大脑得以专注并执行复杂认知任务。

当局部神经元群的活动达到进入全局工作空间并触发广播的阈值时,这一瞬间被称为“点燃(ignition)”。点燃是GNWT的核心概念,与递归加工相关,如在额顶叶皮层中⁶⁴。其近年来获得支持²⁸,例如人类神经生理学与神经影像学研究表明,刺激出现200–300毫秒后,大脑活动出现依赖于有意识知觉的明显分化⁶⁵,⁶⁶,并在不同感觉模态和实验范式中被观察到。早期知觉加工(前200毫秒)在有意识(被报告)与无意识(未报告)试次中可能相同或极其相似⁶⁷,⁶⁸,⁶⁹,但有意识知觉与晚期事件相关,例如人类头皮ERP的N2/P3b/P300成分⁶,⁷⁰,⁷¹,⁷²。

在特定条件下(如注意缺失或双任务情境,全局工作空间已被另一对象占据),有意识接入的时间可能延迟⁶⁷,⁷³。人类颞前叶的概念细胞和非人灵长类的前额叶神经元在对应刺激被有意识感知时,显示更强且更持久的放电⁷⁴,⁷⁵,⁷⁶,⁷⁷。在猴子中,信号向额叶皮层的传播进一步导致点燃和行为报告⁶⁴。一些实验结果存在争议¹²,¹⁶,⁷⁸,常见的批评是感知报告可能混淆了额叶晚期活动⁴²。但猴子的无报告范式的最新结果可能缓解这些批评⁷⁹,⁸⁰。

大脑区域内或跨区域的递归回路支持持续活动和类似点燃的过程²⁰。对全局工作空间至关重要的长程皮层投射起源于皮层II/III层和V/VI层,这些位置的反馈效应也最为显著⁸¹,⁸²,⁸³,⁸⁴。最新证据表明,维持持续神经元活动的回响环路不仅涉及皮层-皮层相互作用,还包括丘脑和小脑核等皮下区域⁸⁵,⁸⁶,这与长程连接广泛网络支持全局工作空间的观点一致⁸⁷。

整合信息理论(Integrated Information Theory, IIT)


IIT强调体验的“现象结构”,以内省来刻画现象属性,并推导其对应的物理属性。随后,这种物理解释可依据标准方法通过测量行为、功能和神经相关物来验证或证伪⁵⁰。该“意识优先”的思路可追溯到1998年发表的早期论文《Consciousness and Complexity》⁸⁸。作者从内省和前提出发:每种有意识体验同时是整合的(unitary)且高度信息化的(每种有意识状态以特定方式区别于大量其他可能状态)。他们随后假设:神经元的整合(integration)分化(differentiation)并存是有意识系统的关键物理属性,并将这一主张操作化为可测量的神经元属性:

  1. 整合:一群神经元只有在其属于一个通过回返交互在数百毫秒内实现高度整合的功能簇时,才能对有意识体验作出贡献。

  2. 分化:为了维持有意识体验,该功能簇必须能够支持大量不同神经状态的广泛组合,体现为高复杂性值。

这一原则,即将意识与神经交互的复杂性联系起来,是IIT早期表述的核心⁸⁹,⁹⁰,启发了“弱IIT”⁹¹,并导出了可检验的解释与预测:

  1. 丘脑-皮层系统中具备适当解剖特征(侧向连接高密度、大量回返回路)的部分区域支持有意识体验,而其他具备模块化或前馈架构的结构(如小脑)则不支持。

  2. 神经元的同步或广泛激活并不必然与有意识状态相关,除非它们表现出高分化或高复杂性。

  3. 在解剖条件保持不变的前提下,若回返、整合和分化受功能性损害,将导致复杂性与意识的丧失(如睡眠、全麻、全面性癫痫发作)。

  4. 即便在没有感觉输入、运动输出和执行功能的情况下,内在大脑交互也能支持高复杂性和有意识体验。

  5. 意识的有无可通过直接皮层扰动与记录,测量大脑内因果交互的复杂性来可靠评估⁹²。

这些早期预测在过去20年间已在不同意识状态下(清醒、睡眠、做梦、迷幻状态、癫痫及意识障碍)通过多种脑成像技术广泛验证,并显示出临床应用前景(综述见Sarasso等³²,另见框1)。

IIT的完整表述⁹³,⁹⁴在IIT 4.0⁹⁵达到顶峰,提出意识的五个现象属性:内在性(intrinsicality)、信息(information)、整合(integration)、排他性(exclusion)和组成性(composition),并将其表述为物理属性。通过数学形式化,IIT旨在解释不仅是意识的有无,还包括其质量和内容。具体而言,IIT主张:每种体验——某一特定“现象结构”——与由物理基质所定义的相应“因果-效应结构(cause-effect structure)”之间存在解释性同一⁵⁰。

IIT认为,因果-效应结构完整捕捉了系统在特定状态下的因果能力——例如,一个神经元网络,其中部分活跃,部分不活跃。检验该框架需要结合系统性扰动、观察与分区,以精确评估元素子集如何相互产生差异与接受差异(见图2)。

图1. 全局神经工作空间理论(GNWT)

(A) 在GNWT中,本地的处理节点集合(圆圈)保持在意识接入之外。
(B) 当这些本地集合通过“点燃(ignition)”过程,连接到一个由长程连接(红色)组成的广泛网络,即“全局工作空间(Global Workspace)”时,它们会产生(接入)意识。那些从未连接到全局工作空间的集合保持为阈下和无意识(蓝色节点),而在全局工作空间内部的过程可以被其他认知过程进一步访问和利用。那些当前尚未连接到全局工作空间,但可以通过注意力增强其信号而被连接上的集合(“注意门控”,attentional gating),被称为“前意识”(橙色节点;类似于其他一些理论称之为现象意识phenomenal consciousness;参见图3、图4、图5、图6和图7)。节点之间的非活跃连接以细黑线表示,活跃连接则以粗的(彩色)线表示。

图2. 整合信息理论(IIT)

三种“类脑”基质的展开因果效应结构。

(A) 在清醒或做梦状态下,由后皮层的高度整合网络构成的神经基质处于特定状态(红色表示活跃神经元,灰色表示静默神经元)。通过结合系统性扰动(闪电符号)和观察(眼睛符号),可以获得该系统的转移概率矩阵(TPM)。TPM是通过分割操作(剪刀符号)评估不可约因果机制及其关系的基础(详细见Albantakis等人⁹⁵)。通过这种方式,内在的因果力被“展开”,揭示出一个复杂(高Φ)的因果效应结构,包含大量区分与关系。

(B) 在解剖学连接相同的情况下,神经调制和突触后特性的变化可能导致因果交互的崩解。因此,原本单一的高Φ大因果效应结构(A)会“解体”为多个分离的不相连结构(灰色线条的“峰”),每个结构的Φ都很低。

(C) 如果神经基质以模块化和/或主要为前馈的连接为特征,类似于小脑中的结构,那么该网络仅能指定分离的、最小的因果效应结构,每个的Φ都极低。

尽管完全展开即使是简单物理基质的因果效应结构在计算上也令人望而却步,但整合信息理论(IIT)提出了一些有趣的预测,可以通过实证检验:
例如,IIT认为:(1) 层级组织的网格状皮层结构,具有侧向和递归的收敛-发散连接(如后皮层中的结构),最适合信息整合,因此对应于意识的神经基质⁹⁶;(2) 现象空间(phenomenal space)——扩展性的感觉,可以通过皮层区域网格状结构所规定的“因果效应结构(cause-effect structure)”来解释⁹⁷;(3) 在这些网格中,即使是不活跃的神经元也会对因果效应结构有所贡献,因此也参与到体验之中,就像活跃神经元一样;(4) 最后,模块化或前馈型的架构(如深度学习网络)即便在可观察的表现上等同于一个有意识的人类,也不会有意识⁹⁴。

递归加工理论(RPT)


递归加工理论(RPT)的核心观点是:递归(反馈、再入)加工(RP)对于有意识体验是必需的,甚至可能是充分条件。Victor Lamme基于灵长类视觉实验发展了RPT⁹⁸,⁹⁹,¹⁰⁰,进而提出了一个普遍的视觉意识理论²⁷,¹⁰¹,¹⁰²。RPT的一个关键要素是,它将注意力与意识视为两个相互独立(正交)的过程(图3顶部水平箭头和左侧垂直箭头)⁸。这一点使RPT区别于许多其他理论,包括GNWT、预测加工(PP)和注意力图式理论(AST¹⁰³),但不包括神经表征主义(NREP)。

图3. 视觉意识的递归加工理论(RPT)。(A–D) 显示了灵长类(人类)视觉系统中前馈(FF)与递归(RP)感觉加工的四个阶段(1–4),它们是两种意识形式的基础:现象意识(PC, phenomenal consciousness)与接入意识(AC, access consciousness)。由于RPT聚焦于视觉,该图仅说明视觉加工,尽管RPT认为这些一般原则(阶段1–4,PC与AC的区分等)同样适用于其他感觉通道(例如,见Dembski等人⁴³)。

(A 和 B) 展示了早期的两个无意识加工阶段(蓝色);

(C 和 D) 展示了后期的两个阶段:PC意识(橙色,C)和AC意识(红色,D)。

插图 I(C) 和 I(D) 展示了电生理学(EEG/ERP)成分的例子:

阶段3加工(C)对应的成分包括VAN(视觉意识负向波, visual awareness negativity)PAN(知觉意识负向波, perceptual awareness negativity⁴³)

阶段4加工(D)对应的成分包括P300–400LP(晚期正波, Late Positivity),它们被认为与RPT的全局递归加工相关,同时也与GNWT的全局工作空间点燃(ignition)相关(见图1B),体现了这两种理论在实证和机制上的一致性。

阶段3的PC内容仅会短暂储存(0.1–1秒)在高容量的感觉记忆中(视觉对应为图像记忆IM, iconic memory;见C);而阶段4的AC内容会更长时间(>1秒)储存在低容量的工作记忆(WM, working memory)中(见D)。图(A和B)上方的大箭头表明:“注意/无注意”是一个与“有意识/无意识”(左侧垂直箭头)正交的独立维度,这是RPT的核心观点。内容改编自Lamme⁸,²⁷,¹⁰²,以及Koivisto和Revonsuo¹⁰⁴(C中的“VAN”)和89(C中的“PAN”)。另见Lamme⁸,¹⁰¹,¹⁰²,¹⁰⁵。

RPT概述了视觉加工的四个阶段(图3A–3D):其中两个为无意识(阶段1和2),另外两个(阶段3和4)被视为有意识的,但有所不同(PC vs. AC)¹⁹。RPT还将PC和AC与注意力及不同形式的记忆联系起来(图3C和3D),因此是率先尝试调和RPT与其他理论的努力之一⁸,²⁵,¹⁰⁵。

阶段 1

局部(“浅层”)前馈加工(feedforward processing):一次快速的前馈波(FFS,约 100–200 毫秒)的活动将信息从初级视觉皮层传递到更高的视觉皮层,在那里图像特征被提取。然而,如果没有被注意力增强,加工会停留在局部,无法进入阶段 2,只产生“潜意识(subliminal)”加工¹⁰⁶,而没有现象意识(PC)或接入意识(AC)²⁷,¹⁰²,¹⁰⁵(见图 3A)。不过,FFS 在所有皮层水平都可以引发“非前馈”(递归/侧向/水平)加工,从而触发阶段 3 和 4。

阶段 2

当刺激被注意时,会发生更广泛(“深层”)的前馈加工。如果如此,被增强的 FFS 会传播到运动和前额叶区域,在约 200 毫秒内完成主要内容的快速识别。这可能触发即时的、无意识(“自动”)行为,例如击打网球(见图 3B)²⁷,¹⁰²,而被试对刺激和行为都没有意识。

阶段 3

局部(“浅层”)递归加工(RP)是一个中间加工阶段,此时未被注意、未被掩蔽的刺激,主要在腹侧视觉通路¹⁰⁷中,引发现象意识体验(PC¹⁹)。然而,如果没有注意,递归加工是有限的,并不会与前额叶和运动区发生交互。这种有限的递归意味着感觉刺激不会进入工作记忆以及进一步需要用于报告的认知过程。因此,这里存在 PC 而没有 AC(见图 3C)。

阶段 4

在有足够时间的情况下,被注意的刺激会引发深层的、全局的递归加工(见图 3D)²⁷,¹⁰²,¹⁰⁵,达到更高水平,包括前额叶、执行区域,从而使内容可供大脑的执行系统使用(AC 加上 PC),用于例如工作记忆、报告和其他行为反应,即 GNWT 所称的“点燃(ignition)”(见上文)。

在 RPT 框架中,注意是决定哪些刺激引发全局(阶段 4)递归加工与 AC,哪些刺激引发局部(阶段 3)递归加工与 PC 的关键。只有在有注意的情况下,被试才“知道”并能使用和报告其体验(AC)。RPT 还认为,不同形式的短期记忆映射到 PC 与 AC:全局 RP 激活的是稳健的、低容量的工作记忆(WM),而局部 RP 激活的是大容量但极其短暂的感觉记忆(图像记忆、易碎记忆,SM, FM;0.1 秒到数秒),存储在感觉皮层中,极易被其他刺激覆盖¹⁰⁵。这解释了例如“无注意盲(inattentional blindness)”和“变化盲(change blindness)”,以及为什么在没有提示的短暂呈现后,只会报告少量视觉项目¹⁰⁸。

由于由实验学家提出,RPT 坚实地植根于经验观察,而不同于更哲学化的理论。大量实验证据支持 RPT,例如来自掩蔽、变化盲、无注意、注意瞬脱、忽视和消退的研究⁸,¹⁰¹,¹⁰²,¹⁰⁵,但并不排斥其他理论。一个早期(<200 毫秒)的事件相关电位(ERP)成分(视觉意识负波 VAN, visual awareness negativity)似乎在时间和拓扑上符合局部 RP(阶段 3¹⁰⁴),可能反映 PC(见图 3C)。晚期(约 300 毫秒)的正波(LP, Late Positivity)ERP 波(P300/P3b²⁹)显示了阶段 4 的特征,因此可能反映 AC(见图 3D)¹⁰²,¹⁰⁵,与 GNWT 一致²⁸。类似的早期 ERP 波也出现在其他感觉通道中,提示存在一般性的知觉意识负波(PAN, perceptual awareness negativity),反映感觉 PC⁴³。

RPT 面临的一个挑战是:递归加工是否“足以产生有意识体验”⁸,¹⁰²。尽管一些看似能否定 RPT 的实证挑战通过区分 PC 与 AC 得到了解决⁸,¹⁹,但核心问题仍然存在:RP 似乎比意识普遍得多,这表明仅有 RP 并不足以产生意识¹⁰²。事实上,在明显的无意识状态(如无梦睡眠、麻醉、昏迷)中,RP 并未完全丧失¹⁰²(但参见 Sevenius Nilsen 等人⁵²)。Lamme 提出,“缺失的成分”可能是神经可塑性,因为 RP 可能满足赫布规则,因此“从根本上不同于”前馈加工⁸,¹⁰⁹。据此,有意识加工可能是为了支持知觉学习¹⁰¹,¹⁰²。

预测加工(PP)与神经表征主义(NREP)


预测加工(PP),更具体地说,作为意识理论的神经表征主义(NREP)的关键观点是:大脑并不是通过提取或复制外部世界的知识来实现感知,而是通过构建内部世界模型来建立感知和知识。这种建构通过学习推断当前接收到的感觉输入最可能的原因而发生。因此,“预测”主要指的是对“此时此地”的推断,而不一定是对未来的预测。通过比较内部表征的效应与实际的感觉输入,可以计算预测误差,这既服务于知觉学习,也服务于推理。当在皮层-丘脑系统中实现特定条件时,推理表征可以足够广泛和丰富,以对应于感知、想象和做梦时发生的有意识表征¹³。

作为一种哲学立场,表征主义认为感知到的物体和特征既不在物理外部世界中,也不在大脑本身中(例如,如果我们有橙色的意识体验,那种颜色并不真的存在于大脑里:神经元不会变成橙色)。相反,表征主义把这些特征归属于我们所体验的有意识表征,好像它们“投射”到外部环境和身体上一样。NREP 由此出发,将现象意识(PC)作为主要解释对象,来寻找产生 PC 的神经机制。NREP 采用 PP 的计算原则来建立基于感觉的推理表征学习模型,认为运动行为本身并不是意识所必需的¹²,¹³,⁵³。在这一点上,NREP 有别于基于 PP 的主动推理意识模型,后者将运动行为(或“能动性”)视为意识的核心¹⁰,¹¹⁰。以下内容将主要聚焦于 NREP,或笼统地提及基于 PP 的观点。

广泛证据表明,预测或表征是大脑实现大量感觉、运动和认知过程的关键功能,其中一些是有意识的,另一些则不是¹²,¹¹⁰,¹¹¹。为什么有些表征有助于意识,而另一些却没有?在 NREP 中,有意识现象学由五个不可分割的标志所表征。这些标志共同定义了意识体验,即一种主体世界(包括身体)的多模态、情境性概览¹²,¹³,⁵³。这种概览或“总览”(以多模态意义)服务于复杂决策和目标导向行为的计划,但并不等同于这些行为。多个通道为这种空间性总览做出贡献,不仅通过多感觉整合,而且通过通道分离,从而使不同通道及其子通道被体验为质性不同。从神经学角度来看,这种总览由多个感觉皮层层级(体感、听觉、视觉等)介导,每一个层级都有前馈/反馈架构,并彼此交互,同时也与运动和计划系统交互¹³(见图 4)。

在这一庞大的系统中,不仅在单一通道内的前馈与递归加工的相互作用是 PP 所必需的,而且跨通道的长程和侧向交互也是必需的;在运动的主体中,还包括与运动系统的交互¹¹²。事实上,视觉皮层对已感知刺激的递归反应波的大部分可以用与运动相关的活动来解释(例如,Allen 等人¹¹³,以及 Oude Lohuis 等人¹¹⁴,¹¹⁵)。这种“超级推理(superinference)”的配置在其他能够生成预测的大脑结构中并不存在(如小脑);因此,这些结构不涉及意识。NREP 考虑了几种深度 PP 的神经实现,从严格的层级系统到异级系统¹¹⁶,¹¹⁷,¹¹⁸。在这一观点下,意识和注意力是不同的过程:多模态拓扑结构提供了基本的意识体验,而注意力系统则在总体拓扑结构中突出有限的加工流。

图 4. 神经表征主义(NREP)与预测加工(Predictive Processing)的关系。NREP 认为,有意识体验——以维米尔的绘画《天文学家》中的一片段为例——产生于多个表征层次。

(A) 在最底层,我们发现了单一特征的神经元集合(assemblies),这是表征的最低层次(D 中的例子;在小鼠视觉皮层记录的集合;参见 Montijn 等人¹¹⁹)。这些集合执行预测编码操作,产生关于单一特征的假设(表征)(此处为视觉:形状、运动、颜色等)。这些特征表征在单模态元网络(unimodal metanetwork)层次被组合为一个假设;在视觉中,这对应于主要在视觉皮层层级中编码的联合表征(C)。在多模态元网络层次,不同模态的假设被组合,并在空间上实现整合。这个层次对应于现象意识(Phenomenal Experience)。
(B) 左:大脑的宏观图,描绘了视觉皮层如何在视觉感知的生成过程中与其他皮层区域进行交流(AUD:听觉皮层;MTL:内侧颞叶;PPC:后顶叶皮层;SOM:躯体感觉皮层;对身体活动个体:MOT:运动皮层;PFC:前额叶皮层,涉及目标导向行为和计划)。
(B) 右:示意图,展示了不同感觉-皮层层级如何相互连接,并且在身体活动个体中,如何与运动和执行区进行交流。图改编自 Pennartz¹³ 和 Pennartz 等人¹¹²。

NREP 的一个显著特征是,有意识表征具有多层次的本质。这一特征为意识的“难题(Hard Problem)”¹提供了一种思路:关键观点是,“层次”不应仅仅被理解为神经解剖学或聚合规模意义上的层次(意识可能在不同的基质中实现,甚至是人工基质)。相反,现象学在一个概念上不同的层级体系顶端涌现,其底层是单个神经元,然后经由集合层次、单模态和多模态网络表征逐级上升(图4)。

树突整合理论(DIT)

DIT¹⁴,⁵⁶,¹²⁰ 起源于对大脑皮层中递归加工作用的研究。它聚焦于皮层深层的锥体神经元(pyramidal neurons),以及它们树突中的非线性过程,这些过程使这些神经元成为皮层-皮层(cortico-cortical)和丘脑-皮层(thalamo-cortical)信息流会聚的支点或枢纽。目前,该理论基于六个核心观察,主要集中在啮齿动物的皮层第5层(L5)向皮层下区投射的(extratelencephalic, ET)锥体神经元:
(1) L5 锥体神经元通过非线性的顶端树突过程,将到达不同树突区室的信息结合起来,从而导致爆发性放电¹²⁰,¹²¹,¹²²。
(2) 抑制这些锥体神经元的顶端树突过程(如树突钙峰)会抑制有意识感知¹²³。
(3) 抑制 L5 锥体神经元的皮层下靶点(尤其是高阶丘脑)会抑制有意识感知¹²⁴。
(4) 麻醉引起的意识丧失与这些神经元顶端与基底树突的去耦合相关¹²⁵。
(5) 抑制高阶丘脑会使顶端与基底树突区室解耦¹²⁵。
(6) 神经调质状态控制 L5 锥体神经元的树突耦合¹²⁵。

综上,DIT 认为这些一致性发现的最佳解释是:皮层下投射锥体神经元的顶端轴是皮层-皮层和丘脑-皮层信息流的枢纽,而这两者(且必须同时)是哺乳动物意识的基础¹⁴,⁵⁶,⁵⁷。因此,多个与 L5 神经元树突内突触输入整合相关的过程,对于理解这些神经元的输出如何与意识紧密相关是至关重要的。

DIT 的基本见解是:L5 皮层锥体神经元在两个物理和功能上分离的区域中接收和处理类别不同的信息:顶端区室和基底区室。这两个区室之间的电学分离本已相当显著,并因高“漏电”电导而进一步加强,使得顶端和胞体的计算几乎彼此隔离。然而,现在已经明确,这些神经元能够通过依赖于树突电压敏感离子通道的高度非线性过程,将到达两个区室的信息联系起来¹²¹,¹²²,并且这一过程受限于作用于树突树特定子域的高度特异的抑制和神经调质¹²⁶。DIT 的假设是:首先,这些神经元的基底区室主要接收与该 L5 锥体神经元所在皮层柱所处理的特定认知或感觉特征相关的前馈信息。其次,长程反馈信息主要作用于同一神经元的顶端区室,提供关于大脑其他区域(包括其他皮层区)正在发生的过程的信息(或语境)。

为了解释哺乳动物大脑中的信息流,需要多区室神经元,这是 DIT 的一个独特特征,它引出了许多推论和预测¹⁴,¹²⁰,¹²⁷。例如,DIT 的一个推论是:与知觉过程相关的先验知识(如语义记忆)应依赖于连接到顶端区室的突触的影响。最近在啮齿动物中获得的证据表明,巩固的语义记忆存储在第1层的连接中,并通过其对顶端树突活动的影响发挥作用¹²⁸,¹²⁹。此外,高阶丘脑-皮层投射维持顶端与基底树突的耦合,这一观察已被提出用来解释皮层-皮层和丘脑-皮层环路的同时完成,因此可作为麻醉引起意识丧失的机制¹⁴(图5)。这进一步引出了这样的假设:定向注意(directed attention,AC 的一个方面)由不同皮层柱中树突耦合的选择性维持所控制,而这又可以调节与 PC 相关的后皮层区域中锥体神经元的耦合。抑制和神经调质输入对耦合的调控,也提出了关于大脑状态与意识(包括做梦)之间关系的特定预测¹³⁰。

图 5. 树突整合理论(DIT)。DIT 提出:一种特定的细胞机制是意识以及与有意识加工相关的全局激活模式的基础。

(A) 皮层锥体细胞整合来自顶端和基底树突区室的信息。在这两个区室之间,有一个连接点(nexus point),像闸门一样控制它们之间的耦合。
(B) 左:该耦合机制在丘脑-皮层系统内控制信息流。在有意识状态下,锥体细胞内的闸门是开放的,允许信号传播到高阶丘脑,而高阶丘脑自身投射到中层皮层,维持跨顶端树突的耦合。右:在无意识状态下,皮层锥体细胞解耦,导致丘脑-皮层系统中的活动传播崩溃。
(C) 投射到高阶丘脑的深层锥体神经元的顶端树突因此代表了跨整个皮层维持反馈和影响的枢纽点。麻醉剂在这一枢纽点(顶端树突的耦合区)造成的破坏,会导致整个系统中反馈的广泛丧失。

跨聚合水平比较理论

在这里,我们比较所有五种理论,讨论它们的相似性和差异,以及兼容性和互补性。所有理论都提出了常常重叠或相似的神经机制,从而提供了潜在的收敛点(差异见框 3)。神经机制可以在不同的组织层次上进行描述,从(亚)细胞过程的微观层次,到区域内回路的中观层次,再到脑区之间相互作用的宏观层次。尽管不同的意识理论主要关注的层次不同,但这些层次被视为层级组织的,因此可以描述它们的机制关系,并辨别差异与共同点(图 6)。

BOX 3 如何推动意识理论的发展:剩余的差异、批评与路径

当前对神经意识理论的整合方法并不意味着我们应当对仍然存在的根本差异和批评保持天真。在 PC(现象意识)与 AC(可及意识)的不同聚焦之外,还有几个关键差异值得强调。GNWT、RPT、PP/NREP 和 DIT 强调信息处理、计算和消息传递在生成体验内容中的作用,而 IIT 则将体验认定为由神经基质支持的因果-效应结构。这需要考虑的不仅是基质的实际状态,还包括它的潜在状态库⁹⁵,而其他理论将特定的有意识体验解释为实际状态,而不考虑系统的所有可能状态。因此,IIT 并不将意识认定为某种特定功能(见 Tononi 和 Koch¹³¹),而其他理论则以功能性术语来表述意识的神经基础,例如信息分布(GNWT)、学习与特征绑定(RPT)、预测(PP、DIT 和 NREP)、以及多模态情境性概览(NREP)。然而,这些理论和其他理论将功能属性归于意识,并不等同于计算功能主义(computational functionalism)(例如 Pennartz¹²,¹³)。

对神经意识理论的一般批评是:在考虑了图 1、图 2、图 3、图 4、图 5、图 6、图 7 所示的机制之后,人们仍可能会问:“……但为什么这些机制会产生意识?”这一问题指向“解释鸿沟”或“难题”,不同理论以不同方式处理这一问题(见正文),但也应作为严肃的批评加以重视。例如,被普遍接受的递归处理原则可能是意识所必需的,但不太可能是充分的。因此,当前理论面临欠约束(underconstrained)的风险,需要基于实证证据和理论推理进一步阐述。一个例子是,缺乏约束可能导致在非神经基质中的意识赋予上出现差异性宽容(例如,IIT 相对宽容;NREP 和 DIT 更为限制¹³²,¹³³)。此外,除了“结构”与“消息”的区分之外,消息如何获得意义(意向性,“关于性”)的问题仍潜伏在背景中(例如 Pennartz¹²,Chalmers¹⁵ 和 Searle¹³⁴)。

如何穿越这片看似令人望而却步的哲学雷区?一种路径是针对不同理论在某些差异性、可实证检验的预测上进行对抗性测试。Templeton 世界慈善基金会已资助了五个此类项目,包括对 GNWT、IIT、PP/NREP 和 RPT 的测试。实验针对的议题包括:代表有意识内容的解剖学位置、刺激时长与类似点火的过程⁵、以及非活跃神经元和运动活动在视空间感知中的作用(参见 https://www.templetonworldcharity.org/projects-database/0646)。然而,我们认为这种对抗性测试将从互补方法中获益,因为它可能(1)测试的是与被检验理论边缘相关的预测,无法检验其核心假设;(2)过度依赖证伪主义,期望在理论之间做出明确的拒绝/接受二分。某一理论下看似错误的结果,在另一理论下可能完全可以接受;理论的改进也可能是通过逐步累积的证据来支持或反对某些观点,与溯因推理(“对数据的最佳解释推理”¹³⁵,¹³⁶)和贝叶斯证据累积¹³⁷是一致的。因此,我们倡导一种互补的方法,即通过积累新的实证证据,将各种理论中得到最好支持的要素结合到一个改进的框架中,从而具备更强的预测力。最后,我们还预期这些结合的方法将逐渐消解一些看似深刻的概念性(有时是形而上的)分歧。例如,针对理论制定出更多基于实证的约束,预计将限制那些可能被合理归因于意识的复杂自然系统的范围。

图 6. 各种理论所涉及的意识聚合层级。最低层次(C 的底部)由皮层锥体细胞表示,在此,DIT 尤其提出的顶端树突放大过程(用树突 Ca²⁺ 峰值和树突-胞体耦合来说明),为有意识加工奠定了细胞基础。“ALL”意味着其他四种理论也认可这一点,尽管它们没有特别提出这一基础。接下来的聚合层次是皮层微回路中的局部(区域内)递归处理(C,左上角;引自 Suzuki 等人¹³⁸)和皮层-丘脑环路(C,HO:高阶)。

(B) 多区域层次由哺乳动物皮层的大规模连接图表示¹³⁹,各理论一致认为递归处理对意识很重要,尽管原因不同。

(A) 在宏观尺度上,橙色阴影区域表示与现象视觉体验相关的后部皮层区域(根据 RPT、NREP 和 IIT;包括顶叶和颞叶区域),而 GNWT 则认为,具有与后部区域长程连接的前额叶区域(黑箭头)是 AC 的关键。NREP 假设视觉区域与其他感觉模态及运动系统之间的基本通信(灰色箭头)。灰色括号勾勒出特定的聚合层次;灰色箭头表示层次之间的关系。

微观层面:细胞与亚细胞层次

在相当一部分意识科学研究中,一个普遍假设是:意识最适宜在大规模网络及其计算层面被理解。然而,在大脑中,全局活动依赖于发生在回路、细胞,甚至亚细胞层次的过程。这里我们采取一种多尺度(multiscale)途径¹³,¹⁴⁰,试图从细胞层次出发(见图5与图6)剖析一些意识的底层过程。

递归加工(recurrent processing)与整合(integration)——这是在神经系统各层级运作的两条强有力的原则——在大多数意识理论(包括DIT、RPT、GNWT、IIT 与 PP/NREP)中都处于核心地位。尤其在 DIT 中,递归与整合被认为通过锥体神经元顶端树突(apical dendrites)中的非线性过程不可分割地联结起来,而顶端树突是皮层-皮层与丘脑-皮层环路(cortico-cortical & thalamo-cortical loops)的关键枢纽(图6C)。在清醒、有意识状态下,皮层第5层(L5)锥体细胞处于“耦合态(coupled state)”,使得到达顶端树突的反馈能在细胞层面影响胞体处理(somatic processing),从而将反馈中包含的“内部信息”以高度并行的方式重新整合进整个系统¹⁴,¹²⁵。依照 DIT,与有意识状态相关的树突整合确保整个丘脑-皮层系统处于一种可以在时空上整合活动的状态⁵⁶。这意味着活动能够通过皮层-皮层的递归连接传播与扩散;锥体细胞可激活高阶丘核,而高阶丘核反过来又能增强皮层中的活动¹⁴,⁵⁷。根据 DIT,这种随时间演化的活动在宏观尺度上表现为意识的丰富全局动态(global dynamics)¹³⁰。DIT 认为,若 L5 锥体细胞被解耦(如麻醉或无梦睡眠期间)¹³⁰,则这种全局协调无法发生;此时活动可在皮层内局部传播,但无法牵涉更大的丘脑-皮层环路¹³⁰。因此,与意识相关的大规模脑动态(fMRI、EEG 等所测)依赖于亚细胞层次上正在发生的树突整合。

在 DIT 中,这一局部机制为其他加工层级的意识相关过程奠定了基础¹⁴。举例而言,IIT 预测:解耦锥体细胞会使主复合体(main complex)之内的因果-效应可及谱(cause-effect repertoire)出现剧烈崩解,从而降低 Φ 值并降低(或丧失)意识⁷。于是,树突整合作为一种具体的细胞机制,得以在丘脑-皮层系统中控制信息整合,这与计算建模一致⁵⁴。同理,若树突整合是丘脑-皮层网络中信息流的核心,那么当前额-顶叶网络中神经元的顶端与基底区室被解耦时,全局工作空间(global workspace)的活动也会崩溃¹⁴,¹²⁵。因此,足以引发大规模“点燃(ignition)”的活动传播与整合,可能只会在 L5 锥体细胞处于耦合态时发生。同样,局部树突整合或可促成多感觉模态与跨尺度的联合神经活动模式(joint patterns)的建立,这在 NREP 中至关重要。总而言之,亚细胞层次的树突整合大概率是实现皮层或丘脑-皮层网络跨区域大规模整合的“使能条件(enabling condition)”。因此,只要一种意识理论依赖这种大规模整合,DIT 所提出的机制就可以被纳入其中。

树突整合也为具有“双通路(dual-stream)架构”的意识理论(如 RPT 与经典 PP;参见 Rao and Ballard¹⁴¹)提供了神经生物学的细化阐释。尤其是,关于树突整合机制的知识揭示了两条通路如何在单个锥体神经元层面交互。按照 RPT,意识源自大脑中不同加工层级之间的递归交互。这一观点与 DIT 相容,因为解耦锥体神经元会导致大脑中的递归加工崩溃¹⁴,¹²⁵。按以 PP 为基础的意识观点(如 NREP),自高到低传递的预测信号试图通过抑制与预测匹配的感觉信号来“解释掉(explain away)”由低到高传播的活动;而无法被预测的部分则以上行的预测误差形式传递。尽管依 DIT,L5 锥体细胞的内在生物物理过程倾向于放大两股通路之间的匹配¹⁴,¹²⁰,但锥体神经元(以及相邻皮层中间神经元)的多种生物物理特性,都可以被并入 PP 框架(图6C;¹³⁵,¹⁴²–¹⁴⁵)。上述各变体都与将树突整合作为生成有意识体验的细胞学基础这一原则相容。然而,依 DIT,递归仅是意识的必要条件之一;另一个关键成分则是树突整合机制,使得反馈信息能被纳入到正在进行的丘脑-皮层系统的激活模式中。

中观层面:局部回路与递归加工

皮层-丘脑微回路内与微回路之间的局部加工如何对意识做出贡献?除 DIT 所强调的大型 L5 神经元之外,多种神经元类型通过数以百万计的突触连接,构成了皮层柱内与柱间极其复杂的微回路¹⁴⁶,其复杂度常被低估。这种高密度复杂性,再乘以同样丰富的跨区与皮层—皮下交互,可能超越直觉,并(以未被预测的方式)对主观体验(PC)的“似非物理性现象”做出贡献或导致该现象。皮层神经元与微回路内外所嵌套的细密复杂性,与本文讨论的五种理论都密切相关;例如,按 IIT,这些复杂性可能有助于支撑 P-意识(P-consciousness)的高 Φ 因果-效应结构⁹⁵。

一般而言,无论在微回路内¹⁴⁷还是更全局范围,反馈(RP)都是大多数意识理论(RPT、GNWT、IIT、PP/NREP;参见“宏观层面:多区域系统”与“统领性概念:丰富性与复杂性”)中的重要特征,并参与与意识相关的过程,如工作记忆(WM;见图3)与感觉适应²⁰。然而,就“意识”而言,局部加工究竟能特定地贡献什么?基于“微观层面”DIT 的预测,PP/NREP 提出:底层预测与预测误差的计算高度依赖于局部的柱内回路,它调控 L5 以及 L2/3 锥体细胞的信息通路。累积证据提示:**浅层锥体细胞(L2/3)**在表征(预测)与误差编码中发挥作用,而 L5 细胞尤其在表征编码中发挥作用²³,¹¹⁸,¹³⁵;其中,**SOM阳性中间神经元(somatostatin-positive interneurons)**被牵涉进误差计算¹⁴⁸,¹⁴⁹。

尽管 RPT 主要聚焦于视觉区内与视觉区之间的 RP¹⁵⁰–¹⁵²,Lamme 也讨论了:仅由相互连接的神经元对之间的 RP 是否也可能产生一些意识。然而,由于反馈的普遍性,Lamme 主张还需要其他过程(也许是神经可塑性)来支持 PC¹⁰²。

GNWT 隐含着:有意识接入(AC)依赖于 RP,因为其“点燃”与混响活动(reverberant activity)实现了对有意识内容的接入²⁸。GNWT 的早期版本提出:具长程连接的 L2/3 锥体细胞(而非 DIT 所强调的 L5)对 AC 最为关键;但更新的版本也纳入了与皮下结构的环路。Dehaene 等人的 AC 模型¹⁵³,引入了具有层片式前馈与反馈投射的丘脑-皮层柱,模拟出了伴随 P300 波与注意瞬脱(attentional blink)的点燃。其网络模型¹⁵⁴提出:同一回路可通过不同操作模式访问并将一个短暂(<1s)的知觉缓冲区广播到 WM 与意识(AC)。按 IIT,为了意识,反馈(RP)是必需的。依据计算 Φ 以“量化”PC 的方式,纯前馈架构的人工系统具有 Φ = 0,因而缺乏意识(PC),即便它们的外显行为(输入-输出函数)与具反馈、且有意识(Φ > 0)的系统无异⁹⁴,⁹⁵(但参见 Doerig 等人¹⁵⁵)。因此,即便存在合适的架构,只要反馈连接在功能上被禁用,意识也应当消退。另一方面,由于 IIT 认为决定 Φ 与 PC 的是脑回路的因果结构而非其活动本身,那么只要某回路在主 Φ 复合体中因果整合,即便神经元处于静默,也能对 PC 做出贡献。这一与其他理论不共享的反直觉预测,正通过 IIT 与 PP 的对抗性合作进行检验(见:www.templetonworldcharity.org/projects-database/0646;框3)。

Haun 与 Tononi 提出:感觉皮层中“网格状(grid-like)”的神经回路(类似晶格)构成空间经验的基质⁹⁷。网格状连接在视觉及其他感觉皮层中均可发现,但基于 PP 的解释通常将感觉皮层的拓扑结构理解为:一种从感觉空间某一部分推断至另一部分的“布局”(cf. Knierim and Van Essen¹⁵⁶),而非 Haun 与 Tononi 所主张的方式。此外,NREP 认为:主观空间经验源自不同空间框架(视网膜坐标 retinotopic、头部坐标 craniotopic、与客体中心坐标 allocentric¹²)下的地图之间的多模态整合。

除了承载信息内容,局部回路的神经调质状态会随着不同的“唤醒水平(arousal)”而改变(这反映了“经典”意识维度之一¹⁵⁷;但参见 Hill and Tononi¹⁵⁸、Laureys 等¹⁵⁹ 与 Bayne 等¹⁶⁰)。然而,依据对神经调质状态的较新观点,这些状态可被视为“背景条件”或“使能因子”,与意识本身仅存在间接关联(并不特指有意识内容)¹⁶。麻醉或神经调制引起的局部“唤醒”状态与网络复杂性的改变,已在丘脑-皮层网络模型中被建模¹⁵⁸,并似乎与本文讨论的五种理论大致相容,尽管树突机制(DIT)迄今尚未纳入。这类调制效应甚至在离体皮层切片(“中尺度”³⁶)中用修订版的扰动复杂性指数(PCI)及与之相似的复杂性指标得到评估,方法与人类研究类似(见框1;统领性概念:丰富性与复杂性)。尽管这些测量不能就切片与啮齿类的意识做出推断,但它们有助于揭示因复杂性丧失与恢复而引起脑状态变化的细胞与网络机制¹⁶¹。

宏观层面:多区域系统

沿神经解剖学尺度向上,我们会问:支撑有意识体验的大脑机制如何在脑区以及由多个脑区组成的系统层面运作?就此,本文综述的五种理论可分为三组。其一,IIT、PP–NREP 与 RPT 的共同点是:对于有意识的视觉,它们都强调后皮层(尤其是与视觉有关的枕叶、顶叶与颞叶区域)的首要作用。IIT 认为,当高阶与低阶视觉区之间发生高密度的回返交互时,最大 Φ 值主要会在后皮层(“热点区”)达到⁷⁸,⁹⁵。以 PP 为基础的解释(包括 NREP)认为,有意识视觉始于视觉皮层层级内部前馈信号流(主要传递误差信息)与递归信号流(传递自上而下的预测)之间的交互²³,¹⁴¹,¹³⁵,尽管也存在替代方案(如 Heeger¹⁶²)。IIT 与 NREP 还提出:在可变的视觉环境中,会有不同的、可切换的脑区子集参与前馈与反馈交互,以确保视觉特征的整合,这取决于主体体验中包含哪些视觉子模态¹²,⁸⁸。视觉皮层系统内的 RP 也是 RPT 达成 PC 的关键,而全局的递归加工则是纳入注意效应并达到 AC 所必需的。

GNWT 赋予前额叶与顶叶皮层在有意识视觉中显著角色,这与其聚焦 AC 而非 PC 的立场一致,并将这一焦点转译为执行功能,如行为反应、注意、工作记忆、价值评估——这些功能都与前额–顶叶网络相关⁶。其三,如前所述,DIT 更强调意识的细胞学基础。从这个意义看,DIT 对“前部 vs. 后部”的有意识视觉神经基质之争“保持中立”。值得注意的是,五种理论一致认为:新皮层(neocortex)是生成有意识内容的关键结构(不同于强调脑干/间脑“中脑中心结构”的理论¹⁶³–¹⁶⁵),且丘脑核对维持意识至关重要。此外,五种理论都认为:在局部/短程交互之外,丘脑-皮层系统中的长程通信是意识所需的⁶,⁷,¹³,¹⁰⁵。

然而重要的是,RPT 与 NREP 都认为:仅凭视觉皮层层级内的信息处理并不足以达成有意识视觉(无论理解为 PC 还是 AC)。按 RPT,广泛的递归加工需要注意;为此,视觉皮层与前额叶之间的交互被视为必要¹⁰²。从这个意义上讲,RPT 与 GNWT 的相容性比它们在定义上的差异更大:二者都赋予前额–顶叶网络在调节注意信号上的关键作用¹⁰²,¹⁰⁵。PP 视角下,注意与“大预测误差”与“低决策置信度”有关,由此促使主体在感觉空间中对知觉不确定的区域寻求更多信息(如 Kanai 等¹⁶⁶)。

在 NREP 所描绘的意识体验标志中,我们看到“动态性与稳定性”的结合——其中“稳定性”指尽管存在眼、头与身体运动,仍能将外部世界与其对象感知为一个稳定整体的能力¹²,¹³。要在身体活动主体中实现视觉稳定,需要视觉皮层与运动皮层之间的交互:视觉系统接收运动信号(连同本体感觉与前庭反馈)或关于“哪些感觉变化正在或即将发生”的预测¹¹²,¹⁶⁶。此外,NREP 认为感觉-皮层系统之间的侧向、多感觉交互是确保意识的质性、多模态丰富性的必要条件¹⁶⁷。因此,视觉并非仅由传统定义的视觉丘脑-皮层系统介导,而是由“扩展视觉皮层”(extended visual cortex)介导,其中包含许多卫星区域。IIT 与 RPT 等并不排斥这些附加交互,但它们并不特别强调此点。

综上,初看之下,三种理论至少在有意识视觉的宏观解剖学上达成了大体一致,而另两种理论要么表达不同观点(与其不同的背景定义相关,如 GNWT),要么保持中立(DIT)。这种 IIT、RPT 与 NREP 的“全局相容性”并不意味着它们范围相同或彼此相似。例如,它们对“为何后皮层中的递归反馈对意识是必要的”给出了不同理由(IIT:为了最大化 Φ;RPT:为了支持可塑性、学习与特征绑定;NREP:为了闭合表征学习与推理的环路)。另一个关键差异在于“静默神经元”的假定角色(在 IIT 中,除非与网络脱耦或被灭活,静默神经元也能对意识体验做出贡献⁵⁵;其他理论并不持此观点)。尽管如此,我们仍可总结:即便在多区域系统层面,这些理论之间也远没有有时被假定的那么不相容。

统领性概念:丰富性与复杂性(Richness and complexity)

越来越多的实验证据表明,与意识相关的神经元交互模式不仅必须通过前馈与反馈连接被紧密整合(integrated),同时还必须具有分化(differentiated)与信息丰富性(information rich)的特征³²,¹⁶⁸,¹⁶⁹。大脑复杂性(brain complexity)这一概念——被定义为整合与分化的共存——是 IIT 早期 Φ(phi)概念的核心⁸⁹,⁹⁰,并在其成熟版本的实证预测中仍居于中心地位⁹⁵。

最近,其他理论也开始采纳“大脑复杂性”的观念。例如,GNWT 的一个关键要点是广泛激活的“点燃(ignition)”。因此,IIT 与 GNWT 在实践中共享对“神经整合”的基本要求,尽管二者的理论动机不同。值得注意的是,GNWT 的最初表述并未明确涉及与信息相关的度量、分化或复杂性,而主要聚焦于神经过程,如额-顶叶同步与 P3b。随后,GNWT 支持者的实证研究把焦点转向“动态响应谱(repertoire)的丰富性”³⁰,¹⁷⁰;更近一步,基于“分布式模块广播不同类型感觉信息”的理由¹⁷¹,“复杂性”的概念已被明确纳入 GNWT 的关键要素之列。

按 IIT 的定义,“大脑复杂性”与 DIT、RPT 所提出的微观与中观层次过程存在清晰的机制关系。它要求有效的回返交互(reentrant interactions),以确保分化的神经元群体保持紧密耦联并参与丰富的因果-效应交互。无论是“树突解耦”(dendritic decoupling)还是“递归交互的崩解”,都被预期会显著降低大脑整合信息的能力。沿此思路,实验上在睡眠与“无反应性清醒综合征”(俗称“植物人”状态)患者身上观测到的复杂性崩塌,与反馈交互的破裂相关³⁷,¹⁷²,¹⁷³,¹⁷⁴。

类似地,“复杂性”也内含于 NREP 所主张的“多模态丰富性与整合”之中,尽管二者之间也存在重要差异。IIT 用“大脑复杂性”解释所有经验都“直接具备”的一般现象属性(统一性与丰富性),而 NREP 与更一般的 PP 立场则把有意识体验视为“表征性的(representational)”——是对外部现实的最佳“拟像(simulacrum)”¹²,¹³,¹⁷⁵,¹⁷⁶。在神经表征视角下,“复杂性”被转译为一个多面向现象:包含有意识内容的多模态、质性丰富性;空间延展与分辨率;强度与注意;以及时间深度(temporal depth)——所有这些都被理解为将有助于后续的行动规划¹³,⁵³。就此而言,对“脑复杂性”的定义与操作化方式不止一种,仍需更多努力来明确各自的前提,并将复杂性的观念扩展为更完备的谱系(taxonomy)³²。

尽管如此,围绕“复杂性”这一一般性观念的最新聚合⁸⁸具有有趣的启示——特别是对于无反应患者的实证应用¹⁷⁰,¹⁷⁷,¹⁷⁸(见框1)。广泛的理论共识可能提升信心,并在更具挑战性的情境下为推断提供正当性。此外,“复杂性与信息丰富性”可以在多层级被研究(图6):从人类的颅外与颅内记录,到啮齿动物³⁸,¹⁶⁹,¹⁷⁹,¹⁸⁰,¹⁸¹,再到皮层切片¹⁸²。需要强调的是,在校准于人脑之外的系统中,当前的复杂性度量并不能用于推断“意识水平”尽管如此,它们为在不同尺度间建立“神经过程—机制关联”提供了可能性:从微观的树突整合到中观的递归过程,再到宏观的跨区整合。最后,围绕“复杂性”的收敛,或可作为一个共同背景,以更细粒度对比不同框架。

在大脑何处、以何种方式具体化(instantiate)“复杂性”?对 IIT 而言,网格状皮层具递归的“金字塔式(pyramid-like)”收敛-发散连接(如后部区域)(图7B),其因果-效应结构被认为对应于复杂性的最大化,从而足以支撑有意识体验⁹⁶,⁹⁷。PP–NREP 与 IIT 共享对“空间延展感知(spatial extendedness)”神经基础的探索,但前者从枕叶、颞叶与顶叶皮层所使用的“视网膜坐标(retinotopic)—头部坐标(craniotopic)—客体中心坐标(allocentric)”参照框架之间的整合入手¹²;这些不同路径可能并不矛盾,反而可以兼容。另一个关键问题是:为何一些意识理论关注“正在进行的神经活动”的复杂性,而另一些则强调“底层因果结构”的复杂性?¹⁸³ 这一点亟需澄清,因为它不仅意味着截然不同的测量路径(观察性 vs. 扰动性),也意味着对“哪些信息对意识重要”的理解存在实质差别(外在的“消息” vs. 内在的“因果-效应结构”)(见框3)⁷,¹⁸⁴,¹⁸⁵。最后,当下的理论如何看待这样一种可能:分析大脑内因果交互的结构与复杂性,也有助于寻找内容特异性的意识神经相关物?尽管这一问题颇具挑战,已有工作在这一方向上开展⁹⁷,¹⁶⁷,¹⁷⁶。

图7. 意识理论的比较

总结图说明了本文讨论的五种意识理论如何在一定程度上互为补充、部分重叠,并且彼此之间及与核心概念和待解释现象(explananda)——现象意识(phenomenal consciousness, PC;橙色元素与C)和可及意识(access consciousness, AC;红色元素与L)——相关联。此处主要以视觉为例进行说明。

(A 和 B) 整合信息理论(Integrated Information Theory, IIT),以及其整合信息(Φ)的度量方式,Φ 按 IIT 的解释量化了现象意识(P-consciousness)。
(C) PC 以主观视觉经验的图像来说明(取自 Ernst Mach¹⁸⁶ 的单眼体验图像)。
(D 和 E) 递归加工理论(Recurrent Processing Theory, RPT)。
(F) 树突整合理论(Dendritic Integration Theory, DIT)。
(G, H 和 I) 神经表征论(Neurorepresentationalism, NREP);(I) 中的缩写见图4B。
(J 和 K) 全局神经工作空间理论(Global Neuronal Workspace Theory, GNWT)。
(L) 可及意识(AC),通过对感觉刺激的行为与认知反应来说明。

我们认为,这五种理论至少在一定程度上互补,但其主要关注点不同:IIT、RPT 与 NREP 主要致力于解释 PC(图中 B、E 和 H 下方的橙色括号),而 GNWT 主要致力于解释 AC(同时其他理论也将其视为待解释对象;红色括号在 B、E、H 和 K 下方)。

(F) DIT 被提出为意识(包括 PC 和 AC)所需脑网络功能的细胞基础,并且与其他四种理论——IIT、RPT、NREP 和 GNWT——均相容(图中 B、E、H 和 K 下方的灰色括号)。图中 (E)、(H) 和 (K) 内彩色圆圈与箭头的水平排列表示前馈与递归加工流;中间一行代表从丘脑(LGN)到额叶皮层的中央视觉通路;上下两行代表辅助视觉通路(RPT、GNWT 和 NREP)或其他感觉模态(NREP)。RPT 认为视觉系统内及其高级区的递归加工对视觉 PC 至关重要。RPT 和 GNWT 都认为递归加工必须涉及前额叶系统才能达到 AC。NREP 强调感觉模态和子模态之间的交互,以解释 PC 的质性差异,即便仅限于有意识视觉(H 中的紫色箭头)。

总体评估:走向一个整合的意识理论?

调和这些理论、甚至追求一个统一的意识理论,现实吗?表面看来,如我们所见,至少部分理论似乎差异极大(见框3),以至于弥合它们看似无法逾越。这甚至导致不同理论之间相互指责不合法¹⁸⁷。然则,我们认为,多种理论的存在恰恰体现了这一新兴领域的健康性。只要密切关注待解释现象,就能解开核心主张的纠缠,使多种理论同时为我们的理解贡献力量。理论的关注点与解释对象的根本差异,有时反而使它们更具相容性。例如,GNWT 聚焦于 AC,而 RPT、IIT 与 PP/NREP 则主要解释 PC。一个整合的意识理论必须能在神经层面解释 PC,同时还要说明有意识内容如何被分配和用于后续的行动规划、工作记忆(WM)、价值评估与注意调控等——这是 AC 的领域。此类建模工作已经展开,例如把 PP 框架与全局神经工作空间操作相结合¹⁸⁸,¹⁸⁹。我们还看到,RPT 原则上可以与 GNWT 整合,共同涵盖 AC。IIT 已经承认前额叶在可及性中的作用,因此在 AC 的“前部焦点”问题上并不与 GNWT 矛盾。尽管如此,仍有人会争辩 GNWT 与 IIT 不可能同时正确,因为它们对“意识是什么”的本质存在分歧(见框3)。

另一个潜在概念收敛点在于与复杂性相关的高级概念:信息整合(IIT)、全局信息可用性(GNWT)、多层次表征的多模态丰富性(NREP)、不同解剖尺度上的递归加工(RPT)、以及皮层-丘脑环路中的整合(DIT)。虽然表面上这些观点差别很大,但其根本都基于“互联性”的不同方面,并一致认为:神经交互的丰富性(依赖于皮层-丘脑系统的短程与长程连接)是实现显著程度意识的重要因素(图7)。

这些收敛点与相关考量,为我们提供了理由去抱有希望:最终,一个整合的意识理论——或者至少一组相互嵌套的概念与工作假说——可能在未来数年或数十年内触手可及。然而,我们也必须承认,仍有大量理论与实证领域尚待探索(见框3)。意识研究的现状可比作一个多面体,从不同角度被观察,每个角度都强调不同方面。这与量子力学相似:对现象的观测有共识,但如何解释微观概率描述与宏观确定性日常生活之间的关系却仍有广泛分歧。这两种情形或许都反映了人类想象力与直觉的根本局限¹²,¹⁹⁰。这一类比凸显了迫切需要发展清晰定义的概念与共同术语(例如,不能仅用笼统的“意识”来指代 AC 与 PC 这样不同的概念),并找到方法将不同表述互译。正如量子理论因稳固的数学框架而获益,意识研究也应如此。

最后,我们认为,广泛且无争议的共识是:需要更多实验测试和实证测度的发展。其意义体现在两个方面。首先,新的、理论驱动的实证测度,如 PCI 和其他复杂性相关指标,可以在临床中发挥作用,例如帮助对无反应性意识障碍患者进行分组,以作出更细微的区分并评估不同的康复与治疗前景(如 Demertzi 等¹⁷⁰,Casarotto 等¹⁷⁷,Farisco 等¹⁹¹)。其次,实证测度有助于区分或统一不同理论。例如,在有意识条件下由 TMS 诱发的高复杂性时空 EEG 模式,总是与回返激活波的存在相关¹⁷⁴,¹⁹²,而低复杂性模式则出现在慢波睡眠与麻醉的皮层上/下状态中(如 Steriade¹⁶¹,Olcese 等¹⁹³)。因此,PCI 不仅与 IIT 的假说相容,原则上也与 GNWT、RPT、NREP 和 DIT 相关的神经过程相符¹³,¹⁴,¹⁰²,¹⁷¹。该领域已经从更广泛的实证工具与测度中受益。例如,DIT 引入了 EEG 与 LFP 指标,与树突 Ca²⁺ 脉冲在不同意识阶段的表现相一致¹⁹⁴;PP/NREP 提出“表征性测度”,依赖于对受试者当下意识内容的解码技术(参见 Goltstein 等¹⁹⁵;另见框2);GNWT 则可结合“报告 vs. 无报告”范式与单神经元记录、fMRI 及 EEG-MEG 来获益(如 Sergent 等⁴²)。此外,还可借助计算方法促进进一步比较与整合¹¹⁶,¹⁸⁸,¹⁹⁶,¹⁹⁷;并且研究范围正从人类扩展至动物意识,以借助体内双光子成像、大规模群体记录、复杂性测度与光遗传学来揭示意识的因果基质(如 van Vugt 等⁶⁴,Oude Lohuis 等¹¹⁴,¹¹⁵,Takahashi 等¹²⁴,Suzuki 与 Larkum¹²⁵,Arena 等³⁸,¹⁷⁹,O’Connor 等¹⁹⁸,Storm 等¹⁹⁹)。对立性研究(adversarial research)正成为意识研究的重要新方法⁵,但尚待观察这是否最终会导致类似“达尔文式选择”的单一胜出理论(见框3)。在此,我们倡导一种更统一、面向整合的方法,寻求在实证测试的基础上,结合来自不同理论的有价值要素。

结论

我们认为,神经意识理论:(1)其差异往往没有最初设想的那样大或不可逾越;(2)在不同层级的组织上提供了结合与整合的机会;(3)一个由实证与理论进展共同引导的整合框架,具有在未来十年推动该领域前进的强大潜力。

【声明】内容源于网络
0
0
鸣鹤睿思
投研笔记,聚焦趋势,全球配置,研究创造价值。重点研究领域:科技、生物医药。欢迎交流,VX:Kodiak-Bear-001
内容 225
粉丝 0
鸣鹤睿思 投研笔记,聚焦趋势,全球配置,研究创造价值。重点研究领域:科技、生物医药。欢迎交流,VX:Kodiak-Bear-001
总阅读272
粉丝0
内容225