受动机影响的决策需要考虑成本和收益。尽管中脑边缘多巴胺(Dopamine, DA)释放对奖励学习和决策至关重要,先前的研究对其在编码成本、收益或动机方面存在分歧。一是伏隔核(Nucleus accumbens, NAc)DA释放主要调节成本计算的结论,即动物为获取奖励付出多少努力。二是纹状体DA更可靠地编码潜在的收益,而不是成本。然而,这些研究大多是相关的,没有利用光遗传学等因果工具来探讨DA神经元活动如何直接影响行为。
2023年11月27日,来自美国斯坦福大学医学院精神病学和行为科学系的Neir Eshel研究员及其团队在《Neuron》上发表了题为Striatal dopamine integrates cost, benefit, and motivation的研究论文。
为了解决先前研究的局限性,团队建立了一个简单的操作任务,独立变化成本和收益,以产生对蔗糖奖励或DA输入的光遗传学刺激的行为经济需求曲线的响应。这种方法提供了一个动机的定量度量,由克服成本的意愿定义,独立于奖励剂量或无成本的偏好消费。同时,研究团队使用基因编码的传感器测量纹状体DA释放,以测试纹状体DA释放如何反映成本、收益和动机状态。研究人员发现,纹状体DA释放在每次试验中整合成本和收益,并且令人惊讶的是,高动机抑制了这些信号。这些发现调和了先前关于DA的研究的差异,并有助于澄清纹状体DA信号在有动机行为中的作用。
NAc和DLS的多巴胺释放
成本和效益的信号
▲ 在NAc和DLS中的DA释放编码了收益和成本
伴随着短暂的光音提示,小鼠通过主动用鼻戳孔的方式学会了获取蔗糖奖励。在训练完成的小鼠中,研究团队在50分钟内以10分钟为单位改变了获取奖励所需的鼻戳次数(FR)。同时改变作为奖励的蔗糖的浓度和数量,使小鼠经历了四种不同的收益。正如预期的那样,小鼠的操作行为对奖励收益和成本都很敏感。
在小鼠执行任务时,研究团队使用在体光遗传光纤记录了两个纹状体区域中的DA释放:对奖励学习和成瘾至关重要的NAc,以及长期与运动启动和习惯形成相关联的背外侧纹状体(Dorsolateral striatum, DLS)。
实验结果显示,增加蔗糖浓度和数量增强了NAc中提示的DA释放。尽管DLS中DA响应的动力学模式明显不同,具有更尖锐的初始峰值和蔗糖浓度的延迟效应,DLS中的DA也表现出相同的总体模式。
令人惊讶的是,尽管提示和奖励保持不变,成本的增加明显增强了两个区域中的DA响应,这与预期相反。尽管成本可能包括努力和时间,但效应不仅仅是由于奖励之间时间差异的差异,因为即使保持这个时间间隔恒定,DA释放仍随着FR的增加而增加。为了确定成本对DA释放的影响是否与FR的呈现顺序有关,研究团队进行了两个额外的实验。在一个实验中,研究人员让小鼠在不同的日子里经历五个FR,仍然发现了相同的效应。在第二个对照实验中,研究者让新的小鼠群体经历了两个单独的会话:一个是FR1在FR10之前,另一个是FR10在FR1之前。无论顺序如何,DA释放对更高的FR更大。
总体而言,在两个纹状体区域中,相位DA同时编码收益和成本,并且成本与DA释放呈正相关。
将消费与动机分离开来
经济需求曲线
▲ 经济需求曲线将消费与动机分离开来
为了做出理性的决策,个体必须综合考虑成本和收益,以确定收益是否值得成本。这种成本-效益计算是动机的核心。为了衡量动机,研究团队转向了对需求曲线的经典经济分析。对于每个会话,研究人员绘制了奖励消耗作为成本的函数,揭示了两个正交的参数:Q0,无成本时的首选消费水平,以及alpha,消费对成本的敏感性。Q0是需求曲线的y轴截距,主要受到总体奖励消耗或奖励率的影响。相比之下,alpha依赖于需求曲线的斜率,与主体获得奖励的动机成反比。换句话说,Q0在成本最小时衡量奖励偏好,而alpha在成本增加时衡量个体对任务的持续参与。
为了验证该分析是否准确反映了受试者行为的一致性,研究团队在连续的几天内使用恒定的蔗糖奖励重复进行了相同的需求曲线测试,发现动机度量和自由消耗度量保持一致,只有轻微的日常变异。此外,改变奖励大小并没有引起alpha的变化,但却引起了Q0的变化。这种动机和自由消耗之间的分离是预期的,有助于确保alpha参数不仅仅反映奖励的剂量,而更反映动物的动机状态。在典型的主体中,不同蔗糖奖励提供的情况下,自由消耗会在不同会话之间变化,但通过将每个需求曲线归一化为自由消耗,研究者发现alpha,即曲线的斜率和因此对蔗糖的动机吸引力,尽管剂量变化,仍然保持一致。
作为对任务有效性的最后测试,研究团队询问alpha参数是否能预测另一种常见的动机度量:对惩罚的耐受性。在这个新任务中,老鼠在70%的试验中以FR5获得蔗糖奖励,在剩下的30%的试验中,它们既获得蔗糖奖励又受到轻微的电击。研究人员发现,从先前的需求曲线测试中计算出的动机参数(1/alpha),而不是自由消耗参数Q0,预测了主体愿意经历的电击次数以获得奖励。这些结果强有力地表明,在本研究中使用的行为经济学任务成功地独立于剂量或首选消耗度量动机。
纹状体多巴胺的释放
反向反映了动机状态
▲ 纹状体多巴胺的释放反向反映了动机状态
为了确定纹状体DA释放与动机或奖励消耗的关系,研究团队利用了受试者表现的日常变化。引人注目的是,对于给定的固定奖励,DA释放反映了动机水平,但不反映自由消耗。在老鼠对特定奖励更有动机的会话中,纹状体两个区域在对奖励提示的响应中释放的DA更少。此外,组间比较显示,平均动机水平更高的老鼠在腹侧和腹侧纹状体中对于固定奖励的平均DA响应更低。因此,DA释放反映了动机的日常和个体间的变异。在两种情况下,动机越低,提示诱发的DA释放就越高。此外,这种效应特异于动机参数(1/alpha),而不是自由消耗参数(Q0)。在多元线性回归中,即使在控制自由消耗的情况下,动机仍然是DA响应的显著预测因子,而仅包括动机参数的模型优于包含动机和自由消耗的模型。因此,研究团队的DA发现不仅仅反映奖励偏好或消耗的变化,而更反映了动物为获得该奖励而支付逐渐增加的成本的意愿。
光遗传诱发的纹状体多巴胺释放
对成本很敏感
▲ 光遗传诱发的纹状体DA释放对沉没成本很敏感
所有以上的结果都依赖于对蔗糖奖励的研究,这对与味觉和饱腹感相关的回路敏感。为了绕过这些回路,在独立的老鼠群体中,研究团队使用了光遗传自我刺激。每只DA转运蛋白(DA transporter, DAT)-Cre小鼠接受了两次病毒注射:一次是将兴奋性光敏蛋白ChRmine或惰性荧光色素mScarlet输送到腹侧被盖区(Ventral tegmental area, VTA)或黑质致密部(Substantia nigra pars compacta, SNc)的DA神经元中,另一次是将GRAB-DA输送到NAc或DLS中的适当目标。然后,研究人员在NAc或DLS上植入,这样能够同时刺激DA输入并记录产生的DA释放。
任务几乎与之前相同,只是老鼠不再为蔗糖而进行鼻戳行为,而是伴随着相同的光声提示,为光遗传刺激纹状体DA释放而戳。如预期的那样,老鼠在NAc和DLS中都学会了鼻戳以获取DA输入刺激。
尽管使用相同的光刺激参数,随着成本的增加,无论在NAc还是DLS,光遗传诱导的DA释放都增加了。这个结果不是我们使用的特定刺激参数的人为结果,而是在多个不同的参数组合中都成立。对照组老鼠,尽管偶尔鼻戳却没有获得奖励,却没有在成本和DA释放之间显示出关系,这些结果与蔗糖实验一致。
光遗传诱发的DA释放
与动机成负相关
▲ 光遗传诱发的纹状体DA释放与动机呈负相关
对行为经济需求曲线的分析为确定纹状体DA释放的内在动机效应提供了一个平台。类似于之前使用蔗糖作为奖励的实验,研究团队利用了动机在一天到一天和老鼠到老鼠之间的变化,并比较了在高动机和低动机会话中的光遗传诱导DA释放。与先前的结果一致,低动机会话中NAc和DLS中的DA释放量较大。相比之下,自由消耗的幅度不影响光遗传纹状体DA释放。在每个受试者内和受试者间,以及多个不同的刺激参数下,动机与光遗传纹状体DA释放之间的反向关系保持不变。因此,尽管DA释放对于动物学习和执行任务是必要的,但更大的光遗传纹状体DA释放反映了更低的动机水平。
检验动机与纹状体DA释放之间的
因果关系
▲ 动机与纹状体DA释放的双向关系
通过在操作任务中系统地检查受试者内部和受试者间的行为变异,研究团队提供了证据表明获得自然奖励以及光遗传触发的纹状体DA释放这种人工、非生理学的“奖励”与被该奖励引起的纹状体DA释放的幅度呈负相关。到目前为止,这些证据还不能排除动机与纹状体DA释放之间的间接或巧合关系。为了测试这种反向关系的因果性质,研究团队进行了两个进一步的实验。
首先,研究人员试图操纵对奖励的内在动机,并观察对该奖励引起的纹状体DA释放的影响。为此,研究者训练了一组新的老鼠进行鼻戳以获得蔗糖奖励,并在两种条件下比较纹状体DA释放:标准条件,其中老鼠在行为会话期间除了在行为会话期间没有蔗糖外,还有一种条件,其中动物在每个行为会话前都可以获得蔗糖30分钟。如预期,预先饲养减少了对蔗糖的动机,而这些会话与在标准会话期间提供的相同蔗糖奖励引起的纹状体DA释放更高相关。因此,一种简单的降低对食物的动机而不影响任务表现的“自然”操作导致了在NAc和DLS中引起的奖励诱导的DA释放增强。
其次,研究团队试图操纵由自然奖励引起的DA释放,并观察对动机的影响。DAT-Cre小鼠组接受了两次病毒注射:一次是将抑制性光敏蛋白halorhodopsin(NpHR)输送到VTA或SNc的DA神经元中,另一次是将GRAB-DA输送到NAc或DLS中的适当靶标。然后,研究人员在NAc或DLS上植入光纤,以同时抑制DA输入并记录产生的DA释放。一旦老鼠从手术中恢复过来,研究者就像以前一样训练它们以获得蔗糖奖励。在行为经济学任务上稳定了它们的表现之后,研究团队使用光刺激来在每个试验的2秒奖励提示期间抑制DA释放。发现NpHR刺激成功减少了NAc和DLS中的DA释放,并且这种操作增加了对蔗糖奖励的动机,同时保持了类似的自由消耗水平。研究团队得出结论,纹状体DA释放与对自然奖励的动机之间存在直接的、双向的关系。
这项研究测量了纹状体的NAc和DLS中的DA释放,同时独立变化成本和收益,并应用行为经济学原理来确定小鼠的动机水平。研究团队揭示了在这两个结构中的DA释放同时包含奖励幅度和沉没成本。令人惊讶的是,动机与奖励诱发的DA释放呈负相关。此外,光遗传学诱导的DA释放也严重依赖于沉没成本。研究的结果通过证明纹状体DA释放同时在不同时间尺度上以不同方式编码成本、收益和动机,调和了先前不同的研究结果。未来的研究将需要确定高度动机动物中相位DA释放的减少是否是由于基础DA水平的变化。
领脑科技多通道同步光遗传光纤记录系统,具有同时实现多个通道的光遗传刺激和荧光信号记录的特点和优势,每个通道光刺激参数可独立调控。该系统能够解析多神经环路神经活动与行为的关联,探索行为的多样调控机制。
产品即将在年底推出,敬请期待!
领脑科技将持续为您
跟进业界最新技术与资讯,
下期见。
往期精彩内容
微信号 | 领脑科技
邮箱 | lingnaokeji@163.com
网址 | www.lambdaroptic.com
参考文献:
1.https://www.cell.com/neuron/fulltext/S0896-6273(23)00843-7

