大数跨境

【蛋白组学】科研私话 | 基于质普技术的蛋白组学研究基石——蛋白质的鉴定原理

【蛋白组学】科研私话 | 基于质普技术的蛋白组学研究基石——蛋白质的鉴定原理 丰信生命科学
2024-04-19
3
导读:基于质谱技术的蛋白质组学,需要通过裂解、酶切、色谱分离、质谱分析、搜库等多个步骤,最终实现对生物体内蛋白质的鉴定。这一技术不仅为我们提供了丰富的蛋白质信息,也为蛋白组学在动植物、环境、食品等领域的应用



Step1: 蛋白酶解、肽段分离

蛋白质的鉴定方法多种多样,但其原理基本都融合了生物化学、分析化学和计算机科学等多个领域的知识。本文旨在讨论基于质谱技术的蛋白质鉴定原理。

在基于质谱技术的蛋白组学项目中,首先要对细胞或组织进行裂解,以获得其中的蛋白质。然后需要对这些蛋白质使用特定蛋白酶进行酶切消化,变成一定长度的肽段混合物。一般选择胰蛋白酶(Trypsin)进行酶切,胰蛋白酶作用位点在K(赖氨酸)和R(精氨酸)的C端肽键,专一性很强;经酶切后肽段一般至少含一个K或者R,在ESI正离子模式下离子化效率高;酶切蛋白产生的多肽多在1-3 KDa,平均每个蛋白产生约50个肽段。

接下来,这些肽段混合物需要经过色谱进行分离。这个过程是利用肽段的亲疏水性的不同而实现的。经过色谱分离后,肽段混合物被转化为一系列单一的肽段,为后续质谱分析提供了原料。

基于质谱技术的蛋白组学实验流程图
(DOI:10.1021/acs.jproteome.2c00838)


Step2: 质谱检测、肽段碎裂

随后,这些肽段进入质谱仪中进行分析。在质谱仪中,离子源通过高能电子流等方法将样品离子化,使肽段带上电荷。这些带电的肽段随后进入质量分析器,在其中通过电场或磁场的作用,使不同质荷比的离子发生分离。质谱仪的检测器会记录下这些离子的质荷比及电荷信息,从而得到肽段的相对分子质量,这被称为MS1(一级质谱峰图)。

为了获得更详细的信息,还需要对肽段进行进一步的碎裂。常用的碎裂方式有碰撞诱导解离(CID)和高能碰撞解离(HCD)等。通过碎裂肽段,可以产生一系列的碎片离子,这些碎片离子的信息被记录下来后,被称为MS2(二级质谱峰图)。

MS1和MS2峰谱示意图
(DOI:10.1021/acs.jproteome.2c00838)
(图A表示,m/z = 482.278 Th的肽段经MS1检测,被选择后经HCD碰撞;图B表示,该肽段碎裂所生成碎片产生的MS2谱图)


Step3: 计算机算法匹配

综合MS1和MS2的信息,可以利用计算机算法进行肽序列标签的匹配。HCD、CID碎裂方式是从形成b-y离子的位置断开,含有完整氨基的一端称为b离子,含有完整羧基的一端称为y离子。因此,搜库软件通过样本实际二级谱图与数据库中理论酶切理论碎裂的二级谱图进行比对,从而鉴定出肽段序列,并进一步匹配到对应的蛋白质。这一步骤是蛋白组学鉴定中的核心环节,它让我们能够准确地获得生物体内蛋白质的组成。


理论谱图与实际谱图匹配示意图
(DOI:10.1021/acs.jproteome.2c00838)
(图A表示,NILIDFTK肽段的b-y离子的理论m/z信息;图B表示,NILIDFTK肽段的实际碎裂离子的m/z信息;图C表示,NILIDFTK肽段理论m/z和实际m/z匹配情况 )

目前,质谱可以在数分钟内生成数以万计的谱图,以人工的方式逐一比对翻译并不现实。所以,才会有“搜库”这一概念,即通过计算机软件和程序对生成的谱图进行自动化比对,识别样本中的肽段序列。为了能快速获取蛋白鉴定结果,配置蛋白专属数据处理工作站,可以及时快速处理蛋白组大数据,获得蛋白的定性和定量信息。
典型的蛋白组学实验流程示意图
(图A为深度定制的蛋白项目自动化前处理装置;图B为液相-质谱LC-MS联用装置,每秒可采集高达200张谱图;图C为蛋白项目数据处理工作站,可实现数据存储及自动化数据处理等)


Step4: 搜库结果质控
搜库过程中,软件为降低错误匹配的概率,还需要计算错误率(FDR)值(FDR为1%,表示99%的匹配结果是正确的,只有1%的匹配是错误的)或者q值(对FDR在打分上的单调化)和后错误概率(PEP,分数最高的肽段被错误匹配的概率)进行质控。得分大于99且FDR值小于0.01的肽段序列是匹配正确的,结果以High表示,即该肽段是用于定性该蛋白质的最佳匹配肽段。
最终蛋白的鉴定结果依赖于特异性肽段(Unique Peptide)。特异性肽段是蛋白的特征肽段,一般用此肽段的二级谱图作为鉴定到某蛋白的标志。在有些搜库软件的结果中会标注哪些肽段为特异性肽段。蛋白鉴定必需要求至少有一个特异性肽段,也有文章要求特异性肽段数量大于2。当肽段匹配到多个蛋白时,软件会依据蛋白中是否存在特异性肽段、匹配肽段的多少等进行权重打分,获得一个protein group蛋白,其他蛋白则被group掉。因此,常见到protein数量较多,但protein group数量要少一些的情况,而实际上protein group数量才是实际鉴定到的蛋白数量。
protein group定性示意图
(DOI:10.1038/nprot.2016.136)


Summary
综上所述,基于质谱技术的蛋白质组学,需要通过裂解、酶切、色谱分离、质谱分析、搜库等多个步骤,最终实现对生物体内蛋白质的鉴定。这一技术不仅为我们提供了丰富的蛋白质信息,也为蛋白组学在动植物、环境、食品等领域的应用提供了重要的工具


若需转载,请注明来源。














相关阅读










【声明】内容源于网络
0
0
丰信生命科学
内容 142
粉丝 0
丰信生命科学
总阅读61
粉丝0
内容142