
根据隔离窗口的大小,数据独立采集(DIA)可大致分为窄窗口和宽窗口策略。还有两种数据分析策略——以肽为中心和以谱为中心。Mascot Server可以使用嵌合搜索功能对窄窗口DIA数据运行以频谱为中心的搜索。Mascot Distiller目前能够处理大多数Thermo仪器生成的窄窗口DIA数据文件。
为了检查这一点,我们从EBI PRIDE存储库中获取了公开可用的窄窗口DIA 数据集[1],并使用Mascot Distiller 2.8.5 和Mascot Server 2.8.3进行了重新处理和搜索。
我们使用Mascot Distiller重新处理了窄窗口DIA数据文件。
如下表1所示,大多数峰值列表都有Mascot Distiller识别的1、2或3个可能的前体离子质量,每个峰值列表的平均数量大约为2.5。

表1:前体离子质量数量和峰值列表计数
搜索设置取自该论文,整个过程使用Mascot Daemon自动化。并使用 Mascot Distiller LFQ进行了定量。
在选定的1% PSM FDR下,该数据集总共有大约160万个显着的PSM,涵盖4296个蛋白质匹配和大约20.5万个肽段序列,这意味着大约32%的搜索谱图具有一个或多个显着的母离子匹配。结果总结在下表2中。

表2:识别出的显着前体离子的数量和峰值列表的数量。
这相当于每个谱图匹配大约1.1个显着的前体离子质量(忽略未匹配的未分配列表)。
下图1显示了一个嵌合谱图的典型示例,该谱图具有2个前体离子质量和两个强肽段匹配,它们共同涵盖了谱图中大多数最强的峰。

图1:窄窗口DIA MS/MS谱图的嵌合匹配示例。
我们使用Mascot Distiller在整个数据集上运行无标记定量。下图2显示了分析中典型肽段匹配的XIC。由于我们正在采取以谱图为中心的方法,因此我们看到大多数组件的整个XIC区域内都有肽段匹配,这使我们对鉴定结果非常有信心。
图2:数据集中包含40个样品的肽段匹配地XIC示例。图表上的灰色条形显示了识别出与该肽段的显着MS/MS匹配的区域。
数据集论文作者挑选出3种细胞外囊泡(EV)蛋白,通过所有采用的实验方法始终发现这些蛋白在前列腺癌患者样本中上调,尽管论文中的图4清楚地表明这些蛋白并未在前列腺癌患者样本中上调在所有患者样本中找到。
确定的3种EV蛋白是:α-1抗糜蛋白酶(SERPINA3);富含亮氨酸的α-2糖蛋白(LRG1);分泌球蛋白家族A成员1(SCGB3A1)
在我们使用Mascot Server和Mascot Distiller重新分析中,我们看到这些相同的3种蛋白质在前列腺癌患者样本中上调。使用Mascot Distiller附带的报告之一生成的示例火山图显示在下图3中。报告中使用的plot.ly库突出显示了感兴趣的三个蛋白质。
图3:使用Mascot Distiller附带的报告之一生成的火山图示例。感兴趣的三个蛋白质已突出显示。
为了更深入地探索结果,我们对定量结果运行了附带的主成分分析(PCA)报告。从报告中,我们可以粗略地将20名患者分为3组,即第1组,我们称之为左、右和中。为了检查哪些蛋白质导致差异,我们运行了“ANOVA加聚类”报告进行这三组的蛋白丰度分析(p<0.001),并使用Benjamini-Hochberg校正进行多重检验。
结果的层次聚类报告显示在下图4,正如你所看到的,这三个不同的组在ANOVA识别的蛋白质上非常明显地分离开来。而许多这里的蛋白质与前列腺癌或其他癌症有关——例如ROBO4[2]。
图4:层次聚类报告,显示这三个不同的组在ANOVA识别的蛋白质上非常明确地分离开来。
增加灵敏度的一种方法是使用Percolator。这使用谱图和肽段的附加特征对匹配进行重新评分。在Mascot的当前版本中,只能将Percolator评分应用于单个结果文件——你无法在合并结果中应用percolator,这与Distiller定量过程冲突。
这是Mascot Server下一个版本将解决的限制。与此同时,为了了解潜在的改进,我们从该项目的N4样本中获取了结果(该文件的频谱具有5个重要的 PSM),并比较了未渗透和渗透的结果总结于下表3中。

表3:窄窗口DIA样本之一的标准Mascot和Percolator重新评分之间的显着PSM计数比较
正如您所看到的,使用Percolator重新评分使我们显着增加了重要PSM的数量。与未渗透的结果相比,我们额外获得了16836个PSM,提高了近 40%。除此之外,我们还获得了更多的嵌合匹配,因此渗滤器重新评分正在提高匹配更复杂谱图的灵敏度。我们预计会有类似的改进,如在合并的数据集上运行percolator。
我们在这里进行的以谱为中心的分析已经取得了广泛的成功,我们得到的搜索和定量结果与原始论文中报告的结果一致。
通过采用以谱图为中心的方法,我们能够对未解释的MS/MS数据进行标准数据库搜索,从而避免了对实验或预测谱库的需求。这种方法在处理意外修改方面具有明显的优势。
这种方法也有缺点。Mascot和Distiller均主要针对DDA工作流程而设计,因此处理、挑选和报告嵌合样本可能会很棘手。当然,我们的目标是在Mascot Server和Mascot Distiller的未来版本中改进许多限制,并增加对来自其他仪器供应商原始文件类型和DIA数据的工作流程支持。
滑动查看相关链接:
[1] Zhang H et al. Molecules 2022, 27(23), 8155. doi:10.3390/molecules27238155
[2] Pircher A et al. Int J Med Sci 2019, 16(1), 115-124. doi:10.7150/ijms.28735
