文章名称:Systematic benchmarking of imaging spatial transcriptomics platforms in FFPE tissues
期刊:Nature Communications
影响因子:15.7
发表时间:2025.11
新兴成像空间转录组学平台及其配套分析方法能够解析细胞间相互作用、空间共变基因簇以及与病理特征相关的基因标志物,因而特别适用于福尔马林固定石蜡包埋组织的研究。
2025年11月20日,美国Broad研究所May-Britt Tessem团队在Nature communications发表题为“Systematic benchmarking of imaging spatial transcriptomics platforms in FFPE tissues”的论文。通过包含17种肿瘤和16种正常组织类型的组织芯片连续切片,对三种商业化iST平台——10X Xenium、Vizgen MERSCOPE和Nanostring CosMx——进行了技术与生物学性能的综合评估。在相同基因集检测中,Xenium在保持特异性的前提下持续产生更高的单基因转录本计数。Xenium与CosMx检测结果与正交单细胞转录组数据具有良好一致性。三大平台均能实现空间分辨的细胞分型,但细分聚类能力存在差异:Xenium和CosMx相较MERSCOPE能识别更多细胞亚群,但其错误发现率与细胞分割误差频率各有不同。本研究为这一快速演进领域中珍贵样本研究设计的平台选择提供了全面基准依据。
空间转录组学(ST)技术通过原位检测基因表达,突破了单细胞RNA测序因细胞解离而丢失空间信息的局限,能有效解析细胞互作、空间共变基因等关键生物信息。该技术主要分为基于测序(sST)和基于成像(iST)两类方法:sST通过空间条形码定位转录本,而iST基于多重荧光原位杂交技术,具有单分子分辨率优势,但需依赖预设基因Panel。当前iST技术面临的核心挑战包括样本处理策略差异(如透明化处理与信号质量的权衡)、成像通量与分辨率的平衡,以及长期以来在临床标准FFPE样本应用中的兼容性问题。
为解决FFPE兼容性问题,10x、NanoString和Vizgen三家公司分别推出Xenium、CosMx和MERSCOPE平台,各采用独特的信号放大方案(滚环扩增/分支链杂交/多位点探针覆盖)。本研究首次对这三个平台进行系统性平行比对:通过33种FFPE组织样本、超500万细胞的数据集,从检测灵敏度特异性、与scRNA-seq数据一致性、细胞分割性能及细胞分型能力等维度开展评估。该工作为选择适宜技术平台、优化实验设计提供了关键基准参考,尤其对利用珍贵存档样本开展研究具有重要指导意义。
01.研究设计与样本:
研究核心是对三种商业iST平台(10X Xenium, Vizgen MERSCOPE, Nanostring CosMx)进行性能基准测试。采用来自33种FFPE组织(17种肿瘤、16种正常)的组织芯片(TMA)连续切片,以最大程度实现样本与基因表达对比的匹配性。为模拟真实临床场景,研究使用了典型生物样本库中的FFPE样本,未基于RNA完整性进行预筛选。
02.平台与实验方案:
各平台在Panel定制化与通量上存在差异:Xenium和MERSCOPE提供定制化Panel,而CosMx在当时主要提供标准的1K基因Panel。
研究共测试了六个Panel,确保相互间有超过65个基因的重叠,以进行有效对比。
实验在2023和2024年分多轮进行,文中分析主要基于能反映各平台最新技术状态的2024年数据。
03.主要技术性能发现:
转录本检出总量:在2024年的测试中,CosMx平台的转录本检出总数最高,Xenium次之,MERSCOPE最低。
数据质量:Xenium在保持特异性的前提下,对相同基因能产生更高的转录本计数。
组织与平台差异:不同TMA的组织质量差异影响了转录本检出数量。值得注意的是,MERSCOPE对正常组织TMA的检测未达到常规成功标准,但该数据被保留用以展示低捕获率对下游分析的影响。
图1 实验设计与空间转录组技术平台概览
注:a 生成iST数据的整体实验流程。b Xenium、MERSCOPE和CosMx采用的不同信号放大策略。c 本研究涉及的组织类型与组织芯数量概览(BlC膀胱癌、BrC乳腺癌、CRC结直肠癌、HNSCC头颈部鳞状细胞癌、Mel黑色素瘤、NSCLC非小细胞肺癌、OvC卵巢癌、SCC鳞状细胞癌)。d 各组织芯片(肿瘤TMA1、肿瘤TMA2、正常组织TMA)经Xenium平台检测的DAPI染色图像。
为直接比较各iST平台在相同基因上的性能,首先采用组织芯水平的伪批量分析方法,以规避细胞分割差异的影响。
01.数据可重复性分析:
通过tTMA1和nTMA评估实验可重复性发现:
不同Panel检测的共享基因总转录本计数高度相关,主要偏差源于连续切片间的形态学差异
即使形态匹配良好的组织芯中,部分基因在乳腺/肺Panel间表达量存在最高达3倍的差异,主要归因于探针间轻微竞争
同一患者同类型组织芯的基因表达相关性高(Spearman r > 0.74),表明各平台自身具有良好重复性
02.时间稳定性验证:
对比2023与2024年tTMA1数据发现:
尽管存在样本保存时间、算法更新及处理条件差异,各平台共享基因总转录本计数仍高度相关(Spearman r分别为0.99、0.94、0.95)
Xenium在2024年数据中表达量中位数仅下降18%,CosMx提升4倍,MERSCOPE下降8倍
MERSCOPE与CosMx的组间变异大于Xenium
03.灵敏度比较:
通过共享基因总转录本计数评估灵敏度:
平台间呈线性关系
CosMx在2023年低表达区出现的异常高计数现象,经算法更新后在2024年数据中消失,基因长度对检测性能无显著影响
在统一处理的tTMA1(24)中,Xenium计数为CosMx的2倍,CosMx为MERSCOPE的11倍,Xenium为MERSCOPE的20倍。MERSCOPE检测能力对样本质量与处理流程高度敏感
04.特异性评估:
通过阴性对照探针与条形码计算特异性:
Xenium始终显示最高靶向转录本比例,CosMx在多数组织中最低
经标准化校正的假发现率计算显示:Xenium在22个TMA-癌种组合中的15个里保持最低FDR,CosMx最高
05.基因检测效能:
基于阴性对照评估各组织类型可检测基因数:
CosMx因Panel通量高,在22个组合中均检测到最多绝对基因数
在15/22组合中检测到最高比例基因,Xenium在5个癌种中领先
2024版CosMx化学试剂使部分组织FDR降低近10倍,可检测基因数相应增加
图2 基于2024年数据集的iST平台技术性能比较
注:(a)Xenium(乳腺Panel)与CosMx(1K Panel)在tTMA1(24)匹配组织芯中各共享基因表达总和散点图(对数坐标)。数据点代表单个基因,红线为对数空间一阶多项式拟合后反变换的回归曲线,阴影带标示残差±1.96倍标准差范围。(b)同(a),对比MERSCOPE(乳腺Panel)与CosMx(1K Panel)数据。(c)同(a),对比Xenium(乳腺Panel)与MERSCOPE(乳腺Panel)数据。(d)靶向基因转录本占总检测信号(含阴性对照探针及未使用条形码)百分比的小提琴图,数据按同类型组织芯平均值呈现(Xenium乳腺Panel、MERSCOPE乳腺Panel、CosMx多组织1K Panel)。每个数据点代表特定TMA-组织类型组合(如tTMA1(24)-BrC),小提琴轮廓显示核密度估计,内部线条标示四分位数(中位数=第二四分位数),完整数据见附图5a。(e)基于空白条形码的假发现率小提琴图,计算公式:FDR(%) = (空白条形码计数/总转录本计数) × (Panel基因数/空白条形码数) × 100。(f)同(e),使用阴性对照探针替代空白条形码计算。MERSCOPE因设计未包含阴性对照探针而未参与本图计算。(g)噪声阈值以上检测基因数小提琴图(阈值定义为阴性对照探针平均表达值+2倍标准差)。(h)同(g),但经Panel基因数标准化为百分比显示。(d-h)中平台间差异均采用双侧Mann-Whitney U检验,标注括号显示未校正p值。
为探究高基因检测数代表真实生物学灵敏度提升还是假阳性率增高,我们系统评估了iST数据与参考RNA-seq数据的相关性。
01.与公共数据库对比分析:
TCGA数据验证:在tTMA1(24)乳腺癌样本中,CosMx与TCGA数据相关性最高(Spearman r=0.80),优于Xenium(0.64)和MERSCOPE(0.55)。该趋势在所有癌种中一致,而2023年数据中各平台相关性相当
GTEx数据验证:正常组织nTMA(23)数据显示,Xenium(r=0.57)与CosMx(0.46)与GTEx乳腺数据相关性显著高于MERSCOPE(0.33)。甲状腺、胰腺等组织相关性最低,前列腺、扁桃体等最高
组织特异性标志物:Xenium在正常组织中呈现最清晰的标志物空间表达模式,CosMx次之
02.匹配单细胞转录组验证:
通过tTMA1(24)和tTMA2(24)连续切片获取匹配单细胞参考数据集(分别含14,945/17,749个高质量细胞),聚焦血管平滑肌细胞进行精准对比:
该细胞群高表达MYH11、DST等平滑肌标志基因,低表达CSTG等非相关基因
相关性分析重现2024年趋势:CosMx相关性最高(tTMA1:0.77; tTMA2:0.78),Xenium次之(0.53; 0.72),MERSCOPE最低(0.6; 0.23)
当仅分析平台共享基因时,相关性差异减小且多数无统计学意义(附图8e-g),表明CosMx的高相关性主要源于其更大Panel覆盖的基因表达范围
03.系统偏差分析:
通过拟合残差分析发现:
各平台均存在相对于单细胞数据的基因特异性计数偏差
偏差基因集在不同平台间重叠度低,可能与探针设计及解码化学的灵敏度差异有关
这种系统偏差可部分解释图2a-c中观察到的平台间基因表达差异
图3 空间转录组数据与参考RNA-seq数据集
的一致性分析
注:(a)共享基因散点图:显示tTMA1(24)乳腺癌组织芯中各平台检测基因表达均值(经十万标准化)与TCGA数据库同类型组织FPKM均值的对比。黑色线条为一阶多项式拟合曲线,插图为斯皮尔曼相关系数。(b)同(a),对比nTMA(23)乳腺组织芯与GTEx乳腺样本nTPM均值。(c)重叠基因散点图:显示tTMA1(23)中平滑肌细胞基因表达总量与单细胞转录组数据的对比。(d)同(c),针对tTMA1(24)数据。(e)同(c),针对tTMA2(24)数据。(f)各平台在tTMA1(23)/tTMA1(24)中相对于单细胞数据的拟合残差比较。
本研究进一步在单细胞水平评估各iST平台的性能表现,重点关注细胞分割准确性与过滤后细胞质量。
01.细胞分割精度评估:
基于tTMA1(24)三个代表性组织芯的31,400个手动标注细胞进行验证:
密集细胞区域:CosMx与Xenium精度显著优于MERSCOPE(0.90 vs 0.83, p<0.01),召回率与F1分数呈现一致趋势
特殊形态细胞:所有平台对细长细胞和稀疏细胞的分割精度均下降,但平台间性能排序保持不变
平台间比较:CosMx与Xenium在所有测试场景中均无显著性能差异
02.细胞过滤效果分析:
按各平台推荐阈值过滤后(Xenium/MERSCOPE: 10个转录本,CosMx: 20个转录本):
细胞保留率:tTMA1(24)中CosMx最高(95.97%),Xenium次之(94.28%),MERSCOPE最低(27.97%)
空间密度变化:过滤后所有平台单位面积细胞数下降,CosMx与Xenium降幅最小
细胞形态特征:CosMx与Xenium保留细胞面积相似,MERSCOPE因大量低质量细胞被剔除导致平均细胞面积增大
03.单细胞分子检测效能:
过滤后肿瘤组织芯分析显示:
全Panel基因:CosMx凭借更大Panel尺寸,单细胞转录本数与基因数均最高,Xenium次之
共享基因集:限定共享基因时,Xenium在22个癌种组合中的21个里单细胞转录本数领先,CosMx仅在肝癌中最高
基因检测效率:Xenium在所有组织类型中单细胞独特基因数最高
04.标志物共表达验证:
通过互斥标志物对评估分割特异性:
Xenium显示最清晰的谱系分离模式(CD3E/EPCAM、CD4/CD8A、PPARG/CD68)
MERSCOPE仅在CD3E/EPCAM中呈现分离模式,高质量数据(tTMA1(23))中可观察到更多分离模式
CosMx仅PPARG/CD68显示明确分离模式
图4 各空间转录组平台细胞分割结果比较
图4:(a)首行:显示DAPI(蓝色填充)与膜染色(绿色填充)的局部数据,叠加细胞分割边界(白色轮廓)及人工标注细胞中心点(红点);中行:绿色圆点表示所有转录本,蓝色圆点表示EPCAM转录本;末行:质控前后的细胞分割边界(白色轮廓,青色轮廓为保留细胞,橙色轮廓为剔除细胞)。研究共获取263个TMA组织芯的成像数据,对每个平台选取3个代表性组织芯进行分割评估,共计生成31,384个人工标注细胞。(b)不同场景(密集细胞、稀疏细胞、细长细胞)下的分割精度评估(精度、召回率、F1值)。采用单因素分组方差分析及Tukey HSD事后检验进行平台间两两比较,星号标示显著性水平(p<0.05;p<0.01;p<0.001;****p<0.0001),括号上方显示经多重校正的精确p值。(c)过滤后单细胞转录本数热图(基于各Panel全基因集)。按平台推荐阈值剔除低质量细胞(Xenium/MERSCOPE:<10转录本;CosMx:<20转录本)。(d)同(c),展示单细胞独特基因数。(e)同(c),限定共享基因集重新分析。(f)同(d),限定共享基因集重新分析。(g)tTMA1(24)中三对互斥基因(行)在各平台(列)的共表达密度图。MERSCOPE乳腺数据集因细胞数不足未生成PPARG vs. CD68图谱。整合所有组织中至少检测到一个目标基因转录本的细胞,颜色深度表示特定表达水平下的细胞数量。全图数据均来自tTMA1(24)与tTMA2(24)。
在典型空间转录组分析流程中,细胞分型是关键步骤。本研究以乳腺组织为重点,通过比较各平台过滤后数据的聚类结果,评估其细胞类型识别能力。
01.跨平台细胞分型一致性:
tTMA1(23)数据分析:Xenium识别9种细胞类型(包括肺泡细胞、B细胞、基底细胞等),CosMx识别8种类型(未区分B细胞与T细胞亚型),MERSCOPE识别6种类型(缺失部分免疫细胞亚型),Xenium与CosMx细胞类型转录组谱高度相关,MERSCOPE与Xenium聚类映射关系更清晰。
tTMA1(24)验证实验:Xenium新增上皮细胞类型,CosMx与MERSCOPE细胞类型集合保持不变。两年实验间同一细胞类型相关性高,证实结果可重复性。
02.细胞亚型分辨能力差异:
上皮/肺泡细胞区分:Xenium凭借明确的肺泡细胞标志物实现精准分型,CosMx与MERSCOPE仅能识别更宽泛的上皮细胞类别
免疫细胞细分:Xenium可区分T细胞、B细胞等免疫亚群,而CosMx与MERSCOPE多停留在"免疫细胞"层面
聚类对应关系:热图显示Xenium的肺泡细胞簇与CosMx/MERSCOPE的上皮细胞簇存在交叉相关性,反映亚型分辨精度差异
03.组织特异性表现:
在tTMA2(24)浸润性乳腺癌样本中:CosMx识别7种细胞类型(含肺泡细胞),Xenium仅识别5种类型(缺失肺泡细胞),MERSCOPE因转录本数过低未参与分析,两平台识别类型间仍保持高相关性
04.平台特性权衡:
综合分析表明:CosMx凭借更大Panel尺寸,具备检测更多细胞类型的潜力。Xenium凭借更高灵敏度与更低假阳性率,在亚型分辨上更具优势。各平台均能获得合理的细胞分型结果,支持下游生物学分析。
图5 各技术平台的细胞类型识别性能
注:(a)tTMA1(23)乳腺癌样本的聚类分析结果(Xenium乳腺Panel、MERSCOPE乳腺Panel、CosMx多组织Panel),右侧相关性热图显示CosMx及MERSCOPE与Xenium平台细胞类型的对应关系。(b)tTMA1(24)乳腺癌样本的聚类分析结果及跨平台细胞类型相关性比较。(c)Xenium(上)、MERSCOPE(中)、CosMx(下)在肿瘤TMA1两次实验中的细胞类型注释相关性热图,显示实验间高度一致性。(d)tTMA2(24)乳腺癌样本聚类结果(Xenium乳腺Panel与CosMx多组织Panel)及两平台细胞类型相关性分析。
本研究通过对三种商用空间转录组平台在存档FFPE组织中的系统性比较,评估了其技术性能特征,为基于临床样本的实验设计提供了实践指导。
01.技术性能权衡分析
工作流程差异:Xenium具有最短的手操作时间(2-3天)和全玻片成像优势;CosMx支持批量处理但需手动选择感兴趣区域;MERSCOPE流程耗时最长(5-7天)且存在成像区域限制
检测灵敏度比较:在共享基因分析中,Xenium始终展现最高灵敏度;2024版CosMx化学试剂将与Xenium的灵敏度差距从12-15倍缩小至2倍,同时特异性提升近10倍
平台特异性表现:MERSCOPE性能对样本质量高度敏感,在优质样本中可达Xenium水平,但不同样本间波动显著(灵敏度差异达2.6-100倍)
02.数据可靠性与相关性验证
所有平台在标准化基因表达测量中均表现出高度自相关性(不同实验条件、时间点间Spearman r>0.74)
与GTEx、TCGA等参考数据集及自生成单细胞数据均呈现良好相关性
各平台均存在特定基因的系统性估计偏差,提示中表达基因可能被错误归类
03.单细胞分析能力评估
细胞分割性能:CosMx与Xenium在密集/稀疏/细长细胞中均优于MERSCOPE(精度0.90 vs 0.83)
细胞保留率:CosMx过滤后细胞保留率最高(95.97%),Xenium次之(94.28%),MERSCOPE最低(27.97%)
谱系分辨能力:Xenium在互斥标志物共表达分析中表现最佳,细胞亚型区分更精确
04.细胞分型效能与应用建议
在乳腺癌样本中,各平台细胞分型结果高度一致,Xenium与CosMx能识别更多亚型(9种 vs 8种)
Panel大小与检测灵敏度的平衡是关键考量因素:CosMx的大Panel提供更多转录本信息,Xenium的高灵敏度支持更精细的亚型区分
建议通过现有图谱数据子采样验证目标基因集是否满足研究需求
本研究聚焦典型临床存档样本,结论不一定适用于冷冻样本或RNA完整性极高的FFPE样本。MERSCOPE的Panel设计为兼容多组织而缩减规模,可能影响其细胞分型能力,空间转录组与蛋白质生物标志物的关联仍需更大样本验证。
对于RNA可能高度降解的低质量样本,依赖信号放大技术的平台(Xenium、CosMx)更具优势。高质量样本中,各平台性能差距缩小,均可获得有效的空间分析数据。实验设计应综合考虑样本质量、目标基因数量与细胞分型精度需求。
南京安悦生物(anyue-bio)是一家生命科学技术服务企业,专注于提供领先的多组学技术与生物信息分析一体化解决方案。公司以“精准解析、智慧赋能”为核心理念,致力于为科研机构、医疗机构及企业客户提供从样本处理、数据生成到深度挖掘的全链条服务。亿科安悦生物旨在通过多维度、跨层次的组学整合分析,助力客户在疾病机制探索、生物标志物发现、药物靶点筛选及临床转化研究中突破关键瓶颈,推动生命科学研究和精准医疗的发展。

