大家好呀!今天小编和大家分享的是2021年7月发表在杂志Frontiers in Cell and Developmental Biology(IF = 6.684)上的一篇文章,题目为:乳腺癌m6A修饰相关lncRNA调控因子的免疫-肿瘤靶点和免疫浸润综合分析。
DOI: 10.3389/fcell.2021.686675
摘要
为进一步寻找乳腺癌患者(BRCA)预后标志物,本研究基于TCGA数据集(N=1089)和RNA-Seq数据(N=196)探索BRAC m6A-related lncRNAs的预后价值。基于Pearson相关性分析和单因素、多因素Cox回归分析筛选与预后相关的m6A-related lncRNAs。在TCGA队列(训练集 N=545; 验证集 N=544)中共鉴定出12个m6A-related lncRNAs预后标志物(m6A-LPS),并基于这12个lncRNAs的表达量计算风险评分。根据风险评分中值,将患者分为高风险组和低风险组。两组间存在明显的免疫细胞浸润。低风险组患者免疫评分较高且4个免疫-肿瘤靶点(CTLA4, PDCD1, CD274和CD19)均下调表达。相比之下,高风险组与基因突变、Wnt/β-catenin信号通路和JAK-STAT信号通路相关。分层分析进一步验证了m6A-LPS的预后预测能力。此外,构建列线图模型(基于风险评分、年龄、性别、肿瘤分期、PAM50和T、N、M分期)评估BRCA患者的总生存期(OS),并得出结论,m6A-LPS可作为敏感的生物标志物用于BRCA患者的预后并对个体化的免疫治疗具积极影响。
技术路线
材料与方法
从TCGA数据库(N=1089)中获取BRCA患者mRNA表达谱数据、部分lncRNA注释文件以及对应的临床信息。其余lncRNA注释文件从实验获得的RNA-seq数据(N=196)中获取。此外,研究获得21个m6A相关基因的表达矩阵。从CellMiner数据库中下载药物IC50数据。
2. 生物信息学分析
首先,使用Pearson相关性分析提取每个数据集中m6A related lncRNAs (|Pearson R|>0.5且p <0.05)。从两个数据集中筛选出来的lncRNAs取交集,得到1509个一致的lncRNAs。接下来,分别对训练集和验证集进行单因素和多因素Cox回归分析,鉴定出12个预后相关的m6A-related lncRNAs,即BRCA患者m6A-related lncRNAs预后标志物。接下来,计算TCGA数据集中全部患者的风险评分。使用ssGSEA计算肿瘤免疫微环境(TIME)中28种免疫细胞的相对丰度。
3. 统计学分析
1) 使用Kaplan-Meier曲线,根据不同的临床病理特征,比较高、低风险组和其他亚组的OS差异。
2) 使用Student’s t-test比较CTLA4、CD274、PDCD1、CD19 4个基因在高、低风险组的表达差异以及基因突变数量。
3) 使用Pearson’s相关性检验比较免疫浸润水平的相关性。
4) 单因素和多因素Cox回归分析用于评估m6A-LPS的独立预后价值。
5) 通过多因素Cox回归分析构建列线图,校准图说明了列线图在预后预测方面的准确性。
6) 使用ROC曲线和AUC值评估风险的预后能力,以及其它的临床病理特征。
7) 统计学分析使用R、SPSS、GraphPad Prism。
研究结果
1. 乳腺癌患者中m6A-related lncRNAs的鉴定
研究共从TCGA数据集中获得16,501个lncRNAs,RNA-seq数据集(196名乳腺癌患者)中获得17,573个lncRNAs。m6A-related lncRNAs被定义为是lncRNA,其表达量与至少1个m6A-related genes(共21个)的表达量相关(|Pearson R|>0.5且p<0.05)。Pearson相关性分析结果表明:基于两个数据集共筛选出1,509个m6A-related lncRNAs。接下来,TCGA数据集中1,089个BRCA患者样本被随机分成训练集(N=545)和验证集(N=544)。单因素和多因素Cox回归分析结果表明,在1509个m6A-related lncRNAs中有12个与BRCA患者的OS相关。
通过单因素和多因素Cox回归分析得到12个与预后相关的m6A-related lncRNAs。
12个预后相关的m6A-related lncRNA与m6A-related相关性热图。
2. TCGA队列中m6A-related lncRNAs预后标志物的鉴定和验证
12个与预后相关的m6A-related lncRNAs即m6A-related lncRNAs预后标志物。基于12个m6A-related lncRNAs的表达差异计算风险评分。训练集和验证集中患者风险评分和生存时间分别如图2A、B所示。
图2A、B | 基于训练集和验证集的风险评分曲线、ROC曲线和生存曲线。
3. m6A-related lncRNAs预后标志物与免疫细胞浸润和免疫-肿瘤靶点之间的关联
该部分的分析是为探究高、低风险组之间的免疫浸润水平以及m6A-related lncRNAs预后标志物与肿瘤免疫微环境(TIME)之间的相互作用(图2C)。
图2C | 高、低风险组中28种免疫细胞的浸润水平。
图3A | TCGA队列中,4个免疫-肿瘤靶点基因在高、低风险组的表达水平。
4. 风险评分与单核苷酸多态性(SNP)、肿瘤突变负荷、GSEA、化学疗法之间的相关性
如图3B、C所示,研究进一步分析了风险模型中SNPs的情况。结果表明,高风险组的496个样本中,有420个样本发生了基因改变。其中,8个基因的表达量显著高于其它基因。
图3B、C | 高、低风险组中8个高表达突变基因的瀑布图。
5. m6A-LPS的分层分析和独立预后分析
图4A结果显示,TGFB2-AS1、LINC01725、AP002478、AL352979、 AL033543、ZNF197-AS1、AL592546、AC092653、AP005131的表达量越低,风险评分越高,且这些lncRNA的表达量与BRCA患者临床病理特征存在相关性。单因素和多因素Cox回归分析结果表明,风险评分可作为独立的预后因素(图4B、C)。
图4A | TCGA队列中,12 个m6A-related lncRNA的表达量与临床病理特征之间的相关性热图。
图4B、C | 单因素和多因素Cox分析结果表明,风险评分可作为独立的预后因素。
6. 基于m6A-LPS的列线图预测模型的构建
图4E | 基于风险评分、年龄、性别、TNM分期、PAM50构建列线图模型。
好啦~今天的内容到这里就结束啦!感谢大家的支持,我们继续精进。
生信相关分析咨询
欢迎扫描下方二维码联系小编

