大数跨境

7月生信文速递 6+:m6A修饰相关lncRNA预后标志物的筛选及验证

7月生信文速递 6+:m6A修饰相关lncRNA预后标志物的筛选及验证 中科生信
2021-07-31
3
导读:Frontiers in Cell and Developmental Biology(IF = 6.684):乳腺癌m6A修饰相关lncRNA调控因子的免疫-肿瘤靶点和免疫浸润综合分析

大家好呀!今天小编和大家分享的是2021年7月发表在杂志Frontiers in Cell and Developmental Biology(IF = 6.684)上的一篇文章,题目为:乳腺癌m6A修饰相关lncRNA调控因子的免疫-肿瘤靶点和免疫浸润综合分析。


DOI: 10.3389/fcell.2021.686675


摘要

为进一步寻找乳腺癌患者(BRCA)预后标志物,本研究基于TCGA数据集(N=1089)和RNA-Seq数据(N=196)探索BRAC m6A-related lncRNAs的预后价值。基于Pearson相关性分析和单因素、多因素Cox回归分析筛选与预后相关的m6A-related lncRNAs。在TCGA队列(训练集 N=545; 验证集 N=544)中共鉴定出12个m6A-related lncRNAs预后标志物(m6A-LPS),并基于这12个lncRNAs的表达量计算风险评分。根据风险评分中值,将患者分为高风险组和低风险组。两组间存在明显的免疫细胞浸润。低风险组患者免疫评分较高且4个免疫-肿瘤靶点(CTLA4, PDCD1, CD274和CD19)均下调表达。相比之下,高风险组与基因突变、Wnt/β-catenin信号通路和JAK-STAT信号通路相关。分层分析进一步验证了m6A-LPS的预后预测能力。此外,构建列线图模型(基于风险评分、年龄、性别、肿瘤分期、PAM50和T、N、M分期)评估BRCA患者的总生存期(OS),并得出结论,m6A-LPS可作为敏感的生物标志物用于BRCA患者的预后并对个体化的免疫治疗具积极影响。

技术路线

材料与方法

1. 数据获取

TCGA数据库(N=1089)中获取BRCA患者mRNA表达谱数据、部分lncRNA注释文件以及对应的临床信息。其余lncRNA注释文件从实验获得的RNA-seq数据(N=196)中获取。此外,研究获得21个m6A相关基因的表达矩阵。从CellMiner数据库中下载药物IC50数据。

2. 生物信息学分析

首先,使用Pearson相关性分析提取每个数据集中m6A related lncRNAs (|Pearson R|>0.5且p <0.05)。从两个数据集中筛选出来的lncRNAs取交集,得到1509个一致的lncRNAs。接下来,分别对训练集和验证集进行单因素和多因素Cox回归分析,鉴定出12个预后相关的m6A-related lncRNAs,即BRCA患者m6A-related lncRNAs预后标志物。接下来,计算TCGA数据集中全部患者的风险评分。使用ssGSEA计算肿瘤免疫微环境(TIME)中28种免疫细胞的相对丰度。

3. 统计学分析

1) 使用Kaplan-Meier曲线,根据不同的临床病理特征,比较高、低风险组和其他亚组的OS差异。

2) 使用Student’s t-test比较CTLA4、CD274、PDCD1、CD19 4个基因在高、低风险组的表达差异以及基因突变数量。

3) 使用Pearson’s相关性检验比较免疫浸润水平的相关性。

4) 单因素和多因素Cox回归分析用于评估m6A-LPS的独立预后价值。

5) 通过多因素Cox回归分析构建列线图,校准图说明了列线图在预后预测方面的准确性。

6) 使用ROC曲线和AUC值评估风险的预后能力,以及其它的临床病理特征。

7) 统计学分析使用R、SPSS、GraphPad Prism。

研究结果

1. 乳腺癌患者中m6A-related lncRNAs的鉴定

研究共从TCGA数据集中获得16,501个lncRNAs,RNA-seq数据集(196名乳腺癌患者)中获得17,573个lncRNAs。m6A-related lncRNAs被定义为是lncRNA,其表达量与至少1个m6A-related genes(共21个)的表达量相关(|Pearson R|>0.5且p<0.05)。Pearson相关性分析结果表明:基于两个数据集共筛选出1,509个m6A-related lncRNAs。接下来,TCGA数据集中1,089个BRCA患者样本被随机分成训练集(N=545)和验证集(N=544)。单因素和多因素Cox回归分析结果表明,在1509个m6A-related lncRNAs中有12个与BRCA患者的OS相关。

通过单因素和多因素Cox回归分析得到12个与预后相关的m6A-related lncRNAs。

12个预后相关的m6A-related lncRNA与m6A-related相关性热图

2. TCGA队列中m6A-related lncRNAs预后标志物的鉴定和验证

12个与预后相关的m6A-related lncRNAs即m6A-related lncRNAs预后标志物。基于12个m6A-related lncRNAs的表达差异计算风险评分。训练集和验证集中患者风险评分和生存时间分别如图2A、B所示。

图2A、B | 基于训练集和验证集的风险评分曲线、ROC曲线和生存曲线。

3. m6A-related lncRNAs预后标志物与免疫细胞浸润和免疫-肿瘤靶点之间的关联

该部分的分析是为探究高、低风险组之间的免疫浸润水平以及m6A-related lncRNAs预后标志物与肿瘤免疫微环境(TIME)之间的相互作用(图2C)。

图2C | 高、低风险组中28种免疫细胞的浸润水平。

图3A | TCGA队列中,4个免疫-肿瘤靶点基因在高、低风险组的表达水平。

4. 风险评分与单核苷酸多态性(SNP)、肿瘤突变负荷、GSEA、化学疗法之间的相关性

如图3B、C所示,研究进一步分析了风险模型中SNPs的情况。结果表明,高风险组的496个样本中,有420个样本发生了基因改变。其中,8个基因的表达量显著高于其它基因。

图3B、C | 高、低风险组中8个高表达突变基因的瀑布图。

5. m6A-LPS的分层分析和独立预后分析

图4A结果显示,TGFB2-AS1、LINC01725、AP002478、AL352979、 AL033543、ZNF197-AS1、AL592546、AC092653、AP005131的表达量越低,风险评分越高,且这些lncRNA的表达量与BRCA患者临床病理特征存在相关性。单因素和多因素Cox回归分析结果表明,风险评分可作为独立的预后因素(图4B、C)。

图4A | TCGA队列中,12 个m6A-related lncRNA的表达量与临床病理特征之间的相关性热图。

图4B、C | 单因素和多因素Cox分析结果表明,风险评分可作为独立的预后因素。

6. 基于m6A-LPS的列线图预测模型的构建

图4E | 基于风险评分、年龄、性别、TNM分期、PAM50构建列线图模型。

好啦~今天的内容到这里就结束啦!感谢大家的支持,我们继续精进。


生信相关分析咨询

欢迎扫描下方二维码联系小编



【声明】内容源于网络
0
0
中科生信
中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
内容 580
粉丝 0
中科生信 中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
总阅读1.1k
粉丝0
内容580