大数跨境

开发基于血管生成相关lncRNAs的RiskS - core模型用于结肠腺癌预后预测

开发基于血管生成相关lncRNAs的RiskS - core模型用于结肠腺癌预后预测 中科生信
2023-11-16
3
导读:大家好!今天小编和大家分享一篇23年11月13日发表在Current Medicinal Chemistry (IF:4.1 Q2)杂志的文章
大家好!今天小编和大家分享一篇231113发表在Current Medicinal Chemistry (IF4.1 Q2)杂志的文章《Developing a RiskS-core Model based on Angiogenesis-related lncRNAs for Colon Adenocarcinoma Prognostic Prediction》。作者通过生物信息学,基于结肠腺癌( COAD )筛选关键血管生成相关lncRNA,构建RiskS - core模型预测COAD预后,有助于揭示COAD的发病机制并优化临床治疗。

背景

lncRNAs在肿瘤进展和预后中的调控作用已得到证实,但鲜有研究探讨血管生成相关lncRNAsCOAD中的作用。

方法:

样本数据来自于癌症基因组图谱(TCGA)和基因表达综合数据库(GEO)。采用单样本基因集富集分析(ssGSEA)方法计算样本中的标志性通路得分。与血管生成相关的lncrna通过一个集成的管道算法进行过滤。通过Consensus Cluster Plus对基于lncRNA的亚型进行分类,然后与其他已建立的亚型进行比较。基于单变量CoxLASSO回归和逐步回归分析,建立了RiskS - core模型。采用Rsurvival绘制Kaplan-Meier曲线。时间依赖的ROC曲线由timeROC包绘制。最后,使用肿瘤免疫功能障碍和排除(TIDE)软件和pRRophetic软件包分析免疫治疗的疗效和药物敏感性。

结果:

通路分析显示,血管生成通路是影响COAD患者预后的危险因素。共筛选出66个与血管生成相关的lncrna,获得3个分子亚型(S1S2S3)。S1S2的预后均优于S3。与现有的亚型相比,S3亚型与其他两种亚型有显著差异。免疫分析结果显示,S2亚型的免疫细胞评分低于S1亚型和S3亚型,且TIDE评分最高。招募了8个关键的lncrna来开发一个RiskS - core模型。生存率较低、TIDE评分较高的高RiskS - core组预计从免疫治疗中获益有限,但它可能对化疗药物更敏感。由RiskS - core特征和其他临床病理特征设计的列线图为COAD治疗提供了合理的预测能力。

结论:

该研究构建了基于血管生成相关lncrnaRiskS - core模型,可作为COAD患者潜在的预后预测因子,并为抗血管生成应用的干预提供线索。研究结果可能有助于评估COAD的预后,并提供更好的治疗策略。

研究结果:

1.血管生成相关通路评分分析

TCGA数据集和GSE39582数据集中对HALLMARK通路的分析均显示血管生成相关通路的得分明显较高,证明血管生成相关通路是预后危险因素 (Fig. 1A-B)。此外,肿瘤样本中血管生成相关通路的得分也明显高于正常样本( p < 0.0001 ),表明血管生成通路在肿瘤中的重要作用 (Fig. 1C-D)

2.鉴定了与血管生成相关的lncrna

TCGA数据集中鉴定了92个与血管生成信号相关的lncRNA,从GSE39582数据集中鉴定了75个与血管生成信号相关的lncRNA。最后取交集,共获得29lncRNA。获得了部分TCGA数据集中血管生成通路中血管生成信号相关lncRNAGSEA模式 (Fig. 2)

 

3.基于血管生成相关LncRNA的分子分型

两个数据集的并集包含138个血管生成相关的lncRNA,交集包含29个血管生成相关的lncRNA,提示不同平台的数据集之间lncRNA的一致性较差。因此,在TCGAGSE39582数据集中使用138lncRNA进行单因素Cox分析,共获得66个与预后相关的lncRNA用于进一步分析 (Fig. 3a)

CDF delta area曲线表明Cluster 3具有相对稳定的聚类结果。最终选择k = 3得到3个分子亚型,分别为S1S2S3 (Fig. 3B-D)。进一步分析两种数据集中3种亚型的预后特征,发现存在显著的预后差异。总体而言,S1S2预后较好,而S3预后最差 (Fig. 3E-F)。这些结果表明,基于血管生成相关lncRNAs分类的3种分子亚型在不同的研究队列中具有相似性。

4.本研究的亚型与现有亚型的比较

将现有的6个免疫亚型进行比较,发现TCGA-COAD数据中没有C5免疫亚型,而TCGA数据中的大部分患者属于C1C2免疫亚型。在分子亚型和现有免疫亚型中的样本分布显示,S3亚型与S1亚型之间存在明显差异。TCGA亚型的4种亚型在本研究3种亚型中的分布存在显著差异 (Fig. 3g)。而在TCGAGSE39582中,CMS4S3中分布最多,与其他两种亚型均有显著差异 (Fig. 3H)

 

5.分子亚型间的突变特征及临床特征分析

S1S2S3在年龄、N分期、T分期、分期等TCGA临床特征中的分布差异在各亚型间差异有统计学意义 (Figs. 4A-D)。而TMBS1S2S3中的分布情况均无显著性差异 (Fig. 4e)。然后,分析了TCGA队列中不同分子亚型的体细胞突变,并定位了每个亚型中前20个基因的突变特征,其中KRASFAT4为突变频率最高的基因 (Fig. 4f)



6.分子亚型的GSEA分析

分别在TCGAGSE39582数据集中获得了GSEA显著富集的途径结果。在TCGAGSE39582数据集中,不同亚型的结果是一致的。与亚型S1S2相比,HYPOXIAEPITHELIAL _ MESENCHYMAL _ TRANSITIONTNFA _ SIGNALING _ VIA _ NFKBTGF _ BETA _ SIGNALING等通路在S3亚型中显著富集 (Fig. 5A-B)

 


7.分子亚型的免疫学特征

TCGA队列中不同亚型的免疫评分比较显示,S2的多免疫评分低于S1S3 (Fig. 6a)。在先天免疫和适应性免疫评分中,S2的免疫评分也低于S1S3 (Fig. 6b)。在TCGA队列中,S2的估计免疫分数和MCP计数评估的10个免疫细胞分数也显著低于S1S3 (Fig. 6C-D)S2中免疫相关基因的表达量也低于S1S3,如CTLA4IDO1LAG3PDCD1LD2等。同样的结果在GSE39582数据集中得到了验证。

8.分子亚型的TIDE分析

发现S2TCGA队列中得分最低,S3亚型TIDE得分最高,提示S3免疫逃逸的可能性更大。还分析了TIDE软件预测的免疫治疗反应状态的生存情况,发现S2中真实(治疗反应)的比例显著高于S1S3 (Fig. 6f)GSE39582数据集的结果与TCGA的结果一致。

 

9.基于血管生成相关lncrna的预后模型的设计与验证

对训练数据集中的138lncRNAs进行单变量Cox分析,获得30个预后lncRNAs。然后使用Lasso回归进一步压缩训练数据集中的这30个基因。随着独立变量系数的逐渐增加,多个自变量的系数开始趋近于0。当lambda=0.0286时,该模型达到了最优水平。因此,有14lambda=0.0286lncrna,将它们作为靶lncrna。然后对8lncRNALINC00973LINC01116LINC00839LINC02656AC080038.2AC020659.1AL354836.1PCAT6)进行多元逐步回归分析,进行多变量Cox分析,计算各lncRNA的风险系数(图7a)。

RiskS - core模型的计算公式为:RiskS-core=0.724*LINC00973+0.176* LINC01116+0.758*LINC00839+0.668*LINC02656+0.617*AC080038.2+0.293*AC020659.1+0.265*AL35 4836.1+0.381*PCAT6

训练集和测试集的RiskS - core模型的ROC曲线显示,所有曲线均具有较高的AUC值,且测试集的AUC值均高于0.75,表明模型具有较强的预测能力。训练集和测试集的RiskS - core模型的KM曲线显示,低Risk S - core组的生存概率显著较高,P< 0.0001 (Fig. 7B-C)

使用3个独立的数据集GSE39582GSE38832GSE33113进行验证。计算了样本的RiskS - core。其中ROC曲线在验证集和训练集中显示了类似的结果。高RiskS - core组预后较差,低RiskS - core组预后较好 (Fig. 7E-G)

 

10.RiskS - Core组的通路评分、免疫治疗和药物敏感性分析

两个RiskS - core组的通路得分比较显示,在27个通路中存在显著差异 (Fig. 8a)。计算了这27个通路得分与RiskS - core的相关性,发现目前的RiskS - coreKRAS _ SIGNALING _ UPTGF _ BETA _ SIGNALINGHYPOXIAANGIOGENESISEPITHELIAL _ MESENCHYMAL _ - TRANSITIONNOTCH _ SIGNALING等通路呈显著正相关 (Fig. 8b)

计算13个人类相关通路的标记基因评分,并在TCGA数据集中计算RiskS-core与这些评分之间的相关性。结果表明,RiskS-coreWNT靶点EMT1EMT2EMT3、同源重组显著正相关,而与DNA复制、碱基切除修复、细胞周期、同源重组、DDR、核苷酸切除修复,错配修复显著负相关 (Fig. 8c)。同时,在高、低RiskS - core组的这些评分的比较中检测到13个通路中的11个有显著性差异 (Fig. 8d)

我们发现,在TCGA队列中,低RiskS核心组的TIDE评分最低,这表明低RiskS - core组从免疫治疗中获益更大 (Fig. 8E)。对传统化疗药物的敏感性分析显示,在TCGA数据集中,有100种药物,其中高RiskS - core组和低RiskS - core组分别对56种和44种药物敏感 (Fig. 8F)

 

11.临床特征RiskS - core和列线图的综合分析

在风险因素和临床病理特征的单因素和多因素Cox回归分析中,风险评分被证明是最重要的预测因素 (Figs. 9A-B)。通过结合其他临床病理变量和RiskS - core创建了一个列线图。RiskS-core对预测患者生存的影响最大 (Fig. 9c)1年、3年、5年的预测校准曲线与标准曲线接近,验证了列线图的准确预测 (Fig. 9d)DCARiskS - core和列线图中显示出比极端曲线更大的益处,表明两种工具具有很强的预测能力(9E ) (Fig. 9E)

 

总结:

本研究对与血管生成相关的lncrna进行了鉴定和筛选,并鉴定出了8个影响COAD预后的关键lncrnaLINC00973LINC01116LINC00839LINC02656AC080038.2AC020659.1AL354836.1PCAT6)。设计了一个风险预测模型来准确预测COAD的预后,便于评估COAD患者的免疫治疗和药物敏感性。



【声明】内容源于网络
0
0
中科生信
中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
内容 580
粉丝 0
中科生信 中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
总阅读1.4k
粉丝0
内容580