大家好呀!今天小编和大家分享的是2021年3月发表在杂志Theranostics(IF = 11.556)上的一篇文章,题目为:缺氧因子的鉴定及其在肺腺癌I期患者临床诊断和治疗反应中的应用。
DOI: 10.7150/thno.56202
摘要
【研究背景】肿瘤TNM(肿瘤-关键调控蛋白-转移)分期系统不能够满足肺腺癌(Lung adenocarcinoma, LUAD)I期患者精确的临床诊断和生存预测需要,迫切需要更可靠的生物标志物辅助指导治疗。【研究方法】本研究分析了14个公共数据集的共1400例LUAD I期患者转录组图谱和临床参数数据,其中包括13个微阵列(microarray)数据集和TCGA数据库中的1个RNA-Seq数据集。研究综合使用生物信息学和机器学习方法鉴定缺氧信号因子以预测LUAD I期患者总生存期(Overall survival, OS)和免疫检查点阻断(Immune checkpoint blockade, ICB)治疗反应。此外,研究还分析了不同风险亚组的富集通路、基因组和拷贝数变化,并进行比较分析。
【研究结果】研究结果表明,缺氧是影响LUAD I期患者生存率的主要因素。与传统临床病理特征相比,缺氧相关基因的预后风险评估(Hypoxia-related prognostic risk score, HPRS)显示出更强大的生存预测能力,缺氧相关的免疫治疗反应评估(Hypoxia-related immunotherapeutic response score, HIRS)也要优于传统的生物标记物,最终生成决策树和列线图,定量分析、评估肿瘤发病风险。
关键词:肺腺癌I期;缺氧;基因组改变;机器学习
材料与方法
1. 数据获取 共14个公共数据集:13个微列阵数据集+1个RNA-Seq数据集,纳入标准:①详细的TNM分期信息(I,IA,IB或T1N0M0和T2aN0M0等);②完整的随访时间和生命状态。本研究共获取1400个LUAD I期患者数据信息。选择GSE72094数据集作为训练集。从TCGA数据库下载体细胞突变和拷贝数变异数据,体细胞突变数据分析使用R包“maftools”,使用GISTIC 2.0软件检验拷贝数扩增或缺失。
2. 组织、单细胞和细胞系转录组分析 从CCLE癌症细胞系百科全书获得69种LUAD细胞系转录组基因表达量TPM值。此外,研究分析LUAD样本微阵列数据集(GSE30979),LUAD样本在体外缺氧(氧浓度1%)或常氧条件下培养3天。从GSE69405数据集获取LUAD患者单细胞RNA-Seq数据(N = 77)。用于分析的微阵列和RNA-Seq数据集均经标准化处理和log2转换。
3. 候选基因的选择和缺氧相关基因预测模型的建立 Hanahan和Weinberg(2000)提出了肿瘤细胞的十大基本特征,例如:细胞周期(Cell cycle progression, CCP)、上皮间质转化(Epithelial-mesenchymal transition, EMT)和缺氧(Hypoxia)。本研究基于训练集中每个样本的转录组数据和从MSigDB数据库中检索到的相应基因集,使用单样本基因集富集分析(Single-sample gene set enrichment analysis, ssGSEA)算法进行定量分析。基于训练集中每个样本的转录组数据,使用CIBERSORT软件量化免疫浸润。使用加权基因共表达网络分析(WGCNA)寻找与缺氧密切相关的基因模块。Z-score归一法标准化ssGSEA和免疫浸润得分。
4. 生物信息学和统计学分析 数据分析和作图使用的工具:IBM SPSS Statistics 20、GraphPad Prism 8.0、Stata 12、R。
1)使用层次聚类分析方法描述不同癌症特征之间的距离;
2)使用多因素Cox回归分析评估各因素对生存期的影响;
3)使用非负矩阵分解进行特征聚类;
4)主成分分析及可视化使用R包“pca3d”,提取及方差可视化使用R包“factoextra”;
5)进行Kaplan-Meier生存分析,log-rank检验用于评估样本生存曲线之间的差异;
6)使用随机效应meta分析模型计算风险比(hazard ratio, HR);
7)C-index和tROC分析用于比较不同变量间的生存预测能力,使用R包“survConcordance”和“survivalROC”;
8)进行决策曲线分析(DCA)计算各变量的生存净获益,使用R包“stdca.R”;
9)递归分区分析构建生存决策树,使用R包“rpart”。
研究思路
基于Hanahan和Weinberg(2000)所定义的癌症特征,缺氧被认为是LUAD I期患者总生存期最主要的危险因素。本研究综合使用WGCNA和LASSO Cox算法筛选缺氧相关的预后标志物,基于训练集和5个独立的验证集评估缺氧相关特征的预后能力,使用meta分析对其预后能力进一步验证。决策曲线分析(DCA)用于比较各变量的生存净获益,构建决策树和列线图,提高患者风险分层管理和生存预测能力。最后,研究分析比较了差异表达基因、基因组改变和治疗反应的富集通路。

