
铛铛铛,宝子们大家好呀,热爱科研的小记者又来啦!目前,在肿瘤研究领域,生信热度持续攀升,发文量居高不下!那么,想要在生信分析中获得高分,就必须拥有自己的独特优势。今天小记者给大家分享一篇宝藏之作,咱们一起来看一看这篇文章的奥秘之处!
1.本研究采用免疫细胞反褶积、一致聚类和免疫谱分析将患者分为胰腺癌免疫冷/热组,以免疫冷/热肿瘤为主要研究对象,瞬间吸引人眼球!
2.文章通过机器学习+预后模型+单细胞数据分析等,全面而系统地分析了免疫冷、热胰腺腺癌的生物标志物及其分子机制,是文章的质量关键,也是文章创新性的体现!
3.最后,文章进行了药物敏感性和分子对接研究,确定了PAAD的候选药物和相应的蛋白靶点,为免疫冷肿瘤转化为热肿瘤治疗PAAD方面提供理论基础,是纯生信的模板呦,生信小白速进!(ps:听完小记者的介绍,小伙伴们是不是瞬间信心倍增?机器学习+单细胞数据分析+分子对接就是杠杠滴厉害! 如果你有思路,不知怎么复现,赶紧关注小记者吧! 小记者这里有超多高分思路与新的分析方向,快来和小记者一起学习吧! 下一个拿高分的就是你!)


题目:基于机器学习的免疫冷、热胰腺腺癌生物标志物和药物鉴定
杂志:Journal of Translational Medicine
影响因子:IF=6.1
发表时间:2024年8月
公众号回复“999”领取原文PDF,文献编号:240824
研究背景
胰腺腺癌(PAAD)通常表现为“冷”或免疫抑制肿瘤环境,这与免疫检查点阻断治疗的耐药性有关。然而,其潜在的机制还不完全清楚。因此,本研究的目的是确定治疗PAAD的生物标志物、治疗靶点和潜在药物,来改善PAAD的治疗。
研究思路
文章首先根据免疫热或冷PAAD亚型进行分类,然后通过Cox回归和加权相关网络分析构建新的基因标记,称为“下调肿瘤、预后和免疫相关基因”(DPIRGs),并通过机器学习(ML)开发PAAD的预后模型。文章通过ML鉴定PAAD免疫亚型和预测预后的生物标志物基因,并利用公开的单细胞转录组学和蛋白质组学资源验证生物标志物的表达。通过分子对接研究,确定了冷肿瘤变热的候选药物和相应的靶蛋白。
主要结果
1.PAAD的免疫分析和共识聚类
本研究根据22种免疫细胞分数,使用ConsensusClusterPlus包进行一致聚类分析。初步将PAAD患者分为2 - 9个簇,利用CDF曲线确定最佳簇数为2(图 1A)。随后的Cox分析显示,两组患者的生存率存在显著差异(图1B)。基于StromaScore、ImmuneScore和EstimateScore,本研究将集群1肿瘤定义为“热免疫”肿瘤,将集群2肿瘤定义为“冷免疫”肿瘤(图1C)。文章使用“limma-voom”算法在热肿瘤中鉴定出2055个上调基因和2565个下调基因 (图1D)。


图1 热/冷肿瘤和DEGs的鉴定
2.预后和免疫相关基因特征的鉴定
文章使用WGCNA算法确定了10个不同颜色的模块,计算了各模块与免疫簇或免疫细胞的相关性,发现粉色和绿松石色模块与冷肿瘤相关,黑色模块与热肿瘤相关,相关系数值均> 0.3(图2A)。在粉色模块中,基因显著性(GS)与模块隶属度(MM)的相关系数为0.46(图2B),而绿松石和黑色模块的相关系数分别为0.81和0.23(图2C和D)。本研究选择GS > 0.3和MM > 0.5的基因进行进一步分析(图2B-D),其中包括165个热相关基因(HRGs)和4183个冷相关基因(CRGs)(图2E, F)。DEGs和WGCNA的交叉结果显示,在DEGs和HRGs之间有118个重叠基因,在DEGs和CRGs之间有375个重叠基因,提取这些基因进行后续分析(图2E, F)。



图2 加权相关网络分析
3. 构建共识机器学习驱动的预后模型
为了建立一个共识模型,本研究使用LOOCV框架,对82个UPIRGs, 96个DPIRGs和所有178个预后免疫相关基因进行了基于ML的整合。结果表明,UPIRGs的最佳模型是Survival RF和Enet的组合(图3A);对于DPIRGs,是Survival RF和PlsRcox的组合(图3B);对于PIRGs,它是生存RF和ANN的组合(图3C)。综合这三种模型,发现结合生存率RF和PlsRcox的DPIRGs模型是C-index最佳的预后模型,并将其命名为混合模型。为了评估DPIRGs的预后意义,本研究根据风险评分的中位数将PAAD患者分为高危组和低危组。根据TCGA + ICGC训练数据库,高危组和低危组的生存率有显著差异,低危组生存率更高(图3D)。TCGA + ICGC队列中1年、2年和3年生存率的ROC曲线下面积(AUC)值分别为0.979、0.983和0.986(图3E)。本研究还比较了两组的风险评分和临床状况,发现高危组的生存率较低(图3F)。




图 3 预后特征的构建和验证
4.DPIRGs特征在PAAD中的预后价值
本研究采用单ML和联合ML算法构建基于DPIRGs的热、冷肿瘤患者共识模型。根据所有模型的4个GSE验证数据集的平均c指数值,热肿瘤患者的最佳模型是生存RF和ridge的组合,研究将其命名为热模型(图4A),冷肿瘤患者的最佳模型是plsRcox和XGBoost的组合,研究将其命名为冷模型(图4B)。Cox分析显示,热模型比冷模型更适合将患者分为高危组和低危组,根据热模型以及TCGA + ICGC和四个GSE数据库的数据,风险组之间的生存差异更为显著(图4C-D)。


图4 热/冷胰腺癌患者预后特征的构建和验证
5 免疫治疗反应分析及药物预测
TIDE评分与肿瘤免疫逃逸和免疫治疗抵抗的可能性密切相关,如图5A所示,低热肿瘤的TIDE评分明显低于高冷肿瘤。此外,对PD-1阻断有反应的患者的DPIRGs评分明显低于无反应的患者(图5B)。本研究还使用五种ML算法预测了影响TIDE评分的显著DPIRGs,发现排名前五的基因是RPL1P42、KRT18P7、MIR554、RBMXP2和FAM157A(图5C)。接下来,研究发现23种药物与DPIRGs表达水平呈负相关,且这23种药物的IC50值在低热组和高冷组之间存在差异,高热组的IC50值更高,说明这些药物在高冷组可能具有更强的治疗效果(图5D)。在冷高组中,药物与Tregs和静息NK细胞呈强烈负相关(图5E)。此外,这些药物与标志通路呈正相关,低热组的相关系数高于高冷组(图5F)。接下来,使用5种ML算法预测药物对预后的意义,与患者生存相关的前8位药物分别是CAY10594、沙利度胺、AT13387、nb -431542、达沙替尼、博来霉素A2、ML258和TGX-221(图5G)。研究还使用5种ML算法预测能够显著调节DPIRG评分的药物,排名前8位的药物分别是BRD-K02251932、WAY-362450、西咪替丁、semagacestat、nb -431542、博来霉素A2、ML258和沙利度胺(图5H)。





图5 免疫治疗和药物预测
6. 药物分子与DPIRGs的结合
随后,本研究从ZINC15数据库下载了8个活性化合物的化学结构,分别是AT13387、卡铂、CAY10594、沙利度胺、TGX-221、达沙替尼、semagacestat和sb431542。然后,本研究选择了4个具有相应完整蛋白结构的基因,探索基因与药物的结合模式(图6)。

图6 药物分子与DPRIGs的结合
7. PAAD样品中细胞类型特异性DPIRG表达的验证
本研究下载了8个PAAD scRNA-seq数据集,检测了AHNAK2、PLEC、ITGB4和XDH在低热和高冷肿瘤中的差异表达,结果发现这些基因在恶性细胞中表达更强烈(图7A)。在HPA网站上,可获得9个DPIRGs对应蛋白的免疫组化结果,包括AHNAK2、ANKRD61、CEP295NL、DCST1、ITGB4、PLEC、RGPD3和ZC3H11B。根据免疫组化分析,这些蛋白在代表性PAAD样品中的分布和染色强度,从低表达到高表达,如图7B所示。


图7 单细胞分析和免疫组织化学分析
文章小结
看完这篇文章,有没有觉得文章内容量很大,思路超新颖?本研究以免疫冷/热肿瘤为主要研究方向,妥妥滴结合临床,是审稿人想要的方向呦!并且文章通过机器学习+单细胞数据分析+预后模型等,进行免疫冷、热胰腺腺癌生物标志物及其分子机制的研究,是文章质量的关键。此外,本研究还进行了药物敏感性和分子对接研究,以确定PAAD的候选药物和相应的蛋白靶点,给文章锦上添花呦,这不是妥妥滴纯生信模板嘛!想发文章的小伙伴们,赶快抓住机器学习+单细胞数据分析+分子对接的套路,赶紧大显身手! 关注小记者,无论是生信分析还是基础实验,各种创新性思路设计,小记者都可以帮你解忧哦~
小记者话生信
如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和期刊推荐有所需要的话,“生信日报”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及付费选刊等,有意向的小伙伴欢迎咨询小记者哦!
生信分析
思路设计
服务器租赁
扫码咨询小记者
1、超高分sci!将近50分你还有不看的理由?德国学者真是把机器学习玩出花了,直接构建一个新生信分析方法,还不快看!
2、国自然出品就是牛!复旦大学施思&虞先濬团队:借公共数据库+RNA-seq+湿实验研究癌症成纤维,IF近9分属实佩服!
3、MDPI期刊再爆丑闻!23本期刊存在“审稿人工厂”问题!

