
相信很多小伙伴都已经感受到现在生信发文章好难啊,尤其在咱们深度学习领域。一方面,技术变化那是日新月异,新的模型和算法不断涌现;另一方面要求不断创新和寻找新的研究方向,在研究方法和实验设计上也要做出差异化的贡献。
1.研究构建了可解释的深度学习模型预测抗癌药物对复制应激的敏感性或耐药性。这些模型可以解释预测结果的机制。
2.研究通过多种基因组功能实验的验证和在临床中的应用来证明模型的有效性。
3.研究发现遗传变异在癌症蛋白复合物中的集中作用对于预测药物敏感性或耐药性至关重要,为精准医学提供了重要的理论和方法基础。(PS:如果你对深度学习的研究思路、研究方法有疑问,或者想复现相关研究,那你可以随时来找小记者。)


题目:癌症突变集中在蛋白质组件的集合上,以预测对复制应激的抵抗力
-
杂志:Cancer Discovery 影响因子:IF=28.2
发表时间:2024年1月
后台回复“999”获取原文献,文献编号240402
研究背景
快速增殖是癌症的特征之一,也是DNA复制应激疗法敏感性的关键。目前,大量的癌症治疗药物采用多样的复制应激诱导(RSi)机制,利用复制应激来消灭癌细胞。然而,许多肿瘤通过尚未完全理解的分子途径表现出耐药性。此外,肿瘤在药物敏感性和耐药性方面存在显著差异,这促使人们去更好地理解相关反应的机制。本研究利用机器学习算法开发了一套预测模型,旨在阐明癌症突变如何影响癌症对常见复制应激诱导药物的反应。
数据来源
RSi药物反应数据来源于公开可用的药物反应数据库,包括GDSC数据库(https://www.cancerrxgene.org/)以及CTRP数据库(https://portals.broadinstitute.org/ctrp/)。718个癌症相关的临床基因数据来源于先前的研究,包括FoundationOne CDx(Frampton et al,Nat Biotechnol,2013),Tempus xT(Beaubier et al,Oncotarget,2019),PALOMA-3 trial(Lira et al,Cancer Res,2017)和Project GENIE(Smyth et al,Cancer Discov,2020)。368名接受顺铂治疗的患者的基因组谱和临床信息数据从TCGA (PanCancer Atlas)和cBioPortal (https://www.cbioportal.org/datasets)等获得。(PS:本研究使用到了大量的公开数据,如果你也想处理分析公开数据,随时可以来找小记者!)
研究思路
本研究整合了大量的遗传变异数据和蛋白质相互作用网络数据,构建了一个包含多个蛋白质组件的网络图谱。然后使用深度学习模型预测了特定药物的敏感性或抗性,并确定了对药物反应预测具有重要贡献的蛋白质组件。通过功能筛选实验验证了这些预测结果。最后,本研究探索了这些蛋白质组件在临床上对顺铂治疗的预测价值。总的来说,本研究建立了一种综合遗传变异和蛋白质组件的预测模型,为精准医学提供了重要的参考(图1)。

图1 研究设计思路
主要结果
1.模型的训练
本研究通过分析由当前临床癌症基因组评估出的718个基因来建立对RSi药物的反应模型。将肿瘤样品中这些基因的基因组改变状态用作输入,使用来自CTRP和GDSC的基因组特征化肿瘤细胞系的药物反应数据来训练模型。主要包括六种RSi药物,包括顺铂、吉西他滨、喜树碱、依托泊苷、奥拉帕尼和CD437等。训练包括单药预测模型和多药统一模型,通过最小化预测药物反应和观察到的药物反应之间的均方误差(MSE)来进行(图2 A)。(PS:对深度学习训练方法有疑问的,随时可以来找小记者。)

图2 RSi药物反应模型的性能
2.模型的评估
研究人员使用嵌套交叉验证评估了每个模型的药物反应预测准确性(图2B)。评估结果显示,单药预测模型预测优势比(OR)在2.2至3.2范围内,表现出与现有模型相当或优于现有模型的性能。多药统一模型的OR在3.0至4.9范围内,显著优于单药模型和对应的黑匣子模型。此外,通过评估多药统一模型在预测细胞系对尚未在本研究中见过的RSi药物的准确性进一步证实了模型的普适性(图2C)。
3.分子组件对RSi药物反应预测是重要的
接下来,本研究使用SI(重要性分数)来确定对药物反应预测具有重要贡献的蛋白质组件。SI分数通过计算Ridge回归模型的预测结果与实验数据之间的相关性来衡量。为了突出对RSi药物重要的蛋白质组件,研究人员将注意力集中在小到中等规模的组件上,并确定了41个在单药或多药RSi模型中得分较高的组件(图3A,B)。通过正负对照,发现各种RSi药物模型产生的组件重要性分数与非RSi药物有所不同,但彼此相似(图3C)。此外,相较于非RSi药物,这些RSi组件对于预测细胞对RSi药物的反应更重要(图3D)。

图3 识别对RSi药物反应重要的分子机制
4. 使用全基因组功能分析来验证特异性蛋白组件
研究人员通过CRISPR/Cas9技术和RNAi技术进行了功能筛选实验,以验证确定的重要蛋白组件(图4A,B)。在41个RSi组件中,30个得到了药物敏感性或复制重启读数的支持,15个同时得到支持,表明这些组件在调控药物敏感性或耐药性方面起着重要作用(图4C)。

图4 通过系统性siRNA筛选评估重要组装体
5.对顺铂的临床反应的预测
在癌症基因组图谱(TCGA)分类的成人实体瘤中,有五种癌症亚型通常接受了顺铂治疗。使用C-index和HR,研究人员对接受顺铂治疗的患者进行了模型评估(图5)。根据模型预测,接受顺铂治疗的CESC或LUSC患者,如果被预测为对治疗敏感,其无进展生存期(PFS)结果显著优于被预测为耐药的患者。这一表现明显优于基线随机森林或弹性网模型。在未显示顺铂益处的其余癌症患者中,观察到顺铂VNN模型大多数预测为耐药,也符合预期。

图5 预测宫颈癌和肺癌临床结果的模型
文章小结
这篇影响因子28+的文章的内容可谓相当丰富。研究提出了一套可解释的深度学习模型,旨在了解肿瘤对复制应激诱导药物的敏感性和耐药性的遗传机制。并且研究策略不是将单基因改变与药物反应直接关联,而是将这些改变投影到与癌症相关的蛋白质复合物和更大的分子组装图上。在实验设计以及实验思路上也都相当缜密,值得我们借鉴和学习。相信看了一篇这么棒的文章,大家也一定有所收获。如果你对思路设计、文章复现、生信分析有所感想,都可以call小记者哟~

小记者话生信
如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和期刊推荐有所需要的话,“生信日报”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及付费选刊等,有意向的小伙伴欢迎咨询小记者哦!
生信分析
思路设计
扫码咨询小记者
1、注意!这个8分+『NHANES数据库分析友好期刊』On hold了!可能会被踢出SCI ···
2、7分+生信友好Nature子刊,质量过硬,影响因子看涨,但审稿速度拉垮,急稿建议绕行~
3、4分+中医药方向期刊,大量接收网络药理学!国人友好,审稿速度快,投稿看过来~

