大数跨境

揭示有前途的乳腺癌生物标志物:结合生物信息学分析和实验验证的综合方法

揭示有前途的乳腺癌生物标志物:结合生物信息学分析和实验验证的综合方法 中科生信
2024-09-02
3
导读:揭示有前途的乳腺癌生物标志物:结合生物信息学分析和实验验证的综合方法
点击蓝字

关注我们

揭示有前途的乳腺癌生物标志物:结合生物信息学分析和实验验证的综合方法



今天小编和大家分享一篇2024年1月发表在BMC Cancer杂志的文章《Unveiling promising breast cancer biomarkers: an integrative approach combining bioinformatics analysis and experimental verification》。





背景:



乳腺癌仍然是全球面临的一项重大健康挑战,因此有必要确定可靠的生物标志物,以便进行早期检测、准确预后和靶向治疗。





方法:



对TCGA数据库中的乳腺癌RNA表达数据进行了分析,以确定差异表达基因(DEG)。采用随机森林分析法选出前500个上调DEGs进行进一步研究,以确定关键基因。评估这些基因的依据是它们作为诊断生物标志物的潜力、它们在乳腺癌组织中的过表达量以及它们在正常女性组织中的低中位表达量。我们采用了多种验证方法,包括在线工具和定量实时PCR (qRT-PCR),以确认所发现的基因作为乳腺癌生物标志物的潜力。





结果:



01
(一)关键基因的筛选

从TCGA数据库中提取RNA表达数据,比较乳腺浸润癌(BRCA)和正常样本之间的差异表达基因(DEGs)。然后使用随机森林算法确定上调DEGs的重要性,并识别重要的基因特征(补充文件1-2)。在筛选出100个重要性得分较高的基因后,这些基因又经过了细致的筛选过程。通过利用UCSC Xena 服务器、UALCAN 和GEPIA2数据库进行评估,确定了与正常组织相比在乳腺癌组织中表达过高的基因。然后,利用GEPIA2对正常女性组织中表达中位数较低的基因进行鉴别。最后,对相关科学文献和文章进行了综合研究和分析,在确定的DEGs中找出了一组新的潜在诊断生物标志物,突出了基因探索的创新性。通过这一筛选过程,确定了四个基因,即CACNG4、PKMYT1、EPYC和CHRNA6,然后利用各种数据库研究了这些入选基因的预后和治疗意义。基于 METABRIC数据库,与正常组织相比,CACNG4、PKMYT1和CHRNA6在乳腺癌组织中表现出差异表达。然而,EPYC并没有表现出这种差异(补充文件3)。


02
(二)mRNA 表达

利用GEPIA2数据库比较了乳腺癌患者组织与正常人之间所选基因的表达水平。分析结果显示,与正常乳腺组织相比,CACNG4、PKMYT1、EPYC和CHRNA6基因在BRCA组织中过表达,而CACNG4和PKMYT1基因的过表达具有统计学意义,如Fig. 1A所示。我们还利用UCSC和UALCAN数据库分析了四个基因的差异表达。使用Xena UCSC 工具和 UALCAN 网络资源(https://ualcan.path.uab.edu/)发现,所有四个选定基因在乳腺癌中的表达水平都明显高于正常组织,见补充文件4。此外,如Fig. 1B所示,PKMYT1(P = 0.006)的表达水平在不同肿瘤分期表现出差异,而CACNG4(P = 0.06)、EPYC(P = 0.4)和CHRNA6(P = 0.2)的表达水平则没有任何统计学意义上的差异。


03
(三)亚细胞定位预测

   利用 GeneCards 数据库确定了已鉴定蛋白质的亚细胞定位。考虑到细胞膜蛋白作为治疗靶点的重要性,对鉴定出的基因进行了亚细胞定位研究。CACNG4和CHRNA6定位于质膜。相比之下,PKMYT1被预测定位于细胞核和细胞膜,而EPYC被预测定位于细胞外基质(补充文件5)。


04
(四)研究表达与临床病理参数的相关性

我们研究了CACNG4、PKMYT1、EPYC和CHRNA6基因在乳腺癌患者中的表达水平,这些基因按Scarff-Bloom和Richardson分级状态(SBR1、SBR2和SBR3)、BRCA1/2状态(野生型和突变型)和PAM50亚型(基础型、HER-2、Luminal A、Luminal B和正常乳腺样)分类为乳腺癌患者使用乳腺癌基因表达Miner v4.8数据库(bc-GenExMiner v4.8)(补充文件6-7)。结果显示,CACNG4、PKMYT1和CHRNA6在SBR1、SBR2和SBR3之间的表达水平存在显著差异。然而,在SBR1、SBR2和SBR3之间未观察到EPYC基因的表达差异。此外,在比较 BRCA1/2 状态时,在野生型和突变型 BRCA1/2 中未发现 CACNG4 和 EPYC 表达水平的显著差异。相反,突变组中PKMYT1的表达水平高于野生型,突变组中 CHRNA6 的表达水平低于野生型,如补充文件7(补充图4A)所示。此外,该分析还发现,与正常乳房样相比,CACNG4、PKMYT1、EPYC和CHRNA6在不同BRCA亚型中的表达各不相同(CACNG4(HER-2、Luminal A和B>正常乳房样,基底样<正常乳房样),PKMYT1(基底样、HER-2和Luminal B>正常乳房样、 正常乳房样)、PKMYT1(基底样、HER-2 和 Luminal B > 正常乳房样,Luminal B < 正常乳房样)、EPYC(Luminal A 和 B > 正常乳房样,基底样 < 正常乳房样 HER-2 = 正常乳房样)和 CHRNA6(HER-2、Luminal A 和 B、基底样 > 正常乳房样)),可参见附加文件 7(补充图 4A)。4A). 为了补充我们的研究结果,我们通过 UALCAN 数据库分析了 CACNG4、PKMYT1、EPYC 和 CHRNA6 基因的表达和临床病理参数,这些参数基于结节转移状态(正常、N0、N1、N2、N3)、TP53 突变状态(正常、TP53 突变和 TP53 非突变)和患者性别(正常病例、男性和女性患者)。研究结果显示,在结节转移状态(N0、N1、N2、N3 > Normal)和 TP53 突变状态(TP53 突变和 TP53 非突变 > Normal)下,CACNG4、PKMYT1、EPYC 和 CHRNA6 mRNA 的表达水平存在明显差异(附加文件 7,补充图 4B)。此外,对患者性别的评估表明,男性和女性患者的 CACNG4、PKMYT1 和 CHRNA6 mRNA 表达水平明显高于正常病例。值得注意的是,女性患者中 EPYC mRNA 的表达水平高于正常病例(p < 0.05);然而,如补充文件 7(补充图4B)所示,男性患者和正常病例中 EPYC mRNA 的表达没有明显差异(p > 0.05)。


05
(五)功能和通路富集分析

利用GEPIA2数据库(BRCA数据集)和cBioPortal数据集(TCGA,PanCancer Atlas)选择 CACNG4、PKMYT1、EPYC和CHRNA6基因共表达的基因。对这两个数据库的数据进行交叉分析,以确定共同表达的基因。使用 FunRich 工具对共表达基因进行了基因本体和通路分析。GO富集分析将基因功能分为三类:生物过程(BP)、分子功能(MF)和细胞成分(CC)。根据 GO 分析,CACNG4 的常见共表达基因在质膜、转运活性和信号转导等亚类中相当突出(补充文件8-12)。

同样,PKMYT1的共表达基因也富集在细胞核、DNA结合和细胞周期亚类中(补充文件9)。相比之下,EPYC共同表达基因则富集在细胞外基质、细胞外基质一致性和细胞生长亚类中(补充文件10)。此外,CHRNA6常见共表达基因富集在细胞质、转录调控活性和细胞通讯亚类中(补充文件11)。生物通路富集分析表明,CACNG4与ErbB受体信号网络和mTOR信号通路显著相关。同时,PKMYT1在DNA复制和细胞周期通路中富集。此外,EPYC主要与上皮细胞向间质转化有关,而CHRNA6则参与了ErbB受体信号网络和信号转导。我们还进行了GSEA,以确定最显著的标志基因集。GSEA的结果显示了5个基因集的富集(补充文件13)。


06
(六)选定基因的基因改变和体细胞突变

我们利用cBioPortal数据库调查了BRCA中CACNG4、PKMYT1、EPYC和CHRNA6 基因的基因改变频率。如补充文件14所示,我们的研究结果表明,所有被查询基因的总体改变频率为37%。值得注意的是,CACNG4基因改变导致mRNA上调的病例比例最高(16%)。相反,就CHRNA6基因而言,扩增是最常见的改变(6.55%)。此外,COSMIC数据库分析了乳腺癌中CACNG4、PKMYT1、EPYC和CHRNA6基因的突变情况。补充文件14提供了在这四个基因中观察到的突变类型的详细信息。在所有这四个基因的转化类型中,错义突变占的比例最大。


07
(七)选定基因的预后潜力

根据 Kaplan-Meier plotter 数据库分析的结果,如Fig. 2A所示,在BRCA中,PKMYT1的高表达与不利的总生存(OS)结果有显著关联(危险比(HR)= 1.38,P =0.00074)。相比之下,CHRNA6的高表达则显示出潜在的有利预后(HR=0.81,P=0.025)(Fig. 2B)。然而,CACNG4(HR=0.84, P=0.06)(Fig. 2C)和EPYC(HR=1.04,P=0.72)基因的OS并无统计学差异(Fig. 2D)。


08
(八)评估肿瘤细胞系对CACNG4、PKMYT1、EPYC和CHRNA6的依赖性

肿瘤细胞的生长和存活取决于一些治疗性生物标志物的表达水平。癌症依赖图分析工具是可以帮助识别与肿瘤细胞活力相关的生物标志物的数据库之一。在这项研究中,DepMap工具用于评估已鉴定的生物标志物对乳腺肿瘤细胞生长和存活的重要性。具体来说,分析siRNA和CRISPR筛选数据以确定乳腺细胞系对已鉴定基因依赖的可能性,如依赖性评分所示。较低的Chronos分数表明目标基因在特定细胞系中至关重要的可能性较高。在我们鉴定的基因中,PKMYT1在CRISPR 敲除的情况下表现出显着的依赖性评分(较低的Chronos评分),而CACNG4、EPYC和CHRNA6没有显示出显着的依赖性评分,如补充文件15所示。


09
(九)mRNA表达定量

基于对55例乳腺癌患者和正常病例进行的qRT-PCR分析,观察到CACNG4、PKMYT1、EPYC和CHRNA6 mRNA在乳腺癌组织(BCT)中的表达水平显著高于非肿瘤癌旁组织(NTAT)(P < 0.0001)。如Fig.3,比较乳腺肿瘤和正常组织之间 CACNG4、PKMYT1、EPYC和CHRNA6基因表达谱的配对t检验显示,与正常组织相比,乳腺肿瘤分别增加了近5.55倍、2.31倍、2.32倍和2.14倍。值得注意的是,对提取的RNA样品进行的PCR反应没有显示没有扩增。



010
(十)基因表达模式与临床病理特征的关联

对乳腺癌患者临床病理特征的评估显示,平均年龄为57.6 ± 11.5 (37-76)岁。大多数患者(77.5%)被诊断为早期乳腺癌,特别是 I 期和 II 期,47% 的淋巴结受累阳性。无花果。Fig.4A和补充文件16显示了CACNG4、PKMYT1、EPYC和CHRNA6基因的相对表达与临床病理特征之间的关联,包括年龄、ER、PR、HER2状态、TNM 期和组织学分级,这些特征使用 Mann-Whitney 检验进行评估。CACNG4 mRNA 表达分析显示,与 I 级和 II 级肿瘤患者相比,III 级乳腺癌患者显著上调。此外,与ER阴性病例相比,在ER阳性乳腺癌患者中观察到CACNG4 mRNA 表达显着增加。PKMYT1 mRNA表达在50岁及以上的患者以及HER2阳性患者中上调,如图所示。Fig.4B分析显示,与HR阴性(HR-) 个体相比,激素受体阳性(HR+) 乳腺癌患者的 EPYC mRNA表达水平显著增加。此外,与早期 (I+II) 患者相比,晚期(III+IV)乳腺癌患者观察到 EPYC mRNA表达的显著上调,如图Fig.4C所示. Fig.4D显示CHRNA6 mRNA表达在50岁以上的患者以及PR阳性和HER2阳性患者中较高。还评估了这些鉴定的基因与淋巴结状态和乳腺癌亚型的关联,但没有观察到显着差异。因此,这些发现未包含在Fig.4D. 进行非参数Spearman 相关分析以评估已鉴定基因之间的关联强度。CACNG4和EPYC mRNA表达水平 (r = 0.87,P < 0.0001)和CACNG4和CHRNA6mRNA表达水平(r = 0.5,P = 0.0008)之间观察到显著的正相关。然而,在乳腺癌患者中,PKMYT1和EPYC、PKMYT1和CACNG4、PKMYT1和CHRNA6以及EPYC和CHRNA6 mRNA 表达水平之间未观察到显著相关性(Fig.5)。





结论:



生物信息学数据库的整合有助于发现和选择新型诊断、预后和治疗生物标志物。通过生物信息学分析和qRT-PCR验证,我们证实了CACNG4、PKMYT1、EPYC和CHRNA6在乳腺癌中的上调。共表达和GO富集分析揭示了这些基因在乳腺癌发生和发展中的潜在机制。我们认为CACNG4、PKMYT1和CHRNA6有希望成为乳腺癌诊断和治疗的潜在靶点,而EPYC则有可能只用作有效的诊断生物标记。









扫码添加小助理
领取完整解读报告和原文文献


END



【声明】内容源于网络
0
0
中科生信
中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
内容 580
粉丝 0
中科生信 中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
总阅读1.4k
粉丝0
内容580