大数跨境

4+ hub筛选新方法:机器学习

4+ hub筛选新方法:机器学习 中科生信
2022-09-16
4

分享一篇2022年2月发表在Front Genet(IF:4.772)《Identification and Validation of Aging-Related Genes in Idiopathic Pulmonary Fibrosis》(PMID: 35211155),作者通过机器学习方法筛选了衰老相关hub基因,并使用GEO数据集和临床样本验证了他们的表达水平。该研究方法同样适用于其他肿瘤或非肿瘤的研究,有相关需求的老师欢迎联系我们。

#

背景&方法



背景:

特发性肺纤维化(IPF)是一种慢性、进行性、纤维化间质性肺炎,其病因和发病机制尚未完全了解。衰老在IPF的发生和发展中起着重要作用。

方法:

1.IPF差异衰老相关基因的鉴定;

2.蛋白质-蛋白质相互作用网络及相关性分析;

3.差异衰老相关基因的GO和KEGG富集分析;

4.通过LASSO、SVM-RFE筛选hub基因;

5.hub基因的ROC曲线;

6.qRT-PCR验证hub基因的表达差异。

#

结果



IPF差异表达衰老相关基因

PCA显示一个样本是异常值,被排除在分析之外(图1A)。共鉴定出16个衰老相关基因(图1B,C和图2)。

图1

图2

蛋白质-蛋白质相互作用网络及相关性分析

PPI分析揭示了差异衰老基因之间的相互作用(图3A),并确定了每个基因的相互作用数量(图3B)。相关性分析表明16个差异衰老基因之间存在相关性(图4)。

图3

图4

GO和KEGG富集分析

进行GO(图5)和KEGG(图6)富集分析以确定差异表达衰老相关基因的潜在生物学功能。

图5

图6

通过LASSO、SVM-RFE筛选基因

LASSO回归算法识别出10个衰老相关基因(图7A,B),而SVM-RFE算法识别出8个衰老相关基因(图7C)。两种算法鉴定出六个hub基因:IGF1、CDKN2A、JUN、IGFBP2、RET和TFAP2A(图7D)。

图7

六个hub基因的ROC曲线

ROC曲线结果表明6个特异性表达的衰老相关基因对IPF具有较高的诊断价值。 其中,IGF1 在IPF样本中显示出最高的诊断价值。

图8

验证临床样本中差异表达的衰老相关基因

qRT-PCR进一步分析上述六个衰老相关基因的表达,分析结果与主要生物信息学分析的结果大体相似(图9)。

图9


今天的分享就到这里啦,对上述分析方法感兴趣或者没有研究思路的小伙伴,欢迎扫下方二维码前来咨询哦!先到先得,欲购从速!



微信号  /  中科生信


【声明】内容源于网络
0
0
中科生信
中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
内容 580
粉丝 0
中科生信 中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
总阅读850
粉丝0
内容580