本次小编分享一篇2021年9月2号发表于Brief Bioinform的文献,题目为《Bioinformatics and system biology approach to identify the influences of SARS-CoV-2 infections to idiopathic pulmonary fibrosis and chronic obstructive pulmonary disease patients》,影响因子11.622。该文献主要做了一下几个工作:(1)发现IPF和COPD与COVID-19相比的一些显著的共同基因,以评估其不同的遗传机制。(2)基于基因集的富集分析预测IPF、COPD和covid-19感染肺细胞中的GO,Hub基因识别使药物化合物的预测更加有用。(3)基于蛋白质-蛋白质相互作用网络的分析确定与IPF、COPD和COVID - 19相关的Hub基因。它可以引导我们了解他们的共同表达伙伴的正常和疾病状态,并评估风险因素。(4)在数据集中发现了TFs-基因相互作用和DEGs-miRNAs与共同基因的协同调控网络,以寻找共同基因的转录和转录后调节因子。(5)蛋白质与药物的相互作用提示了10种可能的抗COVID-19的化合物。
背景
严重急性呼吸综合征冠状病毒2(SARS-CoV-2)(COVID-19),目前已成为对人类的威胁。新型冠状病毒感染症(SARS-CoV-2)的第二波疫情席卷了许多国家,新冠肺炎确诊病例正在迅速扩散。因此,疫情仍在度过可怕的阶段。特发性肺纤维化(IPF)和慢性阻塞性肺疾病(COPD)是COVID-19的危险因素,但IPF、COPD和CVOID-19背后的分子机制尚不清楚。因此,我们通过转录组分析来检测IPF、COPD和COVID-19中的常见通路和分子生物标志物,以帮助理解SARS-CoV-2与IPF和COPD患者的关联。本文利用基因表达综合数据库(Gene Expression Omnibus, GEO)中的三个RNA-seq数据集(GSE147507、GSE52463和GSE57148)检测IPF和COVID-19感染的COPD患者的相互差异表达基因(EGs),以寻找共享通路和候选药物。三个数据集共鉴定出65个常见的DEGs。利用多种组合统计方法和生物信息学工具构建蛋白质-蛋白质相互作用(PPI)网络,并从该网络中识别出Hub基因和关键模块。此外,我们在本体论术语和通路分析下进行了功能分析,发现IPF和COPD与COVID-19感染的进展有一些共同的联系。数据集中还发现了转录因子-基因相互作用、蛋白质-药物相互作用以及具有共同DEGs的DEGs-miRNAs协同调控网络。我们认为,本研究获得的候选药物可能有助于COVID-19的有效治疗。
方法
1.本研究使用的数据集
为了确定SARS-CoV-2、IPF和COPD之间共享的遗传相互关系,我们使用了来自美国国家生物技术信息中心(NCBI)的GEO数据库中的微阵列和RNA-seq数据集。SARS-CoV-2数据集的GEO accession ID为GSE147507,这是通过Illumina NextSeq 500高通量测序平台提取RNA序列对COVID-19肺活检响应呼吸道感染的转录谱分析。IPF数据集是人类肺组织(GEO accession ID: GSE52463),包含8个IPF肺样本和7个健康对照,由Nance等人贡献的名为Illumina HiSeq(智人)的高通量测序系统进行测序。GEO ID: GSE57148的COPD数据集收集自91名肺活量测量正常的受试者和98名COPD受试者。通过Cufflinks软件检测基因表达,使用HiSeq 2000和RNA-seq对从COPD样本中分离的RNA进行检测。数据集的汇总信息如表1所示。
2.IPF、COPD和COVID-19之间的DEGs和相互DEGs的鉴定
当不同的测试条件在转录水平上有统计学显著差异时,一个基因的特征是表达不同。该分析的关键作用是获取数据集GSE147507、GSE52463和GSE57148的DEGs。在多个测试选项中,利用LIMMA包识别出DEGs。采用截断标准(P-value < 0.05和|logFC|≥1.0)检测所有数据集的显著DEGs。GSE147507、GSE52463和GSE57148的相互DEGs是使用在线VENN分析工具Jvenn获得的。
3.GO与通路富集分析
基因集富集分析是一项重要的分析。利用enrichment(一种综合性的基因集富集网络工具)进行基因本体、功能富集(生物过程、细胞成分和分子功能)和通路富集研究,以表征共享的DEGs的生物学机制和信号通路。目前,我们以KEGG (Kyoto Encyclopedia of Genes and Genomes)、WikiPathways、Reactome和BioCarta 4个数据库作为路径分类的起点,明确IPF、COPD和COVID-19之间的共享路径。通常,已知KEGG通路可以掌握代谢过程,并在基因组分析中发挥相当大的作用。P值< 0.05被认为是量化排名前几位途径的标准度量。
4.蛋白质相互作用网络分析
蛋白质在进入细胞的过程中,通过一个蛋白质-蛋白质网络与蛋白质形成相似的关系,这表明了蛋白质的机制。在细胞生物学和系统生物学中,对PPI网络及其功能的评估和分析是解释和了解细胞机械操作的基础和关键目标。我们利用STRING(version 11.0)存储库构建了来自共享DEGs的蛋白质的PPI网络,以描绘IPF、COPD和COVID-19之间的功能和物理相互作用。STRING设想通过积极的交互渠道,包括文本挖掘、实验数据库、共表达、文化、基因融合和在不同的分类置信值(低、中、高)设置下的共发生,扩展对PPI的见解。本实验设置中等置信值为0.5,生成常见DEGs的PPI网络。然后,我们将我们的PPI网络用于Cytoscape (v.3.7.1)的可视化和进一步的PPI网络实验研究。
5.Hub基因提取及子模块分析
PPI网络由节点、边以及它们之间的连接组成,其中纠缠最严重的节点被认为是Hub基因。Cytohubba——一个新颖的cytoscape插件,用于根据各种网络特征对生物网络的中心或潜在或目标元素进行排序和提取。Cytohubba有11种从不同角度研究网络的方法,其中maximclique Centrality(MCC)是最好的方法。我们利用Cytohubba的MCC方法从PPI网络中识别出前15个中枢基因。我们还根据Cytohubba的近邻域排序特征对中心基因的最短可用路径进行了分类。
6.转录因子和miRNA的识别与常见的DEGs相关
转录因子(TFs)是附着在特定基因上并控制遗传信息转录速率的蛋白质;因此,这对于分子观察至关重要。我们已经利用NetworkAnalyst平台定位来自JASPAR数据库的拓扑上可信的TFs,这些TFs倾向于绑定到我们相互的DEGs。JASPAR是一个公开可用的资源,用于研究六个分类群中的多个物种的TFs配置文件。NetworkAnalyst是一个广泛的在线平台,用于meta分析基因表达数据,并获得对生物机制、角色和解释的见解。此外,针对基因相互作用的miRNAs被纳入,以追踪力争与基因转录物结合以影响蛋白质表达的miRNAs。Tarbase和mirTarbase是miRNA-靶基因相互作用的主要实验效度数据库。通过networkAnalyst的miRNA-gene相互作用,我们从Tarbase和mirTarbase中提取了miRNA,这些miRNA与共同的DEGs相互作用,主要用于拓扑分析。TFs-gene和miRNA-gene相互作用网络在Cytoscape中得到了说明。该工具帮助研究人员高度过滤顶部的miRNAs,检测其生物学功能和特征,从而得出有效的生物学假设。
7.上市药品的评估
预测蛋白质-药物相互作用(PDI)或药物分子鉴定是本研究的重要内容之一。通过基于COVID-19、IPF和COPD的基因片段的Enrichr,利用Drug Signatures database (DSigDB)对药物分子进行鉴定。Enrichr是一个流行的门户网站,拥有大量不同的基因集库,探索基因集在全基因组范围内的富集。DSigDB是识别与DEGs相关的靶向药物的全球档案。该数据库有22527个基因集。
8.基因-疾病关联分析
DisGeNET是一个全面的基因-疾病关联数据库,从具有疾病的各种生物医学方面的几个起源同步关系。它强调了对人类遗传疾病的新见解。我们还通过网络分析检查了基因-疾病关系,以发现与常见的DEGs相关的疾病及其慢性并发症。
结果
1.IPF、COPD和COVID-19中DEGs和常见DEGs的鉴定
为了研究IPF和COPD与COVID-19的相互关系和影响,我们分析了NCBI的人类RNA-seq数据集和微阵列数据集,对刺激COVID-19、IPF和COPD的紊乱基因进行排序。RNA-seq和微阵列数据集实验在具有DESeq2和limma包的R语言环境下进行,存在Benjamin-Hochberg错误发现率。首先,1184个基因表达差异,其中293个基因表达上调,891个基因表达下调。同样,本分析在完成不同的统计分析过程后,选择了IPF和COPD最显著的DEGs。我们在IPF数据集中发现了1444个DEGs(783个上调,661个下调),在COPD数据集中发现了1461个DEGs(1022个上调,439个下调)。所有显著性DEGs均在p值< 0.05和|logFC|≥1的基础上提取。在对Venn分析的可靠门户网站jvenn进行交叉比较分析后,我们从IPF、COPD和SARS-CoV-2数据集中确定了65个常见的差异基因。利用这个常见的基因集来完成进一步的实验。这三种疾病是联系在一起的,因为它们彼此有一个或多个共同的基因。图2表示了三个数据集的累积比较评价和相互DEGs的检索。
2.GO与通路富集分析
利用Enrichr软件进行GO与通路富集分析,确定本研究中所强调的富集途径共享的DEGs的生物学意义。GO考虑了基因功能及其组成部分,提供了丰富的可计算知识资源。GO在给定的上下文中定义了一组信息——理论上讲。从生物过程、细胞成分和分子功能三个类别获取GO,并选择GO数据库作为注释源。表2总结了生物过程、分子功能和细胞成分类别中的前10个术语。图3还在柱状图中线性地描述了每个类别的整体GO分析。
通路分析揭示生物体对其固有的修饰作出反应。它是一种模型技术,通过基本的分子或生物过程来展示各种疾病之间的相互作用。从KEGG、WikiPathways、Reactome和BioCarta等四个全球数据库中收集了IPF、COPD和COVID-19中受影响最大的常见DEGs通路。表3列出了从所选数据集获得的最高路径。为了更准确地说明,图4也用条形图表示了通路富集分析。
3.Hub蛋白和子模块的分类
我们仔细研究了来自STRING的PPI网络,并在Cytoscape中可视化,以预测常见的DEGs相互作用。常见DEGs的PPI网络由781个节点和968条边组成,如图5所示。同时,大多数相互连接的节点被认为是PPI网络的中心基因。从包含Cytohubba插件的PPI网络分析中,我们列出了最具影响力的14个(21.54%)基因。hub基因分别为NOTCH4、FLNC、Indian hedgehog (IHH)、FOSL1、CXCR4、PSMB8、DAXX、RASD2、EPN3、DIRAS1、BATF、GDF5、RGS4和CD28。这些中枢基因可能是潜在的生物标志物,这也可能导致新的治疗策略的研究疾病。由于中心基因是有潜力的,在Cytohubba插件的帮助下,我们还构建了一个子模块网络(图6),以更深入地了解它们的近连通性和邻近性。从PPI网络衍生出的hub-gene相互作用扩展网络如图6所示。
4.egulatory signatures的确定
为了识别在转录水平发生的实质性变化,并深入了解中心蛋白的调控分子或常见的DEGs,我们采用了基于网络的方法来解码调控转录因子和miRNAs。TFs调节因子与共同的DEGs相互作用如图7所示。同样,图8显示了mirna调控因子与共同的基因差异基因的相互作用。从TFs -基因和miRNAs -基因相互作用网络分析中,确定了112个转录因子(TFs)和68个转录后(miRNAs)调控信号具有不止一种共同的DEGs,这从本质上说明它们之间存在强烈的干扰。
5.候选药物的鉴定
评估蛋白质-药物相互作用对于理解受体敏感性推荐的结构特征很重要。在IPF、COPD和COVID-19中作为潜在药物靶点的常见DEGs方面,我们基于来自DSigDB数据库的转录组特征,利用扩增技术确定了10种可能的药物分子。排名前10位的化合物是根据p值提取的。这些潜在的药物被建议用于常见的DEGs;这些药物可以是三种疾病的常见化合物。表4显示了DSigDB数据库中常见基因的有效药物。
6.疾病关联鉴定
不同疾病相互关联的条件是它们通常必须有一个或多个相似的基因。疾病治疗设计策略开始揭示基因和疾病之间的关系。通过NetworkAnalyst对基因-疾病关联的分析,我们注意到类风湿关节炎、精神分裂症、疹子、特应性皮炎和常染色体隐性易感疾病与我们报道的中枢基因最为协调,甚至在IPF、COPD和COVID-19中也是如此。精神分裂症是一种复杂的疾病,包括其病理生理中多种路径的失调。谷氨酸能、多巴胺能和氨基丁酸能神经递质系统正在影响精神分裂症疾病,这些受体之间的相互作用有助于疾病的病理生理学。特应性皮炎的病理生理学是多因素和困难的,包括IgE介导的超敏反应、屏障功能障碍的因素、细胞改变和环境因素。基因与疾病之间的关系如图9所示。
小结
我们的研究在IPF、COPD和COVID-19转录组分析的背景下,总结了这三个疾病基因之间的关系。我们在三个数据集中进行了DEGs,识别了常见基因,并找出了IPF、COPD和SARS-CoV-2感染肺细胞之间的疾病应答。生物信息学分析显示,IPF和COPD患者感染SARS-CoV-2的风险较高。因此,我们面对这些数据集中65个共同的相关基因。然后利用共有的65个基因获得了PPI网络,并从PPI网络中筛选出了10个最重要的枢纽基因。通过DSigDB数据库检索中枢基因,提示多种药物分子和药物-靶相互作用。对IPF、COPD和COVID-19的分析表明了一种识别各种疾病感染的方法。因此,有可能减轻IPF和COPD患者受SARS-CoV-2影响的风险。COVID-19是一种最近发现的疾病;关于危险因素和疾病的研究还不多。有了上述数据集,对COVID-19进行充分分析就更为重要。目前,有一些疫苗可用于预防COVID-19。但这些疫苗在某些情况下并不有效,尤其是对不同的SARS-CoV-2变种。尽管如此,科学界正在集中精力开发治疗COVID-19的更有效疫苗。因此,我们通过转录组分析来检测IPF、COPD和COVID-19中的常见通路和分子生物标志物,以帮助理解SARS-CoV-2与IPF和COPD的关联。10个中枢蛋白被鉴定参与了这些疾病。所有这些中枢基因在不同的功能突变中发挥着重要作用。所鉴定的TFs和miRNAs与不同类型的呼吸道疾病相关。因此,我们发现的基因可以成为COVID-19疫苗开发的新的治疗靶点。
写
在
最
后
以上就是小编对于这篇文章的介绍,中科生信致力于生信个性化分析新模式,专注于服务医学科研用户,按需定制对应服务,如果您对这篇文章感兴趣或是想了解其他方向的生信内容的话,欢迎长按下方二维码联系我们!
中科生信
微信公众号
中科生信
新浪微博
@中科生信

