大数跨境

转录组测序助力解锁精神分裂症分子特征与关键基因密码

转录组测序助力解锁精神分裂症分子特征与关键基因密码 Biolinker
2025-01-25
1

导语


精神分裂症(Schizophrenia,SCZ)是一种复杂的精神疾病,给社会带来沉重负担,其特征包括精神病症状、认知缺陷和功能障碍。由于SCZ 的发病机制复杂,涉及多种分子机制间的相互作用,全基因组关联研究虽已识别出一些遗传风险因素,但将其转化为临床有用的风险预测模型颇具挑战。通过转录组测序及分析可揭示 SCZ 的分子基础,但以往研究存在局限性。


2024年11月作者在期刊Advanced Science(IF=14.3)上发表题为“Integrated Transcriptome Analysis Reveals Novel Molecular Signatures for Schizophrenia Characterization”的文章。该研究基于全基因组关联研究的成果,采用综合方法,整合转录组分析、基因组数据和实验验证,旨在识别疾病反应必需基因(disease‐responsive essential genes,DREGs),以加强对 SCZ 的分子特征描述。


一、实验设计


1.样本采集:从多个地点招募参与者,获取 3 个独立数据集。数据集 1 包含鹰潭精神卫生医院的首发未用药 SCZ 患者和健康对照;数据集 2 来自山东精神卫生中心的 SCZ 患者和山东大学齐鲁医院的健康对照;数据集 3 则有鹰潭精神卫生医院的 SCZ 和非 SCZ 精神疾病患者。采集 2.5mL 全血用于 RNA 测序,且患者样本有超 1 个月的停药史。


2.其他数据来源:获取 PsychENCODE 的 3 个前额叶皮层(prefrontal cortex,PFC) RNA 测序数据集(包含 SCZ 患者和健康对照)和新生成的外周血 RNA 测序数据。


3.分析流程:作者利用 PsychENCODE 的前额叶皮层(prefrontal cortex,PFC)RNA 测序数据和新的外周血 RNA 测序数据,将 70% 的数据用于差异表达基因分析,通过 DESeq2、EdgeR 和 Limma 三种算法的结果交集确定差异表达基因,再经支持向量机(SVM)递归特征消除法识别 DREGs。之后,使用自建的最新人类相互作用组进行蛋白质 - 蛋白质相互作用分析,通过 GO 和 KEGG 分析揭示 SCZ 相关通路富集情况,并在人类脑组织和 SCZ 模型中验证 DREGs 表达,利用多基因风险评分评估其遗传贡献。最后,选用八种顶级机器学习模型对 70% 的 PFC 和血液 RNA 测序数据进行十折交叉验证,获得最佳特征描述模型,并在三个独立数据集上验证 DREGs 对 SCZ 的特征描述能力,通过受试者工作特征曲线下面积(AUC)评估结果。

Figure1. The workflow for SCZ DREGs identification, analysis, and characterization.

二、主要结果


1. 184个精神分裂症(SCZ)疾病反应必需基因(DREGs)的鉴定结果


首先,作者通过 limma、EdgeR 和 DESeq2 算法对四个数据集(CommonMind Consortium [CMC]、Human Brain Collection Core [HBCC]、Lieber Institute for Brain Development [LIBD] 以及来自外周血的 Dataset 1)进行差异表达基因分析。接着,整合四个训练数据集的差异表达基因富集通路,识别出 70 条显著通路和 600 个相应基因。最后,基于这 600 个基因,利用支持向量机(SVM)进行递归特征消除,得到结果曲线,最终选定 184 个 DREGs,这些基因将进一步用于构建 SCZ 的特征模型。

Figure2. The results of characterization of 184 SCZ DREGs.

2. 疾病反应必需基因(DREGs)编码的蛋白质-蛋白质相互作用(PPI)网络的特征


作者构建了包含 24178 个基因和 2544177 个相互作用的综合人类相互作用组数据集,在 184 个 DREGs 中,155 个存在直接相互作用,形成了一个包含 155 个基因和 900 个相互作用的紧密连接的 PPI 网络(图 3A)。通过置换检验,将该网络与 1000 个随机生成的 PPI 网络比较,发现 DREGs 的 PPI 网络具有显著更多的蛋白质相互作用(P<1×10⁻¹⁶)(图 3B)。对比 DREGs 的 PPI 网络和背景基因(BG)的 PPI 网络的节点度和中介中心性等网络参数,结果显示 DREGs 的相关参数值显著高于 BG 基因(节点度 P<2×10⁻¹⁶,中介中心性 P = 4.8×10⁻¹⁶)(图 3C、D)。这些结果表明 DREGs 在网络中蛋白质相互作用丰富且处于核心地位。

Figure3.The characteristics of the significantly interconnected PPI Network encoded by the DREGs.

3. DREGs 的 PPI 网络中主要富集的通路


对 DREG 集合中排名前 32 的基因进行通路富集分析,发现免疫调节、突触可塑性、神经元发育等多条通路显著富集(图 4A)。从 DREGs 的 PPI 网络中提取直接相互作用大于 20 的基因作为 hub 基因,对其进行 GO 和 KEGG 富集分析,发现染色质重塑、转录调控等通路显著富集(图 4B)。通过 ClusterONE 算法识别出两个功能模块,模块 1 包含 8 个基因(如 RFGAP1、CYTH2 等),主要与谷氨酸能神经递质分泌和突触传递相关(图 4C、E);模块 2 包含 3 个基因(如 PLXND1、PLXNA2 等),与突触可塑性、神经元发育和投射有关(图 4D、F)。这些结果表明不同基因集合在不同通路上存在特异性富集,进一步揭示了 DREGs 在精神分裂症发病机制中的重要作用。

Figure4.The results of dominant pathway enrichment in the DREG PPI network.

4.疾病反应必需基因(DREGs)在多种人类脑组织中的表达模式


在 GTEx V8 数据库的 13 种人类脑组织中,DREGs 表达水平整体高于背景基因(BG genes),其中 hub 基因表达最高,hub 基因和模块 2 基因在不同脑组织中的表达趋势一致,而模块 1 基因在某些脑区表达较低(图 5A)。从 BrainSpan 数据库的脑发育阶段数据来看,DREGs、hub 基因和模块 2 基因在所有发育阶段的表达水平均显著高于 BG 基因,hub 基因在出生后表达达到峰值且在发育过程中波动明显(图 5B)。在 HBT 数据库的 16 个脑区中,DREGs、hub 基因以及模块 1 - 2 基因的表达水平均显著较高,hub 基因表达始终最高,模块 2 基因在不同脑区呈现出特异性表达变化(图 5C)。在 Allen 数据库中,SCZ 相关的中颞叶和前扣带回区域,DREGs、hub 基因和模块1-2基因表达水平也显著高于 BG 基因,关键 DREGs 在谷氨酸能神经元中表达波动明显,且模块 1 和 2 基因在这两个脑区的表达模式存在差异(图 5D、E)。

Figure5.The results of expression patterns in DREGs across various human brain tissues.



5. 9个关键疾病反应必需基因(DREGs)在精神分裂症(SCZ)动物模型和人类 RNA 测序数据集中的差异表达情况


研究选取 19 个关键 DREGs 中的 9 个 novel 基因(BICD1、IFFO1 等),利用 MK - 801 诱导的 SCZ 小鼠模型,检测其在小鼠外周血和前额叶皮层(PFC)中的 mRNA 水平,并与人类数据对比。结果显示,在动物模型的脑样本中,9 个基因里有 8 个呈现出统计学上显著的表达变化,KDELR3 基因虽未达显著水平但有变化趋势。在小鼠外周血中,KDELR3、PACSIN2、CDK9 和 PLXND1 这 4 个基因虽未呈现出统计学显著差异,但它们的表达趋势与人类脑数据一致。这些结果表明这些关键 DREGs 在 SCZ 的病理过程中可能发挥重要作用,可作为可靠的 SCZ 反应指标。

Figure6.Differential expression profiles of 9 key DREGs in the peripheral blood and prefrontal cortex of SCZ animal models and human RNA‐seq datasets.


6. 用疾病反应必需基因(DREGs)作为精神分裂症(SCZ)特征描述的性能评估


研究人员结合四个训练集数据,对逻辑回归(LR)、决策树(DT)等八种高性能机器学习模型进行十折交叉验证,结果显示支持向量机(SVM)模型表现最佳,平均准确率达 89.21%(图 7A)。因此选用优化后的基于 DREGs 的 SVM(DRES)模型进行后续测试,该模型在内部测试集上的准确率为 69% - 83%,对应的曲线下面积(AUC)值为 73% - 85%;在外部测试集 Dataset 2 上的特征准确率为 83%,AUC 值为 85%(图 7B)。此外,DRES 模型在区分 SCZ 与非 SCZ 疾病方面也表现良好,AUC 值达到 79%,准确率为 83%,仅 1 名 SCZ 患者被误分类,且在 6 种非 SCZ 疾病中,仅甲基苯丙胺诱导的精神病未被区分出来(图 7C)。这表明 DRES 模型在识别 SCZ 个体方面具有较高潜力。

Figure7.Assessment of characteristic performance and specificity of DREGs for SCZ.



领克生物科技(昆明)有限公司致力于下一代高通量测序技术(NGS)、生物信息学分析、转化医学研究等领域的应用和推广。


服务项目包括单细胞多组学测序、基因组重测序、外显子测序、WGBS、转录组测序、LncRNA测序、miRNA测序等,优势项目包括单细胞多组学、Smart-seq2、ATAC-seq和CUT&Tag等前沿技术服务,并且能够进行各类组学数据的个性化分析服务等。

欢迎咨询了解~      

电话:0871-65399960   

邮箱:service@biolinker.com

【声明】内容源于网络
0
0
Biolinker
领克生物是一家专业提供高通量测序技术服务、单细胞多组学以及定制化生信分析的生物技术服务企业。主营业务:BD平台单细胞多组学、10X多组学、新格元单细胞转录组、表观组学、三代测序以及定制化实验方案(农口+医口)等。
内容 34
粉丝 0
Biolinker 领克生物是一家专业提供高通量测序技术服务、单细胞多组学以及定制化生信分析的生物技术服务企业。主营业务:BD平台单细胞多组学、10X多组学、新格元单细胞转录组、表观组学、三代测序以及定制化实验方案(农口+医口)等。
总阅读11
粉丝0
内容34