大数跨境

纯生信7.5分新突破!全基因组学锁定阿尔茨海默病“细胞特异性药靶”,揭示精准治疗新方向!

纯生信7.5分新突破!全基因组学锁定阿尔茨海默病“细胞特异性药靶”,揭示精准治疗新方向! 中科生信
2025-07-22
3
导读:纯生信7.5分新突破!全基因组学锁定阿尔茨海默病“细胞特异性药靶”,揭示精准治疗新方向!

大家好!今天小编和大家一起分享一篇20257发表在 Journal of Translational Medicine杂志JCR2IF: 7.5的文章Multi-omics analysis for identifying cell-type-specific and bulk-level druggable targets in Alzheimers disease多组学分析:阿尔茨海默病中细胞类型特异性及整体水平可成药靶点的鉴定

Highlights

1、揭示细胞类型特异性致病基因的分布特征,凸显了AD病理机制的细胞特异性,为精准靶向特定脑细胞类型的研究提供了关键线索

2、鉴定新候选基因PABPC1及其潜在作用机制

3、构建药物-靶基因网络,为开发细胞类型特异性药物提供了可转化的研究基础

背景

阿尔茨海默病(AD)是一种多方面的神经退行性疾病,其特征是进行性认知衰退和记忆力丧失。AD 大致分为早发性和晚发性两种类型,其中晚发性ADLOAD)最为常见。AD 的遗传结构复杂,涉及分布在多个基因上的众多有害变异。其中,APOE ε等位基因被认为是晚发性AD 最强的遗传风险因素。全基因组关联研究(GWAS)极大地增进了我们对AD遗传基础的理解。早期的AD GWAS研究发现了CLUCR1等关键基因座。最新的AD GWAS 研究进一步拓展了我们对阿尔茨海默病遗传基础的认识,在75 个基因座上发现了83 个遗传变异,包括在欧洲ancestry人群中新发现的42个变异。然而,尽管GWAS在识别与AD相关的遗传变异方面发挥着重要作用,但它们无法阐明这些变异导致疾病发生的分子和细胞机制。这些变异中,只有一小部分位于编码区,而大量非编码风险变异的作用机制仍不明确。

数据源及方法

公共数据源:NHGRI-EBI GWAS 目录下载的 项最新的涉及欧洲血统的 AD GWAS 研究的汇总统计数据、两个源自AD脑样本单细胞测序的细胞类型水平eQTL数据集、组织水平MetaBrain eQTL数据集。

主要生物信息学方法:基于汇总数据的孟德尔随机化(SMR)、贝叶斯共定位(COLOC)、WGCNA、成药分析、药物预测

Workflow

由于篇幅限制,原始表见原文:https://pmc.ncbi.nlm.nih.gov/articles/PMC12257706/#Sec2

主要结果

检测到的候选致病基因的总结结果

我们整合了五个近期AD 全基因组关联研究(GWAS)数据集、两个通过AD 脑样本单细胞测序获得的细胞类型水平表达数量性状位点(eQTL)数据集,以及一个来自先前研究的脑组织水平 MetaBrain eQTL 数据集(图2)。Bryois 单细胞RNA 数据来自颞叶皮层、白质和前额叶皮层等多个区域,而Mathys 等人的单细胞 RNA 测序数据则来自背外侧前额叶皮层(DLPFC)区域(图2)。通过SMRHEIDI 以及COLOC 分析,我们在这些数据集中确定了28 个符合筛选标准的候选致病基因(图和补充文件1:表S3-S5),筛选标准为:SMR 错误发现率(FDR<0.05HEIDI p > 0.05COLOC PPH4>0.75 且 COLOC PPH4/PPH3>3

在这28 个候选致病基因中,有两个(AL355353.1 和 AL137789.1)为长链非编码RNAlncRNA)基因,其余26 个为信使RNAmRNA)基因。补充文件2:图S1-S5 显示,与其他AD GWAS 数据集相比,Bellenguez AD GWAS 汇总统计数据中鉴定出的候选致病基因数量最多。在这28 个候选致病基因中,12 个仅在细胞类型水平被检测到,个在细胞类型和整体分析中均被发现,个仅在整体水平被识别(补充文件2:图S6)。此外,我们还注意到细胞类型水平eQTL 和整体水平eQTL 数据集之间的MR效应值方向一致。在整体水平和细胞类型水平数据集中均检测到EGFRSNX31PABPC1ACEARL17BPRSS36 LRRC37A,且它们的效应方向一致(图2,补充文件2:图S6)。此外,TSPAN14GRN、CD2APAPH1BSLC39A13FCER1GCR1NDUFAF6 和 TP53INP1 仅在整体MetaBrain eQTL 数据集中被鉴定为候选致病基因(图2,补充文件2:图 S6)。而RIN3PICALMJAZF1RABEP1KANSL1AL355353.1SCIMPUSP6NLCASS4FERMT2BIN1 和 AL137789.1 则仅在细胞类型 eQTL 数据集中被鉴定为候选致病基因(图2,补充文件2:图S6)。

综合所有GWAS数据集的结果,在19 个细胞类型水平的候选致病基因中,16 个仅在一种细胞类型中被证实具有致病性(图和表1)。此外,ACEARL17B 和 SCIMP 个基因在多种细胞类型中均被检测到,且孟德尔随机化(MR)效应值方向一致(图和表1)。小胶质细胞中检测到的候选致病基因数量最多,其次是兴奋性神经元、星形胶质细胞、抑制性神经元、少突胶质细胞和少突胶质前体细胞(OPCs)(图和表1)。我们还鉴定出 个细胞类型特异性候选致病基因(EGFRSNX31PICALMJAZF1 和 RABEP1,这些基因在两个单核RNAsnRNA)表达数量性状位点(eQTL)数据集中均有发现(表1)。为评估本研究鉴定出的候选致病基因的新颖性和稳健性,我们将其与既往文献进行了交叉比对。根据基因是否有既往整体水平研究或细胞类型特异性研究支持(如Agora 数据库提名,或经 SMR、共定位分析显著检出),或是否为新发现,我们对这些基因进行了分组。

首先,在个仅在整体水平数据集中检出的候选致病基因中,所有基因均已在既往文献中被报道(表2)。值得注意的是,FCER1GGRNCD2APAPH1B CR1 在既往研究中也通过共定位或 SMR 分析被鉴定为细胞类型水平的致病基因(表2)。其次,在 12 个仅在细胞类型水平数据集中检出的基因中,RIN3BIN1CASS4RABEP1AL355353.1SCIMPUSP6NLPICALM 个基因已有整体水平和细胞类型水平的双重证据支持(表2);KANSL1AL137789.1 FERMT2 有既往整体水平研究支持,JAZF1 则有既往细胞类型水平研究支持(表2)。此外,既往在整体水平已知的候选致病基因 AL137789.1 和 FERMT2,在本研究中得到了新的细胞类型水平证据的证实(表2)。最后,在个同时在细胞类型水平和整体水平数据集中检出的基因中,ACE PRSS36 已有整体水平和细胞类型水平的双重证据支持(表2);EGFRSNX31ARL17B 和 LRRC37A 有既往整体水平研究支持,本研究进一步提供了新的细胞类型水平证据(表2);而 PABPC1 则是通过 SMR 和共定位分析新发现的候选致病基因,既往支持证据有限或无相关报道(表2)。

通过 SMR 和共定位分析获得的候选致病基因的 SMR 效应值(beta 值)方向

注:综合了所有五个全基因组关联研究(GWAS)数据集的结果。候选致病基因的筛选标准为:SMR 错误发现率(FDR<0.05HEIDI p > 0.05、共定位分析 PPH4>0.75 且 PPH4/PPH3>3

蛋白质-蛋白质相互作用与功能表征

PPI分析显示,23个候选致病基因编码的蛋白质之间存在相互作用;而PRSS36CR1TSPAN14FCER1GSLC39A135个基因编码的蛋白质在网络中未检测到相互作用,具体如图3A所示。在星形胶质细胞中鉴定出的EGFR是连接度最高的节点(存在7种相互作用),这表明它可能作为核心枢纽调控多条通路的信号传递(图3A)。其他连接度较高的基因包括RIN3CASS4PICALM,这些基因均主要在小胶质细胞中被检测到,各自存在6种相互作用(图3A)。在小胶质细胞表达的基因之间观察到多种强相互作用,例如BIN1~RIN3CASS4~FERMT2以及CD2AP~PICALM,这提示存在一个密集的小胶质细胞亚网络(图3A)。富集分析显示,候选致病基因与膜组织、细胞迁移以及关键信号通路(包括ERK1/2 PI3K/AKT 级联反应)显著相关(GO 生物学过程)(图3B 和表S6)。这些基因还在囊泡、早期内体、黏着斑、轴突和树突等细胞组分中富集(图S7)。Reactome 分析突出显示,膜转运、囊泡介导的运输以及网格蛋白介导的内吞作用是显著富集的通路(图3C)。

候选因果基因网络分析和途径富集。 候选致病基因的STRING PPI 网络。节点代表蛋白质,而边则说明它们之间的相互作用。每个节点的形状用于表示候选基因的检测背景:椭圆表示仅在细胞类型水平数据集中检测到的基因,菱形表示仅在批量水平数据集中发现的基因,矩形表示细胞类型水平和批量水平分析之间共享的基因。边缘的厚度对应于来自 STRING 的组合交互得分。ACE 和 SCIMP 在兴奋性神经元和抑制性神经元中均被检测到,而 ARL17 B 在小胶质细胞和 OPC 中均被检测到。途径富集基于基因本体(GO)生物过程类别的候选因果(mRNA)基因。 基于 Reactome 途径的候选致病基因(mRNA)的 途径富集。

新的星形胶质细胞特异性候选致病基因共定位的可视化

如图4A-C所示,PABPC1的表达受GWAS显著位点rs1693551的影响(GWAS P值:1.785e08;效应值Beta0.0459,数据来源于Bellenguez等人的AD GWAS汇总统计)。我们的分析还显示,rs1693551可能同时影响邻近的另一个基因SNX31(图2和图4B)。

我们观察到,在AD GWAS的显著变异列表中,eQTL存在富集趋势(星形胶质细胞中PABPC1的富集P=1.12e4)(图4D)。对于PABPC1,星形胶质细胞中基因表达相关的SNP效应与AD患病风险的效应方向一致(图4AEF)。eQTpLotP值相关性分析进一步证实了星形胶质细胞中PABPC1的基因表达与AD风险之间的共定位(图4E),相关系数r=0.85P=1.19e72。变异rs1693551的参考等位基因为T,替代等位基因为C,该变异未在最新的GWAS研究中被鉴定为新的风险位点。但我们的分析显示,该变异超过了全基因组显著阈值,具体可见补充文件28号染色体的曼哈顿图(图S8)。此外,我们还观察到PABPC1基因表达与AD风险的共享致病变异在MetaBraineQTL数据集中也存在共定位(补充文件2:图S9)。MR 和共定位分析确定了星形胶质细胞中PABPC 1 基因表达与 AD 风险之间的因果关系。为了进一步探讨这种关系,我们检测了PABPC 1 在星形胶质细胞和星形胶质细胞亚型中的表达,以及其与AD 病理学、认知功能和AD 组的相关性。具体而言,我们利用了来自先前研究[ 20 ]的差异基因表达(DEG)结果,该研究侧重于 DLPFC 区域,并应用了多个测试校正。在附加文件:图S10 中呈现的发现表明,星形胶质细胞中的PABPC1 表达与感知方向显著相关,但与AD 诊断无关。此外,星形胶质细胞亚型GRM3 PABPC 1 的表达显示与缠结密度显著相关。

用于基因 PABPC 1 的 eQTL 和 AD 的 GWAS 信号之间共定位的 eQTpLotGWAS 数据集来自 Bellenguez 等人[ 4 ],星形胶质细胞的细胞类型 eQTL 数据集来自 Mathys 等人[ 20 ]显示含有 PABPC 1 基因的目的基因座,其中染色体空间沿水平轴沿着指示。纵轴上每个点的位置对应于该变体与 AD 关联的 值,而每个点的色标对应于该变体与 PABPC 1 表达关联的 值的大小。具有一致效应的变量使用蓝色标度绘制,而具有不一致效应的变量使用红色标度绘制。每个三角形的方向性对应于 GWAS 效应方向,而每个三角形的大小对应于 eQTL 数据的效应大小。 GWAS 分析的默认全基因组 值显著性阈值 5e用水平红线表示。显示 AD 内所有基因的基因组位置。描绘了所有 PABPC 1eQTL 变体的 LD 信息的热图,为了便于参考,在与图 和 相同的染色体空间中显示(R2 min = 0.1LD min = 10)。描绘了 PABPC 1eQTL 在 GWAS 显著性变体中的富集,而 和 描绘了 PABPC 1 和 AD 的 PGWAS 和 对于 E,分析仅限于效应方向一致的变量,而对于 F,分析仅包括效应方向不一致的变量。 一个前导变体在 和 中都有指示,并且两者也在 中标记。

携带AD 风险变体的增强子调节细胞类型特异性基因表达

我们的研究结果显示,某些基因(如PABPC1)仅在一种细胞类型中被鉴定为候选致病基因,而在其他脑细胞类型中未被发现。为探究SNP与基因表达的关系,我们分析了基因型依赖的表达模式,发现仅在星形胶质细胞中,PABPC1的表达量随基因型从TTTC再到CC呈逐步升高趋势(FDR=5.32×10⁻¹²)(图S11)。受同一SNP影响的邻近基因SNX31在星形胶质细胞中也表现出更强的eQTL关联(FDR=8.97×10⁻⁵²),相比之下,其在兴奋性神经元(FDR=0.017)和少突胶质前体细胞(OPCsFDR=0.00038)中的关联强度显著较低(图S12),这提示该位点可能存在星形胶质细胞特异性的调控机制。这一结果凸显了许多候选致病基因可能具有单一细胞类型特异性。为进一步理解这种细胞类型特异性效应,探究这些变异如何影响基因表达及潜在的调控机制至关重要。增强子是调控基因表达的基因组区域,其作用通常具有细胞特异性。既往一项研究[19]分析了人类脑细胞核中增强子和启动子的活性,发现与脑特征及疾病相关的遗传变异存在细胞特异性的增强子富集模式。为验证本研究鉴定的细胞类型特异性致病基因是否受细胞类型特异性增强子活性调控,我们分析了一个公开数据集(详见方法部分),该数据集包含各脑细胞类型的开放染色质区域ATAC-seq数据,以及活性增强子(H3K27ac)和启动子(H3K4me3)的ChIP-seq数据。

为精准识别与外泌体相关的ncRNA,我们采用WGCNA 算法对整合数据集的 ncRNA 数据构建基因共表达网络。Power选择结果如图5A 所示。共鉴定出17 个模块,模块间相关性如图5B 所示。其中,个模块与外泌体相关模式特征的量化指标 PEXS 呈强显著关联(图5C),部分模块内基因显著性(GS)与模块成员关系(MM)的相关性如图5D 所示。通过方法学中描述的筛选流程,最终确定10 个与外泌体密切相关的 ncRNA。这10 ncRNA 的表达与种典型外泌体标志物(TSG101HSPA8PDCD6IPFLOT2)的表达呈显著相关(图5E),且与我们注释的外泌体相关基因存在大量相关对(图5F),进一步支持这些ncRNA 与外泌体的关联性。绘制 ROC 曲线显示,PRKCQ-AS1 在整合数据集中对银屑病具有较高诊断价值(AUC=0.826,图5G)。尽管部分 ncRNA 的倍数变化较小,但整合数据集及三个子数据集中,这些ncRNA 在非皮损与皮损样本间的表达均存在显著差异(图5H,表S4)。如图所示,对于星形胶质细胞中的候选致病基因PABPC 1 SNX 31,相关的疾病变体是rs 1693551chr 8hg 19_位置:10675584 bp),其位于距离先前研究中鉴定的星形胶质细胞特异性增强子(chr 8hg 19_位置:101675643 - 101676301 bp)的边界仅59 bp [ 19 ]。考虑到其接近增强子边界,增强子区域可能延伸超出检测到的范围,特别是考虑到增强子的动态性质和当前检测方法的技术限制。图显示,位于PABPC 1 基因下游和 SNX 31 上游的该增强子仅在星形胶质细胞中有活性,由突出的H3 K27 ac 和 ATAC-seq 峰证明,而在其他细胞类型中没有活性。 这表明该变体可能通过细胞类型特异性增强子影响基因表达,这可以解释为什么PABPC 1 仅在星形胶质细胞中被检测为致病基因,以及为什么SNX 31 表达比其他细胞类型更受星形胶质细胞中该基因座基因型的影响。

5 UCSC Genome Browserhg 19)的脑细胞类型特异性染色质图谱。PABPC 1 的 H3 K27 ac 和 ATAC-seq 数据,显示活性增强子区域和对星形胶质细胞特异性的开放染色质,黄色垂直线标记相关疾病变体的位置,虚线方形显示活性增强子区域。

药物敏感性分析和药物/化合物预测

为了从我们的候选致病基因中鉴定可药物化的基因,我们基于先前的药物等级分类对它们进行分类。第层包括批准的药物和临床候选物的靶标;层包括具有已知药物样相互作用或与批准的药物靶标高度相似的靶标;层包括与药物靶标或关键可药用家族中的那些具有遥远相似性的蛋白质,如方法中所述。如附加文件:表S7 中所详述,我们鉴定了三种候选致病基因EGFRACE APH 1B 作为第层可药物化基因,以及三种基因GRNPRSS 36 CR 1 作为第层可药物化基因。根据先前的研究,剩余的候选致病基因未被归类为可用药基因。对于这些不可药物化的基因,我们使用EpiGraphDB 在同一PPI 网络中优先考虑潜在的替代药物靶点。 我们使用来自IntAct STRING 数据库的 PPI 网络直接鉴定了具有第层可药性的AD 相关相互作用基因,如附加文件:表S7 所示。图6 A 显示了按基因比率(与药物基因集重叠的靶基因的百分比)分组的药物。在每组中,药物按其调整后的值显著性进行排名。 结果突出显示,3-1-甲基吡咯烷-2-基)吡啶靶向的基因数量最多,有16 个靶基因,包括EGFRACEMAPK 1TNFRSF 1AEEF 2ADRB 2CD 4APPTFRCITGALPLD 1FYNPIK 3CARAF 1TP 53 和 VEGFA(附加文件:表S8)。在第二组中,地诺前列酮是最重要的药物,针对14 个基因。在第三组中,甲磺酸伊马替尼是最重要的药物,靶向13 个基因,其次是组胺。检测到甲磺酸伊马替尼是各组中最显著的药物。网络突出显示,第层可成药基因(如EGFR(被所有前10 种药物靶向)和ACE(被前10 种药物中的种靶向))是多种药物的直接靶点(附加文件1:表S8 和图6B)。此外,第层可成药基因CR1 直接被甲磺酸伊马替尼靶向。在该网络中,可成药和不可成药的致病基因用蓝色圆圈表示;相互作用基因以绿色圆圈呈现,药物化合物则以粉红色描绘(图6B)。网络的中心区域以药物和第层可成药基因为特征,表明存在直接靶向关系;而周围的组别代表相互作用基因和不可成药的致病基因,它们通过这些相互作用被间接靶向。这一可视化结果展示了前10 种药物在直接和间接靶向多个致病基因方面的作用及意义(图6B)。

潜在药物富集分析与基因-药物相互作用网络。 基于DSigDB 预测的前 10 种富集药物/化合物。说明富集药物/化合物与靶基因之间的连接的相互作用网络。蓝色圆圈表示本研究中鉴定的可药物化/不可药物化的因果基因,绿色圆圈表示与不可药物化的因果基因相关的可药物化的相互作用基因,粉色节点表示前 10 种富集的药物/化合物。

研究小结

研究鉴定出28AD候选致病基因,其中12个仅在细胞类型水平被检测到,9个仅在整体水平被发现,7个在两种水平均有检出。在19个细胞类型水平的候选致病基因中,小胶质细胞贡献的候选基因数量最多,其次是兴奋性神经元、星形胶质细胞、抑制性神经元、少突胶质细胞和少突胶质前体细胞(OPCs)。PABPC1作为新的候选致病基因在星形胶质细胞中被发现。具体而言,MR和共定位分析证实,星形胶质细胞中PABPC1的基因表达与AD风险存在因果关联。星形胶质细胞中PABPC1的表达与感知定向显著相关,且与 GRM3星形胶质细胞亚型中的缠结密度显著相关。此外,我们将这28个基因分为三个药物层级,并鉴定出可成药相互作用,其中甲磺酸伊马替尼是关键候选药物。总的来说,研究基于细胞类型水平和整体水平的分子证据,对AD的候选致病基因进行了系统的优先级排序。这种整合分析方法加深了我们对AD相关遗传变异分子机制的理解,也为 AD GWAS结果的解读提供了便利。

SMR、共定位和成药分析是本研究的亮点和高分基础,感兴趣的小伙伴可以学起来了!


【声明】内容源于网络
0
0
中科生信
中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
内容 580
粉丝 0
中科生信 中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
总阅读1.4k
粉丝0
内容580