大数跨境

5+!!“双样本/多变量孟德尔随机化(MR)+后全基因组关联研究(GWAS)多层级验证”的整合分析策略

5+!!“双样本/多变量孟德尔随机化(MR)+后全基因组关联研究(GWAS)多层级验证”的整合分析策略 中科生信
2025-12-08
4
导读:新颖选题“UHRF1BP1/SNRPC等→免疫调控/炎症反应→干燥综合征相关心血管疾病”,加上“多维度MR+后GWAS整合分析+组织特异性验证”,可以直接“抄作业”啦!

今天小编要和大家分享的这篇文章是20255月发表在《J Transl Med》(IF5.531)期刊上的文章《Post-genome-wide association study dissects genetic vulnerability and risk gene expression of Sjögren's disease for cardiovascular disease。以下是这篇文章的主要亮点,一起跟着小编来看一下叭~

亮点:该研究聚焦干燥综合征(SD)与心血管疾病(CVD)的遗传关联性,创新性采用双样本/多变量孟德尔随机化(MR+后全基因组关联研究GWAS多层级验证的整合分析策略,通过连锁不平衡分数回归LDSC遗传相关分析、贝叶斯共定位、全基因组关联研究多表型分析MTAG跨表型meta分析、基于功能摘要归因的转录组全关联研究FUSION-TWAS及基因组注释多标记分析MAGMA基因富集等多方法交叉验证,同时结合基因表达综合数据库GEO数据集的组织特异性差异表达基因(DEG)验证,不仅明确了SD对缺血性心脏病(IHD)和卒中的遗传易感性,还精准筛选出主要组织相容性复合体MHC区域内外的关键多效性基因,并关联潜在治疗药物,全程依托高通量数据整合与多算法校验,逻辑严谨且可复现,为自身免疫病与并发症的遗传机制研究提供了高效范式。

背景介绍

SD是一种慢性免疫炎症性疾病,发病率为每10万人6.92例,患病率为每10万人60.82例。该病主要累及女性,尤其以40-50岁女性为高发人群。SD可原发,也可继发于类风湿关节炎(RA)、系统性红斑狼疮(SLE)、系统性硬化症(SSc)等疾病,其典型表现为外分泌腺淋巴细胞浸润,并常伴有多种腺外表现。越来越多的观察性研究表明,无论是否合并其他风湿性疾病,SD患者发生心血管事件的风险均显著高于健康人群。例如,一项纳入大量SD患者队列的综合数据分析证实,SD患者的心血管疾病(CVD)发病风险升高。此外,研究发现SD患者更易出现血脂异常和高血压,这些因素可能增加该人群发生缺血性心脏病(IHD)等心血管事件的风险。长期随访研究进一步显示,Ro/SSALa/SSB自身抗体可使CVD发病风险增加3倍。这些研究结果证实了SDCVD之间的关联性,表明SD可能是心血管疾病的潜在独立危险因素。然而,SDCVD相关的具体发病机制,以及与抗Ro/La抗体相关的CVD遗传风险因素仍不明确。

本研究旨在通过MR分析和跨表型GWAS后分析,阐明SD与卒中、IHD等缺血性疾病之间的遗传关联。该方法不仅有助于明确两种疾病的因果关系,还能探索其共病的遗传基础,为开发靶向治疗药物和个性化治疗策略奠定基础,最终有望改善临床预后并提高医疗资源利用效率。

流程图

主要研究结果

1、LDSC

我们采用LDSC分析评估SDCVD结局之间的遗传力。SD和各类CVD的基于单核苷酸多态性(SNP)的遗传力处于可接受范围,其遗传力估计值()相对较高且统计学显著(h² P值具有意义),但SD的遗传力Z值(Z=2.51)低于推荐阈值4。利用GWAS数据进行的分析显示,SD与各类CVD之间的遗传相关估计值均具有统计学意义(遗传相关系数rg P<0.05)(图2)。

双样本MR分析中SD与心血管事件的因果关系。

2、SDCVD的因果关系

我们首先进行了双样本MR分析。采用标准聚类阈值筛选后,共鉴定出19个与SD显著相关的SNP。为确保工具变量的有效性,我们排除了8个与潜在混杂因素相关的SNPP<5×10⁻⁸或连锁不平衡系数r²>0.8),包括rs10174238SLE)、rs75782365(高密度脂蛋白胆固醇,HDL-C)、rs185466530(体重指数,BMI)、rs3093958(血压)、rs41423345RA)、rs9277476SLE)、rs150724213SLE)及 rs2004640RA)。排除后剩余11SNP作为SD的工具变量(IVs),分别为rs35948093rs2517830rs1056429rs72891915rs9469586rs79756150rs9366833rs1064994rs9277928rs62404122rs937033

如图2所示,逆方差加权(IVW)分析显示,SDIHD和卒中这两类CVD事件具有正向因果效应:IHD的比值比(OR)为1.0495%置信区间CI1.01-1.06P=9.78×10⁻³),卒中的OR1.1095% CI1.08-1.13P=5.22×10⁻¹³)。即使在Bonferroni校正(P<0.025)条件下,结果仍具有统计学意义。Cochran Q检验结果显示P>0.05,表明不存在显著异质性;最大似然法、加权中位数法及MR-Egger回归的分析结果与IVW结果一致(图2)。MR-PRESSO检验未在所有CVD结局中检测到水平多效性;逐一剔除分析进一步证实结果的稳健性,剔除任一与SD相关的SNP后,结果均无显著变化。此外,Steiger方向检验证实所有因果关系的方向设定正确。

在多变量MR分析中,控制混杂变量后,SDIHDOR1.0295% CI1.00-1.03P=0.03)和卒中(OR1.0395% CI1.02-1.05P=5.35×10⁻⁵)仍呈现一致的正向因果关联(图3)。同时,我们评估了SDCVD常见危险因素的因果效应,但未观察到显著关联。

多变量MR分析中SDCVD事件的因果关系

3、共定位分析

为进一步证实SDCVD事件之间复杂的遗传关联,我们基于选定的基因座区域(6号染色体,位置:3144264431942644)进行了共定位分析。结果显示,SD与卒中、SDIHD均存在共享因果变异,两者的最显著SNP均为rs3093958,其假设4后验概率(PPH4)分别为0.990.93(图2)。

4、跨表型荟萃分析

MTAG中,我们分别对SDGWAS数据(GWASₛₙ)与卒中的GWAS数据(GWASₛₜᵣₒₖₑ)、SDGWAS数据(GWASₛₙ)与IHDGWAS数据(GWASᵢₕₙ)进行了跨表型分析,最终得到四组MTAG表型对,分别为MTAGₛₙ₋ᵢₕₙMTAGᵢₕₙ₋ₛₙMTAGₛₙ₋ₛₜᵣₒₖₑMTAGₛₜᵣₒₖₑ₋ₛₙ,这些表型对将作为后续TWASMAGMA的输入数据。对于SD-卒中表型对,MTAGₛₙ₋ₛₜᵣₒₖₑMTAGₛₜᵣₒₖₑ₋ₛₙ共共享4487MTAG P< 5×10⁻⁸的变异位点;而对于SD-IHD表型对,MTAGₛₙ₋ᵢₕₙMTAGᵢₕₙ₋ₛₙ共共享519个此类变异位点。在跨表型关联分析(CPASSOC)中,SD-卒中表型对和SD-IHD表型对分别鉴定出13341个和13222SHet P< 5×10⁻⁸的变异位点。MTAGCPASSOC结果的高度重叠,凸显了MTAG分析结果的稳健性。

5、独立显著变异位点的鉴定与功能注释

MTAGCPASSOCGWAS中采用5×10⁻⁸的严格P值阈值筛选后,我们分别鉴定出38SD-卒中相关、37SD-IHD相关的独立显著变异位点。值得注意的是,SD-卒中与SD-IHD仅共享1SNP位点rs62397687。在鉴定出的非编码变异位点中,基因间区变异最为常见,占总SNP54.79%,提示这些变异可能发挥调控作用而非直接参与蛋白质编码功能。此外,相当比例的SNP位于非编码RNAncRNA)内含子区(16.44%)和基因内含子区(13.70%)。4SNP位点(rs1041981rs14597rs1766rs7383287)定位于外显子区,分别直接影响邻近基因LTAHCG26HLA-DQB1-AS1HLA-DOB,进而对疾病易感性产生重要影响。最终,从SD-卒中相关SNP中映射到100kb聚类区域内的19个邻近基因,从SD-IHD相关SNP中映射到15个邻近基因。所有这些基因均位于6p21.326p21.33位点,该区域是公认的免疫相关基因密集区。

6 、多效性基因与通路

鉴于基于邻近性的基因注释存在局限性,我们对MTAG的汇总结果进一步开展了FUSION-TWASMAGMA,以鉴定多效性基因(图4)。联合FUSIONMAGMA分析结果显示,UHRF1BP1SNRPC这两个基因是SDIHD共有的多效性基因,其本杰明-霍奇伯格(BH)校正后P值均< 0.05(表1)。此外,SD与卒中共鉴定出7个多效性基因,分别为UHRF1BP1SNRPCBLKFAM167AARHGAP27C8orf12FAM167A-AS1)及PLEKHM1。值得注意的是,UHRF1BP1SNRPCSD、卒中与IHD三者共有的多效性基因。

曼哈顿图。A基于MTAG结果的MAGMA曼哈顿图(以IHD为输入数据,表型对:IHD-SD);B基于MTAG结果的MAGMA曼哈顿图(以SD为输入数据,表型对:SD-IHD);C基于MTAG结果的MAGMA曼哈顿图(以卒中为输入数据,表型对:Stroke-SD);D基于MTAG结果的MAGMA曼哈顿图(以SD为输入数据,表型对:SD-Stroke);E基于MTAG结果的FUSION-TWAS曼哈顿图(以IHD为输入数据,表型对:IHD-SD);F基于MTAG结果的FUSION-TWAS曼哈顿图(以SD为输入数据,表型对:SD-IHD);G基于MTAG结果的FUSION-TWAS曼哈顿图(以卒中为输入数据,表型对:Stroke-SD);H基于MTAG结果的FUSION-TWAS曼哈顿图(以SD为输入数据,表型对:SD-Stroke)。

通过多效性SNPANNOVAR注释、FUSION-TWASMAGMA基因集分析,共鉴定出21SD-IHD共有的多效性基因和22SD-卒中共有的多效性基因。我们利用FUMA gene2function工具在54种不同正常组织中对这些基因进行了进一步可视化分析。结果显示,这些基因在小肠、EB病毒(EBV)转化淋巴细胞、脾脏、血液和肺等组织中高表达,表明它们主要参与免疫系统相关过程(图5A)。这一特征在HLA-DOBHLA-DQA1HLA-DQA2HLA-DQB1HLA-DRB5LTALST1BLKARHGAP27AIF1MICBUHRF1BP1等基因中尤为显著——这些基因在免疫应答通路中发挥关键作用,且在EBV转化淋巴细胞和脾脏中呈现显著高表达(图5B)。

利用分子特征数据库(MSigDB)共鉴定出401条校正后P值具有统计学意义的通路。图5C展示的15条最显著富集通路主要与免疫细胞活化相关,尤其涉及T细胞介导的免疫和白细胞黏附过程,这凸显了适应性免疫应答在这些疾病中的关键作用。通过GeneMANIA进行的网络分析显示,抗原加工、MHC介导的呈递过程,与支撑这些功能的细胞结构之间存在显著关联。共表达和物理相互作用占总网络的约77%,提示这些基因可能在相同的生物学过程、通路或细胞结构中协同作用。这种紧密的关联性强调了这些基因在免疫应答(尤其是抗原呈递和免疫细胞调控)中的协同作用(图5D)。

组织特异性基因表达差异、通路富集及基因间相互作用分析。A利用FUMA工具和基因型-组织表达项目(GTExv8数据集分析54种正常组织中的差异表达基因(DEGs);B利用FUMA工具和GTEx v8数据集分析54种正常组织的组织特异性基因表达差异;C通过基因本体论分子功能(GOMF)、基因本体论生物学过程(GOBP)、基因本体论细胞组分(GOCC)及京都基因与基因组百科全书(KEGG)分析,在分子特征数据库(MSigDB)中筛选出的15条最显著富集通路;D利用GeneMANIA工具进行的基因间相互作用及功能探索分析。

7、利用GEO验证差异表达基因(DEGs

为排除FinnGen数据库中其他免疫炎症性疾病重叠病例可能带来的混杂效应,我们利用RNA测序数据检测SD特异性DEGs,对本研究鉴定出的多效性基因进行验证。排除7个未检测到的非编码RNA基因后,共鉴定出27个目标基因。其中,26个差异表达基因在血液组织中得到验证(数据集GSE84844,图6A),23个在小唾液腺组织中得到验证(数据集GSE7451,图6B)。这些结果表明,多效性基因在SD不同组织中的验证率较高,与GWAS后分析结果一致,证实了这些基因与SD的特异性关联。该验证步骤有效降低了FinnGen数据中SLERA重叠病例带来的潜在混杂影响。

6 SD患者中已鉴定多效性基因的表达情况。A SD患者血液组织中DEGs的热图与火山图;B SD患者小唾液腺组织中DEGs的热图与火山图。

8、敏感性分析

基于既往已发表研究,从SDGWAS数据中提取了42SNP位点。其中,15SNP位点达到5×10⁻⁸的显著性阈值。采用严格的聚类标准(10000kb窗口内连锁不平衡系数r²<0.001)筛选后,鉴定出4个独立SNP位点,分别为rs11889341(对应基因STAT4)、rs3135394(对应基因HLA-DRA)、rs117026326(对应基因NCF1)及rs3757387(对应基因IRF5)。逆方差加权(IVW)分析显示,SD的遗传代理指标对包括IHD和卒中在内的CVD事件具有因果效应:IHD的比值比(OR)为1.0595%置信区间CI1.02-1.081P=9.41×10⁻⁴),卒中的OR1.0895% CI1.036-1.127P=3.15×10⁻⁴)(图7)。即使在Bonferroni校正(P<0.025)条件下,该结果仍具有统计学意义。

基于已发表研究鉴定的遗传代理指标,探讨双样本MR分析中SD与心血管事件的因果关系

本研究鉴定出4个独立SNP位点,分别代表MHC 类区域外的易感基因:rs62065377对应ARHGAP27PLEKHM1基因;rs7001675对应BLKFAM167AFAM167A-AS1基因;rs184242965对应UHRF1BP1基因;rs546271365对应SNRPC基因。采用Wald比值法进行MR分析显示,这些基因在SD患者中的预测高表达与IHD和卒中的发病风险增加显著相关(图8)。

SD-卒中的共定位分析结果显示,BLKFAM167AFAM167A-AS1基因(最显著SNPrs998683)、SNRPC基因(最显著SNPrs2744944)及UHRF1BP1基因(最显著SNPrs142415291)进一步强化了这些基因与SD及其并发症的关联性。然而,该分析未显示SD-IHD相关的UHRF1BP1SNRPC基因,或SD-卒中相关的ARHGAP27PLEKHM1基因达到预设的PPH3+PPH4>0.8阈值,表明这些基因与SD相关并发症的因果关系仍需进一步验证。

8 SD患者中MHC区域外多效性基因的预测表达与CVD风险的关联性

 9、降低CVD事件风险的潜在药物

基于SDCVD共有的多效性基因,我们通过查询药物-基因相互作用数据库(DGIdb)、药物银行(DrugBank)等数据库,直接筛选潜在治疗药物。在鉴定出的77种已获批药物中,多种糖皮质激素和改善病情抗风湿药(DMARDs)被证实具有降低SD及其心血管并发症风险的潜力,包括曲安奈德(作用靶点:HCG22基因)、依那西普(作用靶点:LTAHLA-BHLA-DRB1基因)、英夫利昔单抗(作用靶点:HLA-DRB1HLA-B基因)、巯嘌呤(作用靶点:HLA-DRB1HLA-DQA1基因)、硫唑嘌呤(作用靶点:HLA-DQA1HLA-DRB1基因)、托珠单抗(作用靶点:HLA-DRB1基因)、利洛纳塞普(作用靶点:HLA-DRB1基因)及卡那单抗(作用靶点:HLA-DRB1基因)。这些用于治疗炎症性结缔组织病的激素类或单克隆抗体类药物,均显示出降低CVD风险的潜在价值。然而,未来仍需通过进一步的通路分析和临床研究验证其疗效。

总结

本研究通过MR分析及GWAS后分析,系统评估了SDIHD和卒中风险的遗传易感性。单变量和多变量MR分析均显示SD与各类CVD存在显著关联,敏感性分析进一步验证了该结果的稳健性。LDSC分析表明SD与所有CVD之间存在显著遗传相关性;贝叶斯共定位分析显示SD-IHDSD-卒中之间存在多效性,特定基因座的假设4后验概率(PPH4>0.8。利用MTAGCPASSOC进行荟萃分析后,我们分别鉴定出38SD-卒中相关、37SD-IHD相关的独立显著SNP位点。MHC类、类和类基因是SDCVD共有的核心多效性决定因子,通路富集分析强调了抗原呈递和免疫应答过程的广泛影响。值得注意的是,排除MHC区域后,SNRPCUHRF1BP1两个基因的表达与SD患者IHD风险增加相关,而SNRPCUHRF1BP1FAM167ABLKC8orf12FAM167A-AS1)、ARHGAP27PLEKHM1七个基因的表达与卒中风险相关。共定位分析进一步证实,SD与卒FAM167ABLKC8orf12SNRPCUHRF1BP1基因座内共享显著SNP位点。利用SD患者RNA测序数据进行的DEG分析为上述结论提供了额外佐证。


【声明】内容源于网络
0
0
中科生信
中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
内容 580
粉丝 0
中科生信 中科生信是一家专业从事生物技术服务的公司,提供生物医学领域的定制化数据分析服务。公司业务有:二代测序平台、数据库搭建技术、测序个性化分析平台、以及生信分析定制化服务!致力于为客户提供“一站式”科研服务。
总阅读1.4k
粉丝0
内容580