大数跨境

【多组学】Nature(2023 IF:64.8)| 基因组与代谢组联合的mGWAS助力疾病研究

【多组学】Nature(2023 IF:64.8)| 基因组与代谢组联合的mGWAS助力疾病研究 丰信生命科学
2024-04-23
1
导读:中文题目:循环代谢生物标志物的全基因组表征期刊:Nature影响因子:64.8(2023 IF)发表时间:2024.03文章链接:https://doi.org/10.1038/s41586-024-



  文章简介

中文题目:循环代谢生物标志物的全基因组表征
期刊:Nature
影响因子:64.8(2023 IF)
发表时间2024.03
文章链接:https://doi.org/10.1038/s41586-024-07148-y

研究背景

人类基因与循环代谢物之间存在密切的关系。基因编码了蛋白质,而蛋白质是细胞内外的主要功能性分子。这些蛋白质在代谢途径中扮演着重要的角色,包括调节酶活性、携带分子、调控代谢途径等。因此,人类基因的变异或突变可能会影响蛋白质的结构或功能,从而导致代谢异常。
全基因组关联分析研究(GWAS)技术结合代谢质谱分析,已经发现了许多与循环代谢物相关的基因。这些基因可以影响血液中各种代谢物质的水平,包括脂质、脂蛋白、氨基酸等。基因组与代谢组联合的mGWAS已经为人类代谢的生物学提供了新的见解。这种对系统代谢的遗传决定因素的详细了解对揭示遗传途径如何影响生物机制和复杂疾病至关重要。人类基因和循环代谢物之间的关系是复杂而密切相互作用的,这些发现不仅有助于理解人类代谢的生物学基础,还有助于揭示代谢异常与疾病之间的关系。
样本来源:33个队列,136,016名参与者
关注表型:233种代谢物

研究结果

1.遗传学发现
33个队列、共计136,016名参与者,通过核磁共振光谱法定量测定的233种循环代谢特征的进行基因组范围关联研究。GWASmeta分析使用了高达13,389,637个常染色体单核苷酸多态性(SNPs)。在meta分析中,检测到所有233种代谢特征的基因组范围显著关联,表现出广泛的多效性和多基因性。并检测到与至少一种代谢特征相关的276个广泛区域。在276个区域内,发现了8,795个主导SNP-主导特征关联,对应于1,447个独特的主导SNP。使用连锁不平衡(LD)分析独立信号后,得出276个广泛区域涉及至少443个独立位点。遗传力结果显示,性状特征遗传力中位数为0.29,其中仅约四分之一由主导SNP解释,支持许多特征具有高度多基因性。
2.祖先分层分析
对南亚人群(五个队列,11,340名参与者)、东亚人群(一个队列,4,435名参与者)、芬兰人群(六个队列,27,577名参与者)和非芬兰欧洲人群(21个队列,92,664名参与者)进行了祖先分层分析,以研究关联结果在不同种族群中的普适性,并寻找额外的祖先特异性关联信号。为了进一步研究普适性,文章还将关联结果与非洲祖先小型人群(n=1,405)进行了事后比较。结果显示,各祖先群体之间的关联呈强烈正相关,表明关联结果在不同祖先群体之间具有广泛的可转移性。文章没有在任何祖先群体中发现新的基因组区域,除了meta分析中发现的276个区域,这表明未来研究将需要具有非欧洲祖先的参与者的大规模样本量。
3.UK Biobank 相关
UK Biobank(英国生物样本库)中的核磁共振数据能够在一个独立的人群中检测主导变异体与代谢特征之间的关联,并评估参与者特征和样本相关因素对关联结果的影响。在最多115,078UK Biobank的参与者中,有8,502个主导SNP-代谢特征对可以进行检验,其中5,442个(64.0%)在P < 5×10-8水平上关联,另有772个(9.1%328个唯一的SNP)在P < 1×10-5水平上关联。文章使用不同样本类型(血清,n = 90,223;血浆,n = 45,793)以及禁食(n = 68,559)和非禁食(n = 58,112)的队列进行进一步的分层分析,发现除了研究之间人群祖先之间的细微差异外,样本类型和禁食状态是结果不可复制的主要原因。因此,文章提出在解释代谢特征的GWAS结果和进行下游分析时需要认真考虑样本类型和禁食状态。
4.新基因和候选基因
该研究确定了231个与相关特征具有清晰生物学相关性的潜在致病基因。与之前的大规模核磁共振代谢组学GWAS相比,文章又发现了212个相关基因组区域。其中包括138个与脂蛋白、脂质和脂肪酸性状相关的新基因组区域,以及113个与非脂质性状相关的新区域。在先前与临床脂质相关的基因中,检测到了几个脂蛋白亚类测量与脂质酸盐的新关联。还检测到了与苯丙氨酸和谷氨酰胺等小分子相关的新基因。新的苯丙氨酸相关基因包括一个众所周知的代谢特征相关基因(FADS1–FADS2)和两个新的、生物学上合理的基因(GSTA2SLC2A4RG)。文章进行了广泛的手动整理,以确定几乎300个相关位点上高度可能的致病基因,为进一步理解这些基因和疾病的关联提供了有用的资源,并允许高置信度地确定与疾病关联的共定位的致病基因。
5.apoB变异的影响
为了揭示脂质基因影响脂蛋白代谢连续性的不同方式,文章对具有相似代谢关联特征的基因簇进行了表征。根据最近的研究结果,即apoB在冠状动脉疾病发病学中发挥主要作用,因此文章对具有与apoB有关的轻度证据(P <0.05)的134个基因进行了研究。后使用聚类方法对84个新的基因的代谢谱进行了分析发现,TRIM5的代谢特征与影响LDL胆固醇通过LDL受体摄取到肝细胞的基因吻合,表明TRIM5可能是降低具有促动脉粥样硬化作用的脂质水平(从而降低心血管疾病发病率)的潜在治疗靶点。
6.代谢性状变异与疾病
为了研究代谢特征相关变异在疾病中的作用,文章扫描了FinnGen研究(参与者达309,154人,共3,095个表型),这是一个将芬兰参与者的基因组信息与数字化健康医疗数据联系起来的数据集,以及已发表GWAS的编辑集合,包括PhenoScannerGWAS目录。在1,447个先导SNPs中 ,大多数(n=1,279)已被报道与特征或疾病有关的关联(P<5×10-8)。在FinnGen中,7个代谢特质相关基因与妊娠期内肝内胆汁淤积症ICP)风险相关(P < 5 × 10-8),但此次发现3个新基因(UGT8NUP153HKDC1)ICP风险相关。ICP相关基因通路分析显示,生物过程与胆汁酸、葡萄糖和脂质代谢有关,并且这些生物过程在ICP中是富集的,与代谢特征关联相一致。通过详细描述ICP相关基因与代谢特征的关联,文章将代谢关联信息与疾病关联结合起来以阐明目前知之甚少的疾病的代谢基础。
7.孟德尔随机化
双样本孟德尔随机化分析研究了20种非脂质性状的遗传预测水平与460Phecodes和来自UK Biobank52个数量性状的关联。确定了503个显著关联(P < 4.88 × 10−6),包括葡萄糖与糖尿病、肌酐与肾衰竭以及氨基酸与糖尿病之间的正关联。以及较少被表征的关联,包括遗传预测乳酸水平与子宫良性肿瘤之间的正关联。研究还发现,遗传预测循环甘氨酸水平与血压呈负相关,这得到了与高血压的强关联以及遗传数据的支持。这一发现暗示了甘氨酸水平与心肌梗死之间的逆相关可能存在中介因素。这些例子突显了在规模上将遗传学、代谢特征和疾病结果数据联系起来的价值,以识别代谢特征和疾病之间的新的因果关系。
综上所述,该研究使用大规模队列(33个队列,136016名参与者)进行分析,揭示了循环代谢标志物与遗传突变之间的关联,深化了对全身代谢遗传调控的理解。通过人工整理了几乎300个相关位点上高度可能的致病基因,为从生物学角度进一步理解基因和疾病相关性提供了重要资源。并利用脂蛋白和脂类相关变异的详细代谢特征来探究已知脂质位点和新位点对脂蛋白代谢的影响。文章可用结果的公开为社区检验代谢在各种疾病中的作用提供基础资源。


若需转载,请注明来源。














相关阅读











【声明】内容源于网络
0
0
丰信生命科学
内容 142
粉丝 0
丰信生命科学
总阅读61
粉丝0
内容142