大数跨境

【项目文章】WGS助力人类长寿关键基因组区域的鉴定

【项目文章】WGS助力人类长寿关键基因组区域的鉴定 Biolinker
2023-07-13
1
点击Biolinker,关注我们                                                     

2022年7月,中国科学院昆明动物研究所孔庆鹏研究组在Aging Cell(IF=7.8)杂志上发表了题为"Scrutiny of genome-wide somatic mutationprofiles in centenarians identifies the key genomic regions for human longevity"的文章,揭示关键功能区域的体细胞突变规避是百岁老人基因组的重要特征。该研究中的WGS测序服务由领克生物科技(昆明)提供。


文章导读




流行病学调查显示,百岁老人(Centenarians,CENs)在其非凡的超长寿命中保持相对健康,这表明他们有能力抑制动脉粥样硬化、冠状动脉疾病和阿尔茨海默病等严重的年龄相关疾病,但是这种生存优势的遗传基础在很大程度上是未知的。本文基于以下原因:1、体细胞突变积累是错误DNA复制或修复的结果,被认为是衰老和年龄相关疾病的重要驱动因素。2、体细胞突变率与物种寿命呈强烈的反比关系。3、使用全基因组扫描方法在长寿人群中仅鉴定出少量与长寿相关的种系变异,并通过生成和分析百岁老人(Centenarians,CENs)和年轻对照组(Young controls,YCs)的全基因组体细胞突变图谱来解决这个问题。





WGS实验设计


样本选择:The peripheral whole blood samples from 124 female participants, including 73 centenarians (CENs) and 51 younger controls (YCs).
文库构建:Whole genome
测序平台:Illumina HiSeq NovaSeq 6000 by Biolinker Technology Co., Ltd
数据产出:A total of 110,157 somatic single-base substitution (SSBS) mutations were identified in the 124 individuals

研究结果

▸CENs的体细胞突变和有害SSBS更少





C

作者对73名CENs和51名YCs的外周血样本进行全基因组测序,共鉴定出110,157个体细胞单碱基替代(Somatic single-base substitution,SSBS)突变,并且在该研究中鉴定的体细胞突变的空间分布和突变图谱与通过纠错测序方法获得的高度一致(图1a-d),在两组之间没有发现突变敏感性的差异(图1h)。总体而言,与YCs相比,CENs含有更多突变,YCs样本中观察到突变数量和年龄呈现正相关关系(图2a)。然而CENs的变异等位基因频率(Variant allele frequency,VAF)低于YCs(图1f),表明在CENs携带的体细胞突变比预期少。还通过FATHMM模型的功能分析和(Combined annotation-dependent depletion,CADD)估计了每个SSBS的危害性,发现CENs有害SSBS的比率显著小于YCs(图2b,c,图1g)。


Figure1.CENsYCs体细胞突变的可信度分析

(点击查看大图)


Figure2.CEN突变严重程度低于YC突变

(点击查看大图)


▸CENs和YCs基因组中体细胞的突变分布存在偏差

本研究确定了CENs和YCs基因组中体细胞的突变分布存在偏差,CENs在功能元件中含有较少的SSBSs(图3a)。CENs外显子的SSBS比率也明显低于YCs,但YCs外显子的SSBS比率随着年龄的增长而增加(图3)。同样,与YCs相比,CENs中非同义的SSBSs数量和比例也明显较低(图2d,e)。在基因富集的基因组区和转录活性区,CENs携带的SSBSs也明显较少(图2f–h,图4a),在人类必需基因中也观察到类似的结果(图2i)。由于大多数(99.18%)已鉴定的SSBS为非离子型,作者研究了SSBSs在预测调控区(分为五类:H3K4me3、H3K27ac、ENCODE cCRE、oRegAnno和Ensembl调控元件)的分布,发现CENs在这些区域比YCs含有更少的SSBSs(图4b)。

Figure3.CENsYCs中外显子突变的分布

(点击查看大图)

Figure4.被鉴定的体细胞突变在不同调控元件上的分布

(点击查看大图)


▸CENs的基因组区域高度保守

有趣的是,作者还鉴定了137个基因组区域(平均宽度:3587 bp),在YCs中易发生突变,但在CENs中高度保守(图5a和图6a)。在CENs和YCs之间,未观察到长寿人群特异的极度保守区域(CEN somatic mutation-free regions,CSM-FRs)的读取覆盖率差异(图6e)。进一步的分析表明,这些CSM-FRs不是随机分布的(图6b,c),但与基因组中的随机选取区域相比,在五个调控区域中的代表性显著过高(图7a,b,图8)。重要的是,与CENs体细胞突变簇区域相比,除ENCODE cCRE外,CSM-FRs在五个调控区域中的四个区域中代表性显著过高(图7c)。

Figure5.CSM-FRs的鉴定

(点击查看大图)


Figure6.CSM-FRsCSM-CRs的基因组分布

(点击查看大图)

Figure7.CSM-FRs优先位于关键基因组区域

(点击查看大图)

Figure8.位于调控元件的随机抽取样区域的分布

点击查看大图)


▸CSM-FRs包含更多的DSMs和突变的危害会更大

上述结果表明,CSM-FRs可能非常重要以至于一旦发生突变危害会更大,推测在CSM-FRs中观察到的任何体细胞突变更有害,或者鉴定出的致病性突变在CSM-FRs中发生的可能性比任何其他基因组区域高得多。事实上,通过研究位于CSM-FRs中的YCs突变,作者发现这些突变比CSM-FRs之外的突变可能更有害(图7d)。此外,基于DisGeNET数据库的疾病易感性突变(Disease susceptibility mutations,DSMs),发现CSM-FRs比随机基因区域和长寿人群体细胞突变簇区域(CEN somatic mutation cluster regions,CSM-CRs)包含更多的DSMs(图7e,图9)。观察到的含有DSMs的CSM-FRs的比例也明显高于任何其他随机基因组区域和CSM-CRs(图7f,图10)。有趣的是,富集分析显示,CSM-FRs中的基因在氰酸盐代谢途径和氰酸盐分解代谢过程中显著富集(p<0.05),其失调可能不可逆地破坏脂蛋白功能并导致心血管疾病(Cardiovascular disease,CVD),这与CENs中CVD发病率的降低相一致。

Figure9.位于随机选择的基因组区域中的DSMs数量

点击查看大图)

Figure10.CSM-FRs优先维持DSMs

点击查看大图)


▸DNA修复机制可以解释CENs特有的体细胞突变模式

为了研究CENs特异性SSBS分布的潜在因素,利用YAPSA方法对样本进行突变特征分析(图7,图11a)。结果显示,SBS5 and SBS40在CENs中更普遍(图11b,c),与DNA同源重组修复(Homologous recombination repair,HRR)失败相关的SBS3的比例在CENs中显著较低(图7h,图11d)。这些结果表明,CSM-FRs可能来自于CENs中不易出错的DNA修复机制,并且很可能是DNA修复热点(DNA repair hotspots,DRHs),正如最近所发现的,CSM-FRs优先位于DRHs中(图7i)。此外,CENs表现出较高的复制后修复途径活性(图11e)。综上所述,这种CENs特有的体细胞突变模式可以部分地用更有效的DNA修复能力来解释,这可能是与包括人类在内的各种物种的长寿和健康衰老相关的保守机制。

Figure11.突变图谱与特征分析

点击查看大图)

总结与展望


这项研究内容指出了在CENs存在大量无体细胞突变区域,且特别保守,对人类生存和健康至关重要,CSM-FRs富含基因调控区,并且可能通过CENs特异性增强的DNA修复能力在衰老过程中保持其完整性但是样本(CENs和YCs)均为女性,所发现的体细胞突变模式是否仅限于女性或也适用于男性有待进一步研究。未来利用高精度方法(例如,纠错双链测序和单细胞衍生群体测序)的研究可能有助于更精细地了解诱变在健康衰老中的作用。

BIOLINKER

领克生物致力于新一代高通量测序技术(NGS)的应用和推广、生信分析、临床辅助诊断、产前检测、转化医学研究等领域。

业务包括单细胞多组学测序、基因组重测序、外显子测序、WGBS、RRBS、转录组测序、LncRNA测序、miRNA测序、ATAC-seq、CUT&Tag、Hi-C、4C-seq、m6A测序等前沿技术服务、各类组学数据的个性化分析服务以及临床疾病的辅助诊断产前检测等。

感兴趣的小伙伴快来咨询了解吧!

END


编辑:唐欢


【声明】内容源于网络
0
0
Biolinker
领克生物是一家专业提供高通量测序技术服务、单细胞多组学以及定制化生信分析的生物技术服务企业。主营业务:BD平台单细胞多组学、10X多组学、新格元单细胞转录组、表观组学、三代测序以及定制化实验方案(农口+医口)等。
内容 34
粉丝 0
Biolinker 领克生物是一家专业提供高通量测序技术服务、单细胞多组学以及定制化生信分析的生物技术服务企业。主营业务:BD平台单细胞多组学、10X多组学、新格元单细胞转录组、表观组学、三代测序以及定制化实验方案(农口+医口)等。
总阅读11
粉丝0
内容34