大数跨境
0
0

基于三代测序的cfDNA检测

基于三代测序的cfDNA检测 Dr.X的基因空间
2023-12-06
1
导读:PacBio平台在cfDNA检测领域的应用

基于Pacbio的cfDNA测序及应用

写在前面的
之前的推送关于cfDNA测序及其甲基化检测的研究主要围绕NGS测序平台。但是之前的推文在介绍这些测序背景时已经提到尽管Bisulfite在cfDNA甲基化检测中扮演了非常重要的角色,然而其本身的理化性质又使得DNA易降解,并且这种降解偏向于先作用于为基因组上富含未甲基化的胞嘧啶区域,这种降解的偏好性一方面容易导致高估基因组其他区域的全局甲基化程度,另一方面容易造成无法量化地比较在不同Bisulfite处理手册下基因组甲基化差异。虽然大部分研究指出cfDNA分子通常在166bp左右,但是也有研究发现了长链cfDNA分子(long molecular of cfDNA)。或许是目前很多研究使用NGS平台开展cfDNA片段组学的研究,因此长链cfDNA分子很少进入人们的视野,但这并不代表着长链cfDNA分子一定是罕见的,或者也无法说明长链cfDNA分子一定没有在人类疾病发生发展中扮演重要的功能角色。长链cfDNA分子是否普遍存在,或者长链cfDNA分子是否可能与人类疾病的发生发展有关,是有必要探索的。

基于Pacbio的长链cfDNA分子检测技术建立

       如果说目前很少有长链cfDNA分子被关注是因为基于短读长(short-reads)的NGS平台限制,那么基于长读长(long-reads)的TGS测序平台或许可以打破瓶颈。随着三代测序的发展,Pacbio和Nanopore这两大三代测序平台已经广为人知,二者在植物学领域对多种复杂多倍体甚至是异源多倍体植物的T2T测序应用,组装并揭示了这些复杂的全基因组图谱。因此三代测序平台应用于发现长链cfDNA分子在理论上是可行的。果不其然,cfDNA领域的明星科学家卢煜明院士团队在前两年已经布局并建立了相关技术体系。该团队选择了Pacbio平台构建长链cfDNA的发现及特性表征的基础平台。之所以选择Pacbio测序平台是因为该平台在2018年的时候革新了一种基于环化共有序列(Circular Consensus Sequencing, CCS)的高准确性测序模式,并在2019基于CCS模式又推出了一种HIFI(High Fidelity reads)测序方案。这种测序方案的原理如下图所示

       首先利用发卡状的接头(Hairpin Adapter)和双链DNA模板,两个发卡状接头将双链DNA连接成哑铃状(Dumbell)的形态。此时选择具有超长读取活性的DNA聚合酶,由于这种DNA聚合酶可以合成的长度远远大于插入的核酸长度。因此DNA聚合酶可以沿着哑铃状的DNA一圈又一圈的读取合成碱基。哪怕这种DNA聚合酶不是100%保真的,但是由于在一圈又一圈的读取合成中,碱基识别错误随机发生的,那么对于同一位点,尽管不能保证每次都识别正确,但是只要能多次识别正确即可。所以通过反复读取的方式,Pacbio成功实现了兼顾单碱基识别准确性(大于99.8%的准确性)和读取长度的HIFI测序方案。

      该团队利用了Pacbio测序平台建立了cfDNA单分子实时测序(Single Molecular Real-time Sequencing)及分析技术,并将该技术应用于探索肝癌患者、乙肝携带者和健康人的长链cfDNA序列特征中。

       在具体探索三组队列的长链cfDNA序列特征前,该团队首先比较了三代测序平台输出的cfDNA序列特征和基于NGS测序平台输出的cfDNA序列特征的差异。可以明显从下图A看出,有相当高比例的NGS-cfDNA片段的长度在200bp以内,超过200bp的NGS-cfDNA片段比例出现陡降,超过400bp的NGS-cfDNA的比例几乎肉眼不可观察。相比之下TGS-cfDNA的比例在200~3kbp之间出现了均匀且相对平缓递减的比例分布。可以说明,的确存在300bp以上的cfDNA片段。确认好TGS-cfDNA的合理性及准确性后,该团队首先比较了健康人、乙肝携带者和肝癌患者大于1k的cfDNA比例。无一例外,NGS-cfDNA在三组中均没有超过10%,但是三组中均有超过10%的大于1kb的长链cfDNA。为了探索肝癌相关的cfDNA序列特征,作者首先分析了肝癌患者中全部cfDNA的体细胞突变(somatic mutation),并将全部肝癌患者的发生了癌源体细胞突变的cfDNA归为一组,将肝癌患者的未发生癌源体细胞突变的cfDNA归为另外一组。作者比较了两组cfDNA长度的差异。如下图C所示,癌症相关的大于200bp的cfDNA的比例低于非肿瘤的大于200bp的cfDNA的比例。

       紧接着作者比较了不同分组下的5’末端首位碱基在不同长度的cfDNA单分子中的比例差异。作者发现了一些共性结论:1.无论在什么样本中,500bp以内的cfDNA分子的5’-C-end比例最高,5’-A-end比例最低;2.500bp以上的cfDNA分子的5’-C-end比例开始伴随cfDNA分子长度的增加而降低;3. 2k以上的cfDNA分子的5’-A-end比例陡增。结合既往文献报道,DNASE1L3酶一般会切割产生5’-C-end的cfDNA,DNA片段化因子β亚基(DDFB)通常产生5’-A-end的cfDNA。因此作者推测,无论是否有肝癌,DDFB在产生5’-A-end的长链cfDNA分子中可能起到了关键作用。

总结

       作者通过Pacbio平台建立了SMART-long-Molecular-cfDNA测序技术,表征了长链cfDNA分子特征,并在肝癌患者、乙肝携带者和健康人中进行了应用。发现了无论是健康人还是病人,均存在长链cfDNA分子。一般情况下,在肝癌群体中长链cfDNA分子的长度短于健康人。而肿瘤患者体内被发现最长的肿瘤cfDNA为13.6kb。这个长度几乎达到了人类线粒体DNA(mtDNA)的82%。通过作者的研究发现肿瘤长链cfDNA的特征与健康人不同,并且长链cfDNA的产生过程中可能与DDFB等酶存在一些关系。总之,目前的发现对于理解长链cfDNA,指导肿瘤相关液体活检等具有重要意义

参考

  1. Pacbio Sequencing: https://ccs.how/

  2. Tse OYO, Jiang P, Cheng SH, Peng W, Shang H, Wong J, Chan SL, Poon LCY, Leung TY, Chan KCA, Chiu RWK, Lo YMD. Genome-wide detection of cytosine methylation by single molecule real-time sequencing. Proc Natl Acad Sci U S A. 2021 Feb 2;118(5):e2019768118. doi: 10.1073/pnas.2019768118. PMID: 33495335; PMCID: PMC7865158.

  3. Choy LYL, Peng W, Jiang P, Cheng SH, Yu SCY, Shang H, Olivia Tse OY, Wong J, Wong VWS, Wong GLH, Lam WKJ, Chan SL, Chiu RWK, Chan KCA, Lo YMD. Single-Molecule Sequencing Enables Long Cell-Free DNA Detection and Direct Methylation Analysis for Cancer Patients. Clin Chem. 2022 Sep 1;68(9):1151-1163. doi: 10.1093/clinchem/hvac086. PMID: 35587130.

写在后面的
其实作者的研究不仅只是建立了基于Pacbio的长链cfDNA测序技术,他们同时还建立了基于相同平台的cfDNA甲基化检测技术,同时也比较评估了不同肿瘤患者中长链cfDNA的甲基化特征。后续的推送会分享解读作者开发的基于Pacbio的cfDNA甲基化检测技术。


【声明】内容源于网络
0
0
Dr.X的基因空间
【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
内容 176
粉丝 0
Dr.X的基因空间 【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
总阅读0
粉丝0
内容176