大数跨境

在PrecisionFDA挑战赛中,PacBio HiFi Reads的表现优于其它测序技术

在PrecisionFDA挑战赛中,PacBio HiFi Reads的表现优于其它测序技术 基因快讯
2020-08-14
0
导读:HiFi reads的一份美丽答卷~


为了便于更好的推送PacBio相关的最新信息,欢迎您长按并识别左边二维码,添加企业微信联系人PacBio HiFi reads


在最近的PrecisionFDA 真实挑战赛V2中,使用PacBio HiFi Reads的方法在所有类别变异检测中均具有最高的精确度和召回率(图1)。PrecisionFDA 真实挑战,其目的是在一个共同的参考框架下评估不同生信分析流程以及不同测序方法对人类基因组中的变异检测准确性。本次挑战比较了在全基因组范围内,特别是在基因组中难以映射的区域以及片段重复和主要组织相容性复合体(MHC)中对变异检测的精确度和召回率。 


图1. PrecisionFDA Truth Challenge V2结果

在单一技术参赛结果中,使用PacBio HiFi数据(粉红色)在所有类别中,无论是全基因组范围(“所有基准区域”),是在难以映射的区域或是主要的组织相容性复合体(MHC)中均提供了最高的准确性。所有的多技术参赛结果(橙色)都使用了PacBio HiFi数据。“1-F1”是综合评估特异性和敏感性的指标;较低的值表示较高的精度。


本次PrecisionFDA 真实挑战赛共收到不同团队提交的64个分析结果:其中17个使用PacBio HiFi数据,24个使用Illumina数据,3个使用Oxford Nanopore数据以及20个联合使用多种测序技术。在最准确的26个分析结果中,有25个都使用了PacBio HiFi数据(12个是只使用HiFi数据,13个采用多种测序技术),分析结果的前12名全都在分析流程中使用了HiFi数据(3个只使用HiFi数据,9个采用多种测序技术)。


Google DeepVariant使用HiFi数据提交的结果在所有单一技术检测全基因组范围内的变异准确性最高,对SNV精确度和召回率可以达到99.9%,对插入缺失的精确度和召回率可以达到99.4%。与目前被广泛使用的GATK分析流程 + Illumina数据的组合相比,检测单核苷酸变异(SNV)和插入缺失的性能更好,总错误减少5.8倍。与ONT数据+ DeepVariant的组合相比总错误减少30.4倍


图2,不同分析流程和测序技术对变异检测的性能对比

Total errors – the sum of SNV and indel false positives (FP) and false negatives (FN) – in a DeepVariant callset from 35× PacBio HiFi read coverage (Sequel II System, Chemistry 2.0); a DeepVariant callset from 35× Illumina NovaSeq; a GATK 4 callset from 35× Illumina NovaSeq; and a PEPPER-DeepVariant callset from 60× ONT PromethION R9.4.1. Performance is measured with hap.py against the Genome in a Bottle small variant benchmark v4.2 used in the precisionFDA Truth Challenge V2.


关于PrecisionFDA 真实挑战赛


在人全基因组测序的背景下,生信分析流程通常依赖于先将测序reads或组装结果映射到参考基因组上,然后再识别变异(差异)。评估此类分析流程性能的一种方法是通过使用已经被充分测序和验证的数据集,例如由美国国家标准技术研究院(NIST)领导的Genome in a Bottle(GIAB)数据库中的7个人类标准参考基因组(https://www.nist.gov/programs-projects/genome-bottle)


直到最近,GIAB标准数据库还无法测量人类最困难的12%基因组中的变异检出准确度,其中包括许多医学上相关的基因。为了解决这个问题,GIAB为其中一个参考样本HG002发布了扩展的标准数据(v4),该基准数据涵盖了另外6.3%的基因组(图3)。 


图3. 升级后的HG002 v4基准,覆盖了比v3.3.2更多的GRCh38基因组区域


GIAB随后为另外两个样品HG003和HG004开发了扩展的标准数据。在发布这些标准之前,新的precisionFDA真实挑战赛V2被用于评估当前可用的变异检测技术。


图4. PrecisionFDA真实挑战赛采用盲法来评估不同分析流程对改进的HG003和HG004标准数据中变异的识别


PrecisionFDA 真实挑战赛提供了Illumina NovaSeq的短读长测序数据,PacBio Sequel II系统的HiFi数据,Oxford Nanopore的PromethION的HG002,HG003和HG004的长读长数据。邀请参赛者提交HG003和HG004的变异检测结果,然后根据尚未发布的这些样品的“真实”变异数据库进行对比评估。测量了针对整个基因组,难映射区域和主要组织相容性复合体(MHC)中SNV和插入缺失的变异检测准确性(图4)。


总结


PrecisionFDA真实挑战赛是评估变异检测方法的重要机会,它展示了PacBio HiFi数据如何提供更全面,准确的变异检测。我们希望看到研究人员未来如何将这种能力应用于寻找新的疾病基因并解决其他方法无法诊断的罕见疾病病例。



PacBio HiFi reads


为了更好的向您推送PacBio SMRT测序技术的最新进展,基因有限公司开辟了相应的企业微信账号“PacBio HiFi reads


长按并识别二维码添加“PacBio HiFi reads”为联系人,您将了解到有关高准确度长读长测序技术的最新进展,以及我们即将举办的线上线下活动







      基因有限公司作为PacBio公司在中国区的独家代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。







【声明】内容源于网络
0
0
基因快讯
基因生物技术国际贸易(上海)有限公司拥有仪器,试剂,市场与技术支持,售后等各部门组成的完整体系,是国内生命科学领域主要供应商之一,代理国际一流的高科技产品。积极利用公众号,进行最新资讯的共享,希望得到您的关注和支持。
内容 874
粉丝 0
基因快讯 基因生物技术国际贸易(上海)有限公司拥有仪器,试剂,市场与技术支持,售后等各部门组成的完整体系,是国内生命科学领域主要供应商之一,代理国际一流的高科技产品。积极利用公众号,进行最新资讯的共享,希望得到您的关注和支持。
总阅读445
粉丝0
内容874