大数跨境
0
0

前沿 | 张锋团队重磅《科学》!发现188个新型CRISPR系统,基因编辑有望迎来新突破

前沿 | 张锋团队重磅《科学》!发现188个新型CRISPR系统,基因编辑有望迎来新突破 药明康德
2023-11-29
0
导读:学术经纬
▎药明康德内容团队编辑  

30年前的西班牙阿利坎特大学,一位读博中的年轻人Francisco Mojica正在研究来自当地海滩的耐盐性古菌。在一种古菌的DNA序列中,Mojica注意到一个难以解释的奇怪现象:一段长30个碱基的片段会以相同的间隔规律性地重复。在那之后,经过十年的研究,Mojica终于揭开了这种重复序列的功能:作为古菌与细菌的“免疫系统”,这些序列能记住噬菌体的遗传特征,从而抵抗后者的感染。这些序列有一个我们无比熟悉的名字:CRISPR

Mojica的这一发现并没有立即得到认可,他的成果被多家学术期刊拒稿,最终发表在一本影响力不高的期刊Journal of Molecular Evolution上。但很快,科学界意识到了CRISPR的重要潜力,后面就是我们熟知的故事了。2012年,Emmanuelle Charpentier教授和Jennifer Doudna教授发表了CRISPR-Cas9基因编辑系统,利用Cas9核酸内切酶实现了特定位点对DNA的精准切割;不到一年后,张锋教授团队首次将CRISPR-Cas9基因编辑系统改进并应用于哺乳动物和人类细胞。今天,CRISPR已经成为改写生物学研究与疾病治疗的革命性工具

不过,科学家们并不满足于此,他们仍在挖掘CRISPR系统的更多潜力。在最新一期《科学》杂志上,MIT、Broad研究所的张锋教授团队就与美国国立卫生研究院的Eugene Koonin教授合作,借助其开发的全新算法,从数十亿个蛋白质序列中发现了188个此前未知的新型CRISPR相关系统,并且可能将CRISPR系统的类型拓展至7大类。这一发现进一步证实CRISPR系统的多样性,并且有望带来新型基因编辑工具。


近些年来,通过对蛋白质序列数据库的计算检索,CRISPR工具箱在近年间已经得到了大幅扩展。到目前为止,科学家们已经鉴定出了6类CRISPR系统,依次命名为I-VI。其中,基因编辑中最常用的CRISPR-Cas9系统就属于II型。

我们知道,CRISPR系统包含两个重要组成部分:识别并结合噬菌体DNA或RNA的向导RNA,以及在向导RNA指示的位点切割或干扰遗传物质的酶。这些不同类型的CRISPR系统使用不同的酶,其识别、结合与切割遗传物质的方式也各不相同。

但这还不是CRISPR系统的全部,一些未知的新系统很可能藏在自然界某些罕见的细菌或古菌中。新型CRISPR系统的发现有望推动生物技术的进一步发展,并且帮助开发更加安全有效的基因疗法。然而,要挖掘包含数十亿蛋白质、以指数增长的数据集,传统的算法显得力不从心。

为了在自然界找到更加多样的CRISPR系统,在最新研究中,研究团队开发了一款名为FLSHclust(意为flash clust)的全新算法。

FLSHclust算法示意图(图片来源:参考资料[1])

FLSHclust是一种基于序列相似性,利用大数据对蛋白质进行聚类的算法。FLSHclust可以对公开数据库中的基因序列进行分析,这些数据包含了收集自南极湖泊、狗的唾液、啤酒厂等广泛来源的细菌与古菌。最终的数据库包括80亿个蛋白和1020万个CRISPR阵列。通过寻找相似但不完全相同的序列,研究将其分为约5亿个簇,从宏基因组数据库中寻找CRISPR相关基因。

相比于已有的工具方法,FLSHclust可以快速高效地分析海量的蛋白质序列数据库,在数周内探索数十亿的蛋白质和DNA序列,而同样的工作在此前需要几个月时间才能完成。

利用FLSHclust,研究团队从数十亿个蛋白质序列中发现了大约13万个与CRISPR相关的基因,其中188个属于此前未知的新型CRISPR相关系统。

CRISPR-Cas9系统(图片来源:药明康德内容团队)

在188个新型CRISPR相关系统中,研究团队对其中4种进行了进一步的详细介绍。他们发现,这些CRISPR系统可以通过各种策略来攻击噬菌体,包括解开DNA双螺旋,以及通过允许基因插入或删除的方式切割DNA。

具体而言,在4个得到详细研究的CRISPR系统中,首先是两个I型CRISPR系统的新变体。这两个I型系统包含了插入Cas蛋白不同亚基(Cas8和Cas5)的HNH核酸酶结构域,因此分别被命名为Cas8-HNHCas5-HNH。研究显示,这两个系统均能进行精准的DNA双链与单链剪切。它们使用的是32个碱基对的向导RNA,相比于常用的Cas9系统的20个核苷酸向导要更长,因此有潜力用于开发更精准、不易脱靶的基因编辑系统。研究还证实这两个系统都可以应用于人类细胞的基因组编辑,其中Cas8-HNH还具有高度特异性。这些I型CRISPR系统的另一个优势是,由于大小与CRISPR-Cas9相似,因此或许可以利用已有的递送技术,将其递送至动物或人类细胞中。

研究发现了多个此前未知的CRISPR-Cas系统(图片来源:参考资料[1])

另一个新发现的CRISPR系统是IV型的DinG-HNH。在这个系统中,HNH核酸酶结构域插入了CRISPR相关的DNA损伤诱导基因G(DinG)样解旋酶。研究团队发现,该系统表现出RNA引导的PAM依赖性双链DNA降解,这需要DinG-HNH蛋白的三磷酸腺苷水解以及HNH核酸酶功能。

以上3个全新CRISPR系统的发现表明,通过对Cas蛋白组成与子域的模块化替换,CRISPR系统能够实现演化。除此之外,研究还发现了一个不同于已知CRISPR类型的候选VII型系统,包括一个小型的Cas7-Cas5效应系统,以及一个包含b-CASP结构域的独特干扰蛋白。该系统可以精确靶向RNA,从而用于RNA编辑。

作者表示,寻找全新类型的CRISPR系统愈加困难,VII型以及其他尚未被确定的类型,在自然界都是极其罕见的。从新发现的CRISPR系统中,我们看到了用于哺乳动物细胞编辑,以及用于诊断、记录细胞内活性的潜力。这项研究展示了CRISPR前所未有的多样性与灵活性,随着数据库的增长,还可能有更多罕见的系统有待发现。

封面图来源:张锋教授实验室主页
参考资料:
[1] Altae-Tran, H. et al. Uncovering the functional diversity of rare CRISPR-Cas systems with deep terascale clustering. Science (2023). DOI: 10.1126/science.adi1910
[2] Search algorithm reveals nearly 200 new kinds of CRISPR systems. Retrieved Nov. 24, 2023 from https://mcgovern.mit.edu/2023/11/23/search-algorithm-reveals-nearly-200-new-kinds-of-crispr-systems/
[3] ‘Treasure trove’ of new CRISPR systems holds promise for genome editing. Retrieved Nov. 24, 2023 from https://www.nature.com/articles/d41586-023-03697-w

▼细胞和基因疗法科学讲座
点击图片立即观看

本文来自药明康德内容微信团队,欢迎转发到朋友圈,谢绝转载到其他平台。如有开设白名单需求,请在“学术经纬”公众号主页回复“转载”获取转载须知。其他合作需求,请联系wuxi_media@wuxiapptec.com。


免责声明:药明康德内容团队专注介绍全球生物医药健康研究进展。本文仅作信息交流之目的,文中观点不代表药明康德立场,亦不代表药明康德支持或反对文中观点。本文也不是治疗方案推荐。如需获得治疗方案指导,请前往正规医院就诊。


更多推荐






点个“在看”再走吧~

【声明】内容源于网络
0
0
药明康德
全球领先的新药研发赋能平台,致力于帮助任何人、任何公司更快、更好地研发新医药产品,探索无限可能
内容 2479
粉丝 0
药明康德 全球领先的新药研发赋能平台,致力于帮助任何人、任何公司更快、更好地研发新医药产品,探索无限可能
总阅读993
粉丝0
内容2.5k