基因编辑工具 ▎CRISPR-Cas的发现之旅

CRISPR结构广泛存在于原核生物基因组中,在真核生物中尚未见报道。该结构由高度保守的短重复序列和各不相同的间隔序列组成,其中重复序列多具有回文特征,而间隔序列往往来源于病毒、质粒等外源遗传因子(图1)。Cas蛋白的编码基因往往形成一个cas操纵子,与CRISPR结构在原核基因组上偶联存在。当一个基因组中含有多个相同类型的CRISPR结构时,cas操纵子往往在其中一个CRISPR结构的附近。Cas蛋白和CRISPR结构经过长期的共同进化,形成多种多样的CRISPR-Cas系统。

 

R. repeat,重复序列;S. spacer,间隔序列

CRISPR结构最早被发现于1987年,然而这种特殊的重复序列结构当时并未引起足够的重视。直到2007年,CRISPR-Cas的免疫功能被证实,人们才开始认识到这是一种新型的微生物免疫系统。而CRISPR系统真正成为整个生命科学领域关注的焦点,是从2012年CRISPR被开发为一种新型的基因编辑工具开始。这一工具由于具有高效、特异、设计简单等显著优势,迅速成为21世纪最受关注的分子生物技术之一。

CRISPR系统的发现历程

 

1987年,日本学者Ishino及其同事在研究大肠杆菌中负责碱性磷酸酶同工酶转化的iap基因时,发现其下游存在一连串29bp的正向重复序列。有意思的是,这些重复单元之间均被32bp的非重复序列间隔开来。这是对CRISPR的最早报道。

1993年,Mojica等在一株名为地中海富盐菌的嗜盐古菌中发现类似的重复序列。1989~2000年,这种间隔重复序列陆续在更多的细菌和古菌中被发现。2000年,Mojica及其同事通过生物信息学分析,在已测序的基因组数据库中发现这类重复序列在细菌和古菌中广泛存在,并描述了其结构特征,从而使科学家们意识到这类重复序列可能在原核生物中具有重要的生理功能。因此,Mojica是CRISPR早期研究的重要推进者。

2002年,荷兰学者Jansen等通过生物信息学分析总结了这类重复序列的特点。尤其重要的是,他们发现了与这类结构偶联存在的特征蛋白Cas,这些蛋白质大多为核酸相关蛋白,且只有在CRISPR结构的基因组中存在。在与Mojica讨论后,他们正式将该系统命名为CRISPR-Cas系统。虽然这些系统的功能尚不确定,他们依据Cas蛋白多为核酸相关蛋白的特征,推测该系统可能与DNA复制、修复等生理过程相关。

2005年,Mojica带领的研究团队首先发现CRISPR的许多间隔序列与病毒DNA、接合转移质粒等外源遗传因子具有很高的同源性,因此推测该系统可能与抵御病毒(质粒)入侵有关;紧接着,Pourcel和Bolotin的研究团队也各自独立报道了类似的发现。另外,科学家们发现CRISPR结构可以发生转录,病毒无法侵染含有其同源间隔序列的古菌细胞等,这些现象暗示CRISPR系统可能基于核酸间的Watson-Crick碱基匹配性抵御病毒等外源遗传因子的入侵。虽然这些初期的探索性工作尚未证实CRISPR系统的免疫功能,但它们为后人的研究指明了方向。

2007年,CRISPR的研究取得了重要突破。由法国Horvath研究组领衔,Barrangou为第一作者,报道了一株用于酸奶发酵的嗜热链球菌从烈性噬菌体获得新的间隔序列后可以产生对该噬菌体的特异性免疫,从而首次实验证实了CRISPR-Cas系统的适应性免疫功能。

2008年,荷兰Wageningen大学(瓦格宁根大学)van der Oost研究团队的Brouns等在研究大肠杆菌I-E型CRISPR系统时,发现CRISPR结构的转录本会被CasE蛋白切割成大量crRNA小分子,每个crRNA携带一个间隔序列RNA作为向导序列,指导Cas蛋白切割与其具有同源序列的噬菌体。该实验还发现,无论间隔序列RNA靶向目标DNA的转录模板链还是编码链,都可导致干扰过程的发生,因此推测CRISPR免疫的靶标分子是DNA。

2010年,Moineau实验室对嗜热链球菌Ⅱ型CRISPR系统进行了深入研究,确定了该系统在外源质粒双链DNA上精确的切割位点,并且研究表明Cas9是介导靶序列切割所需的唯一蛋白质。因此,截至2010年,人们对CRISPR-Cas系统免疫功能的一般机制已有了基本认识,并开始利用该系统发展微生物应用和研究的相关技术。

 

2011年,瑞典的Charpentier实验室对酿脓链球菌Ⅱ型CRISPR-Cas系统进行了更加深入的研究,发现了在crRNA加工过程中一个关键的RNA组分——反式激活crRNA,简称tracrRNA。tracrRNA与重复序列RNA存在部分序列匹配,因此可以在Cas9的帮助下招募RNaseⅢ加工并产生成熟的crRNA。这两个实验说明重建CRISPR核酸酶系统至少需要Cas9蛋白、成熟crRNA及tracrRNA。

2012年,Charpentier和Doudna实验室合作,发现体外实验中嗜热链球菌或酿脓链球菌纯化的Cas9蛋白可被crRNA引导切割靶标DNA。Silksnys实验室也独立发表了类似的结果。此外,Charpentier和Doudna实验室还对该系统进行了简化,她们将tracrRNA与crRNA嵌合成一条单链向导RNA,只需sgRNA和Cas9蛋白两个组分即可靶向特定的序列,并指出这将是一种重要的基因组编辑技术。

 

2013年,张锋实验室和Church实验室几乎同时将该技术应用于真核生物的基因组编辑。张锋实验室采用嗜热链球菌或酿脓链球菌的Ⅱ型系统,发现Cas9蛋白在sgRNA的引导下可以在小鼠和人类基因组中实现靶向切割。当提供外源供体时,还可以通过同源重组过程精确编辑靶位点。此外,当在CRISPR序列上添加多个引导序列时,该系统同时编辑哺乳动物基因组的多个位点。Church实验室也采用Ⅱ型系统编辑人类基因组,得到类似结果。这两篇文章开拓了CRISPR基因组编辑技术编辑真核生物细胞的新时代。此后,CRISPR-Cas9系统迅速被全球各个实验室用来对各种生命体进行基因编辑。其中许多开放的资源平台,如Addgene,以及许多在线用户论坛为Cas9技术的推广起了很好的推动作用