新浪博客

CRISPR/Cas的起源和原理

2016-05-06 01:28阅读:
CRISPR是什么?基因编辑的工具。


那么它的工作原理是什么?基因编辑的工具那么多,为什么CRISPR最近特别火?要理解这些,我们必须知道CRISPR到底是什么,这样才能理解它的潜力所在。


你猜我是怎么知道CRISPR这名词的?我搜王力宏竟然发现了这个:
20160505-CRISPR/Cas的起源和原理
人家搞演艺的在那里大夸张峰和CRISPR,我竟然不知道这是个啥。。。。好歹我也算个爱生物爱科研的实验狗啊。不能忍!


首先让我们来认识一下CRISPR的大名:CRISPR: clustered
regularly interspaced short palindromicrepeats
(
规律成簇的间隔短回文重复)
。换句话说你就明白了:CRISPR就是重复的DNA序列,只是重复得有规律有性格,人家是回文序列。


人家CRISPR也不是到处都有,主要在大多数的古细菌(90%)和细菌(40%)中存在。它们是这些细菌的获得性免疫系统的一部分[1]。


等等,你说什么?!细菌有获得性免疫系统?!细菌明明是单细胞生物,哪里来的B细胞T细胞,哪里来的抗体免疫?!


冷静冷静,这里的获得性,最好理解为记忆。CRISPR的大名里面有俩字:间隔。也就是说这些重复的DNA序列之间是有别的东西,这些别的东西就很有来头,它们不是细菌自己的,是那些曾经感染过这些细菌的噬菌体留下来的,我们管他们叫Spacer,间隔DNA。当这些噬菌体感染细菌,细菌跟它打了一架,即使胜利了也可能大伤元气,总得总结经验教训以后少吃亏不是,所以他们就把这些噬菌体DNA的一部分截下来,放到自己的DNA里面留个记忆。可是敌人总是多多的有,噬菌体A挂了,还有噬菌体BCDF 。。。。 这么多教训要总结,做事总得有个条理,所以就有了这些CRISPR序列,用他们把不同的外源DNA分隔开。设想一个细菌的记忆库,里面是很多的小隔间,每个隔间里放着一段外来DNA,隔间之间的隔板相当于CRISPR序列。一旦有外物入侵,赶紧去记忆库里搜,要是发现敌人的DNA和记忆库里面有匹配的,对应的解决方法妥妥地有了,方便快捷。人类用抗体记忆病原表面蛋白特征,也有对应的抗体库,所以说CRISPR是细菌的获得性免疫系统的构成部分,是很有道理的。


到这里大家应该已经可以理解CRISPR所在的基因片断是这个模样:回文重复-外源DNA1-回文重复-外源DNA2-回文重复-外源DNA3-回文重复-外源DNA4-回文重复.。。大概就是这个鬼样子。但是还得额外加点东西:假设这些小隔间都处于一个大仓库里面,为了知道里面大概是什么东西,总得贴个标签好认路。所以最前面还得有个引导序列。因此CRISPR所在基因片断完整来看是这样的:引导序列回文重复-外源DNA1-回文重复-外源DNA2-回文重复-外源DNA3-回文重复-外源DNA4-回文重复。。。


可是大家一说CRISPR总会顺便带上个Cas啥的,这个Cas又是个什么鬼?!作为一个完整的免疫系统,总不能光写记录不干活吧。所以Cas就是负责干活的功能蛋白。编码Cas蛋白的基因一般就在CRISPR序列的附近,即与CRISPR相关联(CRISPR-associated),所以称为Cas蛋白。这些Cas蛋白通常都是DNA解旋酶啦,核苷酸酶啦,聚合酶啦之类之类的,总之要是外来的DNA跟小隔间里的DNA配对上,Cas蛋白就冲锋上阵,把外来DNA该解旋的解旋,该切割的切割,该降解的降解。


可是不要忽略一个问题:这细菌把来自于噬菌体病毒等的外源DNA​嵌到自己基因组里了,它会不会在那个位置把自己切了呀?答案是不会。因为细菌已经想好了办法,区分外面来的DNA和存在自己仓库小隔间的DNA。怎么区分呢?设想有两本一模一样的书,在噬菌体那里,完完整整,还有磁条;可是细菌拿到那本书以后,把磁条撕掉了。这样一来,两本书同时在细菌里面过机检测,只有从噬菌体来的那本书会搞到机子呱呱乱叫。在噬菌体或病毒的DNA序列里面,这个磁条就是一段只有几个核苷酸长度的DNA序列,称为PAM。在CRISPR系列里面,间隔DNA被称为Spacer,这个Spacer其实是来源于噬菌体或病毒的,也就是说它的原型(老家)在那边,所以噬菌体或病毒里跟Spacer一模一样的那段DNA被称为proto-spacer,即间隔原型序列。而PAM一般位于spacer附近,故称为“间隔原型序列邻近基序”(proto-spacer
adjacent motifs,PAMs)
。对于不同的细菌种类或Cas蛋白,PAM的序列会有所变化。PAM只存在于噬菌体或者病毒基因组里面,并且相对保守,所以细菌可以根据PAM可靠地认出外源DNA。PAM在细菌自己的基因组里面是没有的,因此不用担心切伤自己。


这样子就明白了,要有一个成功的免疫系统,你需要三样东西:在自身体内帮助记忆并认出外来DNACRISPR的序列,在外源物种体内用于区分敌我的特异保守的DNA短片段PAM,以及一些能发挥相应功能的酶Cas(通常不止一种)。所以一般并称CRISPRCas免疫系统。


那么具体怎么操作呢?
当噬菌体或病毒初次感染细菌(或者外源质粒输入),Cas功能蛋白识别PAM序列,截下一段DNA,并且将这段DNA插入到引导序列旁边,形成新的间隔序列和重复。比如原来是这样:引导序列回文重复-外源DNA1-回文重复-外源DNA2-回文重复-外源DNA3-回文重复-外源DNA4-回文重复。。。;加了新的就变成了这样:引导序列—“新回文重复-新外源DNA”-回文重复-外源DNA1-回文重复-外源DNA2-回文重复-外源DNA3-回文重复-外源DNA4-回文重复。。。这就是记忆存储的部分。
当噬菌体或病毒第二次感染细菌(或者外源质粒再次输入),细菌基因组会将CRISPR一众序列全部转导出来,形成pre-crRNA;
经过相应的Cas功能蛋白处理后,形成单个的crRNA,“回文重复-外源序列-回文重复”,这样没那么长,就可以轻松愉快赶紧去配对了;如果crRNA找到了配对的DNA序列,二者形成双链,同时Cas功能蛋白识别到PAM序列,确认外来病原再次入侵,那它们就会果断采取行动,把外源DNA切割,降解。。。各种处理让它们无法肆虐。

这样子就明白了,要做基因编辑,你需要三样东西:外源导入的用于识别目的DNA片段的类似CRISPR的序列,存在于目的细胞或动物基因组内用于帮助Cas蛋白特异性识别的DNA短片段PAM,和一些能发挥相应功能的Cas酶。因为Cas9这酶好用,所以常用CRISPRCas9基因编辑系统。


然后你就可以想到:可能限制这个系统的,应该就是PAM在目的细胞/动物的存在是否广泛,PAM是否能与目的基因片段搭配​,可使用的Cas蛋白与PAM的配合,Cas蛋白的功能单双链切割/修补。。。当然还有作用效率等等。


这些以后再说。写这么多,累。​来个总结图。来源自参考文献[1]。
20160505-CRISPR/Cas的起源和原理
参考文献:
[1]Horvath, P., & Barrangou, R. (2010).
CRISPR/Cas,
the immune system of bacteria and archaea. Science,
327
(5962), 167-170. doi: 10.1126/science.1179555​

我的更多文章

下载客户端阅读体验更佳

APP专享