生物砖BioBricks(1)
2016-10-15 17:52阅读:
背景
在现代的生物学研究中,需要设计各种部件,通过质粒转入到细菌或其它体系中进行复制、转录和表达。二十世纪末期许多研究人员就发现一个普遍性的问题,生物部件缺少标准化,给具体应用带来很多具体的问题。比如我们想把绿色荧光蛋白gfp基因转入到细胞中,除了编码序列(CDS)外,还需要在上游设计启动子(promoter)、核糖体结合位点(RBS),在下游设计终止子(terminator)。除了CDS外,其它序列有多种选择,不同的组合效率可能千差万别,对实验结果影响巨大。为了解决这个问题,生物学家就设想把生物部件(DNA序列)进行标准化,使得在应用时象使用电子器件一样方便组合。其中2003年MIT的Tom
Knight等人提出的生物砖(BioBrick)的概念现在被广泛应用。
所谓的生物砖是指的符合一系列有关使用限制性内切酶组装标准的DNA序列。简单地说,生物砖部件就是指这样一些功能DNA序列:它的序列中不含有特定的酶切位点,我们可以通过一套通用的实验方案进行拼装。换句话来说,它们是DNA水平上的乐高,任何人只要掌握拼接的实验方案都能达到同样的效果。除了组件(parts)这个最基础的层次外,不同的组件的特定组合可以发挥一定的功能,形成一个器件(device),不同的器件还可以相互组合完成更为复杂的任务。比如启动子、CDS、RBS、终止子等DNA序列都可以标准化为一个部件,它们组合可形成一个生物门或其它类型的器件,多个生物门器件又可以组合为完成负责“生物计算”的系统,称为基于回路(circuit)。因此生物砖的目标就是把DNA序列标准化,能够随心所欲地自由拼装。
生物砖标准化 (BioBrick RFC 10)
要了解生物砖的设计标准要求,首先要对部件组装的实验过程有所了解。这里先介绍Tom Knight提出的组装标准10 (BioBrick
RFC
10)。在这个标准中,一个最基本的部件(DNA序列)有三部分组成,功能序列本身,前缀(prefix)和后缀(suffix)。如下图所示。
Prefix Suffix 5' - GAATTC GCGGCCGC T TCTAGA G ...part... T ACTAGT A
GCGGCCG CTGCAG - 3' EcoRI NotI XbaI SpeI N
otI PstI
前缀为5‘端额外的DNA序列,共包含三段,分别为EcoRI的酶切位点GATTC,NotI酶切位点GCGGCCGC和XbaI的酶切位点TCTAGA。注意NotI和XbaI酶切位点之间还多了个碱基T,XbaI下游还多了个T。后缀为3‘端额外的DNA序列,同样地也包含了三个酶切位点,分别为SpeI(ACTAGT),NotI(GCGGCCG)和PsI(CTGCAG)。需要注意的是生物砖部件指的是不包括前缀和后缀的序列,前缀和后缀属于标准的一部分。在生物研究中,整个序列是放在质粒的环形DNA分子中。如下图所示,图中未标注的部分称为质粒的骨架。这个质粒DNA称为生物砖的载体(vector),把生物砖转运到细胞内。
5' - GAATTC GCGGCCGC T TCTAGA G ...part... T ACTAGT A GCGGCCG
CTGCAG - 3'-
|
|
|
|
|_________________________________________________________________________|
通过使用上述5种限制性内切酶,我们可以把生物砖的DNA进行选择性地在特定位点切割。(注意这些酶切开后并不是形成平切的切口,而是两条链错开的地方打开,形成粘性端。一个粘性端可以和另外一个互补的序列结合,再经过ligase的作用重新连接。这在下文拼装中发挥作用)因此标准化的第一个要素就是部件的序列中不含有这些酶切位点序列,从而保证序列本身不会被切割。
大家可以看到,前缀和后缀中间的酶切位点都是NotI,也就是说如果使用NotI酶来处理的话,部件的前后都会被切开。而使用其它5种酶进行反应时,只能切开一端。
生物砖组装
上面介绍了对一个部件的序列要求。这个标准的目的是使得部件组装时可以标准化。下文以两个部件的组装过程来说明基本原理。
上述标准10的组装方法有多种,有一种被BioBricks推荐使用的称为3A组装,它是three antibiotic
assembly(三种抗生素组装)的简写。生物器件和抗生素又有什么关系呢?这是为了筛选正确组装的细菌,实验上使用抗生素来除去不正确拼装的克隆。如果只有正确组装的质粒才具有对某种抗生素,如盘尼西林,的抗性。那么在组装之后,对混合的细菌体系施加该抗生素,那么只有含有目标质粒的细菌才能存活,其它细菌都被杀死。通过这个方法,我们可以直观地获得筛选结果,免去繁琐的分离纯化和测序的过程。如果两段DNA碱基数目差异不足200,凝胶电泳很难把它们分开。
由于这个原因,RFC10对转运部件的质粒骨架也有具体的要求。其中一个要素就是质粒骨架至少含有如下抵抗抗生素之一的标志物。换句话说,含有质粒的细菌要能经受如下一种抗生素。如果质粒含有Ampicillin和不超过一种其它抗生素的标志物也是可以接受的。
Ampicillin Chloramphenicol Kanamycin Tetracycline
对质粒骨架序列另外一个要素是测序中需要使用到的引物(primer)序列。这里不展开讲。
下图为3A组装方案的示意图(图来自parts.igem.org)。总的目标是把部件B0034和C0010组装成一个新的部件,使得B0034在左边(5‘端,即上游),而C0010在右侧(3‘端,即下游)。这两个部件分别在两个质粒的环形DNA中(下图第一行左侧和中间图),而组装后的部件要放在一个线性化的质粒骨架DNA中(下图第一行最右侧)。这三种质粒分别含有A、B、C三种抗生素的标志物。

图中的E、X、S和P分别表示为EcoRI、Xbal、SpeI和PstI的缩写(对内切酶本身和相应的酶切位点序列没做区分)。
组装的第一步:对含有B0034(蓝色)部件的质粒DNA使用E和S两种内切酶进行消化,获得-E-X-...part
B0034...S-的DNA片段(两端粘性);对含有C0010(绿色)部件的质粒DNA使用X和P两种内切酶进行消化,获得-X..C0010...S-P-片段;对线性化的待装载的质粒DNA使用E和P酶进行切割,获得含有E和P酶切位点的粘性端。
组装的第二步:把三种体系进行混合,使用连接酶(ligase)进行拼接。注意空载的质粒存在E酶右侧粘性端,B0034部件含有E酶左侧的粘性端,二者粘性端碱基互补,因此能拼接在一起。同样地,C0010右侧能和空载的质粒P酶粘性端互补,进行组装。
那么B0034部件右侧和C0010左侧能顺利连接吗?它们对应着不同酶切位点切后的粘性端。SpeI酶切示意图如下所示(注意这里给出的是双链序列)。

XbaI的酶切示意图如下所示。

B0034部件被S酶切割后留下的粘性端为:
5‘-A
3’-TGATC
C0010部件被X酶切割后留下的粘性端为:
CTAGA-3'
T-5'
因此,两个粘性端也是互补的,它们相互结合后通过连接酶也能拼接在一起。
组装的第三步:施加抗生素C,原有含有A和B的质粒细菌被杀死,只有含有正确组装的部件的细菌才能存活。(空载的C质粒DNA是线性化的不能被连接酶拼接)
上述的组装方法有两个特点:一是组装后的新部件同样保持着相同的前缀和后缀,可以再使用同样的方法再和第三个部件进行组装。这种性质称为idempotent(这是数学上常见的一个词,指的是某种算子作用于某个对象后结果不变,f(f(x))
=
f(x),这里结果指的是前后缀的序列不变)。第二个特点是两个部件组装后,中间多了一段序列5'-ACTAGA-3'。这个称为伤疤(scar),即上图中的M标记处。如果要拼装的部件一个或两个都是编码序列(CDS),那么这个多出来的序列可能带来严重问题。ACTAGA对应的氨基酸为苏氨酸(threonine)和精氨酸(arginine,Arg,R)。Arg是个带正电的氨基酸,这个额外的精氨酸可能会对组装后的序列表达出来的蛋白性质和结果造成重大影响,如不能折叠为正常的二级结构。这是RFC10标准的缺点,如何解决这个问题呢?