[转载]怎样解析难结晶蛋白的结构?
2016-09-17 22:13阅读:
时至今日,蛋白结晶还存在许多问题,制约着蛋白结构测定的速度。去污剂的种类,是问题之一。我们看下面的帖子:
我的晶体总是先出沉淀,再出晶体。
结晶条件是 14%PEG2000,pH6.0,0.2M
LiSO4,0.5%w/v LDAO,5% glycerol
加入LDAO之前没有沉淀,但晶体核多且很难控制,晶体往往长得很小,容易孪,后搜索additive
kit后发现LDAO加入后晶体形状大大改善,但每次都是点完很快就出沉淀,48h后开始出核,72h后就可以看到比较大的六棱柱晶体(如图)但由于晶体是从沉淀里出来,捞的时候很难清理干净,衍射质量也并不好,分辨率在上海最高只能达到3.5埃。
LDAO(十二烷基二甲基氧化胺)是一种detergent
请教各位高手,是否有用过LDAO或类似detergent的,加入detergent后出沉淀该如何控制?有没有跟LDAO类似的添加剂可以尝试?
计算后发现晶体溶剂含量在50%~60%,但试过脱水后效果不太好,晶体表现出现裂缝。
现在能想到的是降低蛋白和沉淀剂的浓度,试一下接种。
请问各位有没有好的建议?先谢。
根据detergent结构选择相似的再尝试
下面的办法,是绕过全分子难结晶的困境。
2007年的一个帖子:
本来也许应该放在最后的,但是我决定还是写在最前面的。
我想告诉大家,通过这次journal club,大家可以学到什么
.
如果你对结构生物学一无所知:
通过这篇文章,你应该知道,结构解析有两个方法
NMR:用于解析比较小的蛋白,小于25kD,比较快速、简单。
复合物,大的蛋白:比较适合用晶体结构、共结晶。
如果你稍微懂一些结构生物学:
通过这篇文章,你可以知道蛋白结构解析的瓶颈是如何得到可溶蛋白,
通过FPLC可以很简单就可以知道两个蛋白是不是相互作用。
如果你比较了解结构生物学:
你只要知道有一种可以得到可溶蛋白的新方法就可以了。
anyway,希望每一个读到这篇文章的人,都可以得到自己的收获。
首先我们来看看这篇文章,是nature structure(全称NATURE STRUCTURAL & MOLECULAR
BIOLOGY)上的一篇文章。nature structure 差不多是结构生物学领域最好的一篇杂志,影响因子12左右。
全文应该非常容易找到。
先简要介绍一下这篇文章。
这篇文章的主要内容或者亮点吧
1、提出了一种用于在一个全长蛋白中寻找可溶片段的方法。(ESPRIT)
2、第一次用这种方法得到了禽流感病毒RNA聚合酶亚基PB2中最C端的一个可溶片段。并用NMR方法解析这个这个片段的结构。并且用细胞生物学方法研究了这个片段in
vivo的定位。
3、用晶体方法得到了这个片段和一个核孔运输蛋白的复合体的结构。
这篇文章所要研究的一个蛋白是禽流感病毒RNA聚合酶中的一个亚基PB2.
RNA聚合酶是禽流感病毒中非常重要的一个蛋白,含有三个亚基PA, PB1
and PB2。
它在病毒的生活史中有两个方面的功能:
1、转录病毒基因组中所编码的蛋白。
2、复制整个病毒基因组。
正因为禽流感危害较大,这个蛋白又非常的重要,所以研究的特别的多,本文所研究的是PB2亚基,大小为759个氨基酸。
目前在世界各地所采集的许多禽流感病毒株中,发现了很多的点突变,这些突变造成的巨大的危害之一就是能够是禽流感病毒,可以更换宿主,或者说能够让它感染哺乳动物,包括人。所以大家都很想弄清除的这些点突变的作用机理是什么。其中有些重要的点突变就是在RNA聚合酶的PB2亚基中。但是这些点突变的机制很难研究,因为到目前为止还没有可用的原子结构。
这是因为:一直得不到可溶的RNA聚合酶的亚基。没有了可溶的蛋白,就无法利用NMR或者X-ray晶体衍射解析其蛋白结构。
因为得到可溶性的蛋白,是蛋白解析结构的前提。无论是NMR还是x-ray都首先需要的到可溶的蛋白。既然PB2的全长无法得到可溶表达,那么很多人都会想到克隆表达全长蛋白中的一个domain或者片段。但是由于目前关于禽流感RNA聚合酶生物信息学的知识非常的匮乏,无法用软件预测PB2全长蛋白中的domain的位置。
怎么办呢?
ESPRIT:翻译过来就是:(通过)随机增加末端切掉片段表达可溶蛋白。
通过名字我们也能猜出这种方法的含义:既然我们不知道全长蛋白中,哪一段单独表达会是可溶的,就只能通过随机的方法来寻找。我们可以从一个全长蛋白的N端或者C端(本文用的是从N端)随机的减掉一个AA,这样把任何一个可能都尝试了,就有可能找到可溶的片段。
PB2全长是759个AA,那么我们从N端一个一个切,那么我们如果得到759个construct就可以包括所有的可能了(C端也同样,但是本文没有做)。
理论上我们可以通过PCR实验,设计不同的引物,应该也可以实现,但是这样无论成本、劳动力都太大了。本篇文章用的就是一个创新的方法。
简单的描述一下:
就是首先将PB2基因查到PGEX中,然后用一种限制性酶切酶从5‘端把Pb2切开,然后用核酸外切酶3来处理,每隔一定时间取样,然后处理成平末端,用T4DNA连接酶重新连接成环,转化到DH5a中,提出痕量质粒转化到BL21中,然后检测可溶表达情况。
这里,我要补充一下,他们检测蛋白是否可溶的方法也比较新颖,通常我们在实验室都是用超声破碎,取全蛋白和上清分别取样跑胶比较而判断的。但是这种方法无法适合大规模的筛选。
本文用的方法,就是通过克隆的方法,在PB2基因的C末端加了14个AA的短肽,这个短肽能够在大肠杆菌体内被生物素修饰,在体外当加入fluorescent
streptavidin
之后,就能够通过荧光检测,这样就能够判断蛋白是不是可溶表达了。
附,文章详细的方法的protocol。
自己总结的。
其实大家不用很详细的看。了解基本原理即可,知道有这么一种方法也就足够。
1
PB2
library
vector
construction.(Nde
I,Not
I
and
Nsi
I)
(PCR:pb2+14biotin
acceptor
peptide
+
pmal-cg)
2
Truncation
library
construction.
(Not
I
and
Nsi
I,
Exonuclease
III
time-dependent,
MBN
enzyme,
T4DNA
polymerase,
T4DNA
ligase,
transform
DH5a:24036
)
3
Colony
picking.
(transform
BL21:26880,robot:384-well
plate
with
LB
)
4
Preparation
of
colony
array
filters.
(nitrocellulose
membrane,
array,
induce
over
LB
)
5
Detection
of
biotinylated
proteins.
(lysed
in
situ
and
streptavidin
conjugates
used
to
detect
biotinylated
proteins)
6
Further
data
analysis.
(300
clones)
通过荧光检测就能得到能够可溶表达的片段了。
通过PCR,就很容易知道,可溶表达的片段了,最终的结果找了两个片段:678–759
(designated
DPDE,
from
the
first
four
residues)
和661–759
(TTKR)。后者只是多了N端的一段loop而已。本文后面的研究对象都是
DPDE。
通过NMR方法就非常容易解析到了这个domain的结构,是一个含有helix和beta-sheet的结构,左图是10个结构,右图是平均结构。
![[转载]怎样解析难结晶蛋白的结构? [转载]怎样解析难结晶蛋白的结构?](http://s15.sinaimg.cn/bmiddle/002h16y4gy6U0dLPQeife&690)
结构生物学的文章,如果想发的比较好,一般有两个条件要满足的,第一,蛋白结构的本身笔记新颖,是一个新的fold。第二,一般都要和功能相互联系,能够用来解析生物现象才最好,通俗的说,结构解析出来之后,还要做一些生物实验或者功能实验。
这个结构DPDE,通过和目前已知的结构库(dali)相比较得知,是一个全新的结构。
另外作者还做了生物学的实验:
1、DPDE的细胞定位。
2、和其他蛋白的相互作用。
通过这些,使得文章的水平非常高。
关于这两个细胞生物学的实验,我会简单的讲,因为我想大家对这个课题本身的兴趣并不是很大,除非你就是研究“禽流感病毒蛋白”的。
首先DPED的细胞定位实验。
通过将DPED和PB2全长和EGFP相连,从而研究比较,他们的细胞定位。
然后将感兴趣的几个部分又做了点突变,并观察对细胞定位的影响。
结论是,他们的细胞定位是一致的,都是细胞核定位,并以此,以及序列比对,提出了一个新的细胞核定位信号:KRx12–15KRxR
![[转载]怎样解析难结晶蛋白的结构? [转载]怎样解析难结晶蛋白的结构?](http://s11.sinaimg.cn/bmiddle/002h16y4gy6U0dMhsFk4a&690)
第二个生物学实验:研究DPDE和Importin a5
的相互作用,Importin是一个典型的细胞核转运蛋白,作者猜测PB2亚基可以通过Importina5,被独立的转运到细胞核内。
为了验证他们是不是相互作用,作者用了一个最简单、但是确是最实用的方法,FPLC的方法
图示:
a
DPDE自身的FPLC分子筛图,并将峰的位置取样跑胶。
b
importin5自身的FPLC分子筛图,其中最前面那个小的是多聚形式,然后将峰的位置取样跑胶。
C
将二者混合之后的FPLC分子筛图,并将峰的位置取样跑胶。
因为在importin的峰里,看到了DPDE的存在,很明显就证明了他们在体外是可以相互作用的。
详细的讲,是:
(您好。我对蛋白质相互作用这块比较感兴趣。但上句是不是应该表述成:
C
将二者混合之后的FPLC分子筛图,并将峰的位置取样跑胶。
因为在importin的峰里,取样做电泳,检测到了DPDE的存在,很明显就证明了他们在体外是可以相互作用的。
多谢指教。)
这个方法的优点:非常简单,结果非常的明了。缺点就是,不太适合两个分子量接近的蛋白。而且,只能看到是否结合,却无法定量,只能定性。
anyway,我们还是可以很多时候考虑用这种方法的。
![[转载]怎样解析难结晶蛋白的结构? [转载]怎样解析难结晶蛋白的结构?](http://s10.sinaimg.cn/bmiddle/002h16y4gy6U0dMI4yt69&690)
上面所讲的通过FPLC验证二者可以相互作用,但是这种方法,却无法得知他们是如何相互作用的,也就是说,无法得知,他们确切的相互作用的机理、方式。
于是作者通过共结晶的方法解析了importin
5a和DPDE的结构,从而从原子水平了得知他们是如何相互作用的。
下面是他们的复合体的晶体结构,红色的部分是DPDE的结构。
![[转载]怎样解析难结晶蛋白的结构? [转载]怎样解析难结晶蛋白的结构?](http://s12.sinaimg.cn/bmiddle/002h16y4gy6U0dNvVi3bb&690)
上面所讲的通过FPLC验证二者可以相互作用,但是这种方法,却无法得知他们是如何相互作用的,也就是说,无法得知,他们确切的相互作用的机理、方式。
于是作者通过共结晶的方法解析了importin
5a和DPDE的结构,从而从原子水平了得知他们是如何相互作用的。
下面是他们的复合体的晶体结构,红色的部分是DPDE的结构。
具体的相互作用方式:
![[转载]怎样解析难结晶蛋白的结构? [转载]怎样解析难结晶蛋白的结构?](http://s14.sinaimg.cn/bmiddle/002h16y4gy6U0dNVJp36d&690)
通过分析复合物的结构,找出相互作用的位点,通过点突变,进行验证。
方法还是FPLC。
![[转载]怎样解析难结晶蛋白的结构? [转载]怎样解析难结晶蛋白的结构?](http://s12.sinaimg.cn/bmiddle/002h16y4gy6U0dOlDT5cb&690)
总结:
之所以将这一篇作为journal
club的对象,是因为它非常典型。
1、他用到了NMR和X-ray这两者解析蛋白结构解析的方法。
2、他告诉我们结构生物学的瓶颈:拿到可溶的蛋白。并提出了一种行之有效的解决方案。
3、他用最典型的方式来阐述了结构如何和功能相联系起来。
4、他用了最简单、直接的方法解决问题:FPLC、点突变、细胞定位。
在这个帖子里,强调的是,世上本无路,走的人多了,也就有了路。不管这路是不是最合适的。
问个问题,我是结构学的外行-.-
随便弄一段可溶片段然后送去分析结构,就可以确定该结构是存在于正常的蛋白质结构中的一部份么? 换句话说,
该文章证明了那一段被切下来的可溶性蛋白单独存在时可以形成某种结构,
但是如何确定这一片段在全长蛋白中会也形成同样的结构?
还是说..这个根本就是结构生物学中的基本常识?
完全不懂了,求教!
一般来说,从来没有“随便”弄一段的说法。
在结构生物学中,像这篇文章中的一个C端的domain,因为从结构上分析,它和前面的区域之间有一个很长的loop,在结构上被认为是形成了一个独立的domain,也许和前面的domain有相互作用,但是事实上,这个domain的独立结构和在整个蛋白中的结构一般认为不会有变化的。
所以在很多文章中,都是拿很多独立的domain作为研究对象:当然不是随便弄一段的呵呵
那就是说还是建立在domain
prediction的基础上的么?但是如果是这样,为什么要用非常难以控制的按时间取样,而不将predicted的domain直接clone,再去测它的可溶性呢?
我没有看原文(比较懒嘿嘿),但是通过看帖子描述,前半部分方法是先快速采样,再确定domain的过程,就是说类似screening,事先其实并不知道哪一段是可溶的;
然而后来的结果则是恰恰好一整个domain都可溶.这个...可以用巧合来解释么?按时间取样刚刚好取到整个C
terminal domain的片段长度?
再次求教,谢谢
ESPRIT:翻译过来就是:(通过)随机增加末端切掉片段表达可溶蛋白。
通过名字我们也能猜出这种方法的含义:既然我们不知道全长蛋白中,哪一段单独表达会是可溶的,就只能通过随机的方法来寻找。我们可以从一个全长蛋白的N端或者C端(本文用的是从N端)随机的减掉一个AA,这样把任何一个可能都尝试了,就有可能找到可溶的片段。
PB2全长是759个AA,那么我们从N端一个一个切,那么我们如果得到759个construct就可以包括所有的可能了(C端也同样,但是本文没有做)。
理论上我们可以通过PCR实验,设计不同的引物,应该也可以实现,但是这样无论成本、劳动力都太大了。本篇文章用的就是一个创新的方法。
简单的描述一下:
就是首先将PB2基因查到PGEX中,然后用一种限制性酶切酶从5‘端把Pb2切开,然后用核酸外切酶3来处理,每隔一定时间取样,然后处理成平末端,用T4DNA连接酶重新连接成环,转化到DH5a中,提出痕量质粒转化到BL21中,然后检测可溶表达情况。
是这个没错吧?
然后是
'通过PCR,就很容易知道,可溶表达的片段了,最终的结果找了两个片段:678–759
(designated DPDE, from the first
four residues) 和661–759
(TTKR)。后者只是多了N端的一段loop而已。本文后面的研究对象都是
DPDE。'
就这里不太懂,
为什么'每隔一段时间取样', 得到的两个可溶片段,
其中一个DPDE就恰好是一个'C端的domain,因为从结构上分析,它和前面的区域之间有一个很长的loop,在结构上被认为是形成了一个独立的domain,也许和前面的domain有相互作用,但是事实上,这个domain的独立结构和在整个蛋白中的结构一般认为不会有变化的。'
按之前说的,分析结构一般是以一个独立的domain为单位做NMR和XRAY分析的,这篇文章得到的可溶性片段是直接拿去分析结构了还是先作prediction然后再去分析结构?
如果是直接分析,那如何断定这个片段没有因为'按时间取样'而丧失一定的完整性
如果是后者,那为什么不用传统的方式直接将predicted的domain克隆到vector里去
我真的仔细看了这个帖子了-_-..
可能理解能力有限,还是觉得这个文章有些,奇怪...不好意思
你找到了问题的关键,可能是我没有交代清楚。
你说的很对,通常情况下,我们都是通过预测从而找到domain的。
但是这个蛋白所有的同源蛋白,都没有解析出来结构,所以我们无法predict出来哪里可以形成独立的domain,而只能像这篇文章用的方法,把所有的可能的片段都找出来,然后看看哪些片段可以形成独立折叠的domain。
predict的基础是同源蛋白已经有了结构才可以。
但是对于没有同源结构的,只能用本文的方法了,虽然成本很高呵呵
看完之后,有一个问题
他用的方法确实很新颖,用外切核酸酶来获得从C端开始的全部长度的基因片段,虽然他也可以用类似的方法来获得从N端开始的全部片段,
但是,这样获得的片段都有一个固定的起点,要么C端,要么N端
那么,如何获得在基因内部的某段序列,并且筛选它是否是具有某种结构的domain呢?
我想,能不能参考它的方法继续进行下去,现在他已经确定了C端的一个可溶性domain和一个loop,那么,我们可以用loop上的某个aa作为新的C端起点,用同样的方法进行筛选,那么会不会得到下一个可溶性domain呢?再以这个domain的终点aa作为下一次筛选的起点,从而完成对全序列的筛选?当然,我们也可以同时从N端开始筛选,从两边向中间靠拢,这样速度会更快。
另外,我还有一个问题,(我不是学结构,可能比较弱)
文章说,这个蛋白在体外表达时(e.coli,昆虫和哺乳动物细胞),基本上是不溶,那么是否意味这个蛋白在体内(即病毒合成时)也是不溶的。
如果它是不溶的,或者我们选择的某段起点序列是不溶的,会不会对后续筛选产生影响,也就是说,起点一段不溶序列后面跟随了一段自身可溶的domain,会不会使整个肽段都不溶呢?
如果算结构的文章,那可是天女散花,
无论是MC,还是plos系列,nature系列,cell系列,到处都有。感觉这片文章到NSMB,有几点可能性。
1。
正如你所说,作者是作结构的,NSMB在他们的想法中,估计是最好的。
2。 作病毒,上不了CNS,plos
B,估计下来就是NSMB
3。
文章很漂亮,
虽然把结构方面的东西都做完了,但是仅仅从结构到结构,在功能方面没有能做到进一步的阐释,例如,证明了与细胞核转运蛋白的binding,并且研究了如何binding,但是还是没能说明这个binding在整个virus
life cycle中有什么意义。
没有能够对更大范围的科研产生影响,还有很多工作要作。
体会:随着结构的方法越来越简单,流水线,大规模,routine,一个结构一篇CNS的日子基本已经过去了(除了大complex,和膜蛋白)。
估计未来的关键功能为主,只有能够更好的解释功能,而不仅仅是为结构而结构,才能在激烈的竞争中存活。