[转载]蛋白疏水分析、跨膜区预测以及拓扑结构的生化分析

2018-10-23 21:07阅读：

http://blog.sina.cn/dpool/blog/u/6104691699

本文为Atom原创，特此说明
内容概要
1、蛋白疏水性计算机分析和跨膜结构预测
(这部分本人绝对外行，只介绍几个我曾经用过的方法)
1.1 Kyte and Doolittle疏水分析
1.2 Helical wheel分析Amphiphilic肽段
1.3 alpha螺旋穿膜区的预测

2、膜蛋白拓扑结构的生化分析
2.1 原

核细胞：Enzyme Tags
2.2 真核细胞：Glycosylation Tags
2.3 Cysteine Scanning
2.4 BAD Tag
2.5 蛋白酶保护分析
---------------------------------------------------------------------------------------

1、蛋白疏水性计算机分析和跨膜结构预测
跨膜区结构预测
由双层脂类组成的生物膜结构是细胞的基本构成单元，然而，生物膜的大部分功能是由镶嵌在生物膜中的蛋白质来完成的，膜蛋白决定了生物膜的功能特性，因此，不同类型的生物膜，其蛋白构成比例有很大的差别，以质量来算，从25%到75%不等。另一个角度来说，生物体内的蛋白质中，20-30%都属于膜蛋白，因此膜蛋白在细胞的功能中占据重要地位是显而易见的。由于膜蛋白很难得到大量外源表达，纯化、结晶也非常困难，所以得到结晶X线衍射明确其结构的膜蛋白至今仍然很少，目前对于膜蛋白的结构研究，仍然处于起步阶段。
膜蛋白包括integral membrane protein和peripheral membrane protein，在integral膜蛋白中，与细胞膜的结合也有几种不同的方式，其中主要方式是肽段直接跨过细胞膜，即transmembrane protein(跨膜蛋白)，另外还有通过脂肪基与细胞膜发生共价结合，蛋白本身可以在细胞内侧，也可以在细胞膜外侧。跨膜蛋白一般以疏水的alpha- helix与膜脂肪发生非共价结合，在细胞中常执行信号传导或转运通道功能，因此是研究最集中的一类蛋白质。这里介绍的是膜蛋白二级结构中alpha- helix的预测和跨膜结构生化分析相关方法学。
1.1 Kyte and Doolittle疏水分析
1982 年Kyte和Doolittle发表在Journal of Molecular Biology上的分析蛋白疏水特性的方法，(A Simple Method for Displaying the Hydropathic Character of a Protein)仍然是目前应用最为广泛的蛋白疏水区作图法。目前大多数分子生物综合分析软件(例如DNASTAR，OMIGA2)都包括了这个分析功能：Kyte Doolittle Hydrophobicity Plot。在这个作图法中，分析的是氨基酸系列的平均疏水性，从而预测肽段是否有足够的疏水性而成为跨膜区。图形报告中，X轴为氨基酸系列位置，Y轴为氨基酸平均疏水指标，“平均”指的是这个疏水指标不仅仅反应该氨基酸，而且反应了周围几个氨基酸的疏水性，在作图前，需要设置window size来决定分析周围几个氨基酸的平均值，window size应该是一个单数，比如11，那么某个位置氨基酸的平均疏水性就是这个氨基酸N端侧5个和C端侧5个以及它自己的疏水性的平均值。根据这个原理，蛋白的前几个和最后几个氨基酸是不能得到疏水指标的，因此在疏水图中不能显示。请参考附图，我这个图是用一个免费软件winpep做的，该软件还提供一个功能，就是预测可能的疏水alpha-helix区，在产生图以前，需要输入一个预测阈值，通常设定为1.6，条件要求苛刻时设定为2.0，一般认为2.0 得到的预测是可靠的。
我试过许多不同软件，没有找到一个满意的，也就是可以输出发表格式图形的软件，最后只好通过拷屏的方法拼凑打印成图形发表。如果哪位朋友发现比较好的软件可以直接输出图形，特别是要输出高dpi的图形，麻烦你告诉大家共享。

引用:最初由 zhengz 发布
谢谢了，看了后对这个有点懂了，以前自己用dnastar做了一个类似分析，按一片文章的方法类推的，全用默认值。没有深入思考过。请问，window size有什么要求吗？平均疏水性的具体数值怎么评估的阿？
还有文献中提到关于氨基酸的二级结构和一些物理性质的预测，具有较大的价值，具体的与真实结构的吻合率有多高？

我前面说过，我在这方面是外行，所以具体原理我闹不太明白的。根据我自己的理解，氨基酸的疏水值是由这个氨基酸从脂相进入水相所需要的能量(free energy)和氨基酸侧链结构来决定的，如果氨基酸进入水相需要能量，则为正值，所以正值越大，疏水性越强。Kyte和Doolittle分析得到了每个氨基酸的疏水指标，平均疏水值就是通过设定窗口，然后算窗口内这些氨基酸的疏水指标的均数得到，因此阈值的设定，可能会影响疏水区预测的准确性，一般推荐同时用1.6和2.0两个数值，既不遗漏可能的疏水片段，也可以看出苛刻条件时这个疏水片段是否仍然存在。窗口大小的设定，作者推荐的是7、9、11，原因是小于7时平均值受个别氨基酸影响大，可能无法得到准确结果，而大于11时可能会遗漏比较短的疏水区，我自己认为，跨膜螺旋一般要求15个氨基酸以上才能形成，所以我倾向于用11或者更大的窗口，当然还要用7做一次，避免遗漏。(补充：今天看见一篇文献介绍，为了提高跨膜疏水区预测准确性，跨膜蛋白的疏水分析要用19个氨基酸的平均疏水值才比较准确，而7、9、11则主要用于分析其他蛋白的疏水区，比如可溶性蛋白的疏水核心等等，因此看来，我原来的观点基本上是正确的。)
说到预测的准确性，我就不知道该用什么概率了。我自己是这样看的：即使预测准确性达到99%，也仍然是预测，你也不能保证你的蛋白质不会落到例外的1%里面。所以，预测本身只能帮助你分析，帮助实验设计，但是你不能依赖预测来出结果，预测和生化、衍射或者MRI实验结果相符合时，你才能说它是准确的，如果不符合，可能还要分析一下原因，但是仍然以实验为准。我从来没有看到通过预测就可以写出文章来的，除非是讲预测方法学的文章，

因此，特别要说明，我这个主题的重点应该是在生化分析那部分。

1.2 Helical wheel分析Amphiphilic肽段

Amphiphilic (或者称为Amphipathic)是指某些肽段，在形成alpha螺旋以后，氨基酸侧链一边是亲水的，另一边是疏水的，这样疏水这边就形成了一个叫做 hydrophobic moment，这种肽段可以通过两种方式成为跨膜蛋白：一是一侧埋入膜脂肪中，另一侧在细胞内；二是和其他亲水、疏水区发生聚集，形成疏水区向外，亲水区向里的结构，而这样的结构，可能是膜蛋白形成小孔(pore)或者某些通道(channel)的重要方式。请参考示意图，图中黄色表示疏水区，绿色表示亲水区，左边是一个一侧埋入细胞膜的肽段，其他区域则仍然在细胞内，右边是两个肽段聚集形成的跨膜结构(domain)，显示两个alpha-helix通过疏水侧链与膜脂肪结合，亲水侧链则互相结合，注意这个结构中心是亲水的，因此很容易形成离子通道一类功能区。

因为alpha-helix每3.6个氨基酸形成一个螺旋，在蛋白一级结构系列中，Amphiphilic(Amphipathic)螺旋，是无法分析出来的，这种结构的预测需要绘制helical wheel图才能明了。helical wheel是把螺旋里面的氨基酸，垂直投影下来变成一个圆圈来分析，因为每一个螺旋是3.6个氨基酸，根据螺旋投影，每个相邻氨基酸在圆圈中的间隔是 100度，这样五圈即18个氨基酸以后又回到原位(即第19个氨基酸投影与第一个在一起)，所以一般绘制helical wheel都是用18个氨基酸，也有一些软件(例如DNASTAR, PEPTOOLS)采用每一圈缩小一点，可以绘制更多的氨基酸，不过我个人觉得那种方式出来的图不是太好看，同时18个氨基酸也已经足够成为跨膜肽段，所以分析的时候也许可以用更长的肽段，发表论文的时候，选择18个氨基酸，绘制一个简单图形就完全可以了。因为论坛帖子只能贴图一个，我将在下一个帖子中给一个实例。

这是一个假想的肽段，从一级结构来看，有数个 Serine和Glutamine是极性、亲水的，计算平均疏水不可能达到1.6。绘制helical wheel图中，非极性氨基酸是用黄色显示的，可以清楚看到只有螺旋的左下侧是亲水的，右、上侧都是疏水的。因此可以认为，如果这个肽段形成alpha helix，将是一个amphiphilic helix，条件适合时可能成为跨膜alpha helix，而且这种Amphiphilic螺旋如果通过生化实验证明确实是跨膜结构的话，一定是一个非常重要的功能区。

Helical Wheel绘制的软件很多，除了前面说到的dnastar, peptools外，通过google搜索helical wheel可以得到许多在线服务软件，大家可以根据自己的喜好来选择。此外，何有裕大侠的http://www.biolover.com里面不仅有种类齐全的软件，而且有众多高手云集，如果要做蛋白结构预测，一定要去他们那里好好学习。

1.2 alpha螺旋穿膜区的预测

前面已经写完了疏水区的预测，蛋白跨膜区预测的最重要基础实际上就是疏水区预测，但是跨膜区以及跨膜拓扑结构的预测比这要复杂得多，我说过我在这方面是外行，很幸运，今天找到了一篇去年的综述，内容非常全面，包括spiro提到的几个方法都有介绍，我就偷懒了(另一方面也是避免露馅)，直接把这篇综述贴上来给大家一起学习吧。当然，你想偷懒看中文就没戏了，不过真正有兴趣的朋友一定不会错过这篇文献的。

这里是摘要：
Abstract: Membrane proteins are crucial for many biological functions and have become attractive targets for pharmacological agents. About 10%-30% of all proteins contain membrane-spanning helices. Despite recent successes, high-resolution structures for membrane proteins remain exceptional. The gap between known sequences and known structures calls for finding solutions through bioinformatics. While many methods predict membrane helices, very few predict membrane strands. The good news is that most methods for helical membrane proteins are available and are more often right than wrong. The best current prediction methods appear to correctly predict all membrane helices for about 50%-70% of all proteins, and to falsely predict membrane helices for about 10% of all globular proteins. The bad news is that developers have seriously overestimated the accuracy of their methods. In particular, while simple hydrophobicity scales identify many membrane helices, they frequently and incorrectly predict membrane helices in globular proteins. Additionally, all methods tend to confuse signal peptides with membrane helices. Nonetheless, wet-lab biologists can reach into an impressive toolbox for membrane protein predictions. However, the computational biologists will have to improve their methods considerably before they reach the levels of accuracy they claim.

我的主要内容在后面的生化分析，但是可能会拖比较长的时间才能完成，请大家谅解。

2、膜蛋白拓扑结构的生化分析

所谓膜蛋白拓扑结构，实际上就是描述一个跨膜蛋白有几个跨膜区，这些跨膜区是由里向外，还是由外向里，N端和C端分别是在膜内还是在膜外。对于原核生物，因为没有胞内膜系统，跨膜，实际上就是跨细胞膜，对于真核生物，情况复杂一些，不过规律是一样的，值得注意的是，从拓扑结构来说，内质网的外侧等同于细胞内，而内质网的囊腔(lumen)则相当于细胞膜外侧，这一点在分析真核细胞拓扑结构时一定要搞清楚，因为跨膜蛋白合成一般都是在内质网完成，蛋白合成的同时即实现跨膜转移，所以真核细胞的拓扑结构生化分析通常是用内质网系统来进行的。
跨膜结构的生化分析，通常以计算机预测作为实验设计的基础。由于生物膜的的相对不通透性，膜两侧出现不同的分隔区，如果在预测的跨膜片段前、后附加适当标记，这个标记出现在膜内或者膜外将会有不同的生化表现，就可以验证预测的跨膜区是否真正的跨膜片段，而且可以知道这个片段的跨膜方向(N-in, C-out 或者 N-out, C-in)。对于有多个跨膜区的膜蛋白，则需要逐个分析确认。

2.1 原核细胞：Enzyme Tags

用大肠杆菌做研究模型，目前已经有三种酶可以作为标记，用来研究蛋白跨膜结构，这三种酶是：碱性磷酸酶(PhoA)，beta-galactosidase (LacZ)，beta-lactamase(内酰胺酶？Bla)，他们有一个共同特点，就是表达在细胞浆与转运到细胞膜外会出现不同的酶活性。PhoA 前体蛋白有一个信号肽(实际上就是N-in, C-out跨膜片段)，PhoA只有通过信号肽跨膜分泌到细胞膜外侧(在大肠杆菌实际上是进入periplasm)，才会正确折叠并形成双体，从而具有酶活性。如果PhoA多肽表达在细胞内而不能分泌到膜外侧，则无法完成折叠，因此没有酶活性。LacZ的表现恰恰相反，这个蛋白只有在细胞浆内才会表现出酶活性，如果在LacZ的N端附加一个信号肽把蛋白转运分泌到细胞外，将无法正确折叠，失去酶活性。Bla是抗生素领域的一个重要的酶，内酰胺类抗生素(青霉素及先锋类)的作用原理是阻碍细胞壁的合成，而Bla则会分解这些抗生素的内酰胺环，从而保护细菌，使其免受抗生素的影响，因此表达Bla的菌株通常是对青霉素和先锋类耐药的。Bla的作用部位既然在细胞壁合成途径，它当然需要进入periplasm才能起作用，所以没有转运信号的Bla是实际上是不具有生物活性的。

根据以上这些酶的特点，实验设计通常是这样的：根据计算机预测结果，在预测跨膜区的前面或者后面选择一个点中断(truncate)目的蛋白质的肽链，然后与以上三个酶之一形成融合蛋白，这叫做C-terminal deletion fusion，形成的融合蛋白，根据跨膜区的走向，例如一个N-in, C-out跨膜区(类似于信号肽)，如果融合点在跨膜区的N端一侧(参见示意图B-1)，则酶的多肽区将在细胞内，如果融合点在跨膜区的C端一侧，则酶的多肽区将被前面的跨膜信号转运到膜外侧(见图A)，如果跨膜区是反向的(N-out, C-in)，则两种融合蛋白的标记酶都在细胞内(见图B-2)。对于多个跨膜区的蛋白，以同样方式可以设计多个融合点，通常融合点的设计都是安排在跨膜区的前后loop，而不在跨膜区里面，以免标记酶系列进入膜内干扰跨膜区结构，如示意图的C、D(某些情况下可以设计融合点在跨膜区内，后面还要介绍)。

融合蛋白的表达，当然是通过质粒DNA重组的方式实现的。特别需要提到的是，因为PhoA和Bla两个蛋白本身就是分泌蛋白，他们的原始系列里面是有跨膜信号肽的，设计融合蛋白的时候，这个信号肽当然不能包括进来，所以在融合蛋白里面的PhoA和Bla氨基酸系列，实际上是成熟蛋白(mature peptide)的系列。

得到含有重组子的细菌以后，首先要通过western blot证明融合蛋白的表达。这三个酶的抗体都已经有商业化的产品(不过我用SIGMA的PhoA单克隆抗体检测我的融合蛋白却没有成功，据说某些抗体可以检测天然蛋白，却不能与融合蛋白反应，我最后还是从别人实验室要的抗体才得到western结果)。表达融合蛋白的大肠杆菌，可以通过培养皿直接检测酶活性(PhoA和LacZ是通过显色反应，Bla是通过ampicillin拮抗性检测)，PhoA和 LacZ的活性还可以通过液体培养后进行显色反应得到一个定量的结果，某些情况下活性的定量也是有意义的，后面还要提到。根据酶活性的结果，就可以判断融合蛋白的融合点是在细胞膜外侧，还是在胞浆里面。例如示意图中，A、D融合蛋白PhoA是有活性的，而B-1、B-2和C融合蛋白PhoA是没有活性的。用LacZ做融合蛋白，酶活性结果将和PhoA的结果完全相反，所以，这两个方法被不少人用来做互补实验，以进一步确认实验的准确性。

除了C-terminal deletion fusion方法以外，还有人用夹心法融合(sandwich fusion)，也就是把酶标记插入蛋白质系列的中间，而损失膜蛋白的原始系列，这样可以相对保持被研究的蛋白质整个拓扑结构的完整性，希望通过这种办法得到更加可靠的结果。但是这种方法在膜蛋白中间夹入一个相当长的酶，所以仍然无法保证蛋白的正常跨膜结构形成，除非可以证明这种方法得到的融合蛋白是有天然蛋白的正常功能，否则夹心法得到的结果不见得比C-terminal deletion fusion得到的结果更好。

总的来说，无论是C-terminal deletion fusion 还是 sandwich fusion，有一个基本的假设就是：膜蛋白在被改造(truncated, sandwich)形成融合蛋白以后，其跨膜拓扑结构仍然能够维持原来天然蛋白的方式。实际上，融合蛋白的跨膜结构将受到膜蛋白本身序列、标记酶序列和融合点三方面的影响。经过多年许多实验室的研究结果和一些已经结晶的蛋白质结构对比，以及和其他途径获得的蛋白结构信息对比，至少大部分膜蛋白经过酶标记分析得到的拓扑结构是完全正确的。同时，也有一些实验结果发现了一些融合蛋白表现和天然蛋白不同的结果，下面是一些已经发现的问题：

1、LacZ的活性表现在细胞内，因此只有被转运到细胞外才会失活，如果细胞跨膜转运机制出现饱和(saturation of export machinery)，或者部分酶正好嵌入在细胞膜内，出现漏入细胞内的情况，将出现假阳性结果，相对而言，PhoA和Bla的活性必须有一个完整的出膜信号存在才能出现，因此一旦发现阳性，往往可以肯定跨膜信号的存在。许多互补实验的结果证明，用PhoA和Bla作为酶标记得到的跨膜结构，特别是出膜信号，结果更加准确，所以目前大多数研究已经不用LacZ作为标记酶。
2、融合位点的设计，应该离跨膜区远一些，一般可以设计在下一个跨膜区的前面(C-terminal end of cytoplasmic loops)，这样保证loop能够稳定信号区结构，实验发现，PhoA融合在一个入胞跨膜信号的后面，如果离入胞信号太近，丧失了胞内区的亲水氨基酸，这个跨膜区可能无法稳定在细胞膜，可能出现阳性结果。
3、如果一个出膜信号的氨基酸序列中有一些亲水氨基酸存在，这个出膜信号可能不够强，融合在这个出膜信号后面的PhoA或者Bla会无法被转运，因此出现阴性结果，对于这种跨膜结构的分析需要特别谨慎。另外一种情况是，示意图中的B-2，虽然其N端是在膜外的，但是这种出膜信号无法通过C- terminal deletion fusion实验来分析，无论融合点在那里，PhoA总是阴性的，因此需要用到以后介绍的一些方法。
4、对于有些穿膜信号，可能只要其中某一部分就已经可以完成跨膜任务，因此融合位点的设计可以在跨膜区中间，这种设计用于PhoA标记的研究，有时候可以准确分析跨膜区的中间点，因为融合到跨膜区的不同位点，将得到一系列不同强度的酶活性，因此而推断出整个跨膜区序列，这种方法要求对PhoA进行定量分析。

总之，通过酶标记融合蛋白的方法研究膜蛋白的拓扑结构是一个很有实用价值的方法，结合计算机预测的结果进行实验设计和分析，往往可以得到大多数膜蛋白的正确结构。但是少数情况下会出现一些异常结果，如果和预测的结果不符合，就需要增加融合位点，采用不同酶标，或者用其他一些方法来进一步分析。还要特别说明的是，尽管酶标记的方法是用大肠杆菌做实验模型，但是，对于真核细胞的跨膜蛋白分析，同样也可以用这个系统来实现，因为大肠杆菌实验条件要求相对于真核细胞实验来说要简单得多，用于真核蛋白的研究仍然不失为一个很好的手段。对于一些融合蛋白，其跨膜表现和天然蛋白不同，虽然会影响膜蛋白结构的研究，然而另一方面，深入分析这些不同，也可能会发现跨膜信号的形成机制中我们还没有认识到的东西，从而改进膜蛋白跨膜结构的研究方法。

2.2 真核细胞：Glycosylation Tags

糖基化在真核细胞膜蛋白翻译后修饰中是一个普遍现象，糖基结合位点在NXT/S保守序列的Asn侧链氨基上，这个修饰是由寡糖基转移酶 (Oligosaccharyl Transferase, OST)完成的。由于OST本身是一个跨膜蛋白，其催化基团在内质网的囊腔内，糖基化只能发生在跨膜蛋白的囊腔内区域，也就是膜外区，这种特点因此可以被用来研究跨膜蛋白的拓扑结构。实验设计几乎和大肠杆菌的PhoA实验完全相同，不同的是在这里作为标记的是糖基化的保守序列而不是PhoA，同时必须在真核细胞系统(细胞整体或者体外翻译系统)进行实验。糖基化修饰的蛋白分子量会增加2.5 kDa左右，在普通SDS-PAGE电泳中通过对比即可明确，为了确定是糖基化造成的分子量迁移，可以用糖基酶(Glycosidase)消化糖基，或者在翻译系统中加入糖基化抑制剂(tunicamycin)或糖基化竞争片段(例如Ac-NYT-NH2，N-benzoyl-NLT-N- methylamide，其中NYT和NLT都是糖基化保守区)，如果处理后得到的蛋白没有分子量迁移，可以肯定迁移是糖基化造成的。

用糖基化标记研究跨膜蛋白的拓扑结构也有两种不同策略，即C-terminal deletion fusion和Sandwich fusion，后者一般称为糖基化扫描(Glycosylation Scanning)。

C-terminal deletion fusion方法几乎和PhoA融合蛋白完全一样，通常选一个肯定会发生糖基化的多肽区域(这个标记片段往往根据实验室的方便来选择，可以根据自己手头已经有的蛋白，选一个区域来作为标记)，融合到要研究的蛋白质某个位点(膜内或者膜外区)C末端，在体外翻译系统中，加入内质网系统(Microsome) 则蛋白将发生糖基化，如果不加入内质网，蛋白则不发生糖基化，通过对比不同翻译系统产生的蛋白质的分子量，即可明了标记蛋白片段是在膜内(不发生糖基化) 还是在膜外(即内质网的囊腔，发生糖基化)，从而确定融合位点的相对位置。文献报道常用的标记片段是胃壁细胞的H+K+ATPase beta亚基的C端区，共有5个糖基化位点，因为已经通过许多实验证实这个片段只要进入内质网的囊腔，就会发生糖基化，故可作为经典的糖基化标记。

糖基化扫描的实验设计相对复杂一些，通常是选择一个相对比较短的(甚至只有三个氨基酸NXS，一个糖基化位点或者四个氨基酸NNSS，两个糖基化位点)标记，插入膜内或者膜外区域某个点中间，通过设计一系列的突变体，标记蛋白质不同区域(即扫描)，为了保证这个位点是蛋白序列的唯一糖基化位点，先必须通过 DNA突变把蛋白质内所有可能发生糖基化的位点都清除掉，这样得到的蛋白质如果发生糖基化，即说明标记位点在内质网囊腔内。由于糖基化扫描可以插入很短的序列作为标记，在维持蛋白的折叠、拓扑结构方面有明显优点。但是在实验设计中有三个问题必须注意：
1、糖基化位点与跨膜区的距离：因为OST的催化基团与细胞膜本身有一定空间距离，如果糖基化位点太接近蛋白跨膜区，这个位点和催化基团无法接触，将不会发生糖基化。实验证明，糖基化区域的细胞内环至少需要30个氨基酸，其中与上游(N端)跨膜区距离必须超过14个氨基酸，与下游(C端)跨膜区距离须超过 12个氨基酸，因此如果预测膜内(外)区过短，需要设计比较长的插入标记才能得到正确结果。不过，这个特点可以用来确定跨膜区的开始和结束的位置。
2、如果突变、标记以后蛋白质不具有功能，说明蛋白质的折叠可能发生了变化，糖基化标记得到的信息即有可能是错误的。当然也有人认为，如果蛋白质折叠发生错误，将在进入细胞膜以前即被蛋白酶消化而降解，所以只要能得到膜蛋白表达，大多数情况下其结果都是可靠的，如果标记蛋白功能正常(或者保持部分功能)，糖基化扫描的结果将是非常有说服力的。
3、由于糖基化受蛋白空间结构、催化位点与糖基化位点相互作用等因素影响，虽然糖基化阳性说明标记位点在膜外，糖基化阴性却不能完全排除其在膜外的可能性，阴性结果必须得到其他实验的验证。

糖基化标记法虽然是通过真核细胞翻译系统进行实验，但是原核细胞的蛋白如果在这个系统中翻译表达，同样可以发生糖基化，所以这个方法用于原核细胞的跨膜蛋白研究，也有成功的报道。
2.3 Cysteine Scanning 半胱氨酸扫描实验

半胱氨酸是一个非常特殊的氨基酸，它的巯基是一个活跃基团，在蛋白折叠、多聚体形成以及酶活性中心里面都扮演重要角色。在细胞跨膜蛋白分析中，利用巯基容易受化学修饰的特性，通过标记的巯基修饰试剂来分析半胱氨酸的位置，这个实验也多半在大肠杆菌体系完成(对于真核细胞，目前只能用于研究细胞膜的蛋白，不能研究表达于细胞器膜上的蛋白)，其原理也非常简单，在完整细胞中，有些巯基修饰剂不能穿透细胞，因此只能和膜外侧的巯基发生反应，给巯基修饰剂带上标记 (同位素、荧光或者生物素)，和完整细胞进行反应，细胞外侧的半胱氨酸将出现阳性标记，如果蛋白中的巯基没有被标记，说明这个巯基的位置是在细胞内。

由于半胱氨酸可能出现于蛋白原始的序列中，所以实验第一步是必须得到一个没有半胱氨酸的突变蛋白，通常把蛋白序列里的所有氨基酸都要突变成侧链是羟基的丝氨酸，然后检测该突变蛋白的功能，如果突变蛋白有一定功能，说明突变本身没有破坏蛋白的基本结构，那么半胱氨酸扫描实验就可以顺利进行了。

半胱氨酸扫描，就是在蛋白质的不同位点，将某个氨基酸突变成为半胱氨酸，每次只突变一个位置，产生一系列的突变蛋白，也就是用突变的半胱氨酸扫描蛋白系列，这些突变体分别在大肠杆菌表达，通过分析其受化学修饰的结果情况，判断不同位置的氨基酸在细胞膜两侧的相对位置，就可以得到整个蛋白的拓扑结构图。由于半胱氨酸对蛋白特性干扰比较少，通常情况下，可以得到有部分甚至全部功能的cysteine-less蛋白突变体，而且半胱氨酸扫描只改变蛋白结构中的一个氨基酸，蛋白系列中的大多数氨基酸，突变成半胱氨酸以后对蛋白功能也不会有太大的影响，万一有影响，还可以设计突变附近的其他氨基酸，另外，由于化学修饰是在翻译、修饰并折叠完成的成熟蛋白上进行的，所以，半胱氨酸扫描在膜蛋白拓扑结构研究中，得到的结果可能是最准确的。

目前最常用的巯基修饰试剂是maleimide的衍生物(参考示意图)，例如文献中报告的有：可穿透细胞膜的[14C]NEM (N-ethylmaleimide)为同位素标记，Fluoresceinmaleimide为荧光标记，MBP (Biotinmaleimide)是生物素标记，还有不能穿透细胞膜的AmdiS (acetomaleimidedisulfonate)。由于部分巯基在蛋白序列中受空间结构影响，会出现不能被修饰的现象，可穿透的和不穿透的试剂结合应用，可以得到更加准确的判断，例如，可以先用不穿透的试剂(不标记)和完整细胞进行反应，封闭细胞外结合位点，然后再和标记的穿透试剂反应，如果蛋白被标记，可以肯定标记位点在细胞内(见示意图)，如果没有标记，还要看对照，就是没有封闭的细胞是否被标记，如果没有封闭的细胞被标记了，说明标记位点在细胞外，没有封闭的细胞也没有标记的话，说明是巯基空间构相屏蔽，无法修饰，这叫做互补实验(complementary experiment)。另外也可以用去污剂溶解细胞，解离膜蛋白，再进行蛋白修饰，此时仍然不能被修饰的蛋白，说明巯基肯定是被屏蔽了。

还要注意的一点是，正常细胞膜上表达许多不同蛋白，都可能有巯基存在，因此化学修饰总是会在许多膜蛋白上发生，进行半胱氨酸扫描实验，必须做免疫沉淀分离特异蛋白才能进行结果分析。
半胱氨酸扫描分析蛋白跨膜结构的基本过程是：
1、设计cysteine-less突变蛋白，进行基因重组表达
2、检测cysteine-less蛋白的功能，至少要保留部分功能
3、在cysteine-less突变蛋白的基础上，构建一系列突变体进行氨基酸序列扫描
4、在大肠杆菌分别表达突变体
5、设计不同组合的化学修饰方法，对一系列表达突变蛋白的菌株进行化学修饰实验
6、溶解细菌，用目的蛋白特异的抗体做免疫沉淀
7、SDS-PAGE分离IP产物
8、检测蛋白标记情况，分析跨膜拓扑结构
就目前的论文发表情况来看，如果能够选择一个比较有意义的跨膜蛋白，完成半胱氨酸扫描，得到蛋白拓扑结构，并且把蛋白的跨膜结构和其生物功能联系起来分析得到合理的解释，基本上发一篇JBC的论文应该还是没有问题的。不过半胱氨酸扫描突变蛋白构建工作量非常大，还有大量的功能分析实验要完成，这个工作也没有想象的那么简单。

最后提醒一点，如果得到一系列半胱氨酸扫描的蛋白都是有功能的，这些突变蛋白还可以用于蛋白的生物物理实验，分析蛋白空间构相、功能基团等等，我对这个方面了解甚少，仅仅提醒大家而已，有兴趣的朋友可以自己进一步学习。

2.4 BAD Tag

BAD 是Biotin Acceptor Domain的缩写。在大肠杆菌细胞浆有一种酶biotin ligase，它催化生物素(biotin)与biotin carboxyl carrier protein(BCCP)的结合反应，BCCP蛋白序列中与生物素化相关的特异性区域即BAD，这个domain约80个氨基酸，可以单独克隆表达，仍然有生物素结合功能，所以被用于表达一些融合蛋白，通过in vivo或者in vitro使融合蛋白生物素化，用卵白素(avidin)特异结合反应，可以识别和纯化融合蛋白。

由于biotin ligase是大肠杆菌的胞浆蛋白，所以BAD只有出现在胞浆内时会发生生物素化，如果BAD被转移到细胞膜外侧，这个蛋白在活细菌上(in vivo)不会被生物素化。利用这个特性，BAD tag可以代替我前面提到的LacZ融合蛋白，作为跨膜蛋白细胞内区的标记。实验证明，用BAD tag准确性明显优于LacZ，同时，BAD tag可以融合在跨膜片段的胞浆内近端，而不象PhoA融合蛋白，需要远离跨膜区一端(即需要在下一个跨膜片段前)融合才能得到比较准确的结果，作为 PhoA融合蛋白方法的一种补充，可以分析一些PhoA融合法无法解决的问题。
不过，BAD融合蛋白也有一个缺点，它不能做夹心法融合，由于BAD影响空间构相，除非夹心蛋白功能正常，否则不能得到准确结果。检测融合蛋白是否生物素化是很简单的，我们做组化实验时常用的HRP-Avidin就可以直接用于特异识别生物素，然后通过显色或者化学发光法检测蛋白。BAD tag原理和方法均与LacZ融合蛋白近似，所以不再深入讨论。

2.5 蛋白酶保护分析

蛋白质通常都有许多特异或者非特异的蛋白酶位点，跨膜蛋白序列中，跨膜区本身位于双层脂质内，因此受到保护而不会被蛋白酶消化。不过对蛋白跨膜结构分析有意义的是，在正常菌体细胞，当细胞膜完整时，胞浆内蛋白会受到保护，对于真核细胞内质网的蛋白，则是囊腔内的蛋白将受到保护。通过体外分离细胞膜并且在一定条件下重新悬浮，可以产生inside out vesicle，这时得到的结果将完全相反，通过这种互补实验，可得到比较正确的拓扑结构。我们知道目前比较常用的表达载体中，往往有一些特异标记比如6 -His，c-myc，FLAG等等，同时，为了纯化蛋白，有许多载体也加入了endokinase，Xa消化位点，如果手头正好有合适的蛋白，就地取材就可以得到一些拓扑结构信息，另外，如果前面介绍的方法都碰到一些问题时，也可以根据这个原理和思路，专门设计蛋白酶位点以及特异标记来进行实验。

我手头现在就在做一个膜蛋白，N端有6-His标记，在标记的下游(C端侧)有一个endokinase位点Xpress标记，计算机预测跨膜区不甚明确，不过即使有也只能出现在这个EK位点下游。我通过PhoA融合蛋白法已经证明蛋白的C末端是在胞浆内的，但是无法确定N末端是否被转出胞外，目前我正在设计两个实验，一是用proteinase K直接消化原生质细胞(即经过溶菌酶消化清除了细胞壁的细菌)，如果N端的标记消失，而通过C端标记仍然可以检测到一个分子量小一些的蛋白，提示N端是在膜外侧的，已经被消化掉；为了验证结果，还打算用EK进行实验，特异切割N端标记，应该得到两个小片段，这样可以准确说明N端的位置。不过原生质体对缓冲液要求很严格，否则将会溶解，在该缓冲液条件中，EK是否可以消化蛋白目前无法确定，需要实验以后才能知道。

常用的TM预测server

转自spiro:
跨膜区结构预测
Method Server
ALOM psort.nibb.ac.jp/form.html
HMMTOP www.enzim.hu/hmmtop
MEMSAT www.psipred.net
KD fasta.bioch.virginia.edu/fasta/grease.htm
PHDhtm cubic.bioc.columbia.edu/predictprotein
SOSUI sosui.proteome.bio.tuat.ac.jp/
SPLIT www.mbb.ki.se/tmap/index.html
TMAP www.mbb.ki.se/tmap/index.html
TMHMM www.cbs.dtu.dk/services/TMHMM-2.0

举报/Report

我的更多文章

下载客户端阅读体验更佳

APP专享

新浪博客

[转载]蛋白疏水分析、跨膜区预测以及拓扑结构的生化分析

分享

我的更多文章

下载客户端阅读体验更佳

疯狂捕鱼