前面已经写完了疏水区的预测,蛋白跨膜区预测的最重要基础实际上就是疏水区预测,但是跨膜区以及跨膜拓扑结构的预测比这要复杂得多,我说过我在这方面是外行,很幸运,今天找到了一篇去年的综述,内容非常全面,包括spiro提到的几个方法都有介绍,我就偷懒了(另一方面也是避免露馅),直接把这篇综述贴上来给大家一起学习吧。当然,你想偷懒看中文就没戏了,不过真正有兴趣的朋友一定不会错过这篇文献的。 这里是摘要: Abstract: Membrane
proteins are crucial for many biological functions and have become
attractive targets for pharmacological agents. About 10%-30% of all
proteins contain membrane-spanning helices. Despite recent
successes, high-resolution structures for membrane proteins remain
exceptional. The gap between known sequences and known structures
calls for finding solutions through bioinformatics. While many
methods predict membrane helices, very few predict membrane
strands. The good news is that most methods for helical membrane
proteins are available and are more often right than wrong. The
best current prediction methods appear to correctly predict all
membrane helices for about 50%-70% of all proteins, and to falsely
predict membrane helices for about 10% of all globular proteins.
The bad news is that developers have seriously overestimated the
accuracy of their methods. In particular, while simple
hydrophobicity scales identify many membrane helices, they
frequently and incorrectly predict membrane helices in globular
proteins. Additionally, all methods tend to confuse signal peptides
with membrane helices. Nonetheless, wet-lab biologists can reach
into an impressive toolbox for membrane protein predictions.
However, the computational biologists will have to improve their
methods considerably before they reach the levels of accuracy they
claim. 我的主要内容在后面的生化分析,但是可能会拖比较长的时间才能完成,请大家谅解。 2、膜蛋白拓扑结构的生化分析 所谓膜蛋白拓扑结构,实际上就是描述一个跨膜蛋白有几个跨膜区,这些跨膜区是由里向外,还是由外向里,N端和C端分别是在膜内还是在膜外。对于原核生物,因为没有胞内膜系统,跨膜,实际上就是跨细胞膜,对于真核生物,情况复杂一些,不过规律是一样的,值得注意的是,从拓扑结构来说,内质网的外侧等同于细胞内,而内质网的囊腔(lumen)则相当于细胞膜外侧,这一点在分析真核细胞拓扑结构时一定要搞清楚,因为跨膜蛋白合成一般都是在内质网完成,蛋白合成的同时即实现跨膜转移,所以真核细胞的拓扑结构生化分析通常是用内质网系统来进行的。 跨膜结构的生化分析,通常以计算机预测作为实验设计的基础。由于生物膜的的相对不通透性,膜两侧出现不同的分隔区,如果在预测的跨膜片段前、后附加适当标记,这个标记出现在膜内或者膜外将会有不同的生化表现,就可以验证预测的跨膜区是否真正的跨膜片段,而且可以知道这个片段的跨膜方向(N-in,C-out 或者
N-out, C-in)。对于有多个跨膜区的膜蛋白,则需要逐个分析确认。 2.1 原核细胞:Enzyme Tags 用大肠杆菌做研究模型,目前已经有三种酶可以作为标记,用来研究蛋白跨膜结构,这三种酶是:碱性磷酸酶(PhoA),beta-galactosidase(LacZ),beta-lactamase(内酰胺酶?Bla),他们有一个共同特点,就是表达在细胞浆与转运到细胞膜外会出现不同的酶活性。PhoA前体蛋白有一个信号肽(实际上就是N-in,C-out跨膜片段),PhoA只有通过信号肽跨膜分泌到细胞膜外侧(在大肠杆菌实际上是进入periplasm),才会正确折叠并形成双体,从而具有酶活性。如果PhoA多肽表达在细胞内而不能分泌到膜外侧,则无法完成折叠,因此没有酶活性。LacZ的表现恰恰相反,这个蛋白只有在细胞浆内才会表现出酶活性,如果在LacZ的N端附加一个信号肽把蛋白转运分泌到细胞外,将无法正确折叠,失去酶活性。Bla是抗生素领域的一个重要的酶,内酰胺类抗生素(青霉素及先锋类)的作用原理是阻碍细胞壁的合成,而Bla则会分解这些抗生素的内酰胺环,从而保护细菌,使其免受抗生素的影响,因此表达Bla的菌株通常是对青霉素和先锋类耐药的。Bla的作用部位既然在细胞壁合成途径,它当然需要进入periplasm才能起作用,所以没有转运信号的Bla是实际上是不具有生物活性的。 根据以上这些酶的特点,实验设计通常是这样的:根据计算机预测结果,在预测跨膜区的前面或者后面选择一个点中断(truncate)目的蛋白质的肽链,然后与以上三个酶之一形成融合蛋白,这叫做C-terminaldeletion fusion,形成的融合蛋白,根据跨膜区的走向,例如一个N-in,C-out跨膜区(类似于信号肽),如果融合点在跨膜区的N端一侧(参见示意图B-1),则酶的多肽区将在细胞内,如果融合点在跨膜区的C端一侧,则酶的多肽区将被前面的跨膜信号转运到膜外侧(见图A),如果跨膜区是反向的(N-out,C-in),则两种融合蛋白的标记酶都在细胞内(见图B-2)。对于多个跨膜区的蛋白,以同样方式可以设计多个融合点,通常融合点的设计都是安排在跨膜区的前后loop,而不在跨膜区里面,以免标记酶系列进入膜内干扰跨膜区结构,如示意图的C、D(某些情况下可以设计融合点在跨膜区内,后面还要介绍)。 融合蛋白的表达,当然是通过质粒DNA重组的方式实现的。特别需要提到的是,因为PhoA和Bla两个蛋白本身就是分泌蛋白,他们的原始系列里面是有跨膜信号肽的,设计融合蛋白的时候,这个信号肽当然不能包括进来,所以在融合蛋白里面的PhoA和Bla氨基酸系列,实际上是成熟蛋白(maturepeptide)的系列。 得到含有重组子的细菌以后,首先要通过westernblot证明融合蛋白的表达。这三个酶的抗体都已经有商业化的产品(不过我用SIGMA的PhoA单克隆抗体检测我的融合蛋白却没有成功,据说某些抗体可以检测天然蛋白,却不能与融合蛋白反应,我最后还是从别人实验室要的抗体才得到western结果)。表达融合蛋白的大肠杆菌,可以通过培养皿直接检测酶活性(PhoA和LacZ是通过显色反应,Bla是通过ampicillin拮抗性检测),PhoA和LacZ的活性还可以通过液体培养后进行显色反应得到一个定量的结果,某些情况下活性的定量也是有意义的,后面还要提到。根据酶活性的结果,就可以判断融合蛋白的融合点是在细胞膜外侧,还是在胞浆里面。例如示意图中,A、D融合蛋白PhoA是有活性的,而B-1、B-2和C融合蛋白PhoA是没有活性的。用LacZ做融合蛋白,酶活性结果将和PhoA的结果完全相反,所以,这两个方法被不少人用来做互补实验,以进一步确认实验的准确性。 除了C-terminal deletion
fusion方法以外,还有人用夹心法融合(sandwichfusion),也就是把酶标记插入蛋白质系列的中间,而损失膜蛋白的原始系列,这样可以相对保持被研究的蛋白质整个拓扑结构的完整性,希望通过这种办法得到更加可靠的结果。但是这种方法在膜蛋白中间夹入一个相当长的酶,所以仍然无法保证蛋白的正常跨膜结构形成,除非可以证明这种方法得到的融合蛋白是有天然蛋白的正常功能,否则夹心法得到的结果不见得比C-terminaldeletion fusion得到的结果更好。 总的来说,无论是C-terminal
deletion fusion 还是 sandwichfusion,有一个基本的假设就是:膜蛋白在被改造(truncated,sandwich)形成融合蛋白以后,其跨膜拓扑结构仍然能够维持原来天然蛋白的方式。实际上,融合蛋白的跨膜结构将受到膜蛋白本身序列、标记酶序列和融合点三方面的影响。经过多年许多实验室的研究结果和一些已经结晶的蛋白质结构对比,以及和其他途径获得的蛋白结构信息对比,至少大部分膜蛋白经过酶标记分析得到的拓扑结构是完全正确的。同时,也有一些实验结果发现了一些融合蛋白表现和天然蛋白不同的结果,下面是一些已经发现的问题: 1、LacZ的活性表现在细胞内,因此只有被转运到细胞外才会失活,如果细胞跨膜转运机制出现饱和(saturation of exportmachinery),或者部分酶正好嵌入在细胞膜内,出现漏入细胞内的情况,将出现假阳性结果,相对而言,PhoA和Bla的活性必须有一个完整的出膜信号存在才能出现,因此一旦发现阳性,往往可以肯定跨膜信号的存在。许多互补实验的结果证明,用PhoA和Bla作为酶标记得到的跨膜结构,特别是出膜信号,结果更加准确,所以目前大多数研究已经不用LacZ作为标记酶。 2、融合位点的设计,应该离跨膜区远一些,一般可以设计在下一个跨膜区的前面(C-terminal end of cytoplasmicloops),这样保证loop能够稳定信号区结构,实验发现,PhoA融合在一个入胞跨膜信号的后面,如果离入胞信号太近,丧失了胞内区的亲水氨基酸,这个跨膜区可能无法稳定在细胞膜,可能出现阳性结果。 3、如果一个出膜信号的氨基酸序列中有一些亲水氨基酸存在,这个出膜信号可能不够强,融合在这个出膜信号后面的PhoA或者Bla会无法被转运,因此出现阴性结果,对于这种跨膜结构的分析需要特别谨慎。另外一种情况是,示意图中的B-2,虽然其N端是在膜外的,但是这种出膜信号无法通过C-terminal deletion fusion实验来分析,无论融合点在那里,PhoA总是阴性的,因此需要用到以后介绍的一些方法。 4、对于有些穿膜信号,可能只要其中某一部分就已经可以完成跨膜任务,因此融合位点的设计可以在跨膜区中间,这种设计用于PhoA标记的研究,有时候可以准确分析跨膜区的中间点,因为融合到跨膜区的不同位点,将得到一系列不同强度的酶活性,因此而推断出整个跨膜区序列,这种方法要求对PhoA进行定量分析。 总之,通过酶标记融合蛋白的方法研究膜蛋白的拓扑结构是一个很有实用价值的方法,结合计算机预测的结果进行实验设计和分析,往往可以得到大多数膜蛋白的正确结构。但是少数情况下会出现一些异常结果,如果和预测的结果不符合,就需要增加融合位点,采用不同酶标,或者用其他一些方法来进一步分析。还要特别说明的是,尽管酶标记的方法是用大肠杆菌做实验模型,但是,对于真核细胞的跨膜蛋白分析,同样也可以用这个系统来实现,因为大肠杆菌实验条件要求相对于真核细胞实验来说要简单得多,用于真核蛋白的研究仍然不失为一个很好的手段。对于一些融合蛋白,其跨膜表现和天然蛋白不同,虽然会影响膜蛋白结构的研究,然而另一方面,深入分析这些不同,也可能会发现跨膜信号的形成机制中我们还没有认识到的东西,从而改进膜蛋白跨膜结构的研究方法。 2.2 真核细胞:Glycosylation Tags 糖基化在真核细胞膜蛋白翻译后修饰中是一个普遍现象,糖基结合位点在NXT/S保守序列的Asn侧链氨基上,这个修饰是由寡糖基转移酶(Oligosaccharyl
Transferase,OST)完成的。由于OST本身是一个跨膜蛋白,其催化基团在内质网的囊腔内,糖基化只能发生在跨膜蛋白的囊腔内区域,也就是膜外区,这种特点因此可以被用来研究跨膜蛋白的拓扑结构。实验设计几乎和大肠杆菌的PhoA实验完全相同,不同的是在这里作为标记的是糖基化的保守序列而不是PhoA,同时必须在真核细胞系统(细胞整体或者体外翻译系统)进行实验。糖基化修饰的蛋白分子量会增加2.5kDa左右,在普通SDS-PAGE电泳中通过对比即可明确,为了确定是糖基化造成的分子量迁移,可以用糖基酶(Glycosidase)消化糖基,或者在翻译系统中加入糖基化抑制剂(tunicamycin)或糖基化竞争片段(例如Ac-NYT-NH2,N-benzoyl-NLT-N-methylamide,其中NYT和NLT都是糖基化保守区),如果处理后得到的蛋白没有分子量迁移,可以肯定迁移是糖基化造成的。 用糖基化标记研究跨膜蛋白的拓扑结构也有两种不同策略,即C-terminal
deletion fusion和Sandwichfusion,后者一般称为糖基化扫描(Glycosylation
Scanning)。 C-terminal deletionfusion方法几乎和PhoA融合蛋白完全一样,通常选一个肯定会发生糖基化的多肽区域(这个标记片段往往根据实验室的方便来选择,可以根据自己手头已经有的蛋白,选一个区域来作为标记),融合到要研究的蛋白质某个位点(膜内或者膜外区)C末端,在体外翻译系统中,加入内质网系统(Microsome)则蛋白将发生糖基化,如果不加入内质网,蛋白则不发生糖基化,通过对比不同翻译系统产生的蛋白质的分子量,即可明了标记蛋白片段是在膜内(不发生糖基化)还是在膜外(即内质网的囊腔,发生糖基化),从而确定融合位点的相对位置。文献报道常用的标记片段是胃壁细胞的H+K+ATPasebeta亚基的C端区,共有5个糖基化位点,因为已经通过许多实验证实这个片段只要进入内质网的囊腔,就会发生糖基化,故可作为经典的糖基化标记。 糖基化扫描的实验设计相对复杂一些,通常是选择一个相对比较短的(甚至只有三个氨基酸NXS,一个糖基化位点或者四个氨基酸NNSS,两个糖基化位点)标记,插入膜内或者膜外区域某个点中间,通过设计一系列的突变体,标记蛋白质不同区域(即扫描),为了保证这个位点是蛋白序列的唯一糖基化位点,先必须通过DNA突变把蛋白质内所有可能发生糖基化的位点都清除掉,这样得到的蛋白质如果发生糖基化,即说明标记位点在内质网囊腔内。由于糖基化扫描可以插入很短的序列作为标记,在维持蛋白的折叠、拓扑结构方面有明显优点。但是在实验设计中有三个问题必须注意: 1、糖基化位点与跨膜区的距离:因为OST的催化基团与细胞膜本身有一定空间距离,如果糖基化位点太接近蛋白跨膜区,这个位点和催化基团无法接触,将不会发生糖基化。实验证明,糖基化区域的细胞内环至少需要30个氨基酸,其中与上游(N端)跨膜区距离必须超过14个氨基酸,与下游(C端)跨膜区距离须超过12个氨基酸,因此如果预测膜内(外)区过短,需要设计比较长的插入标记才能得到正确结果。不过,这个特点可以用来确定跨膜区的开始和结束的位置。 2、如果突变、标记以后蛋白质不具有功能,说明蛋白质的折叠可能发生了变化,糖基化标记得到的信息即有可能是错误的。当然也有人认为,如果蛋白质折叠发生错误,将在进入细胞膜以前即被蛋白酶消化而降解,所以只要能得到膜蛋白表达,大多数情况下其结果都是可靠的,如果标记蛋白功能正常(或者保持部分功能),糖基化扫描的结果将是非常有说服力的。 3、由于糖基化受蛋白空间结构、催化位点与糖基化位点相互作用等因素影响,虽然糖基化阳性说明标记位点在膜外,糖基化阴性却不能完全排除其在膜外的可能性,阴性结果必须得到其他实验的验证。 糖基化标记法虽然是通过真核细胞翻译系统进行实验,但是原核细胞的蛋白如果在这个系统中翻译表达,同样可以发生糖基化,所以这个方法用于原核细胞的跨膜蛋白研究,也有成功的报道。 2.3 Cysteine Scanning 半胱氨酸扫描实验 半胱氨酸是一个非常特殊的氨基酸,它的巯基是一个活跃基团,在蛋白折叠、多聚体形成以及酶活性中心里面都扮演重要角色。在细胞跨膜蛋白分析中,利用巯基容易受化学修饰的特性,通过标记的巯基修饰试剂来分析半胱氨酸的位置,这个实验也多半在大肠杆菌体系完成(对于真核细胞,目前只能用于研究细胞膜的蛋白,不能研究表达于细胞器膜上的蛋白),其原理也非常简单,在完整细胞中,有些巯基修饰剂不能穿透细胞,因此只能和膜外侧的巯基发生反应,给巯基修饰剂带上标记(同位素、荧光或者生物素),和完整细胞进行反应,细胞外侧的半胱氨酸将出现阳性标记,如果蛋白中的巯基没有被标记,说明这个巯基的位置是在细胞内。 由于半胱氨酸可能出现于蛋白原始的序列中,所以实验第一步是必须得到一个没有半胱氨酸的突变蛋白,通常把蛋白序列里的所有氨基酸都要突变成侧链是羟基的丝氨酸,然后检测该突变蛋白的功能,如果突变蛋白有一定功能,说明突变本身没有破坏蛋白的基本结构,那么半胱氨酸扫描实验就可以顺利进行了。 半胱氨酸扫描,就是在蛋白质的不同位点,将某个氨基酸突变成为半胱氨酸,每次只突变一个位置,产生一系列的突变蛋白,也就是用突变的半胱氨酸扫描蛋白系列,这些突变体分别在大肠杆菌表达,通过分析其受化学修饰的结果情况,判断不同位置的氨基酸在细胞膜两侧的相对位置,就可以得到整个蛋白的拓扑结构图。由于半胱氨酸对蛋白特性干扰比较少,通常情况下,可以得到有部分甚至全部功能的cysteine-less蛋白突变体,而且半胱氨酸扫描只改变蛋白结构中的一个氨基酸,蛋白系列中的大多数氨基酸,突变成半胱氨酸以后对蛋白功能也不会有太大的影响,万一有影响,还可以设计突变附近的其他氨基酸,另外,由于化学修饰是在翻译、修饰并折叠完成的成熟蛋白上进行的,所以,半胱氨酸扫描在膜蛋白拓扑结构研究中,得到的结果可能是最准确的。 目前最常用的巯基修饰试剂是maleimide的衍生物(参考示意图),例如文献中报告的有:可穿透细胞膜的[14C]NEM(N-ethylmaleimide)为同位素标记,Fluoresceinmaleimide为荧光标记,MBP(Biotinmaleimide)是生物素标记,还有不能穿透细胞膜的AmdiS(acetomaleimidedisulfonate)。由于部分巯基在蛋白序列中受空间结构影响,会出现不能被修饰的现象,可穿透的和不穿透的试剂结合应用,可以得到更加准确的判断,例如,可以先用不穿透的试剂(不标记)和完整细胞进行反应,封闭细胞外结合位点,然后再和标记的穿透试剂反应,如果蛋白被标记,可以肯定标记位点在细胞内(见示意图),如果没有标记,还要看对照,就是没有封闭的细胞是否被标记,如果没有封闭的细胞被标记了,说明标记位点在细胞外,没有封闭的细胞也没有标记的话,说明是巯基空间构相屏蔽,无法修饰,这叫做互补实验(complementaryexperiment)。另外也可以用去污剂溶解细胞,解离膜蛋白,再进行蛋白修饰,此时仍然不能被修饰的蛋白,说明巯基肯定是被屏蔽了。 还要注意的一点是,正常细胞膜上表达许多不同蛋白,都可能有巯基存在,因此化学修饰总是会在许多膜蛋白上发生,进行半胱氨酸扫描实验,必须做免疫沉淀分离特异蛋白才能进行结果分析。 半胱氨酸扫描分析蛋白跨膜结构的基本过程是: 1、设计cysteine-less突变蛋白,进行基因重组表达 2、检测cysteine-less蛋白的功能,至少要保留部分功能 3、在cysteine-less突变蛋白的基础上,构建一系列突变体进行氨基酸序列扫描 4、在大肠杆菌分别表达突变体 5、设计不同组合的化学修饰方法,对一系列表达突变蛋白的菌株进行化学修饰实验 6、溶解细菌,用目的蛋白特异的抗体做免疫沉淀 7、SDS-PAGE分离IP产物 8、检测蛋白标记情况,分析跨膜拓扑结构 就目前的论文发表情况来看,如果能够选择一个比较有意义的跨膜蛋白,完成半胱氨酸扫描,得到蛋白拓扑结构,并且把蛋白的跨膜结构和其生物功能联系起来分析得到合理的解释,基本上发一篇JBC的论文应该还是没有问题的。不过半胱氨酸扫描突变蛋白构建工作量非常大,还有大量的功能分析实验要完成,这个工作也没有想象的那么简单。 最后提醒一点,如果得到一系列半胱氨酸扫描的蛋白都是有功能的,这些突变蛋白还可以用于蛋白的生物物理实验,分析蛋白空间构相、功能基团等等,我对这个方面了解甚少,仅仅提醒大家而已,有兴趣的朋友可以自己进一步学习。
2.4 BAD Tag BAD 是Biotin AcceptorDomain的缩写。在大肠杆菌细胞浆有一种酶biotin
ligase,它催化生物素(biotin)与biotin carboxyl carrierprotein(BCCP)的结合反应,BCCP蛋白序列中与生物素化相关的特异性区域即BAD,这个domain约80个氨基酸,可以单独克隆表达,仍然有生物素结合功能,所以被用于表达一些融合蛋白,通过invivo或者in vitro使融合蛋白生物素化,用卵白素(avidin)特异结合反应,可以识别和纯化融合蛋白。 由于biotinligase是大肠杆菌的胞浆蛋白,所以BAD只有出现在胞浆内时会发生生物素化,如果BAD被转移到细胞膜外侧,这个蛋白在活细菌上(invivo)不会被生物素化。利用这个特性,BAD
tag可以代替我前面提到的LacZ融合蛋白,作为跨膜蛋白细胞内区的标记。实验证明,用BADtag准确性明显优于LacZ,同时,BADtag可以融合在跨膜片段的胞浆内近端,而不象PhoA融合蛋白,需要远离跨膜区一端(即需要在下一个跨膜片段前)融合才能得到比较准确的结果,作为PhoA融合蛋白方法的一种补充,可以分析一些PhoA融合法无法解决的问题。 不过,BAD融合蛋白也有一个缺点,它不能做夹心法融合,由于BAD影响空间构相,除非夹心蛋白功能正常,否则不能得到准确结果。检测融合蛋白是否生物素化是很简单的,我们做组化实验时常用的HRP-Avidin就可以直接用于特异识别生物素,然后通过显色或者化学发光法检测蛋白。BADtag原理和方法均与LacZ融合蛋白近似,所以不再深入讨论。 2.5 蛋白酶保护分析 蛋白质通常都有许多特异或者非特异的蛋白酶位点,跨膜蛋白序列中,跨膜区本身位于双层脂质内,因此受到保护而不会被蛋白酶消化。不过对蛋白跨膜结构分析有意义的是,在正常菌体细胞,当细胞膜完整时,胞浆内蛋白会受到保护,对于真核细胞内质网的蛋白,则是囊腔内的蛋白将受到保护。通过体外分离细胞膜并且在一定条件下重新悬浮,可以产生insideout vesicle,这时得到的结果将完全相反,通过这种互补实验,可得到比较正确的拓扑结构。我们知道目前比较常用的表达载体中,往往有一些特异标记比如6-His,c-myc,FLAG等等,同时,为了纯化蛋白,有许多载体也加入了endokinase,Xa消化位点,如果手头正好有合适的蛋白,就地取材就可以得到一些拓扑结构信息,另外,如果前面介绍的方法都碰到一些问题时,也可以根据这个原理和思路,专门设计蛋白酶位点以及特异标记来进行实验。 我手头现在就在做一个膜蛋白,N端有6-His标记,在标记的下游(C端侧)有一个endokinase位点Xpress标记,计算机预测跨膜区不甚明确,不过即使有也只能出现在这个EK位点下游。我通过PhoA融合蛋白法已经证明蛋白的C末端是在胞浆内的,但是无法确定N末端是否被转出胞外,目前我正在设计两个实验,一是用proteinaseK直接消化原生质细胞(即经过溶菌酶消化清除了细胞壁的细菌),如果N端的标记消失,而通过C端标记仍然可以检测到一个分子量小一些的蛋白,提示N端是在膜外侧的,已经被消化掉;为了验证结果,还打算用EK进行实验,特异切割N端标记,应该得到两个小片段,这样可以准确说明N端的位置。不过原生质体对缓冲液要求很严格,否则将会溶解,在该缓冲液条件中,EK是否可以消化蛋白目前无法确定,需要实验以后才能知道。 常用的TM预测server 转自spiro: 跨膜区结构预测 Method Server ALOM psort.nibb.ac.jp/form.html HMMTOPwww.enzim.hu/hmmtop MEMSATwww.psipred.net KD
fasta.bioch.virginia.edu/fasta/grease.htm PHDhtm cubic.bioc.columbia.edu/predictprotein SOSUI
sosui.proteome.bio.tuat.ac.jp/ SPLITwww.mbb.ki.se/tmap/index.html TMAPwww.mbb.ki.se/tmap/index.html TMHMMwww.cbs.dtu.dk/services/TMHMM-2.0