新浪博客

SWISS-MODEL 工作原理

2010-03-18 16:24阅读:
同源建模方法预测蛋白结构一般包含以下四步:1、模板选择;2、目标序列模板序列比对;3、构建模型;4、评价。
不断重复如上步骤直到找到一个令人满意的模型。SWISS-MODEL开发了几套不同的建模技术。SWISS-MODEL的预测方法可以被描述为以α-螺旋和β-折叠为基础的'刚性片段组装'。
1、模板选择
SWISS-MODEL服务器模板数据库ExPDB是由PDB中提取的:PDB文件被分成确定蛋白链和不确定蛋白链,去掉不确定蛋白链(理论模型或仅提供α-碳坐标的质量较差的数据文件)。SWISS-MODEL吸收了额外的有用信息,如可能的四级结构信息,明确的标志信息(经验力场能、ANOLEA平均势能得分)。对于某一目标序列,SWISS-MODEL搜索模板数据库ExPDB选择合适的模板。如果对某一目标序列找不到合适的模板,但可以找到几个模板序列,经过拼凑后覆盖目标序列,SWISS-MODEL的建模过程就分成几个部分,分别进行批处理。
2、比对
使用重复最小的方块算法,每个批处理最多能接受五个模板结构。去除不匹配模板(即那些与第一个模板相比有高α-碳均方差偏离的模板),产生结构比对。目标序列与模板序列进行局部两两序列比对,然后经过一次经验步骤改进比对。插入和缺失位置的选择由模板整体结构来决定,即比对产生的孤立的残基被移动到临近的无规则卷曲结构。
3、建模
多个模板结构主干原子的位置经过平均形成预测模型的核心。首先去除那些显著偏离原子的位置,然后某一模板的重要性由它与目标序列的相似度来决定。模板坐标不被用于比对中的插入或缺失区域。对于插入或缺失区域,片段的整体与相邻的主干的协调用“空间约束程序”(Constraint
Space Programming CSP)完成。最佳的环状结构是由力场能量、空间障碍、氢键等决定。如果不能识别出合适的环状结构,相邻的残基就被纳入片段重建,以实现更多的灵活性。当CSP给不出一个令人满意的答案并且有10个以上残基时,程序就自动搜索由实验数据得到的“环状序列文库”(loop library),寻找可以接受的环状结构。
侧链建模
模型侧链的重建是基于模板结构中相应残基的最有利位置。以保守残基开头,模型侧链通过空间等位取代模板结构侧链的方式构建。可能的侧链构型从主干依赖型旋转异构体文库(rotamer library)中选择。得分函数中着重体现氢键、二硫键,避免不利接触。
4、能量最小化
蛋白质结构几何结构的调整是建模中的最后一步。当连接刚性片段时,使用根据能量最小原理的GROMOS96力场算法进行调整。经验的力场用于发现模型构象中的错误。一般说来,能量最低化或分子动力学方法普遍不能提高模型的精度,在SWISS-MODEL中使用仅仅是使分子结构更加标准化。

四个建模步骤(模板选择,目标序列模板序列比对,建模和能量最小化)已经在ANSIC的ProModⅡ程序中实现。


SWISS-MODEL所用到的数据库: ExPDB:模板数据库,从PDB中提取高质量的数据文件组成。
ExNRL-3D:序列数据库,是ExPDB模板数据库中的序列部分,用于BLASTP2模板搜索。
环状序列文库(loop library):实验数据得到的无规则卷曲结构汇集。
旋转异构体文库(rotamer library):用于非主干氨基酸的空间构型的确定。
 
SWISS-MODEL的程序和方法

  • 序列比对 

    • BLASTP2:搜索蛋白质模板数据库ExNRL-3D,寻找与目标序列相似的模板。

    • SIM:选择序列相似性大于25%的模板或大于20个残基的工程模式的模板。

    • ProModII:根据模板生成所有可能的分子模型(model)。

  • 能量最小化原理 

    • Gromos96:能量最小化程序。

  • 模型评价 

我的更多文章

下载客户端阅读体验更佳

APP专享