EMBOSS 是'The European Molecular Biology Open Software
Suite'的缩写,是一个开放源代码的序列分析软件包,它是一组为分子生物学家所设计的公开且免费软件。该软件能够自动识别处理以不同格式存储的数据,甚至可以通过互联网提取数据,此外同软件包一同提供的还包括大量的程序库,软件包整合了
100多个的序列分析程序,可以满足一般实验室的各种各样的序列分析要求。并且,因为该软件包同时提供了一个扩展库,它也是允许其他科学家依据自由软件精神编制、发布软件的一个平台。EMBOSS
同时将现在可以得到的一系列序列分析工具整合成一个无缝的整体。
使用者可以通过三种不同的方式使用 EMBOSS 软件:第一种是通过命令行的方式;第二种是通过 X-Windows 的方式使用 EMBOSS 软件的图形界面;第三种是内联网的方式。使用者可以免费获得以及这些软件以及相关界面程序。
通过前几节课的学习,我们已经学习了 water、needle、dottup、dotmatcher、dotpath、polydot、pepwheel、pepnet、tmap 等多种 EMBOSS 软件包中的工具,下面就对这几个工具的使用作一个简要的总结。
首先 water、needle、dottup、dotmatcher、dotpath、polydot 属于序列排比分析(Sequence Alignment)工具,上次已经做过总结,这次再简要谈一下。dotplot是以点阵图来分析序列的相似性,能够在全局直观的反映两条或多条序列的相似程度。needle 和 water 程序则是用来精确排比分析两条序列相似程度,计算得分、一致性及相似性。在 dotplot 中,dottup 是两条序列精确匹配的作图方法,这个程序的执行方式是在给定序列长度(word size) 下逐一比对,找到完全相同的序列片段。而 dotmatcher 是两条序列近似匹配的作图方法,并不像 dottup 那样要求特定长度的序列完全相同,它的执行方式是通过设定 threshold 来图示序列的相似度,只要在给定的 window size 内,各碱基或氨基酸的配对得分高于设定的threshold,便可以在图示中表现出来。Dotpath 是 Non-overlapping wo
使用者可以通过三种不同的方式使用 EMBOSS 软件:第一种是通过命令行的方式;第二种是通过 X-Windows 的方式使用 EMBOSS 软件的图形界面;第三种是内联网的方式。使用者可以免费获得以及这些软件以及相关界面程序。
通过前几节课的学习,我们已经学习了 water、needle、dottup、dotmatcher、dotpath、polydot、pepwheel、pepnet、tmap 等多种 EMBOSS 软件包中的工具,下面就对这几个工具的使用作一个简要的总结。
首先 water、needle、dottup、dotmatcher、dotpath、polydot 属于序列排比分析(Sequence Alignment)工具,上次已经做过总结,这次再简要谈一下。dotplot是以点阵图来分析序列的相似性,能够在全局直观的反映两条或多条序列的相似程度。needle 和 water 程序则是用来精确排比分析两条序列相似程度,计算得分、一致性及相似性。在 dotplot 中,dottup 是两条序列精确匹配的作图方法,这个程序的执行方式是在给定序列长度(word size) 下逐一比对,找到完全相同的序列片段。而 dotmatcher 是两条序列近似匹配的作图方法,并不像 dottup 那样要求特定长度的序列完全相同,它的执行方式是通过设定 threshold 来图示序列的相似度,只要在给定的 window size 内,各碱基或氨基酸的配对得分高于设定的threshold,便可以在图示中表现出来。Dotpath 是 Non-overlapping wo

