KEGG
AutomaticAnnotationServe r,KEGG数据库的自动注释服务简称KAAS。在线网址为http://www.genome.jp/tools/kaas/。在我们处理无参转录组测序数据时,会用到该软件,对拼接得到的基因序列进行pathway注释。现在简单地介绍下该软件的原理及其使用方法。
l 算法原理
在KEGG数据库中,有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。对于酶来说,40-70%的序列相似性对于功能的预测有90%的准确性。直系同源基因是来自于相同的祖先的基因分化,保存在不同的物种中的功能基因。在实际操作中,可以通过双向BLAST,来判断两个基因是否是BBH(bi-directional best hit),从而来判断两个基因是否是直系同源基因。因此,对在许多物种中的直系同源基因的鉴定是对新测序的基因功能预测的最便捷的途径。而KEGG 数据库就
l
在KEGG数据库中,有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上KO(或K)标签。对于酶来说,40-70%的序列相似性对于功能的预测有90%的准确性。直系同源基因是来自于相同的祖先的基因分化,保存在不同的物种中的功能基因。在实际操作中,可以通过双向BLAST,来判断两个基因是否是BBH(bi-directional best hit),从而来判断两个基因是否是直系同源基因。因此,对在许多物种中的直系同源基因的鉴定是对新测序的基因功能预测的最便捷的途径。而KEGG 数据库就
