此博文我的上一篇博文讲述使用checkm对宏基因组Binning结果的评估。
其实checkm不仅可以对binning好的数据进行评估,还可以进一步从每一个binner中找出16s rRNA基因,以便于后续对所拼装达到的菌种的分类信息进行鉴定。
该软件包以及软件包的安装大家可分别访问以下网址:
https://github.com/Ecogenomics/CheckM
https://github.com/Ecogenomics/CheckM/wiki
对于其的安装我只说一点,在安装其之前首先需要安装pplacer (>=1.1)软件包,并将其放入系统环境中:export PATH=$PATH: /homepplacer-Linux-v1.1.alpha17
下面是该软件具体操作流程:
checkm lineage_wf bin1 bin1_check -x fasta -t 4 –nt
其中Bin1文件夹中包含了所有的拼接好的fasta文件,bin1_check中保存着所有的输出结果,-x代表拼接好的基因组序列的后缀,-nt可以挑选并预测出一个Binner中的所有基因信息。下面其中一个Binner的评估结果:
bin_out.003 {'Translation table': 11, 'GC std': 0.010094058156906055, '# ambiguous bases': 0, 'Genome size': 541248, 'Longest contig': 14451, 'N50 (scaffolds)': 2637, 'Mean scaffold length': 2405.5466666
其实checkm不仅可以对binning好的数据进行评估,还可以进一步从每一个binner中找出16s rRNA基因,以便于后续对所拼装达到的菌种的分类信息进行鉴定。
该软件包以及软件包的安装大家可分别访问以下网址:
https://github.com/Ecogenomics/CheckM
https://github.com/Ecogenomics/CheckM/wiki
对于其的安装我只说一点,在安装其之前首先需要安装pplacer (>=1.1)软件包,并将其放入系统环境中:export PATH=$PATH: /homepplacer-Linux-v1.1.alpha17
下面是该软件具体操作流程:
checkm lineage_wf bin1 bin1_check -x fasta -t 4 –nt
其中Bin1文件夹中包含了所有的拼接好的fasta文件,bin1_check中保存着所有的输出结果,-x代表拼接好的基因组序列的后缀,-nt可以挑选并预测出一个Binner中的所有基因信息。下面其中一个Binner的评估结果:
bin_out.003 {'Translation table': 11, 'GC std': 0.010094058156906055, '# ambiguous bases': 0, 'Genome size': 541248, 'Longest contig': 14451, 'N50 (scaffolds)': 2637, 'Mean scaffold length': 2405.5466666
