对菌群16S
rRNA基因进行高通量测序,无疑是微生物组研究中最基础也是最常用的研究方法,能以较高的性价比揭示菌群的具体物种组成,从而解答“群落中有谁在?”的基本问题。然而,很多时候,我们更希望知道菌群行使的具体功能,也就是解释“它们在干什么?”。对菌群进行宏基因组测序自然是最佳解决方案,但如此高大上的研究方法,投入成本相对较多,分析方法也相对复杂。如果仅仅知道菌群组成,该怎么把物种的“身份”和它的“功能”对应起来呢?
由此,一款名为PICRUSt的菌群代谢功能预测利器应运而生,相关论文发表在权威期刊《Nature Biotechnology》上[1]。
PICRUSt全称为“Phylogenetic Investigation of Communities byReconstruction of Unobserved States”,可以通过16S rRNA基因序列,预测对应的细菌和古菌的代谢功能谱。
有了PICRUSt,相当于在菌群的“组成”和“功能”之间搭起了一座桥,即使只有16S rRNA基因的测序结果,我们一样可以获得宏基因组级别的研究结果!
1、PICRUSt的基本原理
PICRUSt的总体思路说来很简单,主要分为3步:
1. 先根据已测微生物基因组的16S rRNA基因全长序列,推断它们的共同祖先的基因功能谱;
2. 对Greengenes数据库中其它未测物种的基因功能谱进行推断,构建古菌和细菌域全谱系的基因功能预测谱;
3. 最后,将测序得到的菌群组成“映射”到数据库中,对菌群代谢功能进行预测。该步骤具体通过以下方式实现:
i. 对测序获得的16S rRNA基因序列,进行“封闭式”参考OTU划分(Closed-reference OTU picking),通过与Greengenes数据库比对,寻找每一条测序序列的“参考序列最近邻居”,并归为参考OTU;
ii. 根据“参考序列最近邻居”的rRNA基因拷贝数,对获得的OTU丰度矩阵进行校正;
iii. 根据“参考序列最近邻居”对应的KEGG/EggNOG等基因功能谱数据,换算预测菌群的整体代谢功能。
2、ICRUSt的特点
PICRUSt算法的一大特点,就是基于Greengenes的16S rRNA基因全
由此,一款名为PICRUSt的菌群代谢功能预测利器应运而生,相关论文发表在权威期刊《Nature Biotechnology》上[1]。
PICRUSt全称为“Phylogenetic Investigation of Communities byReconstruction of Unobserved States”,可以通过16S rRNA基因序列,预测对应的细菌和古菌的代谢功能谱。
有了PICRUSt,相当于在菌群的“组成”和“功能”之间搭起了一座桥,即使只有16S rRNA基因的测序结果,我们一样可以获得宏基因组级别的研究结果!
1、PICRUSt的基本原理
PICRUSt的总体思路说来很简单,主要分为3步:
1. 先根据已测微生物基因组的16S rRNA基因全长序列,推断它们的共同祖先的基因功能谱;
2. 对Greengenes数据库中其它未测物种的基因功能谱进行推断,构建古菌和细菌域全谱系的基因功能预测谱;
3. 最后,将测序得到的菌群组成“映射”到数据库中,对菌群代谢功能进行预测。该步骤具体通过以下方式实现:
i. 对测序获得的16S rRNA基因序列,进行“封闭式”参考OTU划分(Closed-reference OTU picking),通过与Greengenes数据库比对,寻找每一条测序序列的“参考序列最近邻居”,并归为参考OTU;
ii. 根据“参考序列最近邻居”的rRNA基因拷贝数,对获得的OTU丰度矩阵进行校正;
iii. 根据“参考序列最近邻居”对应的KEGG/EggNOG等基因功能谱数据,换算预测菌群的整体代谢功能。
2、ICRUSt的特点
PICRUSt算法的一大特点,就是基于Greengenes的16S rRNA基因全
