细菌群落结构分析:菌群α多样性 香农指数、辛普森Chao1、Rarefaction多样性
2015-12-17 08:29阅读:
物多样性测定主要有三个空间尺度:α多样性,β多样性,γ多样性。
α多样性主要关注局域均匀生境下的物种数目,因此也被称为生境内的多样性(within-habitat
diversity)
β多样性指沿环境梯度不同生境群落之间物种组成的的相异性或物种沿环境梯度的更替速率也被称为生境间的多样性(between-habitat
diversity),控制β多样性的主要生态因子有土壤、地貌及干扰等。
不同群落或某环境梯度上不同点之间的共有种越少,β多样性越大。精确地测定
β多样性具有重要的意义。这是因为:①它可以指示生境被物种隔离的程度;②β多样性的测定值可以用来比较不同地段的生境多样性;③β多样性与
α多样性一起构成了总体多样性或一定地段的生物异质性。
γ多样性描述区域或大陆尺度的多样性,是指区域或大陆尺度的物种数量,也被称为区域多样性(regional
diversity)。控制γ多样性的生态过程主要为水热动态,气候和物种形成
及演化的历史。主要指标为物种数(S)。γ多样性测定沿海拔梯度具有两种分布格局:偏锋分布和显著的负相关格局。
alpha_rarefaction.py(qiime)
via铁汉1990
这个脚本调用如下的步骤: Generate rarefied OTU
tables; compute alpha diversity metrics for each rarefied OTU
table; collate alpha diversity results; and generate alpha
rarefaction plots.
alpha_rarefaction.py
-i,
输入biom文件
-m,
mapping文件
-o,
输出文件夹
-p,
参数文件,指定求解哪些东西
-n, --num_steps
Number of steps (or rarefied OTU table sizes) to make between
min and max counts [default: 10]
-f,
强行覆盖同名的文件夹
-w,
提示有哪些程序,但不适用他们(用于排错)
-a, 平行运行
-t,
进化树文件
--min_rare_depth
The lower limit of rarefaction depths [default:
10]
-e, --max_rare_depth
The upper limit of rarefaction depths [default: median
sequence/sample count]
-O, --jobs_to_start
Number of jobs to start. NOTE: you must also pass -a to run
in parallel, this defines the number of jobs to be started if and
only if -a is passed [default: 2]
--retain_intermediate_files
Retain intermediate files: rarefied OTU tables (rarefaction)
and alpha diversity results (alpha_div). By default these will be
erased [default: False]
例子:
(1)首先把需要做的多样性指数写入txt文档中:
echo 'alpha_diversity:metricsshannon,PD_whole_tree,chao1,observed_species,goods_coverage,simpson'
> alpha_params.txt
(2)接着运行脚本(it may
need several hours):
alpha_rarefaction.py -i otu_table/otu_table.biom -m map.txt
-o div_alpha/ -p alpha_params.txt -t
rep_phylo.tre
#输入文件otu_table.biom,rep_phylo.tre
#输出结果在div_alpha/
div_alpha/alpha_rarefaction_plots/rarefaction_plots.html用网页打开,可以选择你想要表示的图形文件
log文件中显示调用的命令
python /usr/lib/qiime/bin//multiple_rarefactions.py -i
otu_table/otu_table.biom -m 10 -x 16544 -s1653 -o
div_alpha//rarefaction/
随即抽取序列,默认的最小取10条序列,最大取16544条序列,下次抽取增加1653条序列,每一步的抽取重复10次
# Alpha diversity
on rarefied OTU tables command
python /usr/lib/qiime/bin//alpha_diversity.py
-i div_alpha//rarefaction/ -o div_alpha//alpha_div/
--metrics
shannon,PD_whole_tree,chao1,observed_species,goods_coverage,simpson
-t rep_phylo.tre
sam@sam-Precision-WorkStation-T7500[mtt3] alpha_diversity.py
-s
Known metrics are: ACE, berger_parker_d, brillouin_d, chao1,
chao1_confidence, dominance, doubles, equitability, esty_ci,
fisher_alpha, gini_index, goods_coverage, heip_e, kempton_taylor_q,
margalef, mcintosh_d, mcintosh_e, menhinick, michaelis_menten_fit,
observed_species, osd, simpson_reciprocal, robbins, shannon,
simpson, simpson_e, singles, strong, PD_whole_tree
可以知道一共有哪些alpha_diversity矩阵
# Collate alpha command
python /usr/lib/qiime/bin//collate_alpha.py
-i div_alpha//alpha_div/ -o
div_alpha//alpha_div_collated/
#上一步得到的结果中,一个文件夹中包含很多个Alpha多样性矩阵,将文件夹中所有文件中涉及到同一个矩阵的内容提出来,以该矩阵命令,形成新的文件夹。
# Rarefaction plot: All metrics command
python /usr/lib/qiime/bin//make_rarefaction_plots.py -i
div_alpha//alpha_div_collated/ -m map.txt -o
div_alpha//alpha_rarefaction_plots/
作图,div_alpha/alpha_rarefaction_plots/rarefaction_plots.html用网页打开,你什么都明白了
里面提到的几个矩阵:
shannon,
菌群多样性指数
香农-威纳指数的公式是:H=-∑(Pi)(㏑Pi)
Pi=样品中属于第i种的个体的比例,如样品总个体数为N,第i种个体数为ni,则Pi=ni/N
各种之间,个体分配越均匀,H值就越大。如果每一个体都属于不同的种,多样性指数就最大;如果每一个体都属于同一种,则其多样性指数就最小
Dominance
随即取两条序列,来自同一个样品的概率Σ
(Si(Si-1))/N(N-1)
simpson
菌群多样性指数
辛普森多样性指数=随机取样的两个个体属于不同种的概率
=1-随机取样的两个个体属于同种的概率
越均匀,值越大
PD_whole_tree,

谱系alpha多样性(phylogenetic
diversity,Faith
1992):探讨进化历史的保存,应用于种群,群落,生物地理学,保护生物学。
谱系beta多样性(phylobetadiversity,Webb
2002):探讨群落或的确的谱系距离及其成因。
谱系信号与谱系结构(phylogenetic signal and
phylogenetic
structure):探讨群落和地区物种共存机制。
谱系多样性(phylogenetic diversity
PD),某个地点所有物种间最短进化分支长度之和占各节点分支长度综合的比例(Faith,1992)
群落谱系距离(phylogenetic
distance):群落I与群落II中种俩俩之间谱系分支长度之和的平均值(Webb,2002)
PD_whole_