新浪博客

R语言ade4包PCA主成分分析步骤

2018-08-27 17:25阅读:
source('http://bioconductor.org/biocLite.R') ##启动Bioconductor
biocLite(“ade4”) ##安装ade4
library(ade4) ##调用ade4
setwd(“D:/”) ##设置文件存档地址
getwd() ##查看文件存档地址
gene<-read.table('1.txt', header=T,sep='') ##读取文件

文件格式如下:
R语言ade4包PCA主成分分析步骤
第一列为分组信息,如果是两组,暂且分为01
head(gene) ##查看文件信息

row.names=1 ##第一列为样本名称
y<-as.factor(gene$name)##第二列为分组因子
pca1<-dudi.pca(gene[,3:7],scann=F,nf=7) ##nf代表因子数,这里总共涉及到gene3-7所以设置为7
gcol = c(3, 2)#作图时点的颜色
s.class(dfxy = pca1$li, fac = y, col = gcol, xax = 1, yax = 2)#分类作图
R语言ade4包PCA主成分分析步骤
names(pca1) ##总共输出13箱都是输出结果
[1] 'tab' 'cw' 'lw' 'eig' 'rank' 'nf' 'c1' 'li' 'co' 'l1' 'call' 'cent' 'norm' 每一项都有特殊意义,其中eig代表的是特征值
pca1$eig ## 输出特征值
[1] 3.5966164 0.6514622 0.3079472 0.2774258 0.1665484

barplot(pca1$eig) ##画出特征值碎石图
R语言ade4包PCA主成分分析步骤
kip <- 100 * pca1$eig/sum(pca1$eig) ##查看特征值贡献率命令
kip
[1] 71.932328 13.029243 6.158943 5.548516 3.330968


我的更多文章

下载客户端阅读体验更佳

APP专享