如何将非正态分布数据转化为正态分布
2013-11-08 18:20阅读:
本文转载自:
http://user.qzone.qq.com/394092593/main#!app=2&via=QZ.HashRefresh&pos=1380882112
SPSS和SAS常用正态检验方法
许多计量资料的分析方法要求数据分布是正态或近似正态,因此对原始独立测定数据进行正态性检验是十分必要的。
通过绘制数据的频数分布直方图来定性地判断数据分布正态性。这样的图形判断决不是严格的正态性检验,它所提供的信息只是对正态性检验的重要补充。
正态性检验主要有三类方法:
一、计算综合统计量
如动差法、夏皮罗-威尔克Shapiro-Wilk
法(W 检验) 、达戈斯提诺D′Agostino
法(D 检验) 、Shapiro-Francia
法(W′检验) .
二、正态分布
的拟合优度检验 如皮尔逊χ2
检验 、对数似然比检验
、柯尔莫哥洛夫Kolmogorov-Smirov
法检验 .
三、图示法(正态概率图Normal Probability plot)
如分位数图(Quantile
Quantileplot ,简称QQ 图)
、百分位数(Percent Percent
plot ,简称PP 图)
和稳定化概率图(Stablized
Probability plot ,简称SP 图) 等.
下面介绍几种较统计软件中常用的正态性检验方法
1、用偏态系数和峰态系数检验数据正态性
偏态系数Sk,它用于检验不对称性;峰态系数Ku,它用于检验峰态。 S k= 0, K u= 0 时, 分布呈正态, S
k> 0 时, 分布呈正偏态,S k < 0 时, 分布呈负偏态。适用条件:样本含量应大于200
2、用夏皮罗-威尔克(Shapiro-Wilk)法检验数据正态性
即W检验,1965 年提出,适用于样本含量n ≤50
时的正态性检验;。
这个检验没有独立的菜单,所以不熟悉SPSS的人可能不太任意找到。
Shapiro-Wilk检验是一种进行正态性检验的方法。
它是一个统计描述的附加部分。可以通过以下方法完成。
analysis-descriptive statistics -Export
点Plot按钮,
选中Normal plot with test
这样就可以对选择的变量进行正态性检验了,结果会有Kolmogorov-Smirnov检验(简称K-S检验)和Shapiro-Wilk检验
3、用达戈斯提诺(D′Agostino)法检验数据正态性
即D检验,1971提出,正态性D检验该方法效率高,是比较精确的正态检验法。
4、Shapiro-Francia 法
即W′检验,于1972 年提出,适用于50 < n < 100 时的正态性检验。
5、QQ图或PP图
散点聚集在固定直线的周围,可以认为数据资料近似服从正态分布
SPSS&SAS规则:
SPSS 规定:当样本含量3 ≤n ≤5000 时,结果以Shapiro - Wilk (W 检验)
为难,当样本含量n > 5000 结果以Kolmogorov - Smirnov
为准。
而SAS 规定:当样本含量n ≤2000 时,结果以Shapiro - Wilk (W 检验)
为准,当样本含量n >2000 时,结果以Kolmogorov - Smirnov (D 检验)
为准。