新浪博客

spss数据分析原理—描述统计概述

2011-08-17 09:22阅读:
描述统计学是用图表和数字(统计量)来表现样本数据的分布及特征,也反映了总体分布及特征。描述统计是在数据整理的基础上进行的。
最基本的数据分析首先就要求对数据进行整理汇总,其内容包括统计分组,然后形成次数分布数列,并以次数分布的形式表现出来,以各种图形,如直方图(histogram)、条形图(bar)、饼图(pie)以及茎叶图(stem—and—left)等直观的表示数据分布状态。
次数分布表(频数分布表):第一列首先是分组标志(定性变量、定量变量),第二列是该标志出现的次数,称为频数(frequency),第三列则是在频数的基础上得到的频率,继而得到累计频率等。
根据次数分布表,可以给出五数概况值(描述统计量):上下四分位数(quartile)、中位数(medium)、最大值(maximnum)、最小值(minimum)。并用箱线图(boxplot)直观的表现,箱线图一般由上下四分位数围成一个盒子及通向奇异值和极端值的两条线段组成。
描述统计量分为三类分别表示集中趋势、离散程度、分布形状特征
1、表示位置(或集中趋势)特征的统计量
  • 总和(sum):n个数据的算术和
spss数据分析原理—描述统计概述

  • 均值(Mean):它是数据的算术平均值,描述n个数据的平均水平。
spss数据分析原理—描述统计概述
  • 众数(Mode):n个观测数据中出现次数最多的数。
  • 中位数(Median):将n个数据从大到小排列为 spss数据分析原理—描述统计概述即最小值为排在最前面,最大值排在最后面,而中位数为排在中间位置的值。
  • 百分位数(percentile):将数据从小到大排序后,处于k%位置的值成为第K百分位数。其中第50%百分位数就是中位数,第25百分位数成为四分之一分位数(上四分位数)记为Q1;第75百分位数成为四分之三分位数(下四分位数)记为Q3。
2、表示离散度的统计量
  • 方差(variance):
    spss数据分析原理—描述统计概述
  • 标准差(Std.Deviation):
spss数据分析原理—描述统计概述
  • 标准误(S.E.Mean):
spss数据分析原理—描述统计概述
  • 极差(Range):
spss数据分析原理—描述统计概述
  • 四分位极差(Interquartile Range):
spss数据分析原理—描述统计概述
3、表示分布形状特征的统计量
  • 偏度(Skewness):
spss数据分析原理—描述统计概述
偏度用来考察分布形状是否对称。当偏度接近0时,可以认为分布是对称的;当偏度值>0时称为右偏态(正偏),此时偏离均值位置的数据右侧比左侧分布更为分散;当偏度值《0时称为左偏态(负偏),此时偏离均值位置的数据左侧比右侧分布更为分散;
  • 峰度(Kurtosis):
spss数据分析原理—描述统计概述
峰度用来考察分布形状陡峭或平缓的程度(相对正态分布)。当峰值度接近0时,可以认为所研究的分布的方差与正态分布的方差相等,及分布形状的陡峭度与正态分布一致;当峰值>0时,该分布形状较为陡峭;当峰度值<0时,该分布形状较为平缓。

我的更多文章

下载客户端阅读体验更佳

APP专享