[转载]数据的标准化 正态化 标准正态化
2017-12-16 02:42阅读:
数据的标准化、正态化、标准正态化
熊志权
用数据说话,成了教育管理中理直气壮的话题,但是,如何科学合理地用数据去甄别、测量和评价学生和学校,这才是教育研究者要用心讨论的话题。我们也不希望用数据去绑架任何田园式的教学研究,永远要记住:“重复一次抵得上一千次t检验”,有责任的教育工作者是不会随意拿着鸡毛当令箭去向教育发号施令的。
一、数据的标准化
(一)在进行数据的标准化解说之前,我们首先回答一个问题:我们为什么要将数据进行标准化处理?
由于数据的性质不同,不便进行统一加减运算,如珠海市香洲区六年级的语文、数学、英语三科成绩,它们的平均分各不相同,标准差也各不相同,如果生硬地加在一起计算总分,就可能有失体统了,就正如美元和日元不能直接相加一样。因为每一科代表的1分各不相同,特别是总分不同的科目(不考虑权重)和难度相差较大的科目就更不能直接相加了。
如果我们有某种计算方式将原始分数进行科学合理地转换,使得珠海市香洲区六年级语、数、外三科的平均分、标准差均相同,那么就万事大吉了。
上面内容涉及到了标准差这个名词,我们先解释什么是标准差。
标准差表示成绩的离散程度。当平均分相同时,标准差小的学校教学效果较好,因为所有分数均靠近平均分,表示成绩越均衡,学生成绩越集中。而一个学校如果是天女散花般的分数,则是离散度比较大的,高分很高,低分很低,很难说这是教师教育的直接结果。
如,两个班都是8个同学,一个班的数学成绩是79、80、80、82、78、85、75、81,而另一个班的数学成绩分别是60、100、90、70、90、50、100,它们的平均分均分都是80分,但第二个班成绩离散分布强烈,标准差大,所以,一定要去衡量两个班教学效果好坏的话,第一个班教学效果要
好于第二个班(前提是前测无明显差异)
。(如果是不同学科间比较标准差并不可取,还要转换成“相对标准差”,也叫“差异系数”进行比较)
总体的标准差用“德尔塔”来表示:
![[转载]数据的标准化 <wbr>正态化 <wbr>标准正态化 [转载]数据的标准化 <wbr>正态化 <wbr>标准正态化](http://s12.sinaimg.cn/bmiddle/75f9c716gc46f4968194b&690)
式中N表示参加考人数x表示某一个学生的平均分,x拔表示平均分。这样一来,学生成绩偏离平均分越远,则标准差就越大。
(二)如何进行数据的标准化?
总有聪明人能想出这么一条伟大的公式:
即:标准分=(某个分数-平均分)/标准差。这样,就可以将数据标准化了。
上面推导有一点点烦,推导结果显示:
任何一组杂乱无章的数据,被这样一折腾,全部变成了平均数为0(平均分相同表示统一了基准,即所有科目在一条起跑线上)标准差为1的“标准”数据了(标准差相同表示统一了刻度,即保证能用相同的尺子去测量每一科的成绩),这就进行了数据的标准化。
要求一组数据的平均分和标准差,在EXCEL中也容易实现,然后代入计算公式即可计算相应的标准分。因此,没有学习SPSS的也可以求出一组数据的标准分。
我原来在中学任教时,衡量某一个班成绩的差劣,高三级长们有一个这样粗糙的方式测量和评价:
将这个班的每一个学科在学校中的名次累加,如果总数最小,那么,这个班的成绩就最好。如,高三(1)班,语文第1名,数学第2名,英语第9名,文科综合第6名,名次累加就是1+2+9+6=18,而高三(9)班,语文第3名,数学第3名,英语第6名,文科综合第5名,名次累加就是3+3+6+9=21。于是,我们认为高三(1)班成绩好。这种方式多少不一有点体现“标准分”的意思,但比较粗糙不够精细,如果再细化点,将班上每个同学的全校排名累加,这样就更有“标准分”的味道了。
从公式
标准分=(某个分数-平均分)/标准差
中可以看出,对于一组数据,平均分和标准差是一定的常数,因此,
z
是随着x变化的单调函数,x分数高的z值高,x分数低的z分低。即就是说,这样的变换是线性变换,不会改变数据的排列顺序,老子仍然是老子,儿子仍然是儿子。排在第一的怎么变也变不了老二,永远永远是第一,
不要以为数据在变换的过程中“太子换狸猫”了。只是,更加将排位精细化了。
从公式
标准分=(某个分数-平均分)/标准差
中还可以看出,对于一组数据,如果标准差较小的学科(如语文),那么,某一个同学的语文分数高出平均分较多,它的标准分就很大,如果小于平均分多,标准分就小,如高考的语文学科,它的总体标准差是比较小的(这有其学科特点),因此,语文得高分在计算标准分时这个学科就很有优势。事实上,语文这个学科学生得高分相当难,当然,想低也不会低不到哪儿去。
从另外一个角度看,标准分鼓励了强者,狠狠地打击了弱者。一个学科越是突出,标准分对它更有利。这好象符合新的课程要求:张扬个性。
这里值得一提的是,总分的标准分不是将总分的原始分直接进行标准化,而是将各科原始分标准化后,再将各科标准分累加成总分(称为z总分),注意,此时,z总分与原始总分的排序可能不一致。
最后,我们再将这个z总分标准化,这样的标准分才是总分的标准分(SPSS中自动称为zz总分)。
(三)数据标准化后的使用
标准化后的分数z分,是一个在平均分0分附近摆的分数,如果一个考生是-0.12分,说明它没有达到平均分,如果一个考生成绩是3分,则很高分了。这就是著名的“三个标准差”法则。
如果数据接近正态分布。那么,标准分的出现是有概率的。高分和低分出现的概率极低,如,1.96分以上出现的几率是2.5%,当然,根据对称性,-1.96以下的分数出现的几率也是2.5%。显著性检验的单尾、双尾就是这样来的,这些数据之外的数据出现都属于小概率或者偶发事件,小概率事件在单独一次试验中是不可能出现的,因此,这就是假设检验中“拒绝”还是“接受”的问题。
在教师教学中,我认为,这个小概率分数的出现不是教师教育的结果,即高分不是教师教出来的,低分学生也不是被教师陷害的。如果标准分在3分以上,或者-3分以下出现的几率只有百分之零点零六五(查表可知),数据标准化了,成绩可以纵向比较(同学科间比较),也可以横向比较(不同学科间比较),如果实现不同学科间的分数也可以直接进行比较了,既简化了管理程序,又提高了管理的科学性。这样,标准分在学校管理中大有用武之地。
如下表中,选取2009年珠海市香洲区的五所公办学校的中考成绩(900分标准制):
学校
|
语文标准分
|
数学标准分
|
英语标准分
|
物理标准分
|
化学标准分
|
总分标准分
|
学校1
|
498.95
|
488.01
|
513.55
|
492.98
|
497.56
|
497.44
|
学校2
|
473.53
|
489.99
|
488.65
|
470.35
|
462.7
|
479.45
|
学校3
|
484.93
|
498.72
|
505.17
|
515.14
|
502.47
|
506.73
|
学校4
|
519.14
|
506.85
|
511.71
|
516.58
|
512.7
|
515.7
|
学校5
|
519.16
|
512.33
|
510.77
|
514.89
|
517.85
|
516.56
|
如“学校1”中,学科间横向比较是:数学考得最差,英语考得最好,这是勿用置疑的。或者将它与总分标准分比较,高于总分的则做了贡献,低于总分的学科则拖了后腿。纵向比较就简单了,如语文学科,“学校5”的语文考得最好,这是勿庸置疑的。
特别注意的是,总分的标准分不是各科标准分相加再平均!广东标准分时代,公布高考分数当天,每每有各批次临界分数的学生深更半夜打电话向我惊喜地报告:熊老师,我的高考总分竟然加错了!
80年代手工计算高考总分,我的邻居就因为总分多加了十分上了大学,从此改变他这个家族的命运。但计算机时代,不可能单独出现,要么都没错,要么错了一大批。
这些学生均是空欢喜一场,因为总分是在各科标准分之和的基础上再进行了一次标准化。如上表中,“学校1”五科标准分的平均是
(498.95+488.01+513.55+492.98+497.56)/5=498.21,根本不等于最终的“总分标准分”497.44。所以,标准分对考试的管理者有这样一个十足的好处:分数就是让你摸不清头脑,迷迷糊糊的,考多少标准分不是由你说了算,而是考试院说了算,事实上,标准分不再是“分”,而是“名次”,是高厉害的血淋淋的排名分!尽管你能根据答案估计自己能考多少“分”,如果没有其它竞争对手的衬托和陪伴,谁也不会知道自己究竟考了多少“名”,这个知情权就在考试院。2007年,广东高考从标准分转换到原始分录取(因为分类的群体不同而引起社会广泛争论,于是只好放弃标准分录取),就是因为原始分如此透明引发了一些关于学科难度均衡的问题的麻烦(如2007年高考物理其实比2006年容易,但2006年用的是标准分,学生不知道自己考了多少分,社会趋于平静,而2007年高考物理由于较难而引起不小轰动)。
广东高考2007年前都是采用的标准分,并且是900分制,它是进行了线性变换,将标准分拉伸和平移了。变换公式为:
Z=100z+500将Z分扩大100倍,然后平移500个单位,即它变成了标准差为100,平均分为500的标准分了。就相当于把挤在一起的,分数(通常是-4到4分间)拉大了,方便高校甄别和选拔了。当然,线性变换公式根据需要你也可以随时制定,如标准100分,看你的喜爱和偏爱而已。
广东高考最高分900分,即z=4分,我们知道,如果是正态分布,能够达到z=4的几率是多少呢?通过查表发现,它的几率是0.000024,因此,900分考生几乎是另类了。假设广东考生60万,那么,全体考生都参加考试的高考语文学科的900分(所谓的语文状元)就高达14个!当然,单科报考人数少的学科或者分数分布特殊的学科(如最高分重迭现象严重),或许就没有900分的学生,如2003年广东高考的化学科状元就只有882分,并且有并列3个。
因此,广东高考标准分录取时代,高考状元满天飞!
(四)标准分和原始分的关系
我们来看两个考生的成绩,如下表
![[转载]数据的标准化 <wbr>正态化 <wbr>标准正态化 [转载]数据的标准化 <wbr>正态化 <wbr>标准正态化](http://s14.sinaimg.cn/bmiddle/75f9c716gc470757ccb2d&690)
甲考生的原始总分是低于乙考生的,但标准分却反过来了。为什么?
注:以上表格中的数据来自于何以建老师“SPSS初级班培训班”中的PPT。
(五)在SPSS中怎么进行数据的标准化呢?
在SPSS18.0中,很容易实现将数据的标准化,操作步骤是:
[分析]——[描述统计]——[描述]——将要选入的标准化的数据移入对话框[变量]——将左下角的[将标准化得分另存为变量z]的位置打个勾勾,最后一点[确定]就OK了。
二、数据的正态化
(待续,请您关注我的博客。一家之言,不妥当之处各位大方专家请批评斧正!)