新浪博客

统计检验的意义与bootstrapping方法——《管理学问卷调查研究方法》读书笔记9

2017-08-09 20:02阅读:
6.5 统计检验的意义 在统计研究中,我们感兴趣的是相关系数,x与y要么相关,要么不相关,这种判断标准在统计上是没有问题的,但是,应用到真实的研究中可能就有点问题了。
方法论大师,爱荷华大学的Frank Schmidt教授在80年代末期就倡导一个放弃假设检验的运动。他主要论据是假设检验违背了科学分享和总结的精神。很多学术刊物不喜欢没有结果的研究,如果一个研究假设x影响y,但是假设检验不显著的话,绝大部分学术刊物会退稿。这样就产生了2个严重的后果:
1.很多设计很好的研究因为结果不显著导致石沉大海
2.导致发表的研究有正向偏差的现象。也就是说全是显著的结果而没有不显著的结果,理论上来说,应该把有效的结果喝无效的结果一并考虑,才能得到总体参数的正确估计。
由于以上的原因,Frank Schmidt提出了元分析这种统计工具。Frank Schmidt除了提出元分析的方法以外,还提倡在研究中用“置信区间“来取代假设检验,这样研究结果就无所谓显著还是不显著,也不会因为不显著就被退稿了。从这个角度看,置信区间比假设检验更有建设性。
但是为什么目前大部分研究还是采用假设检验作为主流报告形式呢?原因主要有2个,一个是习惯的问题。另一个原因是假设检验非常方便,实用。如果放弃了假设检验,评审就要单靠研究的设计,理论的强弱来决定文章接受与否。因此,目前为止假设检验还是主流,但同时把置信区间也报告出来的论文也越来越多。
6.6 未知抽样分布的假设检验方法与工具
假设验证时候需要统计量的抽样分布属于正太分布。但很多时候我们根本没法推算某些统计量的抽样分布是什么形状的。以相关系数为例,如果没有Fisher's Z转换把它的抽样分布转为正太分布是不行的。在不知道统计项的抽样分布时候,如何做假设检验呢?这需要借助'bootstrapping'方法了。
bootstrapping方法其实很简单,说穿了就是把样本看作总体,然后坐重置抽样。如果手头的样本是从一个总体中随机抽出来的样本,它对总体应该有一定代表性。通过重置抽样的方法,抽出来的子样本所组成的概率分布就是总体的一个合理的代表了。但是由于是重置抽样(抽出来记录后再放回去),字样本里的数据点可能会有重复。如
果每次抽出一个样本记录相关系数,然后不停重复这个步骤,重复个1000次,就会形成一个如下图的'不同随机样本的相关分布',接下来,把1000个相关系数从大到小排列起来,从头开始选取1000的2.5%,也就是第25个相关系数,再从最小的算起,选取1000的2.5%,也就是第975个相关系数,这两个相关系数就是临界值了。最后把我们原来样本的相关系数与这两个临界值比较,如果在两个临界值范围内,就推翻了虚无假设,x与y的相关就不是0了。
统计检验的意义与bootstrapping方法——《管理学问卷调查研究方法》读书笔记9

我的更多文章

下载客户端阅读体验更佳

APP专享