每次研究生答辩,委员会们为了显示自己的认真负责态度,都会对统计学方法,统计学差异,P值等问题特别重视。大家显然对这个问题都是一知半解,甚至误解。关于统计学的争议最多的就是P值,就是这个大写斜体的P值。无数论文和博客曾经写过这个“无效假设检验”话题。
无效假设检验是统计学的基本原理和基石,是指根据某种实际需要,对未知的或不完全知道的统计总体提出一些假设。然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的测验。一般的描述是,你假设两组处理是不同的,然后用检测数据进行统计学计算(经常说分析),计算什么,计算这两组因为抽样误差产生这种差异的概率不超过5%(任何小于5%的概率)。统计学经过大量研究认为,相同的概率不超过5%,属于小概率事件,我们就可以说这两组数据存在显著(显著只是统计学几率,不是相差多少)差异。
请注意,统计学分析的结果是两组差异的可能性P值大小,并不是相差的多少,但是我们现在对P值非常认真,几乎到了崇拜的地步。如果没有达到预期的小概率,即使数据差别很大,我们也不承认差异。在临床研究中,我们几乎都不相信个案,认为这是偶然的可能性很大,除非像某些绝对不可能发生的案例,例如你用某方法治疗艾滋病,患者完全痊愈,有一个我也服。其他的,例如你治某个恶性癌症患者,完全康复。因为本来就存在不名原因自愈的可能,我绝对不相信,尽管我也觉得有点神奇。
《自然》认为P值只是冰山一角,是“无效假设检验”。而根据数学和统计规律,影响P值大小的最重要因素是样本量和差异大小。如果差异足够大,例如某种抗血压药物的治疗效果,很小的样本量就可以计算出足够小的P值,如果差异比较小,例如某种癌症治疗药物,可以通过扩大样本量获得足够小的P值。言外之意,
无效假设检验是统计学的基本原理和基石,是指根据某种实际需要,对未知的或不完全知道的统计总体提出一些假设。然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的测验。一般的描述是,你假设两组处理是不同的,然后用检测数据进行统计学计算(经常说分析),计算什么,计算这两组因为抽样误差产生这种差异的概率不超过5%(任何小于5%的概率)。统计学经过大量研究认为,相同的概率不超过5%,属于小概率事件,我们就可以说这两组数据存在显著(显著只是统计学几率,不是相差多少)差异。
请注意,统计学分析的结果是两组差异的可能性P值大小,并不是相差的多少,但是我们现在对P值非常认真,几乎到了崇拜的地步。如果没有达到预期的小概率,即使数据差别很大,我们也不承认差异。在临床研究中,我们几乎都不相信个案,认为这是偶然的可能性很大,除非像某些绝对不可能发生的案例,例如你用某方法治疗艾滋病,患者完全痊愈,有一个我也服。其他的,例如你治某个恶性癌症患者,完全康复。因为本来就存在不名原因自愈的可能,我绝对不相信,尽管我也觉得有点神奇。
《自然》认为P值只是冰山一角,是“无效假设检验”。而根据数学和统计规律,影响P值大小的最重要因素是样本量和差异大小。如果差异足够大,例如某种抗血压药物的治疗效果,很小的样本量就可以计算出足够小的P值,如果差异比较小,例如某种癌症治疗药物,可以通过扩大样本量获得足够小的P值。言外之意,
