新浪博客

《女士品茶》读书笔记

2017-08-13 22:59阅读:
《女士品茶》读书笔记
《女士品茶》是一部关于统计学历史与变革的书,从某位喝茶的英国女士的假设学说为起点,引出了近代数理统计的开创者——费歇尔,以及二十世纪参与这场科学变革的代表性人物与事迹。作者在序中提到本书不是一本关于概率和概率论的书,读者也不会从本书中学到对科学数据进行统计分析所需要的足够知识,但本书可以帮助我们去理解统计学到底是什么,它是如何发展演变的。
本书的第一章以女士能否正确区分先加奶后加茶和先加茶后加奶这两种注茶方式开始讨论,“那位女士也许能、也许不能正确地品出不同的茶来,但这无关紧要,因为,实验的真正乐趣,在于找到一种判断该女士是对还是错的方案来。”这就涉及到实验的设计,费歇尔把女士的断言视为假设问题,设计实验的问题是,如果只给那位女士一杯茶,那么即使她没有区分能力,她也有50%的机会猜错。如果给两杯茶,她仍可能猜对。如果她知道两杯茶分别以不同的方式调制,她可能一下子全部猜对(或全部猜错)。值得考虑的是,“即使这位女士能做出区分,她仍然有猜错的可能。或者是其中的一杯与奶没有充分地混合,或者是泡制时茶水不够热。即使这位女士能做出区分,也很有可能是奉上了10杯茶,她却只是猜对了其中的9杯。”费歇尔还提出了“应该为那位女士奉上多少杯茶?这些茶应该按什么顺序奉上?对所奉各杯茶的顺序应该告诉那位女士多少信息?”这些是我在学习统计过程中从未想到过的。关于实验设计,还提到了老师应该如何组织考试?“是搞那种只包括几天前所教授内容的系列考试,还是每次考试都从考试前所教授的全部内容中提取一部分?考试是一个星期搞一次,还是每天搞一次?或者在每个教学单位结束时搞?”这些问题让我开始重新审视实验设计,并有兴趣仔细了解下实验设计。
第二章偏斜分布提到了高尔顿,他发现了“向平均回归”的现象,这表现为:非常高的父亲,其儿子往往要比父亲矮一些;而非常矮的父亲,其儿子往往要比父亲高一些。这些用日常思维就能想到的结论却让我着实眼前一亮。原来生活中就蕴藏着无数统计规律。高尔顿还发现了这种关系的一
种数学测度,称之为“相关系数”。接下来K·皮尔逊认为实验结果不应该看成精心测量得出的数据,它们本来就不是确切的,用更容易接受的术语来替代:它们是一组散布数据或一个数据分布中的样本。这些是科学家花了很长一段时间才认识到的性质,我们从一开始就已经知道了,到这里,我真正理解了站在巨人的肩膀上的含义。K·皮尔逊提出,这些观测到的现象只是一种随机的映像,不是真实的,所谓的真实是概率分布。但是,皮尔逊以为若能搜集到足够的数据去估计参数就会得到参数的真实数值。K·皮尔逊从一系列工作中发展了一种被称为“拟合优度检验”的基本统计工具,这使科学家能够确定一组给定的观测值是否适用于某一特定的数学分布函数。“科学的对象并不是不可观测事物本身,而是数学分布函数,以描述与所观测事物相联系的概率。”这是皮尔逊革命留给我们的观念。
第三章可爱的戈赛特先生,戈赛特在测量样本中酵母细胞的量时发现酵母细胞的数量可以用泊松分布来描述,这并不是K·皮尔逊偏斜分布家族中的一种概率分布。K·皮尔逊所有的工作都假定:样本足够大,以至于确定参数可以没有误差。戈赛特提出,如果是小样本会怎么样?我们将如何处理自己的计算中肯定会出现的随机误差?由此,“学生”的t检验被发现。
第五章收成变动研究中,费歇尔在《作物收成变动研究二》中提出方差分析,用于分解各种不同处理的效应。《作物收成变动研究四》还介绍了费歇尔提出的协方差分析。除此之外,自由度也是费歇尔提出的。
第六章“百年不遇的洪水”让我更加深入的了解了统计的应用范围。“谁能为这样的突发时间制定防范计划呢?像这样罕见的洪水,我们又怎么能估计其洪峰会高达多少呢?如果说现代科学有统计模型能用来处理观测数据的分布,那么,对这种未曾发生过,或者即便发生,也是百年才发生一次的大洪灾,又该如何用统计模型来分析呢?”这就提到了极值分布,“如果我们知道极值分布与正常值分布之间的关系,就可以记录每年洪峰的高度,并预测百年不遇的洪灾发生时最可能的洪峰高度。”
第七章费歇尔获胜中提到了费歇尔提出的三个准则:一致性:得到的数据越多,计算出来的统计量接近参数真值的概率就越大;无偏性:如果用很多组不同数据集多次测量某一特定的统计量,那么该统计量的这些测量值的平均数应该近似于这个参数的真值;有效性:统计量的值不会完全等于该参数的真值,但是用来估计一个参数的大多数统计量应该与真值相去不远。为了得到一致且有效(但未必无偏)的统计量,费歇尔还提出了“极大似然估计量”。
第八章致死的剂量中举了一个我们常出现的情况,在处理问题的时候我们常常拼命地寻找一个类似的并且已经解出答案的例题,然后把文字应用题的新数字塞进这道例题所用的公式中。可是,我们通常面对的问题又没这么简单。试想有这样一个文字应用题,没有人知道如何将它转化为数学公式,没有人知道问题中哪些数据是多余的,而一些至关重要的信息又常常缺失,况且教科书中也没有事先已解出来的类似例题。为此,布利斯发明了“概率单位分析”方法。他的模型中生成的最重要的参数谓之“半数致死剂量”,通常以“LD-50”来表示,是指杀虫剂能以50%的概率杀死虫子的剂量。
第九章钟形曲线,中心极限定理阐明无论初始数据是怎么来的,这个分布都可以用正态概率分布来逼近。且正态分布具备某些非常优良的性质:如果有两个随机变量服从正态分布,那么两变量之和也同样服从正态分布。就一般而言,正态变量的各种类型的和与差也服从正态分布。因此,由正态随机变量推演得出的许多统计量,其自身也服从正态分布。
第十章拟合优度检验,洛仑兹提出的“蝴蝶效应”主要还是混沌学的一个比喻,不起眼的小动作却能引起一连串的反应。皮尔逊的拟合优度检验的重要组成是“假设检验”或“显著性检验”,它允许分析人员提出用来模拟现实的两种(或多种)不一致的数学模型,然后利用数据来放弃其中的一个。在某个待检验的假设条件下,“显著的”用来表示计算结果发生的概率很低。如果用χ^2拟合优度来检验一组服从正态分布的数据,但是并没有得到一个显著的p值,那么怎么知道这组数据确实服从正态分布呢?也就是说,怎么知道至今尚未发现的另一种χ^2检验或者另一种拟合优度检验不会已经产生一个显著的p值,而允许在拟合数据的时候拒绝这个正态分布呢?这就很自然地引出了下一章。
第十一章假设检验,在显著性检验中,如果得到的是一个不显著的结果,那么它的含义是什么?如果我们找不到拒绝一个假设的证据,我们能做结论说这个假设为真吗?费歇尔把比较大的p值(代表没有找到显著性证据)解释为:根据该组数据不能做出充分的判断。依据费歇尔的解释,我们绝不会得出这样的推理,即没有找到显著性的证据,就意味着待检验的假设为真。
第十二章置信诡计,当20世纪80年代出现了艾滋病这种传染病时,卫生官员需要知道有多少人受到感染,以便安排需要的资源来应付这种传染病。至此,才切切实实的体会到统计的重要性。流行病学是与统计学关系非常密切的一门学科领域,其中统计模型被用来检验人类的健康模式。我们知道数据是观测的来的,参数是固定的值(尽管是未知的),因此参数取某个特定值的概率只有两个结果,或者100%(如果它就是那个值),或者是0(如果它根本不是那个值)。然而,一个95%的置信区间涉及的是95%的概率。这个概率指的是什么?对此,奈曼并没有回答。
第十四章数学界的莫扎特,柯尔莫哥罗夫建立了平滑和预测平稳随机过程的基本定理。在这之前,费歇尔在《研究工作者的统计方法》一书中举了他的新生儿子每周体重的例子,得出在现实生活中,一个长时间搜集上来的数据序列很难被认为是真正独立的。费歇尔无法再进一步的解决这个问题,直到柯尔莫哥罗夫,他把随时间搜集得来的前后相联的这一数值序列,成为“随机过程”。正是由于有了柯尔莫哥罗夫的思想,现在我们才能对那些随时间搜集上来的记录实行检查分析,而且得出很专门的结论。
第十六章非参数方法,威尔科克森在考察t检验和方差分析的计算公式时,意识到这些极端的异常值显著的影响了结果,导致t检验统计量的数值比正常情形下的数值更小。这诱使他从观测值的集合中剔除异常值,用剩下的观测值计算t检验统计。这样一来,我们如何判断一个数到底是不是异常值?必须剔除多少个异常值?当异常值被剔除后,还能继续使用那些基于标准检验统计量的概率图表吗?借此,威尔科克森检验,一种无需估计任何参数的检验方法,仅需要将观测数据的散点图与纯随机分布所预期的情形进行比较,这种非参数检验方法产生了。在非参数检验和参数检验的问题中,皮特曼成功解决了相关问题。一当我们知道参数模型和本应该使用特定的参数检验时,如果还使用非参数检验,结果根本不差!二如果数据不适用参数模型,只需稍稍偏离参数模型,则非参数检验将远远的胜过参数检验。
第二十五章来自黑衣女士的忠告,这章举了一个重犯率与刑期间的对比,得出刑期越短,重新犯罪的概率越高。但是我们需要注意的是,这种明显强关联关系主要是刑期在三个月之内的犯人重犯率高,经过仔细检查,这些人“几乎都是些年老的、处境悲惨的、精神不正常的人,他们被精神病医院拒之门外,所以才会一次又一次的反复犯罪后再进监狱。”因此,他们被当做不同的人重复统计,才将短期犯罪的重犯率夸大了。另一个极端的表现是,刑期在10年以上的犯人出狱后只有15%的人又重新犯罪。坎利夫认为“这里有一个很大的年龄因素,一个很大的环境因素和一个很大的犯罪程度因素”当将这两个极端的情况调整后,重犯率和刑期间明显的关系消失了。
第二十七章意向治疗法,这章举了这样一个例子,公公住宅是否影响低收入人群的社会态度和生活水平的提高。统计学家建议寻找这样一群人,不论他们是否申请了公共住宅,随机分配公共住宅给其中一部分人,而对另外的一些人不提供公共住宅。一反政府安置公共住宅时采取的先到先得的方式。这其中的原因是,不管使用何种方法,那些最先申请的人通常都是最积极并且有野心的人,如果这种说法是对的,那么住在公共住宅里的人本来就比另外一些人干得好,这与提供住宅本身无关。
我主要挑选了自己感兴趣的几个章节进行总结,这本书让我在了解统计发展的过程中,又对实验设计的严谨性有了进一步的认识。
本文由“一个年轻姑娘账号”发布,2017年08月13日

我的更多文章

下载客户端阅读体验更佳

APP专享