“回归”是由英国著名生物学家兼统计学家高尔顿(Galton)在研究人类遗传问题
2008-01-09 14:38阅读:
“回归”是由英国著名生物学家兼统计学家高尔顿(Galton)在研究人类遗传问题时提出来的。为了研究父代与子代身高的关系,高尔顿搜集了1078对父亲及其儿子的身高数据。他发现这些数据的散点图大致呈直线状态,也就是说,总的趋势是父亲的身高增加时,儿子的身高也倾向于增加。但是,高尔顿对试验数据进行了深入的分析,发现了一个很有趣的现象—回归效应。因为当父亲高于平均身高时,他们的儿子身高比他更高的概率要小于比他更矮的概率;父亲矮于平均身高时,他们的儿子身高比他更矮的概率要小于比他更高的概率。它反映了一个规律,即这两种身高父亲的儿子的身高,有向他们父辈的平均身高回归的趋势。对于这个一般结论的解释是:大自然具有一种约束力,使人类身高的分布相对稳定而不产生两极分化,这就是所谓的回归效应。
高尔顿与回归分析的起源
弗朗西斯·高尔顿(Francis
Galton,1822--1911),英国人类学家、生物统计学家,著名生物学家达尔文的表弟,1822年2月6日生于伯明翰。早年在剑桥学习数学,后到伦敦攻读医学,1860年当选为皇家学会会员,1909年被封为爵士。共发表了200余篇论文,出版十几部专著,内容涉及人体测量学、实验心理学、生物统计学等诸多领域。
高尔顿是生物统计学派的奠基人。达尔文的鸿篇巨著《物种起源》问世以后,触动他用统计方法研究智力遗传进化问题,第一次将概率统计原理等数学方法用于生物科学,明确提出“生物统计学”的名称,现在统计学上的“相关”和“回归”的概念就是由高尔顿最先作为统计学术语使用的。1855年,高尔顿发表《遗传的身高向平均数方向的回归》一文,他和他的学生K·Pearson通过观察1078对夫妇,以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高作为因变量,分析儿子身高与父母身高之间的关系,发现父母的身高可以预测子女的身高,两者近乎一条直线。当父母越高或越矮时,
STRONG>的身高会比一般儿童高或矮,他将儿子与
父母身高的这种现象拟合出一种线形关系,其回归直线方程为
^=33.73+0.516
,这种趋势及回归方程表明
父母身高每增加一个单位时,其成年儿子的身高平均增加0.516个单位。
有趣的是,通过观察,
高尔顿还注意到,尽管这是一种拟合较好的线形关系,但仍然存在例外现象:矮个父母所生的儿子比其父要高,身材较高的父母所生
子女的身高却回降到多数人的平均身高。换句话说,当
父母身高走向极端,
子女的身高不会象
父母身高那样极端化,其身高要比父母们的身高更接近平均身高,即有“回归”到平均数去的趋势,这就是统计学上最初出现“回归”时的涵义,
高尔顿把这一现象叫做“向平均数方向的回归”(regression
toward
mediocrity)。虽然这是一种特殊情况,与线形关系拟合的一般规则无关,但“线形回归”的术语却因此沿用下来,作为根据一种变量(
父母身高)预测另一种变量(
子女身高)或多种变量关系的描述方法。
高尔顿揭示了统计方法在生物学研究中的应用,引进了回归直线、相关系数的概念,创始了回归分析,开创了生物统计学研究的先河。他于1889年在《自然
遗传》中,应用百分位数法和四分位偏差法代替离差度量,现在随机过程中的
高尔顿─沃森过程(简称G─W过程)就是以他的姓氏命名的。
http://blog.fhedu.net.cn/user1/fhyke/index.shtml
高尔顿
“高尔顿等人关于回归分析的先驱性的工作,以及时间序列分析方面的一些工作,…是数理统计学发展史中的重要事件.”──摘自《中国大百科全书》(数学卷)
高尔顿是英国人类学家、生物统计学家.1822年2月6日生于伯明翰,1911年1月17日卒于萨里郡黑斯尔米尔.
高尔顿是生物学家达尔文的表弟.他早年在剑桥学习数学,后到伦敦攻读医学.1860年当选为皇家学会会员,1909年被封为爵士.1845—1852年深入到非洲腹地探险、考察.
高尔顿是生物统计学派的奠基人,他的表哥达尔文的巨著《物种起源》问世以后,触动他用统计方法研究智力遗传进化问题,第一次将概率统计原理等数学方法用于生物科学,明确提出“生物统计学”的名词.现在统计学上的“相关”和“回归”的概念也是高尔顿第一次使用的,他是怎样产生这些概念的呢?1870年,高尔顿在研究人类身长的遗传时,发现下列关系:高个子父母的子女,其身高有低于其父母身高的趋势,而矮个子父母的子女,其身高有高于其父母的趋势,即有“回归”到平均数去的趋势,这就是统计学上最初出现“回归”时的涵义.高尔顿揭示了统计方法在生物学研究中是有用的,引进了回归直线、相关系数的概念,创始了回归分析.开创了生物统计学研究的先河.他于1889年在《自然遗传》中,应用百分位数法和四分位偏差法代替离差度量.在现在的随机过程中有以他的姓氏命名的高尔顿─沃森过程(简称G─W过程).
高尔顿发表了200篇论文和出版了十几部专著,涉及人体测量学,实验心理学等领域,其中数学始终起着重要作用.
|