超几何分布
超几何分布是统计学上一种离散概率分布。它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。
超几何分布最早由法国统计学家皮埃尔·西蒙·拉普拉斯在1812年提出。拉普拉斯考虑了从一个有限总数的单位中随机抽取不放回,得到某种特定特征(如性别、已婚/未婚等)的完整个体数量的情况,由此提出了超几何分布。
超几何分布的应用场景包括实际生产、实验,或者对大量统计数据中对于某些特定情况的数量计算,用来估计某种特定类型对象在总体中的比例分布情况。其参数包括总体大小N、抽取的样本大小n和指定种类物件的数目M,表达式为X~H(N,n,M)。
在数学中,高斯超几何函数或普通超几何函数是一个用超几何级数定义的函数,很多特殊函数都是它的特例或极限。所有具有三个正则奇点的二阶线性常微分方程的解都可以用超几何函数表示。
超几何分布之所以被称为“超几何”,主要有以下几个原因:
一、与超几何函数的关联
超几何分布的概率分布形式与超几何函数的级数展开系数有关。在数学上,超几何函数是一类特殊的函数,其级数展开的系数具有特定的形式。而超几何分布的概率质量函数也呈现出类似的形式,因此得名“超几何”。
二、概率特性的体现
超几何分布用于描述从有限个物件中不放回地抽取一定数量物件时,特定属性物件出现的概率。这种分布的特性在于,随着抽取的进行,总体中的物件数量减少,且每次抽取的概率会发生变化。这种概率变化的特点与超几何级数中项与前一项之比为项数的简单函数的关系相类似,因此被称为“超几何”。
三、与几何分布的扩展关系
几何分布是描述在独立重
