(文:北京夷安君泰管理咨询有限公司董事长 张宏亮博士)
在统计的世界,我们面临的总是只有样本,Where there is sample, there is uncertainty,正因为不确定性的存在,才使统计能够生生不息。传说统计学家、数学家和物理学家乘坐一列火车上旅行,路上看到草原上有一只黑羊,统计学家说,“基于这个样本来看,这片草原上所有的羊都是黑的”,数学家说,“只有眼前这只羊是黑的”,物理学家则说,“你们都不对,只有羊的这一面是黑的”。这是关于统计和其他学科的一个玩笑话,说明了统计的一些特征,比如基于样本推断总体。一般情况下,总体永远都无法知道,我们能利用的只有样本,现在的问题是,样本该怎样利用呢?Bootstrap的奥义也就是:既然样本是抽出来的,那我何不从样本中再抽样(Resample)(谢益辉,2007)。
Bootstrap方法在概率分布拟合中能够发挥很大作用,特别是描述拟合概率分布的参数不确定性。在样本量少的情况下,拟合的概率分布参数具有较大不确定性,这时,可以使用Bootstrap方法计算得出这个不确定性,即参数的概率分布。
Bootstrap方法又可分为参数Bootstrap方法和非参Bootstrap方法。具体原理,这里就不再详述了。不过,@Risk软件在其概率分布拟合功能中,加入了参数Bootstrap方法。对于一些@Risk内嵌概率分布,在分布拟合时可以利用Bootstrap方法自动计算参数概率分布。
例如,我们针对一组样本数据,拟合其概率分布,得到正态分布Normal(4.93, 2.09),见下图。
在统计的世界,我们面临的总是只有样本,Where there is sample, there is uncertainty,正因为不确定性的存在,才使统计能够生生不息。传说统计学家、数学家和物理学家乘坐一列火车上旅行,路上看到草原上有一只黑羊,统计学家说,“基于这个样本来看,这片草原上所有的羊都是黑的”,数学家说,“只有眼前这只羊是黑的”,物理学家则说,“你们都不对,只有羊的这一面是黑的”。这是关于统计和其他学科的一个玩笑话,说明了统计的一些特征,比如基于样本推断总体。一般情况下,总体永远都无法知道,我们能利用的只有样本,现在的问题是,样本该怎样利用呢?Bootstrap的奥义也就是:既然样本是抽出来的,那我何不从样本中再抽样(Resample)(谢益辉,2007)。
Bootstrap方法在概率分布拟合中能够发挥很大作用,特别是描述拟合概率分布的参数不确定性。在样本量少的情况下,拟合的概率分布参数具有较大不确定性,这时,可以使用Bootstrap方法计算得出这个不确定性,即参数的概率分布。
Bootstrap方法又可分为参数Bootstrap方法和非参Bootstrap方法。具体原理,这里就不再详述了。不过,@Risk软件在其概率分布拟合功能中,加入了参数Bootstrap方法。对于一些@Risk内嵌概率分布,在分布拟合时可以利用Bootstrap方法自动计算参数概率分布。
例如,我们针对一组样本数据,拟合其概率分布,得到正态分布Normal(4.93, 2.09),见下图。
