Minitab的Box-Cox变换功能

2011-06-09 21:10阅读：

http://blog.sina.cn/dpool/blog/u/1173162601

Box-Cox变换对于修正过程数据中的非正态性(nonnormality)和与子组均值相关的子组过程波动来说是很有帮助的。在大部分的情况下,是不需要修正非正态性的,除非数据是高度偏态的。Wheeler和Chambers建议对于使用在控制图中的数据是不需要进行变换的,因为控制图在当数据不是正态分布的情况下仍然可以运行良好。他们给出了一个极好的示范,即在数据是采集自多种非对称分布时来执行控制图。
Minitab提供了两个Box-Cox变换:单独的命令和在所有控制图(除了属性图)中提供的变换选项。你可以先后使用这两个过程。首先,使用单独的命令来帮助你探测性的决定变换的最佳lambda值。然后,当你在使用控制图命令时,使用变换选项来转换数据,同时生成图形。
从菜单选择Stat > Control Charts> Box-Cox Transformation
对要使用在控制图中的过程数据执行一次Box-Cox过程。要使用Box-Cox,所有的数据必须大于0。
当通过Minitab来评估lambda值时,会得到一个图形输出。查看Box-Cox Transformation-Graphical Output图形输出部分来查看输出的解释。
对话框选项

All observations for a chart are in one column(图表的所有观测值均在一列中):选择是否数据在一列或多列中,然后输入列.
S

ubgroup sizes(子组大小):输入数字或标识符(subscripts)列.
Observations for a subgroup are in one row of columns(子组的观测值位于多列的同一行中):选择每个子组数据是否位于跨多列的行内,然后输入列。
Box-Cox变换-图形输出
当使用Minitab来评估lambda值时,会生成一个图形,显示了下列内容：

变换的一个近似lambda评估值
两个和lambda值接近的对比值
lambda真实值的95%置信区间

具体查看Box-Cox数据变换示例
图形能够被用来评估变换的合适性。例如,你能使用lambda值的95%置信区间来决定是否最佳lambda值'接近'于1,lambda为1表明不应该去做变换。在最佳lambda值接近1的情况下,通过执行变换能够获得的需要非常少.
在另外一个方面,如果最佳lambda'接近'0.5,你可以简单地就对数据取平方根,既然这个变换是简单而且容易理解的。
注意
在某些情况下,lambda值的某个接近的对比值可能有比最佳评估值更加小的标准差值。

图形中选项(Options)-Box-Cox
... > Control Chart Options > Box-Cox
图形除了属性图形以外的任何图形中的操作
当数据存在非常大的偏态或子组内波动不稳定的时候,你能够使用Box-Cox幂(power)变换来使得数据'更加正态'.变换就是取原始数据的幂lambda,除非lambda＝0,此时取自然对数.
要使用这个选项,数据必须是正的。当使用控制图的Options>Estimate功能来包含(include)或排除(exclude)行时,Minitab只使用非遗漏值(non-omitted)来寻找lambda值。
选项(Options)子对话框列出了常用的转换,取自然对数(lambda=0)和开平方根(lambda=0.5).当然lambda值可以取-5到5之间的任何值。在大部分情况下,你不应该选择超出-2到2区间的值来作为lambda值。你首先要运行命令Stat > Control Charts > Box-Cox Transformation来帮助你找到最佳转换值。
当你使用这个变换的时候,Minitab不接受在Parameters标签中输入值来作为历史均值或历史标准差。
Minitab尽可能使用接近值来进行Box-Cox变换。如果不想使用接近值来作为lambda值,查看Tools> Options > Control Chart and Quality Tools > Other部分.
注意
如果使用菜单命令Stat > Control Charts > Box-Cox Transformation来找出最佳lambda值,并且选择了保存转换后的数据,那么在生成控制图时不要选择Box-Cox选项,因为这样会让数据再进行一次转换。

图形中选项(Options)-Box-Cox对话框项目
Use a Box-Cox transformation (W = Y**Lambda)(使用Box-Cox变换(W = Y**Lambda)):当数据中存在很大的偏态或子组内波动不稳定时选择使用。
Lambda =0(natural log)(自然对数):选择对数据取自然对数
Lambda=0.5(square root)(平方跟):选择对数据开平方根
Optimal lambda(最佳lambda):选择让Minitab来寻找最佳值
Optimal lambda for each stage (in a chart with stages)(每阶段最佳lambda值(在带阶段的图中)):选择让Minitab寻找每阶段的最佳值
Other (enter a value between -5 and 5)(其它(输入-5到5区间内任一值)):选择使用其它的lambda值来进行转换,然后输入lambda值。

Box-Cox变换示例
使用在示例中的数据是高度偏态的,包含50个分组,每个分组大小是5。如果你愿意,你可以使用Graph>Historgram来查看转换前后数据的扩展.
1.打开工作表BOXCOX.MTW
2.选择Stat > Control Charts > Box-Cox Transformation
3.选择All observations for a chart are in one column,然后输入Skewed
4.在Subgroup sizes,输入5
5.点击Options.在Store transformed data in,输入C2。在每个对话框中点击OK。
Minitab的Box-Cox变换功能

Minitab的Box-Cox变换功能

图形窗口输出
Minitab的Box-Cox变换功能

Minitab的Box-Cox变换功能

结果分析
lambda表包含一个lambda评估值(0.04)和接近值(0.00),这是使用在变换中的值。lambda表同样包含上置信区间(CI)(0.29)和下置信区间(CI)(-0.21),在图上用垂直线标注。
尽管最佳lambda估计值是个非常小的值,但在实际工作中,你可能需要一个能对应到可理解变换的lambda值,比如,平方根(lambda=0.5)或自然对数(lambda=0).在这个例子中,0是一个合理的选择,因为它落在95%置信区间里。因此,自然对数变换对于指定最佳lambda估计值的变换来说是首选。
95%置信区间中包含的所有的lambda值,它们的标准差都小于或等于水平线。因此,任何标准差接近虚线的lambda值都可以被认为是可用在变换中的合理值。在这个例子中,对应的区间是-0.21到0.29。

方法和公式-Box-Cox变换
Box-Cox变换估计lambda值,如下所示,最小化了经过标准化变换后变量的标准差值。随之的变换是Y^λ(当λ不等于0时),LogeY(当λ=0时)。
使用这个方法在-5到5这个区间中搜索。下面有一些常用的转换,Y'是数据Y的转换。
Minitab的Box-Cox变换功能

Minitab的Box-Cox变换功能

举报/Report

我的更多文章

下载客户端阅读体验更佳