新浪博客

共线性问题

2014-02-26 19:59阅读:
回归方程中,自变量多个的时候,需要用多元线性回归,前提是各自变量之间是不相关的。如果某些自变量之间彼此相关,即存在共线性的问题,这会给评价自变量的贡献率带来困难。因此,需要对回归方程中的变量进行共线性诊断,并且确定他们对参数估计的影响。
共线性分为精确共线性和近似共线性。
当遇到近似共线性问题时,一般是将引起共线性的自变量剔除,但需要掌握的原则是:务必使丢失的信息最少。
1. 容忍度
容忍度定义为 Toli=1-Ri2,值位于0-1之间,值越小,共线性就越强!使用容许度作为共线性度量指标的条件比较严格,观测值一定要大致近似于正态分布。
2. 方差膨胀因子
方差膨胀因子(VIF)是容许度的倒数,其值越大,自变量之间存在的共线性的可能性越大。
3. 条件指数 (Condition Index)
条件指数是计算特征值时候产生的一个统计量,其值越大,说米昂自变量之间的共线性可能性越大。一般认为,条件指数大于等于15时候可能存在共线性问题,大于等于30的时候存在严重的共线性问题。
4. 方差比例(Variance Proportions)
要判断变量之间是否存在共线性问题,注意观测同一序号的特征值对应的变量的方差比例。比例越大,其共线性的可能性越大。
5. 特征值(Eigenvalues)
当若干特征值较小并且接近于0时,说明某些变量之间存在较高的相关性。这些变量的观测量出现较小的变化时,都会导致方程系数较大的变化。
共线性问题常用的解决方法
1)从有共线性问题的自变量中剔除不重要的自变量
2)增加样本量
3)重新抽取样本数据

我的更多文章

下载客户端阅读体验更佳

APP专享