[转载]多元回归分析的Eviews实现（一）

2014-03-15 16:08阅读：

http://blog.sina.cn/dpool/blog/u/2482907525

原文地址：多元回归分析的Eviews实现（一）

原文作者：MiltonDeng

【原来所有的图都会残掉。算了，这样也好，只提供文字方法，防止一些懒人直接套用。可以留言讨论】
回归分析作业：自寻数据，进行回归模型构建，并检验异方差、自回归、多重共线性。基于Eviews实现。（最初要求用SPSS实现，但是我们发现Eviews做回归实在太方便了。Eviews几乎天生为回归而作。当然几大统计软件各有所长）
现在感觉做作业就是拼学习能力啊.. 大家都是小白，看谁比较接受比较快了。前面异方差、自回归基本上是我在做，后面基本上是QG在做，我也有尝试。描述统计WX用SPSS完成，虽然我觉得很多描述和回归关系不大。
其他多数组是用SPSS做，所以很多不如我们做得透彻。（看了它们的presentation，感觉很多东西SPSS无法很好实现，而Eviews几乎是一键式的。）但是我们的东西……说实话，我觉得问题很大，具体问题在哪在文中有总结。但就作业来说，还算可以的，比较深入了。另外我们经济意义分析太少…
这篇算作一份总结，反思一些问题在哪。也算对Eviews的熟悉。
而且做的时候几乎看了网上所有的相关

Eviews材料，所以也应该对大家有点帮助吧(主要是操作上的)。
（另外QG不介意我发这个吧，我可以删掉这个…诶..其实我为什么要发这个呢。这份资料挺宝贵的，留着自己看比较好，有点舍不得发上来。）

一、 描述统计

1.散点图
选择图形-图表构建程序

选择散点图/点图中的简单散点图，把变量lnoutput放在Y轴，两次分别把lnlabor和lncapital置于X轴，可得结果。

均值、方差、分位数

选择分析-描述统计-频率
把变量lnlabor,lncapital和lnoutput放到变量列表中，并点击统计量选项。勾选中均值，方差，四分位数，最大值和最小值。

统计量
		lncapital	lnlabor	lnoutput
N	有效	30	30	30
N	缺失	0	0	0
均值		13.2078	10.4668	12.0858
中值		13.3749	10.7121	12.3597
方差		1.864	1.405	2.920
极小值		10.05	7.14	8.67
极大值		15.31	12.20	15.87
百分位数	25	12.3211	9.8270	11.3250
	50	13.3749	10.7121	12.3597
	75	14.0677	11.2590	12.9507

箱线图

选择图形-图表构建程序，并选中箱线图
分别把变量lnlabor,lncapital和lnoutput放到Y轴上

数据与背景：
这组数据是组长QG选的，主要是为了完成作业，最好保证异方差、自回归等都有体现所以选了这份数据（但是说真的…这份数据估计是瞎编的，问题很大…）。
数据结构和意义很简单，其实就是验证Cobb-Doglas函数Y=A*K^a*L^b，取对数，LnY=C+aLnK+bLnL。初始数据共三项：Output，Labor，Capital，然后对数话生成三个对数话后的数据列：
Genr lnoutput = log(output)
其他两列同。【建议还是把数据命名成y x1 x2这样啊.. 一直打lnoutput什么的太长了..】

经典假设下的最小二乘估计：

回归模型生成： ls lnoutput c lnlabor lncapital (含C表示有截距项)
下面是拟合的一些结果：

View -> Representations

线性回归模型：
LNOUTPUT = C(1) + C(2)*LNLABOR + C(3)*LNCAPITAL
带入参数后：
LNOUTPUT = -2.90027329579 - 1.09033573829*LNLABOR+1.99870061342*LNCAPITAL

参数表：

C1	-2.900273
C2	-1.090336
C3	1.998701

【其实这里已经存在一个很大的问题：C2是负值。太奇怪了。QG解释是人口结构问题…我不赞同。但数据估计是瞎编的，所以没办法了…】

View -> Estimate Output

可决系数R^2:
R-squared = 0.742295

调整可决系数：
Adjusted R-squared = 0.723205 【 = 1-(1-R^2)*(n-1)/(n-1-k) = 1 – ( 1 - 0.742295) * 29/27 】

方程显著性检验【F检验】：
（1）F = [SSR/k] / [SSE/ (n-k-1)] ~ F ( k , n-k-1 ) = F (2, 27 )
α=0.05 临界值 F0.05 ( 2 , 27 ) = 6.49
此处 F- statistic = 38.88542 > 6.49 拒绝原假设，总体显著
（2）Prob(F-statistic) = 0.000000 << 0.05 , 拒绝原假设，总体显著

各变量显著性检验【t检验】：

Variable	t-Statistic	Prob.


LNLABOR	-1.320803	0.1977
LNCAPITAL	2.789112	0.0096

LnLabor Prob(t) = 0.1977 > 0.05 不显著（原因可以在后面看到，这是因为L和K之间有显著共线性）
LnCapital Prob(t) = 0.0096 << 0.05 显著
DW值:
Durbin-Watson stat = 1.763567
得到自相关系数估计值：p = 1 – DW/2 = 0.1182615
微弱一阶自相关

另： dependent 是指因变量。
Log likelihood 对数似然比：残差越小，L越大，越精确
Akaike info criterion 赤池信息量：越小越精确
Schwarz criterion 施瓦兹信息量：越小越精确

Forecast

被解释变量置信区间：
蓝线是表示预测值。纵轴为LnOutput的刻度。横轴表示第几个样本。
红线是蓝线加减2S.E. 即置信区间。

右表：
Root Mean Squared Error (RMSE): 误差均方根
Mean Absolute/ Abs. Percentage Error (MAE/ MAPE): 绝对/相对平均误差
Theil Inequality Coefficient : Theil 系数，越小越好
Bp+Vp+Cp=1, 值集中在Cp（协变率）上较好。

举报/Report

我的更多文章

下载客户端阅读体验更佳