预测税收收入

2014-09-04 08:38阅读：

http://blog.sina.cn/dpool/blog/u/1503201861

我国税收收入预测及方法选择
----基于多模型动态分析法
注：本文数据均由公开渠道收集整理。未经作者允许，禁止转载和引用
摘要：本文结合我国税收收入历年数据和重点税源企业历史入库数据，利用随机森林方法选择变量,建立人工神经网络、支持向量机、多元自适应回归样条三种预测模型，通过对模型进行评估，选择最优模型对税收收入进行预测，最后提出了存在的问题和进一步改进的思路。
一、引言
2014年，因为经济运行受全球影响，存在下行的压力，税收减收因素较多，税收收入形势比较严峻，所以必须加强对税收收入信息的分析监控，增强应对税收风险的能力。同时，税收收入预测是税务各级部门制定相关征管、稽查策略的重要参考，以适应纳税人规模的不断扩大和专业化管理的逐步深入的需要。因此，迫切需要建立一套税收收入预测模型。
目前现行的税收预测模型包括回归、时间序列、人工神经网络等。这些模型的建立或是关注税收收入与相关经济要素，或是发掘税收收入自身的规律特点，有各自的适用范围和优势。但随着数据挖掘和机器学习的理论的进一步发展，各种税收预测模型有较大需要细化提高的空间，同时也存在若干难点，总结为如下两方面：
首先，预测模型需要创新研究。现行的税收预测往往基于指数平滑法、时间序列法等较为传统的预测模型，虽然时间序列法以税种自身的发展变化为重点，在这方面有着天然的优势。但是随着大数据的出现、数据挖掘的发展和机器学习的深入，涌现出支持向量机、组合建模等先进的建模的理论，需要我们引入到税收收入预测中来。
其次，模型参数需要自适应调节。比如人工神经网络具有较好的容错和容差能力，但在神经网络结构上有很多人为因素，且模型的复杂性使

年份		2009年	2010年	2011年	2012年	2013年
原始值（亿元）		59521.59	73210.79	89738.39	100614.28	110497.00
SVM模型	预测值	63643.21	69861.45	86487.36	105923.27	116537.21
	残差	-4121.623	3349.342	3251.031	-5308.993	-6040.209
	误差率	0.06924586	0.04574930	0.03622787	0.05276580	0.05466401
ANN模型	预测值	63758.68	69664.63	86018.84	105486.71	117995.62
	残差	-4237.090	3546.162	3719.548	-4872.428	-7498.624
	误差率	0.07118577	0.04843770	0.04144879	0.04842680	0.06786270
ARIMA模型	预测值	62890.24	67833.45	90414.15	106375.69	119367.82
	残差	-3368.6478	5377.3416	-675.7648	-5761.4108	-8870.8167
	误差率	0.056595394	0.073450123	0.007530387	0.057262356	0.080281063
组合模型	预测值	63257.27	69495.68	87202.75	104072.21	109301.10
	残差	-3735.68	3715.11	2535.64	-3457.93	1195.90
	误差率	-0.062761748	0.050745387	0.028255857	-0.034368217	0.010822936

	ANN	SVM	ARIMA	ANN+SVM+ARIMA
平均绝对误差	3592.659	3413.387	4219.291	2179.295
均方根误差	4153.768	3842.402	4857.239	2500.119

新浪博客

预测税收收入

分享

我的更多文章

下载客户端阅读体验更佳

疯狂捕鱼