聚类分析应用实例
2010-06-22 23:50阅读:
在这里选择了一个能源的数据进行分析。由于此原始数据涉及主要能源(石油、天燃气、煤炭)和黑色金属矿产(铁矿、锰矿、铬矿、钒矿、原生钛铁矿)的基础储量,有部分省市含有很少甚至没有后四种矿藏,因而新筛选出的数据资料仅包含石油、天燃气、煤炭、铁矿的储量,但仍有少部分省市对此有缺失,故对缺失值以最小单位量0.01补齐,以方便数据的分析整理。
应用spss中的聚类操作对数据资料进行分析,其中选择了Range of solution
2-4类(保存在数据表中),Dendrogram,为了消除量纲影响并对其进行Standardize(Z
scores).分析结果如下表图:
地区
石油
天燃气
煤炭 铁矿
clu4_1 clu3_1
clu2_1
万吨 亿立方米
亿吨
亿吨
北 京
.01
.01
5.73 3.17
1
1
1
天
津
3074.99
275.75
2.97
.01
1
1
1
河
北 16338.63
240.59 68.15
42.51
2
1
1
山
西
.01
.01
1051.66
6.15
3
2
2
内蒙古
5526.32
1643.04 802.33
12.96
3
2
2
辽
宁 17010.38
202.91
49.75 70.16
2
1
1
吉
林 16529.56
167.84
17.11
1.33
1
1
1
黑龙江 62196.71
935.83
77.67
.54
1
1
1
上
海
.01
.01
.01
.01
1
1
1
江
苏
2503.77
22.71
18.30
1.91
1
1
1
浙
江
.01
.01
.49
.15
1
1
1
安
徽
137.88
.02 118.74
8.82
1
1
1
福
建
.01
.01
4.79
3.68
1
1
1
江
西
.01
.01
8.18
1.93
1
1
1
山
东 34747.87
348.36 103.25
9.86
1
1
1
河
南
5370.67
110.42 123.30
.91
1
1
1
湖
北
1187.18
3.85
3.26
4.29
1
1
1
湖
南
.01
.01
20.12
1.44
1
1
1
广
东
9.00
.31
1.89
1.87
1
1
1
广
西
175.16
3.48
8.46
.99
1
1
1
海
南
40.80
8.90
.90
.36
1
1
1
重
庆
.01
1135.76
18.26
.01
1
1
1
四
川
345.05
5462.78
50.26 31.40
4
3
1
贵
州
.01
4.61 148.26
.53
1
1
1
云
南
12.40
2.86
73.57
4.48
1
1
1
西
藏
.01
.01
.12
.27
1
1
1
陕
西 19884.83
8587.65 277.57
4.11
4
3
1
甘
肃
8727.59
98.91
61.70
3.97
1
1
1
青
海
4377.23
1496.10
20.66
.07
1
1
1
宁
夏
139.91
1.67
70.06
.01
1
1
1
新
疆 41883.22
6598.24 127.28
3.04
4
3
1
以下是SPSS的输出结果
Rescaled Distance Cluster Combine
C A S E
0
5
10
15
20
25
Label
Num
+---------+---------+---------+---------+---------+
浙
江
11
òø
西
藏
26
òú
海
南
21
òú
上
海
9
òú
江
西
14
òú
广
东
19
òú
来源:(http://blog.sina.cn/dpool/blog/s/blog_635b2a3c0100g6hc.html?vt=4)
- SPSS聚类分析论文(简易篇)_gaoshikun09_新浪博客
湖
南
18
òú
广
西
20
òú
北
京
1
òú
福
建
13
òú
湖
北
17
òú
天
津
2
òú
江
苏
10
òú
云
南
25
òú
宁
夏
30
òú
河
南
16
òú
贵
州
24
òôòø
安
徽
12
òú ó
重
庆
22
òú
ùòòòòòòòòòòòòòòòòòòòòòòòòòòòø
青
海
29
ò÷ ó
ó
吉
林
7
òûò÷
ùòòòòòòòòòòòø
甘
肃
28
ò÷
ó
ó
黑龙江
8
òòòòòòòòòòòûòòòòòòòòòòòòòòòòòòò÷
ùòø
山
东
15
òòòòòòòòòòò÷
ó
河
北
3
òòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòùòòòø
辽
宁
6
òòòòòòòòò÷
陕
西
27
òòòòòòòòòûòòòòòòòòòòòòòòòòòø
ó
ó
新
疆
31
òòòòòòòòò÷
ùòòòòòòòòòòòòòòòòò÷
四
川
23
òòòòòòòòòòòòòòòòòòòòòòòòòòò÷
山
西
4
òòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
内蒙古
5
òòòòò÷
由以上分析可得出结果分为四类比较合适:
第一类:四川、陕西、新疆能源矿藏储量最多的三个地区。这三个地区中的天燃气储量远远超出其他的指标,并且其他三个指标也相对偏高。
第二类:山西、内蒙古能源矿藏储量比较多的两个地区。这两个地区的煤炭储量远大于其他省份,起到重要作用。
第三类:河北、辽宁能源矿藏储量相对较多的两个省份。
第四类:北京、天津、上海、江苏等大部地区属于能源矿藏储量相对比较少的地区。
对此根据我国各地区的能源矿藏储量制定和开发主要资源的战略方针,对各省市之间的资源合理配置及工矿企业的选址起到参考作用。我国已经制定的西气东输工程就是依据新疆地区天燃气巨大储量而制定的支援东部能源供应,协调我国能源矿藏的利用和开采,对我国的经济发展所需能源矿藏起到稳定作用。
SPSS统计事务所主要业务:
1.为学生毕业论文、公司、高校课题提供spss、LISREL、Amos等数据分析服务。
2.为公司、高校和科研机构提供价格优惠的调查问卷数据录入服务。
3.为课题提供量化统计指导和咨询。
联系方式:
QQ:3098529344
电话:18375425162
公司地址:山东省青岛市平度市白沙河街道办事处256号