SPSS聚类分析论文(简易篇)
2009-12-09 17:08阅读:
_
聚类分析论文
数据来源:国家统计局
在这里选择了一个比较简单而且易于分析的数据资料,并且为了方便分析对原始资料进行了略微修改。由于此原始数据涉及主要能源(石油、天燃气、煤炭)和黑色金属矿产(铁矿、锰矿、铬矿、钒矿、原生钛铁矿)的基础储量,有部分省市含有很少甚至没有后四种矿藏,因而新筛选出的数据资料仅包含石油、天燃气、煤炭、铁矿的储量,但仍有少部分省市对此有缺失,故对缺失值以最小单位量0.01补齐,以方便数据的分析整理。
应用spss中的聚类操作对数据资料进行分析,其中选择了Range of solution
2-4类(保存在数据表中),Dendrogram,为了消除量纲影响并对其进行Standardize(Z
scores).分析结果如下表图:
地区 石油
天燃气 煤炭
铁矿 clu4_1 clu3_1 clu2_1
万吨 亿立方米 亿吨
亿吨
北 京 .01
.01 5.73
3.17 1
1 1
天 津 3074.99 275.75
2.97 .01 1
1 1
河 北 16338.63 240.59 68.15
42.51 2
1 1
山 西 .01
.01 1051.66
6.15 3
2 2
内蒙古 5526.32 1643.04 802.33
12.96 3
2 2
辽 宁 17010.38 202.91 49.75
70.16 2
1 1
吉 林 16529.56 167.84 17.11
1.33 1
1 1
黑龙江 62196.71 935.83 77.67
.54 1
1 1
上 海 .01
.01
.01 .01 1
1 1
江 苏 2503.77 22.71
18.30 1.91 1
1
1
浙 江 .01
.01
.49 .15 1
1 1
安 徽 137.88
.02 118.74 8.82 1
1
1
福 建 .01
.01 4.79
3.68 1
1 1
江 西 .01
.01 8.18
1.93 1
1 1
山 东 34747.87 348.36 103.25
9.86 1
1 1
河 南 5370.67 110.42 123.30
.91 1
1 1
湖 北 1187.18
3.85 3.26 4.29 1
1
1
湖 南 .01
.01 20.12
1.44 1
1 1
广 东 9.00
.31 1.89
1.87 1
1 1
广 西 175.16
3.48 8.46 .99
1 1
1
海 南 40.80
8.90 .90
.36 1
1 1
重 庆 .01
1135.76 18.26 .01
1 1
1
四 川 345.05 5462.78
50.26 31.40 4
3 1
贵 州 .01
4.61 148.26 .53
1 1
1
云 南 12.40
2.86 73.57 4.48
1 1
1
西 藏 .01
.01
.12 .27 1
1 1
陕 西 19884.83 8587.65 277.57
4.11 4
3 1
甘 肃 8727.59 98.91
61.70 3.97 1
1
1
青 海 4377.23 1496.10
20.66 .07 1
1 1
宁 夏 139.91
1.67 70.06 .01
1 1
1
新 疆 41883.22 6598.24 127.28
3.04 4
3 1
以下是SPSS的输出结果
Rescaled Distance Cluster Combine
C A S E 0
5
10
15
20
25
Label Num
+---------+---------+---------+---------+---------+
浙 江 11 òø
西 藏 26 òú
海 南 21 òú
上 海 9
òú
江 西 14 òú
广 东 19 òú
湖 南 18 òú
广 西 20 òú
北 京 1
òú
福 建 13 òú
湖 北 17 òú
天 津 2
òú
江 苏 10 òú
云 南 25 òú
宁 夏 30 òú
河 南 16 òú
贵 州 24 òôòø
安 徽 12 òú ó
重 庆 22 òú
ùòòòòòòòòòòòòòòòòòòòòòòòòòòòø
青 海 29 ò÷ ó
ó
吉 林 7 òûò÷
ùòòòòòòòòòòòø
甘 肃 28 ò÷
ó
ó
黑龙江 8
òòòòòòòòòòòûòòòòòòòòòòòòòòòòòòò÷
ùòø
山 东 15 òòòòòòòòòòò÷
ó
河 北 3
òòòòòòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòùòòòø
辽 宁 6
òòòòòòòòò÷
陕 西 27
òòòòòòòòòûòòòòòòòòòòòòòòòòòø
ó ó
新 疆 31 òòòòòòòòò÷
ùòòòòòòòòòòòòòòòòò÷
四 川 23
òòòòòòòòòòòòòòòòòòòòòòòòòòò÷
山 西 4
òòòòòûòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷
内蒙古 5 òòòòò÷
由以上分析可得出结果分为四类比较合适:
第一类:四川、陕西、新疆能源矿藏储量最多的三个地区。这三个地区中的天燃气储量远远超出其他的指标,并且其他三个指标也相对偏高。
第二类:山西、内蒙古能源矿藏储量比较多的两个地区。这两个地区的煤炭储量远大于其他省份,起到重要作用。
第三类:河北、辽宁能源矿藏储量相对较多的两个省份。
第四类:北京、天津、上海、江苏等大部地区属于能源矿藏储量相对比较少的地区。
对此根据我国各地区的能源矿藏储量制定和开发主要资源的战略方针,对各省市之间的资源合理配置及工矿企业的选址起到参考作用。我国已经制定的西气东输工程就是依据新疆地区天燃气巨大储量而制定的支援东部能源供应,协调我国能源矿藏的利用和开采,对我国的经济发展所需能源矿藏起到稳定作用。