新浪博客

用SPSS进行主成分分析

2016-12-28 00:50阅读:
版权声明:本文为博主原创文章,未经允许不得转载。
主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,是一种降维处理技术。在SPSS中没有把主成分分析作为一种独立的分析方法,而是和因子分析共用一个过程。因此在SPSS中进行主成分分析时会输出许多因子分析中的结果,但并不影响分析结果的准确性。
数据:
全国30个省、市自治区经济发展的基本情况数据。具体指标有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。
目的:
利用主成分分析进行数据探索和信息综合
SPSS操作:
Analyze--Dimension reduction--Factor analysis
Descriptives—Correlation matrix(相关矩阵)—Coefficient(系数)打勾
如下图所示
用SPSS进行主成分分析
SPSS在进行主成分分析(因子分析前)会自动对原始变量进行标准化,输出结果里面都是标准化后的变量。关于SPSS因子分析中更多的选项(功能)介绍,我们放在因子分析里面讲,下面只讲主成分相关的。
结果:
用SPSS进行主成分分析

从(Correlation matrix)相关矩阵上看,很多变量之间的相关性比较强,存在信息上的重复,体现了信息浓缩的必要性。
用SPSS进行主成分分析

总体方差解释(Total Variance Explained)里给出我们关心的特征值、方差贡献率(% of Variance)和累计方差贡献率(Cumulative %);在此图中前三个主成分特征根大于1,分别方差贡献为 46.924%、27.532%和15.096%,且累计贡献达到89.551%,已经足够描述经济发展水平了;SPSS抽取了其中特征根大于1的成分在右边形成新表(Extraction Sums of Squared Loadings)。
用SPSS进行主成分分析
成分矩阵(component matrix):由于SPSS中,主成分分析是嵌在因子分析里,其实这张表是初始的因子载荷矩阵,真正的主成分系数矩阵还需要每个数再除以对应的特征值的平方根
结论:经过上面的分析,已经可以求出用来代替8个原始变量的3个主成分。下一步可以进一步利用这3个主成分的得分来进行排序分析;或者进行其他的更深入的分析如回归、聚类等。

我的更多文章

下载客户端阅读体验更佳

APP专享