应用统计学因子分析与主成分分析案例解析+SPSS操作分析
- 格式:doc
- 大小:592.50 KB
- 文档页数:21
因子分析与主成分分析
摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。
关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件
引言:因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。基本步骤:在SPSS中进行因子分析的步骤如下:
选择“分析---降维---因子分析”,在弹出的对话框里
(1)描述---系数、KMO与Bartlett的球形度检验
(2)抽取---碎石图、未旋转的因子解
(3)旋转---最大方差法、旋转解、载荷图
(4)得分---保存为变量、显示因子得分系数矩阵
(5)选项---按大小排序
点击确定得到如下各图
图3-1
相关矩阵
GDP 居民消
费水平
固定资
产投资
职工平
均工资
货物周
转量
居民消
费价格
指数
商品价
格指数
工业总
产值
相关GDP 1.000 .267 .951 .187 .617 -.273 -.264 .874 居民消费水平.267 1.000 .426 .716 -.151 -.235 -.593 .363 固定资产投资.951 .426 1.000 .396 .431 -.280 -.359 .792 职工平均工资.187 .716 .396 1.000 -.357 -.145 -.543 .099 货物周转量.617 -.151 .431 -.357 1.000 -.253 .022 .659 居民消费价格指数-.273 -.235 -.280 -.145 -.253 1.000 .763 -.125 商品价格指数-.264 -.593 -.359 -.543 .022 .763 1.000 -.192 工业总产值.874 .363 .792 .099 .659 -.125 -.192 1.000
图3-2
KMO 和 Bartlett 的检验
取样足够度的 Kaiser-Meyer-Olkin 度量。.620
Bartlett 的球形度检验近似卡方231.285 df 28 Sig. .000
图3-7
旋转成份矩阵a
成份
1 2 3 GDP .955 .124 -.131 工业总产值.944 .109 -.014 固定资产投资.872 .351 -.137 货物周转量.751 -.507 -.192 职工平均工资.048 .925 -.121 居民消费水平.219 .841 -.209 居民消费价格指数-.135 -.013 .969 商品价格指数-.104 -.496 .819
提取方法 :主成份。
旋转法 :具有 Kaiser 标准化的正交旋转法。
a. 旋转在 5 次迭代后收敛。
图3-9
图3-10
成份得分系数矩阵
成份
1 2 3 GDP .306 .011 .047 居民消费水平.025 .387 .040 固定资产投资.270 .129 .075 职工平均工资-.025 .451 .096 货物周转量.248 -.319 -.139 居民消费价格指数.070 .180 .653 商品价格指数.077 -.098 .462 工业总产值.317 .026 .123
成份得分系数矩阵
成份
1 2 3
GDP .306 .011 .047
居民消费水平.025 .387 .040
固定资产投资.270 .129 .075
职工平均工资-.025 .451 .096
货物周转量.248 -.319 -.139
居民消费价格指数.070 .180 .653
商品价格指数.077 -.098 .462
工业总产值.317 .026 .123
提取方法 :主成份。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
图3-11
成份得分协方差矩阵
成份 1 2 3
1 1.000 .000 .000
2 .000 1.000 .000
3 .000 .000 1.000
提取方法 :主成份。
旋转法 :具有 Kaiser 标准化的正交旋转法。
构成得分。
(2)因子模型中各统计量的意义
A)因子载荷:因子载荷为第i个变量在第j个因子上的载荷,实际上就是与的相关系数,表示变量依赖因子的程度,反应了第i个变量对于第j 个因子的重要性。
B)变量的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为,公式为:
=(j=1,2,….,k)