应用统计学因子分析与主成分分析案例解析+SPSS操作分析

  • 格式:doc
  • 大小:592.50 KB
  • 文档页数:21

下载文档原格式

  / 21
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因子分析与主成分分析

摘要:通过搜集相关数据,采用因子分析法和主成份分析法,对我国各个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合评价。

关键词:由于样本数比较多,这里不再给出,可参见factor1.sav文件

引言:因子分析是寻找潜在的起支配作用的因子模型的方法。因子分析是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同的组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为公共因子。对于所研究的问题就可试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。通过因子分析得来的新变量是对每个原始变量进行内部剖析。因子分析不是对原始变量的重新组合,而是对原始变量进行分解,分解为公共因子和特殊因子两部分。具体地说,就是要找出某个问题中可直接测量的具有一定相关性的诸指标,如何受少数几个在专业中有意义、又不可直接测量到、且相对独立的因子支配的规律,从而可用各指标的测定来间接确定各因子的状态。基本步骤:在SPSS中进行因子分析的步骤如下:

选择“分析---降维---因子分析”,在弹出的对话框里

(1)描述---系数、KMO与Bartlett的球形度检验

(2)抽取---碎石图、未旋转的因子解

(3)旋转---最大方差法、旋转解、载荷图

(4)得分---保存为变量、显示因子得分系数矩阵

(5)选项---按大小排序

点击确定得到如下各图

图3-1

相关矩阵

GDP 居民消

费水平

固定资

产投资

职工平

均工资

货物周

转量

居民消

费价格

指数

商品价

格指数

工业总

产值

相关GDP 1.000 .267 .951 .187 .617 -.273 -.264 .874 居民消费水平.267 1.000 .426 .716 -.151 -.235 -.593 .363 固定资产投资.951 .426 1.000 .396 .431 -.280 -.359 .792 职工平均工资.187 .716 .396 1.000 -.357 -.145 -.543 .099 货物周转量.617 -.151 .431 -.357 1.000 -.253 .022 .659 居民消费价格指数-.273 -.235 -.280 -.145 -.253 1.000 .763 -.125 商品价格指数-.264 -.593 -.359 -.543 .022 .763 1.000 -.192 工业总产值.874 .363 .792 .099 .659 -.125 -.192 1.000

图3-2

KMO 和 Bartlett 的检验

取样足够度的 Kaiser-Meyer-Olkin 度量。.620

Bartlett 的球形度检验近似卡方231.285 df 28 Sig. .000

图3-7

旋转成份矩阵a

成份

1 2 3 GDP .955 .124 -.131 工业总产值.944 .109 -.014 固定资产投资.872 .351 -.137 货物周转量.751 -.507 -.192 职工平均工资.048 .925 -.121 居民消费水平.219 .841 -.209 居民消费价格指数-.135 -.013 .969 商品价格指数-.104 -.496 .819

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

a. 旋转在 5 次迭代后收敛。

图3-9

图3-10

成份得分系数矩阵

成份

1 2 3 GDP .306 .011 .047 居民消费水平.025 .387 .040 固定资产投资.270 .129 .075 职工平均工资-.025 .451 .096 货物周转量.248 -.319 -.139 居民消费价格指数.070 .180 .653 商品价格指数.077 -.098 .462 工业总产值.317 .026 .123

成份得分系数矩阵

成份

1 2 3

GDP .306 .011 .047

居民消费水平.025 .387 .040

固定资产投资.270 .129 .075

职工平均工资-.025 .451 .096

货物周转量.248 -.319 -.139

居民消费价格指数.070 .180 .653

商品价格指数.077 -.098 .462

工业总产值.317 .026 .123

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

构成得分。

图3-11

成份得分协方差矩阵

成份 1 2 3

1 1.000 .000 .000

2 .000 1.000 .000

3 .000 .000 1.000

提取方法 :主成份。

旋转法 :具有 Kaiser 标准化的正交旋转法。

构成得分。

(2)因子模型中各统计量的意义

A)因子载荷:因子载荷为第i个变量在第j个因子上的载荷,实际上就是与的相关系数,表示变量依赖因子的程度,反应了第i个变量对于第j 个因子的重要性。

B)变量的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为,公式为:

=(j=1,2,….,k)