当前位置:文档之家› SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤
SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤

实验目的:

引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。

实验变量:

以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。

实验方法:因子分析法

软件:spss19.0

操作过程:

第一步:导入Excel数据文件

1.open data document——open data——open;

2. Opening excel data source——OK.

第二步:

1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).

2.降维:在最上面菜单里面选中Analyze——Dimension

Reduction——Factor ,变量选择标准化后的数据.

3.点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients

和KMO and Bartlett’s text of sphericity,点击Continue.

4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.

5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.

6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.

7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue.

8.返回主对话框,单击OK.

输出结果分析:

1.描述性统计量

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation

农、林、牧、渔业11 3.27 9.73 7.6645 1.97515

采矿业11 .6 9.5 5.008 2.7092

制造业11 .44 7.07 2.6900 2.22405

电力、热力、燃气及水生产和

11 3.36 15.05 10.3545 3.22751

供应业

建筑业11 1.79 23.51 7.8955 6.18302

批发和零售业11 2.10 18.52 9.1018 5.50553

交通运输、仓储和邮政业11 .82 8.39 2.7891 2.20903

Valid N (listwise) 11

该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。

2.KMO和球形Bartlett检验

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .744

Bartlett's Test of Sphericity Approx. Chi-Square 97.122

df 21

Sig. .000

该表给出了因子分析的KMO和Bartlett检验结果。从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.744,根据KMO度量标准可知,原变量适合进行因子分析。

3.因子分析的共同度

Communalities

Initial Extraction

Zscore(农、林、牧、渔业) 1.000 .883

Zscore: 采矿业 1.000 .741

Zscore: 制造业 1.000 .974

Zscore(电力、热力、燃气及

水生产和供应业)

1.000 .992

Zscore: 建筑业 1.000 .987

Zscore(批发和零售业) 1.000 .965

Zscore(交通运输、仓储和邮

政业)

1.000 .935

Extraction Method: Principal Component Analysis.

表格所示是因子分析的共同度。表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。

4.因子分析的总方差解释

Total Variance Explained

Comp onent

Initial Eigenvalues

Extraction Sums of Squared

Loadings

Rotation Sums of Squared

Loadings

Total

% of

Variance

Cumulativ

e % Total

% of

Variance

Cumulativ

e % Total

% of

Variance

Cumulativ

e %

1 3.079 43.99

2 43.992 3.079 43.992 43.992 2.660 37.999 37.999

2 2.35

3 33.608 77.600 2.353 33.608 77.600 2.346 33.517 71.516

3 1.046 14.941 92.541 1.046 14.941 92.541 1.472 21.025 92.541

4 .413 5.90

5 98.446

5 .098 1.399 99.845

6 .011 .152 99.997

7 .000 .003 100.000

Extraction Method: Principal Component Analysis.

该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。

Initial Eigenvalues部分描述了初始因子解的状况。第一个因子的特征根为3.079,解释7个原始变量总方差的43.992%;第二个因子的特征根为

2.353,解释7个原始变量总方差的3

3.608%,累计方差贡献率为77.600%;第三个因子的特征根为1.046,解释7个原始变量总方差的1

4.941%,累计方差贡献率为92.541%,也就是说,三个变量解释了所有7各变量的90%以上,且也只有这三个变量的特征值大于1。

Extraction Sums of Squared Loadings部分和Rotation Sums of Squared Loadings部分描述了因子提取后和旋转后的因子解。从表中看出,有三个因子提取和旋转,其累计解释总方差百分比和初始解的前三个变量相同,但经旋转后的因子重新分配各个因子的解释原始变量的方差,使得因子的方差更接近,也更易于解释。

5.碎石图

利用因子分析的碎石图可以更加直观的发现最优因子的数量。在碎石图中,横坐标表示因子数目,纵坐标表示特征根。从图中可以看出,前三个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大,

6. 旋转前的因子载荷矩阵

该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。

在旋转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。 7. 旋转后的因子载荷矩阵

Rotated Component Matrix a

Component

1

2

3

Zscore(农、林、牧、渔业) .899

Zscore(交通运输、仓储和邮政业) -.716 -.3.41

Zscore: 采 矿 业

.771 .352 Zscore(电力、热力、燃气及水生产和供应业)

.749

.440

.441

Zscore: 建 筑 业 .985

Zscore(批发和零售业) .961

Zscore: 制 造 业

.873

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

Component Matrix a

Component

1

2

3

Zscore(电力、热力、燃气及水生产和供应业)

.871

Zscore(交通运输、仓储和邮政业) -.860 Zscore: 采 矿 业 .857 Zscore(农、林、牧、渔业) .704 Zscore(批发和零售业) .726 .569 Zscore: 建 筑 业 .687 .364 Zscore: 制 造 业

.600

.793

Extraction Method: Principal Component Analysis. a. 3 components extracted.

该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。

在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。和没旋转相比,因子的含义清楚很多。

8.旋转空间的因子图

该图为可以看做是旋转后的载荷矩阵的图形表示。从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。

8.因子得分系数

Component Score Coefficient Matrix

Component

1 2 3

Zscore(农、林、牧、渔业) .445 .075 -.350

Zscore: 采矿业.261 -.054 .093

Zscore: 制造业-.180 .008 .761

Zscore(电力、热力、燃气及

.201 .182 .263

水生产和供应业)

Zscore: 建筑业-.074 .429 .156

Zscore(批发和零售业) .071 .402 -.130

Zscore(交通运输、仓储和邮

-.322 .204 .050

政业)

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

Component Scores.

列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscor e5+0.071*Zscore6-0.322*Zscore7

F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscor e5+0.402*Zscore6-0.204*Zscore7

F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zsco re5-0.130*Zscore6+0.050*Zscore7

不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。

9.总因子得分及排序

附件:

原始数据:

标准化后的数据:

相关主题
文本预览
相关文档 最新文档