SPSS操作方法:因子分析
- 格式:doc
- 大小:276.00 KB
- 文档页数:9
因子分析在各行各业的应用非常广泛,尤其是科研论文中因子分析更是频频出现。
小兵也凑个热闹,参考《SPSS 统计分析》书中的案例,运用SPSS进行因子分析,作为我博客 SPSS案例分析系列的第三篇文章。
【一、概念】探讨具有相关关系的变量之间,是否存在不能直接观察到的,但对可观测变量的变化其支配作用的潜在因素的分析方法就是因子分析,也叫因素分析。
通俗点:因子分析是寻找潜在的、起支配作用因子的方法。
【二、简单实例】现在有 12 个地区的 5 个经济指标调查数据(总人口、学校校龄、总雇员、专业服务、中等房价),为对这 12 个地区进行综合评价,请确定出这 12 个地区的综合评价指标。
【三、解决方案】1、spss因子分析同一指标在不同地区是不同的,用单一某一个指标难以对12个地区进行准确的评价,单一指标智能反映地区的某一方面。
所以,有必要确定综合评价指标,便于对比。
因子分析是一个不错的选择,5 个指标即为我们分析的对象,我们希望从这5个可观测指标中寻找出潜在的因素,用这些具有综合信息的因素对各地区进行评价。
下图是spss因子分析的操作界面,主要包括5方面的选项,变量区只能选择数值型变量,分类型变量不能进入该模型。
另外,spss软件为了消除不同变量间量纲和数量级对结果的影响,在该过程中默认自动进行标准化处理,因此不需要对这些变量提前进行标准化处理。
2、描述统计选项卡我们希望看到各变量的描述统计信息,要对比因子提取前后的方差变化,所以选定“单变量描述性”和“原始分析结果”;现在是基于相关矩阵提取因子,所以,选定相关矩阵的“系数和显著性水平“,比较重要的还有 KMO 和球形检验,通过KMO值,我们可以初步判断该数据集是否适合采用因子分析方法。
比较糟糕的是,kmo结果有时并不会出现,这主要与变量个数和样本量大小有关。
3、抽取选项卡在该选项卡中设置如何提取因子,提取因子的方法有很多,最常用的就是主成分法。
因为参与分析的变量测度单位不同,所以选择“相关矩阵”,如果参与分析的变量测度单位相同,则考虑选用协方差矩阵。
因子分析作业:全国30个省市的8项经济指标如下:要求:先对数据做标准化处理,然后基于标准化数据进行以下操作1、给出原始变量的相关系数矩阵;2、用主成分法求公因子,公因子的提取按照默认提取即特征值大于1,给出公因子的方差贡献度表;3、给出共同度表,并进行解释;4、给出因子载荷矩阵,据之分析提取的公因子的实际意义;如果不好解释,请用因子旋转采用正交旋转中最大方差法给出旋转后的因子载荷矩阵,然后分析旋转之后的公因子,要求给各个公因子赋予实际含义;5、先利用提取的每个公因子分别对各省市进行排名并作简单分析;最后构造一个综合因子,计算各省市的综合因子的分值,并进行排序并作简单分析;1、输入数据,依次点选分析描述统计描述,将变量x1到x8选入右边变量下面,点选“将标准化得分另存为变量”,点确定即可的标准化的数据;依次点选分析降维因子分析,打开因子分析窗口,将标准化的8个变量选入右边变量下面,点选描述相关矩阵下选中系数及KMO和Bartlett的检验,点继续,确定,就可得出8个变量的相关系数矩阵如下图;由表中数据可以看出大部分数据的绝对值都在以上,说明变量间有较强的相关性;KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度.621量;Bartlett 的球形近似卡方度检验df28Sig..000由上图看出,sig.值为0,所以拒绝相关系数为0变量相互独立的原假设,即说明变量间存在相关性;2、依次点选在因子分析窗口点选抽取方法:主成分;分析:相关性矩阵;输出:未旋转的因子解,碎石图;抽取:基于特征值特征值大于1;继续,确定,输出结果如下3个图;,第三列为累积贡献率,由上表看出前3个主成分的累计贡献率就达到了%>85%,所以选取主成分个数为3;选y1为第一主成分,y2为第二主成分,y3为第三主成分;且这三个主成分的方差和占全部方差的%,即基本上保留了原来指标的信息;这样由原来的8个指标变为了3个指标;由上图看出,成分数为3时,特征值的变化曲线趋于平缓,所以由碎石图也可大致确定出主成分个数为3;与按累计贡献率确定的主成分个数是一致的;3、共同度结果如下:;由上表数据可以看出,主成分包含了各个原始变量的80%以上的信息;4、在因子分析窗口,旋转输出:载荷阵;输出结果如下:成份矩阵a成份123Zscore: 国内.885.384.119生产Zscore: 居民.606.276消费由上表数据第一列表明:第一主成分与各个变量之间的相关性;第二列表明:第二主成分与各个变量之间的相关性;第三列表明:第三主成分与各个变量之间的相关性;可以得出:x1x3x8主要由第一主成分解释,x4x5主要由第二主成分解释,x6主要由第三主成分解释;但是x2是由第一主成分还是第二主成分解释不好确定,x7是由三个主成分中的哪个解释也不好确定;下面作因子旋转后的因子载荷阵;在因子分析窗口,抽取输出:旋转的因子解,继续;旋转方法:最大方差法,继续;确定;输出结果如下2图;旋转成份矩阵aa. 旋转在 5 次迭代后收敛;由上表数据可以得出:x1x3x5x8主要由第一主成分解释,x2x4主要由第二主成分解释,x6x7主要由第三主成分解释;与第一因子关系密切的变量主要是投入投资:固定资产投资与产出产值:国内生产总值、工业总产值方面的变量,货物周转又是投入产出的中介过程,可以命名为投入产出因子;与第二因子关系密切的都是反映民众生活水平的变量,可以命名为消费能力因子;与第三因子关系密切的是价格指数方面的变量,可以命名为价格指数因子;由上表可以看出:第二列数据表明,各个主成分的贡献率与旋转前的有变化,但是3个主成分的累积贡献率相同都是%;5、在因子分析窗口,得分因子得分保存为变量f1f2f3;方法:回归;再按三个主成分降序排列:数据排序个案:将f1选入排序依据,排列顺序:降序;同理得出按f2f3排序的结果;结果如下;最后,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分f;即f=f1+f2+f3/f得分在转换计算变量中的出;最后再按f得分排序;排序结果如下:f1 排序f2 排序f3 排序 f 排序山东上海云南上海江苏广东贵州山东广东北京湖北江苏河北天津新疆广东四川浙江四川四川河南西藏陕西湖北辽宁福建上海浙江浙江江苏甘肃云南上海青海广西北京湖北新疆湖南辽宁湖南云南青海湖南黑龙江海南山东新疆安徽宁夏内蒙贵州福建山东西藏河南云南广西江西广西广西甘肃宁夏陕西山西湖北山西河北北京贵州江苏黑龙江陕西黑龙江北京甘肃内蒙吉林浙江福建吉林辽宁河南山西江西湖南黑龙江青海新疆四川辽宁内蒙甘肃陕西河北江西贵州山西福建天津天津江西吉林西藏青海安徽广东吉林宁夏内蒙安徽安徽海南河南天津宁夏西藏河北海南海南有了对各个公因子的合理的解释,结合各个城市在三个公因子的得分和综合得分,就可对各城市的经济发展水平进行评价了;在投入产出因子f1上得分最高的6个城市是山东、江苏、广东、河北、四川;其中山东得分为,江苏得分为,高于其他城市,说明山东、江苏的工业的投入产出能力最高,工业发展相对较快,从而推动城市发展;而青海、宁夏、海南、西藏的投入产出能力较差,可能由于地理位置的缘故工业发展相对落后;上海、广东、北京、天津在消费能力因子f2上的得分较高,说明它们的消费能力较高,人们的收入也较高,从而生活质量较好,城市发展较快;而河南、河北得分较低,它们的消费能力较低,从而说明人们的收入也相对较低,生活质量相对差一点,城市发展较慢;云南、贵州、湖北、新疆在价格指数因子f3上的得分较高,说明在这些城市物价相对较高,可能以些非本地产的东西由于运输的不方便,使得这些物价相对较高,而广东、安徽、天津、海南的价格指数较低,说明,在这些城市,交通相对便捷,运输方便,或者本地产的东西较多基本满足需求,使得物价相对较低,但从侧面也可看出这些城市与其他城市的联系可能较少,不利于自己的总和发展,从而也说明了这些城市的发展相对较慢;由综合因子f的分就可综合评价城市的经济发展水平,综合得分的前3名上海、山东、江苏,得分最低的3个城市安徽、宁夏、海南;。
如何利用SPSS做因子分析等分析SPSS是一款强大的统计分析软件,可以用于各种数据分析任务,包括因子分析。
因子分析是一种用于探究观测变量之间关系的统计方法,它可以帮助我们理解数据集中不同变量之间的相关性和结构。
下面是一个简要的关于如何利用SPSS进行因子分析的步骤:1.准备数据首先,需要确保将数据整理成适合因子分析的格式。
确保数据集中的变量是连续型变量,并且不存在缺失值。
如果存在缺失值,需要进行数据处理或进行数据填充。
2.导入数据打开SPSS软件,然后依次选择“File”、“Open”来导入数据文件。
选择正确的文件路径和文件名,然后点击“打开”按钮。
3.创建因子分析模型选择“Analyze”菜单下的“Dimension Reduction”子菜单,然后选择“Factor”。
将需要进行因子分析的变量移至右侧的“Variables”框中,然后点击“OK”按钮。
4.选择因子提取方法5.设置因子提取参数出现因子提取对话框后,可以选择提取的因子数目和提取标准。
默认情况下,SPSS会提取所有可能的因子。
也可以根据实际需要进行调整。
完成设置后,点击“Continue”按钮。
6.选择因子旋转方法因子旋转可帮助我们更好地理解因子结构。
在因子分析向导的旋转选项中,可以选择旋转方法,如正交旋转和斜交旋转等。
选择一个适合你的需求的旋转方法,然后点击“Rotation”按钮。
7.设置旋转参数出现旋转参数对话框后,可以选择旋转的方法和旋转的标准。
默认情况下,SPSS会选择最大方差法和标准负荷量,但你可以根据需要进行调整。
完成设置后,点击“Continue”按钮。
8.检查结果在因子分析向导的“Descriptives”选项中,可以查看因子提取和旋转后的结果。
这些结果包括因子载荷矩阵、公因子方差和解释方差等信息。
仔细检查结果,确保它们符合你的预期。
9.解释结果在进行因子分析后,需要解释因子载荷矩阵以及其他统计结果。
因子载荷矩阵可以告诉你每个变量与每个因子之间的关系。
我就以我的数据为例来做示范,仅供参考一、信度分析(即可靠度分析)1.分析——度量——可靠度分析图 12.然后就会弹出上图1的框框。
在这里,你可以对所有的问题进行可靠度分析,如果是这样,那你只需要选中所有的问题到右边这个白色的框框,然后点击“统计量”,按照右边这个图进行打钩。
然后点“继续”。
之后就点“确定”图23.接着去“输出1”这个框看分析结果,你就会看到很多分析结果,其中有一个就是右图,那第一个0.808就是你所选择进行分析的数据的信度。
如果你想把每一个维度的数据进行独立的信度分析,那道理也是一样的。
二、因子分析在做因子分析之前首先要判断这些数据是否适合做因子分析,那这里就需要进行效度检验,不过总共效度检验是和因子分析的操作同步的,意思就是说你在做因子分析的时候也可以做效度检验。
具体示范如下:1.分析——降维——因子分析图 2一般来说,咱们做因子分析的时候是为了把那些具有共同属性的因子归类成一类,说的简单点就是要验证咱们所选取的每一个维度下面的题目是属于这个维度,而非其他维度的。
那一般来说,因子分析做出来的结果就是你原本有几个维度,最终分析结果就会归类成几个公因子。
2.一般来说,自变量的题目和因变量的题目是要独立分析的。
我的课题是“店面形象对顾客购买意愿的影响”那自变量就是店面形象的那些维度,因变量就是顾客购买意愿。
3.将要做分析的题目选择到右边的白框之后,就如下图打钩:“抽取”和“选项”两个不用管他。
然后就点“确定”4.按照上述步骤操作下来之后,就可以去“输出1”看分析结果。
首先看效度检验的结果:这里要看第一行和最后一行的数据,第一行数据为0.756,表明效度较高,s ig 为0.000,这两个结果显示这份数据完全可以做因子分析。
那就去看因子分析的结果。
因子分析是一种用于探索变量之间关系的统计方法。
在研究中,我们常常需要对大量的变量进行分析,以了解它们之间的关联性。
因子分析可以帮助我们发现变量之间的潜在结构,同时也可以帮助我们减少数据集中的复杂性。
在本文中,我们将探讨如何利用SPSS软件进行因子分析。
1. 数据准备在进行因子分析之前,首先需要准备好数据。
数据可以是定量的,也可以是定性的。
在SPSS中,我们可以通过导入Excel表格或者直接输入数据进行分析。
在导入数据之后,我们需要对数据进行清洗和筛选,确保数据的完整性和准确性。
2. 变量选择在因子分析中,我们需要选择适当的变量进行分析。
通常情况下,我们会选择相关性较高的变量进行分析,以便发现它们之间的潜在结构。
同时,我们也可以通过相关性分析或者变量筛选的方法来确定需要进行因子分析的变量。
3. 因子分析模型在SPSS中进行因子分析的时候,我们需要选择合适的因子分析模型。
通常情况下,我们可以选择主成分分析或者最大似然法进行因子分析。
在选择模型的时候,我们需要考虑数据的性质和研究的目的,以确保选择合适的模型进行分析。
4. 因子提取在进行因子分析的过程中,我们需要对因子进行提取。
在SPSS中,我们可以选择合适的提取方法,比如主成分法或者最大似然法。
在进行因子提取的时候,我们需要考虑提取的因子数目和因子的解释性,以便选择最合适的因子进行分析。
5. 因子旋转在因子分析中,我们通常会对因子进行旋转,以便更好地解释因子的结构。
在SPSS中,我们可以选择方差最大旋转或者极大似然旋转等方法进行因子旋转。
在进行因子旋转的时候,我们需要考虑因子的解释性和简单性,以便选择最合适的旋转方法。
6. 因子负荷在因子分析的结果中,我们通常会关注因子负荷。
因子负荷可以帮助我们理解变量和因子之间的关系,以及变量在因子上的权重。
在SPSS中,我们可以通过因子负荷矩阵和因子旋转后的因子负荷矩阵来进行观察和分析。
7. 结果解释在完成因子分析之后,我们需要对结果进行解释。
因子分析SPSS操作因子分析是一种多变量统计方法,旨在发现潜在的结构和相关性,以便简化数据集并解释变量之间的关系。
SPSS(统计软件包社会科学)是一种广泛使用的统计软件,可以帮助研究人员进行因子分析。
在SPSS中进行因子分析的步骤如下:1.数据准备:-确保数据集已经导入到SPSS中。
-检查和清洗数据,确保数据完整、准确,并且符合因子分析的前提条件。
2.因子分析模型:- 打开SPSS软件并选择“Analyze”菜单。
- 从下拉菜单中选择“Dimension Reduction”>“Factor Analysis”。
3.变量选择:- 从左侧的变量列表中选择要进行因子分析的变量,并将它们移动到右侧的“Variables”框中。
-这些变量应该是连续变量,而非分类变量。
4.因子提取:- 在“Factor Analysis”对话框的“Extraction”选项卡中选择因子提取方法。
- 确定要提取的因子数量。
可以使用Kaiser标准(主成分分析时为特征值大于1)或Scree Plot来指导因子数量的选择。
5.因子旋转:- 进入“Rotation”选项卡,选择适当的因子旋转方法。
- 常用的方法包括Varimax、Promax、Quartimax等。
-因子旋转的目标是最大化因子载荷的简单性和解释性。
6.结果解释:-在因子分析的结果中,可以查看各个变量的因子载荷矩阵,它描述了每个变量在每个因子上的影响程度。
-可以选择将因子载荷阈值设置为一定值,以便筛选出具有较高负载的变量。
-查看每个因子的解释方差,以了解它们对原始变量的解释程度。
7.结果可视化:-可以使用SPSS的图表功能来可视化因子分析结果。
-比如,可以绘制因子载荷矩阵的热图,用不同颜色表示不同的负载水平。
-还可以绘制因子解释方差的条形图,以比较每个因子的贡献程度。
需要注意的是,因子分析在使用时需要考虑以下几点:-样本量必须足够大,一般建议至少大于观测变量数的10倍。
S P S S操作方法:因子分析09(总9页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--实验指导之四因子分析的SPSS操作方法以例为例进行因子分析操作。
1.在SPSS的数据编辑窗口(见图1)点击Analysize →Data Reduction →Factor,打开Factor Analysis对话框如图2.图1 因子分析操作图2 Factor Analysis 对话框将参与因子分析的变量依次选入Variables框中。
例中有8个参与因子分析的变量,故都选入变量框内。
2.单击Descriptives 按钮,打开Descriptives对话框如图3所示。
Statistics栏,指定输出的统计量。
图3 Descriptives对话框Univariate descriptives 输出每个变量的基本统计描述;Initial solution 输出初始分析结果。
输出主成分变量的相关或协方差矩阵的对角元素。
(本例选择)Correlation Matrix栏指定输出考察因子分析条件和方法。
Coefficients相关系数矩阵;Significance levels 相关系数假设检验的P值;Determinant 相关系数矩阵行列式的值;KMO and Bartlett′s test of Sphericity KMO和巴特利检验(本例选择)巴特利检验是关于研究的变量是否适合进行因子分析的检验. 拒绝原假设意味着适合进行因子分析.KMO值等于变量间单相关系数的平方和与单相关系数平方和加上偏相关系数平方和之比, 值越接近1, 意味着变量间的相关性越强,越适合进行因子分分析, KMO值越接近0, 则变量间的相关性越弱. 越不适合进行因子分析.Inverse 相关系数矩阵的逆矩阵;Reproduced 再生相关阵;Anti-image 反映象相关矩阵。
3.单击Extraction 按钮,打开Extraction对话框选项,见图4。
实验指导之四
因子分析的SPSS操作方法
以例13.1为例进行因子分析操作。
1.在SPSS的数据编辑窗口(见图1)点击Analysize →Data Reduction →Factor,打开Factor Analysis对话框如图
2.
图1 因子分析操作
图2 Factor Analysis 对话框
将参与因子分析的变量依次选入Variables框中。
例13.1中有8个参与因子分析的变量,故都选入变量框内。
2.单击Descriptives 按钮,打开Descriptives对话框如图3所示。
✧Statistics栏,指定输出的统计量。
图3 Descriptives对话框
Univariate descriptives 输出每个变量的基本统计描述;
Initial solution 输出初始分析结果。
输出主成分变量的相关或协方差矩阵的对角元素。
(本例选择)
✧Correlation Matrix栏指定输出考察因子分析条件和方法。
Coefficients相关系数矩阵;
Significance levels 相关系数假设检验的P值;
Determinant 相关系数矩阵行列式的值;
KMO and Bartlett´s test of Sphericity KMO和巴特利检验(本例选择)
巴特利检验是关于研究的变量是否适合进行因子分析的检验. 拒绝原假设意味着适合进行因子分析.
KMO值等于变量间单相关系数的平方和与单相关系数平方和加上偏相关系数平方和之比, 值越接近1, 意味着变量间的相关性越强,越适合进行因子分分析, KMO值越接近0, 则变量间的相关性越弱. 越不适合进行因子分析.
Inverse 相关系数矩阵的逆矩阵;
Reproduced 再生相关阵;
Anti-image 反映象相关矩阵。
3.单击Extraction 按钮,打开Extraction对话框选项,见图4。
图4 Extraction对话框
✧Method栏,指定因子分析方法。
点击下拉菜单可以选择需要的方法。
Principal components 主成分法,系统默认;(本例选择)
Unweighted least square 普通最小二乘法;
Generalized least squares 广义最小二乘法
Maximum likelihood 最大似然法
Principal Axis factoring 主轴因子法
Alpha α因子提取法
Image 映像分析法
✧Extract栏,决定提取主成分的个数。
Eigenvalue over 指定要提取因子的最小特征值,系统默认值1,也可以自定义特征值的数值。
(本例选择)
Number of factors 直接指定提取的因子个数。
✧Display栏指定与初始因子有关的输出项
Unrotated factor solution 显示未旋转的因子解。
可以自定义特征值的数值。
(本例选择)
Scree plot 显示碎石图,可用于决定因子的提取个数。
(本例选择)
4.单击Rotation按钮,打开Rotation对话框(见图5)。
图5 Rotation对话框
✧Methed栏,选择因子旋转方法。
None不作选择,系统默认项。
Varimax 正交旋转最大方差法。
是因子旋转时常用的方法。
其它方法略。
✧Display栏,选择因子旋转的输出信息。
Rotated solution 输出旋转后的因子载荷矩阵。
(本例选择)
Loading plot(s) 输出旋转后的因子载荷散布图。
5.单击Scores按钮,打开Scores对话框选项(见图6)。
图6 Scores对话框
✧Save as variables 将样品的因子得分作为新变量保存在数据文件中。
(本
例选择)
✧Method栏,指定计算因子值方法
Regression 回归法(本例选择)
Bartlett 巴特利特法
Anderson-Rubin 安德森—鲁宾法
✧Display factor Score Coefficient Matrix 输出标准化的因子得分矩阵。
(本例选择)
6.单击Options按钮,打开Options对话框选择项,见图7。
图7 Options对话框
✧Coefficient Display Format 栏,指定输出其它因子结果及缺失值的处理
方式。
本例不作选择。
Sorted by size 从第一因子开始,按降序输出因子载荷矩阵。
Suppress absolute Value less than:( ) 在框内输入数值,表示输出大于等于这个值的载荷的变量。
所有选择完成后单击OK可得输出结果。
观察部分输出的结果:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .412
Bartlett's Test of Sphericity Approx. Chi-Square 165.364 df 28 Sig. .000
上表中表述检验表中巴特利检验通过,故本例采用因子分析是适合的。
下表是因子从每个原始变量中提取的信息量。
从上表中得出所有变量提取的信息量都在0.789以上。
上表显示各主成分解释原始变量总方差的情况。
本例保留了三个因子,这三个因子集中了原始变量的89.968%
上图表示的是碎石图,显示出取三个因子是合适的。
成分矩阵Component Matrix a
Component
1 2 3 Zscore: 固定资产利税(%).970 .037 -.200 Zscore: 资金利税率(%).909 -.342 .048 Zscore: 销售收入利税率(%).851 .158 -.297 Zscore: 资金利润(%) .941 -.291 -.010 Zscore: 固定资产产值率(%).897 -.215 -.007 Zscore: 逆:流动资金周转天数(%).348 .814 .333 Zscore: 逆:万元产值能耗(吨).653 -.050 .707 Zscore: 全员劳动生产率(万元/人.年).577 .617 -.274 a. 3 components extracted.
上表表示的是因子分析的初始解的因子载荷矩阵。
上表表示的是旋转后的因子载荷矩阵。
从表中得出第一个因子表示的是固定资产利税率,资金利税率,销售收入利税率,资金利润率,固定资产产值率这五个指标。
可以认为是工业生产中投入的资金、固定资产产出的效果,可以看成是投入产出因子。
第二个因子是流动资金周转天数和劳动生产率,可以认为是效率因子,而第三个因子反映的是万元产值能耗,反映的是能源消耗效果。
上表表示的是因子得分系数,
Component Transformation Matrix正交矩阵
Compone
nt 1 2 3
1 .891 .343 .296
2 -.342 .938 -.056
3 -.297 -.051 .953
上表表示的是因子旋转的正交矩阵。
最后在数据窗口可以得到的每个样品的因子得分,可以用散布图得出因子的得分图。
各样品的因子得分(标准化得分)图
从图中可以得出因子1中华新水泥厂得分最高。
因子2中湘乡水泥厂最好。