多元统计分析 第8章(因子分析)
- 格式:ppt
- 大小:1.32 MB
- 文档页数:147
多元统计分析之因子分析因子分析是一种常用的多元统计分析方法,旨在从大量观测指标中发现其背后的基本因素或维度,以简化数据分析的复杂性,并提供关于样本之间的隐含结构的信息。
本文将对因子分析的概念、原理、步骤以及其在研究中的应用进行详细介绍。
一、概念和原理因子分析是一种研究多个变量之间关系的统计技术,它通过寻找多个变量之间的共同特征,将它们归纳为较少的无关因素或构念。
这些无关因素或构念称为因子,它们是通过将原始变量进行数学转换而得到的。
因子分析通过发现这样的因子,帮助研究者识别数据中潜在的结构和模式。
因子分析的基本原理是假设多个变量之间存在共同的潜在因素,并试图将这些变量映射到较少的综合因素上。
这些潜在因素无法被直接观察到,因此需要通过数学上的推导和计算才能确定它们的存在。
因子分析的目标是找到能够解释原始变量之间的相关性的最小数目的因子。
二、步骤因子分析通常包括以下步骤:1.收集数据:收集包含多个观测指标的数据,这些指标应当反映被研究对象的多个方面。
2.确定分析的类型:根据研究目的和数据特点,确定主成分分析还是常规因子分析。
3.确定因子数目:使用合适的统计方法(如特征值、解释方差等)确定需要提取的因子数目。
4.提取因子:通过数学计算,将原始变量转换为较少的无关因子。
5.因子旋转:为了使因子更易于解释,通常进行因子旋转,以最大化因子之间的独立性并减少因子与原始变量之间的关联性。
6.解释因子:解释提取的因子,确定它们的意义和作用。
7.评估结果:评估因子分析的效果,并根据需要进行调整和修正。
三、应用因子分析广泛应用于社会科学、市场调研、心理学等领域。
以下列举一些常见的应用场景:1.人格特征研究:通过对多个问卷调查指标进行因子分析,识别人格特征的维度和结构。
2.战略管理:通过对市场指标、经济指标等进行因子分析,发现不同因素对企业发展的影响程度,从而制定合理的战略决策。
3.客户满意度调查:通过对客户满意度调查指标进行因子分析,发现影响客户满意度的各因素,并为改善客户满意度提供指导。
第八章 因子分析§8.1 什么是因子分析及基本思想1904年Charles Spearman 发表一篇著名论文《对智力测验得分进行统计分析》视为因子分析的起点。
因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备使因子分析的应用和发展受到很大的限制,甚至停滞了很长时间。
后来由于电子计算机的出现,才使因子分析的理论研究和计算问题,有了很大的进展。
目前这一方法的应用范围已十分广泛,在经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域都取得了显著的成绩。
1 什么是因子分析因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。
例如,某公司对100名招聘人员的知识和能力进行测试,出了50道题的试卷,其内容包括的面较广,但总的来讲可归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等,我们将每一个方面称为因子,显然这里所说的因子不同于回归分析中因素,因为前者是比较抽象的一种概念,而后者有着极为明确的实际意义,如人口密度、工业总产值、产量等。
假设100人测试的分数{}100,,1, =i X i 可以用上述六个因子表示成线性函数:,1001,i 662211 =++++=i i i i i F a F a F a X ε其中61,,F F 表示六个因子,它对所有X i 是共有的因子,通常称为公共因子,它们的系数61,i i a a 称为因子载荷,它表示第i 个应试人员在六个因子方面的能力。
i ε是第i 个应试人的能力和知识不能被前六个因子包括的部分,称为特殊因子,通常假定),0(~2i i N σε,仔细观察这个模型与回归模型在形式上有些相似,实质很不同。
因子分析+聚类分析:一.对数据进行因子分析,实验步骤:1在SPSS窗口中选择:分析-降维-因子分析,在因子分析主界面将变量X1 移入变量框2点击“描述”,在对话框中,统计量选择:原始分析结果,相关矩阵选择:系数,以描述相关系数,点击继续3点击“抽取”,在对话框中,方法为主成份,分析选择:相关性矩阵,输出选择:未旋转的因子解和碎石图,抽取中选择基于特征值(特征值大于1)或者因子的固定数量(要提取的因子为2),点击继续4点击“旋转”,在对话框中,方法为最大方差法,在输出中选择旋转解和载荷图(当因子数=2时),点击继续5点击“得分”,在对话框中,选中“保存为变量”和“显示因子得分系数矩阵”,在方法中选择“回归”,点击继续6点击确定实验结果分析:1.特征根和累计贡献率解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的 % 累积 % 合计方差的 % 累积 % 合计方差的 % 累积 %1 2.731 45.520 45.520 2.731 45.520 45.520 2.688 44.802 44.8022 2.218 36.969 82.488 2.218 36.969 82.488 2.261 37.687 82.4883 .442 7.360 89.8484 .341 5.688 95.5365 .183 3.044 98.5806 .085 1.420 100.000提取方法:主成份分析。
由表中可以看出,因为成份1和2的特征值>1,被提取出来,而且由于第三个特征根相比下降比较快,我们也只选取两个公共因子,对1和2旋转后其累计贡献率为82.488%。
由碎石图,我们也可以看出1和2的特征值大于1,可以被提取出来,其余变量特征值过小,不予提取。
成份矩阵a成份1 2v1 .928 .253v2 -.301 .795v3 .936 .131v4 -.342 .789v5 -.869 -.351v6 -.177 .871由旋转前的成分矩阵可以写出每个原始变量关于各个成份的表达式。
因子分析+聚类分析:一.对数据进行因子分析,实验步骤:1在SPSS窗口中选择:分析-降维-因子分析,在因子分析主界面将变量X1 移入变量框2点击“描述”,在对话框中,统计量选择:原始分析结果,相关矩阵选择:系数,以描述相关系数,点击继续3点击“抽取”,在对话框中,方法为主成份,分析选择:相关性矩阵,输出选择:未旋转的因子解和碎石图,抽取中选择基于特征值(特征值大于1)或者因子的固定数量(要提取的因子为2),点击继续4点击“旋转”,在对话框中,方法为最大方差法,在输出中选择旋转解和载荷图(当因子数=2时),点击继续5点击“得分”,在对话框中,选中“保存为变量”和“显示因子得分系数矩阵”,在方法中选择“回归”,点击继续6点击确定实验结果分析:1.特征根和累计贡献率由表中可以看出,因为成份1和2的特征值>1,被提取出来,而且由于第三个特征根相比下降比较快,我们也只选取两个公共因子,对1和2旋转后其累计贡献率为82.488%。
由碎石图,我们也可以看出1和2的特征值大于1,可以被提取出来,其余变量特征值过小,不予提取。
从旋转成份矩阵可以看出,经过旋转的载荷系数产生了明显的区别,横向找到最大的一个数,如上表中黄色部分画出,第一个公因子在v1,v3,v5上占有较大载荷,说明于这三个指标有较大的相关性,命名为;第二个公因子在v2,v4,v6上有较大载荷,有较大相关性,归为一类,可命名为。
该表为成分转换矩阵,给出旋转所需的矩阵可以用成份得分系数矩阵写出各个因子关于中心标准化后的变量的表达式。
F1=0.385x1-0.001x2+…..F2=…..(分析的举例:第一个因子在外貌自信心洞察力推销能力工作魄力志向抱负理解能力潜能等变量上有较大的系数,可以抽象为应聘者主客观工作能力因子第二个因子在简历格式工作经验适应力变量上有较大的系数,可抽象为应聘者对客观环境的适应力因子第三个因子在兴趣爱好诚信度求职渴望度变量上有较大的系数,可抽象为应聘者的兴趣和诚信因子。
第8讲因子分析与对应分析因子分析和对应分析是多元统计分析的两个重要方法,可以用于探索和解释多个变量之间的关系。
本文将详细介绍因子分析与对应分析的原理、应用以及在研究中的注意事项。
一、因子分析1.概念与原理因子分析是一种用于降维和检验构念的统计方法,通过分析变量之间的共同变异性,将一组相关变量归纳为几个相互独立的因子。
通过因子分析,可以减少变量的数量,提取出变量集合的共同因素,并进一步应用这些因子进行研究。
2.过程与步骤因子分析的步骤主要包括:确定因子数量、提取因子、旋转因子和解释因子。
首先,需要根据研究的目的和理论基础确定因子的数量;然后,通过主成分分析、最大似然法等方法提取因子;接着,对提取的因子进行旋转,以便更好地解释因子的含义;最后,根据提取和旋转的因子来解释因子的含义和解释力,进行结果的解释。
3.应用与示例因子分析可以应用于研究心理学、社会学、经济学等多个领域。
例如,在心理学中,可以通过因子分析提取出代表不同人格特征的因子,从而研究不同因素对人格的影响。
在市场研究中,可以通过因子分析分析顾客对不同产品特征的偏好,从而为产品定位和市场推广提供参考。
二、对应分析1.概念与原理对应分析是一种描绘和解释两个或多个表格之间关系的统计方法,通过计算表格中元素之间的关联性,找出表格之间的对应关系。
对应分析基于数学原理,可以识别表格中的模式和趋势,并提供对表格元素之间关系的可视化展示。
2.过程与步骤对应分析的过程主要包括:计算对应坐标、分析对应方向和解释对应结果。
首先,通过降维技术(如主成分分析)计算表格中每个元素的对应坐标,即将高维表格转化为低维坐标。
其次,通过对应方向的分析,找出表格之间的对应关系。
最后,根据对应结果,解释表格之间的关联性和趋势。
3.应用与示例对应分析可以应用于研究多个变量之间的关系,如消费者对产品特征的偏好、不同地区的经济发展等。
例如,在市场研究中,可以通过对应分析识别消费者对不同产品特征的偏好,并据此进行市场推广策略。
第八章_因子分析因子分析是一种常用的多元统计分析方法,它通过对观测变量之间的关系进行综合考虑,将它们归纳为较少数量的共同因子,并解释这些因子与观测变量之间的关系。
因子分析可以用来发现数据背后的隐藏结构和模式,从而提高数据的解释力和预测能力。
1.因子分析的主要应用领域因子分析在许多领域中都有广泛应用。
在社会科学领域,因子分析常用于对人的主观评价和态度的研究,例如对消费者满意度、领导能力等方面的研究。
在市场研究中,因子分析可以将众多的市场指标归纳为几个关键的影响因素,从而更好地了解市场的特点和消费者的需求。
在心理学领域,因子分析可以用来研究人的智力、性格、态度等方面的因素。
在生物医学领域,因子分析可以用来研究疾病的病因,如心脏病的发病机制等。
2.因子分析的基本原理因子分析的基本原理是通过对观测变量之间的协方差矩阵进行特征值分解,找出最能解释观测变量之间关系的共同因子。
首先,将原始数据标准化,然后计算变量之间的协方差矩阵。
接下来,对协方差矩阵进行特征值分解,得到一组特征值和特征向量。
根据特征值的大小,选择前k个最大的特征值对应的特征向量,作为共同因子的估计。
最后,通过因子载荷矩阵和因子得分矩阵,将观测变量映射到共同因子上进行解释。
3.因子分析的步骤因子分析的步骤主要包括:确定研究对象和目标、准备数据、选择因子提取方法、确定因子数目、因子旋转和解释因子。
(1)确定研究对象和目标:确定要进行因子分析的变量和要研究的问题,例如对消费者满意度进行因子分析,研究消费者满意度的主要影响因素。
(2)准备数据:收集数据并进行预处理,包括缺失值处理、异常值处理和变量标准化。
(3)选择因子提取方法:根据数据的特点和研究目标选择适合的因子提取方法,常见的方法包括主成分分析、主因子分析和最大似然估计。
(4)确定因子数目:根据特征值和方差贡献率等指标,确定最优的因子数目。
(5)因子旋转:对提取的因子进行旋转,使得每个因子上的变量载荷更加清晰和有意义。