《多元统计分析》课件 因子分析
- 格式:ppt
- 大小:783.00 KB
- 文档页数:5
多元统计分析之因子分析因子分析是一种常用的多元统计分析方法,旨在从大量观测指标中发现其背后的基本因素或维度,以简化数据分析的复杂性,并提供关于样本之间的隐含结构的信息。
本文将对因子分析的概念、原理、步骤以及其在研究中的应用进行详细介绍。
一、概念和原理因子分析是一种研究多个变量之间关系的统计技术,它通过寻找多个变量之间的共同特征,将它们归纳为较少的无关因素或构念。
这些无关因素或构念称为因子,它们是通过将原始变量进行数学转换而得到的。
因子分析通过发现这样的因子,帮助研究者识别数据中潜在的结构和模式。
因子分析的基本原理是假设多个变量之间存在共同的潜在因素,并试图将这些变量映射到较少的综合因素上。
这些潜在因素无法被直接观察到,因此需要通过数学上的推导和计算才能确定它们的存在。
因子分析的目标是找到能够解释原始变量之间的相关性的最小数目的因子。
二、步骤因子分析通常包括以下步骤:1.收集数据:收集包含多个观测指标的数据,这些指标应当反映被研究对象的多个方面。
2.确定分析的类型:根据研究目的和数据特点,确定主成分分析还是常规因子分析。
3.确定因子数目:使用合适的统计方法(如特征值、解释方差等)确定需要提取的因子数目。
4.提取因子:通过数学计算,将原始变量转换为较少的无关因子。
5.因子旋转:为了使因子更易于解释,通常进行因子旋转,以最大化因子之间的独立性并减少因子与原始变量之间的关联性。
6.解释因子:解释提取的因子,确定它们的意义和作用。
7.评估结果:评估因子分析的效果,并根据需要进行调整和修正。
三、应用因子分析广泛应用于社会科学、市场调研、心理学等领域。
以下列举一些常见的应用场景:1.人格特征研究:通过对多个问卷调查指标进行因子分析,识别人格特征的维度和结构。
2.战略管理:通过对市场指标、经济指标等进行因子分析,发现不同因素对企业发展的影响程度,从而制定合理的战略决策。
3.客户满意度调查:通过对客户满意度调查指标进行因子分析,发现影响客户满意度的各因素,并为改善客户满意度提供指导。
第八章 因子分析§8.1 什么是因子分析及基本思想1904年Charles Spearman 发表一篇著名论文《对智力测验得分进行统计分析》视为因子分析的起点。
因子分析的形成和发展有相当长的历史,最早用以研究解决心理学和教育学方面的问题,由于计算量大,又缺少高速计算的设备使因子分析的应用和发展受到很大的限制,甚至停滞了很长时间。
后来由于电子计算机的出现,才使因子分析的理论研究和计算问题,有了很大的进展。
目前这一方法的应用范围已十分广泛,在经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域都取得了显著的成绩。
1 什么是因子分析因子分析是主成分分析的推广和发展,它也是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系,同时根据不同因子还可以对变量进行分类,它也是属于多元分析中处理降维的一种统计方法。
例如,某公司对100名招聘人员的知识和能力进行测试,出了50道题的试卷,其内容包括的面较广,但总的来讲可归纳为六个方面:语言表达能力、逻辑思维能力、判断事物的敏捷和果断程度、思想修养、兴趣爱好、生活常识等,我们将每一个方面称为因子,显然这里所说的因子不同于回归分析中因素,因为前者是比较抽象的一种概念,而后者有着极为明确的实际意义,如人口密度、工业总产值、产量等。
假设100人测试的分数{}100,,1, =i X i 可以用上述六个因子表示成线性函数:,1001,i 662211 =++++=i i i i i F a F a F a X ε其中61,,F F 表示六个因子,它对所有X i 是共有的因子,通常称为公共因子,它们的系数61,i i a a 称为因子载荷,它表示第i 个应试人员在六个因子方面的能力。
i ε是第i 个应试人的能力和知识不能被前六个因子包括的部分,称为特殊因子,通常假定),0(~2i i N σε,仔细观察这个模型与回归模型在形式上有些相似,实质很不同。
第6章因子分析6.1 因子分析数学模型因子分析是很有用的统计分析工具,因子分析的实质就是找出少量不可观测的随机变量,用它们表示众多的可观测随机变量。
以下例子能说明因子分析的意义。
例6.1对一个班的学生,进行五门课程(力学、物理、代数、分析、统计)考试,其中力学和物理闭卷考试,代数、分析、统计开卷。
这5门功课的成绩是可观测的随机向量。
每个学生的成绩可以看成5维随机向量的一个观测,见表6-1。
表6-1 五门课程考试成绩经过一定计算(因子分析)后发现存在不可观测的随机变量:1f 、2f ,它们和51,...x x 间有关系 521542143213221212116377.1091469.9750.678264.162258.5364.721559.013358.6909.720269.564838.7523.721220.864570.8409.62v f f x v f f x v f f x v f f x v f f x +-+=+-+=+-+=+++=+++= (6.1) 其中1f 、2f 是不可观测的随机变量。
我们认为它们分别表示学生的学习能力和适应开闭卷能力,所以可分别称为学习因子和适应开闭卷因子。
(6.1)揭示了这两个因子如何影响5门功课的成绩,也揭示5门课成绩的实质:每门课的成绩由学习因子和适应开闭卷因子的线性组合,加上常数,再加上随机变量而得。
这是是很有意义的。
象例6.1那样,找出少量不可观测因子(例如1f 、2f ),并给出它们影响可观测随机变量(例如51,...x x )方式的统计分析,就是因子分析。
因子分析与主成分分析不同:主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。
因子分析方法在心理学,经济,医学,生物学,教育学等方面有重要用途。