第九讲SPSS主成分分析和因子分析

  • 格式:ppt
  • 大小:894.00 KB
  • 文档页数:33

下载文档原格式

  / 33
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

公因子贡献率指一个 公因子能够解释所有 观测变量总变异的百 分比
特征根的含义是公因子 能够解释的变异是一个 观测变量变异的多少倍
因子负荷 矩阵,也 就是公因 子与观测 变量的相 关矩阵
提取公共因子的 方式
默认主成分分析
根据特征根的值提取公共 因子,一般要求特征根>1 固定公共因子的个数
碎石图可以 作为截取公 因子时的重 要参照
在实际求解过程中,因子分析和主成分 分析都有着一定的区别,计算上因子分 析更为复杂。 但对于计算机,因子分析并不费事。因 子分析比主成分分析多了“因子旋转 (factor rotation)”这样一个步骤。
对样本量的要求
主成分分析对于样本量没有严格的要求, 只要把需要进行分析的样本都用于进行 主成分分析即可。 因子分析理想的样本量是样本数为变量 数的10~25倍,考虑到因子分析时的变量 数通常很多,5~10倍的样本量也可以使 用。
验证性因子分析简介

在寻找公共因子的过程中,是否利用先验信息,产生 了探索性因子分析和确定性因子分析的区别。探索性 因子分析是在事先不知道影响因素的基础上,完全依 据资料数据,以一定的原则进行因子分析,最后得出 因子的过程。而验证性因子分析充分利用了先验信息, 是在已知因子的情况下检验所搜集的数据资料是否按 事先预定的结构方式产生作用。因此探索性因子分析 主要是为了找出影响观测变量的因子个数,以及各个 因子和各个观测变量之间的相关程度;而验证性因子 分析的主要目的是决定事前定义因子的模型拟合实际 数据的能力。
因子分析的基本原理
因子分析有探索性因子分析和验证性因 子分析两种。其中探索性因子分析的主 要作用是简化数据和探索数据结构;验 证性因子分析的作用是对数据结构的先 在假设进行检验。 因子分析使用的方法是分解原始变量, 通过相关找出潜在的“类别”,把每一 类变量看作一个共同因子,从此确定数 据结构。
主成分分析和因子分析
(Principal Component Analysis & Factor Analysis) 在研究实际问题时,往往需要收集多个变量。 但这样会使多个变量间存在较强的相关关系, 即这些变量间存在较多的信息重复,直接利用 它们进行分析,不但模型复杂,还会因为变量 间存在多重共线性而引起较大的误差。 为能够充分利用数据,通常希望用较少的新变 量代替原来较多的旧变量,同时要求这些新变 量尽可能反映原变量的信息。 主成分分析和因子分子正式解决这类问题的有 效方法。它们能够提取信息,使变量简化降维 ,从而使问题更加简单直观。
因子分析中的正交旋转方法



Varimax 方差最大法 只有少数几个变量在某个因子上有较高的负载, 其他变量在这个因子上的负载尽可能低。该方 法强调对因子的解释的简洁性。 Quartimax 四次方最大法 每个变量只在某一个因子上有较高的负载,在 其他的因子上有尽可能低的负载。该方法强调 了对变量解释的简洁性。 Equamax 等量最大法 等量最大法是上面两种方法的加权平均。
第七讲 因子分析与主成分分析
统计名言
模型选择是艺术,而不是科学。
——William Navidi
因子分析得到的是什么?

因子分析方法在部分领域应用的一些例子 心理学:心理学家瑟斯登对 56项测验的得分进 行因子分析,得出了7中主要智力因子:词语理 解能力,语言流畅能力、计数能力、空间能力 、记忆力、知觉速度和推理能力
截取公因子的标准

特征根大于1
公因子累积贡献率达到一定水平
碎石图的拐点

去掉因子负荷大于0.5非常少的因子
如果想把因子分存储下 来用于进一步分析,可 以把这个选项选上
在数据文件中新生成的两 个变量就是提取出的公因 子的因子分
选择是否进行因子旋转的菜单 ,这里面提供了三种正交旋转 和两种斜交旋转的方法,默认 值为不进行旋转。做主成分分
因子分析得到的是什么?

医学:一位研究者对山东某县 2000 ~ 2002 年 3 年 的全死因调查资料中不同地区各恶性肿瘤标化死 亡率进行因子分析后发现,该县居民恶性肿瘤的 发病和死亡具有明显的地区分布。在地区分布中 ,各种恶性肿瘤的死亡具有一定程度的聚集性。 经因子分析得到的 4 个主因子可以解释 10 种恶性 肿瘤死亡率的74.54%;10种恶性肿瘤中,被解释 的比例最小也在62%以上;而胃癌、白血病、膀 胱癌、乳腺癌、结肠癌死亡率被解释的比例均在 77%以上,表明这10种恶性肿瘤之间存在中等偏 强的内在联系和地区分布特点

主成分因子分析 Analyze→Dimention Reduction →Factor
KMO和 Bartlett球 形检验是分 辨数据能否 进行因子分 析的一个重 要指标
KMO取值范围从 0到1,值越大越 适合进行因子分 析,一般>0.7
P<0.05
公因子方差:观测 变量能够被公因子 所解释的变异占总 变异的百分比

选上后,因子负荷矩阵按照 负荷大小排序 低于特定值的因子负荷不 显示
Fra Baidu bibliotek
排序、旋转后、不显示比较 不排序并显示所有因子负荷 小的因子负荷
删除题目的原则

1.删除在两个或两个以上的公共因子上具 有接近因子载荷的题目 2.某个公因子下只有1个题目 3.删除在公共因子上的最大载荷小于0.35, 共同度小于0.4
两种因子分析的比较
选择最常用的方差最大 法进行正交旋转。
呈现因子负荷图
旋转前的因子载荷矩阵
旋转后的因子载荷矩阵
因子旋转的转换矩阵
因子转换矩阵就是旋转前的公因子与旋转后的公因 子之间的相关矩阵
旋转前
旋转后
因子分析的一般步骤
KMO与Bartlett`s球型检验 进行分析,按一定标准提取公因子 如果进行主成分分析则将主成分存为新 变量用于继续分析;如果进行因子分析 则考察公因子的实际意义,如有必要还 需要进行因子旋转,以寻求对因子的最 佳解释。 如有必要可以计算因子得分等中间指标 供进一步分析使用。

主成分分析的基本原理
严格来说,主成分分析只是一种中间手 段,其作用为简化数据。主成分分析不 能作为研究结果,应该在进行主成分分 析之后继续使用其他多元统计方法进行 分析。 主成分分析所使用的方法是通过线性变 换将原来的多个指标组合成相互独立的 少数几个能够反映出大部分信息的指标。

spss的实现