当前位置：文档之家› 用SPSS做探索性因子分析

用SPSS做探索性因子分析

DRAFT ONLY

附：在SPSS 中做探索性因子分析

10.12

操作步骤

3 第一步：载入数据并启动因子分析。 4

7 第二步：选择因子所对应的测度项。在这个研究中，我们选择对应于七个变量(包括8 自变量、因变量、与控制变量) 的测度项。

告读者丗本书的正式版丆《社会调查设计与数据分析:从立题到发表》丆终于作为国内最好的研究方法丛书-重庆大学万卷方法丛书的一员出版了乮六2011年6月乯。有兴趣购买的读者现在可以从卓越购买。相比于意见稿丆正式版丗

- 增加了第13章丆构成性测度与PLS?C - 增加了第14章丆潜变量的调节作用 - 大量充实第15章丆论文写作与发表

- 第12章中数据分析的结果做了大量更新丆原内容介绍的方法与数据分析的结论虽然正确丆数据计算结果有错误。

其它各章也做了相当多的修改丆不再赘述。正式版比意见版的内容增加了大概三分之一。这些新增的内容对于科研人员和方法论老师来讲是十分重要。

本附录是书稿的一部分。

DRAFT ONLY

第三步：设定因子求解办法为主成分分析法。使用相关系数矩阵，并设定主要因子的

特征根大于1。

第四步：设计因子旋转方法为“Varimax”。然后在“Factor Analysis”窗口中按“ok”

开始计算。

DRAFT ONLY

10.13

主成分分析的结果

4 对应于27个测度项，主成分分析法一共产生了27个因子。这是可以产生的因子个数

5 的上限。“Total ”列报告了每一个因子所对应的特征值。“% of Variance ”表示这个特征

6 值在所有特征值和中的比例。“Extraction Sums of Squared Loadings ”这一列反映了特征根

7 大于1的因子。在这个例子中，我们顺利地得到了7个因子。相应地，在用碎石坡法对因

8 子进行目测时，我们得到的结果是一致的。请读者参看本章中的相应图例。值得一提的

9 是，第八个因子的特征根为0.967，十分接近1。如果这个研究的理论因子个数是8个，研10 究者也可能考虑手工设定所要抽取的因子个数 (见第三步界面)。

SPSS也报告了每一个主成分对于一个测度项的载荷。从这个表可以看出，第一个因子解1

释了topicality scope, 与relevance 中的大部分信息，因为在这些测度项上这个因子的载荷很高。3

第二个因子则对应于background knowledge。第三个因子对应于understandability，第四个因子

对应于reliability，第五个因子对应于topicality中的一部分，第六个因子对scope作了一些反向4

的调查，第七个因子似乎对noveltyf进行解释，但它的作用不是很明确。这就是主成分分析产6

生的结果的特点：它告诉我们能够得到的主要因子的个数，每一个因子所对应的信息却无法直7

观解释。这是因为因子之间有信息重合。

Component Matrix (a)

a 7 components extracted.

在这种情况下，我们通常对这样得到的因子进行旋转。下表报告了用Varimax旋转后的因16

子载荷矩阵。

DRAFT ONLY

Rotated Component Matrix (a)

4 Rotation Method: Varimax with Kaiser Normalization.

5 a Rotation converged in

6 iterations.

7 这个载荷矩阵明确地表示了测度项是如何与一些因子对应起来的。检查其中的每一项，我8 们会发现scope4, relevance2违反了区别效度。这就提醒我们重新审视这些测度项的措词。对于9 Scope4，测度项的措词是：The scope of this document is inappropriate for me (1-strongly disagree, 10 7-strongly agree)。而其它几个测度项的措词都是指范围过大或者过小。调查对象可能把11 inappropriate scope 理解成这个文档不对应于他的信息需求，而不是它的内容的量上的不足或过12 多，结果是，这个测度项在相当程度上负载了Topicality 的信息 (0.426)。relevance2的措词是：13 My opinion/view towards the current topic has been significantly changed or strengthened by this 14 document (1-strongly disagree, 7-strongly agree)。仔细观察其它的测度项，其它的测度项都表示15 “我”会不会因着这个文档采取行动，只有这个测度项测量认知上的变化。虽然认知上的变量16 符合这个因子的定义，却是很不容易让人在这种实验环境下有明确的理解。数据结果告诉我17 们，调查对象可能一开始对这个话题都没有什么看法；读了一个文档以后，他们有了一些认18 识，这对他们来讲也是全新的认识，所以这个测度项反而负载了Novelty 中的信息 (0.521)。通19 过这样的“后见之明”，我们体会到在问卷设计之时没有预见到的很多陷阱。NOVEL4 (The 20 content of this document is ____ the content of other document (s) I have read 。1-very similar to, 7-21 very different from) 离关键值很近，它在对应因子上的载荷刚过0.5。这是一个边缘案例。这个

DRAFT ONLY

测度项其实没有违反效度 (原文中的论述有误)。对于处于临界点的测度项，如果测度项个数太1 少，比如去掉之后会少于3，则研究者会考虑保留这个测度项。之后，这几个测度项被逐个去2 掉，在去掉每一个测度项后，我们需要重新作因子分析，以检测测度项在新的情况下的效度。3 如果效度满足，这个过程就可以停止。在本例中，前两个测度项被分两步去掉。以下的报告中4 没有包括第三个测度项是因为在其它的样本中这个测度项几次都出现效度问题 (虽然它在语义5 上没有明显的问题)。为了保证与以后要讲到的结构方程的一致性，我们在这里把它去掉。我们6 提醒读者，如果单单从一个样本来看，这个测度项是应当保留的。下表报告了剩下的测度项的7 载荷矩阵，其中也报告了特征根与一个因子中的信息量。其中因子中的信息量并不表示旋转后8 的一个主成分中的信息，而是指旋转前的信息 (基于“净化”后的测度项)，所以最后三行与各9 旋转后的因子之间并没有对应关系：

Rotated Component Matrix (a)

14 Rotation Method: Varimax with Kaiser Normalization. 15 a Rotation converged in 6 iterations. 16

17 如果读者想验证旋转后的载荷矩阵与旋转前的关系，SPSS 也报告了旋转所用的转换矩18 阵。对于以上结果，这个矩阵是：

19 20 21

DRAFT ONLY

Component Transformation Matrix

6 Rotation Method: Varimax with Kaiser Normalization. 7

8 可以验证：

9 Rotated Component Matrix = Component Matrix Component Transformation Matrix 。 10

11 最后，我们如果想知道一个测度项中的信息有多少被这些主成分解释了，我们可以求这个12 载荷矩阵的积LL ’。这部分被解释的信息叫作公因子方差 (communality)。在SPSS 中我们可以13 得到LL ’是：

15 Reproduced Correlations

know1 know2 know3 topic1 topic2 topic3 topic4 ri4 ri5 know1 0.92 0.91 0.91 -0.18 -0.23 -0.11 -0.09 ….

0.17 0.24 know2 0.91 0.94 0.90 -0.17 -0.24 -0.13 -0.12 0.11 0.20 know3 0.91 0.90 0.91 -0.15 -0.19 -0.07 -0.09 0.17 0.22 topic1 -0.18 -0.17 -0.15 0.80 0.78 0.77 0.72 0.23 0.14 topic2 -0.23 -0.24 -0.19 0.78 0.83 0.84 0.72 0.17 0.02 topic3 -0.11 -0.13 -0.07 0.77 0.84 0.87 0.77 0.25 0.09 topic4 -0.09 -0.12 -0.09

0.72 0.72 0.77 0.75 0.26

0.15

…. ri1 -0.11 -0.17 -0.12 0.26 0.23 0.27 0.28 0.59 0.55 ri3 0.17 0.12 0.17 0.28 0.28 0.39 0.39 0.64 0.59 ri4 0.17 0.11 0.17 0.23 0.17 0.25 0.26 0.82 0.80 ri5

0.24

0.20

0.22

0.14

0.02

0.09

0.15

0.80

0.85

Reproduced Correlations

18 Extraction Method: Principal Component Analysis.

19 a Residuals are computed between observed and reproduced correlations. There are 60 (21.0%) 20 nonredundant residuals with absolute values greater than 0.05. 21 b Reproduced communalities

23 这个拟合的相关系数矩阵中的对角线对应于每个测度项的公因子方差。这个矩阵正好是24 Rotated Component Matrix 与其自身转置的积，读者可以自行验证。同时，SPSS 也会报告每个25 测度项的公因子方差 (通过设置descriptives 中的选项)，其结果与这里是一致的。

26 我们现在来尝试对这个数据进行斜旋转。我们使用一种叫Oblimin 的方法 (并使用默认参27 数)。斜旋转产生与前面一样的因子个数以及Component Matrix 。唯一不同的是旋转以后的载荷28 矩阵。斜旋转产生两个矩阵，一个是Factor Pattern Matrix ，一个是 Factor Structure Matrix 。其29 中Factor Pattern Matrix 表示的是因子的构造方法，即各测度项是如何通过一个类似回归的方法30 加权求和得到一个因子的值。相反，Factor Structure Matrix 表示的是因子与测度项之间的载31 荷，即如何对因子进行加权求和得到测度项 (的近似值)。所以，在报告中，我们应该报告后32 者。

DRAFT ONLY

1 2 3 4

Pattern Matrix (a)

8 Rotation Method: Oblimin with Kaiser Normalization. 9 a Rotation converged in 7 iterations. 10

11 从以下的Structure Matrix 中，我们可以看到测度项在对应的因子上的载荷几乎都增加了。12 但是，有几个测度项 (比如topic4) 违反了正交时区别效度 (虽然这个规则不适用于斜旋转)。在13 本例中，正交旋转与斜旋转的差别不大。但这种差别在因子相关性较大时就会相当明显。

Structure Matrix

16 17

DRAFT ONLY

1 Rotation Method: Oblimin with Kaiser Normalization. 2

3 我们也可以看一眼斜旋转后因子之间的相关性 (下表)。相关系数大多在0.3以内。如果相

4 关系数增加，我们的Structure Matrix 就会变得更难以解释了。

Component Correlation Matrix

7 8

9 Rotation Method: Oblimin with Kaiser Normalization.

SPSS探索性因子分析报告地过程

现要对远程学习者对教育技术资源和使用情况进行了解，设计一个李克特量表，如下图所示：问题题项从未使用很少使用有时使用经常使用总是使用 1 2 3 4 5 a1 电脑 a2 录音磁带 a3 录像带 a4 网上资料 a5 校园网或因特网 a6 电子邮件 a7 电子讨论网 a8 CAI 课件 a9 视频会议 a10 视听会议一．因子分析的定义在现实研究过程中，往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量，从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息，但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系，导致了信息的重叠现象，从而增加了问题分析的复杂性。因子分析是将现实生活中众多相关、重叠的信息进行合并和综合，将原始的多个变量和指标变成较少的几个综合变量和综合指标，以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息，而各综合指标之间彼此是不相关的，代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系，以较少几个因子反应原资料的大部分信息的统计方法。二．数学模型 i m im i i i i U F F F F Z +++++=αααα · · · 332211 i Z 为第i 个变量的标准化分数；（标准分是一种由原始分推导出来的相对地位量数，它是用来说明原始分在所属的那批分数中的相对位置的。） m F 为共同因子； m 为所有变量共同因子的数目； i U 为变量i Z 的唯一因素； im α为因子负荷。（也叫因子载荷，统计意义就是第i 个变量与第m 个公共因子的相关系数,它反映了第i 个变量在第m 个公共因子上的相对重要性也就是第m 个共同因子对第i 个变量的解释程度。）因子分析的理想情况，在于个别因子负荷im α不是很大就是很小，这样每个变量才能与较少的共同因子产生密切关联，如果想要以最少的共同因素数来解释变量间的关系程度，则i U 彼此间不能有关联存在。所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关，即在各个因子变量不相关的情况下，因子负荷im α就是第i 个原有变量和第m 个因子变量间的相关系数，也就是i Z 在第m 个共同因子变量上的相

Amos_验证性因子分析步步教程

应用案例1 第一节模型设定结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解释四个步骤。下面以一个研究实例作为说明，使用Amos7软件2进行计算，阐述在实际应用中结构方程模型的构建、运算、修正与模型解释过程。一、模型构建的思路本案例在著名的美国顾客满意度指数模型(ASCI)的基础上，提出了一个新的模型，并以此构建潜变量并建立模型结构。根据构建的理论模型，通过设计问卷对某超市顾客购物服务满意度调查得到实际数据，然后利用对缺失值进行处理后的数据3进行分析，并对文中提出的模型进行拟合、修正和解释。二、潜变量和可测变量的设定本文在继承ASCI模型核心概念的基础上，对模型作了一些改进，在模型中增加超市形象。它包括顾客对超市总体形象及与其他超市相比的知名度。它与顾客期望，感知价格和顾客满意有关，设计的模型见表7-1。模型中共包含七个因素(潜变量)：超市形象、质量期望、质量感知、感知价值、顾客满意、顾客抱怨、顾客忠诚，其中前四个要素是前提变量，后三个因素是结果变量，前提变量综合决定并影响着结果变量(Eugene W. Anderson & Claes Fornell，2000;殷荣伍，2000)。表 2.1、顾客满意模型中各因素的具体范畴参考前面模型的总体构建情况、国外研究理论和其他行业实证结论，以及小范围甄别调查的结果，模型中各要素需要观测的具体范畴，见表7-2。 1关于该案例的操作也可结合书上第七章的相关内容来看。 2本案例是在Amos7中完成的。 3见spss数据文件“处理后的数据.sav”。

表

三、关于顾客满意调查数据的收集本次问卷调研的对象为居住在某大学校内的各类学生（包括全日制本科生、全日制硕士和博士研究生），并且近一个月内在校内某超市有购物体验的学生。调查采用随机拦访的方式，并且为避免样本的同质性和重复填写，按照性别和被访者经常光顾的超市进行控制。问卷内容包括7个潜变量因子，24项可测指标，7个人口变量，量表采用了Likert10级量度，如对四、缺失值的处理采用表列删除法，即在一条记录中，只要存在一项缺失，则删除该记录。最终得到401条数据，基于这部分数据做分析。五、数据的的信度和效度检验 1．数据的信度检验 4正向的，采用Likert10级量度从“非常低”到“非常高”

SPSS因子分析报告实例操作步骤

SPSS因子分析实例操作步骤实验目的: 引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产与供应业,建筑业,批发与零售业,交通运输、仓储与邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。实验变量: 以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产与供应业,建筑业,批发与零售业,交通运输、仓储与邮政业作为变量。实验方法:因子分析法软件:spss19、0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open; 2、 Opening excel data source——OK、

第二步: 1、数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量)、 2.降维:在最上面菜单里面选中Analyze——Dimension Reduction—— Factor ,变量选择标准化后的数据、

3.点击右侧Descriptive,勾选Correlation Matrix选项组中的 Coefficients与KMO and Bartlett’s text of sphericity,点击 Continue、 4、点击右侧Extraction,勾选Scree Plot与fixed number with factors,默认3个,点击Continue、

5、点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue、 6、点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue、

spss因子分析实例

一．研究目的：为了研究农民收入，我们选取了其中7种主要影响因素，包括财政用于农业的支出的比重（%），第二、三产业从业人数占全社会从业人数的比重（%），非农村人口比重，乡村从业人员占农村人口的比重（%），农业总产值占农林牧总产值的比重（%），农作物播种面积（千公顷），农村用电量（亿千瓦时）。（数据见最后一页）二．研究变量：在经济生活中，根据以上分析，我们在影响农民收入因素中引入7个变量。即设置变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重，x3-非农村人口比重，x4-乡村从业人员占农村人农村口的比重，x5-农业总产值占农林牧总产值的比重，x6-农作物播种面积，x7 — 用电量。一、研究方法：SPSS中的因子分析。具体操作步骤（1）定义变量：x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重，x3-非农村人口比重，x4-乡村从业人员占农村人口的农村用电比重，x5-农业总产值占农林牧总产值的比重，x6-农作物播种面积，x7 — 量。（2）导入数据： file-open-data （3）变量标准化Analyze-Descriptive Statistics-Descriptives

" 勾选Save standardized values as variables保存变量，再点击ok，就完成了对变量的标准化。（3）因子分析 Analyze—Dimension Reduction—Faction

点击右侧的Description选项，选择Statistics选项组中的initial solution，勾选Correlation Matrix 选项组中的Coefficients和KMO and Bartlelts test of sphericity，点击Continue。点击右侧Extraction选项，其中Method选Principal components，Analyze选择Correlation matrix，Display中选择Unrotated factor solution，Extract如图，点击Continue.

SPSS因子分析法

因子分析 ? 因子分析（Factor analysis ）：用少数几个因子来描述许多指标或因素之间的联系，以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看，主成分分析是一种化繁为简的降维处理技术。主成分分析（Principal component analysis ）：是因子分析一个特例，是使用最多的因子提取方法。它通过坐标变换手段，将原有的多个相关变量，做线性变化，转换为另外一组不相关的变量。选取前面几个方差最大的主成分，这样达到了因子分析较少变量个数的目的，同时又能与较少的变量反映原有变量的绝大部分的信息。两者关系：主成分分析（PCA ）和因子分析（FA ）是两种把变量维数降低以便于描述、理解和分析的方法。 ? 特点（1）因子变量的数量远少于原有的指标变量的数量，因而对因子变量的分析能够减少分析中的工作量。（2）因子变量不是对原始变量的取舍，而是根据原始变量的信息进行重新组构，它能够反映原有变量大部分的信息。（3）因子变量之间不存在显著的线性相关关系，对变量的分析比较方便，但原始部分变量之间多存在较显著的相关关系。（4）因子变量具有命名解释性，即该变量是对某些原始变量信息的综合和反映。在保证数据信息丢失最少的原则下，对高维变量空间进行降维处理（即通过因子分析或主成分分析）。显然，在一个低维空间解释系统要比在高维系统容易的多。 ? 类型根据研究对象的不同，把因子分析分为R 型和Q 型两种。当研究对象是变量时，属于R 型因子分析；当研究对象是样品时，属于Q 型因子分析。但有的因子分析方法兼有R 型和Q 型因子分析的一些特点，如因子分析中的对应分析方法，有的学者称之为双重型因子分析，以示与其他两类的区别。 ? 分析原理假定：有n 个地理样本，每个样本共有p 个变量，构成一个n ×p 阶的地理数据矩阵 : 当p 较大时，在p 维空间中考察问题比较麻烦。这就需要进行降维处理，即用较少几个综合指标代替原来指标，而且使这些综合指标既能尽量多地反映原来指标所反映的信息，同时它们之间又是彼此独立的。线性组合：记x1，x2，…，xP 为原变量指标，z1，z2，…，zm （m ≤p ）为??????????????=np n n p p x x x x x x x x x X 212222111211

SPSS因子分析实例操作步骤

4.点击右侧Extraction,勾选Scree Plot和fixed number with factors，默认3个，点击Continue. 5.点击右侧Rotation，勾选Method选项组中的Varimax；勾选Display选项组中的Loding Plot(s)；点击Continue. 6.点击右侧Scores，勾选Method选项组中的Regression；勾选Display factor score coefficient matrix；点击Continue. 7.点击右侧Options，勾选Coefficient Display Format选项组中所有选项，将Absolute value blow改为，点击Continue. 8.返回主对话框，单击OK. 输出结果分析：

SPSS因子分析实例操作步骤

S P S S因子分析实例操作步骤实验目的：引入2003~2013年全国的农、林、牧、渔业，采矿业，制造业电力、热力、燃气及水生产和供应业，建筑业，批发和零售业，交通运输、仓储和邮政业7个产业的投资值作为变量，来研究其对全国总固定投资的影响。实验变量：以年份，合计（单位：千亿元），农、林、牧、渔业，采矿业，制造业电力、热力、燃气及水生产和供应业，建筑业，批发和零售业，交通运输、仓储和邮政业作为变量。实验方法：因子分析法软件：spss19.0 操作过程：第一步：导入Excel数据文件??? 1.opendatadocument——opendata——open； 2.Openingexceldatasource——OK. 第二步： 1.数据标准化：在最上面菜单里面选中Analyze——DescriptiveStatistics——OK?（变量选择除年份、合计以外的所有变量）. 2.降维：在最上面菜单里面选中 Analyze——DimensionReduction——Factor?，变量选择标准化后的数据. 3.点击右侧Descriptive，勾选CorrelationMatrix选项组中的 Coefficients和KMOandBartlett’stextofsphericity,点击Continue. 4.点击右侧Extraction,勾选ScreePlot和fixednumberwithfactors，默认3个，点击Continue. 5.点击右侧Rotation，勾选Method选项组中的Varimax；勾选Display选项组中的LodingPlot(s)；点击Continue. 6.点击右侧Scores，勾选Method选项组中的Regression；勾选Displayfactorscorecoefficientmatrix；点击Continue. 7.点击右侧Options，勾选CoefficientDisplayFormat选项组中所有选项，将Absolutevalueblow改为0.60，点击Continue. 8.返回主对话框，单击OK. 输出结果分析： 1.描述性统计量

因子分析SPSS操作

准化得分另存为变量”，点确定即可的标准化的数据。依次点选分析降维因子分析，打开因子分析窗口，将标准化的8个变量选入右边变量下面，点选描述相关矩阵下选中系数及KMO和Bartlett的检验，点继续，确定，就可得出8个变量的相关系数矩阵如下图。由表中数据可以看出大部分数据的绝对值都在以上，说明变量间有较强的相关性。 KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.621 Bartlett 的球形度检验近似卡方 df28 Sig..000 由上图看出，sig.值为0，所以拒绝相关系数为0（变量相互独立）的原假设，即说明变量间存在相关性。 2、依次点选在因子分析窗口点选抽取方法：主成分；分析：相关性矩阵；输出：未旋转的因子解，碎石图；抽取：基于特征值（特征值大于1）；继续，确定，输出结果如下3个图。解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 % 1 2 3 4.403

SPSS操作方法：因子分析09

实验指导之四因子分析的SPSS操作方法以例为例进行因子分析操作。 1.在SPSS的数据编辑窗口（见图1）点击Analysize →Data Reduction →Factor，打开Factor Analysis对话框如图 2. 图1 因子分析操作

图2 Factor Analysis 对话框将参与因子分析的变量依次选入Variables框中。例中有8个参与因子分析的变量，故都选入变量框内。 2.单击Descriptives 按钮，打开Descriptives对话框如图3所示。 Statistics栏，指定输出的统计量。图3 Descriptives对话框 Univariate descriptives 输出每个变量的基本统计描述；

Initial solution 输出初始分析结果。输出主成分变量的相关或协方差矩阵的对角元素。（本例选择） Correlation Matrix栏指定输出考察因子分析条件和方法。 Coefficients相关系数矩阵； Significance levels 相关系数假设检验的P值； Determinant 相关系数矩阵行列式的值； KMO and Bartlett′s test of Sphericity KMO和巴特利检验（本例选择）巴特利检验是关于研究的变量是否适合进行因子分析的检验. 拒绝原假设意味着适合进行因子分析. KMO值等于变量间单相关系数的平方和与单相关系数平方和加上偏相关系数平方和之比, 值越接近1, 意味着变量间的相关性越强,越适合进行因子分分析, KMO值越接近0, 则变量间的相关性越弱. 越不适合进行因子分析. Inverse 相关系数矩阵的逆矩阵； Reproduced 再生相关阵； Anti-image 反映象相关矩阵。 3.单击Extraction 按钮，打开Extraction对话框选项，见图4。

(完整版)SPSS因子分析法-例子解释

因子分析的基本概念和步骤一、因子分析的意义在研究实际问题时往往希望尽可能多地收集相关变量，以期望能对问题有比较全面、完整的把握和认识。例如，对高等学校科研状况的评价研究，可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标；再例如，学生综合评价研究中，可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力，虽然它们能够较为全面精确地描述事物，但在实际数据建模时，这些变量未必能真正发挥预期的作用，“投入”和“产出”并非呈合理的正比，反而会给统计分析带来很多问题，可以表现在：计算量的问题由于收集的变量较多，如果这些变量都参与数据建模，无疑会增加分析过程中的计算工作量。虽然，现在的计算技术已得到了迅猛发展，但高维变量和海量数据仍是不容忽视的。变量间的相关性问题收集到的诸多变量之间通常都会存在或多或少的相关性。例如，高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性；学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如，多元线性回归分析中，如果众多解释变量之间存在较强的相关性，即存在高度的多重共线性，那么会给回归方程的参数估计带来许多麻烦，致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。为了解决这些问题，最简单和最直接的解决方案是削减变量的个数，但这必然又会导致信息丢失和信息不完整等问题的产生。为此，人们希望探索一种更为有效的解决方法，它既能大大减少参与数据建模的变量个数，同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数，并已得到广泛应用的分析方法。因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前，因子分析已成功应用于心理学、医学、气象、地址、经济学等领域，并因此促进了理论的不断丰富和完善。因子分析以最少的信息丢失为前提，将众多的原有变量综合成较少几个综合指标，名为因子。通常，因子有以下几个特点： ↓因子个数远远少于原有变量的个数原有变量综合成少数几个因子之后，因子将可以替代原有变量参与数据建模，这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息因子并不是原有变量的简单取舍，而是原有变量重组后的结果，因此不会造成原有变量信息的大量丢失，并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著由原有变量重组出来的因子之间的线性关系较弱，因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性通常，因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

Amos-验证性因子分析步步教程

超市形象质量期望质量感知感知价值顾客满意顾客抱怨顾客忠诚应用案例1 第一节模型设定结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解释四个步骤。下面以一个研究实例作为说明，使用Amos7软件2进行计算，阐述在实际应用中结构方程模型的构建、运算、修正与模型解释过程。一、模型构建的思路本案例在著名的美国顾客满意度指数模型(ASCI)的基础上，提出了一个新的模型，并以此构建潜变量并建立模型结构。根据构建的理论模型，通过设计问卷对某超市顾客购物服务满意度调查得到实际数据，然后利用对缺失值进行处理后的数据3进行分析，并对文中提出的模型进行拟合、修正和解释。二、潜变量和可测变量的设定本文在继承ASCI模型核心概念的基础上，对模型作了一些改进，在模型中增加超市形象。它包括顾客对超市总体形象及与其他超市相比的知名度。它与顾客期望，感知价格和顾客满意有关，设计的模型见表7-1。模型中共包含七个因素(潜变量)：超市形象、质量期望、质量感知、感知价值、顾客满意、顾客抱怨、顾客忠诚，其中前四个要素是前提变量，后三个因素是结果变量，前提变量综合决定并影响着结果变量(Eugene W. Anderson & Claes Fornell，2000;殷荣伍，2000)。表7-1 设计的结构路径图和基本路径假设设计的结构路径图基本路径假设超市形象对质量期望有路径影响质量期望对质量感知有路径影响质量感知对感知价格有路径影响质量期望对感知价格有路径影响感知价格对顾客满意有路径影响顾客满意对顾客忠诚有路径影响超市形象对顾客满意有路径影响超市形象对顾客忠诚有路径影响 2.1、顾客满意模型中各因素的具体范畴参考前面模型的总体构建情况、国外研究理论和其他行业实证结论，以及小范围甄别调查的结果，模型中各要素需要观测的具体范畴，见表7-2。 1关于该案例的操作也可结合书上第七章的相关内容来看。 2本案例是在Amos7中完成的。 3见spss数据文件“处理后的数据.sav”。

SPSS探索性因子分析的过程

现要对远程学习者对教育技术资源和使用情况进行了解，设计一个李克特量表，如下图所示：一. 因子分析的定义

在现实研究过程中，往往需要对所反映事物、现象从多个角度进行观测。因此研究者往往设计出多个观测变量，从多个变量收集大量数据以便进行分析寻找规律。多变量大样本虽然会为我们的科学研究提供丰富的信息，但却增加了数据采集和处理的难度。更重要的是许多变量之间存在一定的相关关系，导致了信息的重叠现象，从而增加了问题分析的复杂性。因子分析是将现实生活中众多相关、重叠的信息进行合并和综合，将原始的多个变量和指标变成较少的几个综合变量和综合指标，以利于分析判定。用较少的综合指标分析存在于各变量中的各类信息，而各综合指标之间彼此是不相关的，代表各类信息的综合指标成为因子。因子分析就是用少数几个因子来描述许多指标之间的联系，以较少几个因子反应原资料的大部分信息的统计方法。二. 数学模型 Z i i1F1 i2^ i3F3 …im F m U i 乙为第i个变量的标准化分数；（标准分是一种由原始分推导出来的相对地位量数，它是用来说明原始分在所属的那批分数中的相对位置的。） F m为共同因子； m为所有变量共同因子的数目； U为变量Z的唯一因素； i个变量与第im为因子负荷。（也叫因子载荷，统计意义就是第 m个公共因子的相关系数，它反映了第i个变量在第m个公共因子上的相对重要性也就是第m个共同因子对第i个变量的解释程

度。）因子分析的理想情况，在于个别因子负荷im不是很大就是很小，这样每个变量才能与较少的共同因子产生密切关联，如果想要以最少的共同因素数来解释变量间的关系程度，则U彼此间不能有关联存在。所谓的因子负荷就是因子结构中原始变量与因子分析时抽取出共同因子的相关，即在各个因子变量不相关的情况下，因子负荷.就是第i个原有变量和第m个因子变量间的相关系数，也就是Z在第m个共同因子变量上的相对重要性，因此，.绝对值越大则公共因子和原有变量关系越强。在因子分析中有两个重要指针：一为“共同性”，二为“特征值”。所为共同性，也称变量共同度或者公共方差，就是每个变量在每个共同因子的负荷量的平方总和（一横列中所有因子负荷的的平方和），也就是个别变量可以被共同因子解释的变异量百分比，这个值是个别变量与共同因子间多元相关的平方。从共同性的大小可以判断这个原始变量与共同因子间的关系程度。如果大部分变量的共同度都高于0.8，则说明提取出的共同因子已经基本反映了各原始变量80%以上的信息，仅有较少的信息丢失，因子分析效果较好。而各变量的唯一因素就是1减掉该变量共同性的值，就是原有变量不能

验证性因子分析思路总结

目录验证性因子分析 (1) 分析步骤 (3) （1）模型设定 (4) （2）模型拟合 (4) （ 3 ）模型修正 (6) （4）模型分析 (9) 验证性因子分析，是用于测量因子与测量项（量表题项）之间的对应关系是否与研究者预测保持一致的一种研究方法。尽管因子分析适合任何学科使用，但以社会科学居多。目前有很多软件都可以非常便利地实现验证性因子分析，本文将基于SPSSAU系统进行说明。验证性因子分析

Step1：因子分析类型因子分析可分为两种类型：探索性因子分析（EFA）和验证性因子分析（CFA）。探索性因子分析，主要用于浓缩测量项，将所有题项浓缩提取成几个概括性因子，达到减少分析次数，减少重复信息的目的。验证性因子分析与探索性因子分析相似，两者区别只在于探索性因子分析（EFA）用于探索因子与测量项之间的对应关系，验证性因子分析（CFA）用于验证结果与理论预期是否一致。 Step2：分析思路在实际研究中，验证性因子分析常会与结构方程模型、路径分析等方法联系到一起，对于不熟悉概念的研究人员容易搞混这些方法，下表对这几种方法进行简单说明：

探索性因子分析（EFA）验证性因子分析（CFA ）研究测量关系研究测量关系回归分析研究自变量对一个因变量的影响关系路径分析研究多个自变量与多个因变量之间的影响关系适用于非经典量表适用于经典量表 y 为定量数据可先用CFA/EFA 确定因子与研究项关系，再进行路径分析结构方程模型包括两部分：结构方程模型研究影响关系及测量关系验证性因子分析和路径分析

探索性因子分析：验证因子与分析项的对应关系，索性因子分析。验证性因子分析：验证因子与分析项的对应关系，性因子分析。确认测量关系后，后续可进行路径分析系。检验量表效度，非经典量表通常用探检验量表效度，成熟量表通常用验证 / 线性回归分析研究具体的影响关路径分析：用于研究多个自变量与多个因变量影响关系；如果因变量只有一个，可以使用线性回归分析。结构方程模型SEM：包括测量关系和影响关系。如果仅包括影响关系，此时称作路径分析（Path analysis，有时也称通径分析）。通常需要进行探索性因子分析和验证性因子分析，均保证测量关系无误之后，再进行结构方程模型构建。从分析思路上看，建议先用探索性因子分析EFA构建模型，确定存在几个因子及各分析项与因子的对应关系，再用验证性因子分析CFA加以检验。 Step3：SPSSAU操作分析步骤

在验证性因子分析中

X、在验证性因子分析中，有下列常见指标用以检验模型的拟合优度，如2 X、CFI、RMSEA来衡量模型与数据的拟和程度。其中， /2 df 2 X（卡方）是由拟合函数所转换而来的统计量，反应了结构方程模型假设模型的导出矩阵与观察矩阵的差异程度。所以卡方值越小，说明模型的拟合程度越好。 X（卡方自由度比）：卡方自由度比越小，表示模型拟合度越高，反之/2 df 则表示模型拟合度越差。一般而言，卡方自由度比小于2时，表示模型具有理想的拟合度。 CFI：CFI指标反应了假设模型与无任何相关性的独立模型差异程度的量数，也考虑到被检验模型与中央卡方分配的离散性。当CFI>0.95时，说明模型拟合度较好。 RMSEA：用来比较理论模型与饱和模型的差距，不受样本数和模型复杂度的影响。当RMSEA<0.05时，模型具有良好的拟合度。 raw data from file ss.psf latent variables cleaning managing repairing shoufa shouka phonerepairing tiaopei satisfy relationships V1-V5=cleaning V6-V13=managing V14-V15=repairing V16-V17=shoufa V18-V19=shouka V20-V21=phonerepairing V22-V23=tiaopei V24-V25=satisfy managing=cleaning satisfy=cleaning managing repairing shoufa shouka phonerepairing tiaopei path diagram options:AD=OFF end of problem

因子分析SPSS操作

因子分析S P S S操作 Ting Bao was revised on January 6, 20021

因子分析作业：全国30个省市的8项经济指标如下：要求：先对数据做标准化处理，然后基于标准化数据进行以下操作 1、给出原始变量的相关系数矩阵； 2、用主成分法求公因子，公因子的提取按照默认提取（即特征值大于1），给出公因子的方差贡献度表； 3、给出共同度表，并进行解释； 4、给出因子载荷矩阵，据之分析提取的公因子的实际意义。如果不好解释，请用因子旋转（采用正交旋转中最大方差法）给出旋转后的因子载荷矩阵，然后分析旋转之后的公因子，要求给各个公因子赋予实际含义； 5、先利用提取的每个公因子分别对各省市进行排名并作简单分析。最后构造一个综合因子，计算各省市的综合因子的分值，并进行排序并作简单分析。 1、输入数据，依次点选分析描述统计描述，将变量x1到x8选入右边变量下面，点选“将标准化得分另存为变量”，点确定即可的标准化的数据。依次点选分析降维因子分析，打开因子分析窗口，将标准化的8个变量选入右边变量下面，点选描述相关矩阵下选中系数及KMO和Bartlett的检验，点继续，确定，就可得出8个变量的相关系数矩阵如下图。由表中数据可以看出大部分数据的绝对值都在0.3以上，说明变量间有较强的相关性。 KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。.621 Bartlett的球形度检验近似卡方231.420 df28 Sig..000 由上图看出，sig.值为0，所以拒绝相关系数为0（变量相互独立）的原假设，即说明变量间存在相关性。 2、依次点选在因子分析窗口点选抽取方法：主成分；分析：相关性矩阵；输出：未旋转的因子 3个图。献率，由上表看出前3个主成分的累计贡献率就达到了89.599%>85%，所以选取主成分个数为3。

因子分析SPSS操作

由表中数据可以看出大部分数据的绝对值都在0.3以上，说明变量间有较强的相关性。由上图看出，sig.值为0，所以拒绝相关系数为0（变量相互独立）的原假设，即说明变量间存在相关性。 2、依次点选在因子分析窗口点选抽取方法：主成分；分析：相关性矩阵；输出：未旋转的因子解，碎石图；抽取：基于特征值（特征值大于1）；继续，确定，输出结果如下3个图。上表中第一列为特征值（主成分的方差），第二列为各个主成分的贡献率，第三列为累积贡献率，由上表看出前3个主成分的累计贡献率就达到了89.599%>85% ，所以选取主成分个数为3。选y1 为第一主成分，y2 为第二主成分，y3 为第三主成分。且这三个主成分的方差和占全部方差的89.599% ，即基本上保留了原

验证性因子分析实例

验证性因子分析的实例分析基本上，在应用CFA时，皆是在检验某个学者所发展的测验或量表。 CFA对测验或量表的检验可以有以下作为：（1）检验量表的面向性，或者称因子结构。（2）检验因子的阶层关系，此种测量模式成为阶层式CFA。（3）检验量表的信度与效度。实例一：检验测验的面向性测验或量表的形成是由理论所建构的，可能某些学者的理论认为某个量表是一种单一面向的量表，也可能有些理论认为该量表是有多个面向，对于这种测验或量表的面向性检验，就是一种理论建构的因素效度的检验。对CFA而言，它可以检验出哪一种面向比较符合观察数据，而决定出理论建构的最有效因子结构。本例采用一个父母对孩子学校表现关注量表。这个量表一共7题（X1,…,X7），资料的搜集来自于某县初中3年级学生，共有590个样本。我们假定了三种面向性的模型：（1）此7题只建构了一个潜在因子，称为“关注”因子；（2）此7题可以建构2个潜因子，一个称为“探询”因子，一个称为“协助与督促”因子；（3）此7题可以建构成3个潜因子，第一个称为“了解”因子，第二个称为“与学校接触”因子，第三个称为“协助与督促”因子。第一步：模型界定利用路径图呈现3种模型中变量的关系。如图1~图3所示。图1 父母对孩子学校表现关注量表单因子CFA模型图2 父母对孩子学校表现关注量表一级二因子CFA模型图3 父母对孩子学校表现关注量表一级三因子CFA模型接着是把路径图转换成方程式，就可以用LISREL程序编写出来。图1的方程式如下： X1=λ1ξ1+δ1 X2=λ2ξ1+δ2 X3=λ3ξ1+δ3 X4=λ4ξ1+δ4 X5=λ5ξ1+δ5 X6=λ6ξ1+δ6 X7=λ7ξ1+δ7 图2的方程式如下： X1=λ1ξ1+δ1 X2=λ2ξ1+δ2 X3=λ3ξ1+δ3 X4=λ4ξ1+δ4 X5=λ5ξ1+δ5 X6=λ6ξ2+δ6 X7=λ7ξ2+δ7 cov(探询，协助与督促) 图3的方程式如下： X1=λ1ξ1+δ1

如何利用spss做因子分析等分析(仅供参考)

我就以我的数据为例来做示范，仅供参考一、信度分析（即可靠度分析） 1.分析——度量——可靠度分析图 1 2.然后就会弹出上图1的框框。在这里，你可以对所有的问题进行可靠度分析，如果是这样，那你只需要选中所有的问题到右边这个白色的框框，然后点击“统计量”，按照右边这个图进行打钩。然后点“继续”。之后就点“确定”图2 3.接着去“输出1”这个框看分析结果，你就会看到很多分析结果，其中有一个就是右图，

那第一个0.808就是你所选择进行分析的数据的信度。如果你想把每一个维度的数据进行独立的信度分析，那道理也是一样的。二、因子分析在做因子分析之前首先要判断这些数据是否适合做因子分析，那这里就需要进行效度检验，不过总共效度检验是和因子分析的操作同步的，意思就是说你在做因子分析的时候也可以做效度检验。具体示范如下： 1.分析——降维——因子分析图 2 一般来说，咱们做因子分析的时候是为了把那些具有共同属性的因子归类成一类，说的简单点就是要验证咱们所选取的每一个维度下面的题目是属于这个维度，而非其他维度的。那一般来说，因子分析做出来的结果就是你原本有几个维度，最终分析结果就会归类成几个公因子。 2.一般来说，自变量的题目和因变量的题目是要独立分析的。我的课题是“店

面形象对顾客购买意愿的影响”那自变量就是店面形象的那些维度，因变量就是顾客购买意愿。 3.将要做分析的题目选择到右边的白框之后，就如下图打钩： “抽取”和“选项”两个不用管他。然后就点 “确定” 4.按照上述步骤操作下来之后，就可以去“输出1” 看分析结果。首先看效度检验的结果：这里要看第一行和最后一行的数据，第一行数据为0.756，表明效度较高，sig为 0.000，这两个结果显示这份数据完全可以做因子分析。那就去看因子分析的

如何用amos做验证性因子分析

如何用amos做验证性因子分析验证性因素分析是20世纪60年代后从探索性因素分析发展而来的[12]。它可以通过协方差结构模型(Covariance Structure Modeling,CSM)或称结构方程模型(Structure Equation Modeling,SEM)实现。对于数据的计算和模型的验证，现已编有多种计算机软件，其中著名的一种是K.G.Joreskog和D.Sorbom编制的LISREL。在验证性因素分析方法出现之前，对评价中心的构想效度的验证，更多的是用多质多法。对于多质多法的批评意见，主要是认为这种方法以包含测量误差的可观测变量间的相关为基础，来对潜在的结构进行解释，而实际上测量误差每次是不一致的，从而会影响到相关系数，进而影响对潜在结构解释的准确性。验证性因素分析方法则可以解决这个问题，它对误差和相关的变量进行控制，进而得出一个更加令人满意的结果。因而，它很快被公认为一种适宜且通用的评估MTMM数据的方法[12]。在这种方法中，同一特质不同测评方法所决定的因素代表测评的构想效度，而同一测评方法不同测评特质所代表的因素则表明了测评方法的效应。每一个可观测变量均由特质因素、方法因素和测量误差三部分组成。其最大优点在于能对因素的负荷进行固定，并对提出的不同假设模型进行检验。每一种自由负荷的大小反映了问题的所在。如果在能力因素上的自由负荷小且不显著，而在方法因素上的自由负荷大且显著，那么，这种结果就是支持测评方法导向的。反过来，不同测评方法中的同一种能力的因素负荷的值大而且是显著的，那么，就可以认为不同测评方法之间能力的一致性可以得到确认。通过检测这些不同的假设模型，就可以得出评价中心的评分到底是指向测评维度的还是测评方法的。验证性因素分析及其在心理与教育研究中的应用在心理与教育研究中，方法的突破往往是研究取得新进展的一个重要方面。正如班特勒(Bentler，1990)指出：“研究的突破往往在研究方法的变革上。”而心理与教育研究非常复杂，它具有多层面、多指标的特性，常涉及许多变量(包括控制变量、依变量等)，如何对多变量的问题进行研究，一直是人们努力的方向，也取得不少突破性的进展。如兴起于六、七十年代，目前已在社会科学领域里得到广泛的应用，并被称为近年来统计学三大进展之一的协方差结构模型方法(covarian structure models，CSM)。① 通常协方差结构模型分析由两部分组成，一部分是在心理与教育测量中经常使用的验证性因子模型(验证性因素分析)，也可称之为测量模型；另一部分是在经济计量学中使用的结构方程模型。②③顾海根先生已在《上海教育科研》详细介绍了结构方程模型及其在研究中的应用，因而本文拟对验证性因子分析方法及其在心理与教育研究中的应用作一定的说明。一、探索性因素分析与验证性因素分析最早提出因素分析想法的是高尔顿，他奠定了因素分析的基础。其后，斯皮尔曼在研究“一般智力”(general intelligence)中首次采用了因素分析的数学模型方法，使得因素分析的方法得以真正成为现实。我们知道，因素分析是将多个实测变量转换为少数几个综合指标(或称潜变量)，④它反映了一种降维的思想。我们在研究中往往需要对反映事物的多个变量进行观测，收集数据，变量庞大无疑为科学研究提供了丰富的信息，但在一定程度上增加了问题分析的复杂性，由于各变量存在一定相关关系，因而可以通过降维将相关性高的变量聚在一起，因素分析的思想由此而来。最初在因素分析时常采用探索性因素分析方法，如SPSS软件包中的因素分析(Factor analysis)，MINITAB 软件包中的因素分析，SYSTAT软件包中的因素分析。随着近年来EQS、LISREL、CALIS等软件的开发，