当前位置:文档之家› 基于因子分析法的数据处理

基于因子分析法的数据处理

基于因子分析法的数据处理
基于因子分析法的数据处理

基于因子分析法的数据处理

摘要:本文从教师评估数据出发,分析评估指标是否合适进行因子分析;并在此基础上,利用因子分析法从交互相关的评估指标中,找出起决定作用的两个因子,从而达到简化计算的目的,最终通过因子分析法分析数据得出教师排名顺序。

关键字:评估数据、因子分析法

引言:

因子分析是主成分分析的一种推广和扩展,对于实际应用非常重要,也是利用降维的方法进行统计分析的一种多元统计方法。因子分析研究相关矩阵或协方差的内部依赖关系,由于它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相互关系,因此得到了广泛的应用因子分析的用途主要有:寻求基本结构简化观测系统;用于数据简化。通过因子分析可以用所找出的少数几个因子代替原来的变量做因子分析、判别分析、聚类分析等。

1.因子分析法

1.1因子分析法相关概念

因子分析通常以最少的信息丢失为前提,将原有的众多变量综合成较少的几个综合指标,即因子。

因子负荷。即因子分析式中各因子的系数值,用于反映因子和各个变量间的亲切程度。当各公因子间不相关时,因子负荷值就等于因子与变量的相关系数。它的绝对值越大,说明该因子对当前变量的影响程度越大。

公因子方差比(Communalities)。是指提取公因子后,各变量中信息分别被提取出的比例,或者说原变量的方差中由公因子决定的比例。公因子方差比在0-1之间,取值越大,说明该变量能被因子说明的程度越高,如果各因子间完全独立,则公因子方差比和因子负荷实际上是等价的。

特征值(Eigen value)。特征值可以看成因子分析影响力度的指标,代表引入该因子或主成份后可以解释平均多少原始变量的信息。

KMO统计量。用于研究变量之间的偏相关性,它是比较各变量之间的简单相关和偏相关的大小,取值范围在0-1之间。如果各变量之间存在内在关系,则由于计算偏相关是控制其他因素就会同时控制潜在变量,导致偏相关系数远远小

多元数据处理——因子分析法

多元数据处理 ---因子分析方法 多元数据处理主要包括多元随机变量,协方差分析,趋势面分析,聚类分析,判别分析,主成分分析,因子分析,典型相关分析,回归分析以及各个分析方法的相互结合等等。本文主要针对其中的因子分析方法展开了论述,并举了一个因子分析法在我国房地产市场绩效评价中的应用实例。 第一章因子分析方法概述 1.1因子分析的涵义 为了更全面和准确的测量和评估对象的特征,在实际的应用中,我们往往尽可能多的选用特征指标进行系统评估,选取的指标越多,就越能全面、客观的反映评价对象的特征。选取众多指标的同时也带来了统计分析的困难:一、不同的指标,不同重要程度需要赋予不同的权重,而靠主观的评价避免不了一些失误与错误。二、收集到的指标之间可能存在较大的相关性,大量收集指标带来了人力、物力和财力的浪费。而因子分析方法则较好的解决了上述问题。 因子分析[1]是一种多元统计方法,该方法起源于20世纪初Karl Pearson 和Charles Spearman 等人关于心理测试的统计分析,它的核心是用最少的相互独立的因子反映原有变量的绝大部分信息。[2]通过分析事物内部的因果关系来找出其主要矛盾,找出事物内在的基本规律。 因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但是,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,使不同组内的变量相关性较低[3]。对于所研究的问题就可试图用最少个数的所谓因子的线性函数与特殊因子之和来描述原来观测的每一变量[4]。因子变量的特点:第一,因子变量的数量远小于原指标的数量,对因子变量的分析能够减少分析的工作量;第二,因子变量不是原有变量的简单取舍,而是对原有变量的

因子分析的一般原理概述

因子分析的一般原理概述 简才永 因子分析是处理多变量数据的一种统计方法,它可以揭示多变量之间的关系,其主要目的是从众多的可观测得变量中概括和综合出少数几个因子,用较少的因子变量来最大程度地概括和解释原有的观测信息,从而建立起简洁的概念系统,揭示出事物之间本质的联系。 一、因子分析的种类 (一)、R型因子分析与Q型因子分析 这是最常用的两种因子分析类型。R型因子分析,是针对变量所做的因子分析,其基本思想是通过对变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量去描述多个随机变量之间的相关关系。然后再根据相关性的大小把变量分组,使同组内的变量之间的相关性较高,不同组变量之间的相关性较低。Q型因子分析,是针对样品所做的因子分析。它的思路与R因子分析相同,只是出发点不同而已。它在计算中是从样品的相似系数矩阵出发,而R型因子分析在计算中是从样品的相关系数矩阵出发的。 (二)、探索性因子分析与验证性因子分析 探索性因子分析(EFA),主要适用于在没有任何前提预设假定下,研究者用它来对观察变量因子结构的寻找、对因子的内容以及变量的分类。通过共变关系的分解,进而找出最低限度的主要成分,让你后进一步探讨这些主成分或共同因子与个别变量之间的关系,找出观察变量与其对应因子之间的强度,即所谓的因子负荷值,以说明因

子与所属的观察变量的关系,决定因子的内容,为因子取一个合适的名字。 验证性因子分析(CFA),要求研究者对研究对象潜在变量的内容与性质,在测量之初就必须有非常明确的说明,或有具体的理论基础,并已先期决定相对应的观测变量的组成模式,进行因子分析的目的是为了检验这一先前提出的因子结构的适合性。这种方法也可以应用于理论框架的检验,它在结构方程模型中占据相当重要的地位,有着重要的应用价值,也是近年来心理测量中相当重要的内容。 二、因子分析基本思想、模型与条件 (一)、因子与共变结构 因子分析的基本假设是那些不可观测的“因子”隐含在许多现实可观察的事物背后,虽然难以直接测量,但是可以从复杂的外在现象中计算、估计或抽取得到。它的数学原理是共变抽取。也就是说,受到同一个因子影响的测量分数,共同相关的部分就是因子所在的部分,这可以用“因子”的共变相关部分来表示。 (二)、因子分析的条件 第一、因子分析以变量之间的共变关系作为分析的依据,凡影响共变的因子都要先行确认无误。首先,因子分析的变量都必须是连续变量,符合线性关系的假设。其他顺序与类别型的数据不能用因子分析简化结构。 第二、抽样过程必须随机,并具有一定规模。一般样本量不得低于100,原则上是越大越好。此外,一般还要求样本量与变量数之间

内容分析法

第2讲、内容分析法 一、内容分析法的基本概念 内容分析法是西方社会科学家对语言文字传播内容(报刊、文献和谈话等)和非语言文字传播内容(音乐、影视、艺术作品和姿态等)进行定量研究的科学方法。这种分析方法早在半个世纪以前首先用于信息传播领域,现在成为社会科学广泛应用的研究工具之一。例如著名社会预测学家夸斯比特应用“内容分析法”对美国200多种报纸进行了数年的分析研究,成功地归纳出美国从工业社会过渡到信息社会的十大趋势。因此,他的名著《大趋势——改变我们生活的十个新方向》成为风糜世界的畅销书。 教育和教学活动,也是一种信息的传播过程。我们同样可以利用内容分析法对教育文献、教科书、课堂讲授、视听教材、直观教具、学生练习、试题和试卷等进行分析研究。 (一)内容分析法的特征 - 内容分析法,就是对于明显的传播内容,作客观而有系统的量化并加以描述的一种研究方法。内容分析法的特征表现在明显、客观、系统、量化等四个方面。 1.明显的传播内容 被分析的对象应该是以任何形态被记录和保存下来,并具有传播价值的内容。 任何形态、包括有文字记录形态(如报纸、杂志、书籍、文件)、非文字记录形态(如广播、唱片、演讲录音、音乐)、影像记录形态(如电影、电视、幻灯、图片)等。同时,明显的传播内容是指它所表现的直接意义,而不是指其包含的潜在动机。内容分析就是通过对直接显示的内容的量化处理来判别其间接的、潜在的动机和效果。 2.客观性 在内容分析的过程中,按照预先制定的分析类目表格进行判断和记录内容出现的客观事实,并根据客观事实再作出分析描述。 3.系统性 这是指内容的判断、记录、分析过程是以特定的表格形式、按一定的程序进行的。 4.量化 这是指内容分析的结果可以用数字表达,并能用某种数学关系来表示,如用次数分配、各种百分率或比例、相关系数等方式来描述。 由此可见,内容分析实际上是以预先设计的类目表格为依据,以系统、客观和量化的方式,对信息内容加以归类统计,并根据类别项目的统计数字,作出叙述性的说明。它不仅是资料的收集方法,也是一种独立、完整的专门研究方法。 (二)内容分析与文献分析的比较 内容分析与文献分析,都是对用文字、图形、符号、声频、视频等记录保存下来的资料内容作为分析的对象,但是它们具体的分析处理方法是有所区别的。

因子分析在STATA中实现和案例

第13章因子分析 因子分析始于1904年Chars Spearman对学生成绩的分析,在经济领域有着极为广泛的用途。在多个变量的变化过程中,除了一些特定因素之外,还受到一些共同因素的影响。因此,每个变量可以拆分成两部分,一是共同因素,二是特殊因素。这些共同因素称为公因子,特殊因素称为特殊因子。因子分析即是提出多个变量的公共影响因子的一种多元统计方法,它是主成分分析的推广。 因子分析主要解决两类问题:一是寻求基本结构,简化观察系统。给定一组变量或观察数据,是否存在一个子集,特别是一个加权子集,来解释整个问题,即将为数众多的变量减少为几个新的因子,以再现它们之间的内在联系。二是用于分类,将变量或样本进行分类,根据因子得分值,在因子轴所构成的空间中进行分类处理。 p个变量X的因子模型表达式为: = Λ' e f X+ f称为公因子,Λ称为因子载荷。X的相关系数矩阵分解为: ∑' = + ΛΦΛ ψ 对于未旋转的因子,1 Φ。ψ称为特殊度,即每个变量中不属于共性的部 = 分。 13.1 因子估计 Stata可以通过变量进行因子分析,也可以通过矩阵进行。命令为factor 或factormat。 webuse bg2,clear describe factor bg2cost1-bg2cost6 factor bg2cost1-bg2cost6, factors(2) * pf 主因子方法,用复相关系数的平方作为因子载荷的估计量(默认选项) factor bg2cost1-bg2cost6, factors(2) pcf * pcf 主成分因子,假定共同度=1 factor bg2cost1-bg2cost6, factors(2) ipf * ipf 迭代主因子,重复估计共同度 factor bg2cost1-bg2cost6, factors(2) ml * ml 极大似然因子,假定变量(至少3个)服从多元正态分布,对偏相关矩阵的行列式进行最优化求解,等价于Rao的典型因子方法 13.2 预测 Stata可以通过predict预测变量得分、拟合值和残差等。 webuse bg2,clear factor bg2cost1-bg2cost6 predict f1 f2 * factor1 factor2因子分得分 predict stdp residuals * 预测标准差和残差

(完整版)因子分析法基本原理

1.因子分析法基本原理 在对某一个问题进行论证分析时,采集大量多变量的数据能为我们的研究分析提供更为丰富的信息和增加分析的精确度。然而,这种方法不仅需要巨大的工作量,并且可能会因为变量之间存在相关性而增加了我们研究问题的复杂性。因子分析法就是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。这样我们就可以对原始的数据进行分类归并,将相关比较密切的变量分别归类,归出多个综合指标,这些综合指标互不相关,即它们所综合的信息互相不重叠。这些综合指标就称为因子或公共因子。 因子分析法的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。这样,就能相对容易地以较少的几个因子反映原资料的大部分信息,从而达到浓缩数据,以小见大,抓住问题本质和核心的目的。 因子分析法的核心是对若干综合指标进行因子分析并提取公共因子,再以每个因子的方差贡献率作为权数与该因子的得分乘数之和构造得分函数。因子分析法的数学表示为矩阵:B AF X +=,即: ????? ?? ??++++=++++=++++=++++=p k pk p p p p k k k k k k f f f f x f f f f x f f f f x f f f f x βααααβααααβααααβααααΛΛΛΛΛΛ332211333332321313223232221212113132121111 (k ≤p)………………(1式) 模型中,向量X ()p x x x x ,,,,321Λ是可观测随机向量,即原始观测变量。F ()k f f f f ,,,,321Λ是X ()p x x x x ,,,,321Λ的公共因子,即各个原观测变量的表达式中共同出现的因子,是相互独立的不可观测的理论变量。公共因子的具体含义必须结合实际研究问题来界定。A ()ij α是公共因子F ()k f f f f ,,,,321Λ的系数,称为因子载荷矩阵,ij α(i=1,2,.....,p;j=1,2,....,k)称为因子载荷,是第i 个原有变量在第j 个因子上的负荷,或可将ij α看作第i 个变量在第j 公共因子上的权重。ij α是x i 与f j

因子分析法典型案例

案例:基于因子分析法的高级管理者人力资源价值计量模型一、背景介绍及问题提出 1. 人力资源价值计量的背景著名会计学家 W.A 佩顿(Paton)教授曾经睿智地指出:在企业中,良好组织且忠诚的员工是一项远比商品更为重要的“资产”。对于这样重要的“资产”为什么直到现在都没有纳入财务会计核算体系呢?人力资源价值信息没有在财务报表体系中加以披露的原因是:人力资源的价值计量是一个难题,使得人力资源会计一直处于理论探讨和实验阶段,未能登堂入室。人力资源价值计量研究目的在于:用人力资源的创造能力来反映组织现有人力资源的质量状况及企业对人力资源的能力回报,为企业管理当局和外部利害关系集团提供完整的决策信息。 2.高级管理者人力资源的研究背景高级管理者是企业的核心和灵魂,在企业人力资源中居于中心地位是一种稀缺的生产要素,对高级管理者人力资源的垄断是超额剩余价值的主要来源,几乎每一个优秀的企业都与企业中高级管理团队紧密地联系在一起的。 3. 问题的提出在人力资源价值计量发展的完善的过程中,如何动态地、客观地、科学地综合评价高管的价值,一直是困扰人力资源价值计量的一个难题,许多专家和学者采用未来收益折现或期权定价等方法对人力资源价值进行计量;未来收益折现是以工资为基础对高级管理者的未来收益进行折现,这种货币计量方法存在主要问题在于工资不能反映人力资源真实价值,因为高级管理者人力资源价值本身存在复杂性、隐蔽性及能动性,仅以工资作为衡量人力资源价值的大小的标准,忽略了高级管理者在企业价值创造中的特殊性。由于高级管理者人力资源存在某些特性。因此,对高级管理者的采用非货币计量的方法更加具有现实的意义。二、问题研究的意义 1、人力资源价值的科学计量会使企业更加全面、科学的掌握高级管理者的信息并更加重视人力资源的作用,从而为了保留和争取人才,对企业的高级管理者进行有效的激励。 2、对高级管理者人力资源价值计量的准确与否,关系到企业总资产的精确程度和企业未来发展的能力。对高级管理者人力资源价值的准确计量有利于实现人力资源会计核算体系的建立。三、案例思路首先,在分析高级管理者人力资源价值计量的基本理论与其特性分析的基础上,案例建立影响高级管理者人力资源价值计量的指标体系,该体系由 29 个初级指标构成(如下图一所示)。其次,通过问卷调查的方式,应用因子分析法对上述29 个指标进行筛选。隐性因子学历天赋社会资本任职时间职业背景职业生命周期薪酬年龄体质能力心理能力领导能力战略决策能力风险承受能力人力资源管理能力领导管理因子创新能力学习能力洞察能力沟通能力组织能力团队协作能力个人特征及组织环境因子价值观忠诚感道德行为敬业精神乐观自信理智情绪稳定企业规模职位图一高级管理者人力资源价值指标体系四、数据说明:案例采用问卷调查的方式进行数据收集。问卷发放的数量:本次共发放问卷180 份,其中包括电子文档和纸质问卷,共回收有效问卷103 份,有效回收率为57.22%。问卷内容的设计:案例在分析了高级管理者人力资源价值计量的理论基础和特性分析的基础上建立了高级管理者人力资源价值指标体系。问卷的调查内容是该指标体系中的指标,由企业的高级管理人员依据各指标对高级管理者人力资源价值计量的影响做出基本判断。问卷结构的设计:首先,针对案例提出的 29 个指标要素,设计了 29 个判断指标程度的问题。通过被调查者选择打分的方式,获得各指标的具体分值。所有问题都划分为 7 选项对应7 个程度,由管理者根据题目的内容进行选择。然后采用 7 分模糊打分法,每一个选项对应一个分值,选择第一选项为 7 分,第二选项为6 分,依次为5 分、4 分、3 分、2 分、1 分(调查问卷如下所示)。高级管理者人力资源价值计量

SPSS因子分析法

因子分析 ? 因子分析(Factor analysis ):用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法。 ? 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 ? 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 ? 分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : 当p 较大时,在p 维空间中考察问题比较麻烦。这就需要进行降维处理,即用较少几个综合指标代替原来指标,而且使这些综合指标既能尽量多地反映原来指标所反映的信息,同时它们之间又是彼此独立的。 线性组合:记x1,x2,…,xP 为原变量指标,z1,z2,…,zm (m ≤p )为??????????????=np n n p p x x x x x x x x x X 212222111211

(完整版)因子分析法基本原理.docx

1.因子分析法基本原理 在 某一个 行 分析 , 采集大量多 量的数据能 我 的研究分析提供更 丰富的信息和增加分析的精确度。 然而, 种方法不 需要巨大的工 作量,并且可能会因 量之 存在相关性而增加了我 研究 的复 性。 因子分析法就是从研究 量内部相关的依 关系出 , 把一些具有 复 关系的 量 少数几个 合因子的一种多 量 分析方法。 我 就可以 原始的数据 行分 并,将相关比 密切的 量分 , 出多个 合指 , 些 合指 互不相关, 即它 所 合的信息互相不重叠。 些 合指 就称 因子或公共因子。 因子分析法的基本思想是将 量 行分 , 将相关性 高, 即 系比 密的分在同一 中, 而不同 量之 的相关性 低, 那么每一 量 上就代表了一个基本 构, 即公共因子。 于所研究的 就是 用最少个数的不可 的所 公共因子的 性函数与特殊因子之和来描述原来 的每一分 量。 ,就能相 容易地以 少的几个因子反映原 料的大部分信息, 从而达到 数据,以小 大,抓住 本 和核心的目的。 因子分析法的核心是 若干 合指 行因子分析并提取公共因子, 再以每个因子的方差 献率作 数与 因子的得分乘数之和构造得分函数。 因子分析法的数学表示 矩 : X AF B ,即 : x 1 11 f 1 1 2 f 2 1 3 f 3 1k f k 1 x 2 21 f 1 22 f 2 23 f 3 2 k f k 2 x 3 31 f 1 32 f 2 33 f 3 3k f k 3 (k ≤p)?????? (1 式) x p p1 f 1 p 2 f 2 p 3 f 3 pk f k p 模型中,向量 X x 1, x 2 , x 3 , , x p 是可 随机向量,即原始 量。 F f 1 , f 2, f 3 , , f k 是X x 1, x 2 , x 3, , x p 的公共因子,即各个原 量的表达式中 共同出 的因子, 是相互独立的不可 的理 量。 公共因子的具体含 必 合 研究 来 界定。 A ij 是公共因子 F f 1, f 2 , f 3, , f k 的系数,称 因子 荷矩 , ij (i=1,2,.....,p;j=1,2,....,k)称 因子 荷,是第 i 个原有 量在第 j 个 因子上的 荷,或可将 ij 看作第 i 个 量在第 j 公共因子上的 重。 ij 是 x i 与 f j

因子分析理论与案例

因子分析理论与案例 一、 因子分析原理 因子分析是一种将多变量化简的多元统计方法,它可以看作是主成份分析的推广。因子分析的目的是分解原始变量,从中归纳出潜在的“类别”,相关性较强的变量归为一类,不同类间的变量的相关性则较低。每类变量代表了一个“共同因子”,即一种内在结构(联系)。因子分析就是寻找这种内在结构(联系)的方法。 从全部计算过程来看作R 型因子分析与作Q 型因子分析都是一样的,只不过出发点不同,R 型从相关系数矩阵出发,Q 型从相似系数阵出发都是对同一批观测数据,可以根据其所要求的目的决定用哪一类型的因子分析。 (一)模型 主要模型形式: (2)矩阵型式 (二)相关概念解释 ?????? ? ???????+??????????????????????????=??????????????p m pm p p m m p F F F a a a a a a a a a X X X εεε 21212 1 2222111211 21?????? ?++++=++++=++++=p m pm p p m m m m F a F a F a X F a F a F a X F a F a F a X εε ε 222112 22221212112121111)1(展开式m 1m X A F + p 1p m m 1p 11m p 2 Cov F 01 03D F I F F =1. 01ε ε= ????≤?? ? = ? ??? 简记为:() ()() ()且满足:)) (,)=) ()=即不相关且方差

1、因子载荷 a ij 称为因子载荷(实际上是权数)。 因子载荷的统计意义:就是第i 个变量与第j 个公共因子的相关系数,即表示变量xi 依赖于Fj 的份量(比重),心理学家将它称为载荷。 2、变量共同度 3、方差贡献率 方差贡献率指的是公因子对于自变量的每一分量所提供的方差总和,它是衡量公因子相对重要程度的指标。通常情况下,我们将因子载荷矩阵的所有方差贡献率计算出来并按照大小排序,从而提炼出最具影响力的因子。 二、 主要计算方法及步骤 (一)方法说明 1、因子载荷矩阵估计方法 因子载荷的求解方法主要有主成分法,主轴因子旋转法和极大似然法。主成分法指在进行因子分析之前先对数据进行主成分分析,把前几个主成分作为未旋转的公因子,但是此种方法得到的特殊因子间并不相互独立,当变量的共同度较大时,特殊因子所起的作用较小,它们之间的相关性可以忽略。 主轴因子法与主成分分析方法类似,都是都分析矩阵的结构入手,主轴因子 i m 22 i ij j 1i i11i22im m i 22 i i11im m i 222 2 i1i2im i 22 i i 22i i i X A i h a i 1,,p X a F +a F ++a F +Var X a Var F a Var F Var a a a h X 1h εεσσσ====++++=+=+∑ 变量的共同度——因子载荷阵中第行元素的平方和,即:为了说明他的统计意义,将下式两边求方差,即()=()++()+() =由于已经标准化了,所以有:

【管理学】spss因子分析案例共

【管理学】SPSS因子分析案例共

11.2.1 数据预备 激活数据治理窗口,定义变量名:分不为 XI 、X2、X3、X4、 X5、X6、X7,按顺序输入相应数值,建立数据库,结果见图 11.1。 图11.1 原始数据的输入 激活Statistics 菜单选 Data Reduction 的 Factor..命令项,弹出 F actor An alysis 对话框(图 11.2) X7,点击?钮使之进入 Variabl 图11.3 描述性指标选择对话框 点击 Extraction …钮,弹出 Factor Analysis:Extraction 对话框(图 11.4),系统提供如下因子提取方法: 图 11.4 因子提取方法选择对话框 在对话框左侧的变量列表中选变量 X1至 es 框。 图11.2 因子分析对话框 出 Factor Analysis:Descriptives 对话框(图 11. te descriptives 项要求输出各变量的均数与标 内选 Coefficients 项要求运算有关系数矩阵, 在Statistics 中选 U I 口 I 耐||的財血 准差;在 Correlation "CnrtEititlv ii Mtfhrix ( 并选KMO E “「and Bartlett ' s test of sphericity 项,要求对有关系数矩阵进行 3), 统计 Matrix 栏 pCnr-rcl-fl liciin Mirfirix

Principal components 主成分分析法;Un weighted least squares未加权 最小平方法;Generalized least squares 综合最小平方法;Maximum likelihood :极大似然估量法;Principal axis factoring: 主轴因子 法;Alpha factoring : a 因子法;Image fa cto ri n g :多元回来 法。 本例选用Principal components方法,之后点击Continue钮返回 Factor Analysis 对话框。 点击Rotation...钮,弹出Factor Analysis:Rotation 对话框(图 1 I.5),系统有 5 种因子旋转方法可选: 图11.5 因子旋转方法选择对话框 No ne:不作因子旋转; Varimax :正交旋转; Equamax:全体旋转,对变量和因子均作旋转; Quartimax :四分旋转,对变量作旋转; Direct Oblimin :斜交旋转。旋转的目的是为了获得简单结构,以关心我们讲明因子。本例选正交旋转法,之后点击Continue钮返回Factor Analysis对话框。 点击Scores..钮,弹出弹出Factor Analysis:Scores对话框(图 II.6),系统提供3种估量因子得分系数的方法,本例选Regression (回来 因子得分),之后点击Continue钮返回Factor Analysis对话框,再点击OK 钮即完成分析。 图11.6 估量因子分方法对话框 11.2.3 结果讲明 在输出结果窗口中将看到如下统计数据:

内容分析法的典型案例

内容分析法的典型案例 日本人巧妙搜集信息 第二次世界大战后,日本经济发展速度大大高于其他资本主义国家,重视信息的开发、利用,不能不说是个重要原因。 目前日本的信息传递非常迅速,只要5-10分钟就可以搜集到世界各地金融市场的行情,3-5分钟就可以查询并调用日本国内三万多个重点公司、企业当年或历年经营生产情况的时间系列数据,5分钟即可利用经济模型和计算机模拟出国际国内经济因素变化可能给宏观经济带来影响的变动图和曲线,5-10分钟可以查询或调用政府制定的各种法律、法令和国会记录。这种现代化的信息处理技术,大大提高了行政效率。 日本人十分重视信息的作用,时时处处留意信息的搜集,而且善于从平淡无奇的信息报道中分离出重要的内容。例如,20世纪60年代中国开发大庆油田,惟独日本和中国谈成了征求设计的买卖。原因是别的国家的设计均不符合中国大庆油田的要求,而日本则事先按大庆油田的要求进行产品设计,等待中国人去购买。那么日本人是怎么知道大庆油田的产品设计要求呢? 其实日本人对大庆油田早有耳闻,但始终得不到准确的信息。后来,日本人从1 964年4月20日出版的《人民日报》上看到“大庆精神大庆人”的字句,于是日本人判断…冲国的大庆油田确有其事”。但是,大庆油田究竟在什么地方,日本人还没有材料作出判断。从1966年7月的一期《中国画报》封面上,日本人看到一张照片,铁人王进喜身穿大棉袄,头顶着鹅毛大雪,猜测到“大庆油田是在冬季为零下三十度的东北地区,大致在哈尔滨与齐齐哈尔之间”。后来,到中国来的日本人坐这段火车时发现,来往的油罐车上有很厚的一层土,从土的颜色和厚度,证实了“大庆油田在东北”的论断,但大庆油田的具体地点还是不清楚。1966年10月,日本人又从《人民中国》杂志上找到了王进喜的先进事迹,从事迹介绍的分析中知道:“最早钻井是在安达东北的北安附近下手的,并且从钻井设备运输情况看,离火车站不会太远。”在该事迹介绍中还写有这样一段话:王进喜一到马家窑看到大片荒野时说:“好大的油海!把石油工业落后的帽子丢到太平洋去。”于是,日本人又从伪满州地图上查找到“马家赛是位于黑龙江海伦县东面的一个小村,在北安铁路上一个小车站东边十多公里处。”就这样,日本人终于将大庆油田的准确地理位置搞清楚了。 后来,日本人又从王进喜的一则事迹报道中了解到“王进喜是玉门油矿的工人,是1959年9月到北京参加国庆之后志愿去大庆的”,由此日本人断定大庆油田在19 59年以前就开钻了,并且大体上知道了大庆油田的规模:“马家窑是大庆油田的北端,即北起海伦的庆安,西南穿过哈尔滨与齐齐哈尔铁路的安达附近,包括公主峰西面的大贪,南北400公里的范围。估计从北满到松辽油田统称为大庆。”但是,日本人一时还搞不清楚大庆的炼油规模。

因子分析法(自己整理)

因子分析法 1.因子分析法简介: 1)因子分析法的提出 “因子分析”的名称于1931年由Thurstone 首次提出,但它的概念起源于二十世纪初Karl Pearson 和Charles Spearmen 等人关于智力测验的统计分析。近年来,随着电子计算机的高速发展,人们将因子分析方法成功地应用于各个领域,使得因子分析的理论和方法更加丰富。 2)因子分析的定义 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。因子分析法(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 3)与主成分分析的联系 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变

(完整版)方法:因子分析法

因子分析基础理论知识 1 概念 因子分析(Factor analysis ):就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法,而实际上主成分分析可以说是因子分析的一个特例。 2 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 3 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 4分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : ?????? ????? ???=np n n p p x x x x x x x x x X ΛM M M M ΛΛ212222111211

SPSS因子分析经典案例

SPSS因子分析经典案例 因子分析已经被各行业广泛应用,各种案例琳琅满目,以前在百度空间发表过相关文章,是以每到4至6月,这些文章总会被高校毕业生扒拉一遍,也总能收到各种魅惑的留言,因此,有必要再次发布这经典案例以飨读者。 什么是因子分析? 因子分析又称因素分析,传统的因子分析是探索性的因子分析,即因子分析是基于相关关系而进行的数据分析技术,是一种建立在众多的观测数据的基础上的降维处理方法。其主要目的是探索隐藏在大量观测数据背后的某种结构,寻找一组变量变化的共同因子。 因子分析能做什么? 人的心理结构具有层次性,即分为外显和内隐。但是作为具有同一性的个体来说,内隐的方面总是和外显的方面相互作用,内隐方面制约着外显特征。所以我们经常说,一个人的内在自我会在相当程度上决定他的外在行为特征,表现为某些行为倾向具有高度的一致性或相关性。 反过来说,我们可以通过对个体进行系统的观察和测量,从一组高度相关的行为倾向(可观测)中,探索到某种稳定的内在心理结构(潜存在),这就是因子分析所能做的。 具体来说主要应用于: (1)个体的综合评价:按照综合因子得分对case进行排序; (2)调查问卷效度分析:问卷所列问题作为输入变量,通过KMO、因子特征值贡献率、因子命名等判断调查问卷架构质量; (3)降维处理,结果再利用:因子得分作为变量,进行聚类或其他分析。 案例描述: 高中大家都读过吧,那是一个以成绩论英雄的时代,理科王子、文科小生是时代标签。为什么我们会将数学、物理、化学归并为理科,其他的归并为文科,有没有数据支持?今天我们将用科学的方法找到答案。 100个学生数学、物理、化学、语文、历史、英语成绩如下表(部分),请你来评价他们。

英美文化论文:谈翻译中的案例分析及其文本分析理论

谈翻译中的案例分析及其文本分析理论 一、概述 任何材料的翻译,译前通读全文并进行文本分析,是全面理解源语文本的前提。旅游景点材料,是一种内容包含有地方历史与特色的文本,其文本分析与小说、诗歌、政府报告、产品广告等其他类型的文本分析是否有所不同,还是有某种文本分析模式作为依据呢?德国功能学派第二代的代表人物克里斯蒂安·诺德(Christiane Nord)提出:“我们需要一个能够适用于所有文本类型和文本范例的源语文本分析模式,可以应用于所有的翻译任务。她认为可以建立一个无须参照源语或目标语特征的以翻译为导向的文本分析模式”[1].笔者则认为,一种模式可以起到举一反三的作用,但译者认为分析因素可根据个人主观意愿有所取舍与侧重。这正是本文旨在说明的焦点。 二、文本分析理论 翻译中的文本分析最早源起于德国学者凯瑟琳娜·莱斯(Katharina Reiss)、费米尔(Hans Vermeer)创建的德国翻译功能理论及莱斯的功能文本类型理论。在语言学家布勒语言功能三分法的基础上,莱斯把语言功能与文本联系起来,根据交际功能范畴把文本划分为:信息功能(informative),表达功能(expressive),感召功能(operative)三大文本类型[2]. 在篇章语言学和文本类型理论基础上,诺德提出了翻译的文本分析模式,旨在为译者提供一个分析源语文本的模式,运用于所有的文

本类型和翻译过程。 诺德的翻译导向的文本分析模式强调对源文本的充分理解和准确阐释,解释语言、文本结构及源语言系统规范的关系,为译者选择翻译决策提供可靠的基础[3].相对语篇结构语言学派的文本结构分析,诺德的文本分析模式更为详细全面,对源语文本中的文内外因素进行分析。诺德将源文本中的语言和非语言因素分为“文外因素”和“文内因素”,文外因素包括发送者、发送者意图、接受者、媒介、交际地点、交际时间、交际动机、文本功能八个方面。文内因素包括主题、内容、预设、文本构成、非语言因素、词汇、句子结构、超音段特征八个方面[4].这些因素的排列顺序可以改变,并互相依存,而且其分析是反复进行的,某一因素的分析可能会指引其他因素的分析。 翻译导向的文本分析模式放之四海而皆准,适用于任何的文本分析。因为其模式不变相当具体,对各类翻译问题的解决均有导向的作用。 三、文本分析案例 案例 The Queen of the Adriatic 和 The Majestic Acropo-lis 选自于荷兰作家 Winfried Maas 所编着的英文原版 100Cities of the World 中的两篇城市介绍文章。按照诺德的翻译导向的文本分析模式进行分析。 (一)文本外因素分析 从整体来看,此文本为呼唤型旅游文本,文本实现了唤起读者的

spss因子分析法例子解释【优质】

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: 因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

因子分析方法

因子分析法 1. 因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较 密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不 可观测的,即不是具体的变量) ,以较少的几个因子反映原资料的大部分信息。运用这种研究技 术,我们可以方便地找岀影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响 力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 因子分析法与其他一些多元统计方法的区别: 2?主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析 来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简 化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释各变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumpti on s),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子( specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定( spss根据一定的条件自动设定,只要是特征 值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。和主成分分析相比,由于因子分析可以使用旋转技 术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进 行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的 变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息) 来进入后续的分析,则可 以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单 独使用:a,了解数据。(screening the data) ,b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份 发对变量简化。(reduce dimensionality ) d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。

相关主题
文本预览
相关文档 最新文档