数学建模之因子分析法[精品文档]
- 格式:doc
- 大小:308.00 KB
- 文档页数:5
现代统计学1 ・因子分析(Factor Analysis)因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相尖比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。
运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。
2・主成分分析主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。
主成分分析一般很少单独使用:a,了解数据。
(screening the data),b,和cluster analysis 一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。
(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
主成分分析和因子分析的区别1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。
2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。
3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。
因子分析的假设包括:各个共同因子之间不相尖,特殊因子(specific factor )之间也不相尖,共同因子和特殊因子之间也不相尖。
4、主成分分析中,当给定的协方差矩阵或者相尖矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。
5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。
因子分析模型概述因子分析是一种多变量统计分析方法,旨在找到观测变量背后的共同因素或潜在结构。
因子分析模型通过统计分析观测变量之间的关系,将多个相关变量归纳为较少的无关因子,以解释和简化数据。
模型假设因子分析模型基于以下假设: 1. 变量之间存在线性关系,且该关系可以用较少的无关因子来描述。
2. 每个观测变量是由潜在因子和特异因素共同决定的。
3. 特异因素相互独立,不相关。
模型建立过程因子分析模型的建立包括以下步骤: 1. 数据准备:将需要进行因子分析的样本数据进行整理和清洗,确保数据质量和可用性。
2. 因子提取:采用主成分分析或最大似然估计等方法,提取出潜在因子。
3. 因子旋转:通过因子旋转,使得每个潜在因子与尽可能多的观测变量相关,以减少因子之间的相关性。
4. 因子分析结果解释:解释提取出的因子,确定每个因子与观测变量之间的关系以及因子的实际意义。
模型应用因子分析模型广泛应用于各个领域的研究和实践,如心理学、社会学、市场调研等。
以下是几个常见的应用场景:1. 心理学在心理学中,因子分析可用于评估心理测试的信度和效度。
通过观察心理测试得到的一系列变量,可以通过因子分析确定隐藏在这些变量背后的共同因子,以评估测试的有效性。
2. 市场调研在市场调研中,因子分析可以帮助确定潜在的消费者需求和心理特征。
通过对消费者行为和态度等多个变量进行因子分析,可以获得更准确的结果,从而为企业的市场定位和产品设计提供指导。
3. 社会学在社会学领域,因子分析可用于研究社会结构和社会现象。
例如,通过对教育水平、收入水平、职业等多个变量进行因子分析,可以判断不同因子对社会等级的影响程度,并揭示社会结构中的潜在关系。
模型评估为了评估因子分析模型的拟合程度和模型可解释性,常用的指标有:- 特征根:通过特征根可以判断提取的因子是否显著。
特征值大于1的因子通常被认为是显著的。
- 方差贡献率:衡量因子解释的原始变量方差的比例。
应用案例第一节模型设定结构方程模型分析过程可以分为模型构建、模型运算、模型修正以及模型解释四个步骤。
下面以一个研究实例作为说明,使用Amos7 软件1 2进行计算,阐述在实际应用中结构方程模型的构建、运算、修正与模型解释过程。
模型构建的思路本案例在著名的美国顾客满意度指数模型(ASCI)的基础上,提出了一个新的模型,并以此构建潜变量并建立模型结构。
根据构建的理论模型,通过设计问卷对某超市顾客购物服务满意度调查得到实际数据,然后利用对缺失值进行处理后的数据3进行分析,并对文中提出的模型进行拟合、修正和解释。
二、潜变量和可测变量的设定本文在继承ASCI 模型核心概念的基础上,对模型作了一些改进,在模型中增加超市形象。
它包括顾客对超市总体形象及与其他超市相比的知名度。
1关于该案例的操作也可结合书上第七章的相关内容来看。
2本案例是在Amos7 中完成的。
3见spss 数据文件“处理后的数据.sav”。
2.1、顾客满意模型中各因素的具体范畴参考前面模型的总体构建情况、国外研究理论和其他行业实证结论,以及小范围甄别调查的结果,模型中各要素需要观测的具体范畴,见表7-2 。
模型变量对应表它与顾客期望,感知价格和顾客满意有关,设计的模型见表7-1 。
模型中共包含七个因素(潜变量):超市形象、质量期望、质量感知、感知价值、顾客满意、顾客抱怨、顾客忠诚,其中前四个要素是前提变量,后三个因素是结果变量,前提变量综合决定并影响着结果变量(Eugene W. Anderson & Claes Fornell ,2000;殷荣伍,2000) 。
表7-1 设计的结构路径图和基本路径假设设计的结构路径图顾客抱怨感知价值顾客满意质量感知顾客忠诚基本路径假设? 超市形象对质量期望有路 径影响? 质量期望对质量感知有路径影响? 质量感知对感知价格有路 径影响? 质量期望对感知价格有路 径影响? 感知价格对顾客满意有路 径影响? 顾客满意对顾客忠诚有路 径影响? 超市形象对顾客满意有表 7-2超市形象质量期望潜变量 内涵 可测变量(一) 超 根据 MARTENSEN 在固定 电话、移动电话、超市等行业中的调查研究, 企业形象 是影响总体满意水平的第 一要素,这里将超市形象要 素列为影响因素, 可以从以 下几个方面进行观测。
数学建模之因子分析法
因子分析是一种常用的数学建模方法,用于分析观测变量之间的内在关系和结构。
它通过分析多个观测变量之间的相关性,将它们综合起来解释数据的变异,从而推断潜在的因子或维度。
因子分析的主要目的是降低变量的维度,并发现观测变量之间隐藏的结构成分。
因子分析的一般步骤如下:
1.收集数据:首先,我们需要收集一组变量,这些变量可以是连续型的数据,也可以是离散型的数据。
2. 确定因子数目:在进行因子分析之前,我们需要确定分析所需的因子数目。
可以通过一些统计方法,如Kaiser准则、平行分析或层次分析等来确定。
3.进行因子提取:利用因子提取方法,如主成分分析法(PCA)或最大似然法(ML)等,将原始变量转化为一组因子。
4.因子旋转:由于因子提取得到的因子可能存在模糊性,我们需要对因子进行旋转来使其更具解释性。
常用的旋转方法有方差最大旋转和方差等于1旋转等。
5.因子得分和解释:通过计算因子得分,我们可以得到每个样本的因子得分,从而评估每个样本对于每个因子的贡献。
此外,通过对因子负荷矩阵进行解释,我们可以确定每个因子所代表的具体含义。
6.结果解释和应用:最后,根据因子得分和因子负荷矩阵的结果,我们可以解释数据的变异,并根据需要进一步应用于相关的问题。
因子分析在实际应用中有很多方面的应用,例如心理学、社会学、市场调研等。
在心理学中,因子分析可以用于评估人格特征、心理健康等方面的变量。
在市场调研中,因子分析可以帮助我们发现消费者偏好和行为模式。
因子分析还可以用于降维,减少冗余信息,从而提高其他模型的效果。
企业生命周期评价模型一、 因子分析的基本思想因子分析(factor analysis )模型是主成分分析的推广。
它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。
因子模型可具体写成:111112211122112222221122m m m m p p p pm m p p x a f a f a f a x a f a f a f a x a f a f a f a εεε=++++⎧⎪=++++⎪⎨⎪⎪=++++⎩式中,1f ,2f ,,m f 为主因子,分别反映某一方面信息的不可观测的潜在变量;ij a 为因子载荷系数,是第i 个指标在第j 个因子上的负荷。
二、 基本模型的建立本模型在遵循整体性、可比性、科学性、实用性等原则的基础上,参阅相关文献并结合我国企业现状,选取了具有代表性的13个指标,主要包括总资产净利润率(1X )、资产报酬率(2X )、流动资产净利润率(3X )、固定资产净利润率(4X )、净资产收益率(5X )、资本保值增值率 (6X )、资本积累率(7X )、所有者权益增长率(8X )、权益乘数(9X )、产权比率(10X )、速动比率(11X )、流动比率(12X )和资产负债率(X 13),这些指标从不同角度反映了中小企业财务状况,初步构成了中小企业状况评价指标体系。
本文选取的数据,来自汽车行业中八家上市公司的财务数据。
首先对所有指标的原始数据进行标准化,消除量纲和数量级的影响。
在因子分析之前,对数据进行相关统计检验,看数据是否满足因子分析的条件。
本文运用spss19.0 对相关数据进行KMO和巴特莱特球形检验,检验结果如下表所示:KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。
.650Bartlett 的球形度检验近似卡方1792.109 df 28 Sig. .000结果显示KMO抽样适度测定值为0.65>0.5,根据多元统计因子分析相关知识,在0.05的显著性水平下,球形检验P值为0.00,小于0.05,故应拒绝球形检验零假设,样本符合因子分析的条件。
因子分析
因子分析就是一种降维、简化数据的技术。
它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个“抽象”的变量来表示其基本的数据结构。
这几个抽象的变量被称作“因子”,能反映原来众多变量的主要信息。
原始的变量是可观测的显在变量,而因子一般是不可观测的潜在变量。
1.因子分析法的应用
①汽车行业业绩评价研究(下载文档), ②上市公司盈利能力及资本结构实证分析, ③生育率影响因素分析。
2.步骤
①对原始数据进行标准化处理 用12,,
,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i
个评价对象对应于第j 个指标的取值。
将每个指标值ij a 转化为标准化指标ij a ,即
,(1,2,
,;1,2,
,)ij j
ij j
a a i n j m s μ-=
==
式中:11n j ij i a n μ==∑,21
1()1n
j ij j i s a n μ==--∑ 相应地,标准化指标变量为
,(1,2,
,)j j
j j
x x j m s μ-=
=
②计算相关系数矩阵R
()ij m m R r ⨯=
1
,(,1,2,
,)1
n
ki
kj
k ij a
a r i j m n =⋅=
=-∑
式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。
③计算初等载荷矩阵
解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再求
出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j j mj u u u u =,得到
初等载荷矩阵为
111,
,m m u u λλ⎡⎤Λ=⎣⎦
④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11
85%k
m
i
i
i i λλ
==≥∑∑的这k 个主因子,对k 个因子载荷
矩阵作旋转,用()1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()
21
k T Λ=Λ,建立因子模型,即
1111111,
.
k k m
m mk k x F F x F F αααα=++⎧⎪
⎨⎪=++⎩ ⑥计算因子得分,作出综合评价
求出单个因子的得分函数ˆj F ,用ˆij F 表示第i 个样本对第j 个因子的得分估计值,Y 表示原始数据标准化后的矩阵,则总得分为
1ˆˆ()ij n k k
F F YR -⨯=
=Λ 例题
我国上市公司赢利能力与资本结构的实证分析已知上市公司的数据见表1
表1 上市公司数据
试用因子分析法对上述企业进行综合评价。
模型的建立
①对原始数据进行标准化处理 用12,,
,m x x x 表示因子分析指标的m 个变量,评价对象有n 个,ij a 表示第i
个评价对象对应于第j 个指标的取值。
将每个指标值ij a 转化为标准化指标ij a ,即
,(1,2,
,;1,2,
,)ij j
ij j
a a i n j m s μ-=
==
式中:11n j ij i a n μ==∑,21
1()1n
j ij j i s a n μ==--∑ 相应地,标准化指标变量为
,(1,2,
,)j j
j j
x x j m s μ-=
=
②计算相关系数矩阵R
()ij m m R r ⨯=
1
,(,1,2,
,)1
n
ki
kj
k ij a
a r i j m n =⋅=
=-∑
式中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。
③计算初等载荷矩阵
解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ=12,0m λλλ≥≥≥≥,再求
出相对应的特征值i λ的特征向量(1,2,,)i u i m =,其中12(,,,)T j j j mj u u u u =,得到
初等载荷矩阵为
111,
,m m u u λλ⎡⎤Λ=⎣⎦
④ 确定主因子的个数()k k m ≤ 一般选取使得累计贡献率11
85%k
m
i
i
i i λλ
==≥∑∑的这k 个主因子,对k 个因子载荷
矩阵作旋转,用()1k Λ表示1Λ的前k 列,T 表示正交矩阵,则得矩阵()
21
k T Λ=Λ,建立因子模型,即
1111111,.
k k m
m mk k x F F x F F αααα=++⎧⎪
⎨⎪=++⎩ 模型的求解:
我们选取两个主因子。
利用MATLAB 程序计算得旋转后的因子贡献及贡献率见表2,因子载荷阵见表3。
表2 贡献率数据
表3 旋转因子分析表
计算因子得分,作出综合评价
我们用回归方法求单个因子得分函数
11
ˆ,1,2,
,j j jm m F b x b x j k =++=
用ˆij
F 表示第i 个样本对第j 个因子的得分估计值,则 11
ˆ,(1,2,
,;1,2,,)ij j i jm im F b x b x i n j k =++==
即
1121
112222112k k m m
km b b b b b x R B b b x -⎡⎤⎢⎥⎢⎥=⎢⎥⎢⎥⎣⎦ 用Y 表示原始数据标准化后的矩阵,则总得分为
1ˆˆ()ij n k
F F YR B -⨯== 计算得出各个因子得分函数为
1123421234
0.5310.16150.18310.50150.0450.51510.5810.0199F x x x x F x x x x =+-+=-++-
总得分为
12
44.4941.886.17
F F F +=
计算出16家上市公司赢利能力的综合得分见表4。
表416家上市公司赢利能力的综合得分。