第6章 因子分析
- 格式:doc
- 大小:88.50 KB
- 文档页数:6
多元统计分析陈钰芬课后答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
第六章 因子分析一.基本原理因子分析(Factor anslysis )是用来分析隐藏在表象背后的因子作用的一类统计模型与方法。
起源于心理度量学(Phsycholometrics ),在方法上与主成分分析有密切联系。
因子分析一般有两个用途,一是通过寻求变量的基本结构,对变量进行简化;二是通过因子得分,在因子轴构成的空间中将变量或者样品进行分类。
1.正交因子模型设x 为一个p 维可观测随机向量,假定x 受到m 个不可观测的随机因子的控制,称这m 个影响x 的因子为公共因子,若m 维随机向量f 对x 的影响是线性的,则x 与f 之间的关系可用下述模型来表述:x Lf με=++其中μ为P 维常向量,表示X 的均值;L 为p m ⨯维常数阵,L 的第I 行表示公共因子f 对X 第I 个分量i x 的影响系数;ε为P 维随机变量,表示X 中与f 无关的那一部分,称为特殊因子。
其中f 和ε都是不可观测的,假定它们满足下列条件 (1)f 和ε相互独立 (2)()0,()m E f V f I ==(3)()0,()E V εε==ψ,其中ψ(psai)为对角阵。
由于()m V f I =,即各因子之间不相关,这样的模型便称为正交因子模型。
在正交因子模型中,公共因子f 对X 的各分量都起作用,而特殊因子ε的第I 个分量只对X 的第I 个分量起作用。
L 称为载荷阵(Loading Matrix )。
如果对X 进行标准化处理,则μ为0,原式化为x Af ε=+。
A 为载荷阵。
X 的方差是由载荷阵和特殊因子的方差构成的。
即()Var X AA '=+ψ。
2.因子分析与其他多元分析方法的区别与多元回归的区别:因子分析中,各个公共因子是虚拟的,本身是未知量。
与主成分分析的区别:主成分分析本质上是一种变量变换,而因子分析则是构造出一组新的因子来对原变量进行解释。
二.计算模型1.因子载荷的含义假定在因子分析模型中,对各变量及公共因子、特殊因子均进行了标准化处理。
第六章 因子分析
一、填空题
1.因子分析常用的两种类型为 和 。
2.因子分析是将具有错综复杂关系的变量(或样品)综合为数量较少的几个因子,以再现_____________与____________之间的相互关系。
3.因子分析就是通过寻找众多变量的 来简化变量中存在的复杂关系的一种方法。
4.因子分析是把每个原始变量分解成两个部分即 、 。
5.变量共同度是指因子载荷矩阵中_______________________。
6.公共因子方差与特殊因子方差之和为_______。
7.求解因子载荷矩阵常用的方法有 和 。
8.常用的因子旋转方法有 和 。
9.Spss 中因子分析采用 命令过程。
10.变量i X 的方差由两部分组成,一部分为 ,另一部分为 。
二、判断题
1.在因子分析中,因子载荷阵不是唯一的。
( )
2.因子载荷阵经过正交旋转后,各变量的共性方差和各个因子的贡献都发生了变化。
( )
3.因子分析和主成分分析的核心思想都是降维。
( )
4.因子分析有两大类,R 型因子分析和Q 型因子分析;其中R 型因子分析是从变量的相似矩阵出发,而Q 型因子分析是从样品的相关矩阵出发。
( ) 5.特殊因子与公共因子之间是相互独立的。
( ) 6.变量共同度是因子载荷矩阵列元素的平方和。
( ) 7.公共因子的方差贡献是衡量公共因子相对重要性指标。
( ) 8.对因子载荷阵进行旋转的目的是使结构简化。
( ) 三、简答题
1. 因子分析的基本思想是什么,它与主成分分析有什么区别和联系? 2.因子模型的矩阵形式ε+=X UF ,其中:
()
()
()
u F
F ij m
p P
m
U F
⨯='
='
=εεε,,,,1
1
请解释式中F 、
ε、U 的统计意义。
3.因子旋转的意义何在?如何进行最大方差因子旋转? 4.因子分析主要应用在哪几个方面? 四、计算题
4.假设某地固定资产投资率1x , 通货膨胀率2x 和失业率3x 的约相关矩阵为:
⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢
⎢⎢⎣⎡----=525
25
152********
51*
R 并且已知该相关矩阵的各特征根和相应的非零特征根的单位特征向量分别为: 9123.01=λ ()'
-=657.0657.0369
.01α 0877.02=λ ()'-=261.0261
.0929
.02α
03=λ
要求求解因子分析模型,计算各变量的共同度和各公共因子的方差贡献并解释它们的统计意义。
2.设变量x 1,x 2和x 3已标准化,其样本相关系数矩阵为:
⎥⎥
⎥⎦
⎤⎢⎢⎢⎣⎡=135.045.035.0163.045.063.01
R (1)对变量进行因子分析。
(2)取q=2进行正交因子旋转。
3.已知我国某年各地区的国有及非国有规模以上的工业企业经济效益资料,现做因子分析,结果如下,请说明每一个输出结果的含义及目的,并回答以下问题: (1)什么是方差贡献率? 计算方差贡献率的目的何在?
(2) 如何利用因子分析结果进行综合评价? 结合本例写出计算综合评价结果的公式。
表1
表2
表3
表4
5
表
五、操作题
1.10名初中男生身高、胸围、体重的数据资料如下:
(2)分别计算各变量的公共因子方差和特殊因子方差,判断哪个因子能概括原
始信息的大部分,为什么?
(3)写出方差最大正交旋转因子模型,并分析各因子的实际含义
(4)计算各个样本点的因子得分
2.对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。
数据资料如下:
第一、对数据资料进行主成分分析:
(1)前两个最大特征根为_____________、______________,其对应的特征向量为__________________________________,_____________________________。
(2)第一主成分的表达式为_________________________________________ ___,该主成分包含了原始信息的_______%,第二主成分的表达式为_________________________________________,该主成分的方差贡献率为_______。
(3)如果舍弃第二主成分,则哪个原始变量的损失信息最大:_______
(4)第一个主成分与第二个变量间的相关系数为_____________
(5)第一个主成分主要反映盈利能力,现对第一主成分计算得分为_________________________________________________________________,
对得分进行排序(降序),各企业的得分排名顺序依次为:_________________ __________________________(依企业顺序写出排名)。
若利用第一、二主成分构造综合评价函数,则两主成分的权数分别为_________、_________。
第二、对原数据资料进行因子分析:
(6)利用主成分法求解因子载荷,现提取两个因子进行分析,因子模型表示为:
(7)前三个变量(X1,X2,X3)的公共因子方差为___________、_____________、____________,特殊因子方差为________、___________、_____________。
(8)对以上模型进行方差最大正交旋转,得出旋转后的因子载荷矩阵为:。