第九章-对应分析
- 格式:ppt
- 大小:918.00 KB
- 文档页数:36
第九章 对应分析§9.1 什么是对应分析及基本思想对应分析又称为相应分析,于1970年由法国统计学家J.P.Beozecri 提出来的。
它是在R 型和Q 型因子分析基础上发展起来的一种多元统计方法。
由前一章我们知道应用因子分析的方法,可以用较少的几个公共因子去提取研究对象的绝大部分信息,即可减少因子的数目,又把握住了研究对象之间的相互关系。
但是因子分析根据研究对象的不同又分为R 型因子分析和Q 型因子分析,即对指标(变量)作因子分析和对样品作因子分析是分开进行的,这样做往往会漏掉一些指标与样品之间有关的一些信息,另外在处理实际问题中,样品的个数远远地大于变量个数。
比如有100个样品,每个样品测10项指标,要作Q 型因子分析,就要计算(100×100)阶相似系数阵的特征根和特征向量,这对于一般小型计算机的容量和速度都是难以胜任的。
对应分析是将R 型因子分析与Q 型分子分析结合起来进行统计分析,它是从R 型因子分析出发,而直接获得Q 型因子分析的结果。
克服了由样品容量大,作Q 型分析所带来的计算上的困难。
另外根据R 型和Q 型分析的内在联系,可将指标(变量)和样品同时反映到相同坐标轴(因子轴)的一张图形上,便于对问题的分析。
比如在图形上邻近的一些样品则表示它们的关系密切归为一类,同样邻近的一些变量点则表示它们的关系密切归为一类,而且属地同一类型的样品点,可用邻近的变量点来表征。
因此,对应分析,概括起来可提供如下三方面的信息即指标之间的关系,样品之间的关系,以及指标与样品之间的关系。
基本思想:由于R 型因子分析和Q 型因子分析都是反映一个整体的不同侧面,因此它们之间一定存在内在的联系。
对应分析就是通过一个过渡矩阵Z 将二者有机地结合起来,具体地说,首先给出变量点的协差阵Z Z A '=和样品点的协差阵Z Z B '=,由于Z Z '和Z Z '有相同的非零特征根记为),m i n(0,21n p m m ≤<≥≥≥λλλ ,如果A 的特征根i λ对应的特征向量为i U ,则B 的特征根i λ对应的特征向量就是i i V ZU ∆,根据这个结论(后面有证明)就可以很方便的借助R 型因子分析而得到Q 型因子分析的结果。
第九章对应分析§9.1 什么是对应分析及基本思想一、什么是对应分析1.对应分析的概念与基本形式对某一行业所属的企业进行经济效益评价时,不仅要研究经济效益指标间的关系,还要将企业按经济效益的好坏进行分类,研究哪些企业与哪些经济效益指标的关系更密切一些,为各级领导部门正确指导企业的生产经营活动提供更多的信息。
这就需要有一种统计方法,将指标和企业放在一块进行分类、作图,便于做经济意义上的解释。
在社会科学研究中,一个经常会遇到的问题就是要对定性变量数据进行量化分析,因为研究中往往使用一些定性(Nonmetric)变量,例如名义变量或序次变量来反映研究对象的行为、态度等,研究不同性别的顾客对不同品牌商品的喜好,不同职业的人在吸烟行为上的差异等。
在上述情况下,就可以使用对应分析方法。
对应分析(Correspondence Analysis)方法是近年来新发展起来的一种多元相依变量(Interdependece)统计分析技术,它通过分析由定性变量构成的交互汇总表来揭示变量间的联系。
当以变量的一系列类别以及这些类别的分布图来描述变量之间的联系时,使用这一分析技术可以揭示同一变量的各个类别之间的差异以及不同变量各个类别之间的对应关系。
对应分析的基本形式是对由两个定性或类型(Category)变量构成的交互表进行分析,将定性变量数据转变成可度量的分值、减少维度并作出分值分布图。
在减少维度方面,对应分析与因子分析(Factor Analysis)相似;在作分布图方面,对应分析与多维标度(Multidimensional Scaling)方法相似。
对应分析的优点就在于可以同时做到这几方面,这是以往的统计方法所不能做的,因此,在定性变量数据分析方面,对应分析提供了一种新的多元相依变量(Interdependece)的分析技术。
2.有关多元对应分析虽然对应分析的基本形式是对两个定性变量进行分析,实际上对于由三个或三个以上变量形成的交互表也可以进行对应分析,这样的对应分析称为多元对应分析(Multiple Correspondence Analysis)。