对应分析
- 格式:doc
- 大小:509.50 KB
- 文档页数:10
第九章对应分析
(一)教学目的
通过本章的学习,对对应分析有一个全面地认识,理解对应分析的基本思想和基本原理,掌握用聚类分析解决实际问题的能力。
(二)基本要求
了解对应分析的定义,理解对应分析方法的方法和原理,掌握对应分析的计算步骤。
(三)教学要点
1、对应分析的定义和基本思想;
2、对应分析方法的原理;
3、R型因子分析和Q型因子分析的对应关系;
4、对应分析方法及计算步骤;
(四)教学时数
3课时
(五)教学内容
1、对应分析的基本思想;
2、对应分析方法的方法和原理;
我们知道,主成分分析、因子分析都是研究多维变量之间相互的关系。但在某些实际问题中,既要研究变量之间的关系,还需要研究样品之间的关系。不仅如此,人们往往还希望能够在同一个直角坐标系内直观地同时表达变量和样品之间的相互关系。为实现这一目的就需要进行对应分析。对应分析能够提供变量之间,样品之间以及变量和样品之间相互关系的信息。
第一节对应分析的基本思想
一、什么是对应分析
对应分析(correspondence analysis)又称为相应分析,是一种目的在于揭示变量和样品之间或者定性变量资料中变量与其类别之间的相互关系的多元统计分析方法。
根据分析资料的类型不同,对应分析分为定性资料(分类资料)的对应分析和连续性资料的对应分析(基于均数的对应分析)。其中,根据分析变量个数的多少,定性资料的对应分析又分为简单对应分析和多重对应分析。对两个分类变量进行的对应分析称为简单对应分析,对两个以上的分类变量进行的对应分析称为多重对应分析。
一般认为对应分析起源于20世纪30~20世纪40年代的一批互相独立的文献如Richardson 和Kuder(1933)、Hirshfeld(1935)、Horst(1935)、Fisher(1940)、Cuttman (1941)等,很难说
哪位统计学家是该方法的真正作者,但所有方法的基本原理是相同的。这里主要介绍的是1970年由Beozecri提出的主要是用于连续性资料分析的对应分析方法。
对应分析实际是在R型因子分析和Q型因子分析的基础上发展起来的一种方法。因子分析可以用最少的几个公共因子去提取研究对象的绝大部分信息,既减少了因子的数目,还把握住了研究对象间的相互关系。因子分析有R型因子分析和Q型因子分析两种类型,R型因子分析是将变量转换为变量因子,其实质是对变量进行降维和消除相关性,变量因子的个数小于或等于变量的个数,并且变量因子之间不相关。Q型因子分析是将样品转换为样品因子,其实质是对样品进行降维和消除相关性,样品因子的个数小于或等于样品的个数,并且样品因子之间不相关。但是,因子分析也有其局限性:
一是,R型因子分析和Q型因子分析是分开进行的。当研究的对象是变量时,通常作R型因子分析,当研究的对象是样品时,则采用Q型因子分析,而且把R型和Q型看成两种分离的概念,无法使R型和Q型因子分析同时进行,这样将R型和Q型割裂开后就会损失很多有用的信息,而且还不能揭示指标与样品之间的相关信息。
二是,在处理实际问题中,样品容量往往较大,使Q型因子分析的计算量非常巨大,比如有100个样品,就要计算100×100阶矩阵的特征根和特征向量,这对于一般小型计算机的容量和速度都是难以胜任的。
三是,在进行数据处理时,为了将数量级相差很大的变量进行比较,需要对变量进行标准化处理,然而这种只按照变量列进行的标准化处理对于变量和样品是非对等的,这给寻找R型因子分析和Q型因子分析的联系带来—定的困难。
对应分析就是为了克服因子分析的上述不足而发展起来的。对应分析将R型因子分析和Q型因子分析结合起来进行统计分析,它是从R型因子分析出发,而直接获得Q型因子分析的结果。克服了由于样品容量大,进行Q型因子分析带来的计算上的困难。另外根据对原始数据进行规格化处理,找出R型因子分析和Q型因子分析的内在联系,可将变量和样品同时反映到相同坐标轴的一张图形上,便于对问题的分析和解释。
对应分析的重要输出结果之一在于,把变量与样品同时反映到相同坐标轴(因子轴)的一张图形上,结合计算结果,在绘出的图形上能够直观地观察变量之间的关系、样品之间的关系以及变量与样品之间的对应关系。为此也有人认为,对应分析的实质是将变量、样品的交叉表变换成为一张散点图,从而将表格中包含的变量、样品的关联信息用各散点空间位置关系的形式表现出来。
随着计算机软件的应用,对应分析的方法在社会科学和自然科学领域都有着广泛的应用价值。特别是近年来在市场调查与研究中,有关市场细分、产品定位、品牌形象以及满意度研究等领域正得到越来越广泛的重视和应用。
二、对应分析的基本思想
对应分析的关键是利用一种数据变换,使含有p 个变量n 个样品的原始数据矩阵,变换成为一个过渡矩阵Z ,并通过矩阵Z 将R 型因子分析和Q 型因子分析有机地结合起来。具体地说,首先给出进行R 型因子分析时变量点的协差阵Z Z A '=和进行Q 型因子分析时样品点的协差阵Z Z B '=,由于Z Z '和Z Z '有相同的非零特征根,记为
m λλλ≥≥≥ 21,),min(0n p m ≤<,
依据证明,如果A 的特征根i λ对应的特征向量为i U ,则B 的特征根i λ对应的特征向量就是i i V ZU ∆,根据这个结论就可以很方便地借助R 型因子分析而得到Q 型因子分析的结果。因为求出A 的特征根和特征向量后很容易地写出变量点协差阵对应的因子载荷矩阵,记为F 。则
⎪⎪
⎪⎪
⎪
⎭
⎫
⎝⎛=m pm p p m m m m u u u u u u u u u F λλλλλλλλλ 2
21
122
221
2112121
11 这样,利用关系式i i V ZU ∆也很容易地写出样品点协差阵B 对应的因子载荷阵,记为G 。则
⎪⎪
⎪⎪
⎪
⎭
⎫
⎝⎛=m nm n n m m m m v v v v v v v v v G λλλλλλλλλ 2
21
122
221
2112121
11 从分析结果的展示上,由于A 和B 具有相同的非零特征根,而这些特征根正是公共因子的方差,因此可以用相同的因子轴同时表示变量点和样品点,即把变量点和样品点同时反映在具有相同坐标轴的因子平面上,以便显示出变量点和样品点之间的相互关系,并且可以一并考虑进行分类分析。
第二节 对应分析方法的方法和原理
一、对原始数据规格变换,使R 型和Q 型因子分析有机结合
在以往的对实际问题的统计分析中,若变量值的量纲不同以及数量级相差很大时,通常先将对变量作标准化的处理,然而这种对变量进行的标准化处理是按各个变量列进行的,并没有考虑到样品之间的差异,对于变量和样品而言是非对等的,为了使之具有对等性,以便将R 型因子分析和Q 型因子分析建立起联系,就需将原始数据阵)(ij x X =变换成矩阵)(ij z Z =,即将ij x 变换成ij z 之后,ij z 应满足使变量和样品具有对等性,并且能够通过ij z 把R 型因子分析