DPS数据处理详解
- 格式:ppt
- 大小:2.23 MB
- 文档页数:156
第18章 多因子分析多因子分析是一种将多变量(指标)样本在结构上进行简化的有效方法。
通过分析找到一个包含最佳变量的子集合,使其所包含的变量能反映总体的结构。
这种简化结构的处理对研究多因素之间的规律和构造模型等有重要的作用。
DPS 系统提供的关于多因素分析的主要功能模块包括主成分分析、因子分析、对应分析及典型相关分析等5种分析方法。
18.1 主成分分析18.1.1 基本原理主成分概念由Karl Pearson 于1901年提出,由Hottelling 于1933年推广到随机变量,主成分分析是多元统计分析中的重要统计方法,是用较少的综合指标来代替原来较多的指标。
多元分析中的随机变量,是对同一个体进行测量结果。
从多个实测变量提取较少、互不相关综合指标,反映总体信息,这种综合指标就称为主成分。
主成分分析可在不丢掉主要信息前提下,避开变量间共线性问题,便于继续用其他多元统计方法进行分析。
设两个变量n 个样品,在二维空间分布大致为一椭圆。
作坐标旋转,使新坐标系为椭圆长、短轴方向,坐标旋转公式为⎩⎨⎧+-=+=θθθθcos sin sin cos 212211j j jj j j x x y x x y 对于标准化后的数据,旋转角度为45︒。
如有11个样本的两个变量数据,实施标准化后显示如图18-1中的小圆圈。
图18-1 两变量主成分分析−−坐标旋转·632·第18章 多因子分析从图18-1可以看出,各点坐标呈正相关。
主成分分析,数据点顺时针旋转45︒后处于星号点位置。
这时数据点大部分在横坐标方向,变异(方差)集中在横轴,为第一主成分;纵轴方向变异(方差)较小,为第二主成分。
且相关为零。
一般地,设变量x i 的样本均数和样本样本差分别为i x 和s i ,i =1,2,…,m 。
变量标准化公式为()s x x z i i i /-=对标准化后的变量z i 寻求主成分。
第一主成分C 1是z 1,z 2,…,z m 的线性组合,即m m z a z a z a C 12121111+++=C 1要尽可能多地反映原m 个变量的信息,在121212211=+++m a a a 的条件下,C 1的方差Var(C 1)要尽可能大。