多元统计分析知识点 多元统计分析课件
- 格式:doc
- 大小:3.97 MB
- 文档页数:70
多元统计分析(1)题目:多元统计分析知识点研究生专业指导教师完成日期 2013年 12月目录第一章绪论 (1)§1.1什么是多元统计分析 ....................................................................................................... 1 §1.2多元统计分析能解决哪些实际问题 ............................................................................... 2 §1.3主要内容安排 ................................................................................................................... 2 第二章多元正态分布 .. (2)§2.1基本概念 ........................................................................................................................... 2 §2.2多元正态分布的定义及基本性质 .. (8)1.(多元正态分布)定义 ................................................................................................ 9 2.多元正态变量的基本性质 (10)§2.3多元正态分布的参数估计12(,,,)p X X X X '= (11)1.多元样本的概念及表示法 (12)2. 多元样本的数值特征 ................................................................................................ 123.μ和∑的最大似然估计及基本性质 (15)4.Wishart 分布 (17)第五章 聚类分析 (18)§5.1什么是聚类分析 ............................................................................................................. 18 §5.2距离和相似系数 . (19)1.Q —型聚类分析常用的距离和相似系数 ................................................................ 20 2.R 型聚类分析常用的距离和相似系数 ...................................................................... 25 §5.3八种系统聚类方法 (26)1.最短距离法 .................................................................................................................. 27 2.最长距离法 .................................................................................................................. 30 3.中间距离法 .................................................................................................................. 32 4.重心法 .......................................................................................................................... 35 5.类平均法 ...................................................................................................................... 37 6.可变类平均法 .............................................................................................................. 38 7.可变法 .......................................................................................................................... 38 8.离差平方和法(Word 方法) (38)第六章判别分析 (39)§6.1什么是判别分析 ............................................................................................................. 39 §6.2距离判别法 (40)1、两个总体的距离判别法 (40)2.多总体的距离判别法 (45)§6.3费歇(Fisher)判别法 (46)1.不等协方差矩阵两总体Fisher判别法 (46)2.多总体费歇(Fisher)判别法 (51)§6.4贝叶斯(Bayes)判别法 (58)1.基本思想 (58)2.多元正态总体的Bayes判别法 (59)§6.5逐步判别法 (61)1.基本思想 (61)2.引入和剔除变量所用的检验统计量 (62)3.Bartlett近似公式 (63)第一章绪论§1.1什么是多元统计分析在自然科学、社会科学以及经济领域中,常常需要同时观察多个指标。
例如,要衡量一个地区的经济发展,需要观测的指标有:总产值(X1)、利润(X2)、效益(X3)、劳动生产率(X4)、万元生产值能耗(X5)、固定资产(X6)、流动资金周转率(X7)、物价(X8)、信贷(X9)及税收(X10)也就是说一个地区的经济发展,受多种指标共同作用的影响,我们把每一个指标看成一个随机变量,可以单独研究每个随机变量,但这只能揭示该地区经济发展的一个方面,更多的时候需要把把这诸个随机变量一起研究揭示多个随机变量对该地区经济发展的共同影响,以及揭示这些随机变量内在变化规律。
例如,研究某公司的经营状况,需要观测公司的财务指标有:每股净资产(X1)、净资产收益率(X2)、每股收益(X3)、每股现金流(X4)、负债率(X5)、流动比率(X6)及速动比率(X7)。
可以单独研究每个随机变量,更多的时候需要把这诸个随机变量一起研究,揭示这些随机变量内在变化规律。
多元统计分析——研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。
多元统计分析包括的主要内容:多元(正态)总体的参数估计和假设检验、聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析、多重多元回归分析等。
介绍多元统计分析方法时,需要的时候增加一些线性代数的知识。
§1.2多元统计分析能解决哪些实际问题⑴经济学:对我国32个省市自治区的社会情况进行分析。
⑵工业:服装厂生产服装。
为了适应大多数顾客的需要,如何确定服装的主要指标及分类的型号。
指标:身长、袖长、胸围、腰围、肩宽、肩厚等十几个指标(主要指标:长度、胖瘦)⑶投资组合:§1.3主要内容安排多元(正态)总体的参数估计、聚类分析、判别分析、主成分分析、因子分析、典型相关分析等。
上机操作。
第二章多元正态分布§2.1基本概念1.随机向量的概率分布定义1 将p 个随机变量12,,,p X X X 的整体称为p 维随机向量,记为12(,,,)p X X X X '=在多元统计分析中,仍然将所研究对象的全体称为总体。
一元总体分布函数和分别密度定义:()()F x P X x =≤为随机变量X 的概率分布,记为()X XF x 。
离散型:()k k P X x p == k=1,2,3,…⑴()0k k P X x p ==≥; ⑵1k kp =∑连续型:()()()xF x P X x f t dt -∞=≤=⎰⑴ ()0f t ≥; ⑵()1f t dt +∞-∞=⎰定义2 设12(,,,)p X X X X '=是p 维随机向量,它的多元分别函数定义为111122()=(,,,)(,,,)p p p F x F x x x P X x X x X x =≤≤≤记为()X XF x ,其中记为12=(,,,)R p p x x x x '∈。
定义3 设12(,,,)p X X X X '=是p 维随机向量,若存在有限个或可列个p 维数向量1x ,2x ,3x ,…,记()k k P X x p == (k=1,2,3,…),且满足()0k k P X x p ==≥,1k kp =∑,则称X 为离散型随机向量,称()k k P X x p ==(k=1,2,3,…)为X 的概率分布。
设p 维随机向量()X XF x ,11()=(,,,)p F x F x x x ,若存在一个非负函数12(,,,)p f x x x ,使得对一切12=(,,,)R p p x x x x '∈,有12121212()(,,,)(,,,)px x x p p p F x F x x x f t t t dt dt dt -∞-∞-∞==⎰⎰⎰则称X 为连续随机向量,称12(,,,)X p f x x x 为分布密度函数,易见⑴12(,,,)0p f x x x ≥, ⑵1212(,,,)1p p f t t t dt dt dt ∞∞∞-∞-∞-∞=⎰⎰⎰例1试证函数12()12120,0(,)0x x e x x f x x -+⎧≥≥=⎨⎩其它为随机向量12X X X ⎛⎫= ⎪⎝⎭的密度函数。