厦门大学《应用多元统计分析》_[2]...
- 格式:ppt
- 大小:4.16 MB
- 文档页数:127
思考与练习2.1 试述多元联合分布和边缘分布之间的关系。
2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。
2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为:()()()()()()()()()121122222,d c x a b a x c x a x c f x x b a d c −−+−−−−−2⎡⎤⎣⎦=−−其中,。
求:12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。
⑵ 随机变量1X 和2X 的协方差和相关系数。
⑶ 判断1X 和2X 是否相互独立。
2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。
2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号目前工资 (美元)受教育年限(年)初始工资 (美元)工作经验(月)11 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。
2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1~(,p N nX μΣ)。
2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。
2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。
课程名称:应用多元统计学英文名称:Applied Multivariate Statistical Analysis课程编号:180018开课学期:第5学期学分/周学时:3/54课程类型:学科类方向性课程先修课程:概率论数理统计选用教材:《应用多元统计分析》朱建平主编2006.08 科学出版社主要参考书:多元统计分析引论张尧庭,方开泰97 科学出版社一、课程性质、目的与任务随着计算机应用的广泛和深入,多元统计分析已在包括社会、经济等人文学科在内的许多领域,愈显得重要和光彩。
作为知名大学重点学科得学生,应该知其概貌,懂得相关的必要理论且掌握一些常用的分析方法,为其就业与继续深造打下必要而有用的基础。
为了让学生较系统、全面地了解多元统计分析内容,并掌握多元统计分析的基本方法,我们将按照高等学校大学生的培养目标,有计划、有步骤地讲授《应用多元统计分析》的基本理论方法。
其目的是,在该课程讲授过程中,使学生从学习理论中看到多元统计分析方法的实用价值,通过实证分析,让学生掌握数据处理的多元统计分析方法。
二、教学基本要求根据以往学生的教学实践,现将该课程教学的基本要求概括如下:1、为夯实学习基础,先重点理解一元统计分析(数理统计)的相关知识要点与基本分析工具。
由于该课程需要用到较广且有一定深度的矩阵代数知识,所以在授课进程中相机进行复习和补充。
2、为尽量减轻学生对多元且随机对象得困惑,从一开始就着手建立一套较为严格的符号含义与表叙规则。
让同学们逐渐熟悉“胖字母”(多元对象)并对之产生好感,体会面对多元现象时如何化繁为简抓住要点科学表述的必要性。
3、涉及多元,自然升入高维空间。
虽超传统三维,但对分析对象的几何形式处理,不是不能而是更有必要,因此需要探讨和引入高维随机空间,并考察其与传统高维欧氏空间的位置关系和联系。
4、没有背景的方法和技巧死水一潭,而背景不是解说文字的堆砌。
抓住对空间形式结构的处理,让许多从字面上看十分专深的概念和方法,在中学的几何课堂里找到他们的身影,从而使学生有一种温故而知新的情感,自然产生学习新知识的兴趣和动力。
厦门大学《应用多元统计分析》第02章_多元正态分布的参数估计第一节引言多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵。
例如在研究公司的运营情况时,要考虑公司的获利能力、资金周转能力、竞争能力以及偿债能力等财务指标;又如在研究国家财政收入时,税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等都是需要同时考察的指标。
显然,如果我们只研究一个指标或是将这些指标割裂开分别研究,是不能从整体上把握研究问题的实质的,解决这些问题就需要多元统计分析方法。
为了更好的探讨这些问题,本章我们首先论述有关随机向量的基本概念和性质。
在实用中遇到的随机向量常常是服从正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于正态分布。
因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。
在多元统计分析中,多元正态分布占有很重要地位,本书所介绍的方法大都假定数据来之多元正态分布。
为此,本章将要介绍多元正态分布的定义和有关性质。
然而在实际问题中,多元正态分布中均值向量和协差阵通常是未知的,一般的做法是由样本来估计。
这是本章讨论的重要内容之一,在此我们介绍最常见的最大似然估计法对参数进行估计,并讨论其有关的性质。
第二节基本概念一、随机向量我们所讨论的是多个变量的总体,所研究的数据是同时p个指标(变量),又进行了n次观测得到的,我们把这个p指标表示为X1,X2,…,Xp,常用向量X=(X1,X2,…,XP)''表示对同一个体观测的p个变量。
这里我们应该强调,在多元统计分析中,仍然将所研究对象的全体称为总体,它是由许多(有限和无限)的个体构成的集合,如果构成总体的个体是具有p个需要观测指标的个体,我们称这样的总体为p维总体(或p元总体)。
上面的表示便于人们用数学方法去研究p维总体的特性。
这里“维”(或“元”)的概念,表示共有几个分量。