厦门大学《应用多元统计分析》试题A
- 格式:pdf
- 大小:147.10 KB
- 文档页数:2
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?(),123设X=xx x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ⎛⎫∑==∑=⎪⎝⎭+-1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________i i i i X N i W X X μμμ='∑=--∑、设则=服从。
()1234433,492,3216___________________X x x x R -⎛⎫ ⎪'==-- ⎪ ⎪-⎝⎭=∑、设随机向量且协方差矩阵则它的相关矩阵4、__________, __________,________________。
215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。
(),123设X=x x x 的相关系数矩阵通过因子分析分解为211X h =的共性方差111X σ=的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R ⎛⎫- ⎪⎛⎫⎛⎫ ⎪-⎛⎫ ⎪ ⎪⎪=-=-+ ⎪ ⎪ ⎪ ⎪⎝⎭ ⎪ ⎪ ⎪⎝⎭⎝⎭ ⎪ ⎪⎝⎭12332313116421(,,)~(,),(1,0,2),441,2142X x x x N x x x x x μμ-⎛⎫⎪'=∑=-∑=-- ⎪ ⎪-⎝⎭-⎛⎫+ ⎪⎝⎭、设其中试判断与是否独立?11262(90,58,16),82.0 4.310714.62108.946460.2,(5)( 115.6924)14.6210 3.17237.14.5X S μ--'=-⎛⎫ ⎪==-- ⎪ ⎪⎝⎭0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
多元复习1、多元统计分析是运用数理统计方法来解决多指标问题的理论和方法。
2、多元分析研究的是多个随机变量和相关关系的统计总体。
3、如果A与B是两个P×P维的方阵,则AB与BA有完全相同的特征值。
4、随机向量X的协方差矩阵一定是非负定矩阵。
5、若A为P阶对称矩阵,则存在正交矩阵T与对角矩阵∧,则三者的关系有A=T∧T’。
6、设x是多元向量,服从正太分布即X~,a为P维常熟向量,则其线性型a’x服从一元正态分布,即a’x~。
7、方差相同的两个随机变量的差与和是不相关关系。
8、协方差和相关系数是变量间离散程度的一种变量,并不能刻画变量间可能存在的关联程度的关系。
9、变量的类型按尺度划分为间隔变量、有序变量、名义变量类型。
10、公共因子方差与特殊因子方差之和为1。
11、聚类分析是建立一种分析方法,它将一批样品或变量按照它们在性质上的亲疏关系进行科学的分类。
12、聚类分析是分析如何对样品或变量进行量化分析,通常分为Q型聚类和R型聚类。
13、聚类分析中Q型聚类是对样品进行聚类,R型聚类是对变量进行聚类。
14、进行判别分析时,通常指定一种判别规则用来判定新样品的归属,常见的判别准则有:费希尔判别准则、贝叶斯判别准则。
15、费希尔判别法就是要找P个变量组成的线性判别函数使得各组内点的离差尽可能接近,而不同组间的点尽可能疏远。
16、当X~,则-)服从卡方分布,即-) ~。
17、威尔克斯统计量表达式:∧=。
18、霍特林统计量表达式:。
19、两个变量间的平方马氏距离:;总体的马氏距离:。
20、方差相等的两个随机变量的关系:。
21、几个变量间服从正态分布,各自独立,样品的均值向量服从正态分布。
22、从代数观点看主成分是P个原始相关变量的线性组合。
23、变量共同度是指因子载荷矩阵中的第i行元素的平方和。
24、因子分析是指把每个原始变量分为两部分因素,一部分是公共因子,另一部分是特殊因子。
1、判别分析的目标。
答:判别分析的目标有两个:一是根据已知所属组的样本给出判别函数,并制定判别规则,再依此判断(或预测)每一新样品应归属的组别。
1 、设 X ~ N2 ( ,), 其中 X( x1 , x 2 ),( 1 ,212 ),,1则 Cov( x1x 2 , x1x 2 )=____.102、设X i ~N 3 (,), i 1, L,10,则 W =( X i)( X i)i 1服从_________。
4433、设随机向量X x1x2x3, 且协方差矩阵 4 9 2 ,3 2 16则它的相关矩阵R___________________4、设 X= x1x2x3,的相关系数矩阵通过因子分析分解为112330.93400.1280.4171R100.4170.9340.83530.8940.8940.027 0.83500.4472010.4470.10332__________,__________,X1的共性方差 h1X1的方差11公因子 f 1对 X的贡献 g12________________。
5、设 X i , i 1,L ,16 是来自多元正态总体N p (, ), X 和 A分别为正态总体N p ( ,)的样本均值和样本离差矩阵 , 则T 215[4( X)] A 1[4( X)] ~ ___________。
1642、设( x1 , x2 , x3) ~ N3(, ),其中(1,0, 2) ,44 1 ,1X214试判断 x12 x3与x2x3是否独立?x12、对某地区农村的 6 名 2 周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下 , 根据以往资料 , 该地区城市 2周岁男婴的这三个指标的均值0(90,58,16), 现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。
82.0 4.310714.62108.9464其中 X60.2 ,(5 S ) 1( 115.6924)114.6210 3.17237. 376014.58.946437.376035.5936 (0.01,F 0.01 (3, 2)99.2, F 0.01 (3,3)29.5,F0.01 (3, 4)16.7)、设已知有两正态总体G与 G,且12,24,1211,3126219而其先验概率分别为q1q20.5,误判的代价C (2 1)4;e ,C(1 2)e试用判别法确定样本X 3属于哪一个总体?Bayes514、设X( X1 , X2 , X3 , X4 )T,协方差阵1~ N (0, ),0111(1)试从Σ出发求 X 的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。
厦门大学《多元统计分析》试卷A
经济学院计统系 级 专业 本科生
一、(20%)判断题
1、“p 维随机向量1(,...,)p X X X ′=的协差阵及相关阵一定是非负定阵”是否正确,并说明理由。
2、
“距离判别是Bayes 判别的一种特例”是否正确,为什么? 二、(15%)设标准化变量12,,3X X X 的协差阵(即相关阵)为
1.000.630.450.63 1.000.350.450.35 1.00⎡⎤
⎢⎥=⎢⎥
⎢⎥⎣⎦
R , R 的特征值和相应的正则化特征向量分别为:
'11'22'
331.9633,(0.6250,0.5932,0.5075)0.6795,(0.2186,0.4911,0.8432)0.3572,
(0.7494,0.6379,0.1772)l l l λλλ====−−==−− 要求:
1)计算因子载荷矩阵A ,并建立因子模型;
2)计算公因子的方差贡献,并说明其统计意义。
j F 2(1,2,3j g j =)三、(10%)设三元总体的协方差阵为
X 2
22
222
200σρσρσσρσρσσ⎡⎤⎢
⎥
=⎢⎥⎢⎥⎣
⎦
Σ,试求总体主成分(0ρ<≤。
四、(15%)金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析
员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布),今测得两个总体的若干数据,并由这些数据得到
⎟⎟⎠⎞⎜⎜⎝⎛=62ˆ1μ⎟⎟⎠⎞⎜⎜⎝⎛=24ˆ2μ⎟
⎟⎠⎞⎜⎜⎝⎛=∑4111ˆ 对某一金融分析员进行判别是否能满足这项工作。
进行测量得到两个指标为
,且当两组先验概率分别为)4,5(′=X 269.01=q 与731.02=q ,损失相同。
问该金融分析员满足要求吗?为什么?
五、(6%)设是来自的随机样本,,
令。
试证明:
(1)(),,n X X K ()i i c X (,)p N μΣ0
0(1,,),
1n
i i
i c i n c
=≥==∑L 0
n
i ==∑Z 1)是Z μ的无偏估计量;
2)~,其中。
Z '(,)p N μc c Σ'1(,,)n c c =c L 六、(10%)简述相应分析的基本思想。
七、(12%)针对一个总体均值向量的检验而言,在协差阵已知和未知的两种
情形下,如何分别构造的统计量?
Σ八、(12%)针对典型相关分析而言,简述典型变量与典型相关系数的概念。