厦门大学《应用多元统计分析》试题B答案
- 格式:pdf
- 大小:184.03 KB
- 文档页数:4
统计学试卷B (含答案及评分标准)10分。
(将唯一正确答案的序号写在括号内)1.产品质量的检查应该采用( )。
A.重点调查的方法;B.典型调查的方法;C.普查的方法;D.抽样检验的方法;2.我国的统计调查方法体系中,作为“主体”的是( )A.经常性抽样调查;B.必要的统计报表;C.重点调查及估计推算等;D.周期性普查;3.某商场销售额2004年与2003年相比为120%,同期价格水平下降2%,则该商场销售量指数为( )A.133%; B.122.4%; C.122%; D.118%;4.在具有报告期实际商品流转额和几种商品价格的个体指数资料的条件下,要确定价格的平均变动,应该使用( )指数。
A.综合;B.加权算术平均;C.加权调和平均;D.可变构成;5.复相关系数的取值区间为:( )A. 11≤≤-R ;B. 1≤≤∞-R ;C.10≤≤R ;D.∞≤≤-R 1;6.在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,则样本容量( )。
A.扩大为原来的4倍B. 扩大为原来的2倍C.缩小为原来的二分之一D. 缩小为原来的四分之一7.在长期趋势分析中,如果被研究现象的各年逐期增长量大致相同,则该现象可拟合( )模型。
A.直线; B.二次曲线; C.指数曲线; D.双曲线;8.随着收入水平的提高,下列指标中呈下降趋势的有:( )A.恩格尔系数;B.基尼系数;C.全员劳动生产率;D.投资率9.下列指标中,反映分布离散程度的指标有:( )A.几何平均数;B.决定系数;C.变异系数;D.回归系数;10.在其他条件相同的前提下:不重复抽样误差( )A. 大于重复抽样误差;B. 小于重复抽样误差C. 等于重复抽样误差;D. 与重复抽样误差何者更大无法判定二、多项选择题每小题2分共10分(正确答案包含1至5项,请将正确答案的序号写在1. 常见的离散型分布有:()A.正态分布B.二项分布C.t分布D.F 分布E.卡方分布2.下列定理中,哪两个属于统计推断的数理基础()。
应用多元统计分析课后答案第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1a x b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 12122222()()2[()2()]()()()()dd cc d c x a x b a t x a t dt b a d c b a d c ------=+----⎰2212122222()()[()2()]1()()()()d cdcd c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布,则均值为2b a +,方差为()212b a -。
厦门大学应用多元统计分析试题B厦门大学[应用多元统计分析]试题B厦门大学《多元统计分析》试卷B经济学院计统系级本科生一、判断并改错(每题3分)1. 距离判别是Bayes判别的一种特例。
()2. 系统聚类法中的“离差平方和法”的基本思想来源于同类样品的离差平方和应该较小,不同类样品之间的离差平方和应该较大。
()3. 在对因素A和因素B进行相应分析之前没有必要进行独立性检验。
()4. 相应分析反应的是列变量和行变量的交叉关系。
()5. 典型相关分析是研究多组变量之间相关关系的一种多元统计方法。
()二、(12%)设X(1),K,X(n)是来自Np(μ,Σ)的随机样本,ci≥0(i=1,L,n),∑ci=1,令Z=∑ciX(i)。
试证明:1)Z是μ的无偏估计量;2)Z~Np(μ,c'cΣ),其中c=(c1,L,cn)'。
三、简述题(第1题6分,第2题8分,第3题6分,第4题6分) 1. 在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。
2. 比较主成分分析与因子分析的异同点。
3. 简述相应分析的基本思想。
4. 简述典型相关分析的基本思想。
四、计算题(第1题10分,第2题15分,第3题10分,第4题10分) 1. 设有两个正态总体G1和G2,已知:⎡10⎡⎡20⎡⎡1812⎡⎡20−7⎡,μ(1)=⎡⎡,μ(2)=⎡⎡,Σ1=⎡Σ=⎡2⎡⎡, 1525123275−⎡⎡⎡⎡⎡⎡⎡⎡⎡20⎡试用距离判别法判断:样品:X=⎡⎡,应归属于哪一类?⎡20⎡2.下面是5个样品两两间的距离矩阵⎡⎡0⎡(0)⎡ D90⎡7100⎡试用最长距离法作系统聚类,并画出谱系聚类图。
⎡0⎡4⎡=⎡6⎡⎡1⎡⎡6⎡3. 设三元总体X的协方差阵为Σ=⎡ρσ2⎡0⎡ρσ2σ2ρσ20⎡⎡ρσ2⎡,试求总体主成4. 设标准化变量X1,X2,X3的协差阵(即相关阵)为⎡1.000.630.45⎡⎡, R=⎡0.631.000.35⎡⎡⎡⎡0.450.351.00⎡⎡R的特征值和相应的正则化特征向量分别为:λ1=1.9633,λ2=0.6795,λ3=0.3572,l1=(0.6250,0.5932,0.5075)'l2=(−0.2186,−0.4911,0.8432)'l3=(0.7494,−0.6379,−0.1772)'1)计算因子载荷矩阵A,并建立因子模型; 2)计算公因子Fj的方差贡献g2 j(j=1,2,3),并说明其统计意义。
多元统计分析课后练习答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z 标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。
思考与练习9.1 什么是典型相关分析?简述其基本思想。
9.2 什么是典型变量?它具有哪些性质?9.3 试析一组变量的典型变量与其主成分的联系与区别。
9.4 简述典型相关分析中载荷分析的内容及作用。
9.5 简述典型相关分析中冗余分析的内容及作用。
9.6 设X 和Y 分别是p 维和q 维随机向量,且存在二阶距,设p ≤q 。
它们的第i 对典型变量分别为()i a X ′、()i b Y ′,典型相关系数为i λ,(1,,)i p =L 。
令*X CX l =+,*Y DY m =+,其中C 、D 分别为,p p q q ××阶非奇异阵,、分别为p 维、q 维随机向量,试证明l m1⑴ **X Y 、的第i 对典型变量为1()i C a X −*′、1()i D b Y −*′。
⑵ 1()*i C a X −′与1()*i D b Y −′的典型相关系数为i λ。
9.7 对140名学生进行了阅读速度1x 、阅读能力2x 、运算速度1y 和运算能力2y 的四种测验,所得成绩的相关系数阵为10.030.240.590.0310.060.07R 0.240.0610.240.590.070.241⎡⎤⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦= 试对阅读本领与运算本领之间进行典型相关分析。
9.8 某年级学生的期末考试中,有的课程闭卷考试,有的课程开卷考试。
44名学生的成绩如下表:闭卷 开卷 闭卷 开卷力学 物理 代数分析统计力学物理代数分析 统计 1X 2X 3X 4X5X1X 2X3X 4X5X77 82 676781637880708175 73 7166815572637068 63 63 6570635361726473 51 67 6565685970686256 62 60 5862706472606245 52 64 6063545567596244 50 50 6455636563585637 31 55 6057766064565440 44 69 5353534269615545 62 46 6157453149626362 44 61 5262454941614964 12 58 6163674953496247 54 49 5647535453465944 44 56 5561361844505781 46 52 6550353245495764 30 69 5052454649535937 40 27 5461613142485468 36 59 51455156405654 5 46 56 5749324542555640 42 60 5449334063535425 23 55 5953444848495137 41 63 4946344652534140试对闭卷( 21X ,2X )和开卷(3X ,4X ,5X )两组变量进行典型相关分析。
一、填空题:1、多元统计剖析是运用数理统计方法来研究解决多指标问题的理论和方法 .2、回归参数明显性查验是查验解说变量对被解说变量的影响能否著.3、聚类剖析就是剖析怎样对样品(或变量)进行量化分类的问题。
往常聚类分析分为Q型聚类和R型聚类。
4、相应剖析的主要目的是追求列联表行要素A和列要素B的基本剖析特点和它们的最优联立表示。
5、因子剖析把每个原始变量分解为两部分要素:一部分为公共因子,另一部分为特别因子。
6、若x( ): N P( ,),=1,2,3 .n且互相独立,则样本均值向量x 听从的散布为 _ x ~N(μ,Σ /n)_。
二、简答1、简述典型变量与典型有关系数的观点,并说明典型有关剖析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间拥有最大的有关系数。
选用和最先精选的这对线性组合不有关的线性组合,使其配对,并选用有关系数最大的一对,这样下去直到两组之间的有关性被提取完成为止。
被选出的线性组合配对称为典型变量,它们的有关系数称为典型有关系数。
2、简述相应剖析的基本思想。
相应剖析,是指对两个定性变量的多种水平进行剖析。
设有两组要素A和B,此中要素 A 包括 r 个水平,要素 B 包括 c 个水平。
对这两组要素作随机抽样检查,获得一个 rc 的二维列联表,记为。
要追求列联表列要素 A 和行要素 B 的基本剖析特点和最优列联表示。
相应剖析即是经过列联表的变换,使得要素 A和要素 B 拥有平等性,进而用同样的因子轴同时描绘两个要素各个水平的情况。
把两个要素的各个水平的情况同时反应到拥有同样坐标轴的因子平面上,进而获得要素 A 、 B 的联系。
3、简述费希尔鉴别法的基本思想。
从 k 个整体中抽取拥有 p 个指标的样品观察数据,借助方差剖析的思想结构一个线性鉴别函数系数:确立的原则是使得整体之间差别最大,而使每个整体内部的离差最小。
将新样 品的 p 个指标值代入线性鉴别函数式中求出 值,而后依据鉴别必定的规则,就能够鉴别新的样品属于哪个整体。
第二章2.1 试述多元联合分布和边缘分布之间的关系。
设,是p维随机向量,称由它的q(<p)个分量组成的子向量,的分布为的边缘分布,相对地把的分布称为联合分布。
当的分布函数为F,时,的分布函数即边缘分布函数为F,=P()= F,当X有分布密度f(,)则也有分布密度,即边缘密度函数为:f(,)=(,)2.2 设随机向量服从二元正态分布,写出其联合分布密度函数和各自的边缘密度函数。
联合分布密度函数,0 , 其他==()所以指数部分变为令t== exp[] exp[] ,=0 ,其他 同理,exp[] ,=0 ,其他2.3 已知随机向量 的联合分布密度函数为,其中, 。
求:(1) 随机变量各自的边缘密度函数、均值与方差。
解:==同理,==同理可得()22dc x E +=同理可得()()1222d c x D -=(2)随机变量的协方差和相关系数。
E(==E(==E(==E(=D(E(D(E(Cov E(E(=.===(3)判断是否独立。
不相互独立。
2.4设随机向量,服从正态分布,已知其协差阵为对角阵,证明的分量是相互独立的随机变量。
Σ= ΣΣΣΣ与不相关又 ,服从正态分布与 相互独立。
( , , , , , ) 2.5解: 依据题意,X=E(X)=D(X)=注:利用 11p n n ⨯'=1X X , S 1()n n n n''=-11X I X 其中 1001n ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦I 在SPSS 中求样本均值向量的操作步骤如下:1. 选择菜单项Analyze →Descriptive Statistics →Descriptives ,打开Descriptives 对话框。
将待估计的四个变量移入右边的Variables 列表框中,如图2.1。
图2.1 Descriptives 对话框2. 单击Options 按钮,打开Options 子对话框。
在对话框中选择Mean 复选框,即计算样本均值向量,如图2.2所示。