【最新】应用多元统计分析课后习题答案高惠璇第七章习题解答
- 格式:ppt
- 大小:909.50 KB
- 文档页数:19
7.1 设随机变量12X(X ,X )'=的协差阵为21,12⎡⎤∑=⎢⎥⎣⎦试求X的特征根和特征向量,并写出主成分。
解:先求X的特征根λ,λ满足方程:21012-λ=-λ,即2(2)10-λ-=,因此两个特征根分别为123, 1.λ=λ=设13λ=对应的单位特征向量为()1121a ,a ',则()1121a ,a '满足:1121a 110a 110-⎛⎫⎡⎤⎛⎫= ⎪ ⎪⎢⎥-⎣⎦⎝⎭⎝⎭,故可以取1121a a ⎛⎛⎫ = ⎪ ⎝⎭ ⎝,其对应主成分为:112F X X 22=+;设21λ=对应的单位特征向量为()1222a ,a ',则()1222a ,a '满足:1222a 110a 110⎛⎫⎡⎤⎛⎫=⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭,故可以取1222a a ⎛⎫⎛⎫ ⎪= ⎪ ⎝⎭- ⎝,其对应的主成分为:212F 22=-.7.2设随机变量123X (X ,X ,X )'=的协差阵为120250,002-⎡⎤⎢⎥∑=-⎢⎥⎢⎥⎣⎦试求X的主成分及主成分对变量X的贡献率。
解:先求X的特征根λ,λ满足方程:12025002-λ---λ=-λ,即()2(2)610-λλ-λ+=,因此三个特征根分别为1235.8284,2,0.1716λ=λ=λ=设1 5.8284λ=对应的单位特征向量为()112131a ,a ,a ',则它满足:1121314.828420a 020.82840a 000 3.8284a 0--⎡⎤⎛⎫⎛⎫⎪ ⎪⎢⎥--=⎪ ⎪⎢⎥ ⎪ ⎪⎢⎥-⎣⎦⎝⎭⎝⎭,故可以取 112131a 10.38271a 2.41420.92392.6131a 00⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪=-=- ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,其对应主成分为: 112F 0.3827X 0.9239X =-,其贡献率为5.828472.86%5.828420.1716=++;设22λ=对应的单位特征向量为()122232a,a ,a ',则它满足:122232120a 0230a 0000a 0--⎡⎤⎛⎫⎛⎫ ⎪ ⎪⎢⎥-= ⎪ ⎪⎢⎥ ⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭,故可以取122232a 0a 0a 1⎛⎫⎛⎫⎪ ⎪= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭,其对应主成分为: 23F X =,其贡献率为225%5.828420.1716=++;设30.1716λ=对应的单位特征向量为()132333a ,a ,a ',则它满足:1323330.828420a 02 4.82840a 000 1.8284a 0-⎡⎤⎛⎫⎛⎫⎪ ⎪⎢⎥-=⎪ ⎪⎢⎥ ⎪ ⎪⎢⎥⎣⎦⎝⎭⎝⎭,故可以取132333a 10.92391a 0.41420.38271.0824a 00⎛⎫⎛⎫⎛⎫⎪ ⎪ ⎪== ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,其对应主成分为: 312F 0.9239X 0.3827X =+,其贡献率为0.17162.14%5.828420.1716=++.7.3 设随机变量12X (X ,X )'=的协差阵为14,4100⎡⎤∑=⎢⎥⎣⎦试从∑和相关阵R出发求出总体主成分,并加以比较。
第七章因子分析班级:姓名学号:7.7利用因子分析方法分析下列30个学生成绩的因子构成,并分析各个学生较(2则由上表可写出每个原始变量的因子表达式:X1=-0.662F1+0.503F2;X2=-0.53F1+0.478F2;X6=0.816F1+0.498F2;(4)由Rotated Component Matrix表可以给出旋转后的因子载荷矩阵(见下表),第一个公共因子在指标语文、历史、英语上有较大的载荷,说明这三个指标有较强的相关性,可以归为一类,从分科情况来看,这三个指标属于学生较适合学文学科;第二个公共因子在指标为数学、物理、化学上有较大载荷,同样可以归为一类,这三个指标同属于学生较适合学理科。
(5)根据因子得分系数矩阵与原始变量的标准化值可以计算每个观测值的各F1=F2=0.439X1+0.4X2+0.484X3-0.01X4+0.073X5+0.169X6;则将学生成绩按顺序对应分别带入上面两个式子可以判定,当F1>F2时,该学生适合学文科,当F1<F2时,该学生适合学理科。
24、26的学生适合学文科;学生标号为:2、6、7、9、10、11、13、14、17、18、21、25、27、28、29、30的学生适合学理科。
7.8某汽车组织欲根据一系列指标来预测汽车的销售情况,为了避免有些指标之间的相关关系影响预测结果,须首先进行因子分析来简化系统。
下表是抽查欧洲某汽车市场7个品牌不同型号的汽车的各种指标数据,试用因子分析法找出其简X1=0.794F1;X2=0.879F1;X9=-0.893F1;(4)因为只有一个因子,因此不能被旋转。
(5)根据因子得分系数矩阵与原始变量的标准化值可以计算每个观测值的各因子的得分数,则根据下表可得出该题中的因子得分表达式即为所求的指标系统为:27X8-0.132X9。
7.10 根据习题5.11中2003年我国省会城市和计划单列城市的主要经济指标数据,利用因子分析法对其进行排序和分类,并与聚类分析的结果进行比较。
2(d c)(x 1 a)x 2 (b a)2(d c)2 2[(b a )(X 2 c) 2(X 1 a )(X 2 c)] (b a)2(d c)2dx 22(d c)(x.| a)x 222~(b a) (d c) c2[(b a)t 2(X 1 a)t]2 2 (b a) (d c)dt 2(d c)(x-i a)x 22 2(b a) (d c)所以d c2 2(b a) (d c) o2 2[(b a)t 2(X 1 a)t ] 第二章2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,X (X !,X 2^|X p )的联合分布密度函数是-个p 维的函数,而边际分布讨论是 X (X i ,X 2」||X p)的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量(X 1 X 2)服从二元正态分布,写出其联合分布。
其中 a X 1 b , c X 2 d 。
求(1 )随机变量X 1和X 2的边缘密度函数、均值和方差;(2) 随机变量X 1和X 2的协方差和相关系数; (3) 判断X 1和X 2是否相互独立。
(1)解:随机变量 X 1和X 2的边缘密度函数、均值和方差;2[(d c)(x-i a) (b a)(x 2 c) 2(x 1 a)(x 2c)]2 2(b a) (d c)id解:设(X 1 X 2)的均值向量为口 ,协方差矩阵为21;,则其联合分布密度函数为21/21f(X).2-2.3已知随机向量(X 1f(X 1,X 2)型21122 2exp口)2112 2 2(X口)。
X 2) c)(X 的联合密度函数为a) (b a)(X 2c) 2 2(b a) (d c)2(X 1 a)(x 2 c)] dx(C d)(b a)36COV(N,X2)X i X2(3)解:判断X i和X2是否相互独立。
X i 和X2 由于f(X!,X2) f x,X i) f x,(X2),所以不独立。