多元统计分析课程设计题目知识分享
- 格式:pdf
- 大小:1.27 MB
- 文档页数:13
多元统计分析学习笔记——概论及数据描述知识点回顾这个系列的笔记是疫情期间在家听的⽹络课程——多元统计分析,由经院刘婧媛、钟威两位⽼师主讲,从中国⼤学mooc上可以搜到。
笔记将对课程的主要知识点进⾏总结和整理,记录⼀些课程截图,也会从⽹上搜集⼀些相关的资料,⽬的是加深认识,防⽌遗忘。
今后如果对相关内容有了更深的理解和认识,可能会对内容进⾏更正和补充。
本⽂为前两章的总结多元统计分析是同时考量多个变量,从多元数据集中获取信息的统计⽅法。
⼀个经典的例⼦就是鸢尾花数据集,其中的每个样本包含了四个特征和⼀个对应的标签,如下图所⽰,通过统计分析,⼈们可以找到鸢尾花类型(标签)与四个特征之间的关系,从⽽实现未来利⽤新数据已知的特征变量对未知的花类型进⾏预测的⽬标。
多元统计分析在市场营销、⾦融⾏业、医疗及学术研究等各个领域都有着⼴泛的应⽤。
1 随机变量数据描述样本就是通过采样获得的部分数据点。
随机采样的样本均值可以⽤来估计总体均值。
样本⽅差是对总体⽅差的⽆偏估计。
对于多元随机向量,样本的期望是由各个分量的期望组成的向量随机向量:由多个随机变量组成的向量。
⼀般⽤来代表整个数据集对应的样本向量Y = (y1,……,y n)。
随机样本:是指总体中的每个个体都有同等的机会被选中。
⼀般代表数据集中任意⼀个样本对应的特征向量。
y n = (y n1,……,y np)对于⼆元随机变量,协⽅差等于变量乘积的均值减去变量均值的乘积。
变量间正相关则协⽅差cov(x,y) > 0,负相关cov(x,y) < 0,不相关则cov(x,y) = 0,此处所谓正相关负相关皆属于线性相关关系。
相关系数实际上是消除了量纲的协⽅差,将度量尺度标准化为[1,-1]区间,其中σ=0时说明X与Y不相关(线性独⽴)。
值得注意的是,σ=0时只能说明X与Y线性独⽴,⽽仍有可能以某种⾮线性的⽅式关联,但如果X和Y服从⼆元正态分布,并满⾜σ=0,则可认为是相互独⽴的。
多元统计分析复习题一、填空题1、设有n 个一维数据:12,,...,n x x x ,则均值x -=________,方差2_____________s =。
若将它们从小到大记为(1)(2)(),,...,n x x x ,中位数M=______________________,极差R=______________。
2、请指出下面SPSS 软件操作分别代表多元统计分析中什么分析: (1)Analysis→Classify→Discriminant (2)Analysis→Data Reduction →Factor3、系统聚类法是在聚类分析的开始,每个样本自成 ________ ;然后 ,按照某种方法度量所有样本之间的亲疏程度,并把最相似的样本首先聚成一小类;接下来,度量剩余的样本和小类间的___________,并将当前最接近的样本或小类再聚成一类;如此反复,直到所有样本聚成一类为止。
4、设12(0,1),,,...,in N ξξξξ且相互独立,则n21n212_______;________ii ii ξξξ==∑∑。
5、在线性回归模型中,设因变量Y 与自变量121,,...,p XX X -的n 组观测数据为1,1(;,...,)(1,2,...,i i i p y x x i n -=),记11nii y y n ==∑,线性拟合值0111,1ˆˆˆˆ...i i p i p y x x βββ--=+++,则总离差平方和___________SST =,残差平方和___________SSE =,回归平方和__________SSR =,三者之间关系为___________________。
6、设x,y 是来自均值向量为μ,协方差矩阵为∑的总体G 的两个样品,则x,y之间的马氏平方距离2(,)______________d x y =;x 与总体G 的马氏平方距离2(,)______________d x G =。
填空题:1、费希尔(Fisher)判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上。
2、因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。
3、K均值聚类分析的基本思想是将每一个样品分配给最接近业壶些直的类中。
4、对应分析是将R型因子分析Q型因子分析结合起来进行的统计分析方法。
5、总体方差未知的情况下,采用样本方差代替总体方差的方法进行计算。
6、主成分分析数学模型中的正交变换,在几何上就是作一个坐标旋转7、设X、N2 ( U , N),其中X=(》1,》2),号),则CovQq +》2,*1 - *2)= _0__8、判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判另U法、Bayes判另U法、逐步判另U法9 多元正态分布的任何边缘分布为正态分布10、应用多元统计分析方法用于解决多指标问题,聚类分析就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为Q型聚类和R型聚类。
11、总离差平方和可以分解为回归离差平方和和剩余离差平方和两个部分,各自的自由度为(P )和(n-p-1),其中回归离差平方和在总离差平方和中所占比重越大,则线性回归效果越显著。
12、系统聚类分析方法有最短距离法、最长距离法、中间距离法、重心法、类平均统和可变类平均法。
13、典型相关分析是研究两组变量之间相关关系的一种多元统计方法14、因子分析中因子载荷系数叫,•的统计意义是:(第i个变量与第j个公因子的相关系数)15、相应分析的特点是研究的变量是定性的16、公共因子方差与特殊因子方差之和为o17、设Z 是总体X=(X”…,乂皿)的协方差阵,X 的特征根人。
=1,2,..・田)与对应的单位正交化特征向量% =(%,%2,,则第一主成分的表达式=% ]X| + %2、2 + ・•• + /mX"],方差为2]18、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示19聚类分析一是分析如何对样品或变量进行量化分类的问题。
一、什么是多元统计分析❖多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广。
❖多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律的一门统计学科。
二、多元统计分析的内容和方法❖1、简化数据结构(降维问题)将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。
(1)主成分分析(2)因子分析(3)对应分析等❖2、分类与判别(归类问题)对所考察的变量按相似程度进行分类。
(1)聚类分析:根据分析样本的各研究变量,将性质相似的样本归为一类的方法。
(2)判别分析:判别样本应属何种类型的统计方法。
例5:根据信息基础设施的发展状况,对世界20个国家和地区进行分类。
考察指标有6个:1、X1:每千居民拥有固定电话数目2、X2:每千人拥有移动电话数目3、X3:高峰时期每三分钟国际电话的成本4、X4:每千人拥有电脑的数目5、X5:每千人中电脑使用率6、X6:每千人中开通互联网的人数❖3、变量间的相互联系一是:分析一个或几个变量的变化是否依赖另一些变量的变化。
(回归分析)二是:两组变量间的相互关系(典型相关分析)❖4、多元数据的统计推断点估计参数估计区间估计统 u检验计参数 t检验推 F检验断假设相关与回归检验卡方检验非参秩和检验秩相关检验❖1、假设检验的基本原理小概率事件原理❖ 小概率思想是指小概率事件(P<0.01或P<0.05等)在一次试验中基本上不会发生。
反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;反之,则认为假设成立。
❖ 2、假设检验的步骤 (1)提出一个原假设和备择假设❖ 例如:要对妇女的平均身高进行检验,可以先假设妇女身高的均值等于 160 cm (u=160cm )。
这种原假设也称为零假设( null hypothesis ),记为 H 0 。
多元统计分析(1)题目:多元统计分析知识点研究生专业指导教师完成日期 2013年 12月目录第一章绪论 (1)§1.1什么是多元统计分析 ....................................................................................................... 1 §1.2多元统计分析能解决哪些实际问题 ............................................................................... 2 §1.3主要内容安排 ................................................................................................................... 2 第二章多元正态分布 .. (2)§2.1基本概念 ........................................................................................................................... 2 §2.2多元正态分布的定义及基本性质 .. (8)1.(多元正态分布)定义 ................................................................................................ 9 2.多元正态变量的基本性质 (10)§2.3多元正态分布的参数估计12(,,,)p X X X X '= (11)1.多元样本的概念及表示法 (12)2. 多元样本的数值特征 ................................................................................................ 123.μ和∑的最大似然估计及基本性质 (15)4.Wishart 分布 (17)第五章 聚类分析 (18)§5.1什么是聚类分析 ............................................................................................................. 18 §5.2距离和相似系数 . (19)1.Q —型聚类分析常用的距离和相似系数 ................................................................ 20 2.R 型聚类分析常用的距离和相似系数 ...................................................................... 25 §5.3八种系统聚类方法 (26)1.最短距离法 .................................................................................................................. 27 2.最长距离法 .................................................................................................................. 30 3.中间距离法 .................................................................................................................. 32 4.重心法 .......................................................................................................................... 35 5.类平均法 ...................................................................................................................... 37 6.可变类平均法 .............................................................................................................. 38 7.可变法 .......................................................................................................................... 38 8.离差平方和法(Word 方法) (38)第六章判别分析 (39)§6.1什么是判别分析 ............................................................................................................. 39 §6.2距离判别法 (40)1、两个总体的距离判别法 (40)2.多总体的距离判别法 (45)§6.3费歇(Fisher)判别法 (46)1.不等协方差矩阵两总体Fisher判别法 (46)2.多总体费歇(Fisher)判别法 (51)§6.4贝叶斯(Bayes)判别法 (58)1.基本思想 (58)2.多元正态总体的Bayes判别法 (59)§6.5逐步判别法 (61)1.基本思想 (61)2.引入和剔除变量所用的检验统计量 (62)3.Bartlett近似公式 (63)第一章绪论§1.1什么是多元统计分析在自然科学、社会科学以及经济领域中,常常需要同时观察多个指标。
实用多元统计分析相关习题练习题一、填空题1.人们通过各种实践,发现变量之间的相互关系可以分成(相关)和(不相关)两种类型。
多元统计中常用的统计量有:样本均值、样本方差、样本协方差和样本相关系数。
2.总离差平方和可以分解为(回归离差平方和)和(剩余离差平方和)两个部分,其中(回归离差平方和)在总离差平方和中所占比重越大,则线性回归效果越显著。
3.回归方程显著性检验时通常采用的统计量是(S R/p)/[S E/(n-p-1)]。
4.偏相关系数是指多元回归分析中,(当其他变量固定时,给定的两个变量之间的)的相关系数。
5.Spss中回归方程的建模方法有(一元线性回归、多元线性回归、岭回归、多对多线性回归)等。
6.主成分分析是通过适当的变量替换,使新变量成为原变量的(线性组合),并寻求(降维)的一种方法。
7.主成分分析的基本思想是(设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来替代原来的指标)。
8.主成分表达式的系数向量是(相关系数矩阵)的特征向量。
9.样本主成分的总方差等于(1)。
10.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为(方差贡献度)。
主成分的协方差矩阵为(对称)矩阵。
主成分表达式的系数向量是(相关矩阵特征值)的特征向量。
11.SPSS中主成分分析采用(analyze—data reduction—facyor)命令过程。
12.因子分析是把每个原始变量分解为两部分因素,一部分是(公共因子),另一部分为(特殊因子)。
13.变量共同度是指因子载荷矩阵中(第i行元素的平方和)。
14.公共因子方差与特殊因子方差之和为(1)。
15.聚类分析是建立一种分类方法,它将一批样品或变量按照它们在性质上的(亲疏程度)进行科学的分类。
16.Q型聚类法是按(样品)进行聚类,R型聚类法是按(变量)进行聚类。
17.Q型聚类统计量是(距离),而R型聚类统计量通常采用(相关系数)。
《多元统计分析》复习一、填空题1、设k 是常数,x 是随机变量,则()E kx = ;设x ,y 是随机变量,且两者独立,则()V x y +=2、多元正态分布是 在多元情形下的直接推广;最简单的多元正态分布是3、聚类分析可分为 聚类分析和 聚类分析4、在判别分析中,通常用 距离来度量样品到组的距离5、需考虑先验概率和 是贝叶斯判别不同于其他判别法的关键之处6、用于大数据集的一种聚类方法是7、在主成分分析中,第一主成分包含的信息量 ;本质上,主成分分析是一种 方法8、在因子分析中,因子载荷是 的;模型不受 的影响9、在SAS 中,判别分析运用的是 过程10、典型相关分析能够有效地揭示两组变量之间的 关系1、设k 是常数,则()E k = ;设x ,y 是随机变量,则()V x y +=2、一元正态分布在多元情形下的直接推广是 ;最简单的多元正态分布是3、聚类分析可分为 聚类分析和 聚类分析4、在判别分析中,通常用 距离来度量样品到组的距离5、需考虑先验概率和 是贝叶斯判别不同于其他判别法的关键之处6、用于大数据集的一种聚类方法是7、在主成分分析中,第一主成分包含的信息量 ;本质上,主成分分析是一种 方法8、对于典型相关分析,可运用SAS 软件中的 过程进行计算;对于聚类分析,可运用SAS 软件中的 过程进行计算9、在SAS 中,判别分析运用的是 过程10、典型相关分析是研究两组变量之间 关系的统计分析方法1、设k 是常数,x 是随机变量,则()V kx = 。
2、设A 为常数矩阵,b 是常数向量,则()V Ax b += 。
3、设随机向量(0,)q u N I ,μ为p 维常数向量,A 为p q ⨯常数矩阵,若x Au μ=+,则x 。
4、常用的判别分析方法有 、 和 。
5、通常测量变量有三种尺度:间隔尺度、有序尺度和 。
6、因子分析是主成分分析的推广,它也是一种 技术。
7、主成分分析的目的是:(1)变量的降维;(2) 。
1.什么是单变量(一元)分析?什么是多元分析?对多变量资料为什么不能用一元分析代替多元分析?答案:应变量(因变量/反应变量)即分析指标仅一个时:称一元分析或单变量分析。
应变量(因变量/反应变量)即分析指标有多个时:称多元分析/多变量分析。
◆对多变量资料分别进行单变量分析,可能导致①增大犯第Ⅰ类错误的概率②当单变量分析结果不一致时,很难得到一个综合的结论③忽略变量间的相互关系。
◆因此,多元分析与一元分析在使用时是相辅相成的。
◆多元统计分析具有概括和全面考虑的综合能力和特点◆一元分析(单指标)容易分析各指标各组间的关系和差异◆两种结合起来所得结论更丰富2.某研究者对当地40岁以上人群进行调查,收集性别、、年龄与患冠状动脉疾病数据,并进行回归分析,数据的编码及软件分析结果如下,写出回归模型的一般形式,并解释各回归系数(结合值)。
因素性别赋值说明1=男性,0=女性1=段压低<0.1,2=段压低范围在0.1~0.23=段压低范围≥0.2年龄(岁)冠状动脉疾是=1否=0病Y软件分析结果因素常数回归系数-20.207标准误4.562卡方18.666P值0.000值项性别年龄0.2631.6340.0850.6360.6820.0360.1715.7445.5210.6790.0720.017 5.1240.019 1.089答案:20.207+0.263性别+1.6340.085年龄根据软件结果可知,影响冠状动脉疾病患病的因素有和年龄;偏回归系数解释实际是对的解释:的值为5.124,即每增加一个等级,患冠状动脉疾病的风险增加4.124倍(5.124-1))并且的影响大于年龄的影响;年龄值1.089,年龄增大一岁患冠状动脉疾病的风险是原来的1.089倍。
3、测定n例糖尿病人的血糖(Y,),胰岛素(X1)以及生长素(X2,)的数值,均为定量资料。
并建立了血糖对于胰岛素及生长素的多重线性回归方程,Y=17.0018-0.4059X1+0.0977X2.假定经过检验方程有意义,且两个偏回归系数都有统计学意义,请回答:1)多重线性回归对应变量和自变量有哪些要求?答案:Y(应变量)变量服从正态分布的连续性随机变量;自变量x大多数应为连续性变量,可以有少部分的分类变量(两分类、无序多分类和有许多分类)2)请解释两个偏回归系数的含义。
多元统计分析习题与答案多元统计分析是一种在社会科学研究中广泛应用的方法,它通过同时考虑多个变量之间的关系,帮助研究者更全面地理解和解释现象。
在本文中,我将分享一些多元统计分析的习题和答案,希望能够帮助读者更好地掌握这一方法。
习题一:相关分析假设你正在研究一个学生的学习成绩和他们每天花在学习上的时间之间的关系。
你收集了100个学生的数据,学习成绩用分数表示,学习时间用小时表示。
以下是你的数据:学习成绩(X):75, 80, 85, 90, 95, 70, 65, 60, 55, 50学习时间(Y):5, 6, 7, 8, 9, 4, 3, 2, 1, 0请计算学习成绩和学习时间之间的相关系数,并解释其含义。
答案一:首先,我们需要计算学习成绩和学习时间之间的协方差和标准差。
根据公式,协方差可以通过以下公式计算:协方差= Σ((X - X平均) * (Y - Y平均)) / (n - 1)其中,X和Y分别表示学习成绩和学习时间,X平均和Y平均表示它们的平均值,n表示样本数量。
标准差可以通过以下公式计算:标准差= √(Σ(X - X平均)² / (n - 1))根据以上公式,我们可以得出学习成绩和学习时间之间的协方差为-22.5,标准差分别为18.03和2.87。
然后,我们可以通过以下公式计算相关系数:相关系数 = 协方差 / (X标准差 * Y标准差)根据以上公式,我们可以得出相关系数为-0.93。
由于相关系数接近于-1,可以得出结论:学习成绩和学习时间之间存在强烈的负相关关系,即学习时间越长,学习成绩越低。
习题二:多元线性回归假设你正在研究一个人的身高(X1)、体重(X2)和年龄(X3)对其收入(Y)的影响。
你收集了50个人的数据,以下是你的数据:身高(X1):160, 165, 170, 175, 180, 185, 190, 195, 200, 205体重(X2):50, 55, 60, 65, 70, 75, 80, 85, 90, 95年龄(X3):20, 25, 30, 35, 40, 45, 50, 55, 60, 65收入(Y):5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500请利用多元线性回归分析,建立一个预测人的收入的模型,并解释模型的结果。
多元统计分析课程设计题目课程设计题目1. 下表给出了1991年我国30个省、区、市城镇居民的月平均消费数据,所考察的八个指标如下(单位均为元/人)X1 :人均粮食支出; X2 :人均副食支出;X3 :人均烟酒茶支出; X4 :人均其他副食支出;X5 :人均衣着商品支出; X6 :人均日用品支出;X7 :人均燃料支出; X8 :人均非商品支出;问题:(1)求样品相关系数矩阵R;(2)从R 出发做主成分分析,求各主成分的贡献率,及前两个主成分的累积贡献率;(3)求出前两个主成分并解释其意义.按第一主成分将30个省、区、市排序,结果如何?表一 1991年我国30个省、区、市城镇居民的月平均消费数据省市X1 X2 X3 X4 X5 X6 X7 X81 山西8.35 23.53 7.51 8.62 17.42 10.00 1.04 11.212 内蒙古9.25 23.75 6.61 9.19 17.77 10.48 1.72 10.513 吉林8.19 30.50 4.72 9.78 16.28 7.60 2.52 10.324 黑龙江7.73 29.20 5.42 9.43 19.29 8.49 2.52 10.005 河南9.42 27.93 8.20 8.14 16.17 9.42 1.55 9.766 甘肃9.16 27.98 9.01 9.32 15.99 9.10 1.82 11.357 青海10.06 28.64 10.52 10.05 16.18 8.39 1.96 10.818 河北9.09 28.12 7.40 9.62 17.26 11.12 2.49 12.659 陕西9.41 28.20 5.77 10.80 16.36 11.56 1.53 12.1710 宁夏8.70 28.12 7.21 10.53 19.45 13.30 1.66 11.9611 新疆 6.93 29.85 4.54 9.49 16.62 10.65 1.88 13.6112 湖北8.67 36.05 7.31 7.75 16.67 11.68 2.38 12.8813 云南9.98 37.69 7.01 8.94 16.15 11.08 0.83 11.6714 湖南 6.77 38.69 6.01 8.82 14.79 11.44 1.74 13.2315 安徽8.14 37.75 9.61 8.49 13.15 9.76 1.28 11.2816 贵州7.67 35.71 8.04 8.31 15.13 7.76 1.41 13.2517 辽宁7.90 39.77 8.49 12.94 19.27 11.05 2.04 13.2918 四川7.18 40.91 7.32 8.94 17.60 12.75 1.14 14.8019 山东8.82 33.70 7.59 10.98 18.82 14.73 1.78 10.1020 江西 6.25 35.02 4.72 6.28 10.03 7.15 1.93 10.3921 福建10.60 52.41 7.70 9.98 12.53 11.70 2.31 14.6922 广西7.27 52.65 3.84 9.16 13.03 15.26 1.98 14.5723 海南13.45 55.85 5.50 7.45 9.55 9.52 2.21 16.3024 天津10.85 44.68 7.32 14.51 17.13 12.08 1.26 11.5725 江苏7.21 45.79 7.66 10.36 16.56 12.86 2.25 11.6926 浙江7.68 50.37 11.35 13.30 19.25 14.59 2.75 14.8727 北京7.78 48.44 8.00 20.51 22.12 15.73 1.15 16.6128 西藏7.94 39.65 20.97 20.82 22.52 12.41 1.75 7.9029 上海8.28 64.34 8.00 22.22 20.06 15.12 0.72 22.8930 广东12.47 76.39 5.52 11.24 14.52 22.00 5.46 25.502. 下表是49位女性在空腹情况下三个不同时刻的血糖含量(用X1 ,X2 ,X3表示)和摄入等量食糖一小时后的三个时刻的血糖含量(用小X4 ,X5 ,X6表示)的观测值(单位:mg/100ml).问题:分别从样本协方差阵S和样本相关系数矩阵R出发做主成分分析,求主成分的贡献率和各个主成分. 在两种情况下,你认为应保留几个主成分?其意义如何解释?就此而言,你认为基于S和R的分析那个结果更为合理?表二 49位女性在空腹和摄入食糖后三个不同时刻的血糖含量编号空腹摄入食糖X1 X2 X3 X4 X5 X61 60 69 62 97 69 982 56 53 84 103 78 1073 80 69 76 66 99 1304 55 80 90 80 85 1145 62 75 68 116 130 916 74 64 70 109 101 1037 64 71 66 77 102 1308 73 70 64 115 110 1099 68 67 75 76 85 11910 69 82 74 72 133 12711 60 67 61 130 134 12112 70 74 78 150 158 10013 66 74 78 150 131 14214 83 70 74 99 98 10515 68 66 90 119 85 10916 78 63 75 164 98 13817 103 77 77 160 117 12118 77 68 74 144 71 15319 66 77 68 77 82 8920 70 70 72 114 93 12221 75 65 71 77 70 10922 91 74 93 118 115 15023 66 75 73 170 147 12124 75 82 76 153 132 11525 74 71 66 143 105 10026 76 70 64 114 113 12927 74 90 86 73 106 11628 74 77 80 116 81 7729 67 71 69 63 87 7030 78 75 80 105 132 8031 64 66 71 83 94 13332 71 80 76 81 87 8633 63 75 73 120 89 5934 90 103 74 107 109 10135 60 76 61 99 111 9836 48 77 75 113 124 9737 66 93 97 136 112 12238 74 70 76 109 88 10539 60 74 71 72 90 7140 63 75 66 130 101 9041 66 80 86 130 117 14442 77 67 74 83 92 10743 70 67 100 150 142 14644 73 76 81 119 120 11945 78 90 77 122 155 14946 73 68 80 102 90 12247 72 83 68 104 69 9648 65 60 70 119 94 8949 52 70 76 92 94 100 3. 考察1985年至2000年全国如下各价格指数:X1 :商品零售价格指数;X2 :居民消费价格指数;X3 :城市居民消费价格指数;X4 :农村居民消费价格指数;X5 :农产品收购价格指数;X6 :农村工业品零售价格指数;观测数据见下表.问题:按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.(a)最短距离法;(b)最长距离法;(c)类平均距离法;表三全国各年度各种价格指数年份X1 X2 X3 X4 X5 X6 1985 128.1 100.0 134.2 100.0 166.8 111.1 1986 135.8 106.5 143.6 106.1 177.5 114.7 1987 145.7 114.3 156.2 112.7 198.8 120.2 1988 172.7 135.8 188.5 132.4 244.5 138.5 1989 203.4 160.2 219.2 157.9 281.2 164.4 1990 207.7 162.2 222.0 165.1 273.9 172.0 1991 213.7 170.8 233.3 168.9 268.4 177.2 1992 225.7 181.7 253.4 176.8 277.5 182.7 1993 254.9 208.4 294.2 201.0 314.7 204.3 1994 310.2 258.6 367.8 248.0 440.3 239.4 1995 356.1 302.8 429.6 291.4 527.9 274.6 1996 377.8 327.9 467.4 314.4 550.1 291.6 1997 380.8 337.1 481.9 322.3 525.3 294.8 1998 370.9 334.4 479.0 319.1 483.3 288.3 1999 359.8 329.7 472.8 314.3 424.3 280.5 2000 354.4 331.0 476.6 314.0 409.0 277.14. 考察1985年至2000年全国如下各价格指数:X1 :商品零售价格指数;X2 :居民消费价格指数;X3 :城市居民消费价格指数;X4 :农村居民消费价格指数;X5 :农产品收购价格指数;X6 :农村工业品零售价格指数;观测数据见下表.问题:先将数据标准化,再按年份用下列方法进行系统聚类分析,画出谱系聚类图,并给出聚为3类的结果.(a)最短距离法;(b)最长距离法;(c)重心距离法.表四全国各年度各种价格指数年份X1 X2 X3 X4 X5 X6 1985 128.1 100.0 134.2 100.0 166.8 111.1 1986 135.8 106.5 143.6 106.1 177.5 114.7 1987 145.7 114.3 156.2 112.7 198.8 120.2 1988 172.7 135.8 188.5 132.4 244.5 138.5 1989 203.4 160.2 219.2 157.9 281.2 164.4 1990 207.7 162.2 222.0 165.1 273.9 172.0 1991 213.7 170.8 233.3 168.9 268.4 177.2 1992 225.7 181.7 253.4 176.8 277.5 182.7 1993 254.9 208.4 294.2 201.0 314.7 204.3 1994 310.2 258.6 367.8 248.0 440.3 239.4 1995 356.1 302.8 429.6 291.4 527.9 274.6 1996 377.8 327.9 467.4 314.4 550.1 291.6 1997 380.8 337.1 481.9 322.3 525.3 294.8 1998 370.9 334.4 479.0 319.1 483.3 288.3 1999 359.8 329.7 472.8 314.3 424.3 280.5 2000 354.4 331.0 476.6 314.0 409.0 277.15. 研究货运总量y(万吨)与工业总产值x1(亿元)、农业总产值x2(亿元)。