应用多元统计分析习题解答_聚类分析
- 格式:doc
- 大小:1.08 MB
- 文档页数:20
应用多元统计分析试题及答案(1)多元统计分析是现代统计学中不可或缺的一部分,它是用于对不同数据进行相关分析的高级统计方法。
对于需要进行多因素分析的问题,多元统计分析是必须掌握的技能。
以下是一些应用多元统计分析的试题及答案。
试题1:假设你要进行一项研究,以评估学生在学期末考试成绩与他们的就业情况之间是否存在关联。
你将分析什么类型的多元统计分析?答案:此问题需要进行一种二元多元回归分析。
此方法可以用于探索学期末考试成绩和就业情况之间的相关性。
通过回归分析,我们可以计算出两个变量之间的相关系数以及建立一个数学模型来预测就业成功与否的可能性。
试题2:你是一家旅游公司的行销经理,你想了解你们的财务状况、品牌信誉和市场定位之间的关系。
采用哪种多元统计分析来解决这个问题?答案:这个问题需要进行一种因子分析。
因子分析是一种常用的多元统计技术,可用于探索大量变量之间的共性或相似性。
因此,行销经理可以使用因子分析来探究这三个因素之间的关系,以帮助公司更好地了解市场需求、推广策略和产品定位。
试题3:你是一名医学研究员,你需要研究新型药物的效果以及它是否与特定人群的特征相关。
哪种多元统计分析可用于研究?答案:这个问题需要使用一种路径分析方法。
路径分析是一种分层回归分析技术,可用于探索变量间的直接和间接影响关系。
因此,研究人员可以使用路径分析来研究新型药物的效果以及与特定人群特征的相关性,以便更好地理解治疗效果的影响因素。
试题4:你是一名市场分析师,你需要研究不同年龄、性别和教育水平的人群之间的消费习惯。
采用哪种多元统计分析来解决这个问题?答案:这个问题需要使用一种聚类分析方法。
聚类分析是一种将成为节点的相似对象分组的过程。
因此,市场分析师可以使用聚类分析来将相似的人群以及他们的共同消费习惯分成几个类别,以便更好地了解不同年龄、性别和教育水平背景下的人群之间的消费习惯和偏好。
结论:多元统计分析是一种有用的技术,可以用于探索大量不同变量之间的关系,对于需要分析多个变量之间关系的问题,多元统计分析是必须学习的基本技能。
应用多元统计考试及答案 一、单项选择题(每题1分,共10分) 1. 在多元统计分析中,主成分分析的目的是( )。 A. 寻找数据中的异常值 B. 寻找数据中的相关性 C. 寻找数据中的主成分 D. 寻找数据中的聚类
答案:C 2. 多元线性回归分析中,回归系数的估计通常采用( )。 A. 最小二乘法 B. 最大似然法 C. 贝叶斯方法 D. 决策树方法 答案:A 3. 判别分析中,线性判别函数的构建基于( )。 A. 组间差异 B. 组内差异 C. 组间差异和组内差异 D. 组内差异和组外差异
答案:C 4. 多元方差分析(MANOVA)中,检验多元均值向量是否相等的方法是( )。
A. 单变量方差分析 B. Hotelling's T-squared test C. Wilks' Lambda D. Pillai's Trace
答案:B 5. 聚类分析中,层次聚类法不包括( )。 A. 聚合法 B. 分解法 C. 动态聚类法 D. K-means聚类法
答案:D 6. 因子分析中,公因子提取的方法不包括( )。 A. 主成分法 B. 最大似然法 C. 最小二乘法 D. 贝叶斯方法
答案:D 7. 多元统计分析中,用于度量变量间相关性的统计量是( )。 A. 相关系数 B. 回归系数 C. 距离系数 D. 相似系数
答案:A 8. 多元统计分析中,用于度量变量间距离的统计量是( )。 A. 相关系数 B. 回归系数 C. 距离系数 D. 相似系数
答案:C 9. 多元统计分析中,用于度量变量间相似性的统计量是( )。 A. 相关系数 B. 回归系数 C. 距离系数 D. 相似系数
答案:D 10. 多元统计分析中,用于度量变量间差异的统计量是( )。 A. 相关系数 B. 回归系数 C. 距离系数 D. 相似系数
答案:C 二、多项选择题(每题2分,共10分) 11. 多元统计分析中,以下哪些方法可以用于变量降维( )。 A. 主成分分析 B. 因子分析 C. 聚类分析 D. 判别分析
第1章 多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。
在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
其中最典型的就是0-1标准化和Z 标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m 维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。
如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵, 则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。
2.1.试叙述多元联合分布和边际分布之间的关系。
解:多元联合分布讨论多个随机变量联合到一起的概率分布状况,12(,,)p X X X X '=的联合分布密度函数是一个p 维的函数,而边际分布讨论是12(,,)p X X X X '=的子向量的概率分布,其概率密度函数的维数小于p 。
2.2设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
解:设12()X X '的均值向量为()12μμ'=μ,协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭,则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。
2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤,2c x d ≤≤。
求(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数;(3)判断1X 和2X 是否相互独立。
(1)解:随机变量1X 和2X 的边缘密度函数、均值和方差;112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以 由于1X 服从均匀分布,则均值为2b a+,方差为()212b a -。
多元统计分析李高荣课后答案1、如果对某公司在一个城市中的各个营业点按彼此之间的路程远近来进行聚类,则最适合采用的距离是A、欧氏距离B、绝对值距离C、马氏距离D、各变量标准化之后的欧氏距离答案:绝对值距离2、不适合用于对变量聚类的方法有A、最短距离法B、最长距离法C、类平均法D、k均值法答案:k 均值法3、容易产生链接倾向,不适合对分离得很差的群体进行聚类的系统聚类法有A、最短距离法B、最长距离法C、类平均法D、重心法E、离差平方和法答案:最短距离法4、大的类之间不易合并,而小的类之间易于合并的系统聚类法有A、最短距离法B、最长距离法C、类平均法D、重心法E、离差平方和法答案:离差平方和法5、R型聚类分析的分类对象是样品。
正确错误答案:错误6、距离和相似系数的定义与变量的尺度无关。
正确错误答案:错误7、在聚类分析中,可以采用只满足非负性和对称性而不满足三角不等式的“距离”。
正确错误答案:正确8、所有的系统聚类法都满足单调性。
正确错误答案:错误9、k均值法的聚类结果与初始凝聚点的选择无关。
答案:错10、k均值法的类个数需事先指定。
答案:错11、设x和y是两个随机向量,则x和y的协差阵与y和x的协差阵A、相等B、互为转置C、没有关系D、不相等,但阶数一定相同答案:互为转置12、在实际问题中,我们实际所使用的判别规则一般是A、从总体出发得到的B、从样本出发得到的C、尽可能地从总体出发得到D、时常从总体出发得到,也时常从样本出发得到答案:从样本出发得到的13、在样本容量n不是很大的情形下,以下一般最能给出好的误判概率估计值的非参数方法是A、回代法B、划分样本C、交叉验证法D、正态假定下误判概率的估计答案:交叉验证法14、以下哪种系统聚类法的类与类之间的距离定义不止一种。
A、最短距离法B、最长距离法C、类平均法D、重心法E、离差平方和法答案:类平均法15,以下哪种系统聚类法不具有单调性。
A、最短距离法B、最长距离法C、类平均法D、重心法E、离差平方和法答案:重心法16、聚类变量个数为多少时,一般最不建议使用系统聚类法等正规聚类方法直接进行聚类。
一、填空题:1、多元统计剖析是运用数理统计方法来研究解决多指标问题的理论和方法 .2、回归参数明显性查验是查验解说变量对被解说变量的影响能否著.3、聚类剖析就是剖析怎样对样品(或变量)进行量化分类的问题。
往常聚类分析分为Q型聚类和R型聚类。
4、相应剖析的主要目的是追求列联表行要素A和列要素B的基本剖析特点和它们的最优联立表示。
5、因子剖析把每个原始变量分解为两部分要素:一部分为公共因子,另一部分为特别因子。
6、若x( ): N P( ,),=1,2,3 .n且互相独立,则样本均值向量x 听从的散布为 _ x ~N(μ,Σ /n)_。
二、简答1、简述典型变量与典型有关系数的观点,并说明典型有关剖析的基本思想。
在每组变量中找出变量的线性组合,使得两组的线性组合之间拥有最大的有关系数。
选用和最先精选的这对线性组合不有关的线性组合,使其配对,并选用有关系数最大的一对,这样下去直到两组之间的有关性被提取完成为止。
被选出的线性组合配对称为典型变量,它们的有关系数称为典型有关系数。
2、简述相应剖析的基本思想。
相应剖析,是指对两个定性变量的多种水平进行剖析。
设有两组要素A和B,此中要素 A 包括 r 个水平,要素 B 包括 c 个水平。
对这两组要素作随机抽样检查,获得一个 rc 的二维列联表,记为。
要追求列联表列要素 A 和行要素 B 的基本剖析特点和最优列联表示。
相应剖析即是经过列联表的变换,使得要素 A和要素 B 拥有平等性,进而用同样的因子轴同时描绘两个要素各个水平的情况。
把两个要素的各个水平的情况同时反应到拥有同样坐标轴的因子平面上,进而获得要素 A 、 B 的联系。
3、简述费希尔鉴别法的基本思想。
从 k 个整体中抽取拥有 p 个指标的样品观察数据,借助方差剖析的思想结构一个线性鉴别函数系数:确立的原则是使得整体之间差别最大,而使每个整体内部的离差最小。
将新样 品的 p 个指标值代入线性鉴别函数式中求出 值,而后依据鉴别必定的规则,就能够鉴别新的样品属于哪个整体。
多元统计分析试题及答案一、选择题1. 以下哪一项不是多元统计分析的基本方法?A. 主成分分析B. 聚类分析C. 方差分析D. 因子分析答案:C2. 在多元统计分析中,协方差阵和相关阵的关系是:A. 相关系数是协方差阵的标准化形式B. 协方差阵是相关阵的平方C. 相关系数是协方差阵的平方根D. 协方差阵和相关阵是等价的答案:A3. 在因子分析中,以下哪个指标用于衡量变量间的共同性?A. 提取载荷B. 特征值C. 累计贡献率D. 共同度答案:D4. 聚类分析中,以下哪种方法属于层次聚类法?A. K-means 聚类B. 动态聚类C. 系统聚类D. 密度聚类答案:C二、填空题1. 多元统计分析中的“多元”指的是______。
答案:多个变量2. 主成分分析的目的是将多个变量______,以减少数据的维度。
答案:线性组合3. 在多元正态分布中,若随机变量X和Y独立,则它们的协方差______。
答案:为04. 聚类分析中,类内平方和与类间平方和的比值越大,说明聚类效果______。
答案:越好三、简答题1. 简述主成分分析的基本思想。
答案:主成分分析的基本思想是通过线性变换,将原始变量组合成一组新的变量,这组新变量能够尽可能多地反映原始变量中的信息。
具体步骤如下:(1)计算原始变量的协方差阵;(2)求出协方差阵的特征值和特征向量;(3)根据特征值的大小,选取前几个特征值对应的特征向量,作为主成分;(4)将原始变量表示为新变量的线性组合。
2. 简述因子分析的基本步骤。
答案:因子分析的基本步骤如下:(1)计算变量间的相关阵或协方差阵;(2)求出相关阵的特征值和特征向量;(3)根据特征值的大小,选取前几个特征值对应的特征向量,作为因子;(4)计算因子载荷矩阵;(5)对因子进行命名和解释;(6)计算因子得分,用于进一步的分析。
3. 简述聚类分析中的层次聚类法。
答案:层次聚类法是一种自底向上的聚类方法,其基本思想是将每个样本作为一个初始类,然后根据样本之间的相似度,逐步合并相似度较高的类,直到满足特定的终止条件。
多元统计分析课后练习答案第1章多元正态分布1、在数据处理时,为什么通常要进行标准化处理?数据的标准化就是将数据按比例翻转,并使之掉入一个大的特定区间。
在某些比较和评价的指标处置中经常可以使用,除去数据的单位管制,将其转变为无量纲的纯数值,易于相同单位或量级的指标能展开比较和平均值。
其中最典型的就是0-1标准化和z标准化。
2、欧氏距离与马氏距离的优缺点是什么?欧氏距离也表示欧几里得度量、欧几里得度量,就是一个通常使用的距离定义,它就是在m维空间中两个点之间的真实距离。
在二维和三维空间中的欧氏距离的就是两点之间的距离。
缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。
每个坐标对欧氏距离的贡献是同等的。
当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。
当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。
它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。
没有考虑到总体变异对距离远近的影响。
马氏距离表示数据的协方差距离。
为两个服从同一分布并且其协方差矩阵为σ的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:误导了变化微小的变量的促进作用。
受到协方差矩阵不稳定的影响,马氏距离并不总是能够成功排序出来。
3、当变量x1和x2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?统计数据距离区别于欧式距离,此距离必须倚赖样本的方差和协方差,能彰显各变量在变差大小上的相同,以及优势存有的相关性,还建议距离与各变量所用的单位毫无关系。
第五章 聚类分析 5.1 判别分析和聚类分析有何区别? 答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n个样本,对每个样本测得p项指标(变量)的数据,已知每个样本属于k个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。
5.2 试述系统聚类的基本思想。 答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造? 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n个样本看作p维空间的n个点。点之间的距离即可代表样品间的相似度。常用的距离为
(一)闵可夫斯基距离:1/1()()pqqijikjkkdqXX q取不同值,分为 (1)绝对距离(1q)
1(1)pijikjkkdXX
(2)欧氏距离(2q) 21/2
1(2)()pijikjkkdXX
(3)切比雪夫距离(q) 1()maxijikjkkpdXX
(二)马氏距离 (三)兰氏距离 对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 21()()()ijijijdM
XXΣXX
11()pikjkijkikjkXXdLpXX
将变量看作p维空间的向量,一般用 (一)夹角余弦
(二)相关系数
5.4 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则? 答: 设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。 (1). 最短距离法
,minikjrkrijXGXGDdmin{,}kpkqDD
(2)最长距离法 ,maxipjqpqijXGXGDd
,maxikjrkrijXGXGDdmax{,}kpkqDD
(3)中间距离法
其中 (4)重心法 2()()pqpqpqDXXXX
)(1qqpprrXnXnnX
12211cos()()pikjkkijppikjkkkXXXX 12211()()()()pikijkjkijppikijkjkkXXXXrXXXX
ijGXGXijdDjjii,min
2222212
1
pqkqkpkrDDDD 22222pqpq
krkpkqpqrrr
nnnnDDDDnnn
(5)类平均法 221
ipjjpqijXGXGpqDdnn
221ikjrkrijXGXGkrDdnn22pqkpkqrrnnDDnn
(6)可变类平均法
其中是可变的且 <1 (7)可变法 22221()2krkpkqpqDDDD 其中是可变的且 <1
(8)离差平方和法
1()()tntittitttSXXXX
2222kpkqk
krkpkqpq
rkrkrk
nnnnnDDDDnnnnnn
通常选择距离公式应注意遵循以下的基本原则: (1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。 (2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。 (3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。
5.5试述K均值法与系统聚类法的异同。
2222(1)()pqkrkpkqpqrrnnDDDDnn 答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。 不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。 具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。
5.6 试述K均值法与系统聚类有何区别?试述有序聚类法的基本思想。 答:K均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。系统聚类对不同的类数产生一系列的聚类结果,而K—均值法只能产生指定类数的聚类结果。具体类数的确定,有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K均值法确定类数的参考。
有序聚类就是解决样品的次序不能变动时的聚类分析问题。如果用)()2()1(,,,nXXX表示
n个有序的样品,则每一类必须是这样的形式,即)()1()(,,,jiiXXX,其中,1ni且
nj,简记为},,1,{jiiG
i
。在同一类中的样品是次序相邻的。一般的步骤是(1)
计算直径{D(i,j)}。(2)计算最小分类损失函数{L[p(l,k)]}。(3)确定分类个数k。(4)最优分类。
5.7 检测某类产品的重量, 抽了六个样品, 每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。 (1)用最短距离法进行聚类分析。
采用绝对值距离,计算样品间距离阵
0 1 0 2 1 0 5 4 3 0 8 7 6 3 0 10 9 8 5 2 0
由上表易知 中最小元素是 于是将,,聚为一类,记为 计算距离阵 0 3 0 6 3 0 8 5 2 0 中最小元素是=2 于是将,聚为一类,记为 计算样本距离阵
0 3 0 6 3 0
中最小元素是 于是将,聚为一类,记为 因此,
(2)用重心法进行聚类分析 计算样品间平方距离阵
0 1 0 4 1 0 25 16 9 0 64 49 36 9 0 100 81 64 25 4 0
易知 中最小元素是 于是将,,聚为一类,记为 计算距离阵
0 16 0 49 9 0 81 25 4 0
注:计算方法,其他以此类推。 中最小元素是=4 于是将,聚为一类,记为 计算样本距离阵
0 16 0 64 16 0 中最小元素是 于是将,聚为一类,记为 因此,
5.8 下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K-均值法分别对这些公司进行聚类,并对结果进行比较分析。
公司 编号 净资产收益率 每股净利润 总资产周转率 资产负债率 流动负债比率 每股净资产 净利润增长率 总资产增长率 1 11.09 0.21 0.05 96.98 70.53 1.86 -44.04 81.99 2 11.96 0.59 0.74 51.78 90.73 4.95 7.02 16.11 3 0 0.03 0.03 181.99 100 -2.98 103.33 21.18 4 11.58 0.13 0.17 46.07 92.18 1.14 6.55 -56.32 5 -6.19 -0.09 0.03 43.3 82.24 1.52 -1713.5 -3.36 6 10 0.47 0.48 68.4 86 4.7 -11.56 0.85 7 10.49 0.11 0.35 82.98 99.87 1.02 100.23 30.32 8 11.12 -1.69 0.12 132.14 100 -0.66 -4454.39 -62.75 9 3.41 0.04 0.2 67.86 98.51 1.25 -11.25 -11.43 10 1.16 0.01 0.54 43.7 100 1.03 -87.18 -7.41 11 30.22 0.16 0.4 87.36 94.88 0.53 729.41 -9.97 12 8.19 0.22 0.38 30.31 100 2.73 -12.31 -2.77 13 95.79 -5.2 0.5 252.34 99.34 -5.42 -9816.52 -46.82 14 16.55 0.35 0.93 72.31 84.05 2.14 115.95 123.41 15 -24.18 -1.16 0.79 56.26 97.8 4.81 -533.89 -27.74
解:令净资产收益率为X1,每股净利润X2,总资产周转率为X3,资产负债率为X4,流动负债比率为X5,每股净资产为X6,净利润增长率为X7,总资产增长率为X8,用spss对公司聚类分析的步骤如下: a) 系统聚类法: 1. 在SPSS窗口中选择Analyze→Classify→Hierachical Cluster,调出系统聚类分析主界面,并将变量X8-X1移入Variables框中。在Cluster栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。