判别分析作业
- 格式:doc
- 大小:584.00 KB
- 文档页数:14
聚类分析与判别分析的例题1、某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。
下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。
(1)根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。
(2)现有一新品牌的饮料再该超市试销,其销售价格为3.0,顾客对其口味的评分平均分为8,信任评分为5,试预测该饮料的销售情况。
2、银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。
可以根据贷款申请人的年龄、受教育程度、现从事工作的年龄、未变更住址的年数、收入,负债收入比例、信用卡债务、其他债务等来判断其信用情况。
下表是某银行的客户资料中抽取的部分数据,(1)根据样本资料分别用距离判别法、贝叶斯判别法和费系尔判别法建立判别函数和判别规则。
(2)某客户的如上情况资料为(53,1,9,18,50,11,20,2.02,3.58),对其进行信用好坏的判别。
目前信用好坏客户序号已履行还贷责任1 23 1 7 2 31 6.6 0.34 1.712 34 1 173 59 8.0 1.81 2.913 42 2 7 23 41 4.6 0.94 0.944 39 1 195 48 13.1 1.93 4.365 35 1 9 1 34 5.0 0.40 1.30未履行还贷责任6 37 1 1 3 24 15.1 1.80 1.827 29 1 13 1 42 7.4 1.46 1.658 32 2 11 6 75 23.3 7.76 9.729 28 2 2 3 23 6.4 0.19 1.2910 26 1 4 3 27 10.5 2.47 0.363、从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行思想生化指标的化验:血清铜蛋白、蓝色反应、尿吲哚乙酸和中性硫化物,数据见下表。
试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。
图1由前面分析发现,协方差矩阵不等,可以考虑采用Separate-groups协方差矩阵。
输出结果表1-10:分類結果a被解释变量預測的群組成員資格總計Setosa 鸢尾花Versico-lor 鸢尾花Virginica 鸢尾花原始計數Setosa 鸢尾花50 0 0 50 Versico-lor 鸢尾花0 47 3 50Virginica 鸢尾花0 1 49 50 %Setosa 鸢尾花100.0 .0 .0 100.0 Versico-lor 鸢尾花.0 94.0 6.0 100.0 Virginica 鸢尾花.0 2.0 98.0 100.0a. 97.3% 個原始分組觀察值已正確地分類。
图2分類處理摘要已處理31 已排除遺漏或超出範圍群組代碼0至少一個遺漏識別變數0已在輸出中使用31群組的事前機率地区在前分析中使用的觀察值未加權加權1 .3332 2.0002 .333 2 2.0003 .333 1 1.000總計 1.000 5 5.000分類函數係數地区1 2 3人均食品支出.014 -.004 .021 人均衣着支出-.058 .024 -.092 (常數)-10.708 -3.645 -19.157 費雪 (Fisher) 線性區別函數图4 分類結果a地区預測的群組成員資格總計1 2 3原始計數 1 2 0 0 22 0 2 0 23 1 0 0 1未分組的觀察值8 18 0 26% 1 100.0 .0 .0 100.02 .0 100.0 .0 100.03 100.0 .0 .0 100.0未分組的觀察值30.8 69.2 .0 100.0a. 80.0% 個原始分組觀察值已正確地分類。
由表1-10可以看出,通过判别函数预测,有146个观测是分类正确的,其中,y=1组50个观测全部被判对,y=2组50个观测中有47个被判对,y=3组50个观测中有49个被判对,从而有97.3%的原始观测被判对。
应用多元统计分析习题解答_判别分析第四章判别分析4.1 简述欧几里得距离与马氏距离的区别和联系。
答:设p维欧几里得空间中的两点X=和Y=。
则欧几里得距离为。
欧几里得距离的局限有①在多元数据分析中,其度量不合理。
②会受到实际问题中量纲的影响。
设X,Y是来自均值向量为,协方差为的总体G中的p维样本。
则马氏距离为D(X,Y)=。
当即单位阵时,D(X,Y)==即欧几里得距离。
因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。
4.2 试述判别分析的实质。
答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。
设R1,R2,…,Rk是p维空间R p 的k个子集,如果它们互不相交,且它们的和集为,则称为的一个划分。
判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间构造一个“划分”,这个“划分”就构成了一个判别规则。
4.3 简述距离判别法的基本思想和方法。
答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。
其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。
①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ 2,对于一个新的样品X ,要判断它来自哪个总体。
计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2(X ,G 2),则X,D 2(X ,G 1)D 2(X ,G 2)X,D 2(X ,G 1)> D 2(X ,G 2, 具体分析,2212(,)(,)D G D G -X X111122111111111222*********()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ记()()W '=-X αX μ 则判别规则为X,W(X)X,W(X)<0②多个总体的判别问题。
判别分析与聚类分析不同。
判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。
表3-1 分析案例处理摘要未加权案例N 百分比有效28 90.3排除的缺失或越界组代码 3 9.7至少一个缺失判别变量0 .0缺失或越界组代码还有至少一个缺失判别变量0 .0合计 3 9.7合计31 100.0注:参与判别分析的观测量数据总结,共有31个样品,其中3个样品为待判样品。
表3-2 组统计量案例的类别号均值标准差有效的 N(列表状态)未加权的已加权的1 农业1359.700 342.1673 13 13.000林业146.517 73.3137 13 13.000牧业895.907 333.6804 13 13.000渔业304.403 310.4489 13 13.0002 农业408.396 315.2450 10 10.000林业37.247 49.3953 10 10.000牧业203.285 128.0568 10 10.000渔业39.380 61.9882 10 10.0003 农业2821.154 591.4155 5 5.000林业124.150 69.0856 5 5.000牧业1717.854 429.8756 5 5.000渔业525.066 463.0711 5 5.000合计农业1280.923 928.0349 28 28.000林业103.498 80.6531 28 28.000牧业795.318 612.0639 28 28.000渔业249.156 328.2521 28 28.000 分类统计结果:均值、方差、未加权的权重和加权的权重,从表3-2中可以看出“农业”最发达的处在第3类中;“林业”最发达的处在第1类中;“牧业”相对比较发达的处在第3类中;“渔业”比较发达的处在第3类中.表3-3 汇聚的组内矩阵a农业林业牧业渔业协方差农业147937.808 32.329 53946.036 38237.523林业32.329 4221.968 763.564 5011.382牧业53946.036 763.564 88914.814 -1202.757渔业38237.523 5011.382 -1202.757 81954.578相关性农业 1.000 .001 .470 .347林业.001 1.000 .039 .269牧业.470 .039 1.000 -.014渔业.347 .269 -.014 1.000a. 协方差矩阵的自由度为 25。
判别分析实验报告判别分析实验报告一、引言判别分析是一种常用的统计分析方法,广泛应用于数据挖掘、模式识别、生物信息学等领域。
本实验旨在通过对一个真实数据集的分析,探讨判别分析在实际问题中的应用效果。
二、数据集介绍本实验使用的数据集是一份关于肿瘤患者的临床数据,包括患者的年龄、性别、肿瘤大小、转移情况等多个变量。
我们的目标是根据这些变量,建立一个判别模型,能够准确地预测患者是否患有恶性肿瘤。
三、数据预处理在进行判别分析之前,我们首先对数据进行预处理。
这包括数据清洗、缺失值处理、异常值检测等步骤。
通过对数据的观察和分析,我们发现有部分数据存在缺失值,需要进行处理。
我们选择使用均值替代缺失值的方法进行处理,并对替代后的数据进行了异常值检测。
四、判别模型建立在本实验中,我们选择了线性判别分析(LDA)作为判别模型的建立方法。
LDA 是一种经典的判别分析方法,通过将数据投影到低维空间中,使得不同类别的样本在投影后的空间中能够更好地区分开来。
我们使用Python中的scikit-learn 库来实现LDA算法。
五、模型评估为了评估建立的判别模型的性能,我们将数据集划分为训练集和测试集。
使用训练集对模型进行训练,并使用测试集进行模型的评估。
我们选择了准确率、精确率、召回率和F1值等指标来评估模型的性能。
经过多次实验和交叉验证,我们得到了一个较为稳定的模型,并对其性能进行了详细的分析和解释。
六、结果与讨论经过模型评估,我们得到了一个在测试集上准确率为85%的判别模型。
该模型在预测恶性肿瘤时具有较高的精确率和召回率,说明了其在实际应用中的可行性和有效性。
但同时我们也发现,该模型在预测良性肿瘤时存在一定的误判率,可能需要进一步优化和改进。
七、结论本实验通过对一个真实数据集的判别分析,验证了判别分析方法在预测恶性肿瘤的应用效果。
通过建立判别模型,并对其性能进行评估,我们得到了一个在测试集上具有较高准确率的模型。
然而,我们也发现了该模型在预测良性肿瘤时存在一定的误判率,需要进一步的改进和优化。
《多元统计分析》实验报告实验名称: 判别分析及正态检验专业:统计学班级:120802姓名:指导教师:2014 年6 月26 日给出血友病基因携带者数据1,共分2组,第一组为非携带者(1π),第二组为必然携带者(2π),分组变量为g ,变量x1表示()10log AHF 活性,变量x2表示()10log AHF 抗原,利用上述数据: (1)对两个组检查二元正态性假定;一通过菜单系统实现 二运行结果第一组的正态性检验一运行程序proc princomp data=sasuser.zu1 out=prin prefix=z standard;var x1 x2;run;proc univariate data=work.prin normal plot;var z1 z2;run;二运行结果三结论分析第二组的正态性检验一运行程序proc princomp data=sasuser.zu2 out=prin1 prefix=z standard; var x1 x2;run;proc univariate data=work.prin1 normal plot;var z1 z2;run;二运行结果三结论分析(2)假定两组先验概率相等,求样本线性判别函数,并估计误判概率;一运行程序proc discrim data=sasuser.liangzu listerr crosslisterr;class g;var x1-x2;run;二运行结果三结论分析(3)将血友病基因携带者数据2中的10个新事例用(2)得到的判别函数进行分类;一运行程序proc discrim data=sasuser.liangzu testdata=sasuser.daipan listerr crosslisterr testlist;class g;var x1-x2;run;二运行结果三结论分析(3)假定必然携带者(组2)的先验概率为0.25。
数理统计大作业(二)全国各省发展程度的聚类分析及判别分析指导教师院系名称材料科学与工程院学号学生姓名2015 年 12 月21 日目录全国各省发展程度的聚类分析及判别分析 (1)摘要: (1)引言 (1)1实验方案 (2)1.1数据统计 (2)1.2聚类分析 (3)1.3判别分析 (4)2结果分析与讨论 (5)2.1聚类分析结果 (5)2.2聚类分析结果分析: (8)2.3判别分析结果 (9)2.4 Fisher判别结果分析: (11)参考文献: (16)全国各省发展程度的聚类分析及判别分析摘要:利用SPSS软件对全国31个省、直辖市、自治区(浙江、安徽、甘肃除外)的主要经济指标进行多种聚类分析,分析选择最佳聚类类数,并对浙江、湖南、甘肃进行类型判别分析。
通过这两个方法对全国各省进行发展分类。
本文选取了7项社会发展指标作为决定发展程度的影响因素,其中经济因素为主要因素,同时评估城镇化率和人口素质因素。
各项数据均来自2014年国家统计年鉴。
分析结果表明:北京市和上海市和天津市为同一类;江苏省和山东省和广东省为同一类型;河北、湖北、河南、湖南、四川、辽宁为同一类;其余的为另一类。
关键词:聚类分析、判别分析、发展引言聚类分析是根据研究对象的特征对研究对象进行分类的多元统计分析技术的总称。
它直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类。
系统聚类分析又称集群分析,是聚类分析中应用最广的一种方法,它根据样本的多指标(变量)、多个观察数据,定量地确定样品、指标之间存在的相似性或亲疏关系,并据此连结这些样品或指标,归成大小类群,构成分类树状图或冰柱图。
判别分析是根据多种因素(指标)对事物的影响来实现对事物的分类,从而对事物进行判别分类的统计方法。
判别分析适用于已经掌握了历史上分类的每一个类别的若干样品,希望根据这些历史的经验(样品),总结出分类的规律性(判别函数)来指导未来的分类。
判别分析练习题判别分析练习题在统计学中,判别分析是一种用于分类和预测的方法。
它通过对不同类别的样本进行分析,构建一个分类模型,以便将未知样本分配到正确的类别中。
判别分析在各个领域都有广泛的应用,如医学诊断、金融风险评估等。
下面我将给大家提供一些判别分析的练习题,希望能够帮助大家更好地理解和应用这一方法。
1. 假设有两个类别的样本,每个样本都有两个变量。
已知两个类别的样本均值和协方差矩阵如下:类别1:均值为(1, 2),协方差矩阵为[[2, 1], [1, 2]]类别2:均值为(3, 4),协方差矩阵为[[3, 1], [1, 3]]现有一个未知样本(2, 3),请利用判别分析方法判断该样本属于哪个类别。
解答:首先,我们需要计算两个类别的判别函数值。
对于类别1,判别函数为:g1(x) = -0.5 * (x - μ1) * Σ1^-1 * (x - μ1)T - 0.5 * ln(|Σ1|) + ln(P1)其中,x为未知样本,μ1为类别1的均值,Σ1为类别1的协方差矩阵,P1为类别1的先验概率。
类似地,对于类别2,判别函数为:g2(x) = -0.5 * (x - μ2) * Σ2^-1 * (x - μ2)T - 0.5 * ln(|Σ2|) + ln(P2)其中,μ2为类别2的均值,Σ2为类别2的协方差矩阵,P2为类别2的先验概率。
根据给定的均值和协方差矩阵,我们可以计算出:μ1 = (1, 2), Σ1 = [[2, 1], [1, 2]]μ2 = (3, 4), Σ2 = [[3, 1], [1, 3]]假设两个类别的先验概率相等,即P1 = P2 = 0.5。
将未知样本(2, 3)代入判别函数中,可以计算出:g1(2, 3) = -4.5g2(2, 3) = -5.5由于g2(2, 3)的值较小,所以未知样本更有可能属于类别2。
2. 现有一个三类别的样本,每个样本有三个变量。
已知三个类别的样本均值和协方差矩阵如下:类别1:均值为(1, 2, 3),协方差矩阵为[[2, 1, 1], [1, 2, 1], [1, 1, 2]]类别2:均值为(4, 5, 6),协方差矩阵为[[3, 1, 2], [1, 3, 2], [2, 2, 3]]类别3:均值为(7, 8, 9),协方差矩阵为[[4, 1, 2], [1, 4, 2], [2, 2, 4]]现有一个未知样本(3, 4, 5),请利用判别分析方法判断该样本属于哪个类别。
利用SPSS对全国各省进行经济类型聚类和判别分析摘要:本文利用SPSS统计软件对中国大陆(除港、澳、台之外)的31个省、市、自治区2000年到2009年的经济总量进行聚类分析,将这31个省、市、自治区分为了三大类,即经济发达地区、中等水平区、经济落后区。
并以这31个省级行政区10年的经济数据为样本,进行判别分析,建立了Fisher判别模型。
从判回代统计表可以看出该判别模型有着很高的正确率。
关键词:SPSS 聚类分析判别分析Fisher判别法一、引言利用各省以往经济数据对各省进行经济类型的划分,有助于了解各省的经济发展的状况,特别是能有助于了解全国各区域经济发展状况。
这对于相关部门制定相应的经济政策有一定的参考意义。
本文利用SPSS统计软件对全国31个省级行政区近10年的经济总量进行了聚类分析,把这31个地区划分为三个大类,即经济发达地区、中等水平区、经济落后区,然后对分好的类进行了判别分析,建立了判别函数。
从结果可以看出,其判别效果较好。
二、聚类分析和判别分析简介1、聚类分析法俗话说:“物以类聚,人以群分”。
对研究对象进行适当的分类,进而发现其规律性,是人们认识世界的一种基本方法。
研究怎样对事物进行合理分类(归类)的统计方法称为聚类分析。
依据分类对象的不同可以把聚类分析再分成Q型聚类和R型聚类,Q聚类是对样品进行聚类,R聚类是指对变量进行聚类。
聚类分析的基本原理是把某种性质相似的对象归于同一类,而不同的类之间则存在较大的差异。
为此,首先需要能刻画各个变量之间或者各个样本点之间的相似性,Q聚类一般使用“距离”度量样本点之间的相似性,R聚类则使用“相似系数”作为变量相似性的度量。
定义样本之间的距离可以采用欧氏距离、明考夫斯基距离、马氏距离、兰氏距离等测度;定义各变量之间的相似系数则多采用样本相关系数、夹角余弦等测度。
系统聚类法(Hierarchical Clustering Method )是最常用的一种聚类方法。
为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。
试建立判别函数,判定广东、西藏分别属于哪个收入类型。
判别指标及原始数据见表9-4。
1991年30个省、市、自治区城镇居民月平均收人数据表x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体)x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入x4:人均集体所有制工资收入 x9:个体劳动者收入5贝叶斯判别的SPSS操作方法:1. 建立数据文件2.单击Analyze→Classify→Discriminant,打开Discriminant Analysis判别分析对话框如图1所示:3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。
从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range 对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。
选择后点击Continue按钮返回Discriminant Analysis主对话框。
图2 Define Range对话框4、选择分析方法✧Enter independent together 所有变量全部参与判别分析(系统默认)。
本例选择此项。
✧Use stepwise method 采用逐步判别法自动筛选变量。
单击该项时Method 按钮激活,打开Stepwise Method对话框如图3所示,从中可进一步选择判别分析方法。
图3 Stepwise Method对话框5.单击Statistics 按钮,打开Statistics对话框如图4所示,从中指定输出的统计量。
单击Classify按钮,打开Classify对话框6.单击Save 按钮,打开Save对话框输出结果如下:Analysis Case Processing Summary 分类样本综述Unweighted Cases N Percent Valid 28 93.3 Excluded Missing or out-of-range group codes 2 6.7At least one missing discriminating variable 0 .0Both missing or out-of-range group codes and0 .0at least one missing discriminating variableTotal 2 6.7 Total 30 100.0Group Statistics 各类统计分析1 人均生活费收入(元/人)139.2664 23.35125 11 11.000人均国有经济单位职工工资93.0918 11.38829 11 11.000 人均来源于国有经济单位标准工资53.9882 6.80530 11 11.000 人均集体所有制工资收入11.2073 3.44937 11 11.000 人均集体所有制职工标准工资 6.7645 2.89685 11 11.000 人均各种奖金、超额工资(国有+集体) 19.8082 5.55600 11 11.000 人均各种津贴(国有+集体) 17.8327 6.23305 11 11.000 均从工作单位得到的其他收入11.0018 2.56135 11 11.000 个体劳动者收入 1.6736 1.74528 11 11.0002 人均生活费收入(元/人)107.3099 5.56641 11 11.000人均国有经济单位职工工资75.9064 7.17233 11 11.000 人均来源于国有经济单位标准工资47.7536 3.42090 11 11.000 人均集体所有制工资收入9.0827 2.45900 11 11.000 人均集体所有制职工标准工资 6.0409 1.77266 11 11.000 人均各种奖金、超额工资(国有+集体) 11.2775 2.15323 11 11.000 人均各种津贴(国有+集体) 15.4375 5.11023 11 11.000 均从工作单位得到的其他收入 6.5773 1.38350 11 11.000 个体劳动者收入 1.3845 .73428 11 11.000 3 人均生活费收入(元/人)133.5150 17.11642 6 6.000人均国有经济单位职工工资76.1700 6.06280 6 6.000 人均来源于国有经济单位标准工资44.3033 .91825 6 6.000 人均集体所有制工资收入20.3333 4.09031 6 6.000 人均集体所有制职工标准工资12.4783 3.04592 6 6.000 人均各种奖金、超额工资(国有+集体) 20.3033 5.39344 6 6.000 人均各种津贴(国有+集体) 13.2732 4.34722 6 6.000 均从工作单位得到的其他收入10.1500 2.80907 6 6.000 个体劳动者收入 1.9233 1.11631 6 6.000 Total 人均生活费收入(元/人)125.4796 22.22549 28 28.000 人均国有经济单位职工工资82.7143 12.09003 28 28.000 人均来源于国有经济单位标准工资49.4636 6.09033 28 28.000人均集体所有制工资收入12.3282 5.36546 28 28.000 人均集体所有制职工标准工资7.7046 3.54143 28 28.000 人均各种奖金、超额工资(国有+集体) 16.5630 6.10883 28 28.000 人均各种津贴(国有+集体) 15.9147 5.54104 28 28.000均从工作单位得到的其他收入9.0811 2.98513 28 28.000 个体劳动者收入 1.6136 1.26601 28 28.000Pooled Within-Groups Matrices(a) 合并类内协方差阵和相关矩阵人均生活费收入(元/人)人均国有经济单位职工工资人均来源于国有经济单位标准工资人均集体所有制工资收入人均集体所有制职工标准工资人均各种奖金、超额工资(国有+集体)人均各种津贴(国有+集体)人均从工作单位得到的其他收入个体劳动者收入Covaria nce人均生活费收入(元/人)289.101 92.215 24.694 9.270 -.438 64.106 15.828 9.298 -1.158 人均国有经济单位职工工资92.215 79.806 23.013 -13.984 -14.104 18.999 31.151 -2.229 2.386 人均来源于国有经济单位标准工资24.694 23.013 23.374 -3.496 -2.063 1.925 -1.878 -5.027 -.052 人均集体所有制工资收入9.270 -13.984 -3.496 10.524 7.877 3.113 -7.158 1.660 -1.670 人均集体所有制职工标准工资-.438 -14.104 -2.063 7.877 6.469 .484 -7.895 .665 -1.611 人均各种奖金、超额工资(国有+集体)64.106 18.999 1.925 3.113 .484 20.020 .398 4.724 -.782 人均各种津贴(国有+15.828 31.151 -1.878 -7.158 -7.895 .398 29.766 -.704 2.849均从工作单位得到的其他收入9.298 -2.229 -5.027 1.660 .665 4.724 -.704 4.968 -.020 个体劳动者收入-1.158 2.386 -.052 -1.670 -1.611 -.782 2.849 -.020 1.683Correlat ion人均生活费收入(元/人)1.000 .607 .300 .168 -.010 .843 .171 .245 -.053 人均国有经济单位职工工资.607 1.000 .533 -.483 -.621 .475 .639 -.112 .206 人均来源于国有经济单位标准工资.300 .533 1.000 -.223 -.168 .089 -.071 -.466 -.008 人均集体所有制工资收入.168 -.483 -.223 1.000 .955 .214 -.404 .230 -.397 人均集体所有制职工标准工资-.010 -.621 -.168 .955 1.000 .043 -.569 .117 -.488 人均各种奖金、超额工资(国有+集体).843 .475 .089 .214 .043 1.000 .016 .474 -.135 人均各种津贴(国有+集体).171 .639 -.071 -.404 -.569 .016 1.000 -.058 .402 均从工作单位得到的其他收入.245 -.112 -.466 .230 .117 .474 -.058 1.000 -.007 个体劳动者收入-.053 .206 -.008 -.397 -.488 -.135 .402 -.007 1.000a The covariance matrix has 25 degrees of freedom.Covariance Matrices(a)类内协方差矩阵和总协方差阵分类人均生活费收入(元/人)人均国有经济单位职工工资人均来源于国有经济单位标准工资人均集体所有制工资收入人均集体所有制职工标准工资人均各种奖金、超额工资(国有+集体)人均各种津贴(国有+集体)均从工作单位得到的其他收入个体劳动者收入1 人均生活费收入(元/人)545.281 179.030 37.985 13.286 -1.453 116.976 35.808 13.315 -10.859 人均国有经济单位职工工资179.030 129.693 35.643 -18.802 -20.620 33.023 46.461 -2.168 5.263 人均来源于国有经济单位标准工资37.985 35.643 46.312 -3.559 -1.186 -.665 -6.736 -10.545 .482人均集体所有制工资收入13.286 -18.802 -3.559 11.898 9.560 5.957 -12.699 1.012 -4.445人均集体所有制职工标准工资-1.453 -20.620 -1.186 9.560 8.392 1.919 -14.117 -.005 -3.647 人均各种奖金、超额工资(国有+集116.976 33.023 -.665 5.957 1.919 30.869 5.415 6.027 -3.897人均各种津贴(国35.808 46.461 -6.736 -12.699 -14.117 5.415 38.851 1.994 6.789有+集体)均从工作单位得13.315 -2.168 -10.545 1.012 -.005 6.027 1.994 6.560 -.697到的其他收入个体劳动者收入-10.859 5.263 .482 -4.445 -3.647 -3.897 6.789 -.697 3.0462 人均生活费收入30.985 32.281 16.743 -8.701 -6.425 3.911 8.151 -4.843 -.269(元/人)人均国有经济单32.281 51.442 20.556 -9.294 -7.498 5.980 21.768 -5.232 -1.357位职工工资人均来源于国有16.743 20.556 11.703 -6.005 -4.172 3.025 2.431 -2.925 -.978经济单位标准工资人均集体所有制-8.701 -9.294 -6.005 6.047 4.231 -2.419 2.394 .261 .004 工资收入人均集体所有制-6.425 -7.498 -4.172 4.231 3.142 -1.380 .196 .155 -.106 职工标准工资人均各种奖金、超3.911 5.980 3.025 -2.419 -1.3804.636 -2.436 .506 -.145额工资(国有+集体)人均各种津贴(国8.151 21.768 2.431 2.394 .196 -2.436 26.114 -2.255 -.323有+集体)均从工作单位得-4.843 -5.232 -2.925 .261 .155 .506 -2.255 1.914 .307 到的其他收入个体劳动者收入-.269 -1.357 -.978 .004 -.106 -.145 -.323 .307 .5393 人均生活费收入292.972 38.451 14.013 37.178 13.567 78.758 -8.776 29.547 16.466 (元/人)人均国有经济单38.451 36.758 2.665 -13.730 -14.286 16.990 19.297 3.658 4.120位职工工资人均来源于国有14.013 2.665 .843 1.649 .400 4.905 -.783 1.806 .732经济单位标准工资人均集体所有制37.178 -13.730 1.649 16.731 11.802 8.488 -15.180 5.753 .532工资收入人均集体所有制13.567 -14.286 .400 11.802 9.278 1.340 -11.632 3.026 -.549职工标准工资人均各种奖金、超78.758 16.990 4.905 8.488 1.340 29.089 -3.967 10.556 4.171额工资(国有+集体)人均各种津贴(国-8.776 19.297 -.783 -15.180 -11.632 -3.967 18.898 -2.998 1.312 有+集体)均从工作单位得29.547 3.658 1.806 5.753 3.026 10.556 -2.998 7.891 .680到的其他收入个体劳动者收入16.466 4.120 .732 .532 -.549 4.171 1.312 .680 1.246To tal人均生活费收入(元/人)493.973 182.382 51.722 40.606 15.154 123.390 24.245 39.841 1.513 人均国有经济单位职工工资182.382 146.169 52.685 -20.328 -19.362 40.532 42.118 11.447 2.648 人均来源于国有经济单位标准工资51.722 52.685 37.092 -12.222 -7.958 7.157 5.158 -.595 -.133 人均集体所有制工资收入40.606 -20.328 -12.222 28.788 18.414 15.043 -11.572 5.872 -.720 人均集体所有制职工标准工资15.154 -19.362 -7.958 18.414 12.542 6.755 -10.523 2.711 -1.031 人均各种奖金、超额工资(国有+集体)123.390 40.532 7.157 15.043 6.755 37.318 1.737 13.194 .106 人均各种津贴(国有+集体)24.245 42.118 5.158 -11.572 -10.523 1.737 30.703 .708 2.548 均从工作单位得到的其他收入39.841 11.447 -.595 5.872 2.711 13.194 .708 8.911 .335 个体劳动者收入 1.513 2.648 -.133 -.720 -1.031 .106 2.548 .335 1.603a The total covariance matrix has 27 degrees of freedom.Box's Test of Equality of Covariance Matrices 协方差矩阵相等的检验Log Determinantsa Rank < 6b Too few cases to be non-singularTest Results(a)检验结果Box's M 195.630F Approx. 2.155df1 45df2 1314.073Sig. .000Tests null hypothesis of equal population covariance matrices.a Some covariance matrices are singular and the usual procedure will not work. The non-singular groupswill be tested against their own pooled within-groups covariance matrix. The log of its determinant is 17.611.注意,检验没有通过,即各类的协方差相等的假设在显著性水平下是不成立的。