SPSS操作方法:判别分析例题
- 格式:doc
- 大小:498.50 KB
- 文档页数:16
第五节判别分析判别分析是根据观察或测量到的若干变量值,判断研究对象如何分类的方法。
判别函数一般形式是:F1= a i1x1+a i2x2+a i3x3...+a in x nF2= a i1x1+a i2x2+a i3x3...+a in x n: :F m= a m1x1+a m2x2+a m3x 3...+a mn x nSPSS提供的判别分析过程是Discriminant过程。
【例3-9】浙江北部地区1950~1982年小麦赤霉病发生程度与气象因子研究,总结出上年12月降雨量(x1)、上年10月下旬至11月中旬和当年1~2月总降雨(x2)、上年10月下旬至11月上旬日照时数(x3)、上年10月下旬至12月中旬和当年2月总雨量(x4)以及当年3月中旬平均温度(x5)等5个因子,并将赤霉病情分为轻中重三级(y,分别用1、2、3表示)。
用这些数据建立气象因子与小麦赤霉病发生程度的判别模型。
年份x1x2x3x4x5y195014.3107.3140.0105.3 6.91 195146.5129.1154.191.311.91 195243.0143.183.9157.413.02 195371.2280.582.5317.413.93 1954.769.3145.669.511.31 1955123.9297.364.6307.213.73 195685.4115.439.4144.711.11 195738.477.394.6143.213.92 195879.696.885.499.09.62 195933.474.7129.5103.49.91 196048.195.9155.392.010.511955123.9297.364.6307.213.73 195685.4115.439.4144.711.11 195738.477.394.6143.213.92 195879.696.885.499.09.62 195933.474.7129.5103.49.91 196048.195.9155.392.010.51 19617.7116.3158.2148.115.11 19628.9225.3104.2195.513.81 196334.8150.7165.0124.611.91 196444.4147.288.3158.712.72 196574.2232.794.1154.613.53 1966.180.9148.881.311.01 1967119.6208.070.9217.813.83 196894.0130.249.2176.211.02 196932.983.6115.3135.713.82 197065.588.1126.9102.59.71 197131.359.3105.182.910.01 197252.393.3173.791.210.01 19737.298.2154.3120.715.01 1974 5.3245.8100.4200.213.711准备分析数据在SPSS数据管理窗口,定义变量名x1、x2、x3、x4、x5、y分别表示表中对应变量。
SPSS操作方法:判别分析例题为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。
试建立判别函数,判定广东、西藏分别属于哪个收入类型。
判别指标及原始数据见表9-4。
1991年30个省、市、自治区城镇居民月平均收人数据表单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体)x3:人均来源于国有经济单位标准工资x8:人均从工作单位得到的其他收入x4:人均集体所有制工资收入 x9:个体劳动者收入5贝叶斯判别的SPSS操作方法:1. 建立数据文件2.单击Analyze→ Classify→ Discriminant,打开Discriminant Analysis 判别分析对话框如图1所示:图1 Discriminant Analysis判别分析对话框3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。
从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。
选择后点击Continue按钮返回Discriminant Analysis主对话框。
图2 Define Range对话框4、选择分析方法Enter independent together 所有变量全部参与判别分析(系统默认)。
本例选择此项。
Use stepwise method 采用逐步判别法自动筛选变量。
单击该项时Method 按钮激活,打开Stepwise Method对话框如图3所示,从中可进一步选择判别分析方法。
一、案例背景随着现代人力资源管理理论的迅速开展,绩效考评技术水平也在不断提高。
绩效的多因性、多维性,要求对绩效实施多标准大样本科学有效的评价。
对企业来说,对上千人进展多达50~60个标准的考核是很常见的现象。
但是,目前多标准大样本大型企业绩效考评问题仍然困扰着许多人力资源管理从业人员。
为此,有必要将当今国际上最流行的视窗统计软件SPSS应用于绩效考评之中。
在分析企业员工绩效水平时,由于员工绩效水平的指标很多,各指标之间还有一定的关联性,缺乏有效的方法进展比拟。
目前较理想的方法是非参数统计方法。
本文将列举某企业的具体情况确定适当的考核标准,采用主成分分析以及聚类分析方法,比拟出各员工绩效水平,从而为企业绩效管理提供一定的科学依据。
最后采用判别分析建立判别函数,同时与原分类进展比拟。
聚类分析二、绩效考评的模型建立1、为了分析某企业绩效水平,按照综合性、可比性、实用性和易操作性的选取指标原那么,本文选择了影响某企业绩效水平的成果、行为、态度等6个经济指标(见表1)。
2、对某企业,搜集整理了28名员工2021年第1季度的数据资料。
构建1个28×6维的矩阵(见表2)。
3、应用SPSS数据统计分析系统首先对变量进展及主成分分析,找到样本的主成分及各变量在成分中的得分。
去结果中的表3、表4、表5备用。
表 5成份得分系数矩阵a成份1 2Zscore(X1) .227Zscore(X2) .228Zscore(X3) .224Zscore(X4) .177Zscore(X5) .186 .572Zscore(X6) .185 .587提取方法 :主成份。
构成得分。
a. 系数已被标准化。
4、从表3中可得到前两个成分的特征值大于1,分别为3.944和1.08,所以选取两个主成分。
根据累计奉献率超过80%的一般选取原那么,主成分1和主成分2的累计奉献率已到达了83.74%的水平,说明原来6个变量反映的信息可由两个主成分反映83.74%。
用SPSS软件来实现判别分析哈尔滨商业大学实验题目:___用SPSS软件来实现判别分析___________ 姓名:__张彦琛_____ 学号:__201214390009____数学与应用数学_____________________ 专业:____日期:______2012-10-27_______________________成绩一、实验目的用SPSS软件来实现判别分析及其应用。
二、实验内容已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为第一个样品:x1=-8,x2=-14,x3=16,x4=56 第二个样品:x1=92,x2=-17,x3=18,x4=3.0 三、实验步骤及结论(一)实验步骤把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行判别分析。
执行菜单命令,单击“分析—>分类—>判别”,进行操作步骤……点击确定,即可得到实验结论。
(二)实验结论表一:a检验结果箱的 M 35.960F 近似。
2.108df1 10df2 537.746Sig. .022对相等总体协方差矩阵的零假设进行检验。
a. 有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。
将相对非奇异组的汇聚组内协方差矩阵检验非奇异组。
其行列式的对数为 18.794。
表一是box检验的结果。
Box的检验结果是35.390,Sig.的值为0.0022<0.05,拒绝原假设,即每类的协差阵不完全相等。
表二:特征值函数特征值方差的 % 累积 % 正则相关性a1 3.116 99.6 99.6 .870a2 .012 .4 100.0 .111a. 分析中使用了前 2 个典型判别式函数。
表二是特征值。
从表中知第一个特征值是3.116,方差贡献率为99.6%,累计贡献率为99.6%,判断率为99.6%,则第一判别函数有效。
表三:Wilks 的 Lambda函数检验 Wilks 的 Lambda 卡方 df Sig.1 到2 .240 17.840 8 .0222 .988 .1543 .985表三给出了Fisher判别函数的有效性检验。
spss判别分析案例详解SPSS判别分析案例详解。
在统计学中,判别分析是一种用于确定不同组别之间差异的统计方法。
它可以帮助我们理解不同变量之间的关系,以及这些变量在预测和分类方面的作用。
在本文中,我们将通过一个实际的案例来详细介绍如何使用SPSS进行判别分析。
案例背景:假设我们是一家电子商务公司的数据分析师,我们想要确定哪些因素对于用户购买高价值产品的决策具有影响力。
我们收集了一些用户的个人信息和他们的购买行为数据,希望通过判别分析找出影响用户购买高价值产品的关键因素。
数据准备:首先,我们需要将收集到的数据导入SPSS软件中。
在导入数据后,我们可以对数据进行初步的检查,确保数据的完整性和准确性。
接下来,我们需要选择判别分析作为我们的分析方法,并将购买高价值产品作为分类变量,个人信息和购买行为数据作为判别变量。
分析步骤:1. 设定判别分析的目的和假设,在进行判别分析之前,我们需要明确分析的目的是什么,以及我们的假设是什么。
在这个案例中,我们的目的是找出影响用户购买高价值产品的关键因素,我们的假设是个人信息和购买行为数据会对用户的购买决策产生影响。
2. 进行判别分析,在设定好目的和假设后,我们可以开始进行判别分析。
SPSS 会根据我们选择的分类变量和判别变量,自动进行变量选择和模型拟合,得出判别函数和判别系数。
通过判别函数和判别系数,我们可以了解每个判别变量对于不同组别的影响程度,以及它们对于用户购买高价值产品的预测能力。
3. 结果解释,在得出判别函数和判别系数后,我们需要对结果进行解释。
我们可以通过判别函数的系数来理解每个判别变量对于用户购买高价值产品的影响程度,以及它们之间的相互关系。
同时,我们还可以通过判别系数的大小来评估判别模型的预测能力和区分能力。
案例分析:通过对案例数据的判别分析,我们得出了以下结论:1. 个人收入、年龄和教育程度是影响用户购买高价值产品的重要因素,其中个人收入对用户购买高价值产品的影响最大,其次是年龄和教育程度。
为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。
试建立判别函数,判定广东、西藏分别属于哪个收入类型。
判别指标及原始数据见表9-4。
1991年30个省、市、自治区城镇居民月平均收人数据表单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体)x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入x4:人均集体所有制工资收入 x9:个体劳动者收入5贝叶斯判别的SPSS操作方法:1. 建立数据文件2.单击Analyze→ Classify→ Discriminant,打开Discriminant Analysis 判别分析对话框如图1所示:图1 Discriminant Analysis判别分析对话框3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。
从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。
选择后点击Continue按钮返回Discriminant Analysis主对话框。
图2 Define Range对话框4、选择分析方法Enter independent together 所有变量全部参与判别分析(系统默认)。
本例选择此项。
Use stepwise method 采用逐步判别法自动筛选变量。
单击该项时Method 按钮激活,打开Stepwise Method对话框如图3所示,从中可进一步选择判别分析方法。
图3 Stepwise Method对话框Method栏,选择变量的统计量方法Wilks’lambda (默认)按统计量Wilks λ最小值选择变量;Unexplained variance :按照所有组方差之和最小值选择变量;Mahalanobis’distance:按照相邻两组的最大马氏距离选择变量;Smallest F ratio:按组间最小F值比的最大值选择变量;Rao’s V按照统计量Rao V最大值选择变量。
Criteria 选择逐步回归的标准(略)选择系统默认项。
5.单击Statistics 按钮,打开Statistics对话框如图4所示,从中指定输出的统计量。
Descriptives描述统计量栏Means -各类中各自变量的均值,标准差std Dev 和各自变量总样本的均值和标准差(本例选择)。
Univariate ANOV----对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果(本例选择)。
Box’s M --对各类的协方差矩阵相等的假设进行检验(本例选择)。
图4 Statistics对话框Function coefficients 选择输出判别函数系数Fisherh’s 给出贝叶斯判别函数系数(本例选择)Unstandardized 给出未标准化的典型判别(也称典则判别)系数(费舍尔判别函数)。
Matrices 栏选择给出的自变量系数矩阵Within-groups correlation 合并类内相关系数矩阵(本例选择)Within-groups covariance 合并类内协方差矩阵(本例选择)Separate-groups covariance 各类内协方差矩阵(本例选择)Total covariance 总协方差矩阵(本例选择)6.单击Classify按钮,打开Classify对话框如图5所示:图5 Classify对话框Prior Probabilities栏,选择先验概率。
All groups equal 各类先验概率相等(系统默认);Compute from groups sizes 各类的先验概率与其样本量成正比. (本例选择)Use Covariance Matrix 栏,选择使用的协方差矩阵Within-groups --使用合并类内协方差矩阵进行分类(系统默认)(本例选择)Separate-groups --使用各类协方差矩阵进行分类Display栏,选择生成到输出窗口中的分类结果Casewise results 输出每个观测量包括判别分数实际类预测类(根据判别函数求得的分类结果)和后验概率等。
Summary table 输出分类的小结给出正确分类观测量数(原始类和根据判别函数计算的预测类相同)和错分观测量数和错分率(本例选择)。
Leave-one-out classification 输出交互验证结果。
Plots栏,要求输出的统计图Combined-groups 生成一张包括各类的散点图(本例选择);Separate-groups 每类生成一个散点图;Territorial map 根据生成的函数值把各观测值分到各组的区域图。
(本例选择)6.单击Save 按钮,打开Save对话框,见图6.图6 Save对话框Predicted group membership 建立一个新变量,系统根据判别分数,把观测量按后验概率最大指派所属的类;(本例选择)Discriminant score 建立表明判别得分的新变量,该得分是由未标准化的典则判别函数计算。
(本例选择)Probabilities of group membership 建立新变量表明观测量属于某一类的概率。
有m 类,对一个观测量就会给出m 个概率值,因此建立m 个新变量。
(本例选择)全部选择完成后,点击OK,得到输出结果如下:Analysis Case Processing Summary 分类样本综述Unweighted Cases N PercentValid28Excluded Missing or out-of-range group codes2At least one missing discriminating variable0.0Both missing or out-of-range group codes andat least one missing discriminating variable0.0Total2Total30Group Statistics 各类统计分析分类Mean均值Std. Deviation标准差Valid N (listwise)有效样本数Unweighted Weighted1人均生活费收入(元/人)11人均国有经济单位职工工资11人均来源于国有经济单位标准工资11人均集体所有制工资收入11人均集体所有制职工标准工资11人均各种奖金、超额工资(国有+集体)11人均各种津贴(国有+集体)11均从工作单位得到的其他收入11个体劳动者收入11 2人均生活费收入(元/人)11人均国有经济单位职工工资11人均来源于国有经济单位标准工资11人均集体所有制工资收入11人均集体所有制职工标准工资11人均各种奖金、超额工资(国有+集体)11人均各种津贴(国有+集体)11均从工作单位得到的其他收入11Tests of Equality of Group Means每个变量各类均值相等的检验Pooled Within-Groups Matrices(a) 合并类内协方差阵和相关矩阵a The covariance matrix has 25 degrees of freedom.Covariance Matrices(a)类内协方差矩阵和总协方差阵3人均生活费收入(元/人)人均国有经济单位职工工资人均来源于国有经济单位标准工资.843.400.732人均集体所有制工资收入.532人均集体所有制职工标准工资.400人均各种奖金、超额工资(国有+集体)人均各种津贴(国有+集体)均从工作单位得到的其他收入.680个体劳动者收入.732.532.680To ta l人均生活费收入(元/人)人均国有经济单位职工工资人均来源于国有经济单位标准工资人均集体所有制工资收入人均集体所有制职工标准工资人均各种奖金、超额工资(国有+集体).106人均各种津贴(国有+集体).708均从工作单位得到的其他收入.708.335个体劳动者收入.106.335a The total covariance matrix has 27 degrees of freedom.Box's Test of Equality of Covariance Matrices 协方差矩阵相等的检验 Log DeterminantsThe ranks and natural logarithms of determinants printed are those of the group covariance matrices.a Rank < 6b Too few cases to be non-singularTest Results(a)检验结果Tests null hypothesis of equal population covariance matrices.a Some covariance matrices are singular and the usual procedure will not work. The non-singular groups will be tested against their own pooled within-groups covariance matrix. The log of its determinant is .注意,检验没有通过,即各类的协方差相等的假设在显著性水平下是不成立的。
Summary of Canonical Discriminant Functions典型判别函数综述Eigenvalues特征值a First 2 canonical discriminant functions were used in the analysis.只有两个判别函数,所以特征值只有两个。
判别函数的特征值越大,说明函数越具有区别判断力。
最后一列表示是典则相关系数,是组间平方和与总平方和之比的平方根,表示判别函数分数与组别间的关联程度。
Wilks' Lambda判别函数检验上表中“1through 2”表示两个判别函数的平均数在三个类间的差异情况,P值为表示差异达到显著水平。