当前位置:文档之家› spss进行判别分析步骤

spss进行判别分析步骤

spss进行判别分析步骤
spss进行判别分析步骤

spss进行判别分析步骤

1.Discriminant

Analysis判别分析主对话框

如图1-1 所示

图1-1 Discriminant

Analysis 主对话框

(1)选择分类变量及其范围

在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量),

按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。

此时矩形框下面的Define Range

按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。

图1-2 Define Range 对话框

在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue

按钮返回主对话框。

(2)指定判别分析的自变量

图1-3 展开Selection

Variable 对话框的主对话框

在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮。

把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。

(3)选择观测量

图1-4 Set Value

子对话框

如果希望使用一部分观测量进行判别函数的推导而且有一

个变量的某个值可以作为这些观测量的标识,

则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3

所示。

并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮,

展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值,

一般均使用数据文件中的所有合法观测量此步骤可以省略。(4)选择分析方法

在主对话框中自变量矩形框下面有两个选择项,被选中的方法前面的圆圈中加有黑点。这两个选择项是用于选择判别分

析方法的

l Enter

independent together

选项,当认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析,建立全模型,不需要进一步进行选择。

l Use

stepwise method

选项,当不认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。因此需要判别贡献的大小,再进行选择当鼠标单击该项时Method

按钮加亮,可以进一步选择判别分析方法。

2.Method对话框如图

1-5 所示:

图1-5 Stepwise Method

对话框

单击“Method”按钮展开Stepwise Method对话框。

(1)Method 栏选择进行逐步判别分析的方法

可供选择的判别分析方法有:

l Wilks'lambda 选项,每步都是Wilk 的概计量最小的进入判别函数

l Unexplained variance

选项,每步都是使各类不可解释的方差和最小的变量进入判别函数。

l Mahalanobis’distance

选项,每步都使靠得最近的两类间的Mahalanobis 距离最大的变量进入判别函数

l Smallest F ratio 选项,每步都使任何两类间的最小的F 值最大的变量进入判刑函数

l Rao’s V 选项,每步都会使Rao V

统计量产生最大增量的变量进入判别函数。可以对一个要加入到模型中的变量的V

值指定一个最小增量。选择此种方法后,应该在该项下面的V-to-enter

后的矩形框中输入这个增量的指定值。当某变量导致的V值增量大于指定值的变量后进入判别函数。

(2) Criteria 栏选择逐步判别停止的判据

可供选择的判据有:

l Use F value

选项,使用F值,是系统默认的判据当加人一个变量(或剔除一个变量)后,对在判别函数中的变量进行方差分析。当计算的F值大于指定的Entry

值时,该变量保留在函数中。默认值是Entry为3.84:当该变量使计算的F值小于指定的Removal

值时,该变量从函数中剔除。默认值是Removal为2.71。即当被加入的变量F 值为3.84

时才把该变量加入到模型中,否则变量不能进入模型;或者,当要从模型中移出的变量F值<2.71时,该变量才被移出模型,否则模型中的变量不会被移出.设置这两个值时应该注意Entry值〉Removal

值。

l Use Probability of

F选项,用F检验的概率决定变量是否加入函数或被剔除而

不是用F值。加入变量的F值概率的默认值是0.05(5%);移出变量的F

值概率是0.10(10%)。Removal值(移出变量的F值概率) >Entry值(加入变量的F值概率)。

(3) Display栏显示选择的内容

对于逐步选择变量的过程和最后结果的显示可以通过Display 栏中的两项进行选择:

l Summary of steps

复选项,要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。

l F for Pairwise distances

复选项,要求显示两两类之间的两两F 值矩阵。

3.Statistics对话框指定输出的统计量如图1-6

所示:

图1-6 Statistics 对话框

可以选择的输出统计量分为以下3 类:

(l) 描述统计量

在Descriptives 栏中选择对原始数据的描述统计量的输出:

l Means 复选项,可以输出各类中各自变量的均值MEAN、标准差std Dev

和各自变量总样本的均值和标准差。

l Univariate ANOV

复选项,对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。

l Box’s M

复选项,对各类的协方差矩阵相等的假设进行检验。如果样本足够大,表明差异不显著的p 值表明矩阵差异不明显。

(2) Function coefficients 栏:选择判别函数系数的输出形式

l Fisherh’s

复选项,可以直接用于对新样本进行判别分类的费雪系数。对每一类给出一组系数。并给出该组中判别分数最大的观测量。

l Unstandardized 复选项,未经标准化处理的判别系数。

(3) Matrices 栏:选择自变量的系数矩阵

l Within-groups correlation

matrix复选项,即类内相关矩阵,

它是根据在计算相关矩阵之前将各组(类)协方差矩阵平均后计算类内相关矩阵。

l Within-groups covariance

matrix复选项,即计算并显示合并类内协方差矩阵,

是将各组(类)协方差矩阵平均后计算的。区别于总协方差阵。

l Separate-groups covariance

matrices复选项,对每类输出显示一个协方差矩阵。

l Total covariance

matrix复选项,计算并显示总样本的协方差矩阵。

4.Classification

对话框指定分类参数和判别结果如图1-7 所示

图1-7 Classification 对话框

5.Save对话框,指定生成并保存在数据文件中的新变量。如图1-8

所示:

图1-8 Save 对话框

6.选择好各选择项之后,点击“OK”按钮,提交运行

Discriminant过程。

SPSS主成分分析操作步骤,详细的很啊^_^==

SPSS主成分分析操作步骤,详细的很啊^_^ SPSS在调用Factor Analyze过程进行分析时,SPSS会自动对原始数据进行标准化处理,所以在得到计算结果后指的变量都是指经过标准化处理后的变量,但SPSS不会直接给出标准化后的数据,如需要得到标准化数据,则需调用Descriptives过程进行计算。 图表 3 相关系数矩阵

图表 4 方差分解主成分提取分析表 主成分分析在SPSS中的操作应用(3) 图表 5 初始因子载荷矩阵

从图表3可知GDP与工业增加值,第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、地方财政收入这几个指标存在着极其显著的关系,与海关出口总额存在着显著关系。可见许多变量之间直接的相关性比较强,证明他们存在信息上的重叠。 主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。注:特征值在某种程度上可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此一般可以用特征值大于1作为纳入标准。通过图表4(方差分解主成分提取分析)可知,提取2个主成分,即m=2,从图表5(初始因子载荷矩阵)可知GDP、工业增加值、第三产业增加值、固定资产投资、基本建设投资、社会消费品零售总额、海关出口总额、地方财政收入在第一主成分上有较高载荷,说明第一主成分基本反映了这些指标的信息;人均GDP和农业增加值指标在第二主成分上有较高载荷,说明第二主成分基本反映了人均GDP和农业增加值两个指标的信息。所以提取两个主成分是可以基本反映全部指标的信息,所以决定用两个新变量来代替原来的十个变量。但这两个新变量的表达还不能从输出窗口中直接得到,因为“Component Matrix”是指初始因子载荷矩阵,每一个载荷量表示主成分与对应变量的相关系数。用图表5(主成分载荷矩阵)中的数据除以主成分相对应的特征值开平方根便得到两个主成分中每个指标所对应的系数[2]。将初始因子载荷矩阵中的两列数据输入(可用复制粘贴的方法)到数据编辑窗口(为变量B1、B2),然后利用“TransformàCompute Variable”,在Compute Variable对话框中输入“A1=B1/SQR(7.22)” [注:第二主成分SQR后的括号中填1.235],即可得到特征向量A1(见图表6)。同理,可得到特征向量A2。将得到的特征向量与标准化后的数据相乘,然后就可以得出主成分表达式[注:因本例只是为了说明如何在SPSS进行主成分分析,故在此不对提取的主成分进行命名,有兴趣的读者可自行命名]: F 1=0.353ZX 1 +0.042ZX 2 -0.041ZX 3 +0.364ZX 4 +0.367ZX 5 +0.366ZX 6 +0.352ZX 7 +0.364ZX 8+0.298ZX 9 +0.355ZX 10

SPSS操作方法:判别分析例题

为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 5

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→ Classify→ Discriminant,打开Discriminant Analysis 判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法 Enter independent together 所有变量全部参与判别分析(系统默 认)。本例选择此项。 Use stepwise method 采用逐步判别法自动筛选变量。

SPSS操作方法:判别分析例题

实验指导之二 判别分析的SPSS软件的基本操作 [实验例题]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 x5:人均集体所有制职工标准工资

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→Classify→Discriminant,打开Discriminant Analysis判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range 对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法

多元统计分析--判别分析SPSS实验报告

实验课程名称: __多元统计分析--判别分析___

准则判别归类,则可写成: ?? ? ??=>∈<∈) ,(),( ,),(),(,),(),(,21212211G X D G X D G X D G X D G X G X D G X D G X 当待判当当 题目:表11.5的数据包含三种鸢尾的X2=萼片宽度与X4=花瓣的宽度的观测值。对每种鸢尾有n1=n2=n3=50个观测值。 部分数据:

第二部分:实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过程发现的问题等) 散点图:图形→旧对话框→散点图,打开简单散点图子对话框;将想X2选入X轴变量,X4选入Y轴变量,将总体选入设置标记框中,点击确定。 判别分析: 步骤: 1、选择分析→分类→判别,打开判别分析子对话框。 2、选择变量“总体”,单击→,将其加入到分组变量栏中。 3、打开定义范围子对话框,最小值输入1,最大值输入3。 4、将变量“X2萼片宽度”、“X4花瓣的宽度”选入自变量栏中。选择“一起输入自 变量”的方法。 5、打开统计变量子对话框,选择均值、单变量ANOVA、Box’M、未标准化、组内协 方差、分组协方差及总体协方差,单击继续。 6、打开分类子对话框,选择不考虑该个案时的分类,其余为默认值。 7、打开保存,选择所有的变量。

相关系数矩阵a 总体萼片宽度X2 花瓣宽度X4 合计萼片宽度X2 .190 -.122 花瓣宽度X4 -.122 .581 对数行列式 总体秩对数行列式 1 2 -6.496 2 2 -6.141 3 2 -5.189 汇聚的组内 2 -5.583 检验结果 箱的M 52.832 F 近似。8.632 df1 6 df2 538562.769 Sig. .000 Wilks 的Lambda 函数检 验Wilks 的Lambda 卡方df Sig. 1 到 2 .038 477.868 4 .000 2 .809 31.075 1 .000 典型判别式函数系数 函数 1 2 萼片宽度X2 -1.987 2.680 花瓣宽度X4 5.477 .817 (常量) -.494 -9.174 非标准化系数

spss进行判别分析步骤

spss进行判别分析步骤1.Discriminant Analysis判别分析主对话框 图1-1 Discriminant Analysis 主对话框

(1)选择分类变量及其范围 在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量), 按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。 此时矩形框下面的Define Range 按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。 图1-2 Define Range 对话框 在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue 按钮返回主对话框。 (2)指定判别分析的自变量 图1-3 展开Selection Variable 对话框的主对话框 在主对话框的左面的变量表中选择表明观测量特征的变量,按下面箭头按钮。

把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。(3)选择观测量 图1-4 Set Value 子对话框 如果希望使用一部分观测量进行判别函数的推导而且有一个变量的某个值可以作为这些观测量的标识, 则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3 所示。 并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮, 展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值, 一般均使用数据文件中的所有合法观测量此步骤可以省略。 (4)选择分析方法

SPSS操作方法:判别分析例题

SPSS操作方法:判别分析例题

实验指导之二 判别分析的SPSS软件的基本操作 [实验例题] 为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方 距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x 1 :人均生活费收入 x 6 :人均各种奖金、超额工资(国有+集体) x 2 :人均国有经济单位职工工资 x 7 :人均各种津贴(国有+集体) x 3 :人均来源于国有经济单位标准工资 x 8 :人均从工作单位得到的其他收入 x 4 :人均集体所有制工资收入 x 9 :个体劳动者收入 x 5 :人均集体所有制职工标准工资 样品序地区x 1x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 类序 G 11 北京170.03110.259.768.38 4.4926.8016.4411.90.41 2 天津141.5582.5850.9813.49.3321.3012.369.21 1.05 3 河北119.4083.3353.3911.07.5217.3011.7912.00.70 4 上海194.53107.860.2415.68.8831.0021.0111.80.16 5 山东130.4686.2152.3015.910.520.6l12.149.610.47 6 湖北119.2985.4153.0213.18.4413.8716.478.380.51 7 广西134.46 98.6148.188.90 4.3421.4926.1213.6 4.56 8 海南143.79 99.97 45.60 6.30 1.56 18.67 29.49 11.8 3.82 9 四川128.05 74.96 50.13 13.9 9.62 16.14 10.18 14.5 1.21 10 云南127.41 93.54 50.57 10.5 5.87 19.41 21.20 12.6 0.90

spss进行判别分析步骤

spss进行判别分析步骤 1.Discriminant Analysis判别分析主对话框 如图1-1 所示 图1-1 Discriminant Analysis 主对话框 (1)选择分类变量及其范围 在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量),

按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。 此时矩形框下面的Define Range 按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。 图1-2 Define Range 对话框 在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue 按钮返回主对话框。 (2)指定判别分析的自变量

图1-3 展开Selection Variable 对话框的主对话框 在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮。 把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。 (3)选择观测量 图1-4 Set Value 子对话框

如果希望使用一部分观测量进行判别函数的推导而且有一 个变量的某个值可以作为这些观测量的标识, 则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3 所示。 并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮, 展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值, 一般均使用数据文件中的所有合法观测量此步骤可以省略。(4)选择分析方法 在主对话框中自变量矩形框下面有两个选择项,被选中的方法前面的圆圈中加有黑点。这两个选择项是用于选择判别分

用SPSS软件来实现判别分析

哈尔滨商业大学 数学实验报告 实验题目:___用SPSS软件来实现判别分析___________ 姓名:__张彦琛_____ 学号:__2____ 专业:____数学与应用数学_____________________ 日期:______2012-10-27_______________________

一、实验目的 用SPSS软件来实现判别分析及其应用。 二、实验内容 已知某研究对象分为3类,每个样品考察4项指标,各类观测的样品数分别为7,4,6;另外还有2个待判样品分别为 第一个样品:x1=-8,x2=-14,x3=16,x4=56 第二个样品:x1=92,x2=-17,x3=18,x4=3.0 三、实验步骤及结论 (一)实验步骤 把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行判别分析。执行菜单命令,单击“分析—>分类—>判别”,进行操作步骤……点击确定,即可得到实验结论。(二)实验结论 表一: 检验结果a 箱的 M 35.960 F 近似。 2.108 df1 10 df2 537.746 Sig. .022 对相等总体协方差矩阵的零假设进行检验。 a. 有些协方差矩阵是奇异矩阵,因此一般程序不会起作用。将相对非奇异 组的汇聚组内协方差矩阵检验非奇异组。其行列式的对数为 18.794。 表一是box检验的结果。Box的检验结果是35.390,Sig.的值为0.0022<0.05,拒绝原假设,即每类的协差阵不完全相等。

表二: 表二是特征值。从表中知第一个特征值是3.116,方差贡献率为99.6%,累计贡献率为99.6%,判断率为99.6%,则第一判别函数有效。 表三: 表三给出了Fisher判别函数的有效性检验。由表三知第一个Sig.的值为0.022<0.05,拒绝原假设,检验是显著的,进而说明第一Fisher 判别函数是有效的。而第二个Sig.的值为0.985>0.05,第二Fisher 判别函数不显著,即不有效。 表四: 典型判别式函数系数 函数 1 2 x1 .010 .023 x2 .543 -.107 x3 .047 -.024 x4 -.068 .001 (常量) 9.240 -1.276 非标准化系数

判别分析实验报告 SPSS

一、实验目的及要求: 1、目的 用SPSS软件实现判别分析及其应用。 2、内容及要求 用SPSS对实验数据利用Fisher判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等13个地级市分别属于哪个管理水平类型。 二、仪器用具: 三、实验方法与步骤: 准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS 数据文件中,同时,由于只有当被解释变量是属性变量而解释变量是度量变量时,判别分析才适用,所以将城市管理的7个效率指数变量的变量类型改为“数值(N)”,度量标准改为“度量(S)”,以备接下来的分析。 四、实验结果与数据处理: 表1是对各组均值是否相等的检验,由该表可以看出,在0.05的显著性水平上我们不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设,即认为除了结构效率标准指数和环境效率标准指数外,其余五个标准指数在三组的均值是有显著差异的。

表2 对数行列式 group 秩对数行列式 1 6 -33.410 2 6 -33.177 3 6 -40.584 汇聚的组内 6 -32.308 打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数。 表3 检验结果 箱的 M 140.196 F 近似。 2.498 df1 42 df2 1990.001 Sig. .000 对相等总体协方差矩阵的零假设进行检验。 以上是对各组协方差矩阵是否相等的Box’M检验,表2反映协方差矩阵的秩和行列式的对数值。由行列式的值可以看出,协方差矩阵不是病态矩阵。表3是对各总体协方差阵是否相等的统计检验,由F值及其显著水平,在0.05的显著性水平下拒绝原假设,认为各总体协方差阵不相等。 1)Fisher判别法: 图一

相关主题
文本预览
相关文档 最新文档