实验四6 判别分析

  • 格式:docx
  • 大小:107.94 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、实验目的与要求

1.通过上机操作使学生掌握判别分析方法在SPSS软件中的实现,了解判别方法的分类、适用条件和结果验证方法;

2.要求学生熟悉判别分析的用途和操作,重点掌握对软件处理结果的解释(区域图、未标准化典型判别函数、Bayes判别函数)和如何使用分析结果对新样品进行分类;

3.要求学生阅读一定数量的文献资料,掌握判别分析方法在写作中的应用。

二、实验内容与步骤

判别分析和聚类分析有相似的作用,都是起到分类的作用。但是,判别分析是已知分类然后总结出判别准则,是一种有指导的学习;而聚类分析则是有了一批样本,不知道它们的分类,甚至连分成几类也不知道,希望用某种方法把观测进行合理的分类,使得同一类的观测比较接近,不同类的观测相差较多,这是无指导的学习。判别分析是用于判断个体所属类别的一种统计方法。根据已知观测对象的分类和若干表明观测对象特征的变量值,建立判别函数和判别准则,并使其错判率最小,对于一个未知分类的样本,将所测指标代入判别方程,从而判断它来自哪个总体。当然,这种准则在某种意义上是最优的,如错判概率最小或错判损失最小等。其前提是总体均值有显著差异,否则错分率大,判别分析无意义。例如,我们有了患胃炎的病人和健康人的一些化验指标,就可以从这些化验指标发现两类人的区别,把这种区别表示为判别公式,然后对怀疑患胃炎的人就可以根据其化验指标用判别公式诊断。

判别分析

SPSS 软件中的Analyze→ Classify→Discriminant,就进入了判到分析的对话框。作判别分析时,数据文件包含一个分组变量(grouping variable)。选择分组变量的范围,即分类数目。最小值为1,最大值是组数。然后选择判别变量,点击OK完成基本的判别分析。

另外,如果需要作更深入的分析,可选择其他项。统计量( statistics) 选项中可以选择描述统计量Mean, ANVOA, Box'M,函数可以选择Fisher 和非标准化函数,问时还可选择使用哪种矩阵。分类( c1assify) 选项中可以选择先验概率。子选项显示(display) 中可出选择每个个体的结果(casewise results) ,综合表(summery table) 和交叉确认的验证原则,还可以选择使用哪种协方差矩阵以及作图。保存(save) 选项中可以选择预测的分类、判别得分以及所属分类的概率。当然,变量较多时,还可以选择逐步判别的方法(method) 。

可以深入分析的选择

注意:这个框图中的Fisher’s给出的是贝叶斯判别函数的系数!切记切记!SPSS 默认的判别法是标准化的费歇判别法,但在软件里叫典则判别法。Function Coeffìcients 栏中的 Unstandardized 输出非标准化的费歇判别函数。

要想知道每个样品的判别结果,要在这个框图里把Casewise results 前面的小方块打钩,在Leave-one-out classification之前打钩可以确定交叉误判率。

实例:1991年我国30个省市自治区城镇居民收入的判别分析

SPSS 输出结果如下:

Summary of Canonical Discriminant Functions

因为是3组判别,有两个费歇判别函数。一般地,K组判别时,最多可采用K-1个费歇判别函数。

此表反映两个判别函数的检验结果,采用Wilk’ Lambda统计量。

这个表是软件默认输出的标准化费歇判别函数的系数。

结构矩阵表为判别变量与表转化判别函数之间的合并组内相关系数。

这个表给出的是非标准化费歇判别函数的系数。只有点选相关选项才会给出。

此表为组重心函数值表。

先验概率表,软件默认的是等先验概率,用于贝叶斯判别分析。

这个表包含每个样品的回判结果,可以看出哪些样品被误判了(带星号的样品)。还可以看出待判样品的归属(广东属于第3组,西藏属于第一组)。

这个表用于计算回代误判率和交叉确认误判率。显然,回代误判率为0,交叉确

认误判率为5

100%17.86%

28

⨯=(本属于第一组的11个样品中,有2个误判到第

二组,1个误判到第三组;本属于第三组的6个样品中,有2个误判到第一组)。

三、实验心得与体会