多元统计分析总结计划判别分析总结计划SPSS实验报告总结计划.doc

  • 格式:doc
  • 大小:503.04 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

实验课程名称:__ 多元统计分析 -- 判别分析 ___

实验项目名称实验成绩

实验者专业班级统计学0801组别

同组者实验日期年月日第一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备及耗

材,实验方案与技术路线等)

实验目的:

了解不同判别方法的原理及操作过程;

理解掌握 SPSS 软件中有关判别分析的基本操作;

能够用软件实际问题进行分类。

实验基本原理:判别分析是根据观察或测量到的若干变量值判断研究对象如何分类的方法。判别

分析是在已知分类数目的情况下,根据一定的指标对不知道的数据进行归类。

判别分析的目的是得到体现分类的函数关系式,即判别函数。基本思想是在已知观测对象的分

类和特征变量值得前提下,从中筛选出能提供较多信息的变量,并建立判别函数;目标是是得到的判别函

数在对观测量进行判别其所属类别时的错判概率最小。

判别函数的一般形式是:

y a1x1 a2 x2 a n x n

其中,y 为判别分数判别值;x1、

x2、x n为反映研究对象特征的变量;a1、a2、a n 为个变量的系数,即判别系数

常用的判别方法有距离判别法、Fisher 判别法和贝叶斯判别法等。

Bayes 判别法:假定对所研究的对象已有一定的认识,常用先验概率来描述这种认识。

设有 k 个总体G1, G2,, G k,它们的先验概率分别为q1,q2,q k

(它们可以由经验给出也可以估

出 )。各总体的密度函数分别为:f1 ( x), f2 ( x), , f k ( x)

(在离散情形是概率函数),在观测到一个样

品 x 的情况下,可用著名的 Bayes 公式计算它来自第 g 总体的后验概率(相对于先验概率来说,将它又称为后验概率):

P( g / x)

q g f g ( x)

g 1, ,k

k

q i f i ( x)

i 1

P( h / x)max P( g / x)

并且当

时,则判X 来自第 h 总体。

1 g k

距离判别法:首先计算X 到 G1、G2总体的距离,分别记为D( X, G1 )

D( X ,G2)

,按距离最近

准则判别归类,则可写成:

X G1 ,当 D ( X , G1 ) D ( X ,G 2 )

X G2 ,当 D ( X , G1 ) D ( X ,G2 )

待判 ,当D( X , G1)D ( X , G2 )

题目:表 11.5 的数据包含三种鸢尾的 X2= 萼片宽度与 X4=花瓣的宽度的观测值。对每种鸢尾有 n1=n2=n3=50 个观测值。

部分数据 :

第二部分:实验过程记录(可加页)(包括实验原始数据记录,实验现象记录,实验过

程发现的问题等)

散点图:图形→旧对话框→散点图,打开简单散点图子对话框;将想X2 选入X 轴变量, X4 选入 Y 轴变量,将总体选入设置标记框中,点击确定。

判别分析:

步骤 :

1、选择分析→分类→判别,打开判别分析子对话框。

2、选择变量“总体” ,单击→,将其加入到分组变量栏中。

3、打开定义范围子对话框,最小值输入1,最大值输入3。

4、将变量“ X2 萼片宽度”、“X4 花瓣的宽度”选入自变量栏中。选择“一起输入自

变量”的方法。

5、打开统计变量子对话框,选择均值、单变量ANOVA、Box’M、未标准化、组内协

方差、分组协方差及总体协方差,单击继续。

6、打开分类子对话框,选择不考虑该个案时的分类,其余为默认值。

7、打开保存,选择所有的变量。

组统计量

有效的 N(列表状态)

总体均值标准差未加权的已加权的

1 萼片宽度 X

2 3.428 .3791 50 50.000

花瓣宽度 X4 .246 .1054 50 50.000

2 萼片宽度 X2 2.770 .3138 50 50.000

花瓣宽度 X4 1.326 .1978 50 50.000

3 萼片宽度 X2 2.97

4 .322

5 50 50.000

花瓣宽度 X4 2.026 .2747 50 50.000

合计萼片宽度 X2 3.057 .4359 150 150.000 花瓣宽度 X4 1.199 .7622 150 150.000

组均值的均等性的检验

Wilks 的 Lambda F df1 df2 Sig.

萼片宽度X2 .599 49.160 2 147 .000 花瓣宽度X4 .071 960.007 2 147 .000

协方差矩阵 a

总体萼片宽度 X2 花瓣宽度 X4

1 萼片宽度 X

2 .144 .009

花瓣宽度 X4 .009 .011

2 萼片宽度 X2 .098 .041

花瓣宽度 X4 .041 .039

3 萼片宽度 X2 .10

4 .048

花瓣宽度 X4 .048 .075

合计萼片宽度 X2 .190 -.122

花瓣宽度 X4 -.122 .581

a. 总的协方差矩阵的自由度为149。

相关系数矩阵 a

总体萼片宽度 X2 花瓣宽度 X4

合计萼片宽度 X2 .190 -.122

花瓣宽度 X4 -.122 .581

对数行列式

总体秩对数行列式

1 2 -6.496

2 2 -6.141

3 2 -5.189

汇聚的组内 2 -5.583

检验结果

箱的 M 52.832

F 近似。8.632

df1 6

df2 538562.769

Sig. .000

Wilks 的 Lambda

函数检

验Wilks 的 Lambda 卡方df Sig.

1 到

2 .038 477.868 4 .000

2 .809 31.075 1 .000

典型判别式函数系数

函数

1 2

萼片宽度 X2 -1.987 2.680

花瓣宽度 X4 5.477 .817

(常量 ) -.494 -9.174

非标准化系数