SAS软应用之判别分析PPT课件
- 格式:ppt
- 大小:1.95 MB
- 文档页数:58
S A S判别分析-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN课程:SAS判别分析部门:创新业务部-徐宝莲时间:2015/1/16内容概要:1、判别分析的简单介绍2、一般判别分析——PROC DISCRIM3、典型判别分析——PROC CANDISC4、逐步判别分析——PROC STEPDISC1、判别分析的简单介绍判别分析是一种应用性很强的统计方法。
它通常是根据已有的数据资料,来建立一种判别方法,然后再来判断一个新的样品归属哪一类。
判别分析的SAS过程所处理的数据集要求具有一个分类变量和若干个数值型变量。
SAS中进行判别分析的具体目标可以分为以下三条:建立判别函数,以便用来判别某一新的观测值的所属类别;寻找一组数值型变量的线性组合,使得其能够很好地反映各类别之间的差别;筛选出某些能反映类别间差别的变量。
2、一般判别分析——PROC DISCRIM2.1距离判别法距离判别法是通过计算距离函数来进行判别,即样品与哪个总体之间的距离最近,则判断它属于哪个总体。
如何衡量样品与总体间的这种抽象的距离?我们一般利用马氏距离来描述。
对于两总体的情形,设和是两个P维总体,样品X到的距离为,样品X到的距离为,则我们按照下面的准则对样本X进行判别归类:1)若,则判定X属于;2)若,则判定X属于;3)若,则X有待于进一步判定。
2.2Bayes判别法Bayes判别法是基于Bayes统计的思想,即假定事先对所研究的对象有一定的了解,并通过先验概率分布来进行描述,当抽取样本后,用样本来修正先验概率分布,并得到后验概率分布,然后根据后验概率分布进行各种统计推断。
Bayes判别法首先计算给定样品属于各个总体的条件概率,然后比较这些概率值的大小,将样品判归于条件概率最大的总体。
PROC DISCRIM DATA=数据集名<选项>;CLASS变量名列表;PRIORS概率值;BY 分组变量名;RUN;语句说明:1)PROC DISCRIM 语句用来调用DISCRIM 过程。