另外就分成多少类来说,也要有道理。只要你高 兴,从分层聚类的计算机结果可以得到任何可能 数量的类。但是,聚类的目的是要使各类距离尽 可能的远,而类中点的距离尽可能的近,而且分 类结果还要有令人信服的解释。这一点就不是数 学可以解决的了。
判 别 分 析
n 概述 n 距离判别法 n 贝叶斯判别法 n 费歇尔判别法 n 逐步判别法
14
判别分析举例:
根据发掘出来的人类头盖骨的高、宽等特征来 判断其是男性还是女性。
在税务稽查中,要判断某企业是否偷漏税。 医生对病情的诊断。 信用风险的判定。 成功概率的判定。 企业运行状态或财务状况的判定。
15
二、判别分析的种类
1、按判别的组数分有两组判别分析和多组 判别分析
2、按区分不同总体所用的数学模型分有 线性判别和非线性判别
样本X和Gi类之间的马氏距离定义为X与Gi类重
心间的距离: d 2 ( x , G i ) ( x i ) 1 ( x i )i 1 , 2 , , k 19
马氏距离和欧式距离之间的差别
马氏距离 d 2 (x ,G ) (x -μ ) Σ - 1 ( x -μ )
欧氏距离 d 2 (x ,G ) (x -μ )(x -μ )
设 x (x 1 ,x 2, ,x m )和 y (y 1 ,y 2 , ,y m )是从
期望μ= (1 , 2, , m ) 和方差阵Σ=
ijm m0
的总体G抽得的两个观测值,则
X与Y之间的Mahalanobis距离
d 2 ( x ,y ) ( x y ) 1 ( x y )
xx G G12, ,
如d2(x,G1) d2 x,G2 如d2 x,G2 d2 x,G1
22
1 pp