6.3 距离判别分析
思想:根据已知分类的数据,分别计算各类的重心即 各组的均值,判别准则是对任给的一次观测,若它与 第i类的重心距离最近,就认为它来自第i类。 1.两总体距离判别
第1个总体G1 抽n1个样品
第2个总体G2抽 n2个样品
判别标准
D(X, G1 ) D(X, G 2 ) D(X, G1 ) D(X, G 2 ) D(X, G1 ) D(X, G 2 )
5-5
2.计算判别界值
计算各类判别值均值:
两均值中点为界点:
Y1 Y2 Y0 2
3.建立判别标准 (1)当 Y1 Y2 时,Y<Y0,则X∈G1,否则X∈G2 (2)当 Y1 Y2 时,Y<Y0,则X∈G2,否则X∈G1 (3)当 Y1 Y2 时,待判
5-6
4.实例分析
雨天(A) 晴天(B) 组别 湿温差 气温差 组别 湿温差 气温差 1 -1.9 3.2 2 0.2 6.2 1 -6.9 0.4 2 -0.1 7.5 1 5.2 2 2 0.4 14.6 1 5 2.5 2 2.7 8.3
(tab=table(G,newG)) #混淆矩阵
newG G 1 2 1 9 1 2 1 9
sum(diag(prop.table(tab)))=0.9 #判对率 predict(ld,data.frame(x1=8.1,x2=2.0),data=d6.1) #判对率判别分析 结论:明天x1=8.1,x2=2.0,预测明天是雨天,此 90%。 5次准确率为 -9
问题:现根据该资料建立判别函数,根据判别准则进 行回判,假设有一新厂商推销其产品,Q=8.0,C=7.5, P=65,预测该产品销售前景如何?
5 - 12