Page 5
SVM的描述
期望风险R(w)要依赖联合概率F(x,y)的信息, 实际问题中无法计算。 一般用经验风险Remp(w)代替期望风险R(w)
1 R (w ) L(yi , f (xi , w )) emp n i1 错分数 n
n
Page 6
一般模式识别方法的问题
经验风险最小不等于期望风险最小,不能保证 分类器的推广能力. 经验风险只有在样本数无穷大趋近于期望风险, 需要非常多的样本才能保证分类器的性能。 需要找到经验风险最小和推广能力最大的平衡 点。
解决的方法是采用最大间隔原则。 最大间隔原则:选择使得训练集D对于线性函数 (w· x)+b的几何间隔取最大值的参数对(w,b),并 由此构造决策函数。 在规范化下,超平面的几何间隔为 于是,找最大几何间隔的超平面 表述成如下的最优化问题:
m in
1 w
1 2 w w , b 2 (1) s . t . y w x b ) 1 ,i 1 , ,n i(( i)
n 1 2 min w C i w ,b , 2 i 1 s .t. y w zi )b ) 1 1 , ,n i (( i ,i
(8)
,i 1 , ,n i 0
Page 21
支持向量(分类)机
问题(8)对应的对偶问题为:
n 1 n n min yi yjij K(xi xj ) j 2 i1 j1 j 1
Page 4
模式识别问题的一般描述
已知:n个观测样本,(x1,y1), (x2,y2)…… (xn,yn) 求:最优函数y’= f(x,w) 满足条件:期望风险最小
R ( w ) L ( y , f ( x , w )) dF ( x , y )