TUNIVERSE

机器学习-支持向量机

字数统计: 536阅读时长: 2 min
2022/04/27 11

周志华西瓜书学习笔记

间隔与支持向量

超平面 (w,b),样本空间任意一点 x 到超平面的距离公式:

r=|wx+b|||w||

分子表示点到超平面的有向距离,分母表示超平面法向量 w 的范数(长度)。

对于二分类问题,给定一个训练样本集 D=(x1,y1),(x2,y2),,(xm,ym),yi1,+1. 假设超平面能够将训练样本正确分类,即对于 (xi,yi)D,若 yi=+1,则有 wxi+b>0;反之则小于0. 令

wxi+b+1,yi=+1

wxi+b1,yi=1

满足约束条件的距离超平面最近的这几个训练样本点被称为“支持向量” ;

两个边界之间的距离是 Γ=2||w||,称为间隔

image-20240103144710400

我们要做的事情是找到满足约束条件的 wb 参数,使得对应的间隔最大来划分超平面,根据间隔公式,我们只需要最大化 ||w||1,即最小化 ||w||2,即:

minw,b12||w||2 

s.t.yi(ωxi+b)1,i=1,2,,m.

使用拉格朗日乘子法得到其对偶问题,即为上述式子的每条约束添加拉格朗日乘子 αi0,则问题可以改写为:

L(ω,b,α)=12||ω||2+i=1mαi(1yi(ωxi+b))

其中 α=(α1;α2;;αm),对 ωb 求偏导并令偏导为0,可得到:

ω=i=1mαiyixi

0=i=1mαiyi

将第一个式子代入拉格朗日函数消去w和b,再考虑第二个式子的约束条件,可得到原问题的对偶问题:

maxαi=1mαi12i=1mj=1mαiαjyiyjxixj

s.t.i=1mαiyi=0,αi0,i=1,2,,m.

CATALOG
  1. 1. 间隔与支持向量