SVM难点解读.pptx_第1页
SVM难点解读.pptx_第2页
SVM难点解读.pptx_第3页
SVM难点解读.pptx_第4页
SVM难点解读.pptx_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SVM难点解读,助教:曹扬,直观理解为何要最大化间隔,如右图所示,假设我们已经学习了一个模型,将平面线性分割为两部分。 A离分界面很远,所以我们很有信心A的类型应该是x。 C离分界面很近,很小的波动就可能使它跑到分界面下方,所以我们对C的类型是x信心不大。,直观理解为何要最大化间隔,总的来说,一个点离分界面越远,我们对预测结果就越有信心。 因此,我们希望模型能让所有训练数据都离分界面尽量远。 一个例子:某次考试以60分为界,高于60分定为优生,低于60分定为差生。某学生成绩为90分,我们很有信心他是优生;某学生成绩为65分,我们不太确定他确实为优生。,SVM记号(接下来讨论的基础),输入为。

2、输出为 1, 1 。(注意不是0, 1) 这样,参数为(, )的SVM的表达式可写为 =( +) 其中 = 1, 0 1, 0 ,为系数,为截距(SVM中通常会把截距单独表示出来,而不是在中加一项常数1以便用表示截距)。从表达式可知该SVM分界面为 +=0。,SVM中的概念(接下来讨论的基础),函数间隔 几何间隔,函数间隔,给定一个训练数据( , ),和参数为(, )的SVM,该训练数据在该SVM下的函数间隔定义为 () = ( () +) 从该表达式可以看出,当和一定的时候,离分界面越远的训练数据函数间隔越大(可根据 的正负分情况讨论得出)。,将上图想象为一个3维空间。该SVM输入为2维,因

3、此 = +为三维空间中一个平面。,分界面即为 +=0,也就是 = +与水平面相交形成的直线。,比较A点和B点的函数间隔,可见A的函数间隔较大,函数间隔,但是,函数间隔并不适合作为优化的依据。假设我们把和都扩大为原来2倍,由函数间隔的定义可知,函数间隔也会扩大为原来2倍。但这样的扩大是没有意义的,因为SVM的分界面并没有变(依然是 +=0)。 所以,我们需要在满足某种归一化条件的基础上来最大化函数间隔。通常这个归一化条件是|=1。这就是几何间隔的定义。,分界面没有变化,函数间隔扩大为原来2倍,没有意义。,几何间隔,当我们限制|=1时,函数间隔就是几何间隔。 (可以想象为固定 = +平面与水平面的

4、夹角为45,此时构成的三角形为等腰直角三角形,函数间隔与几何间隔分别为两条腰,所以相等) 从右图可以看出。几何间隔,其实就是点到分界面的距离。(这也是几何间隔的定义) SVM要最大化间隔,需要的是最大化几何间隔,也就是最大化|=1时的函数间隔。,函数间隔,几何间隔,一个等腰直角三角形,如何最大化几何间隔,最大化几何间隔,是指通过调整SVM的两个模型参数(和),来使得所有训练数据中最小的几何间隔(注意,每个训练数据都有自己的几何间隔)最大。 翻译为数学表达式,可得,max , s.t. + , =1, |=1,上式中是我们优化的对象。第一个限制条件说明所有训练数据的间隔都大等于,第二个限制条件说明这里的间隔是几何间隔。,如何最大化几何间隔,上述表达式直接求解很困难。 通过一定的转化(大家可以自行尝试),我们可以得到右图中的表达式。 然后就可以用最优化的方法来解决该问题(超出本课程讨论范

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论