




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Support Vector Machine支持向量机内容 SVM的理论基础 线性判别函数和判别面 最优分类面 支持向量机 LIBSVM简介 实验SVM的理论基础 传统的统计模式识别方法只有在样本趋向无穷大时,其性能才有理论的保证。统计学习理论(STL)研究有限样本情况下的机器学习问题。SVM的理论基础就是统计学习理论。 传统的统计模式识别方法在进行机器学习时,强调经验风险最小化经验风险最小化。而单纯的经验风险最小化会产生“过学习问题”,其推广能力较差。 推广能力推广能力是指: 将学习机器(即预测函数,或称学习函数、学习模型)对未来输出进行正确预测的能力。 SVM的理论基础 “过学习问题过学习
2、问题”:某些情况下,当训练误差过小反而会导致推广能力的下降。 例如:对一组训练样本(x,y),x分布在实数范围内,y取值在0,1之间。无论这些样本是由什么模型产生的,我们总可以用y=sin(w*x)去拟合,使得训练误差为0.SVM的理论基础 根据统计学习理论,学习机器的实际风险由经验风险值和置信范围值两部分组成。而基于经验风险最小化准则的学习方法只强调了训练样本的经验风险最小误差,没有最小化最小化置信范围值,因此其推广能力较差。 Vapnik 与1995年提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,
3、即SVM是一种基于结构风险最小化结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。SVM的理论基础 由于SVM 的求解最后转化成二次规划问题的求解,因此SVM 的解是全局唯一的最优解 SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中.线性判别函数和判别面 一个线性判别函数(discriminant function)是指由x的各个分量的线性组合而成的函数 两类情况:对于两类问题的决策规则为 如果g(x)=0,则判定x属于C1, 如果g(x)=0,则判定x属于C1,如果g(x)0是一个常数,它控制对错分是一个常数,
4、它控制对错分样本惩罚的程度。样本惩罚的程度。支持向量机 上节所得到的最优分类函数为: 该式只包含待分类样本与训练样本中的支持向量的内积 运算,可见,要解决一个特征空间中的最优线性分类问题,我们只需要知道这个空间中的内积运算即可。 对非线性问题, 可以通过非线性变换转化为某个高维空间中的线性问题, 在变换空间求最优分类面. 这种变换可能比较复杂, 因此这种思路在一般情况下不易实现.*1( )sgnsgn()liiiif xwxby x xb 支持向量机 核: 11221,21,21212,( , )( )( ).( ,. )( )( ),.,( )= ( )|: ()()(,)lnKx zXK
5、x zxzXFxxxxxxXFxxXx xx xxxx x 核是一个函数对所有满足这里 是从输入空间 到到特征空间 的映射将输入空间 映射到一个新的空间例如支持向量机( ,)( )( )iiiiK x yxy *1( )sgn( , )liiiif xy K x xb支持向量机核函数的选择支持向量机SVM方法的特点 非线性映射是SVM方法的理论基础,SVM利用内积核函数代替向高维空间的非线性映射; 对特征空间划分的最优超平面是SVM的目标,最大化分类边界的思想是SVM方法的核心; 支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量。 SVM 是一种有坚实理论基础的新颖的小样本
6、学习方法。它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法。从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”(transductive inference) ,大大简化了通常的分类和回归等问题。支持向量机SVM方法的特点 SVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”。 少数支持向量决定了最终结果,这不但可以帮助我们抓住关键样本、“剔除”大量冗余样本,而且注定了该方法不但算法简单,而且具有较好的“鲁棒”性。这种“鲁棒”性主要体现在: 增、删非支持向量样
7、本对模型没有影响; 支持向量样本集具有一定的鲁棒性; 有些成功的应用中,SVM 方法对核的选取不敏感。支持向量机 SVM本质上是两类分类器. 常用的SVM多值分类器构造方法有: LIBSVM简介 LIBSVM是台湾大学林智仁(Lin Chih-Jen)副教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件还有一个特点,就是对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数就可以解决很多问题.支持向量机支持向量机-SVM前面介绍的
8、C-SVM,有两个相互矛盾的目标:最大化间隔和最小化训练错误.其中的常数C起着调和这两个目标的作用.定性地讲,C值有着明确的含义:选取大的C值,意味着更强调最小化训练错误.但定量地讲,C值本身并没有确切的意义,所以C值的选取比较困难.为此,人们提出了这个改进的方法.:的含义1、间隔错误样本的个数所占总样本数的份额的上界;2、支持向量的个数所占总样本点数的份额的下界.支持向量机oneclass SVM不需要类标号,用于支持向量的密度估计和聚类.支持向量机-SVR回归问题: 就是在训练样本上找到一个函数,它可以从输入域近似映射到实数值上.输出值不再是二值.在SVM中,回归问题被转化为分类问题来解.
9、-.-,-.(,) ,1,. ,(,) ,1,. .TTTiTTiyw xbDDDxyiilDxyiil一个超平面的带是指该超平面沿y轴依次上下平移 所扫过的区域如果该超平面的带包含了训练集中所有的训练点则该超平面就是一个硬超平面构造正类点和负类点两个集合 +和 -: 这样就形成了一个对正负两类点进行线性分划的问题了-:带与硬带超平面支持向量机-SVR- ( , ,( ) |( )|max0,|( )|:,-.c x y f xyf xyf x不敏感损失函数其有一个特点对样本点来说 存在着一个不为目标函数提供任何任何损失值的区域 即带-SVR-,-. -.SVRSVRSVR在中需要事先确定不敏感损失函数中的参数 然而在某些情况下选择合适的并不是一件容易的事情能够自动计算中的实验包括分类与回归 对dst,aah,chjsh三种可视音素进行采样,每种类型20张样本图片; 首先转化为灰度图像,然后截取口形部位的80*60区域,再使用Gaussian金字
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/CFA 0160-2023消失模壳型铸造用涂料
- T/CECS 10399-2024桥梁用热轧U形肋
- T/CIQA 88-2024船用生物燃料油
- T/CCMA 0204-2024实验室用混凝土搅拌站
- T/CACE 0128-2024一次性原竹餐具通用技术要求
- 设计公司劳务合同范本3篇
- 正规离婚协议书电子版2篇
- 居住楼出售买卖合同5篇
- 上海小学生奥赛数学试题
- 建筑机械设备出租合同6篇
- 地脚螺栓安装方案
- 工厂管理制度制度
- 餐饮服务食品安全监督量化分级管理制度
- 2023年中国财税服务行业市场全景评估及未来投资趋势预测
- 医疗卫生事业单位面试题型及答题技巧
- 肿瘤科运用PDCA循环提高疼痛评估的规范率品管圈成果汇报
- 管道安全检查表
- 心理剧比赛点评金句
- 校园网站的设计与实现-毕业论文
- 石油石化职业技能鉴定操作试题集-输气工中级
- 办公楼工程临时用电专项施工方案
评论
0/150
提交评论