支持向量机及支持向量回归简介_第1页
支持向量机及支持向量回归简介_第2页
支持向量机及支持向量回归简介_第3页
支持向量机及支持向量回归简介_第4页
支持向量机及支持向量回归简介_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、3支持向量机(回归)3.1.1 支持向量机支持向量机(SVM是美国Vapnik教授于1990年代提出的,2000年代后成 为了很受欢迎的机器学习方法。 它将输入样本集合变换到高维空间使得其分离性 状况得到改善。它的结构酷似三层感知器,是构造分类规则的通用方法。SVh方法的贡献在于, 它使得人们可以在非常高维的空间中构造出好的分类规则, 为分 类算法提供了统一的理论框架。作为副产品,SVM从理论上解释了多层感知器的隐蔽层数目和隐节点数目的作用, 因此,将神经网络的学习算法纳入了核技巧范 畴。所谓核技巧,就是找一个核函数 K(x, y)使其满足K(x,y) ( (x), (y),代 替在特征空间中

2、内积(x), (y)的计算。因为对于非线性分类,一般是先找一 个非线性映射 将输入数据映射到高维特征空间,使之分离性状况得到很大改 观,此时在该特征空间中进行分类, 然后再返会原空间, 就得到了原输入空间的 非线性分类。由于内积运算量相当大,核技巧就是为了降低计算量而生的。特别,对特征空间H为Hilbert空间的情形,设K(x, y)是定义在输入空间 Rn上的二元函数,设H中的规范正交基为!(X), 2(X),n(X),。如果K(x,y)2ak ( k(x), k(y),l2,那么取(x)ak k(x)即为所求的非线性嵌入映射。由于核函数K(x,y)的定义k 1域是原来的输入空间,而不是高维的

3、特征空间。因此,巧妙地避开了计算高维内 积(x), (y)所需付出的计算代价。实际计算中,我们只要选定一个 K(x,y), 并不去重构嵌入映射(x)ak k(x)。所以寻找核函数K(x,y)(对称且非负)k 1就是主要任务了。满足以上条件的核函数很多,例如可以取为d-阶多项式:K(x, y) (1 x|y)d,其中y为固定元素。可以取为径向函数:K(x,y) exp |x y/ 2,其中y为固定元素。可以取为神经网络惯用的核函数:K(x,y) tanh c/y) c?,其中y为固一般地,核函数的存在性只依赖于如何寻找一个平方收敛的非负序列ak o这样的序列在l2空间的正锥|2ak l2 |ak

4、 0, k中的序列都满足。但哪一个最佳还有待于进一步讨论。经验表明,分类问题对于核函数不太敏感。当然,重新 构造一个核函数也不是一个简单的事。因此,实际操作中往往就在上述三类中挑出一个来使用就可以了。支持向量机的结构示意图可以表示如下:Jill)血)K(A-1)w Ut)EGc, «2)Kg, k3)r 需 kL)yL-laL-1Kfx, wL-lJ图1支持向量机结构示意图其中输入层是为了存贮输入数据,并不作任何加工运算;中间层是通过对样本集的学习,选择K(x,x) i 1,2,3,., L ;最后一层就是构造分类函数Ly sgn(yaK(x,xJ b)i 1整个过程等价于在特征空间

5、中构造一个最优超平面支持向量机的作用之一就是分类。 根据分类的任务,可以划分为一分类,二分类 以及多分类。对于多类分类问题,可以用若干种手法将其分解为若干个二分类问 题叠加。因此,为了实现支持向量机分类的算法,我们只要针对二分类,从头来 给出它的数学原理。3.1.2支持向量机分类的数学原理设样本集为 佻)以Rn; yi1, 1 , i 1,.,l,我们的目的是寻找一个最优超平面H使得标签为+ 1和- 1的两类点不仅分开且分得间隔最大。当在n维欧几里德空间中就可以实现线性分离时,也即存在超平面将样本集按照标签-1与+1分在两边。由于超平面在n维欧几里德空间中的数学表达式是一个线性方程w,x b

6、0,其中,w为系数向量,X为n维变量,w,x 内积,b为常数。空间中点Xi到超平面L的距离d(-L)。欲使得d(-H)最大,等价于补最小。于是,得到一个在约束条件下的极值问题min 2|w|I 2W,Xiyi(弓I入 Lagrange 乘子 (2?I),可以解得关于该参变量的方程Q()称之为Lagrange对偶函数。其约束条件为Ii yi0, i 0, i 1,2,,Ii,j 1在此约束条件之下,使得Q()达到最大值的 的许多分量为0,不为0的所对应的样本Xi就称为支持向量。这就是支持向量的来历。将样本集当在输入空间不能实现线性分离,假设我们找到了非线性映射(x,yi)|x Rn; y 1,

7、1 ,i 1,.,I映射到高维特征空间H中,此时我们 考虑在H中的集合(x),yj|x Rn; yi 1, 1 ,i 1,i的线性分类,即 在H中构造超平面,其权系数w满足类似的极值问题。由于允许部分点可以 例外,那么可以引入松弛项,即改写为:1 2 mi njlwll yi( w,x b) 1 i, i 0, i 1,2,.,I最终转化为一个二次型在约束条件下的二次规划问题:min D c2y 0, 0( 1,., J A (C,C)其中,y(y1,.,yJT,c ( 1,.,1)T,DK(Xi,Xj)yiVj1 i,j I为矩阵。K(x,s)是核函数。一分类问题是一个极端情形但却又是非常有

8、用的,它可以表示为如下数学模型:设Xi |Xi Rn,i 1,.,I为空间Rn的有限观测点,找一个以a为心,以R为半径的包含这些点的最小球体。因此,一分类是对于求一个化合物成分的最小包络曲面的最佳方法。与前面完全相同的手法,设 是由某个核函数K(x, s)导出的从输 入空间到特征空间中的嵌入映射,最后可以得到二次规划问题1 ' 'min D c2y 0, 0( 1,., J A (C,.'。)是核函数。此时Lf(x) K(x,x) 2iK(x,xi)iiLjiLiii jK (xi, xj )此时几乎所有的点满足f(x) R2。参数C起着控制落在球外点的数目,变化区间为

9、:1/L C 1.3.1.3基于线性规划的SVM分类由于分类问题的自然推理过程都会归结到二次规划求解,计算复杂度相对较高。 如果能将其简化为线性规划而且没有较大的误差, 那么计算量将急速减少。于 是提出了基于线性规划的SVM分类。此方法经过数学严格推理,是合理的(因为 涉及泛函的知识较多, 推理过程放在附录中)。因此产生了基于线性规划一分类、 二分类、多分类。此处,我们仅给出基于线性规划的 SVM分类的最终形式:minLCii1s.tLLi1i K ( xi , xj )j, j1,.,L;i 1; i, i 0i1解出 与 则得出决策函数 f ( x)LiK(Xi,Xj)以及阈值。参数C控制

10、着满足条i1件 f (x) 的样本数量。特别核函数取为径向函数时,参数 2越小,精度越高。另外,要提醒注意的是,在求解大规模分类问题得SVM算法实现时,需要以下辅助手段:停机准则:由于分类问题等价于求对偶问题在约束条件下的极值Lmaxi 1Ls.tiyi0, 0i C, i 1,2,., Lj%yjK(x,Xj)而KKT条件iyi( w,(为) (C i) i 0, ib) 1 i01,2,.,L是收敛的充分必要条件。因此通过监控KKT条件来得到停机条件i yi 0 i C, i 1,2,,Ly(L1, i 0, iiyK(Xi,Xj) b) 1, 0 i C, i j 11, i C, i这

11、个条件中的不等式不必严格成立,只要在一定误差条件下成立就可以用了。选块算法+分解法1.给定参数M 0,0, k 0。选取初始工作集W。T ,记其对应的样本点的下标集为J0。令Wk T第k次更新的工作集,其对应的样本点的下标集为Jk。2. 基于工作集Wk T ,由优化问题LL Lmax ii jWyjK(x,Xj)i 1i 1 j 1LSti yi 0,0 i C, i Jkj 1求出最优解?j, j Jk,构造 k (;,f)按照如下方式:少j,3. 如果k已经在精度内满足停机准则,那么以此权系数构造决策函数即可否则继续下一步4.在T Wk中找出M个最严重破坏条件L1,i0, iyi(iyiK

12、(Xi,Xj)b)1, 0i C,j 11, iC, i加入Wk得出新的工作集 Wki,相应的下标集记为5.重复2) 3),直到样本集耗完为止。序列最小优化算法(SMOIn put: the observed dataset S(为),.,(Xi,y|x Rn, yj R ,输入精度要求0及指定核函数K(x, y),初始化0 0, k 0。Output: the classification of these samplesStep1.由更新公式k 1 k y2( E1_E2)22 Jk(%, xJK(X2,X2)2K(%,X2)k 1k( kk 1、11 y1y2( 22 )Step2.如果

13、第k步时达到停机要求,取近似解?k,否则继续迭代,直到满足停机为止,取为近似解。支持向量回归(SVR模型对于分类,支持向量机相当于导师样本为有限集的情形。考虑导师集合为不可数的情形,例如训练集可以为形如S(冷 ),(冷 yJ|Xj Rn, yj R的情形,贝U演化出支持向量回归概念。支持向量回归也分为线性回归和非线性回归两种, 但不是统计学中的线性或者非线性回归了,而是根据是否需要嵌入到高维空间来划分的,我们简述如下:对于给定的样本集S,以及任意给定的0,如果在原始空间Rn存在超平面 f(x) w,x b w Rn, b R 使得 |yi f(xj| ,(Xj,yj S,则称f (x) w,x

14、 b是样本集合S的 一线性回归。与初等代数类似,$ f(xj|,(Xj,yj S等价于S中任何点以)到超平面 f (x) w,xb的距离不超过。由于我们是分类,所以希望/ l|w|2调整超平面的斜率 w使得与S中任点(Xj,yj距离都尽可能大。也即使得最大化,这等价于要求min |w|2。于是,线性回归问题转化J |w|2为优化问题:min ; | w |2s.t| W, Xib y|, i 1,2,.,1于是,引入松弛变量,并使用Lagra nge乘子法,得到优化问题的对偶形式:1 1 (min( i2 i,j i*i)( j*j)Xi, Xj1 1* *(ii )Yi( ii )i 1i

15、11s.t.( i i*)0, 0*i iCi ,ii 1,2,.,1i 1对于不可能在原始空间Rn就可以线性分离的样本集S,先用一个非线性映射将数据S映射到一个高维特征空间中,使得(S)在特征空间H中具有很好 的线性回归特征,先在该特征空间中进行线性回归,然后返回到原始空间Rn 中。这就是支持向量非线性回归。于是,支持向量非线性回归的对偶优化问题如下:*min ( i i )( j2i,j ils.t.( i i*) 0, 0i 1lj*) (x), (Xj)(i 1C, i 1,2,.,ll)y (i 1于是,非线性回归问题的实施步骤为:1 寻找一个核函数 K(s,t)使得 K(x,xJ(

16、Xi), (Xj),2 求优化问题lllmin12l(ii,j 1*i)( jl*)K(Xi,Xj)( ii 1*i )yl(ii 1*i)s.t.li 1*(ii)0, 0i , iC,i h2,., l的解i j*i 03 .计算yjl(ii*)K(Xj,Xi),当 i(o,C)bi, j 1lyj(ii,j 1i*)K(Xj,Xi),当:(0,C)4. 构造非线性函数l*nf(x) ( i i )K(Xj,x) b, X R , b R。i 13.2.2支持向量机分类与支持向量回归的关系支持向量机用以分类和回归,两者到底是什么关系为了建立回归与分类的关系, 我们在特征空间中考虑如下的上下

17、移动集合:D ( (X), Vi1)|(X,Yi) S , D ( (Xi), y 1)|(冷比)S对于充分大的,D与D是线性可分离的。于是得出关于 D与D分类。引入松弛变量,由SVM分类方法得到min】2st W zLCii 1b)i1, Z D ,W,z b) i1, z D , i 0, i 1,2,.|将目标函数中的W改写为W (WpW?),特别令w21,那么上式变成而基于观测集Smi nllWJI2 1 C2i 1s.tv?1, (Xi)yW (Xi) yi 0, i 1,2,., li 1,i 1,(石,),,(N,yJ|N Rn, yj,在特征空间中寻找单参数约束下的回归函数f(

18、x) w, (x) b的问题等价于min | w|2s.ty w, (Xi)b iw, (Xi)yib ii 0, i h2,.,丨也就是说,回归问题可以通过分类的算法来实现 附录:基于线性规划的分类的合理性设输入向量的空间为Rn,记Lp(Rn),1 p ,为Rn上一切p 绝对值可积函数g (即一切可测且满足 n|g(x) |pd (x),按照通常的加法和数乘,构成R的线性空间。一般地,我们偏好选则一个非线性映射将Rn嵌入到L2(Rn)空间。因为在该Hilbert空间中,任意闭子空间的正交补子空间存在问题是一个已解决 了的问题,而在Lp(Rn), p 2,还是一个没有被完全解决的问题。 如前所

19、述,在此 空间中得到的结果,特别是诱导出的核函数是一个非常好的亮点。在有限维空间中,任何距离都是等价的。这一特征也是有限维空间独有的。 类似于上面所述,我们可以在有限维空间 Rn上赋予Lp范数:l|x|p|Xi|Pi 1p取遍区间1,,特别,L范数就是通常的最大值范数:| x| max1in|Xi| ,Li范数就是通常的绝对值求和范数,L2范数就是通常的欧式范数。如果用w,x表示内积,那么由 Holder不等式,我们得| w, x | |w|q|x|p,其中1p 1q 1是1,中的一对共轭数。假设一对平行的超平面为:fi(x)w,x d与f2(x)w,xb2,那么,两个平面之间的距离为d(f1

20、, f2)|d b2|w|q特别,如果Rn上赋予的是L1范数,则d(f1, f2)|d b2|w|于是,导出相应的优化问题min w,b max| Wj |s.t y ( w, Xib) 1, i 1,2,.,l于是得到线性规划:min as-t y(w, xb)1, i1,2,.,lawj,awj,j1,2,.,l, a,b R, w R简化了计算。同理,对于不可分离的情况,引入松弛变量后可得lmin a C ii 1s.tyi(w,Xib) 1i, i 1,2,., laWj,aWj, j0,j 1,2,., l,a, b R, w Rn同理,对于非线性分类的情况,换成核函数min a Ci 1StYijYjK(Xj,Gj 1b1i,i 1,2,.,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论