




已阅读5页,还剩134页未读, 继续免费阅读
(信号与信息处理专业论文)支持向量机的理论与算法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京邮电大学博上论文摘要 支持向量机的理论与算法研究 摘要 机器学习是研究计算机怎样模拟或实现人类的学习行为,以获取新 的知识或技能,重新组织已有的知识结构,从而不断改善自身性能。它 是人工智能最早关注的问题之一,是使计算机具有智能的根本途径。 一个不具有学习能力的智能系统难以称得上真正的智能系统,但以 往的智能系统普遍缺少学习能力。例如,它们的推理仅限于演绎而缺少 归纳,因此至多只能够证明已存在的事实、定理,而不能发现新的定理、 定律和规则等。随着人工智能的深入发展,这些局限性表现得愈加突出。 机器学习历经几十年发展,产生了各种各样的方法。从学习所依赖 的经验( 输入) 与学习所要获得的结果( 输出) 之间的关系来看,学习 策略可分为归纳、类比和演绎三种。 归纳:输入概念的实例,学习目标是从这些实例概括出关于这个概 念的描述,或改进概念的已有描述。 类比:输入新问题的描述,学习目标是寻找系统先前已解决的类似 问题,并用解决该问题的经验知识处理新问题。 演绎:输入的新问题能够用学习系统已有的知识解决,但知识库的 相关部分不能被有效地利用,学习目标是将这些部分转换为更好的形式。 实际上,类比策略可看作归纳和演绎策略的综合,因而最基本的学 习策略只有归纳和演绎。从学习内容角度看,归纳是从个别到一般、从 部分到整体的行为,所学知识超过原有知识库所蕴含的范围,我们称之 为知识级学习;而演绎是“保真 变换和特化的过程,尽管所学知识能 够提高系统的效率,但仍被原有的知识库所蕴含,我们称之为符号级学 习。从实现技术角度看,归纳学习使用基于统计的方法,演绎学习使用 北京邮电大学博上论文 摘要 基于规则的方法。 基于规则的方法,优点是简单、效率高,而且发现新规则后可以方 便地加入。但规则总会有例外,规则过多以后,需要权衡这些规则,保 持其一致性,这是很困难的。另外,基于规则的方法对领域的依赖性强, 可移植性差。 基于统计的方法需要有合适的方法产生大量廉价的训练数据,计算 复杂度高,但它与应用领域无关,可移植性好。 2 0 世纪6 0 年代中期至8 0 年代中期,由于人工智能的研究重点是符 号系统和基于知识的方法,机器学习以基于规则的方法为主。2 0 世纪8 0 年代后期,随着神经网络研究重新崛起及其成功应用,基于统计的学习 方法迅速发展。特别是最近十几年,互联网的普及和计算机在各个领域 的应用,大量数据潮水般涌来,如何从中发现隐含的知识,对机器学习 提出了重大挑战,也给基于统计的学习方法带来新的发展机遇。在众多 基于统计的学习方法中,支持向量机( s u p p o r t v e c t o r m a c h i n e ,简称s v m ) 是个新秀,但因其深厚的理论背景和出色的实际表现备受人们青睐。 支持向量机是2 0 世纪9 0 年代中期出现的机器学习技术,是近年来 机器学习领域的研究热点。这项技术从提出到现在不过十年时间,但其 研究进展非常之快、之大。它有坚实的理论基础,应用上也是有口皆碑, 在手写体数字识别、文本分类等具体问题上创造和保持着目前的最好记 录。这项既经得起理论推敲又经得起实践检验的技术,是传统机器学习 技术不能比的,它的发展潜力是令人鼓舞的。基于这样的认识,我选择 了这一研究领域。 支持向量机的理论基础是统计学习理论,该理论的研究始于2 0 世纪 6 0 年代末。此后近2 0 年时间里,前苏联学者v a p n i k 做了大量开创性、 奠基性的工作,提出了“结构风险最小化 原理。这个时期的工作主要 是纯理论性的,没有引起人们重视。1 9 9 5 年,c o r t s & v a p n i k 在其论文 “s u p p o r tv e c t o rn e t w o r k s 中提出支持向量机,它实现了“结构风险最 北京邮电大学博士论文 摘要 小化”原理。支持向量机有很强的泛化能力,它在解决复杂问题,诸如 手写体数字识别、人脸检测、文本分类、大规模生物信息处理等方诬的 上乘表现,引起人们极大关注。国内外著名大学和大公司的研发机构纷 纷成立了相关的研究小组,越来越多的人加入这一研究行列,形成近年 来机器学习领域的研究热点。基础研究涉及训练算法、模型选择、多目 标分类等,应用研究涉及三维目标识别、非线性模式重建、智能信号处 理、信息检索、文本分类和数据挖掘等。有关的国际学术会议、专业杂 志和专业网站雨后春笋般地从无到有,规模由小到大。如今,支持向量 学习已成为机器学习的主流技术之一不夸张地说,就像信息论为信息 技术的崛起开辟道路一样,统计学习理论带来了机器学习领域一场深刻 变革。 支持向量机本质上是一种非线性数据处理方法。与传统的人工神经 网络不同,后者基于“经验风险最小化原理 ,前者基于“结构风险最 小化原理。“结构风险最小化原理刀建立在严谨的数学理论基础之上, 令人耳目一新,使人们对学习机的认识发生了深刻变化。 支持向量机具有以下显著特征。 ( 1 ) 结构简单。 ( 2 ) 凸优化问题。有关的优化问题无局部极小点。 ( 3 ) 稀疏表示。最优分离超平面之法向量w 是训练样本的线性组合, 每个样本的系数在某种意义上反映了该样本的重要性。分类问题的有用 信息全部包含在系数不为零的那些样本即支持向量中。如果从训练集中 去掉非支持向量,或使其在原来位置附近有微小偏移,则重新训练后, 所得最优超平面与原来相同。即问题的解仅与支持向量有关。 ( 4 ) 模块化。它清楚地分成两个模块:一个通用的学习机和与具体 问题有关的核函数。这使我们能够把设计一个好的学习算法和设计一个 好的核函数分开来研究。这种模块化处理方法便于理论分析和工程实现。 ( 5 ) 本质上是线性学习机。它是核函数诱导的( 隐含的) 特征空间 北京邮电大学博士论文 摘要 上的线性函数,因而便于理论分析。 支持向量机体现了以下重要思想和方法。 ( 1 ) 边缘最大化思想。通过最优超平面来构造判决函数,实现了“结 构风险最小化原理 ,避免了对训练集过度拟合,保证了支持向量机的泛 化能力。 ( 2 ) 对偶表示。在对偶表示中训练数据仅以内积形式出现,因此可 以用核函数来代替内积。 ( 3 ) 核方法。从线性分类器转变成非线性分类器,只需要以核函数 替换原来的内积。除此之外,原来的线性算法保持不变,线性分类器的 全部优点都被继承下来,如计算简单、无局部极小点等。通过核函数能 够在输入空间间接地完成高维特征空间( 具有更丰富的结构) 中的操作, 计算复杂度没有实质性增加,但解决了复杂函数的表示问题。引进核函 数之后,特征空间的维数变得不再重要了,甚至不必知道特征映射的具 体形式,避免了维数灾难。通过改变核函数,可以得到不同的分类器。 支持向量机最初是用来解决分类问题的,其思想和方法后来被拓展 到其他领域,如回归分析、函数逼近、密度估计,还有主成分分析、k _ 近邻、费歇判决等。核方法也发展成了一种方法论,把许多重要的数据 处理方法纳入统一的框架,开辟了更加宽广的研究天地。 本文仅研究用来分类的支持向量机。 支持向量机并非尽善尽美,作为发展中的机器学习技术,还有很多 问题有待解决。例如, 1 训练算法 支持向量机的训练归结为求解二次规划问题,但该问题的h e s s i a n 矩阵通常是稠密的,处理大规模问题时存储代价很高。例如,当样本个 数为5 0 0 0 0 时,h e s s i a n 矩阵元素个数达2 5 亿之巨,普通计算机的内存 根本不够用。所以,经典的优化方法不适用,开发耗时短且占用内存少 北京邮电大学博士论文摘要 的算法成为人们追求的目标。训练算法又可以分为线性s v m 训练算法与 非线性s v m 训练算法、在线算法与离线算法、精确算法与近似算法等。 训练算法一直是最活跃的研究课题。 2 模型选择 模型选择是指:对于具体问题,如何选择核函数,以及支持向量机 中的一些参数。这些参数包括:惩罚系数c ,它在训练误差与泛化能力 之间进行平衡;核函数中的参数,如高斯核中的盯和多项式核中的p 等, 不同的参数对应着不同的特征空间和特征映射,它们与支持向量机的泛 化能力密切相关。怎样自动地进行模型选择? 3 知识嵌入 所谓知识,是指除训练样本外的信息,如问题领域的专业知识,专 家经验等。标准的支持向量机是基于训练样本的,隐含的特征映射使得 嵌入知识很困难。但经验告诉我们,一个系统所含知识的多少,对知识 的利用程度如何,反映了其能力的高低。这在解决具体问题时尤其重要, 但s v m 还没有从根本上解决嵌入领域知识的问题。 4 多类问题 最初,s v m 是针对二分类问题的,但实际应用中常常是多类问题。 如何把它推广到多类问题? 多类问题训练集的规模通常很大,如何有效 地训练? 我的论文就是围绕这些问题开展研究。论文的主要贡献是: ( 1 ) 提出“有附加信息的统计学习理论框架 。经典统计学习理 论的重要结论,都是假设训练样本服从某个固定分布,或者服从任意分 布,这是两个极端情形。实际情况是,人们对所处理的问题不全了解, 但又知道一部分信息,这个新框架能够描述这种情况( 见第二章) ( 2 ) 分六个专题,即支持向量机训练算法、支持向量机的各种表现 形式、支持向量机的泛化能力、模型选择、多类问题和支持向量机的应 北京邮电大学博士论文 摘要 用,系统地论述了( 分类) 支持向量机的研究进展( 见第三章) 。 ( 3 ) 提高支持向量机性能的关键,是设计适合特定问题的核函数, 这要求对核函数本身有深入了解。针对三类重要核函数,即平移不变核 函数、旋转不变核函数和卷积核,提出了简单易用的判别准则,并给出 数学证明( 见第四章) 。 ( 4 ) 支持向量机的优势在于处理非线性问题,但设计大规模、非线 性支持向量机训练算法比较困难。本文深入研究了n p a 算法,分析了该 算法存在的不足,对第一、第二类检验下的迭代过程做了实质性改进。 实验结果表明,新版本性能稳定,在未增加计算代价的条件下,训练速 度明显提高( 见第五章) 。 ( 5 ) 利用本文设计的训练算法,开发了一个自动分类模拟系统( 见 第六章) 。 论文共分七章,具体组织如下: 第一章,什么是支持向量机。本章由三部分构成。第一部分阐述什 么是支持向量机,先从简单的线性分类器入手,然后推广到更复杂的情 况。第二部分概括了支持向量机的特征和重要思想。第三部分简要分析 支持向量机与传统神经网络的异同。 第二章,支持向量机的理论基础。本章用严谨、精炼的语言描述了 统计学习理论的概貌,它与支持向量机的关系。在此基础上,提出一个 “有附加信息的统计学习理论框架 。 第三章,支持向量机研究进展。本章分六个专题,即训练算法、支 持向量机的各种表现形式、支持向量机的泛化能力、模型选择、多分类 问题和支持向量机的应用,综述支持向量机的研究进展,涵盖了迄今为 止主要的研究内容和成果,从中可以了解人们所研究的问题、所付出的 努力、所取得的成就和所面临的困难。 第四章,核函数的性质及其构造方法。支持向量机由核函数与训练 北京邮电大学博士论文摘要 集完全刻画。提高支持向量机性能的关键之一,是设计适合特定问题的 核函数,这就要求对核函数本身有深入了解。本章由四部分组成:第一 部分论述核函数与正定矩阵的关系及核函数的基本性质。第二部分对三 类重要核函数,即平移不变核、旋转不变核和卷积核,提出了简单实用 的判别准则,并在此基础上构造了很多重要核函数。第三部分介绍了一 种自适应核函数。第四部分指出把问题领域的知识与核函数设计联系起 来,即通过设计特殊的核函数来嵌入领域知识,是今后努力的方向。 第五章,加速n p a 算法的收敛。支持向量机的优势在于处理非线 性问题,但设计大规模、非线性支持向量机训练算法比较困难。1 9 9 8 年p l a t t 提出的s m o 算法( s e q u e n t i a lm i n i m a lo p t i m i z a t i o n ) ,和2 0 0 1 年k e e r t h i 等人提出的n p a 算法( n e a r e s tp o i n ta l g o r i t h m ) 是目前常用 的。n p a 算法有明确的几何背景,与s m o 相比训练速度毫不逊色,井冬 且在惩罚系数较大时有显著优势。本章分析了n p a 算法存在的不足, 对其第一、第二类检验下的迭代过程做了实质性改进实验结果表明, 新版本性能稳定,在未增加计算代价的条件下,训练速度明显提高。 第六章,支持向量机自动分类模拟系统。本章根据第五章设计的算 法,开发了一个自动分类模拟系统,它由三个主要模块构成,介绍了系。 统界面、系统功能,给出了关键代码。其核心模块很容易嵌入到实用系 统中。 第七章,存在的问题与今后的研究方向。总结了支持向量机研究中 有待解决的关键问题,对今后的研究重点提出建议。 关键词支持向量机算法核函数机器学习 北京邮电大学博士论文 a b s t r a c t r e s e a r c ho nt h e o r y a n d a l g o r i t h mf o rs u p p o r tv e c t o r m a c h i n ec l a s s i f i e r a bs t r a c t m a c h i n el e a r n i n gs t u d i e sh o wc o m p u t e rs i m u l a t e sh u m a nl e a r n i n gb e h a v i o rs ot h a t g a i n sn e wk n o w l e d g eo rs k i l l s ,r e o r g a n i z e se x i s t i n gk n o w l e d g e , a n dt h e r e b yi m p r o v e s a b i l i t i e si t s e l f i ti so n eo fm a j o rs u b j e c t si na r t i f i c i a li n t e l l i g e n c ea n dt h ef u n d a m e n t a lw a y m a k i n gc o m p u t e ri n t e l l i g e n t a s y s t e mw i t h o u tl e a r n i n ga b i l i t y i sn o tq u a l i f i e dt oi n t e l l i g e n ts y s t e m , h o w e v e r , s y s t e m sb u i ri nt h ep a s tu s u r yl a c ko fl e a r n i n ga b i l i t y , f o ri n s t a n c e ,t h e i ri n f e r e n c e m a r i n e ri sc o n f i n e dt od e d u c t i o n , t h u sc a na tm o s tp r o v ee x i s t i n gf a c t sa n dt h e o r e m s ,b u t c a nn o td i s c o v e rn e wt h e o r e m s , l a w sa n dr u l e s 鼬t h ed e v e l o p m e n to fa r t i f i c i a l i n t e l l i g e n c ei nd e p t h , t h e s el i m i t a t i o n sa r cb e c o m i n gi n c r e a s i n g l ye v i d e n t i nt h ep a s td e c a d e s ,a l lk i n d so fm a c h i n el e a r n i n gm e t h o d sh a v eb e e np r o p o s e d b y t h er e l a t i o n s h i pb e t w e e ng i v e ne n v i r o n m e n ta n dd e s i r e dt a r g e t , t h e yf a l li n t ot h r e eg r o u p s a sf o l l o w s - i n d u c t i o n :i n p u ti n s t a n c e so fac o n c e p t , w eh o p et oo b t a i nad e s c r i p t i o na b o u tt h e c o n c e p tb a s e do nt h e s ei n s t a n c e s ,o ri m p r o v ee x i s t i n gd e s c r i p t i o na b o u tt h ec o n c e p l a n a l o g y :i n p u tad e s c r i p t i o na b o u tn e wp r o b l e m , s e a r c h i n gf o ra na n a l o g i c a l p r o b l e ms o l v e db e f o r e ,w eh o p et oh a n d l et h i sn e wp r o b l e mo nt h eb a s i so f e x p e r i e n c e s d e d u c t i o n :p r o b l e m c a nb es o l v e dw i t h e x i s t i n gk n o w l e d g e - b a s e ,b u t t h e k n o w l e d g e - b a s ec a r ln o tb eu t i l i z e de f f e c t i v e l y , w eh o p et ot r a n s f o r mi ti n t oa n o t h e r i nf a c t , a n a l o g yc a l lb er e g a r d e da sc o m p o s i t i o no fi n d u c t i o na n dd e d u c t i o n , s ot h e u n d e r l y i n gl e a r n i n gs t r a t e g i e sa 托o n l yi n d u c t i o na n dd e d u c t i o n i n d u c t i o ni sap r o c e s so f d e r i v i n gg e n e r a lp r i n c i p l e sf r o mp a r t i c u l a rf a c t so ri n s t a n c e s ,t h er e s u l t i n gk n o w l e d g ei s b e y o n de x i s t i n gk n o w l e d g e - b a s e ,w ec a l l e di tk n o w l e d g e l e v e ll e a r n i n g ;w h i l ed e d u c t i o ni s ap r o c e s so ff i d e l i t yt r a n s f o r mo rs p e c i a l i z a t i o n , d e s p 沁o fi m p r o v e m e n to fl e a r n i n g e f f i c i e n c y , t h er e s u l t i n gk n o w l e d g ei ss t i l li m p l i e di nt h ee x i s t i n gk n o w l e d g e b a s e ,w ec a l l i t s y m b o l l e v e ll e a r n i n g f r o mt h ev i e w p o i n to fi m p l e m e n t a t i o n , i n d u c t i v el e a r n i n g 一8 北京邮电大学博士论文a b s t r a c t b e l o n g sw i t hs t a t i s t i c s - b a s e dm e t h o d , w h i l ed e d u c t i o nl e a r n i n gw i t hr u l e b a s e dm e t h o d m a d v a n t a g e so fr u l e - b a s em e t h o da r es i m p l ea n de m c i e n t a n dn e wr u l e sc a l lb e e a s i l ya d d e d b e c a u s eo fe x c e p t i o n s ,h o w e v e r , i ti sv e r yd i m c u l tt ok e e pr u l e sc o n s i s t e n t 弱 t h es i z eo fk n o w l e d g e - b a s ei n c r e a s e s ,f t l r t h e r m o r et h er u l e b a s e dm e t h o dd e p e n d ss e r i o u s l y o nd o m a i nk n o w l e d g e ,i ti sh a r dt ot r a n s p l a n t i nc o n t r a s t , s t a t i s t i c s b a s e dm e t h o dr e q u i r e s l a r g ea m o u n to ft r a i n i n gd a t aw h i c hs h o u l db ee a s i l yo b t a i n e d a n di su s u a l l ye x p e n s i v ei n c o m p u t a t i o n , b u ti ti si n d e p e n d e n to fa p p l i e df i e l d sa n dt r a n s p l a n t a b l ee a s i l y f r o mt h em i d d l eo f19 6 0 st ot h em i d d l eo f19 8 0 s s i n c ea r t i f i c i a l i n t e l l i g e n c e r e s e a r c hc e n t e r e do ns y m b o l i cs y s t e ma n dk n o w l e d g e b a s e dm e t h o d s m a c h i n el e a m i n g s t r e s s e dr u l e b a s e dm e t h o d s i nt h el a t e19 8 0 s a st h en e u r a ln e t w o r kg r o w i n g u p 。 s t a t i s t i c s - b a s e dm e t h o d sm a d er a p i dp r o g r e s s e s p e c i a l l yi nt h er e c e n td e c a d e 。d u et o p o p u l a r i z a t i o no fi n t e r n e ta n da p p l i c a t i o n so fc o m p u t e ri nw i d e s p r e a df i e l d s h u g ea m o u n t o fd a t as t r e a mt ou s ,h o wt od i s c o v e rt h ek n o w l e d g eh i d d e nb e h i n dt h e mi s s u e sa c h a l l e n g e t om a c h i n el e a r n i n g ,a n di n t h em e a n w h i l eb r i n g sd e v e l o p m e n to p p o r t u n i t i e st o s t a t i s t i c s - b a s e dm e t h o d s a m o n gn u m e r o l 娼s t a t i s t i c s - b a s e dm e t h o d s ,s u p p o r tv e c t o r m a c h i n e ,f o rs h o r ts v m ,i sar i s i n g 姗,a n dw i n sp e o p l e sf a v o r sb e c a u s eo fi t ss o l i d t h e o r e t i c a lf o u n d a t i o na n de x c e l l e n tp e r f o r m a n c e s u p p o r tv e c t o rm a c h i n ea r o s ei nt h em i d d l eo f1 9 9 0 s a n dh a sb e c o m eaf o c u so f m a c h i n el e a r n i n gr e s e a r c hi nr e c e n ty e a r s s i n c et h e n , a l t h o u g hi u s tap e r i o do fa b o u tt e n y e a r s , r e s e a r c h e r sh a v em a d eg r e a tp r o g r e s s s v mn o to n l yh a ss o l i dt h e o r e t i c a lf o u n d a t i o n , b u ta l s ow i n su n i v e r s a lc o m m e n d a t i o ni np r a c t i c e ,f o re x a m p l e , i th a sb e e nh o l d i n gt h eb e s t r e c o r d si nh a n d w r i t t e nd i g i t sr e c o g n i t i o na n dt e x tc a t e g o r i z a t i o n 佻t e c h n i q u ei sg o o d b o t hi nt h e o r ya n dp r a c t i c e ,a n di n c o m p a r a b l et oa n yc l a s s i cm a c h i n el e a r n i n gm e t h o d s , i t s p o t e n t i a la t ee n c o u r a g i n g ! f o ra b o v e - m e n t i o n e dr e a s o l 坞) ic h o o s es u p p o r tv e c t o rm a c h i n e a st h et o p i co fm yt h e s i s 啊惋t h e o r e t i c a lf o u n d a t i o no fs u p p o r tv e c t o rm a c h i n ei ss t a t i s t i c a ll e a r n i n gt h e o r y o r i g i n a t e di nt h el a t e19 6 0 s ,i ns u b s e q u e n tt w e n t yy e a r s , v a p n i k , af o r m e rs o v i e ts c i e n t i s t , h a dm a d et r e m e n d o u si n i t i a t i v ea n dp i o n e e r i n ge f f o r t sf o rd e v e l o p m e n to ft h et h e o r y p r e s e n t i n gw e l l - k n o w n “s t r u c r k r e r i s km i n i m i z a t i o n p r i n c i p l e ”b e i n gc o m p l e t e l y t h e o r e t i c a l ,t h e s ea c h i e v e m e n t sd u r i n gt h i sp e r i o dd i dn o ta r o u s ed u ea t t e n t i o n i n19 9 5 c o r t s & v a p n i ki n t r o d u c e ds u p p o r tv e c t o rm a c h i n ei nt h e i rp a p e r “s u p p o r tv e c t o r n e t w o r k s ,w h i c hi m p l e m e n t s s t r u c t u r er i s km i n i m i z a t i o np r i n c i p l e s u p p o r tv e c t o r m a c h i n eh a sp o w e r f u l g e n e r a l i z a t i o na b i l i t y , i t se x c e l l e n tp e r f o r m a n c es h o w ni n h a n d w r i t t e nd i g i t sr e c o g n i t i o n , f a c ed e t e c t i o n , p e d e s t r i a nr e c o g n i t i o n , t e x tc a t e g o r i z a t i o n , l a r g e s c a l eb i o i n f o r m a t i o np r o c e s s i n ga n ds oo n , r e c e i v e di n c r e a s i n ga t t e n t i o n s or e s e a r c h g r o u p sh a v eb e e nf o r m e do n ea f t e ra n o t h e ri nu n i v e r s i t i e sa n dc o m p a n i e sa th o m ea n d a b r o a d , m o r ea n dm o r ep e o p l ej o i n tt h er e s e a r c hr a n k s ,ah o t s p o to fm a c h i n el e a r n i n gh a s t a k e ns h a p e b a s i cr e s e a r c hc o n c e r n st r a i n i n ga l g o r i t h m , m o d e ls e l e c t i o n , m u l t i - c l a s s 9 - 北京邮电大学博士论文 a b s t r a c t p r o b l e me t c ,a n da p p l i e dr e s e a r c hc o n c e r n s3 do b j e c tr e c o g n i t i o n , n o n l i n e a rp a t t e r n r e c o n s t r u c t i o n , i n t e l l i g e n ts i g n a lp r o c e s s i n g , i n f o r m a t i o nr e t r i e v a l ,t e x tc a t e g o r i z a t i o n , d a t a m i n i n ga n ds oo n n o w a d a y s ,s u p p o r tv e c t o rl e a r n i n gb e c o m e sam a i n s t r e a mt e c h n i q u eo f m a c h i n el e a r n i n g w i t h o u te x a g g e r a t i o n , j u s t 弱i n f o r m a t i o nt h e o r yo p e n st h ew a yf o r i n f o r m a t i o nt e c h n o l o g y ;s t a t i s t i c a ll e a r n i n gt h e o r yb r i n g sad e e pc h a n g ef o rm a c h i n e l e a r n i n g s u p p o r tv e c t o rm a c h i n ei se s s e n t i a l l yan o n l i n e a rd a t ap r o c e s s i n gm e t h o da n d d i f f e r e n tf r o mn e u r a ln e t w o r k s ,t h ef o r m e ri sb a s e do ns t r u c t u r er i s km i n i m i z a t i o np r i n c i p l e , w h i l et h el a t t e ro ne m p i r i c a lr i s km i n i m i z a t i o np r i n c i p l e t i l i sn o v e ls t r u c t u r er i s k m i n i m i z a t i o np r i n c i p l er e s t so nf l r mm a t h e m a t i c a lf o u n d a t i o n sa n db r i n g su sp r o f o u n d c h a n g e si nu n d e r s t a n d i n gm a c h i n el e a r n i n g s u p p o r tv e c t o rm a c h i n ei so ft h ef o l l o w i n gc h a r a c t e r i s t i c s : ( 1 ) s i m p l es t r u c t u r e ; ( 2 ) c o n v e xo p t i m i z a t i o n , n ol o c a lm i n i m u m ; ( 3 ) s p a r s er e p r e s e n t a t i o n d i r e c t i o no ft h eo p t i m a ls e p a r a t i n gs u p e r - p l a n ei sa l i n e a r c o m b i n a t i o no ft r a i n i n gs a m p l e s ;t h ec o e f f i c i e n tc o r r e s p o n d i n gt oe a c hs a m p l er e f l e c t si t s i m p o r t a n c e a l li n f o r m a t i o na b o u tc l a s s i f i c a t i o ni sc o n t a i n e di ns u p p o r tv e c t o r sw h o s e c o e f f i c i e n t sa 坞n o tz e r o i fr e m o v i n gn o n - s u p p o r tv e c t o r so rs h i f t i n gt h e ms l i g h t l y , t h e n r e - t r a i n i n gl e a d st ot h es a m es o l u t i o na sb e f o r e ,i no t h e rw o r d s ,t h es o l u t i o no n l yd e p e n d s o ns u p p o r tv e c t o r s ( 4 ) m o d u l a r i z a t i o n s v mi sc o m p o s e do ft w om o d u l e s , ag e n e r a lp u r p o s el e a r n i n g m a c h i n ea n da d o m a i n - s p e c i f i ck e r n e lf u n c t i o n , s ow ec a nd e s i g nl e a r n i n ga l g o r i t h ma n d k e r n e lf u n c t i o ni nam o d u l a rw a y t l i i si sg r e a tf o rt h e o r e t i c a la n a l y s i sa n de n g i n e e r i n g i m p l e m e n t a t i o n ( 5 ) i ti se s s e n t i a l l yal i n e a rf u n c t i o no nf e a t u r es p a c ei n d u c e db yk e r n e lf u n c t i o n , a n d t h u se a s yt ob es t u d i e di nt h e o r y i m p o r t a n ti d e a sa n dm e t h o d o l o g i e sb e h i n ds u p p o r tv e c t o rm a c h i n ea r eg i v e nb e l o w : ( 1 ) m a r g i nm a x i m i z a t i o n b ym e a n 5o fo p t i m a ls e p a r a t i n gh y p e r p l a n e , o rc a l l e d m a x i m a lm a r g i nh y p e r p l a n e ,s t r u c t u r er i s km i n i m i z a t i o np r i n c i p l ei si m p l e m e n t e d , a n d g e n e r a l i z a t i o na b i l i t yi sg u a r a n t e e d ( 2 ) d u a lr e p r e s e n t a t i o n i nd u a lr e p r e s e n t a t i o n , t r a i n i n gs a m p l e sa r i s eo n l yi n t h ef o r m o fd o tp r o d u c t ;t h e r e b yw ec a nr e p l a c ed o tp r o d u c tw i t hk e r n e lf u n c t i o n ( 3 ) k e r n e ls t r a t e g y f r o ml i n e a rc l a s s i f i e rt on o n l i n e a rc l a s s i f i e r , w h a tw en e e di so n l y s u b s t i t u t i n gk e r n e lf u n c t i o nf o rd o tp r o d u c t , o r i g i n a ll i n e a ra l g o r i t h mr e m a i n s ,a l lm e r i t so f l i n e a rc l a s s i f i e ra r ei n h e r i t e ds u c ha ss i m p l ec o m p u t a t i o n , n ol o c a lm i n i l n u l l lc ta 1 w ec a n n o to n l ym a n i p u l a t et h em a p p e ds a m p l e si
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 苏州工行面试题及答案
- 正骨专业知识
- 浙江国企招聘2024台州湾新区招聘8人笔试参考题库附带答案详解
- 2025辽宁辽渔集团招聘27人笔试参考题库附带答案详解
- 2025福建福州市仓山区国有投资发展集团有限公司招聘1人笔试参考题库附带答案详解
- 2025甘肃张掖市发展投资集团有限公司招聘专业技术人员6人笔试参考题库附带答案详解
- 高考文言文阅读练习
- 2025年芜湖凤鸣控股集团及其子公司选调10人笔试参考题库附带答案详解
- 2025年滁州市自然资源勘测规划研究院有限公司招聘4人笔试参考题库附带答案详解
- 2025山东枣庄市国企招聘实习生高薪急聘人数106人笔试参考题库附带答案详解
- 商铺施工方案
- 北师大版2024-2025学年度第二学期一年级数学期中检测(含答案)
- 第10课 养成遵纪守法好习惯
- 2025修订版《保障中小企业款项支付条例》解读学习课件
- 2025年理化检验面试试题及答案
- 2025年水质化验工题库 - 副本
- 2025年吉林司法警官职业学院单招职业倾向性考试题库必考题
- 光伏发电项目施工的应急预案与措施
- 毕业设计(论文)-护栏清洗机设计
- 2025年春人教版英语七年级下册 Unit 7 A Day to Remember(教学设计)
- 2025年电力人工智能多模态大模型创新技术及应用报告-西安交通大学
评论
0/150
提交评论