支持向量机的设计与实现_第1页
支持向量机的设计与实现_第2页
支持向量机的设计与实现_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

支持向量机的设计与实现

1总结网络信息的研究和评价是有效控制网络,促进社会主义和谐社会建设的重要手段。2svm的原理支持向量机(SupportVectorMachine,SVM)是CorinnaCortes和Vapnik等于1995年首先提出的,它在解决高维模式识别中有许多优势,并能够推广到其它机器学习问题中。与传统的机器学习对比发现,在基于VC维(Vipnik-Chervonenkisdimension)理论中,SVM遵循结构风险最小化的原则。其理论思想是:首先选择事先预定的非线性映射关系uf066(uf0d7),将输入的向量X映射到一个高维特征空间向量Z;接着在这个空间向量中构建最优的分类超平面;最终让正确和错误样本之间的分离界限达到最大。依概念理解,离那些决策平面最近的数据点就构成了支持向量,这决定了最优分类超平面的位置。研究证明,最大化分离界限等价于使权向量的Euclidean范数最小2.1rage函数中的svm在两模式分类问题模型中:第一类表示为1,第二类表示为-1。分类超平面表达式为:其中,w是权矢量,其中,N和其中,称为惩罚因子。其约束条件是:利用Lagrange乘子法得到此问题的对偶问题其中Lagrange乘子用α(28)[uf061,(6)式可以写为:约束条件:其中K(x其中,sgn(·)是符号函数。研究发现,当uf061其中,M表示支持向量的个数。而对于通过(12)式确定的阈值b,就能得出判决函数。分析发现采用不同的内积核函数,就可以构造出不同类型SVM,常用的SVM主要有:(1)多项式核函数SVM;(2)径向基核函数SVM;(3)两层感知器核函数SVM;使用较多的是前两种SVM。2.2quadatchpart2通过前面的讨论可以得出,SVM的训练问题可以归纳为一种二次规划(quadraticprogramming,QP)问题。在近十年的发展中,涌现出许多新学习算法,其中比较经典的有:Vapnik提出了chunking方法,Joachims提出了SVM3解决数据聚类分析问题的决策树设计在互联网分析中引入聚类分析,就是对互联网数据进行归类、分组、汇总,得出群体的聚类特征并形成属性知识。而趋势分析则是对前面会联网数据聚类分析后所得到的属性知识为研究对象,接着设计出解决此问题的决策树,以揭示出问题发展的趋势,为预测和把握未来发展方向提供帮助。计算动词决策树的过程是:首先从研究对象属性类型的根节点选取,其次选取根节点的下一个叶子节点N,接着找到此节点N的最佳决策属性,然后通过计算动词增益和计算动词熵来训练节点,最后判断是否把训练样本进行了最佳分类,得到就结束,否则继续找最佳决策属性。4关注热点、敏感话题的识别与追踪(1)在支持向量机技术的支持下,对新闻、论坛/BBS、博客、即时通信软件等渠道传播的网络舆情进行采集,运用聚类分析、主题检测与跟踪、自动摘要等定向分析技术,可以得出网络舆情传播者的感情、想法、观点、立场和意图等主观的特征表现。最终实现用关键字布控、语义分析来达到识别敏感话题的目的。(2)热点话题、敏感话题瞄准与追踪。目前国内外大多采用了文本聚类技术——文本关键字词作为文本特征,分析新发表文章、贴子的话题是否与已有热点或敏感主题相同,并对发表的话题和发信人发表的文章的观点、倾向性进行分析与统计。(3)研究发现当前的网络舆情的研判和预警效果并不理想。主要原因是缺乏统一全面的、全方位多层次的网络舆情预警信息系统,无法满足当前用户所期望的需求;此外各大厂商之间缺乏合作和协调,难以形成有效的合力。所以网络舆情分析及研判技术还有更大的发展空间。(4)除市场环境及用户需求没有边界等特殊因素外,怎样将计算技术与处理内容结合,怎样设计具体的分析引擎和自动信息采集,怎样构建舆情分析库、属性知识储备库,怎样对收集的信息进行与判断、筛选和预处理形成格式化信息,怎样加强专家与系统结合、人机结合来提升舆情判断的准确性等到都是当前解决问题的最重要环节。5在折中的应用支持向量机理论建立在统计学习理论的VC维理论和结构风险最小原理基础上,它作为一种新的机器学习方法,能够依据有限的样本信息,在模型的复杂性和学习能力之间寻求最佳折中,在解决模式分类问题上具有近似最优,而且在没有问题域相关知识属性时所设计的机器依然具有较好的性能。文中提出一种基于支持向量机技术的网络舆情研判方法,具有突出的小样本学习方法,借助它强大的泛化能力,实现了高效的从训练样本到预报样本的“转导推理”,在网络舆情信息处理中具有良好

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论