版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hadoop平台中支持向量机分类算法的实现导师:李学俊答辩人:齐夏新学号:E01214190专业:软件工程主要内容1234156研究背景及意义Hadoop及SVM简介SVM原理SVM优点及应用举例研究步骤时间进度安排研究背景及意义
分类问题是实际应用中普遍存在的问题,也是及其领域学习的基础条件之一,快速发展的信息技术对其在理论研究和实际应用中提出了许多新的难题和挑战。支持向量机是建立在统计学习理论基础上的新型机器学习方法。它根据有限样本信息在模型的复杂和期望风险之间寻求最佳方式,从而获得更好的泛化性能。支持向量机专门针对有限样本情况,得到现有信息下的最优解,很大程度上解决了模型选择、过学习、非线性、维数灾难等问题。与传统的学习方法相比,支持向量机具有泛化能力强、维数不敏感、收敛到全局最优等优点,较好地解决了传统算法容易出现的过学习、局部极值、维数灾难等棘手问题,成为近几年机器学习领域中的一个非常活跃的研究热点。Hadoop简介Hadoop是一个分布式系统基础架构,具有高可靠性、高扩展性、高效性、高容错性等优点hadoop由两部分组成,分别是分布式文件系统HDFS和分布式计算框架MapReduce。HDFS主要用于大规模数据的分布式存储,而MapReduce则构建在分布式文件系统之上,对存储在分布式文件系统中的数据进行分布式计算。HDFS是一个具有高度容错性的分布式文件系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS架构图同HDFS一样,HadoopMapReduce也采用了Master/Slave(M/S)架构,它主要由以下几个组件组成:Client、JobTracker、TaskTracker和Task。HadoopMapReduce架构图SVM简介支持向量机(SupportVectorMachine或SVM)是一种建立在统计学习理论StatisticalLearningTheory或SLT基础上的机器学习方法。与传统统计学相比,统计学习理论SLT是一种专门研究小样本情况下及其学习规律的理论。该理论是建立在一套较坚实的理论基础之上的为解决有限样本学习问题提供了一个统一的框架。它能将许多现有方法纳入其中有望帮助解决许多原来难以解决的问题。SVM原理支持向量机SVM是一种分类算法,通过寻求结构化风险最小来提高学习机泛化能力,实现经验风险和置信范围最小化,从而达到在统计样本量较少的情况下,亦能获得良好统计规律的目的。1.在n维空间中找到一个分类超平面,将空间上的点分类。SVM原理2.一般而言,一个点距离超平面的远近可以表示为分类预测的确信或准确程度。SVM就是要最大化这个间隔值。而在虚线上的点便叫做支持向量SupprotVerctor。SVM优点及举例
SVM学习问题可以表示为凸优化问题,因此可以利用已知的有效算法发现目标函数的全局最小值。而其他分类方法(如基于规则的分类器和人工神经网络)都采用一种基于贪心学习的策略来搜索假设空间,这种方法一般只能获得局部最优解。应用举例:假设现在你是一个农场主,圈养了一批羊群,但为预防狼群袭击羊群,你需要搭建一个篱笆来把羊群围起来。但是篱笆应该建在哪里呢?你很可能需要依据牛群和狼群的位置建立一个“分类器”,比较下图这几种不同的分类器,我们可以看到SVM完成了一个很完美的解决方案。
研究步骤1.对所选课题进行分析,Hadoop平台中支持向量机分类算法的实现,了解Hadoop平台,对资源管理模型(yarn),计算模型(mapreduce),存储模型(hdfs)有一定的认识。2.结合支持向量机的方法及其原理,利用分布式编程来实现支持向量机的分类算法,最后在分布式系统Hadoop中来运行。3.完成支持向量机的分类算法,并在数据集中进行测试。时间进度安排1.2.21-3.21
学习Hadoop,mapreduce的概念及原理,准备开题报告2.3.22-4.10
开题答辩。Hadoop集群操作,使用mapreduce编程实践3.4.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 4S店环境卫生保障合同
- 科技园区道路改造注浆合同
- 影楼分店合同范例
- 旅游景点专用停车场地租赁合同
- 金融服务业应收账款监控
- 水上乐园租赁合同:清凉一夏
- 新屋购买清单餐具合同模板
- 投标建筑工程合同范例
- 抵押车租车合同范例
- 提成进口合同模板
- 2023-2024全国初中物理竞赛试题:光的反射及折射(含答案)
- 人教版(2024)七年级地理上册3.2《世界的地形》精美课件
- 2024年中考英语试题分类汇编:短文填空之选词填空(解析版)
- 山东省烟台市2024年中考英语真题【附真题答案】
- GB/T 44186-2024固定式压缩空气泡沫灭火系统
- 二年级下册科学教案-5《磁极的秘密》 青岛版
- JGJ104-2011建筑工程冬期施工规程
- 船体结构智慧树知到期末考试答案章节答案2024年山东交通学院
- AQ 1117-2020 煤矿井下注浆用高分子材料安全使用管理规范(正式版)
- 《中医药文献检索》课件
- 平衡记分法与关键绩效指标(KPI)(中国联通思茅分公司实际操作模板)
评论
0/150
提交评论