




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 感知机理论研究综述 张天欣近年来,机器学习在各个领域发挥出了出色的表现,在自然语言处理,图像识别,推荐系统等领域都发挥了巨大的作用,成为了当前十分热门的一个学科领域,这引起了笔者的关注和研究。本文主要介绍了机器学习领域的感知机算法,通过感知机算法的概念、思想,以及理论等方面,全面地介绍了感知机算法在解决线性可分的二分类问题中发挥的作用,并通过它的实际应用以及算法自身的特点,对它未来的发展和完善做出了展望。【关键词】感知机 线性分类器 机器学习1 引言随着计算机技术的发展以及各种数据及资源的飞速增长。为了有效地管理和利用各种各样的数据,通过对
2、大量数据的学习使机器具有认识问题和解决问题的能力,这就是机器学习。机器学习作为人工智能的核心内容,已经开始作为一个独立的学科领域飞速发展,并渗透于生活中的各个领域。机器学习的整体思路是定义一个有效的目标模型和一个可以衡量目标模型优劣程度的损失函数,通过对数据的学习一步步地优化目标模型使得损失最小的方式来求出最优模型,最终可以利用这个目标模型来完成各种任务。感知机是机器学习算法中第一个具有重要学术意义的基础算法,它具有运算简单,收敛速度快,具有实用价值等特点,是机器学习领域重要的算法之一,同时也是著名的机器学习算法支持向量机(svm)的基础。2 概念在mcculloch 与pitts 模型的基础
3、上 rosenblatt 首先提出了感知机算法。感知机模型是一个线性分类器,它的目标是通过训练数据训练出能够将数据进行线性二分类的分离超平面。感知机虽然结构简单,但能够学习并解决多种复杂的问题。感知机主要的本质缺陷是它不能直接处理线性不可分问题,以及解决方案的非最优化。3 感知机原理3.1 感知机模型感知机模型就f(x)=sign(w*x+b),即目标模型,我们要做的就是通过已知的数据学习训练得出w和b这两个未知参数,得到了这两个参数也就等同于训练出来我们的目标模型。如下由输入空间x到输出空间f(x)的函数称为感知机的模型:f(x)=sign(w.x+b)其中w叫做权值(weight)或权值向
4、量,w(w1,w2,w3,wn),来表示各个输入对于输出的重要程度,b叫做偏置(bias)用来调整整体结果和阈值之间的关系。sign为符号函数:感知机模型的原理:每一组参数值实际上就对应了一个目标模型,所以只要得出目标参数也就得出了目标模型。我们要初始化参数,然后根据已知的数据来判断这个模型是否符合我们的期望,如果不符合,那么我们根据感知机的学习策略来更新参数,这样得到了一个新的模型,然后再进行判断这个新的模型是否符合我们的期望,如此循环,直至找到符合我们期望的模型。3.2 感知机的学习策略在数据集线性可分的前提下,感知机的学习目标是通过已知数据训练出一个超平面,这个超平面需要具有如下特性:能
5、够将训练集中的两类样本点完全正确分类。为了找到这个超平面,即确定感知机模型参数w,b,需要确定一个学习策略,即定义一个损失函数,来衡量目标模型的优劣,损失函数极小化的过程就是目标模型优化的过程。所以求解目标模型,就可以转换为求解损失函数的最小值。如何定义损失函数?一个自然选择是误分类点的总数,通过误分类点的综述来衡量当前感知机模型的优劣,但是这样的损失函数存在一个严重的问题:对于数据量较小的训练集,我们可以通过这样损失函数找到目标模型,但是当数据集的數据量较大时,我们需要通过计算来求出当前损失函数的最小值,而此时的损失函数关于w,b不是连续可导函数,这样会严重影响我们求出损失函数最小值的效率。
6、所以感知机的损失函数采用另一种形式来定义:计算所有点到超平面的总距离,这样当损失函数为最小值时,意味着所有样本点分类正确,此时损失函数的参数即为目标模型的参数。感知机f(x)=sign(w.x+b)模型的损失函数定义为(重点):l(w,b) = -yi(w*xi+b)为第i组数据的输入和输出,(w*xi+b)是根据当前模型对x做出的预测值,yi是对应于xi的真实值,当一个样本被分类正确时(即取阈值为0时,预测值和真实值都大于0或者都小于0),它的输出是负值,分类错误时,输出值是正值,即损失函数的最小值意味着最多的正确分类点。首先我们需要初始化一组参数< w0,b0>,即初始化一个超
7、平面,然后通过梯度下降法不断地极小化目标函数,即对损失函数l(w,b) = -yi(w*xi+b)分别对w,b求偏导,以求出损失函数最小值。随机选取一个误分类点 (xi,yi),对 w和b 进行更新:ww+yixibb+yi其中 是步长,又称为学习速率,用来控制w和b更新幅度的大小,越大,需要更新的次数越少,但是可能跨过最小值,倒置反复更新,而 越小,则需要更新的次数越多,所以选取适当的也是一个重要的环节。这种学习策略可以理解为当一个样本点被错误分类时,则更新w和b的值,直到该样本点被正确分类。如此循环,直至所有的样本点都被正确分类3.3 感知机学习算法以二维空间为例,感知机的模型即为图1中的
8、蓝色直线,也就是我们要找的可以将红色点和蓝色点区分开的目标模型。例如图1,红色作为一类,蓝色作为另一类,一旦我们找到了这条直线,那么根据一个点在这条直线的上侧还是下侧即可判断该点的分类。如图1所示。感知机学习的过程是由训练集训练出目标感知机模型的过程,即通过已知的数据x和y求得模型参数w,b,进而得到感知机模型f(x)=sign(w*x+b),这里x和y分别是特征向量和类别(也称为目标)。 感知机学习算法转化为求解感知机损失函数的最优化问题,最优化的方法是随机梯度下降法。学习算法:输入:训练数据集t、学习率输出:w,b;感知机模型f(x)=sign(w.x + b)(1)初始参数w0,b0;(
9、2)依次选取训练集中所有的数据(xi,yi);(3)如果yi(w.xi + b) <= 0,即分类错误,则使用随机梯度下降法更新w和b;(4)转至(2),直至训练集中的所有样本点均被正确分类。4 展望4.1 感知机的局限性感知机最初被认为有着良好的发展潜能,但感知机不能直接解决一些线性不可分问题,而且通过感知机算法找到的目标模型有多个,每一个都能满足需求,但这多个模型中有一个最优模型,即为支持向量机模型。其次,感知机是面向二分类的任务,目前对于多分类的任务只能简单地转换为多个二分类问题来处理。4.2 感知机的优势感知机算法是机器领域的一个基础算法,对它的学习和能够更深入的理解其他算法。同
10、时其自身具有系统结构简单,模型易于训练,对于二分类问题分类效果十分显著,学习和预测时间短,使得算法更加高效,其应用也具有更广阔的前景。4.3 感知机的发展感知机面向的是线性分类,但在现实中的分类问题通常是非线性的。简单的感知机模型主要用于线性分类器,但在近年,在使用核技巧改进感知机学习算法之后,愈来愈多的人对感知机学习算法产生兴趣,完善感知机算法,使得多层感知机可用于非线性分器等更复杂的任务上。感知机目前是针对二分类问题的算法,但是所有的分类问题都可以转换为多层的二分类问题,也就是通过贵感知机算法的改进,升级,可以提升感知机的分类能力,从二分类改进为可以进行多分类,同时可以将多分类的改进和非线
11、性分类的改进进行结合,进而处理更为复杂的分类任务。参考文献1王惊晓.budget感知机研究综述j.电脑知识与技术,2012,8(14):3371-3373+3390.2李紅霞.感知机学习算法模拟与改进j.信息与电脑(理论版),2009(10):98-99.3刘华煜.基于支持向量机的机器学习研究d.大庆石油学院,2005.4丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述j.电子科技大学学报,2011,40(01):2-10.5郭亚宁,冯莎莎.机器学习理论研究j.中国科技信息,2010(14):208-209+214.6张润,王永滨.机器学习及其算法和发展研究j.中国传媒大学学报(自然科学版),2016,23(02):10-18+24.7安增波,张彦.机器学习方法的应用研究j.长治学
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 预防甲流中班教案
- 贵州省安顺市2024-2025学年高三下学期第四次监测考试地理试题
- 2025届天津杨村一中高三-历史试卷
- 2025届福建省泉州市高三毕业班下学期质量监测(三模)历史试题
- 特许金融分析师考试展望未来试题及答案
- 高龄产妇的妊娠期护理
- 高脂血症的预防与护理
- 特许金融分析师考试的重要复习资源试题及答案
- 创业基本知识
- 石家庄市辛集中学高二上学期第三次阶段考试英语试题
- 设计伦理和责任
- 射频消融治疗腰椎间盘突出
- 第八单元写作指导 统编版高中语文必修下册
- 儿童外科微创手术介绍
- 2024-2029年中国中医四诊仪行业市场现状分析及竞争格局与投资发展研究报告
- (高清版)DZT 0305-2017 天然场音频大地电磁法技术规程
- 消化道出血的PBL教学查房
- 放射诊疗设备的辐射安全防护设计
- 人音版四年级音乐下册全册教学设计教案表格式
- 计算机应用基础(Windows10+Office2016)(第3版)-教案 情境5、6 Word2016基本操作、实验 Word 2016基本操作
- 《铁路建设项目质量安全红线管理规定》
评论
0/150
提交评论