




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
介简习学器机目录/Contents0102机器学习基本概念机器学习发展历史01机器学习基本概念机器学习基本概念2015年10月5日-9日,AlphaGo以5:0战胜欧洲冠军樊麾2段,法国围棋队总教练。机器学习基本概念2016年3月9日-15日,韩国首尔,AlphaGo以4:1战胜世界冠军李世石9段。李世石被公认为过去10年间韩国最强棋手。机器学习基本概念2017年5月23日-27日,乌镇,AlphaGo以3:0战胜当时世界第一的柯洁。机器学习基本概念在股票交易、投资顾问、风险管理和反欺诈、客户流失预警、服务优化和客户沟通等方面都使用了机器学习技术。机器学习基本概念在交通监控、智能停车、智能路灯、车路信息管理等方面也使用了机器学习技术。机器学习基本概念机器学习基本概念
左图时WindowsPhone上的语音助手Cortana,《光环》。右图是苹果的siri。他们背后的核心技术是什么?为什么它能够听懂人的语音?这个技术正是机器学习。
机器学习是所有语音助手产品能够跟人交互的关键技术。
机器学习基本概念通过上面两个图,我相信大家可以看出机器学习似乎是一个很重要的,有很多未知特性的技术。学习它似乎是一件有趣的任务。实际上,学习机器学习不仅可以帮助我们了解互联网界最新的趋势,同时也可以知道伴随我们的便利服务的实现技术。机器学习基本概念首先它是英文名称MachineLearning(简称ML)的直译,在计算界Machine一般指计算机。说明了这门技术是让机器“学习”的技术。但是计算机是死的,怎么可能像人类一样“学习”呢?传统上如果我们想让计算机工作,我们给它一串指令,然后它遵照这个指令一步步执行下去。但这样的方式在机器学习中行不通。机器学习根本不接受你输入的指令,相反,它接受你输入的数据!也就是说,机器学习是一种让计算机利用数据而不是指令来进行各种工作的方法。“统计”思想将在你学习“机器学习”相关理念时无时无刻不伴随,相关而不是因果的概念将是支撑机器学习能够工作的核心概念。什么是机器学习?机器学习基本概念对我的一个朋友小Y而言,他就不是那么守时,最常见的表现是他经常迟到。当有一次我跟他约好3点钟在某个麦当劳见面时,在我出门的那一刻我突然想到一个问题:我现在出发合适么?我会不会又到了地点后,花上30分钟去等他?我决定采取一个策略解决这个问题。故事:等人问题机器学习基本概念第一种方法是采用知识:我搜寻能够解决这个问题的知识。但很遗憾,没有人会把如何等人这个问题作为知识传授,因此我不可能找到已有的知识能够解决这个问题。第二种方法是问他人:我去询问他人获得解决这个问题的能力。但是同样的,这个问题没有人能够解答,因为可能没人碰上跟我一样的情况。第三种方法是准则法:我问自己的内心,我有否设立过什么准则去面对这个问题?例如,无论别人如何,我都会守时到达。但我不是个死板的人,我没有设立过这样的规则。机器学习基本概念我把过往跟小Y相约的经历在脑海中重现一下,看看跟他相约的次数中,迟到占了多大的比例。而我利用这来预测他这次迟到的可能性。如果这个值超出了我心里的某个界限,那我选择等一会再出发。假设我跟小Y约过5次,他迟到的次数是1次,那么他按时到的比例为80%,我心中的阈值为70%,我认为这次小Y应该不会迟到,因此我按时出门。如果小Y在5次迟到的次数中占了4次,也就是他按时到达的比例为20%,由于这个值低于我的阈值,因此我选择推迟出门的时间。这个方法从它的利用层面来看,又称为经验法。在经验法的思考过程中,我事实上利用了以往所有相约的数据。因此也可以称之为依据数据做的判断。依据数据所做的判断跟机器学习的思想根本上是一致的。机器学习基本概念一般的机器学习模型至少考虑两个量:一个是因变量,也就是我们希望预测的结果,在这个例子里就是小Y迟到与否的判断。另一个是自变量,也就是用来预测小Y是否迟到的量。假设我把时间作为自变量,譬如我发现小Y所有迟到的日子基本都是星期五,而在非星期五情况下他基本不迟到。于是我可以建立一个模型,来模拟小Y迟到与否跟日子是否是星期五的概率。如图所示为决策树模型。机器学习基本概念自变量增加:例如小Y迟到的部分情况时是在他开车过来的时候;小Y的迟到跟天气也有一定的原因,例如下雨的时候;如果我希望能够预测小Y迟到的具体时间,我可以把他每次迟到的时间跟雨量的大小以及前面考虑的自变量统一建立一个模型。机器学习基本概念机器学习方法是计算机利用已有的数据(经验),得出了某种模型(迟到的规律),并利用此模型预测未来(是否迟到)的一种方法。
机器学习的一个主要目的就是把人类思考归纳经验的过程转化为计算机通过对数据的处理计算得出模型的过程。经过计算机得出的模型能够以近似于人的方式解决很多灵活复杂的问题。
机器学习基本概念延迟符号为什么要使用机器学习?(Why)例如:手写数字识别,识别我们写出的数字通过机器学习的方式,我们可以让机器来帮我们做这些“单调乏味”的工作,让机器掌握识别手写数字的技能之后,我们就能让他们帮我们来分拣信件。如果把这项技能再进一步,让机器掌握识别并理解地址信息,我们甚至可以用机器来分拣快递。机器学习基本概念存在某些隐含的模式可以被学习到。举一个反例:预测某个婴儿下一次哭是奇数分钟哭,还是偶数分钟哭。这几乎是一个随机事件,所以不存在任何隐含的模式,因此也就不能使用机器学习的方式来解答。0103有相关的数据。举一个反例:预测世界末日什么时候到来。显然,因为我们没有世界末日发生的相关数据,所以这个问题也无法用机器学习的方式来解答。什么时候可以使用机器学习?(When)02不是很容易总结规律的问题。如果规律很容易总结,那当然就不用使用机器学习了,直接代码实现即可。机器学习基本概念机器学习的定义
百度:
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习基本概念机器学习的定义机器学习是一门系统的学科,它关注设计和开发算法,使得机器的行为随着经验数据的累积而进化,经验数据通常是传感器数据或数据库记录。机器学习是人工智能的一个分支,即机器基于输入的原始数据生成规则。机器学习基本概念机器学习的定义一个计算机程序能够从经验E中学习(学习任务是T,学习的表现用P衡量),这个程序在任务T与表现衡量P下,可以通过经验E得到改进。一个机器学习就是从数据中训练出一个模型,该模型有不低于某种评估指标的泛化能力。机器学习基本概念机器学习的定义广义:机器学习是一种能够赋予机器学习的能力以此让它完成直接编程无法完成的功能的方法。实践:机器学习是一种通过利用数据,训练出模型,然后使用模型预测的一种方法。机器学习基本概念●模式识别=机器学习●数据挖掘=机器学习+数据库●统计学习和机器学习●计算机视觉=图像处理+机器学习●语言识别=语言处理+机器学习●自然语言处理=文本处理+机器学习机器学习的范围机器学习基本概念机器学习与数据挖掘的关系:如果数据挖掘的目标是去寻找数据间的隐含规律,那么数据挖掘和机器学习做的事情是一样的。但是传统的数据挖掘总是着眼于大数据的高效计算。(比如分布式计算框架)机器学习123机器学习与人工智能的关系:机器学习是实现人工智能的一种途径,除此之外,还有一些其他的方式可以实现人工智能。机器学习与统计学的关系:统计学的很多知识都可以被借鉴到机器学习中,但是机器学习中也有很多算法不是基于统计学的规律的。机器学习与其他科目关系机器学习基本概念02机器学习发展历史近年来,人工智能的强势崛起,让我们领略到了人工智能技术的巨大潜力。数据是载体,智能是目标,而机器学习是从数据通往智能的技术途径。2.机器学习的发展进程机器学习是数据科学的核心,是现代人工智能的本质。机器学习的发展是人工智能发展史上重要的分支,机器学习的发展离不开人工智能的发展。2.机器学习的发展进程2.机器学习的发展进程20世纪50年代到70年代初,运用基于符号知识表示的演绎推理技术,人们认为只要给机器赋予逻辑推理能力,机器就能具有智能。推理期知识期学习期A.Newell和H.Simon的“逻辑理论家”(LogicTheorist)程序证明了数学原理,以及此后的“通用问题求解”(GeneralProblemSolving)程序。A.Newell和H.Simon获得1975年的图灵奖。1952年,阿瑟·萨缪尔(ArthurSamuel)在IBM公司研制了一个西洋跳棋程序,这是人工智能下棋问题的由来。2.机器学习的发展进程马文·明斯基(MarvinMinsky)1951年提出思维如何萌发并形成的基本理论,1956年达特茅斯会议的发起人之一,并提出“人工智能”的概念,1958年在MIT创建世界上第一个AI实验室,1969年首位图灵奖获得者,1975年首创框架理论。约翰·麦卡锡
JohnMcCarthy,1956年达特茅斯会议的发起人之一,并提出“人工智能”的概念,1958年与明斯基一起创建世界上第一个人工智能实验室,发明a-β剪枝算法,1959年开发LISP语言,开创逻辑程序研究,用于程序验证和自动程序设计1971年获得图灵奖。2.机器学习的发展进程MarvinMinskyJohnMcCarthy2.机器学习的发展进程推理期知识期学习期20世纪50年中后期,F.Rosenblatt提出了感知机(Perceptron),但该感知机只能处理线性分类问题,处理不了“异或”逻辑。2.机器学习的发展进程E.A.Feigenbaum等人认为,要使机器具有智能,就必须设法使机器拥有知识。在他们的倡导下,20世纪70年代中期开始,人工智能进入了“知识期”。在这一时期,大量专家系统问世,在很多领域做出了巨大贡献。E.A.Feigenbaum作为“知识工程”之父在1994年获得了图灵奖。推理期知识期学习期2.机器学习的发展进程但是,专家系统面临“知识工程瓶颈”,简单地说,就是由人来把知识总结出来再教给计算机是相当困难的。推理期知识期学习期2.机器学习的发展进程20世纪80年代中后期,人工智能进入“学习期”,
20世纪80年代是机器学习成为一个独立的学科领域并开始快速发展、各种机器学习技术百花齐放的时期。在此之后的10年里出现了一些重要的方法和理论,比如分类与回归树、反向传播算法和卷积神经网络。推理期知识期学习期20世纪90年代,机器学习的理论和方法得到完善和发展,其重要成果有:支持向量机(SVM)、循环神经网络(RNN)、随机森林等。2006年加拿大多伦多大学教授、机器学习领域泰斗、神经网络之父——GeoffreyHinton
提出了神经网络DeepLearning模型。小结010203机器学习基本概念机器学习发展历史听聆谢谢用应络网经神技术目录/Contents0103神经网络基本原理0402神经网络-图片识别神经网络的数据分类BPRBF网络的回归01神经网络应用技术
计算机设备也是我们为了方便我们生活,提高我们工作效率而产生的。我们知道,计算机的发展历程也并不长,从世界上的第一台计算机“ENIAC”的诞生到现在也不过经历了短短的七八十年。计算机的体量也从当年的占地一百多平方米发展成为现在的小型微型计算机,计算速度也从每秒数十次到现在的每秒数亿次。当前的计算机技术已经能够基本满足我们普通人的正常工作生活需求,极大地提高了我们工作的效率。5.1神经网络基本原理5.1.1生物神经网络
人类可以说是地球上具有最高智慧的生物,人类有着智慧、有着情感、有着处理各种事情的能力,面对现实世界中各种不同的复杂场景,人类可以产生不同的情感、不同的思考,也会做出不同的反馈,这就是人类的智慧所在。人类数万年来发展进化到现在,能够顺应自然、改造自然,提出问题、解决问题,都是通过人类的智慧所完成的,而这种智慧的获得,是一代一代人学习和传递得到的。那么,人类的智慧到底是怎样工作的呢?这就要提到神经网络了。20世纪初期的神经生物学已经阐明,人的智力功能定位在人的大脑皮层,而人的大脑皮层是由大量的神经元和支持神经元的胶质细胞组成的,其中,神经元是基本的信息处理单元。
类似地,人工神经网络(ANN)中也有生物神经网络等价的结构,如图5-4所示。其中输入连接就对应于下图中的每个圆圈,也就是代表一个神经元。每个神经元接受0个或多个输入,要么来自初始输入,输入层Input的输入是初始输入,相当于人体最表层的感知神经元,要么来自网络中的前一层;线性计算和激活函数,也就是图中的每一条线表明两个神经元间的信息传递,这些“累加”输入共同作用,影响着是否激活当前这个神经元;输出连接,即传递激活信号至网络中下一层的神经元。如图所示,我们把每个神经元按位置分为输入层、隐藏层、输出层三层;其中输入层的功能就是输入变量,有时称为可见层;隐藏层即输入和输出层之间的节点层;输出层即生成输出变量的节点层。5.1.2人工神经网络图5-4人工神经网络5.2神经网络-图片识别
神经网络的技术不断在发展,精度准确率也不断在提高,当前神经网络技术最主要的应用场景也是我们生活中最常能见到的应用场景就是对于图像的处理。近年来随着互联网技术的发展,网络上无时无刻不在产生着海量的数据,这些数据中就包含了大量的图像数据,但是当前随着互联网技术的发展普及,迎来了大数据时代的到来,面对海量的图片数据,仅仅依靠我们人进行手工的图像识别、处理、分析去获取图像当中的信息知识就显得尤为局促,效率低下满足不了当前我们的需求。计算机视觉就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图像处理,用计算机处理成为更适合人眼观察或传送给仪器检测的图像,简而言之计算机视觉的主要任务可以概括为两点:1)让计算机具有人类视觉的所有功能。2)让计算机从图像数据中,提取有用的信息。5.2.1卷积神经网络
在深度学习入门的过程中,卷积神经网络(ConvolutionalNeuralNetwork,CNN)模型的学习是必不可少的,CNN是深度学习理论和方法中的重要组成部分,对卷积神经网络的研究始于二十世纪80至90年代,时间延迟网络和LeNet-5是最早出现的卷积神经网络;在21世纪后,随着深度学习理论的提出和数值计算设备的改进,卷积神经网络得到了快速发展,并被应用于计算机视觉、自然语言处理等领域。卷积神经网络也是一种神经网络,他是在深度神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法。图5-6深度神经网5.3BP神经网络的数据分类——语音特征信号分类5.3.1BP神经网络BP(backpropagation)神经网络是1986年由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的神经网络。图5-10BP神经网络5.3.2语音特征信号识别
语音特征信号识别是语音识别研究领域中的一个重要方面,其根本目的就是判断某种语音信号属于类别。语音特征信号是指用特定的算法把语音转变为特定的数学序列,语音特征信号识别既是用语音特征信号来判断该语音信号属于哪类。语音特征信号识别的方法很多,比较适合于BP网络求解,用训练数据对BP网络进行训练后,即可以用BP网络来根据语音特征信号判断该语音所属类别。
5.4BPRBF网络的回归--非线性函数回归的实现
人工神经网络以其独特的信息处理能力在许多领域得到了成功的应用。它不仅具有强大的非线性映射能力,而且具有自
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论