从AlphaGo看机器学习

上传人：众*** IP属地：上海上传时间：2021-12-20 格式：DOCX 页数：3 大小：14.73KB 积分：34 举报 版权申诉

全文预览已结束

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、从AlphaGo看机器学习陈东焰陆畅摘要：2021年5月，AlphaGo以3：0战胜世界排名第一的柯洁九段，一时间引起了人们对人工智能的热议。AlphaGo主要工作原理是深度学习，它属于机器学习，机器学习又属于人工智能的范畴。可以说机器学习是近年来人工智能领域最热门的板块，吸引着诸多研究者投入了大量的研究，也有着丰富的产出。本文从AlphaGo谈起，介绍人工智能的开展，机器学习的概念理解、分类及应用，分析了模型训练中的常见问题，人工智能与伦理的关系。关键词：人工智能机器学习模型中图分类号：TP181

2、文献标识码：A 文章编号：1674-098X202105a-0146-022021年5月，AlphaGoMaster以3：0战胜了世界排名第一的柯洁九段，一时间引起了不小的轰动。AlphaGo是一款围棋程序，由Google的DeepMind公司开发。早在2021年10月，AlphaGo就以5：0战胜樊麾二段;2021年3月，

3、AlphaGo以4：1战胜拥有18个世界冠军头衔的职业九段李世石;2021年12月29日2021年1月4日，AlphaGo在网络围棋平台上以“Master为注册号60：0战胜数十名中韩日职业围棋手;2021年10月18日，最终版本AlphaGoZero问世，它经过3d的训练以100：0的战绩击败了AlphoGoLee，经过40d的训练击败了AlphoGoMaster。AlphaGo前期版本，结合了数百万人类围棋专家的棋谱，AlphaGoZero那么有了质的提升，它不再需要人类数据和经验，研发团队让它进行自我博弈，3d的训练时间，自我对弈的棋局数量为490万盘。AlphaGo主要工作原理是“深度

4、学习，深度学习是指多层的人工神经网络和训练它的方法。它属于最近十年一个特别火的技术“机器学习ML，机器学习又属于人工智能AI的范畴。1 从机器学习的角度看人工智能的开展史1956年夏天，美国达特茅斯学院举行了人工智能研討会，被认为是人工智能诞生的标志。会上约翰·麦卡锡首次提出了“人工智能这个概念。1959年，IBM公司的计算机专家阿瑟·塞缪尔创造了“机器学习一词。1958年，机器人之父恩格尔伯格和创造家德沃尔合作创立一家生产机器人的公司，当年就产出了一个可以自动完成搬运的机械手臂。1961年，第一台工业机器人Unimation在通用汽车试运行，作用非常显著。197

5、3年，世界第一个人形机器人Wabot-1在早稻田大学诞生，它可以进行简单日语对话，测量距离和方向，靠双脚行走，两手有触觉，可搬运物体行动。1980年，WABOT-2问世，可以用手脚灵活地演奏电子琴。20世纪70年代初，当时的计算机有限的内存和处理速度缺乏以解决实际的人工智能问题，加上数学模型和数学手段有一定的缺陷，对人工智能研究的资助逐渐停止，人工智能进入第1个低谷。直到1980年著名的专家系统XCON的研发，1982年霍普菲尔德神经网络被提出，1986年BP算法出现，使大规模神经网络的训练成为可能，将人工智能推向第2个黄金期。20世纪80年代晚期，美国国防高级研究方案局对AI的投资再次减少，

6、19871993年，人工智能进入第2个低谷。1997年5月，IBM的“深蓝计算机战胜国际象棋大师加里·卡斯帕罗夫，它存储了从18世纪起的200多万经典对局。2021年，杰弗里·辛顿提出“深度学习神经网络，使得人工智能性能获得突破性进展。2021年，深度学习算法在语音和视觉识别上取得成功，人工智能进入感知智能时代。2021年，伊利诺伊大学香槟分校教授李飞飞发现，相对于更好的算法，数据也非常重要，她建立了数据集ImageNet。2021年的图像识别率提升到97.3%，超过了人类，证明了更庞大的数据可以带来更好的决策。2021年IBM的超级计算机Watson在美国著名智力节目?危

7、机边缘?中战胜了人类，20212021年AlphaGo打败了人类。2 理解机器学习及应用机器学习的经典定义：利用经验来改善计算机系统的性能。传统上，如果我们想让计算机工作，会给它一串指令，一步步执行下去。但机器学习不接受输入的指令，它只接收数据，也就是说机器学习是一种让计算机利用数据而不是指令来进行工作的方法，是通过归纳思想得出的相关结论。简单来讲，“机器学习的原理就是模仿人类学习的过程，通过经验来强化自己，所以说机器学习超越人类是完全有可能的。我们可以这样理解机器学习的过程：1+2=？机器：10;太大了;5+7=？机器：6：太小了;2+6=？机器：8;答对了。机器知道了2+6=8，

8、它会在不断的试误中找到正确的答案，在一步步地调整自己学习的方式方法和路径的同时，优化计算过程，保证尽可能少出错，当它能够完全一次性算出正确结果时，它的模型拟合成功，可以被投入使用了。机器学习的应用方向：有现存的解决方案，但是需要手写大量规那么的问题;不存在较好的解决方案的复杂问题;不断开展的问题，机器学习可以适应新的数据;希望通过机器学习，对复杂问题和大量数据得到一些新的见解。3 机器学习的分类机器学习有不同的分类方法，常见的按是否在人为监督下学习分为：监督学习、无监督学习、半监督学习、增强学习。监督机器学习：需要提供带有标签的数据。例如，要区分男孩和女孩的图片，那么男孩的照片打上“

9、男孩、女孩的照片打上“女孩标签，训练模型，直到它能通过测试。半监督机器学习：只有少数图像被标记，计算机程序对未标记的图像进行最正确猜测，然后作为训练数据反响给程序。比方，你有一个相片集，拿出局部相片，把自己的相片标识成“我，把其他人的相片标识成“某人，训练模型，直到它能够做出正确的分辨。无监督机器学习：这种类型的机器学习不涉及任何标签，任由机器深入到数据中去发现和体验，并寻找模式和联系，然后得出结论。强化学习：强化学习把学习看作试探评价过程，智能体选择一个动作用于环境，同时产生一个强化信号奖或惩，智能体根据强化信号和环境当前状态再选择下一个动作，选择的原那么是使受到正强化奖的概率增大。4

10、60;训练模型时的常见问题为了训练出更好的机器学习模型，我们会先选择一个适宜的机器学习算法，再准备好不同的参数，训练模型，得到适宜的参数。例如我们现在要做一个分辨一个物体是否是苹果的模型，苹果有很多品种，它要学习苹果这些特征，把这学到的所有特征整合，也就是模型拟合。有时存在这样的问题：如果从一开始就界定苹果是红颜色的，那么，给一个青苹果时，机器会认为不是苹果，这就是过拟合。一般认为过拟合是由于网络过深，模型的构建关注到了本不是苹果的特征，导致学习有误。过拟合经常表现为训练时，得分很高，但在测试时正确率却很低。这时候就需要机器做及时的完善，学习成苹果是有颜色的即可。有时也会存在这样的情况：如果构

11、建的模型，只认为苹果特征是圆的，那么给一个桔子，它也认为是苹果，这说明机器对苹果特征的学习还不够，这就是欠拟合。一般认为欠拟合是由于网络过小造成的，因此机器就还需要更多的学习来认识苹果。5 人工智能与伦理控制论之父维纳在?人有人的用处?中在谈到自动化技术和智能机器时，得出了一个危言耸听的结论：“这些机器的趋势是要在所有层面上取代人类，而非只是用机器能源和力量取代人类的能源和力量。虽然维纳的话在今天还没有成为现实，但已经成为诸多文学和影视作品中的题材，人们也在讨论人工智能究竟在何时会形成属于自己的意识，超越人类，让人类沦为它的奴仆。目前人工智能相关的倫理和法律研究相对滞后，但可喜的是，我们看到有许多有识之士在呼吁大家共同遵循平安的理念和规那么。相信机器学习能给人类带来美好的明天。参考文献

人人文库> 全部分类> 专业文献 > 学术论文

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

从AlphaGo看机器学习

文档简介

温馨提示

最新文档

评论

从AlphaGo看机器学习

文档简介

温馨提示

最新文档

评论

相关文档