版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2版人工智能通识教程第2章周苏教授QQ:81505050定义人工智能导读案例:自动驾驶概述自动驾驶就是车辆在无驾驶员操作的情况下自行实现驾驶,它是车辆的能力。比如扫地机器人在扫地的时候就是在自动驾驶。自动驾驶有多种发展路径,单车智能、车路协同、联网云控等。车路协同是依靠车-车,车-路动态信息的实时交互实现自动驾驶。联网云控更注重通过云端的控制实现自动驾驶。01人工智能概述02人工智能发展历程目录/CONTENTS03人工智能的研究将人类与其他动物区分开的特征之一就是省力工具的使用。人类发明车轮以减轻远距离携带重物的负担,人类发明长矛从此不再徒手与猎物搏斗。数千年来,人类一直致力于创造越来越精密复杂的机器来节省体力,然而,能够帮助人们节省脑力的机器却一直是一个遥远
的梦想。时至今日,我们才具备了足够的技术实力来探索更加通用的思考机器。第2章定义人工智能PART01人工智能概述人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。自诞生以来,人工智能的理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。2.1人工智能概述显然,人工智能就是人造的智能,它是科学和工程的产物。我们也会进一步考虑什么是人力所能及的,或者人自身的智能程度有没有达到可以创造人工智能的地步,等等。不过,生物学不在这里的讨论范围之内,因为基因工程与人工智能的科学基础全然不同。人们可以在器皿中培育脑细胞,但这只能算是天然大脑的一部分。所有人工智能的研究都围绕着计算机展开,其全部技术也都是在计算机中执行的。2.1.1“人工”与“智能”“智能”,涉及到诸如意识、自我、思维(包括无意识的思维)等等问题。事实上,人应该了解的是人类本身的智能,但我们对自身智能的理解,对构成人的智能的必要元素也了解有限,人们很难准确定义出什么是“人工”制造的“智能”。因此,人工智能的研究往往涉及对人的智能本身的研究,其他关于动物或人造系统的智能也普遍被认为是与人工智能相关的研究课题。
图2-4研究人的智能2.1.1“人工”与“智能”1906年,法国心理学家阿尔弗雷德·比奈这样定义智能:“……判断,又或称为判断力强,实践感强,首创精神,适应环境的能力。良好决策、充分理解、正确推论……但记忆与判断不同且独立于判断。”《牛津英语词典》对智能的定义为“获取和应用知识与技能的能力”,这显然取决于记忆。也许人工智能领域已经影响了我们对智力的一般性认识,人们会根据对实际情况的指导作用来判断知识的重要程度。人工智能的一个重要领域就是储存知识以供计算机使用。2.1.1“人工”与“智能”棋局是程序员研究的早期问题之一。他们认为,就象棋而言,只有人类才能获胜。1997年,IBM机器深蓝击败了象棋大师加里·卡斯帕罗夫,但深蓝并没有显示出任何人类特质,仅仅只是对这一任务进行快速有效的编程而已。图2-5卡斯帕罗夫与深蓝对弈当中2.1.1“人工”与“智能”作为计算机科学的一个分支,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,是一门自然科学、社会科学和技术科学交叉的边缘学科,它涉及的学科内容包括哲学和认知科学、数学、神经生理学、心理学、计算机科学、信息论、控制论、不定性论、仿生学、社会结构学与科学发展观等。2.1.2人工智能定义人工智能研究领域的一个较早流行的定义,是由约翰·麦卡锡在1956年的达特茅斯会议上提出的,即:人工智能就是要让机器的行为看起来像是人类所表现出的智能行为一样。另一个定义指出:人工智能是人造机器所表现出来的智能性。总体来讲,对人工智能的定义大多可划分为四类,即机器“像人一样思考”“像人一样行动”“理性地思考”和“理性地行动”。这里“行动”应广义地理解为采取行动,或制定行动的决策,而不是肢体动作。2.1.2人工智能定义尼尔逊教授对人工智能下了这样一个定义:“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”而温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软/硬件来模拟人类某些智能行为的基本理论、方法和技术。2.1.2人工智能定义可以把人工智能定义为一种工具,用来帮助或者替代人类思维。它是一项计算机程序,可以独立存在于数据中心、个人计算机,也可以通过诸如机器人之类的设备体现出来。它具备智能的外在特征,有能力在特定环境中有目的地获取和应用知识与技能。人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考,甚至也可能超过人的智能。2.1.2人工智能定义20世纪七十年代以来,人工智能被称为世界三大尖端技术之一(空间技术、能源技术、人工智能),也被认为是21世纪三大尖端技术(基因工程、纳米科学、人工智能)之一,这是因为近几十年来人工智能获得了迅速的发展,在很多学科领域都获得了广泛应用,取得了丰硕成果。2.1.2人工智能定义对于人的思维模拟的研究可以从两个方向进行,一是结构模拟,仿照人脑的结构机制,制造出“类人脑”的机器;二是功能模拟,从人脑的功能过程进行模拟。现代电子计算机的产生便是对人脑思维功能的模拟,是对人脑思维的信息过程的模拟。2.1.3人工智能的实现途径实现人工智能有三种途径,即强人工智能、弱人工智能和实用型人工智能。强人工智能,又称多元智能。研究人员希望人工智能最终能成为多元智能并且超越大部分人类的能力。有些人认为要达成以上目标,可能需要拟人化的特性,如人工意识或人工大脑,这被认为是人工智能的完整性:为了解决其中一个问题,你必须解决全部的问题。即使一个简单和特定的任务,如机器翻译,要求机器按照作者的论点(推理),知道什么是被人谈论(知识),忠实地再现作者的意图(情感计算)。因此,机器翻译被认为是具有人工智能完整性。2.1.3人工智能的实现途径强人工智能的观点认为有可能制造出真正能推理和解决问题的智能机器,并且这样的机器将被认为是有知觉的,有自我意识的。强人工智能可以有两类:(1)类人的人工智能,即机器的思考和推理就像人的思维一样;(2)非类人的人工智能,即机器产生了和人完全不一样的知觉和意识,使用和人完全不一样的推理方式。强人工智能即便可以实现也很难被证实。为了创建具备强人工智能的计算机程序,我们首先必须清楚了解人类思维的工作原理,而想要实现这样的目标,还有很长的路要走。2.1.3人工智能的实现途径弱人工智能,认为不可能制造出能真正地推理和解决问题的智能机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有自主意识。弱人工智能只要求机器能够拥有智能行为,具体的实施细节并不重要。深蓝就是在这样的理念下产生的,它没有试图模仿国际象棋大师的思维,仅仅遵循既定的操作步骤。倘若人类和计算机遵照同样的步骤,那么比赛时间将会大大延长,因为计算机每秒验算的可能走位就高达2亿个,就算思维惊人的象棋大师也不太可能达到这样的速度。2.1.3人工智能的实现途径人类拥有高度发达的战略意识,这种意识将需要考虑的走位限制在几步或是几十步以内,而计算机的考虑数以百万计。就弱人工智能而言,这种差异无关紧要,能证明计算机比人类更会下象棋就足够了。如今,主流的研究活动都集中在弱人工智能上,并且一般认为这一研究领域已经取得可观的成就,而强人工智能的研究则处于停滞不前的状态。2.1.3人工智能的实现途径第三种途径称为实用型人工智能。研究者们将目标放低,不再试图创造出像人类一般智慧的机器。眼下我们已经知道如何创造出能模拟昆虫行为的机器人。机械家蝇看起来似乎并没有什么用,但即使是这样的机器人,在完成某些特定任务时也是大有裨益的。比如,一群如狗大小,具备蚂蚁智商的机器人在清理碎石和在灾区找寻幸存者时就能够发挥很大的作用。
图2-6华盛顿大学研制的靠激光束驱动的RoboFly昆虫机器人2.1.3人工智能的实现途径随着模型变得越来越精细,机器能够模仿的生物越来越高等,最终,我们可能必须接受这样的事实:机器似乎变得像人类一样智慧了。也许实用型人工智能与强人工智能殊途同归,但考虑到一切的复杂性,我们不会相信机器人会有自我意识。2.1.3人工智能的实现途径虽然计算机为人工智能提供了必要的技术基础,但人们直到上个世纪50年代早期才注意到人类智能与机器之间的联系。人工智能60余年的发展历史颇具周折,大致可划分为以下6个阶段。图2-7人工智能发展历史2.1.4人工智能发展的6个阶段一是起步发展期:1956年—20世纪60年代初。人工智能概念在首次被提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序、LISP表处理语言等,掀起了人工智能发展的第一个高潮。二是反思发展期:20世纪60—70年代初。人工智能发展初期的突破性进展大大提升了人们对人工智能的期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标的落空(例如无法用机器证明两个连续函数之和还是连续函数、机器翻译闹出笑话等),使人工智能的发展走入了低谷。2.1.4人工智能发展的6个阶段三是应用发展期:20世纪70年代初—80年代中。20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入了应用发展的新高潮。四是低迷发展期:20世纪80年代中—90年代中。随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。2.1.4人工智能发展的6个阶段五是稳步发展期:20世纪90年代中期到2010年。由于网络技术特别是因特网技术的发展,信息与数据的汇聚不断加速,加快了人工智能的创新研究,促使人工智能技术进一步走向实用化。1997年IBM深蓝超级计算机战胜了国际象棋世界冠军卡斯帕罗夫,2008年IBM提出“智慧地球”的概念,这些都是这一时期的标志性事件。2.1.4人工智能发展的6个阶段六是蓬勃发展期:2011年至今。随着因特网、云计算、物联网、大数据等信息技术的发展,泛在感知数据和图形处理器(GPU)等计算平台推动以神经网络深度学习为代表的人工智能技术飞速发展,大幅跨越科学与应用之间的“技术鸿沟”,图像分类、语音识别、知识问答、人机对弈、无人驾驶等具有广阔应用前景的人工智能技术突破了从“不能用、不好用”到“可以用”的技术瓶颈,人工智能发展进入爆发式增长的新高潮。2.1.4人工智能发展的6个阶段“AlphaGo之父”哈萨比斯表示:“我提醒诸位,必须正确地使用人工智能。正确的两个原则是:人工智能必须用来造福全人类,而不能用于非法用途;人工智能技术不能仅为少数公司和少数人所使用,必须共享。”2.1.4人工智能发展的6个阶段PART02人工智能发展历史人类对人工智能的幻想甚至可以追溯到古埃及。电子计算机的诞生使信息存储和处理的各个方面都发生了革命,计算机理论的发展产生了计算机科学并最终促使了人工智能的出现。计算机这个用电子方式处理数据的发明,为人工智能的可能实现提供了一种媒介。2.2人工智能发展历史图灵奖是由美国计算机协会(ACM)于1966年设立的计算机奖项,名称取自艾伦·麦席森·图灵,旨在奖励对计算机事业作出重要贡献的个人。图灵奖是计算机领域的国际最高奖项,被誉为“计算机界的诺贝尔奖”。图灵奖对获奖条件要求极高,评奖程序极严,一般每年仅授予一名计算机科学家。2.2.1人工智能研究获得的图灵奖总结人工智能历史里程碑的快速方法之一是列举与此领域相关的图灵奖得主。获得图灵奖的人工智能大神是:马文·明斯基(1969年图灵奖得主)和约翰·麦卡锡(1971年图灵奖得主),定义了基于表示和推理的领域基础;艾伦·纽厄尔和赫伯特·西蒙(1975年图灵奖得主),提出了关于问题求解和人类认知的符号模型;爱德华·费根鲍姆和劳伊·雷迪(1994年图灵奖得主),开发了通过对人类知识编码来解决真实世界问题的专家系统;2.2.1人工智能研究获得的图灵奖莱斯利·瓦伦特(2010年图灵奖得主),对众多计算理论(包括PAC学习、枚举复杂性、代数计算和并行与分布式计算)做出了变革性的贡献;朱迪亚·珀尔(2011年图灵奖得主)提出了通过原则性的方式处理不确定性的概率因果推理技术;约书亚·本吉奥、杰弗里·辛顿和杨立昆(2018年图灵奖得主),他们将“深度学习”(多层神经网络)作为现代计算的关键部分。2.2.1人工智能研究获得的图灵奖回顾图灵奖50余年的历史可以发现,人工智能一直是图灵奖不断鼓励、不断发现的重要话题。图灵的思考是计算机的起点,直到80年后炙手可热的人工智能仍能从他的思考里找到启迪。2.2.1人工智能研究获得的图灵奖人们普遍认为由沃伦·麦卡洛克和沃尔特·皮茨完成的一项工作是人工智能的第一项研究工作。1943年,他们受到尼古拉斯·拉舍夫斯基对数学建模工作的启发,选择了3方面的资源来构建模型:基础生理学知识和大脑神经元的功能,罗素和怀特海对命题逻辑的形式化分析,以及图灵的计算理论。他们提出一种人工神经元模型,证明本是纯理论的图灵机可以由人工神经元构成。2.2.2从人工神经元开始(1943-1956)制造每个人工神经元需要大量真空管,然而,只需要少数真空管就可以建成逻辑门,即一种由一个或多个输入端与一个输出端构成的电子电路,按输入与输出间的特定逻辑关系运行。其中,每个神经元的特征是“开”或“关”,并且会因足够数量的相邻神经元受到刺激而切换为“开”。神经元的状态被认为是“事实上等同于提出其充分激活的命题”。例如,他们证明任何可计算的函数都可以通过一些神经元互相连接的网络来计算,以及所有的逻辑联结词(AND、OR、NOT等)都可以通过简单的网络结构来实现。2.2.2从人工神经元开始(1943-1956)麦卡洛克和皮茨还表明适当定义的网络可以学习。唐纳德·赫布示范了用于修改神经元之间连接强度的简单更新规则,这些规则被称为赫布型学习,至今仍是一种有影响力的模式。哈佛大学的两名本科生马文·明斯基和迪安·埃德蒙兹在1950年建造了第一台神经网络计算机SNARC,它使用了3000个真空管和B-24轰炸机上一个多余的自动驾驶装置来模拟由40个神经元组成的网络。后来,明斯基在普林斯顿大学研究神经网络中的通用计算。他的博士学位委员会对这类工作是否应该被视为数学持怀疑态度,但据说冯·诺伊曼对此评价说:“如果现在还不能被视为数学,总有一天会的。”2.2.2从人工神经元开始(1943-1956)还有许多早期工作可以被描述为人工智能,包括1952年由曼彻斯特大学的克里斯托弗·斯特雷奇和IBM公司的亚瑟·塞缪尔分别独立开发的西洋跳棋程序。然而,还是图灵的观点最有影响力。早在1947年,他就在伦敦数学协会就这一主题发表了演讲,并在其1950年的文章《计算机器和智能》中指出了定义智能的困难所在。他提出:能像人类一般进行交谈和思考的计算机是有希望制造出来的,至少在非正式会话中难以区分。能否与人类无差别交谈这一评价标准就是著名的图灵测试。2.2.2从人工神经元开始(1943-1956)图灵还认为,通过开发学习算法然后教会机器,而不是手工编写智能程序,将更容易创造出人类水平的人工智能。不过,他在随后的演讲中警告说,实现这一目标对人类来说可能不是最好的事情。取得这些成果不久之后,计算机就开始被应用于第一批人工智能实验,当时所用的计算机体积小且速度慢。曼彻斯特马克一号以小规模实验机为原型,存储器仅有640字节,时钟速度555赫兹(相比之下,现代台式计算机的存储器可达40亿字节,时钟速度30亿赫兹),这就意味着必须谨慎挑选将利用它们来解决的研究问题。在第一个十年里,人工智能项目涉及的都是基本应用,这也成为后续探索研究的奠基石。2.2.2从人工神经元开始(1943-1956)逻辑理论机发布于1956年,以五个公理为出发点推导定理,以此来证明数学定理。这类问题就如同迷宫,你假定自己朝着出口的方向走就是最好的路线,但实际上往往并不能成功,这也正是逻辑理论机难以解决复杂问题的原因所在。它选择看起来最接近目标的方程式,丢弃了那些看起来偏题了的方程式。然而,被丢弃的可能正是最需要的。2.2.2从人工神经元开始(1943-1956)同样在1956年,夏天,达特茅斯学院的约翰·麦卡锡说服哈佛大学的马文·明斯基、贝尔电话实验室的克劳德·香农和IBM公司的纳撒尼尔·罗切斯特帮助他召集对自动机理论、神经网络和智能研究感兴趣的10位有远见卓识的年轻科学家在达特茅斯进行了为期两个月的研讨会,共同研究和探讨用机器模拟智能的一系列有关问题,创建了达特茅斯夏季人工智能研究计划。这场研讨会聚集了人工智能领域的顶尖专家学者,对后世产生了深远影响,首次提出了“人工智能(AI)”这一术语,标志着“人工智能”这门新兴学科的正式诞生。2.2.2从人工神经元开始(1943-1956)20世纪50年代的知识界根据“由能力缺陷得出的论据”提出“机器永远做不到X”这一主张。关于X,图灵列举了以下例子:善良、机智、美丽、友好、上进、幽默、明辨是非、犯错、坠入爱河、享受奶油草莓、让人爱上它、从经验中学习、恰当地使用语言、成为自己思想的主体、有和人类一样的行为多样性、从事新生事物。2.2.3早期期望无限(1952-1969)回顾图灵列举的X,我们发现其中一些事相当简单,如我们都很熟悉“犯错”的计算机。具有元推理能力的计算机能检查自身计算,从而成为自身推理的主体。一项有着百年历史的技术已证明它有“让人爱上它”的能力——它就是泰迪熊。计算机象棋专家戴维·利维预计,到2050年,人们对爱上类人机器人一事将习以为常。至于机器人坠入爱河,这是虚构类文学作品中的常见主题,但这方面的学术推测有限。2.2.3早期期望无限(1952-1969)计算机已经完成了许多非常新颖的工作,在天文学、数学、化学、矿物学、生物学和计算机科学等领域都取得了重大发现,并通过风格转换创造了新的艺术形式。总的来说,程序在某些任务上的表现超过了人类,而在其他任务上则落后于人类。有一件事是很明显的,那就是它们不能真正成为人类。人工智能的研究人员自然而然地一个接一个地演示X以回应。他们特别关注那些被认为能够显示人类智能的任务,包括游戏、谜题、数学和智商测试。2.2.3早期期望无限(1952-1969)纽厄尔和西蒙继“逻辑理论家”成功之后又推出了“通用问题求解器”。与“逻辑理论家”不同,“通用问题求解器”从一开始就被设计为模仿人类求解问题的协议。结果表明,在它可以处理的有限类型的难题中,该程序考虑的子目标和可能采取的行为的顺序与人类处理相同问题的顺序类似。因此,“通用问题求解器”可能是第一个体现“人类思维”方式的程序。2.2.3早期期望无限(1952-1969)作为认知模型,“通用问题求解器”和后续程序的成功使得纽厄尔和西蒙提出了著名的物理符号系统假说,该假说认为“物理符号系统具有进行一般智能动作的必要和充分方法”。意思是,任何显示出智能的系统(人类或机器)必须通过操作由符号组成的数据结构来运行。之后我们会看到这个假说已经受到了多方面的挑战。在IBM,纳撒尼尔,罗切斯特和他的同事开发了首批人工智能程序。赫伯特·盖伦特构造了几何定理证明程序,它能够证明许多数学学生认为相当棘手的定理,这项工作是现代数学定理证明程序的先驱。2.2.3早期期望无限(1952-1969)从长远看,这一时期所有探索性工作中最有影响力的可能是亚瑟·萨缪尔对西洋跳棋的研究,他的程序可以以业余高手的水平参与对抗。因此,他驳斥了计算机只能执行被告知的事情的观点:他的程序很快学会了玩游戏,甚至比其创造者玩得更好,该程序于1956年在电视上演示,给人留下了深刻的印象。和图灵一样,萨缪尔也很难找到使用计算机的机会,他只能晚上工作,使用仍在IBM制造工厂测试场地上还未出厂的计算机。萨缪尔的程序是许多后继系统的前身,如TD-Gammon和AlphaGo(阿尔法狗)。TD-Gammon是世界上最好的西洋双陆棋棋手之一,而AlphaGo因击败人类世界围棋冠军而震惊世界。2.2.3早期期望无限(1952-1969)1958年,约翰·麦卡锡为人工智能做出了两项重要贡献。他在麻省理工学院人工智能实验室定义了高级语言Lisp,成为在此后30年中最重要的人工智能编程语言。在一篇题为“具有常识的程序”的论文中,麦卡锡为基于知识和推理的人工智能系统提出了概念性议案。这篇论文描述了“建议接受者”,这是一个假想程序,其中包含世界的一般知识,并可以利用它得出行动规划。这个概念可以用简单的逻辑公理来说明,这些逻辑公理足以生成一个开车去机场的规划。该程序还被设计为能在正常运行过程中接受新的公理,从而实现无须重新编程就能够在新领域中运行。2.2.3早期期望无限(1952-1969)因此,“建议接受者”体现了知识表示和推理的核心原则:对世界及其运作进行形式化、明确的表示,并且通过演绎来操作这种表示是很有用的。这篇论文影响了人工智能的发展历程。2.2.3早期期望无限(1952-1969)1958年马文·明斯基转到麻省理工学院,然而他与麦卡锡的最初合作并没有持续。麦卡锡强调形式逻辑中的表示和推理,而明斯基则对程序工作并最终形成反逻辑的观点更感兴趣。1963年,麦卡锡在斯坦福大学建立了人工智能实验室。1965年亚伯拉罕·鲁滨逊归结原理(一阶逻辑的完备定理证明算法)的发现推进了麦卡锡使用逻辑来构建最终“建议接受者”的计划。麦卡锡在斯坦福大学的工作中强调了逻辑推理的通用方法。逻辑的应用包括柯德尔·格林的问答和规划系统以及斯坦福研究所(SRI)的Shakey机器人项目,后者是第一个展示逻辑推理和物理活动完全集成的项目。2.2.3早期期望无限(1952-1969)在麻省理工学院,明斯基指导一批学生选择了一些似乎需要智能才能求解的有限问题。其中,詹姆斯·斯莱格尔的SAINT程序能够求解大学一年级课程中典型封闭形式的微积分问题。托马斯·埃文斯的ANALOGY程序能够解决智商测试中常见的几何类比问题。丹尼尔·博布罗的STUDENT项目能够求解代数故事问题。2.2.3早期期望无限(1952-1969)建立在麦卡洛克和皮茨提出的神经网络上的早期工作也蓬勃发展。什穆埃尔·温诺格拉德和杰克·考恩的研究展示了大量元素如何共同代表一个独立的概念,同时提升稳健性和并行性。赫布的学习方法分别得到了伯尼·维德罗和弗兰克·罗森布拉特的改进,他们的网络分别被称为线性自适应神经网络和感知机。感知机收敛定理指出,学习算法可以调整感知机的连接强度来拟合任何输入数据(前提是存在这样的拟合)。2.2.3早期期望无限(1952-1969)从一开始,人工智能研究人员对未来成功的预测毫不避讳。下面这句1957年赫伯特·西蒙的名言经常被引用:我的目的不是使大家感到惊讶或震惊,我可以总结出的最简单的说法是,现在世界上存在着能够思考、学习和创造的机器。此外,它们的这些能力将迅速提高,在可见的未来内,它们能够处理的问题范围将与人类思维的应用范围一样广泛。2.2.4一些现实(1966-1973)虽然“可见的未来”这个词是模糊的,但西蒙也做出了更具体的预测:10年内,计算机将成为国际象棋冠军以及机器将能证明重要的数学定理。这些预测的实现(或近似实现)实际上用了40年时间,远远超过10年。当初西蒙的过度自信源于早期人工智能系统在简单示例任务上的出色表现。但是,在几乎所有情况下,这些早期系统在更困难的问题上都失败了。2.2.4一些现实(1966-1973)失败有两个主要原因:第一个主要原因是许多早期人工智能系统主要基于人类如何执行任务的“知情内省型”,而不是基于对任务、解的含义以及算法需要做什么才能可靠地产生解的仔细分析。2.2.4一些现实(1966-1973)第二个主要原因是对人工智能要求解问题的复杂性缺乏认识。大多数早期的问题求解系统都会尝试组合不同的步骤,直到找到解为止。在计算复杂性理论发展完备之前,人们普遍认为“扩展”到更大的问题仅仅是需要更快的硬件和更大的内存。但是当研究人员无法证明涉及几十个事实的定理时,伴随着归结定理证明发展而来的乐观情绪很快就受到了打击。一般而言,程序可以找到解的事实并不意味着该程序具备任何在实践中找到解所需的机制。2.2.4一些现实(1966-1973)未能处理“组合爆炸”是莱特希尔报告中对人工智能的主要批评之一,基于这份报告,英国政府决定除两所大学外的所有大学中停止支持人工智能研究。此外,产生智能行为的基础结构存在一些根本限制也是导致失败的原因。例如,明斯基和派珀特的著作“感知器证明”,尽管感知机(一种简单的神经网络形式)被证明可以学习它们能够表示的任何事物,但它们能表示的事物很少。例如无法训练双输入感知机来判断它的两个输入是否相同。尽管他们的研究结果并不适用于更复杂的多层网络,但用于神经网络研究的经费很快就减少到几乎为零。2.2.4一些现实(1966-1973)有讽刺意味的是,在20世纪80年代和21世纪10年代再次引起神经网络研究巨大复兴的新反向传播学习算法,早在20世纪60年代初已经在其他情景下得到了发展。2.2.4一些现实(1966-1973)专家系统因其在计算机科学和现实世界中的贡献而曾经被视为是人工智能中最古老、最成功、最知名和最受欢迎的领域。专家系统可以被看作是一类具有专门知识和经验的计算机智能程序系统,它是早期人工智能的一个重要分支,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统一般采用人工智能中的知识表示和知识推理技术,根据系统中的知识与经验,进行推理和判断,来模拟通常由人类领域专家才能解决的复杂问题决策过程。2.2.5专家系统(1969-1986)在人工智能研究的早期提出的问题求解是一种通用搜索机制,试图将基本的推理步骤串在一起找到完整的解。这种方法被称为弱方法,虽然很普适但不能扩展到大型或困难的问题实例上。弱方法的替代方案是使用更强大的领域知识,这些知识允许更大规模的推理步骤,并且可以更轻松地处理特定领域中发生的典型案例。2.2.5专家系统(1969-1986)斯坦福大学开发的DENDRAL程序是这种方法的早期例子。爱德华·费根鲍姆、布鲁斯·布坎南(从哲学家改行的计算机科学家)和乔舒亚·莱德伯格(诺贝尔生理学或医学奖得主,遗传学家)联手解决了从质谱仪提供的信息推断分子结构的问题。该程序的输入包括分子的基本分子式(如C6H13NO2)和质谱,其中质谱给出了分子被电子束轰击时产生的各种碎片的质量。DENDRAL的意义在于它是第一个成功的知识密集型系统:它的专业知识来源得到分析化学家的帮助,应用了大量的专用规则,1971年,费根鲍姆和斯坦福大学的其他研究人员开启了启发式编程项目,以此来研究专家系统的新方法可以在多大程度上应用到其他领域。2.2.5专家系统(1969-1986)接下来的一个主要工作是用于诊断血液感染的Mycin系统。Mycin有大约450条规则,它能够表现得和一些专家一样好,甚至比初级医生要好得多。Mycin与DENDRAL有两个主要区别。首先,不像DENDRAL规则,不存在可以推导出Mycin规则的一般理论模型,Mycin规则不得不从大量的专家访谈中获得。其次,规则必须反映与医学知识相关的不确定性。Mycin引入了一种称为确定性因子的不确定性计算,在当时与医生评估证据对诊断影响的方式非常吻合。2.2.5专家系统(1969-1986)第一个成功的商用专家系统R1在数字设备公司(DEC)投入使用,该程序帮助公司配置新计算机系统的订单。在当时它每年为公司节省约4000万美元。同时期,DEC公司部署了40个人工智能专家系统,而且还有更多的专家系统在开发中;杜邦公司有100个专家系统在使用,500个在开发。当时几乎每家美国大公司都有自己的人工智能团队,不是在使用专家系统,就是在研究专家系统。2.2.5专家系统(1969-1986)领域知识的重要性在自然语言理解领域也很突出。尽管特里·温诺格拉德的Shudlu系统取得了成功,但它的方法并没有扩展到更一般的任务。麻省理工学院的尤金·查尔尼克和耶鲁大学的罗杰·尚克等几位研究人员一致认为,强大的语言理解需要关于世界的一般知识以及使用这些知识的一般方法。尚克和他的学生们建立了一系列的程序,用于理解自然语言,重点在于用语言理解所需的知识来表示和推理问题。2.2.5专家系统(1969-1986)在真实世界中的广泛应用引发了表示和推理工具的广泛发展。有些是基于逻辑的,例如,Prolog语言在欧洲和日本流行,而Planner家族在美国流行。其他人则遵循明斯基的框架思想,采用了一种更结构化的方法,将有关特定对象和事件类型的事实组合起来,并将这些类型组织成类似于生物分类法的大型分类层次结构。2.2.5专家系统(1969-1986)1981年,日本政府宣布了“第五代计算机”计划,这是一个旨在建造运行Prolog的大规模并行智能计算机的十年计划,预算超过13亿美元。作为回应,美国成立了微电子与计算机技术公司(MCC),这是一个旨在确保国家竞争力的联盟。在这两个项目中,人工智能都是广泛努力的一部分,包括芯片设计和人机界面研究。在英国,阿尔维报告恢复了被莱特希尔报告取消的资助资金。然而,这些项目都没有在人工智能能力或经济影响方面下实现其宏伟目标。2.2.5专家系统(1969-1986)此后不久,经历了一段“人工智能冬天”的时期,许多公司因未能兑现夸张的承诺而停滞。事实证明,为复杂领域构建和维护专家系统是困难的,一部分原因是系统使用的推理方法在面临不确定性时会崩溃,另一部分原因是系统无法从经验中学习。2.2.5专家系统(1969-1986)在20世纪80年代中期,至少有4个不同的团队重新发明了最早在20世纪60年代初期发展起来的反向传播学习算法。该算法被应用于计算机科学和心理学中的许多学习问题,并行分布式处理合集中的结果的广泛传播引起了极大的轰动。2.2.6神经网络的回归(1986-现在)这些所谓的联结主义模型被一些人视为纽厄尔和西蒙的符号模型以及麦卡锡和其他人的逻辑主义方法的直接竞争对手,人类在某种程度上操纵符号。事实上,早期人们在语言中命名的许多概念,经过仔细检查后,都未能获得人工智能研究人员希望以公理形式描述逻辑定义的充要条件。联结主义模型以一种流畅和不精确的方式形成内部概念,更适配真实世界的混乱。它们还具备从样本中学习的能力,它们可以将它们的预测输出值与问题的真实值进行比较,并修改参数以减少差异,使它们在未来的样本中更有可能表现良好。2.2.6神经网络的回归(1986-现在)专家系统的脆弱性导致了一种新的、更科学的方法,结合了概率而不是布尔逻辑,基于机器学习而不是手工编码,重视实验结果而不是哲学主张。一些人将这种变化描述为整洁派(认为人工智能理论应该以数学的严谨性为基础的人)战胜了邋遢派(那些宁愿尝试大量的想法,编写一些程序,然后评估哪些似乎可行的人)。这两种方法都很重要。向整洁派的转变意味着该领域已经达到了稳定和成熟的水平。对深度学习的重视可能代表着邋遢派的复兴。更普遍的是,基于现有理论而不是提出全新的理论,基于严格的定理或可靠的实验方法而不是基于直觉的主张,以及展示与真实世界应用的相关性而不是虚拟的示例。2.2.7概率推理和机器学习(1987-现在)共享的基准问题集成为展示进度的标准,其中包括了加利福尼亚大学欧文分校的机器学习数据集库、用于规划算法的国际规划竞赛、用于语音识别的LibriSpeech语料库、用于手写数字识别的MNIST数据集、用于图像物体识别的ImageNet和COCO、用于自然语言问答的SQuAD、机器翻译的WMT竞赛以及布尔可满足性求解器国际SAT竞赛。2.2.7概率推理和机器学习(1987-现在)人工智能的创立在一定程度上是对控制理论和统计等现有领域局限性的反抗,但在这一时期,它吸纳了这些领域的积极成果。正如戴维·麦卡莱斯特所说:在人工智能早期,符号计算的新形式(例如框架和语义网络)使大部分经典理论过时,导致人工智能在很大程度上与计算机科学的其他领域分离。人们认识到,机器学习不应该独立于信息论,不确定推理不应该独立于随机建模,搜索不应该独立于经典优化和控制,自动推理不应该独立于形式化方法和静态分析。2.2.7概率推理和机器学习(1987-现在)语音识别领域的实践说明了这种模式。20世纪70年代,研究人员尝试了各种不同的架构和方法,许多是相当暂时和脆弱的,并且只能处理几个精心挑选的例子。在20世纪80年代,使用隐马尔可夫模型的方法开始主导这一领域。隐马尔可夫模型有两个相关的方面。首先,它们基于严格的数学理论。这使得语音研究人员能够在其他领域数十年数学成果的基础上进行开发。其次,它们是在大量真实语音数据的语料库上训练而产生的,确保了健壮性。因此,语音技术和手写体字符识别的相关领域向广泛的工业和消费级应用过渡。人们并没有使用隐马尔可夫模型识别语音,只是为理解和求解问题提供了一个数学框架。2.2.7概率推理和机器学习(1987-现在)1988年是人工智能与统计学、运筹学、决策论和控制理论等其他领域相联系的重要一年。朱迪亚·珀尔的“智能系统中的概率推理”使概率和决策论在人工智能中得到了新的认可。珀尔对贝叶斯网络的发展产生了一种用于表示不确定的知识的严格而有效的形式体系,以及用于概率推理的实用算法。当年的第二个主要贡献是理查德·萨顿的工作,他将强化学习与运筹学领域开发的马尔可夫决策过程联系起来。随后,大量工作将人工智能规划研究与马尔可夫决策过程联系起来,强化学习领域在机器人和过程控制方面找到了应用,并获得了深厚的理论基础。2.2.7概率推理和机器学习(1987-现在)人工智能对数据、统计建模、优化和机器学习的新认识带来的结果是,计算机视觉、机器人技术、语音识别、多智能体系统和自然语言处理等子领域逐渐统一,在应用方面和关于人工智能核心问题更好的理论理解方面都产生了显著的效用。2.2.7概率推理和机器学习(1987-现在)计算能力的显著进步和互联网的建立促进了巨大数据集的创建,这些大数据集包括数万亿字的文本、数十亿的图像、数十亿小时的语音和视频,以及海量的基因组数据、车辆跟踪数据、点击流数据、社交网络数据等,这导致了专为利用非常大的数据集而设计的学习算法的开发。通常,这类数据集中的绝大多数例子都没有标签。然而,如果有足够大的数据集,合适的学习算法在识别句意的任务上可以达到超过96%的准确率。此外,研究认为,将数据集的规模增加两到三个数量级所获得的性能提升会超过调整算法带来的性能提升。2.2.8大数据(2001-现在)类似的现象也发生在计算机视觉任务中,例如修补照片中的破洞。海斯和埃弗罗斯开发了一种巧妙的方法,从类似的图像中混合像素。他们发现,该技术在仅包含数千幅图像的数据库中效果不佳,但在拥有数百万幅图像的数据库中,该技术超过了质量阈值。不久之后,ImageNet数据库中可用的数干万幅图像引发了计算机视觉领域的一场革命。大数据的可用性和向机器学习的转变帮助人工智能恢复了商业吸引力。大数据是2011年IBM的Watson系统在《危险边缘》问答游戏中战胜人类冠军的关键因素,这一事件深深影响了公众对人工智能的看法。2.2.8大数据(2001-现在)深度学习是指使用多层简单的、可调整的计算单元的机器学习。早在20世纪70年代,研究人员就对这类网络进行了实验,并在20世纪90年代以卷积神经网络的形式在手写数字识别方面取得了一定的成功。
图2-9卷积神经网络示意2.2.9深度学习(2011-现在)然而,直到2011年,深度学习方法才真正开始流行起来,首先是在语音识别领域,然后是在视觉物体识别领域。在2012年的ImageNet竞赛中,需要将图像分类为1000个类别之一(犰狳、书架、开瓶器等)。多伦多大学杰弗里·辛顿团队开发的深度学习系统比以前基于手工特征的系统有了显著改进。从那时起,深度学习系统在某些视觉任务上的表现超过了人类,但在其他一些任务上还显落后。在语音识别、机器翻译、医疗诊断和博弈方面也有类似的进展。2.2.9深度学习(2011-现在)AlphaGo之所以能够战胜人类顶尖的围棋棋手,是因为它使用了深度网络来表示评价函数。这些非凡的成功使公众对人工智能的兴趣重新高涨。似乎每周都有新的人工智能应用接近或超过人类表现的消息,通常伴随着加速成功或人工智能新寒冬的猜测。2.2.9深度学习(2011-现在)深度学习在很大程度上依赖于强大的硬件,一个标准的计算机CPU每秒可以进行109或1010次运算。运行在特定硬件(例如GPU、TPU或FPGA)上的深度学习算法,每秒可能进行1014—1017次运算,主要是高度并行化的矩阵和向量运算。当然,深度学习还依赖于大量训练数据的可用性,以及一些算法技巧。2.2.9深度学习(2011-现在)PART03人工智能的研究繁重的科学和工程计算本来是要人脑来承担的,如今计算机不但能完成这种计算,而且能够比人脑做得更快、更准确,因此,人们已不再把这种计算看作是“需要人类智能才能完成的复杂任务”。可见,复杂工作的定义是随着时代的发展和技术的进步而变化的,人工智能的具体目标也随着时代的变化而发展。它一方面不断获得新进展,另一方面又转向更有意义、更加困难的新目标。2.3人工智能的研究用来研究人工智能的主要物质基础以及能够实现人工智能技术平台的机器就是计算机,人工智能的发展是和计算机科学技术以及其他很多科学的发展联系在一起的。人工智能学科研究的主要内容包括:知识表示、知识获取、自动推理和搜索方法、机器学习、神经网络和深度学习、知识处理系统、自然语言学习与处理、遗传算法、计算机视觉、智能机器人、自动程序设计、数据挖掘、复杂系统、规划、组合调度、感知、模式识别、逻辑程序设计、软计算、不精确和不确定的管理、人类思维方式、人工生命等方面。一般认为,人工智能最关键的难题还是机器自主创造性思维能力的塑造与提升。2.3人工智能的研究(1)深度学习。这是无监督学习的一种,是机器学习研究中的一个领域,是基于现有的数据进行学习操作,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。现实生活中常常会有这样的问题:缺乏足够的先验知识,因此难以人工标注类别或进行人工类别标注的成本太高。很自然地,我们希望计算机可以完成这些工作,或至少提供一些帮助。根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,这就是无监督学习。2.3人工智能的研究(2)自然语言处理。这是用自然语言同计算机进行通讯的一种技术。作为人工智能的分支学科,研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。2.3人工智能的研究(3)大语言模型(LargeLanguageModel,LLM)。这是一种人工智能模型,旨在理解和生成人类语言。它们在大量的文本数据(即语料库,它集中了人类所有相关语言文明的精华,是一个非常非常庞大的一个数据库)上进行训练。它可以执行广泛的任务,包括文本总结、翻译、情感分析等等。LLM的特点是规模庞大,包含数十亿的参数,帮助它们学习语言数据中的复杂模式。这些模型通常基于深度学习架构,如转化器,这有助于它们在各种自然语言处理任务上取得令人印象深刻的表现。2.3人工智能的研究(4)语音识别:2017年,微软表示其会话语音识别系统的单词错误率已降至5.1%,与人类在转录电话对话中的表现相当。现在全世界大约三分之一的计算机交互是通过语音而不是键盘完成的,另外Skype提供了10种语言的实时语音翻译。Alexa、Siri、Cortana和谷歌都提供了可以回答用户问题和执行任务的助手。例如,谷歌Duplex服务使用语音识别和语音合成为用户预订餐厅,它能够代表用户进行流畅的对话。2.3人工智能的研究(5)机器翻译:在线机器翻译系统现在可以阅读超过100种语言的文档,涵盖99%的人类使用的母语,每天为数亿用户翻译数千亿词语。虽然翻译结果还不完美,但通常足以理解。对于具有大量训练数据的密切相关的语言(如法语和英语),在特定领域内的翻译效果已经接近于人类的水平。2.3人工智能的研究(6)计算机视觉。是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。计算机视觉研究人员不再满足于在具有挑战性的ImageNet物体识别任务上超越人类的准确性,他们开始研究更困难的图像描述问题。图2-10计算机视觉应用2.3人工智能的研究计算机视觉用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。计算机视觉的应用包括控制过程、导航、自动检测等方面。2.3人工智能的研究(7)智能机器人。如今我们的身边逐渐出现很多智能机器人,他们具备形形色色的内、外部信息传感器,如视觉、听觉、触觉、嗅觉。除具有感受器外,它还有效应器,作为作用于周围环境的手段。这些机器人都离不开人工智能的技术支持。科学家们认为,智能机器人的研发方向是,给机器人装上“大脑芯片”,从而使其智能性更强,在认知学习、自动组织、对模糊信息的综合处理等方面将会前进一大步。2.3人工智能的研究雷伯特等人制作的四足机器人“大狗”,颠覆了我们对机器人如何行动的概念——不再是好莱坞电影中机器人缓慢、僵硬、左右摇摆的步态,而是类似于动物,并且能够在被推倒或在结冰的水坑上滑倒时恢复站立。类人机器人Atlas不仅能在崎岖不平的路况中行走,还可以跳到箱子上,做后空翻后可以稳定落地。
图2-11大狗机器人2.3人工智能的研究(8)数据挖掘。它一般是指通过算法搜索隐藏于从大量数据中的信息的过程。它通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。它的分析方法包括:分类、估计、预测、相关性分组或关联规则、聚类和复杂数据类型挖掘。2.3人工智能的研究(9)自动驾驶:自动驾驶的历史可以追溯到20世纪20年代的无线电
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《计算机离港系统》课件
- 《数字社区整体方案》课件
- 《撰写专利》课件
- 《讲课体内受精和早期胚胎发育》课件
- 孕期胰腺炎的健康宣教
- 产后睡眠浅的健康宣教
- 孕期关节响的健康宣教
- 悬雍垂过长症的健康宣教
- 《机械设计基础》课件-第7章
- 八年级英语Blindmanandeyesinfiredrama课件
- 激光原理与技术-厦门大学中国大学mooc课后章节答案期末考试题库2023年
- 企业年金基金审计合同范本
- 全能值班员集控面试题
- 第三方支付合作协议
- Unit+6+Lesson+1+A+Medical+Pioneer+课件【 核心知识备课精研精讲】 高中英语北师大版(2019)必修第二册
- 幼儿园大班春季周计划表(整学期)
- 《走遍法国》Reflets课文
- 土地增值税清算管理规程
- 大学生心理健康教育-大学生心理健康导论
- 糖尿病病人的麻醉
- GB/T 29309-2012电工电子产品加速应力试验规程高加速寿命试验导则
评论
0/150
提交评论