人工智能(基础版)高职人工智能基础课程PPT完整全套教学课件_第1页
人工智能(基础版)高职人工智能基础课程PPT完整全套教学课件_第2页
人工智能(基础版)高职人工智能基础课程PPT完整全套教学课件_第3页
人工智能(基础版)高职人工智能基础课程PPT完整全套教学课件_第4页
人工智能(基础版)高职人工智能基础课程PPT完整全套教学课件_第5页
已阅读5页,还剩370页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能全套PPT课件目录contents模块1认识人工智能模块2知识学习模块3机器学习模块4搜索策略模块5自然语言的理解模块6计算机视觉模块7专家系统模块8智能机器人模块1认识人工智能1.1人工智能概述1.1.1人脑与计算机大战2016年1月27日,国际顶尖期刊《自然》封面文章报道,谷歌(Google)公司开发的名为阿尔法(AlphaGo)围棋的人工智能机器人,在没有任何让子的情况下,以5∶0完胜欧洲围棋冠军、职业二段选手樊麾。在围棋人工智能领域,实现了一次史无前例的突破。AlphaGo是第一个击败人类职业围棋选手、第一个战胜世界围棋冠军的人工智能机器人。AlphaGo用到了很多新技术,如神经网络、深度学习、蒙特卡洛树搜索(MonteCarlotreesearch,MCTS)等,使其实力有了实质性的飞跃。在柯洁与AlphaGo的围棋人机大战三番棋结束后,AlphaGo团队宣布AlphaGo将不再参加围棋比赛。AlphaGo将进一步探索医疗领域,利用人工智能技术攻克现代医学中的种种难题。1.1人工智能概述1.1.2人工智能学派1.符号主义符号主义(逻辑主义、心理学派、计算机学派)认为人工智能源于数理逻辑。数理逻辑从19世纪末得以迅速发展,到20世纪30年代开始用于描述智能行为。计算机出现后,又在计算机上实现了逻辑演绎系统。其有代表性的成果为启发式程序LT逻辑理论家,它证明了38条数学定理,表明了可以应用计算机研究人的思维过程,模拟人类智能活动。符号主义如图1-1所示。图1-1符号主义1.1人工智能概述1.1.2人工智能学派2.连接主义连接主义认为人工智能源于仿生学,特别是对人脑模型的研究。它的代表性成果是1943年由生理学家麦卡洛克(McCulloch)和数理逻辑学家皮茨(Pitts)创立的脑模型,即MP模型,开创了用电子装置模仿人脑结构和功能的新途径。它从神经元开始,进而研究神经网络模型和脑模型,开辟了人工智能的又一发展道路。图1-2连接主义1986年,鲁梅尔哈特(Rumelhart)等人提出多层网络中的反向传播(BP)算法。此后,连接主义势头大振,从模型到算法,从理论分析到工程实现,为神经网络计算机走向市场打下基础。现在,对人工神经网络(ANN)的研究热情仍然较高,但研究成果没有像预想的那样好。连接主义如图1-2所示。1.1人工智能概述1.1.2人工智能学派3.行为主义行为主义的原理是控制论及感知-动作型控制系统。行为主义认为智能取决于感知和行动,提出智能行为的感知-动作模式。智能不需要知识、不需要表示、不需要推理;人工智能可以像人类智能一样逐步进化;智能行为只能在现实世界中与周围环境交互作用而表现出来。人工智能三大学派的优势和劣势对比如表1-1所示。表1-1人工智能三大学派的对比分析1.1人工智能概述1.1.3人工智能的层次结构人工智能正在发展得无处不在,大多数人都在使用,如Baidu搜索、淘宝的推送以及各种新闻资讯的推送,苹果Siri每周处理20亿个自然语言请求,Android手机上20%的请求是由语音识别的。现阶段,神经网络芯片、深度学习算法、大数据及云计算,四个催化剂使人工智能开始迅速发展。人工智能的层次结构分为基础层、技术层和应用层,如图1-3所示。图1-3人工智能的层次结构1.2人工智能的发展人工智能的研究可以追溯到亚里士多德(三段论),莱布尼茨(把形式逻辑符号化,使得人们可以对思维进行运算和推理,奠定了数理逻辑的基础)、布尔(布尔代数)、弗雷格、罗素、哥德尔等人在数理逻辑方面的工作,McCulloch和Pitts的人工神经元模型,以及图灵的智能计算等。阿兰·图灵对后世最大的理论贡献之一就是图灵机。如图1-4所示。图1-4图灵机模型1.掣制硬件,人工智能的过去1.2人工智能的发展阿兰·图灵的另一个伟大理论贡献是图灵测试,至今仍然被当作人工智能水平的重要测试标准之一。图灵测试是指人们通过设备和另外一个人聊天,可以是文字形式也可以是语音。如果30%的人认为是在和一个真人聊天,而对方实际是个机器,这个机器就通过了图灵测试,它就是具有智能的。以现在的计算机人工智能技术来说,30%的比例定得有些低,近年来很多人工智能对话程序已经能够通过图灵测试。但在当时受制于硬件设备,没有机器能够通过这样的测试,图灵测试也仅是作为一个预言出现。图灵预言,在20世纪末,一定会有计算机通过“图灵测试”,如图1-5所示。图1-5图灵测试1.掣制硬件,人工智能的过去1.2人工智能的发展会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是为会议讨论的内容起了一个名字———人工智能。因此,1956年成为人工智能元年。图1-6所示为达特茅斯会议照片。会议提出,学习或智能的任何特性都能够被精确地加以描述,使得机器可以对其进行模拟。图1-6达特茅斯会议照片1.掣制硬件,人工智能的过去1.2人工智能的发展大量成功的AI程序和新的研究方向不断涌现,研究学者认为具有完全智能的机器将在20年内出现并给出了如下预言:1.掣制硬件,人工智能的过去(1)1958年,西蒙、纽厄尔:10年之内,数字计算机将成为国际象棋世界冠军,将发现并证明一个重要的数学推理。(2)1965年,西蒙:20年内,机器将能完成人能做到的一切工作。(3)1967年,明斯基:一代之内,创造人工智能的问题将获得实质上的解决。(4)1970年,明斯基:在3~8年的时间里,我们将得到一台具有人类平均智能的机器。1.2人工智能的发展计算机视觉、语音识别、自然语言处理(naturallanguageprocessing)的准确率都已不再停留在“过家家”的水平,应用场景也不再只是一个新奇的“玩具”,而是逐渐在真实的商业界扮演起重要的支持角色,它影响着人类生活的方方面面,如图1-7所示。2.突破阈值,人工智能的现在图1-7AI的应用场景(a)无人驾驶(b)智能家居(c)虚拟现实(d)智能机器人(e)智能投顾(f)智能医疗1.2人工智能的发展人工智能已经发展了很长时间,它在未来的发展问题是该学科有关研究人员讨论的重点,从现阶段的发展情况来看,未来人工智能可能会朝着以下几个方向发展:3.黄金时代,人工智能的未来(1)更好地为人类服务(2)与人类平等(3)毁灭人类1.3人工智能的研究领域1.3.1问题求解与博弈人工智能最早的应用实践是求解难题(problemsolving)和下棋程序。下棋是一种博弈(gameplaying)问题。博弈问题还包括打牌、游戏和战争等竞争性智能活动,即使己方获胜,敌方失败。问题求解和博弈都是指通过搜索的方法寻找目标解的一个合适操作序列,并满足问题的各种约束。它们面对的大多是良结构问题。但是这些良结构问题一般有巨大的搜索空间,导致虽然在理论上可以用穷举法找到最优解,但是由于现实时空约束而不可能得到最优解。简而言之,其核心研究就是搜索技术。1.3人工智能的研究领域1.3.1问题求解与博弈人工智能中的搜索系统一般由全局数据库、算子集和控制策略三部分组成。(1)②③全局数据库包含与具体任务有关的信息,用来反映问题的当前状态、约束条件及预期目标。算子集,也就是操作规则集,用来对数据库进行操作运算。控制策略用来决定下一步选用哪一个算子并在何处应用。1.3人工智能的研究领域1.3.2机器学习目前,机器学习领域的研究工作主要围绕以下几个方面进行:(1)面向任务的研究,研究和分析改进一组预定任务的执行性能的学习系统。(2)认知模型的研究,研究人类学习过程并进行计算机模拟。(3)理论性分析的研究,从理论上探索各种可能的学习方法和独立于应用领域的算法。1.3人工智能的研究领域1.3.3模式识别图1-8所示为模式识别的一般过程,其中,虚线下部是学习训练过程,虚线上部是识别过程。图1-8模式识别的一般过程1.3人工智能的研究领域1.3.4自然语言处理自然语言处理是人工智能中一个看似简单,但实际上十分困难的研究课题。它一方面是语言信息处理的一个分支,另一方面又是人工智能的核心领域之一。自然语言处理主要研究人类如何使用本民族所熟悉的语言(如汉语、英语、法语等)同计算机进行信息交流,探讨人类自身的语言能力和思维活动本质的技术。这在当前新技术革命浪潮中占有十分重要的地位。研究第五代计算机的主要目标之一,就是要使计算机具有理解和运用自然语言的功能。1.3人工智能的研究领域1.3.4自然语言处理具体来讲,自然语言处理要达到以下三个目标:(1)(2)(3)目标计算机能正确理解人们用自然语言输入的信息,并能正确回答输入信息中的有关问题。对输入的信息,计算机能产生相应的摘要,能用不同词语复述所输入信息的内容。计算机能把用某种自然语言表示的信息自动地翻译为另一种自然语言。1.3人工智能的研究领域1.3.5智能机器人智能机器人(intelligentrobots)是指能够模拟人类行为的、可再编程序的多功能操作装置。智能机器人是人工智能中视觉感知系统、问题求解系统、计划产生系统等领域中技术的综合应用成果。1.3人工智能的研究领域1.3.5智能机器人具体来讲,智能机器人应该具有以下两方面的功能:(1)模式识别。给机器人配备视觉、听觉及触觉传感器,使其能够识别外界环境中的各种信息,从而实现信息的输入。(2)运动协调推理。机器人的运动协调推理功能是依赖于感觉驱动的。感觉是机器人接受外界的刺激,而运动则是机器人的行动。1.3人工智能的研究领域1.3.6专家系统领域专家系统通常由知识库、推理机、综合数据库、解释器、人机交互界面和知识获取等部分构成。(1)知识库用来存放专家提供的知识。构成(2)推理机针对当前问题的条件或已知信息,反复匹配知识库中的规则,产生新的结论,以得到问题的求解结果。(3)综合数据库专门用于存储推理过程中所需的原始数据、中间结果和最终结论,往往是作为暂时的存储区。(4)解释器能够根据用户的提问,对结论、求解过程做出说明,从而使专家系统更具有易用性。(5)人机交互界面是系统与用户进行交流时的界面。(6)知识获取是指采集知识并把知识输入知识库的过程。1.3人工智能的研究领域1.3.7人工神经网络人工神经网络(artificialneuralnetwork)简称神经网络(neuralnetwork),是以联结主义研究人工智能的方法,以对人脑和自然神经网络的生理研究成果为基础,抽象和模拟人脑的某些机理、机制,实现某方面的功能。人工神经网络是人工智能研究的主要途径之一,也是机器学习中非常重要的一种学习方法。1.3人工智能的研究领域1.3.7人工神经网络人工神经网络还有很多其他方法无法代替的独特优点。可以任意逼近任何复杂的非线性关系。(1)(3)(5)(2)(4)具有自适应、自学习和自组织能力。所有信息都存储于网络内的各神经元,个别神经元失效不会对整个系统造成致命影响。具有并行运算的本质,可以快速解决复杂问题,或者得到优化解。具有联想存储功能。1.3人工智能的研究领域1.3.7人工神经网络现在,一般认为人工神经网络比较适用于特征提取、模式分类、联想记忆、低层次感知和自适应控制等很难应用严格解析方法的场合。目前,人工神经网络研究主要集中在以下几个方面:(1)(2)(4)(3)利用神经生理与认知科学研究人类思维及智能机理。利用神经基础理论的研究成果,用数理方法探索功能更加完善、性能更加优越的神经数理理论,如神经网络动力学和非线性神经场等。对人工神经网络的软件模拟和硬件实现的研究。人工神经网络在各个领域(如模式识别、信号处理、知识工程、专家系统、优化组合和机器人控制等)中应用的研究。1.4人工智能的应用领域1.人工智能技术在泛安防领域的应用据统计,安防领域视频监控占比近90%,中心侧份额最大。出入口控制的主要产品(如人脸识别闸机、门禁等)门槛较低,与监控人脸识别具备相通之处,因此绝大部分安防产品与解决方案提供商均涉足这部分业务,其市场较大。图1-9所示为2018年AI+安防软硬件细分市场占比图。图1-92018年AI+安防软硬件细分市场占比1.4人工智能的应用领域2.人工智能技术在医疗健康领域的应用医疗健康是个慢行业,中国AI医学影像的商业化于2019年起步,到2022年市场规模达到9.7亿元,在已定级医院中总付费渗透率达5%,在三级医院和二级医院的总付费渗透率达到8%,期间若产品功能取得突破性进展则有更大发展空间。此前,AI医学影像基本采用三甲医院试用合作的模式,2019年后逐步推进产品收费。随着分级诊疗的推进和市场对AI认知的提升,2020年年底至2021年部分产品获得CFDA三类医疗器械认证,同年二级医院客户数量首次超过三级医院。1.4人工智能的应用领域2.人工智能技术在医疗健康领域的应用目前主要有以下三种收费模式:(1)三种收费模式(2)(3)将AI医学影像嵌入云HIS或云PACS中,打包售卖,由于现阶段AI产品商业化存在产品功能还未完全直击客户痛点的情况,医院客户较多使用的是免费AI,与云服务结合可将AI作为收费模块。将AI作为服务单独提供,其优势在于相较于云服务,软件开发形式更符合医院采购习惯。与影像设备厂商合作提供具有AI功能的医疗影像设备,收取一定分成,这种形式较难提供完整的拍片-阅片智能解决方案,需要重新申报CFDA审批认证,目前落地较少。1.4人工智能的应用领域2.人工智能技术在医疗健康领域的应用目前市场中主要有AI企业、医疗信息化厂商、科技巨头、医疗影像设备厂商等几类厂商。如图1-10所示是2019—2022年中国AI医学影像市场规模。图1-102019—2022年中国AI医学影像市场规模1.4人工智能的应用领域3.人工智能技术在教育领域的应用经过多年的发展,随着用户对在线教育的接受度不断提升、在线付费意识逐渐养成以及线上学习体验和效果的提升等因素影响,中国在线教育的市场规模与用户数量已进入初步成熟阶段。据统计,2018年中国在线教育市场规模达2517.6亿元,付费用户数量超过1.35亿人,人工智能技术进入教育领域后,市场上涌现出大量专注于“AI+教育”的新型教育机构,在线教育企业也在已有业务线基础上引入人工智能技术以提升教学效率、拓展商业模式。1.4人工智能的应用领域3.人工智能技术在教育领域的应用图1-11所示为2018—2022年中国在线教育及AI相关业务规模情况。图1-112018—2022年中国在线教育市场规模及AI相关业务规模情况1.4人工智能的应用领域4.人工智能技术在数字营销领域的应用通过技术与营销环节相结合,在提供更加充实的用户特征以及创意内容的同时,对投放的策略和形式进行优化,提升引流、集客、转化效果,图1-12所示为AI+数字营销的核心价值。图1-12AI+数字营销的核心价值1.4人工智能的应用领域5.人工智能技术在城市交通领域的应用2016年,应用人工智能技术的交通大脑出现,使交通管控系统正式步入智能化时代。交通大脑实质是囊括数据采集平台、数据分析平台、数据建模平台和决策平台的PaaS云服务。图1-13所示为交通大脑应用流程图。图1-13交通大脑应用流程图思考与练习1.人工智能的概念是什么?2.简述人工智能的层次结构。3.简述人工智能的三大学派及其对比。4.人工智能可以应用到哪些工程领域?模块2知识学习2.1与机器对话Eliza是由系统工程师约瑟夫·魏泽堡和精神病学家肯尼斯·科尔比在20世纪60年代共同编写的。在当时自然语言技术还没有突破性进展的前提下,Eliza的出现是一件让人“费解”的事情。图2-1所示为Eliza与人类的聊天记录,如果仔细分析Eliza与人聊天的内容,就不难发现它的逻辑原理是非常简单的,甚至可以说其中并没有逻辑,它只是颠倒了对方所说的话的语序,然后回应给对话人。图2-1Eliza与人类的聊天记录2.1与机器对话2.1.1知识的概念培根说:知识就是力量。那么如何让计算机像人一样能够拥有知识的力量是人工智能的本质问题。要解决这个问题至少要弄清知识表示、知识管理、知识推理和知识获取这些问题。知识是人类进行一切智能活动的基础。哲学、心理学、语言学和教育学等都在对知识和知识的表示方法等问题进行研究。知识反映了客观世界中事物之间的关系,不同事物或相同事物间的不同关系形成了不同的知识。2.1与机器对话2.1.2知识的特征和知识表示分类1.知识的特征(1)相对正确性。知识是人们对客观世界认识的结晶,并且经过了长期实践的检验。因此,在一定的条件和环境下,知识一般是正确的,是可信任的。(2)不确定性。由于现实世界的复杂性,信息可能是精确的,也可能是不精确的,知识是有关信息关联在一起形成的信息结构。(3)可表示性与可利用性。知识是可以用适当形式(如语言、文字、图形和神经元网络等)表示出来的;正是由于它具有这一特性,它才能被存储并得以传播。2.1与机器对话2.1.2知识的特征和知识表示分类2.知识表示分类人工智能中的知识表示方法注重知识的运用,所以将知识表示方法粗略地分为过程性(procedure)知识表示和陈述性(declarative)知识表示两大类。过程性知识一般是表示如何做的知识,是有关系统变化、问题求解过程的操作、演算和行为的知识。这种知识是隐含在程序中的,机器是无法从程序的编码中抽取出来的。(1)过程性知识表示(2)陈述性知识表示陈述性知识描述系统的状态、环境和条件,以及问题的概念、定义和事实。陈述性知识表示描述这种事实性知识,即描述客观事物所涉及的对象以及对象之间的联系。陈述性知识的表示与知识运用(推理)是分开处理的,这种知识是显性地表示。2.2正确表示知识1.事实表示产生式中的事实表示有对象性质与对象间关系两种表示法。2.2.1产生式表示法(1)对象性质表示对象性质可用一个三元组表示:(对象,属性,值)它表示指定对象具有指定性质的某个指定值,如(牡丹花,颜色,红)表示牡丹花是红色的。(2)对象间关系表示对象间关系可用一个三元组表示:(关系,对象1,对象2)它表示指定两个对象间所具有指定的某个关系,如(父子,王龙,王晨)表示王龙与王晨间是父子关系。一个给定问题的产生式系统可组成一个事实集合体,称为综合数据库。2.2正确表示知识2.规则表示2.2.1产生式表示法规则是事实间因果联系的动态表示。产生式规则的一般形式为If

P

then

Q其中前半部P确定了该规则可应用的先决条件,后半部Q描述了应用这条规则所采取的行动得出的结论。一条产生式规则满足了应用的先决条件P之后,就可用规则进行操作,使其发生变化产生结果Q。一个给定问题的产生式系统可组成一个规则集合体,称为规则库。2.2正确表示知识3.产生式表示法与知识2.2.1产生式表示法第一层:产生式表示中的对象。它给出了知识中的对象。第二层:产生式表示中的事实。它给出了知识中的事实。第三层:产生式表示中的操作。它给出了知识中的规则。第四层:产生式表示中的知识可设置约束。它给出了元知识。2.2正确表示知识4.产生式表示法实例2.2.1产生式表示法在医学专家系统中判定咽炎的产生式表示。在该医学专家系统中有事实:A:(病人,咽部观察,充血);B:(病人,咽部主诉,疼痛);C:(病人,白细胞数,高);D:(病人,中性指标,高);E:(病人,体温,高);F:(病人,病症,急性咽炎);G:(病人,白细胞数,>500);H:(病人,中性指标,>60);I:(病人,体温,>37);J:(病人,白细胞数,≤500);K:(病人,中性指标,≤60);L:(病人,体温,≤37);M:(病人,白细胞数,正常);N:(病人,中性指标,正常);P:(病人,体温,正常);Q:(病人,病症,慢性咽炎)。上面16个事实组成了综合数据库。2.2正确表示知识4.产生式表示法实例2.2.1产生式表示法它有如下产生式规则:If

A

and

B

and

C

and

D

and

E

then

FIf

G

then

CIf

H

then

DIf

I

then

EIf

J

then

MIf

K

then

NIf

L

then

PIf

A

and

B

and

M

and

N

and

P

then

Q这8个规则组成了规则库。2.2正确表示知识5.产生式表示法的评价(1)知识表示的完整性。可以用产生式表示知识体系中的全部四部分。2.2.1产生式表示法①③④②可以用产生式中的对象表示知识中的对象;可以用产生式中的事实表示知识中的事实;可以用产生式中的规则表示知识中的规则;可以用产生式表示知识中的部分元知识。2.2正确表示知识5.产生式表示法的评价(2)表示规则简单易用。2.2.1产生式表示法用产生式方法表示知识无论是对象、事实、规则都很简单,因此易于掌握使用。2.2正确表示知识1.语义网络的概念及结构语义网络是知识的一种有向图表示方法,如图2-2所示。2.2.2语义网络法图2-2语义基元结构其中,A和B分别代表节点,而RAB则表示A和B之间的某种语义联系。节点用来表示各种事物、概念、情况、属性、状态、动作等,节点上的标注用来区分各节点所表示的不同对象,每个节点可以带有多个属性,以表征其所代表的对象的特性。弧是有方向的,方向体现了节点间的主次关系,标识用来区分各种不同对象以及对象间各种不同语义联系。2.2正确表示知识2.语义网络的基本语义联系当把多个语义基元用相应的语义联系关联在一起时,就形成了一个语义网络,如图2-3所示。2.2.2语义网络法图2-3语义网络结构2.2正确表示知识2.语义网络的基本语义联系语义网络表示法具有如下一些特点:2.2.2语义网络法(1)结构性(2)联想性(3)直观性(4)非严格性(5)处理复杂性2.2正确表示知识2.语义网络的基本语义联系最基本的语义关系包括以下几种:(1)类属关系。类属关系是指具有共同属性的不同事物间的分类关系、成员关系或实例关系,它体现的是“具体与抽象”“个体与集体”的层次分类。常用的类属关系有以下几种:2.2.2语义网络法①AKO(A-Kind-of):表示一个事物是另一个事物的一种类型。②AMO(A-Member-of):表示一个事物是另一个事物的成员。③ISA(Is-a):表示一个事物是另一个事物的实例。2.2正确表示知识2.语义网络的基本语义联系(2)包含关系。包含关系也称为聚集关系,是指具有组织或结构特征的“部分与整体”之间的关系,它和类属关系最主要的区别是包含关系一般不具备属性的继承性。例如,“轮胎是汽车的一部分”,其语义网络表示如图2-4所示。2.2.2语义网络法图2-4包含关系实例2.2正确表示知识2.语义网络的基本语义联系(3)属性关系。属性关系是指事物和其属性之间的关系。常用的属性关系有以下几种:Have:表示一个节点具有另一个节点所描述的属性。Can:表示一个节点能做另一个节点的事情。例如,“鸟有翅膀”“电视机可以播放电视节目”,其对应的语义网络表示如图2-5所示。2.2.2语义网络法图2-5属性关系实例2.2正确表示知识2.语义网络的基本语义联系(4)时间关系。时间关系是指不同事件在其发生时间方面的先后关系,节点间不具备属性继承性。常用的时间关系有以下几种:Before:表示一个事件在一个事件之前发生。After:表示一个事件在一个事件之后发生。例如,“小王在小明之前毕业”“香港回归之后,澳门也回归了”,其对应的语义网络表示如图2-6所示。2.2.2语义网络法图2-6时间关系实例2.2正确表示知识2.语义网络的基本语义联系(5)位置关系。位置关系是指不同事物在位置方面的关系,节点间不具备属性继承性。常用的位置关系有以下几种:Located-on:表示一个物体在另一个物体之上。Located-at:表示一个物体在某一位置。Located-under:表示一个物体在另一个物体之下。Located-inside:表示一个物体在另一个物体之中。Located-outside:表示一个物体在另一个物体之外。例如,“天津大学坐落于天津南开区”,其对应的语义网络表示如图2-7所示。2.2.2语义网络法图2-7位置关系实例2.2正确表示知识2.语义网络的基本语义联系(6)相近关系。相近关系又称相似关系,是指不同事物在形状、内容等方面相似和接近。常用的相近关系有以下几种:Similar-to:表示一个事物与另一个事物相似。Near-to:表示一个事物与另一个事物接近。例如,“狗长得像狼”,其对应的语义网络表示如图2-8所示。2.2.2语义网络法图2-8相似关系实例2.2正确表示知识2.语义网络的基本语义联系(7)因果关系。因果关系是指由于某一事件的发生而导致另一事物的发生,适合表示规则性知识。通常用If-then联系表示两个节点之间的因果关系,其含义是“如果……那么……”。例如,“如果下雨,小王开车上班”,其对应的语义网络表示如图2-9所示。2.2.2语义网络法图2-9因果关系实例2.2正确表示知识2.语义网络的基本语义联系(8)组成关系。组成关系是一种一对多的联系,用于表示某一事物由其他一些事物构成,通常用Composed-of联系表示。Composed-of联系所连接的节点间不具备属性继承性。例如,“整数由正整数、负整数和零组成”,其对应的语义网络如图2-10所示。2.2.2语义网络法图2-10组成关系实例2.2正确表示知识3.语义网络知识表示举例【例2.1】把下列命题用一个语义网络表示出来:(1)猪和羊都是动物。(2)猪和羊都是哺乳动物。(3)野猪是猪,但生长在森林中。(4)山羊是羊,头上长着角。(5)绵羊是一种羊,它能生产羊毛。2.2.2语义网络法解题分析:问题涉及的对象有猪、羊、动物、哺乳动物、野猪、山羊、绵羊、森林、羊毛、角等。然后分析它们之间的语义关系,“动物”和“哺乳动物”,“哺乳动物”和“猪”,“哺乳动物”和“羊”,“羊”和“山羊”及“绵羊”,“野猪”和“猪”之间的关系是“是一种”的关系,可用AKO来表示。“山羊”和“头上有角”之间是一种属性关系,可用Have来描述;“绵羊”和“羊毛”之间是一种属性关系,可用Have来描述;“野猪”和“森林”之间是位置关系,可用Located-at来表示。2.2正确表示知识3.语义网络知识表示举例【例2.1】其语义网络表示如图2-11所示。2.2.2语义网络法图2-11有关羊和猪的语义网络2.2正确表示知识3.语义网络知识表示举例【例2.2】用能语义网络表示下列知识:教师张明在本年度第二学期给计算机应用专业的学生讲授“人工智能”这门课程。2.2.2语义网络法解题分析:本题涉及的对象包括教师、张明、学生、计算机应用、人工智能、本年度第二学期等。然后确定各对象间的关系。“张明”与“教师”之间是一种类属关系,可用ISA表示;“学生”和“计算机应用”之间是一种属性关系,可以用Major表示。“张明”“学生”和“人工智能”则是通过“讲课”这一动作联系在一起的。从上面的分析可知,必须增加一个动作节点“讲课”,“张明”是这一动作的主体,而“学生”和“人工智能”是这一动作的两个客体。“本年度第二学期”则是这个动作的作用时间,属于一种时间关系。因此,通过增加这个动作节点“讲课”将网络中的各节点联系起来了。由“讲课”节点引出的弧不仅指出了讲课的主体和客体,还指出了讲课的时间。2.2正确表示知识3.语义网络知识表示举例【例2.2】通过分析可得其对应的语义网络表示如图2-12所示。2.2.2语义网络法图2-12有关讲课的语义网络2.2正确表示知识1.框架理论2.2.3框架表示法框架理论的基本观点是:人脑已存储有大量的典型情景,当人面临新的情景时,就从记忆中选择(粗匹配)一个称为框架的基础知识结构,这个框架是以前记忆的一个知识空框,而其具体内容依据新的情景而改变,对这一空框的细节进行加工修改和补充,形成对新情景的认识后又记忆于人脑中,以丰富人的知识。2.2正确表示知识2.框架结构框架是表示某一类情景的一种结构化的数据结构。框架由描述事物的各个方面的槽组成,每个槽可有若干个侧面。在一个用框架表示的知识系统中,一般含有多个框架,为了区分不同的框架以及一个框架内不同的槽和侧面,需要分别赋予其不同的名字,分别称为框架名、槽名及侧面名。因此,一个框架通常由框架名、槽名、侧面和值四部分组成,其一般结构如图2-13所示。2.2.3框架表示法图2-13框架的一般结构2.2正确表示知识2.框架结构例如,要用框架来描述“5G手机”这一概念,首先分析商品所具有的属性,一个商品可能具有的属性有商品名称、生产日期、功能参数等,这里只考虑这几个属性。这几个属性可以定义为“5G手机”框架的槽,而“功能参数”这个属性还可以从CPU型号、CPU核数、运行内存和机身存储这四个侧面来加以描述。如果给各个槽和侧面赋予具体的值,就得到了“5G手机”这一概念的一个实例框架,如图2-14所示。2.2.3框架表示法图2-14框架表示法实例2.2正确表示知识1.命题逻辑2.2.4逻辑表示法命题逻辑是数理逻辑的一种,数理逻辑是用形式化语言(逻辑符号语言)进行精确(没有歧义)的描述,用数学的方式进行研究。人们最熟悉的是数学中的设未知数表示。在人工智能的发展史中,关于知识的表示方法曾存在两种不同的观点。一种观点认为,知识主要是陈述性的。其表示方法应着重将其静态特性,即事物的属性及事物间的关系表示出来。这种观点称为陈述式或说明性表示方法。另一种观点认为,知识主要是过程性的。2.2正确表示知识1.命题逻辑2.2.4逻辑表示法说明性表示方法是一种静态表示知识的方法,其主要特征是把领域内的过程性知识与控制性知识(问题求解策略)分离开。例如,在前面讨论的产生式系统中,规则库只是用来表示并存储领域内的过程性知识,而把控制性知识隐含在控制系统中,两者是分离的。过程性表示方法着重于对知识的利用,它把与问题有关的知识以及如何运用这些知识求解问题的控制策略都表述为一个或多个求解问题的过程。每一个过程都是一段程序,用于完成对一个具体事件或情况的处理。2.2正确表示知识1.命题逻辑一般来说,一个过程规则包括激发条件、演绎操作、状态转换和返回四个部分。2.2.4逻辑表示法(1)激发条件。激发条件由两部分组成,即推理方向和调用模式。(2)演绎操作。演绎操作由一系列子目标构成,当上面的激发条件被满足时,将执行这里列出的演绎操作,如GOAL(brother?x?y)、GOAL(fatherxz)。(3)状态转换操作。状态转换操作用于对数据库进行增、删、改,分别用INSERT、DELETE和MODIFY语句实现。(4)返回。在使用过程规则表示知识的系统中,求解问题的基本过程是:每当有一个新的目标时,就从可用的过程规则中选择一个(设为R),并执行过程规则R。2.2正确表示知识1.命题逻辑例如,设数据库中有以下已知事实:(brother

张江海张江洋)(father

张江海

张小海)需要求解的问题是:找出两个人u及v,其中u是v的叔父。该问题可表示为:GOAL(uncle?u?v)。规则库中的规则为BR(uncle?y?z),其语句如下:2.2.4逻辑表示法2.2正确表示知识1.命题逻辑求解该问题的过程如下:2.2.4逻辑表示法(1)在过程规则库中找出对于问题GOAL(uncle?u?v),其激发条件可被满足的过程规则。显然,BR(uncle?y?z)经u/y,v/t变量代换后可以匹配,所以选用该规则。(2)执行该规则的第一个语句GOAL(brother?x?y),此时y已被u代换,经与已知事实brother(张江海张江洋)匹配,得x=张江海,u=张江洋。(3)执行该规则过程的第二个语句GOAL(fatherxz),可得与已知事实father(张江海张小海)匹配,求得了变量v的值张小海。(4)执行该过程规则的第四个语句INSERT(uncleyz)。此时y与z的值均已知,所以插入数据库中的事实是uncle(张江洋张小海)。2.2正确表示知识1.命题逻辑这表明“张江洋是张小海的叔父”,从而求得了问题的解,如图2-15所示。2.2.4逻辑表示法图2-15过程性表示方法求解过程2.2正确表示知识2.谓词逻辑2.2.4逻辑表示法在命题逻辑中,命题是具有真假意义的陈述句。从语法上分析,一个陈述句由主语和谓语组成。在谓词逻辑中,为揭示命题内部接口及不同命题的内部结构关系,就按照这两部分对命题进行分析,并且把主语称为个体或客体,把谓语称为谓词。谓词逻辑相当于数学中的函数表示。2.2正确表示知识2.2.5脚本表示法脚本通过一些原语作为槽名来表示对象的基本行为,描述某些事件的发生序列,有些类似于电影剧本。脚本表示的知识有强烈的因果结构,系统对事件的处理必须是一个动作完成之后才能完成另一个动作。整个过程的启动取决于开场条件,只有满足脚本的开场条件,脚本中的事件才有可能发生,而脚本的结果就是所有动作完成后的系统结果。2.2正确表示知识2.2.5脚本表示法脚本描述一般由以下几部分组成:12345(1)进入条件:指出脚本所描述的事件可能发生的先决条件,即事件发生的前提条件。(2)角色:描述事件中可能出现的人物。(3)道具:描述事件中可能出现的相关物体。(4)场景:描述事件序列,可以有多个场景(场景可变化,剧情可变化)。(5)结局:给出在剧本所描述的事件发生以后通常所产生的结果。思考与练习1.什么是知识学习?2.简述产生式表示法。3.简述语义网络表示法。4.简述过程表示法。模块3机器学习模块3机器学习本模块讲述机器学习的定义和基本模型,机器学习与人类思维的对比,以及机器学习的分类和学习方法、机器学习的应用领域。通过本模块的学习,读者应达到以下学习目标:(1)了解机器学习的定义和基本模型;(2)了解机器学习的分类;(3)理解机器学习的方法;(4)了解机器学习的应用方向。3.1认识机器学习3.1.1机器学习的定义机器学习的核心是学习,但究竟什么是学习,至今都没有一个统一的定义。来自神经学、心理学、计算机科学等不同学科的研究人员,从不同角度对学习给出了不同的解释。以下是关于学习比较有影响的定义:(1)西蒙(Simon,1983):学习就是系统中的适应性变化,这种变化使系统在重复同样工作或类似工作时,能够做得更好或效率更高。(2)明斯基(Minsky,1985):学习是人们头脑里(心理上)有用的变化。(3)迈克尔斯基(Michalski,1986):学习是对经历描述的建立和修改。3.1认识机器学习3.1.1机器学习的定义机器学习的研究主要集中在三个方面展开:一二三一是认知模型的研究,目的是通过对人类学习机理的研究和模拟,从根本上解决机器学习方面存在的种种问题;二是理论学习的研究,目的是从理论上探索各种可能的学习方法,并建立起独立于具体应用领域的学习算法;三是面向任务的研究,目的是根据特定任务的要求建立相应的学习系统。3.1认识机器学习3.1.1机器学习的定义人工智能是社会发展的重要推动力,而机器学习,尤其是深度学习技术是人工智能发展的核心,它们三者之间是包含与被包含的关系,如图3-1所示。图3-1人工智能、机器学习和深度学习三者之间的关系3.1认识机器学习3.1.2机器学习的基本模型机器学习的实现依赖于学习系统,学习系统能够利用过去与环境相互作用时得到的信息提高自身的性能。机器学习系统的基本结构如图3-2所示。图3-2机器学习系统的基本结构影响学习系统设计的最重要因素是环境向系统提供的信息。知识库中存放的是执行部分动作的一般原则,但环境向学习系统提供的信息是多种多样的。如果信息的质量比较高,与一般原则的差别比较小,学习部分就比较容易处理。3.1认识机器学习3.1.3机器学习与人类思考的类比把机器学习的过程与人类归纳历史经验的过程做个比较,如图3-3所示。图3-3机器学习与人类归纳历史经验的过程比较3.1认识机器学习3.1.4机器学习的分类(1)有监督学习。有监督学习是通过已有的训练样本(已知数据及其对应的输出)进行训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断从而实现分类的目的。(2)无监督学习。无监督学习是在用来学习的数据没有任何类别信息以及给定目标值的情况下,通过学习寻求数据间的内在关系和统计规律,从而获得样本数据的结构特征。(3)强化学习。强化学习也称增强式学习,是一类通过交互来学习的机器学习算法。在强化学习中,智能体根据环境的状态做出一个动作,并得到即时或延时的奖励。智能体在与环境的交互中不断学习并调整策略。1.按有无指导来分3.1认识机器学习3.1.4机器学习的分类2.按学习方法来分(1)机械式学习。机械式学习就是死记硬背式学习,是最简单、最原始的学习方法。机械式学习通过简单记忆和查询达到学习目的。(2)指导式学习。指导式学习就是由外部环境向系统提供一般性的指示或建议,系统把它们具体地转化为细节知识并送入知识库中。(3)范例学习。范例学习也称为基于实例的学习,是基于过去经验的一种学习方法,也可以看作一种类比学习。3.1认识机器学习3.1.4机器学习的分类3.按推理策略来分(1)演绎学习。演绎学习就是根据常规逻辑进行演绎推理的学习方法。演绎推理是从一般到个别的推理,其学习过程是一个特化过程。(2)归纳学习。归纳学习就是从一系列正例和反例中,通过归纳推理产生一般概念的学习方法。归纳学习的目标是生成合理的能解释已知事实和预见新事实的一般性结论。归纳推理是从个别到一般的推理,其学习过程是一个泛化过程。(3)类比学习。类比学习就是通过对相似事物进行比较而得到结果的学习方法。类比学习依据从个别到个别的类比推理法。(4)解释学习。解释学习也称为分析学习,是从完善的领域理论出发演绎出有助于有效地利用领域理论的规则。其学习目的是提高系统性能,而不是修改领域理论。3.2机器学习方法机器学习是在计算机系统的支持下,由大量样本数据通过机器建模获得学习模型作为结果的一个过程,可用下面的公式表示:样本数据+机器建模=学习模型由上述公式可见,机器学习的两大要素是样本数据与机器建模。学习模型是由样本数据通过机器建模而获得的学习结果,它是一种知识模型。下面讨论几种常见的学习模型。3.2机器学习方法3.2.1决策树学习决策树也称判定树,它是由对象的若干属性、属性值和有关决策组成的一棵树。其中的节点为属性(一般为语音变量),分支为相应的属性值(一般为语言值),从同一节点出发的各个分支之间是逻辑“或”关系,根节点为对象的某个属性;从根节点到每一个叶子节点的所有节点和边,按顺序串连成一条分支路径,位于同一条分支路径上的各个“属性-值”对之间是逻辑“与”关系,叶子节点为这个“与”关系的对应结果,即决策。1.决策树的概念3.2机器学习方法3.2.1决策树学习例如,图3-4所示是一棵决策树。其中,A、B、C代表属性,ai、bj、ck代表属性值,dl

代表对应的决策。处于同一层的属性(图3-4中的B、C)可能相同,也可能不同,所有叶子节点(图3-4中的dl

,l=1,2,…,6)所表示的决策中也可能有相同者。图3-4决策树示意图1.决策树的概念3.2机器学习方法3.2.1决策树学习下面用一个决策树来判断一个人的性别,如图3-5所示。图中只有一个属性来决定这个人是男人还是女人,一个属性往往决定的结果并不准确。例如,小孩没有胡子,但是并不能认为小孩都是女人。如果想使判断相对准确,需要再增加属性(如喉结),如图3-6所示。图3-5用一个属性判断性别图3-6用两个属性判断性别1.决策树的概念3.2机器学习方法3.2.1决策树学习2.决策树的学习决策树是一种知识表示形式,构造决策树可由人来完成,但也可以由机器从一些实例中总结、归纳出来,即由机器学习而得。机器学习决策树也就是所说的决策树学习。决策树学习是一种归纳学习。由于一棵决策树表示一组产生式规则,决策树学习也是一种规则学习。需要注意的是,当规则是某概念的判定规则时,这种决策树学习也就是一种概念学习。3.2机器学习方法3.2.1决策树学习2.决策树的学习决策树学习的基本方法和步骤如下:(1)(2)(3)选取一个属性,按这个属性的不同取值对实例集进行分类,并以该属性作为根节点,以这个属性的各个取值作为根节点的分支来画树。考查所得的每一个子类,看其中实例的结论是否完全相同。如果完全相同,则以这个相同的结论作为相应分支路径末端的叶子节点,否则,选取一个非父节点的属性,按这个属性的不同取值对该子集进行分类,并以该属性作为节点,以这个属性的各个取值作为节点的分支,继续画树。如此继续,直到所分的子集全都满足实例结论完全相同,而得到所有的叶子节点为止。这样,一棵决策树就生成了。3.2机器学习方法3.2.1决策树学习3.ID3算法ID3算法是一个经典的决策树学习算法,由澳大利亚计算机科学家RQuinlan于1979年提出,全称是iterativedichotomiser3。ID3算法的基本思想是,以信息熵为度量,用于决策树节点的属性选择,每次优先选取信息量最多的属性,亦即能使熵值变成最小的属性,以构造一棵熵值下降最快的决策树,到叶子节点处的熵值为0。此时,每个子节点对应的实例集中的实例属于同类。3.2机器学习方法3.2.2贝叶斯算法1.贝叶斯算法的概念贝叶斯算法要解决两个重要问题:正向概率和逆向概率。正向概率是指假设袋子里面有N个白球,M个黑球,你伸手进去摸一把,摸出黑球的概率是多大。逆向概率是指如果事先不知道袋子里面黑、白球的比例,而是闭着眼睛摸出一个(或好几个)球,观察这些取出来的球的颜色之后,那么可以对袋子里面的黑、白球比例做出什么样的推测。例如,校园中,男生占60%,女性占40%,男生喜欢打乒乓球,女生则一半喜欢打乒乓球一半喜欢游泳。正向概率:随机选取一个学生,他(她)打乒乓球的概率和游泳的概率是多大。逆向概率:迎面走来一个拿着乒乓球拍的学生,你只看得见他(她)拿着乒乓球拍,而无法确定他(她)的性别,你能够推断出他(她)是女生的概率是多大吗?3.2机器学习方法3.2.2贝叶斯算法1.贝叶斯算法的概念根据上面的例子,可以推出贝叶斯公式:P

(A|B)=P

(B|A)*P

(A)/P

(B)其中,P

(A|B)是在B

发生的情况下A发生的可能性。在贝叶斯定理中,每个名词都有约定俗成的名称:●P

(A)是A的先验概率,之所以称为“先验”,是因为它不考虑任何B

方面的因素。●P

(A|B)是已知B发生后A的条件概率,也由于得自B的取值而被称为A

的后验概率。●P

(B|A)是已知A发生后B的条件概率,也由于得自A的取值而被称为B

的后验概率。●P

(B)是B

的先验概率,也称为标准化常量(normalizingconstant)。3.2机器学习方法3.2.2贝叶斯算法2.朴素贝叶斯算法的特点(1)朴素贝叶斯算法很直观,计算量也不大,在很多领域有广泛的应用,主要优点如下:朴素贝叶斯模型发源于古典数学理论,有稳定的分类效率。①标题文字对小规模的数据表现很好,能够处理多分类任务,适合增量式训练,尤其是数据量超出内存时,可以一批批地增量训练。②③对缺失数据不太敏感,算法也比较简单,常用于文本分类。3.2机器学习方法3.2.2贝叶斯算法2.朴素贝叶斯算法的特点(2)朴素贝叶斯算法的主要缺点如下:①理论上朴素贝叶斯模型与其他分类方法相比具有最小的误差率,但是实际上并非总是如此,这是因为朴素贝叶斯模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,在属性个数比较多或属性之间相关性较大时,分类效果不好。②需要知道先验概率,且先验概率很多时候取决于假设,假设的模型可以有很多种,因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。③由于是通过先验和数据来决定后验的概率从而决定分类的,分类决策存在一定的错误率。④对输入数据的表达形式很敏感。3.2机器学习方法3.2.2贝叶斯算法3.贝叶斯算法的应用场景(2)朴素贝叶斯算法的主要缺点如下:(1)(2)(3)文本分类、垃圾文本过滤和情感判别。多分类实时预测。推荐系统。3.2机器学习方法3.2.3聚类算法1.K均值聚类算法K均值聚类算法也称K-Means聚类算法,如图3-7所示,是使用最普遍和最重要的聚类算法之一。K均值聚类算法主要基于数据点之间的均值和与聚类中心的聚类迭代而成。它主要的优点是十分高效,只需要计算数据点与聚类中心的距离即可,其计算复杂度只有O(n),工作原理主要分为以下四步:1243(1)首先需要预先给定聚类的数目同时随机初始化聚类中心,可以粗略地观察数据并给出较为准确的聚类数目。(2)每一个数据点通过计算与聚类中心的距离来分类到最邻近的一类中。(3)根据分类结果,利用分类后的数据点重新计算聚类中心。(4)重复步骤(2)和步骤(3),直到聚类中心不再变化。3.2机器学习方法3.2.3聚类算法1.K均值聚类算法图3-7K均值聚类算法3.2机器学习方法3.2.3聚类算法2.均值漂移算法图3-8均值漂移算法均值漂移算法是一种基于密度梯度上升的非参数方法,其基本思想是在数据集中选定一个点,然后以这个点为圆心,以r为半径画一个圆(二维下是圆),求出这个点到所有点的向量的平均值,而圆心与向量均值的和为新的圆心,然后迭代此过程,直到满足一点的条件结束,如图3-8所示。3.2机器学习方法3.2.3聚类算法2.均值漂移算法均值漂移算法的过程如下:(1)首先以随机选取的点为圆心,以r为半径作一个圆形的滑窗。其目标是找出数据点中密度最高点并作为中心。(2)在每个迭代后滑动窗口的中心将向着较高密度的方向移动。(3)连续移动,直到任何方向的移动都不能增加滑窗中点的数量,此时滑窗收敛。(4)将上述步骤在多个滑窗上进行以覆盖所有的点。当多个滑窗收敛重叠时,其经过的点将会通过其滑窗聚为一个类。3.2机器学习方法3.2.3聚类算法2.均值漂移算法图与3-9中每一个黑点代表一个滑窗的中心,它们最终重叠在每一类的中心。图3-9均值漂移算法的滑窗3.2机器学习方法3.2.3聚类算法3.基于密度的聚类算法基于密度的聚类经典算法———DBSCAN算法(density-based

spatial

clustering

ofapplication

with

noise,具有噪声的基于密度的空间聚类应用)是一种基于高密度连接区域的密度聚类算法,是一个比较有代表性的基于密度的聚类算法,但其原理与均值漂移算法大不相同,如图3-10所示,其主要过程如下:图3-10DBSCAN算法3.2机器学习方法3.2.3聚类算法4.利用高斯混合模型进行最大期望估计对于较复杂的分布K均值算法,将会产生图3-11所示的较为离谱的聚类结果。图3-11较复杂的分布K均值算法的聚类效果3.2机器学习方法3.2.3聚类算法4.利用高斯混合模型进行最大期望估计而高斯混合模型具有更高的灵活性,是通过假设数据点符合均值和标准差描述的高斯混合模型来实现的。图3-12所示为以二维情况为例描述的利用最大期望优化算法来获取分布参数的过程。图3-12利用最大期望优化算法来获取分布参数的过程3.2机器学习方法3.2.3聚类算法5.层次凝聚聚类算法层次凝聚聚类算法主要有自顶向下和自底向上两种方式。其中,自底向上方式最初将每个点看作独立的类别,随后通过一步步地凝聚最后形成独立的一大类,并包含所有的数据点。这会形成一个树形结构,并在这一过程中形成聚类,如图3-13所示。图3-13层次凝聚聚类算法的树形结构3.2机器学习方法3.2.4迁移学习对于人类来说,迁移学习(transferlearning,TL)就是掌握举一反三的学习能力。例如,学会骑自行车后,学骑摩托车就很简单了;在学会打羽毛球后,再学打网球也就没那么难了。这就是举一反三,在某个领域中所学习到的知识可以在另一个领域中有类似的知识供使用,这就是迁移学习的思想。3.2机器学习方法3.2.4迁移学习基于这种迁移学习的思想,可以建立起人工智能中迁移学习的理论,它可作为机器学习的一个部分用于知识的获取。这里介绍这种理论中的基本概念,包括如下一些内容:(1)源领域。在迁移学习中所需迁移知识所在的领域称为源领域,如“自行车”领域、“中国象棋”领域等均为源领域。(2)目标领域。在迁移学习中所需迁移知识的目标所在的领域称为目标领域,如“摩托车”领域、“国际象棋”领域及“围棋”领域等均为目标领域。(3)迁移学习。在源领域中所学习到的知识往往在目标领域中也可学习到,此时实际上可以用某些变换、映射等手段从源领域中将知识转移到目标领域从而达到减少目标领域中的学习成本,提高学习效果的作用,这种学习称为迁移学习。3.2机器学习方法3.2.4迁移学习图3-14所示为迁移学习的原理。图3-14迁移学习的原理在迁移学习中,目标领域的学习方法主要分两个步骤进行:首先从源领域中通过迁移学习将一部分类似的知识迁移至目标领域;然后以这些知识为起点,在目标领域中继续学习,此时的学习已有了迁移的知识,因此学习就变得简单、方便和容易了,图3-15所示为迁移学习方法的两个步骤。图3-15迁移学习方法的两个步骤3.2机器学习方法3.2.4迁移学习1.计算机视觉迁移学习已被广泛地应用于计算机视觉的研究中,如图片分类、风格迁移等。图3-16展示了不同的迁移学习图片分类任务。同一类图片,不同的拍摄角度、光照和背景,都会造成特征分布发生改变。因此,使用迁移学习构建跨领域的鲁棒分类器是十分重要的。图3-16(a)中的手写体数据分别来自经典数据集MNIST和USPS,图3-16(b)中的图像数据则来自迁移学习公开数据集Office-Home。图3-16迁移学习在视觉领域的应用(a)跨领域手写体识别(b)跨领域图像识别3.2机器学习方法3.2.4迁移学习2.自然语言处理自然语言处理领域也有着大量迁移学习的应用。以文本分类为例,由于文本数据有其领域特殊性,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上,这就需要用到迁移学习。图3-17所示是一个由电子产品评论迁移到DVD评论的迁移学习任务。图3-17迁移学习文本分类任务3.2机器学习方法3.2.4迁移学习3.普适计算与人机交互行为识别(activityrecognition)主要通过佩戴在用户身体上的传感器研究用户的行为。行为数据是一种时间序列数据,不同用户、不同环境、不同位置、不同设备,都会导致时间序列数据的分布发生变化,此时,也需要进行迁移学习,如图3-18所示。图3-18迁移学习在普适计算与人机交互领域的应用(a)不同位置的传感器信号差异;(b)室内定位模型由于位置的变化导致的模型性能变化3.3深度学习与神经网络神经网络起源于对生物神经元的研究,生物神经元包括细胞体、树突、轴突等部分。其中,树突用于接受输入信息,输入信息经过突触处理,当达到一定条件时通过轴突传出,此时神经元处于激活状态;反之,没有达到相应条件,则神经元处于抑制状态,如图3-19所示。图3-19生物神经元3.3深度学习与神经网络一般的神经网络包含输入层、隐藏层和输出层三个部分。图3-20所示是含有一个隐藏层的人工神经网络,隐藏层的层数越多,隐藏层的节点数目越多,在非线性的激活函数下,神经网络就可以学习更深层次的特征。图3-20人工神经网络3.3深度学习与神经网络了解神经网络,还需要了解以下几个概念:(1)激活函数。激活函数是神经网络设计的核心单元,激活函数是用来加入非线性因素的,因为线性模型的表达能力不够。激活函数需要满足以下几个条件:①非线性若激活函数是线性的,则不管引入多少隐藏层,其效果和单层感知机没有任何差别。①可微性训练网络时使用的基于梯度的优化方法需要激活函数必须可微。②单调性单调性保证了神经网络模型简单。③3.3深度学习与神经网络了解神经网络,还需要了解以下几个概念:(2)损失函数。损失函数(lossfunction)也称代价函数(costfunction),是神经网络优化的目标函数,神经网络训练或优化的过程就是最小化损失函数的过程(损失函数值小了,对应预测的结果和真实结果的值就越接近)。(3)反向传播(backpropagation,BP)算法。BP算法分为正向传播和误差的反向传播两个部分。正向传播时,输入样本从输入层进入网络,经隐藏层逐层传递至输出层,若输出层的实际输出与期望输出(导师信号)不同,则转至误差反向传播;若输出层的实际输出与期望输出(导师信号)相同,则结束学习算法。3.4机器学习的应用1.医疗诊断和计算机生物学机器学习将改善整个医疗保健价值链的成果并降低成本。它拥有改善诊断、减少错误和简化药物发现过程的潜力,而这一切都令人感到兴奋。患者数据可被用于早期检测疾病和个性化治疗。制药和生物科技公司可以使用计算方法快速、有效地发现比市场上现有药品更为有效的新药。我们的目的是根据人们的研究提出一组具有代表性的提议。3.4机器学习的应用2.供应链机器学习算法以及基于这种算法的模型,非常擅长在大型数据集中发现异常、模式和得出预测性见解。机器学习可以改善供应链的方方面面,包括需求预测、市场趋势、贸易促销和新产品。目前的公司很难评估不断变化的市场模式和波动,为业务决策提供信息并准确预测,而机器学习将改变这一切。据全球最具权威的IT研究与顾问咨询公司Gartner预测,到2023年,25%的供应链技术解决方案中将内嵌智能算法和人工智能技术,或者将其作为增强型组件。3.4机器学习的应用3.制造业机器学习模型可以增强企业的几乎所有方面,从市场营销到销售再到维护。在制造业,物联网的兴起及其带来的前所未有的海量数据,为利用机器学习带来了无数机会。工业机械的计算机化也在迅速地进行。互联网数据中心(Internet

Data

Center,IDC)数据显示,物联网平台的支出将从2019年的每年7450亿美元上升到2023年的逾1万亿美元。3.4机器学习的应用4.金融风险与合规性机器学习方法具备分析大量数据的能力,同时提供深度的预测分析,可以提高金融机构中的风险管理能力和合规领域的分析能力。例如,检测付费系统中复杂的非法交易模式以及更准确的信用风险建模。机器学习方法在金融服务领域的应用高度依赖于环境,金融机构并不总是提供用于培训或分析的高质量数据。更重要的是,几种方法的分析预测能力可能以增加模型复杂性和缺乏解释性洞察力为代价,这是需要改进的地方。3.4机器学习的应用5.改善语音通话在企业运转中的作用尽管分析语音是业务工作流的关键组成部分,但分析语音的复杂性使其处于机器学习趋势的边缘。2013年的New

Voice

Media研究报告称,由于呼叫中心的效率低下,企业每年约损失410亿美元。而企业每年约有240万内部销售参与数百万小时的会话。因此,对语音通话进行自动化流程的改进对企业具有重要意义。当今,电信企业使用人工智能和机器学习(主要通过使用虚拟助手和聊天机器人)来改善其客户服务。3.4机器学习的应用6.保险行业保险是一个庞大且范围广泛的类别,机器学习可以帮助保险公司以更低的成本提供更有针对性的产品。例如,汽车保险公司可以使用驾驶和其他行为数据单独定价溢价,或者可以使用更好的欺诈检测方法降低其总体成本结构。机器学习正在以多种方式改变着保险行业。(1)保险咨询和客户服务的改变(2)交易和索赔的改变(3)减少欺诈行为3.4机器学习的应用7.个性化教育传统教育的一个主要限制是,尽管学生之间的理解水平和学习风格不同,教师却必须为整个班级教授一个标准课程。如今,机器学习在教育领域已经开始发挥作用,随着机器学习的整合,教育和教学效率都有所提高,同时为教师和学生提供了可定制的学习体验。3.4机器学习的应用8.自动驾驶汽车机器学习可以将汽车内外传感器的数据进行融合,借此评估驾驶员情况、进行驾驶场景分类,以此来实现自动驾驶功能。各大公司已经广泛采用机器学习寻找相应的解决方案。汽车中的电子控制单元已经整合了传感器数据处理,如何充分利用机器学习完成新的任务变得至关重要。百度Apollo无人驾驶小巴如图3-21所示。图3-21百度Apollo无人驾驶小巴思考与练习1.什么是机器学习?2.简述机器学习的基本模型。3.简述机器学习的分类。模块4搜索策略模块4搜索策略本模块讲述了问题求解中所采用的搜索策略,包括盲目搜索和启发式搜索,对比了多种搜索策略的优劣。通过本模块的学习,读者应达到以下学习目标:(1)了解搜索的基本概念及问题的表示方式;(2)了解与或树的表示方式;(3)理解广度优先搜索策略和深度优先搜索策略的搜索路径;(4)理解博弈树搜索策略及应用。4.1搜索策略的基本概念1.空间状态法问题求解的空间状态法可以描述为:若定义S

为被求解问题可能有的初始状态的集合,F为求解过程中可使用的操作的集合,而G为目标状态的集合,那么问题求解的过程则是在状态空间中寻找从初始状态X出发,到达目标状态Xs

的一个路径,这就是问题求解的搜索路径。一般情况下,问题求解过程由下面三个部分组成:(1)数据库(2)操作规则(3)控制策略2.问题归纳法问题归纳法是不同于状态空间法的另一种问题描述和求解的方法。问题归纳可用一个三元组(S0

,O

,P

)来描述,其中,S0

是初始问题,即要求解的问题。P是本原问题集,其中的每一个问题是不用证明而自然成立的,如公理、已知事实等,或已证明过的。O

是操作算子集,通过一个操作算子把一个问题转化成若干个子问题。这种表示方法是由问题出发,运用操作算子产生一些子问题,对子问题再运用操作算子产生子问题的子问题,这样一直进行到产生的问题均为本原问题,则问题得解。4.1搜索策略的基本概念4.1.1认识AI中的搜索什么是AI中的搜索?根据问题的实际情况不断寻找可利用的知识,构造出一条代价较少的推理路线,使问题得到圆满解决的过程称为搜索。搜索包括两个方面,即找到从初始事实到问题最终答案的一条推理路径和找到的这条路径是在时间及空间上复杂度最小的路径。搜索是沿着一定的搜索策略找到问题的最终可能答案的过程,它是人工智能中的一个核心技术,是推理不可分割的一部分,它直接关系到智能系统的性能和运行效率。4.1搜索策略的基本概念为了成功地设计和实现搜索算法,程序员必须能够分析和预测它们的行为。需要回答的问题包括:(1)问题求解器保证可以找到解吗?(2)问题求解器总是可以终止吗?也就是说它是否可能陷入无限循环?(3)当找到解时,能保证这个解是最优解吗?(4)搜索过程的时间复杂度如何?内存使用呢?(5)怎样使解释程序最有效地降低搜索复杂度?4.1.2状态空间表示法4.1搜索策略的基本概念图是由一系列节点和一系列连接节点的弧构成的。在问题求解的状态空间模型中,图的节点被用来表示问题求解过程中的离散状态,如逻辑推理的结果。图的弧表示状态之间的转换。状态空间可用三元组(S

,O

,G

)来描述,其中S

是状态集合,每个元素表示一个状态。状态是某种事实的符号或数据。S0是S

的非空子集,是问题的初始状态。G

也是S的非空子集,表示目标状态集。它可以是若干具体的状态,也可以是对某些状态性质的描述。O

是操作子集,利用它将一个状态转化为另一个状态。状态空间的一个解是一个有限的操作序列,它使初始状态转化为目标状态:其中,O1…Ok

即状态空间的一个解,但解不一定是唯一的。4.1.2状态空间表示法4.1搜索策略的基本概念状态空间可用有向图表示,如图4-1所示,其节点表示状态,节点间的弧表示操作过程。图4-1有向图4.1.2状态空间表示法4.1搜索策略的基本概念用与或树可以方便地把问题归纳为子问题替换集合。例如,假设问题A

既可通过问题C1

与C2

,也可通过问题C3

、C4

和C5

,或者由单独求解问题C6

来解决,如图4-2所示。图中各节点表示要求解的问题或子问题。问题C1和C2构成后继问题的一个集合,问题C3

、C4

和C5

构成另一后继问题的集合;而问题C6

则为第三个集合。对应于某个给定集合的各节点,用一个连接它们的圆弧来标记。由节点及连接弧组成的图称为与或树。还可以引进某些附加节点,以便使含有一个以上后继问题的每个集合能够聚集在它们各自的父辈节点之下。这样图4-2就变为图4-3所示的结构了,每个节点的后继只包含一个连接弧。图4-2与或树4.1.3与或树4.1搜索策略的基本概念图4-3带附加节点的与或树4.2状态空间的搜索策略4.2.1状态空间的一般搜索过程1.搜索过程的思路状态空间图对问题的求解就相当于在有向图上寻找一条从某节点(初始状态节点)到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论