版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能基础与应用全套可编辑PPT课件分为基础篇、应用篇和素养篇。基础篇包括揭开人工智能的神秘面纱、人工智能的基础支撑、人工智能的应用技术;应用篇包括AI+安防——为人类安全保驾护航、AI+教育——实现趣味性教学、AI+医疗——提升人类的健康水平、AI+交通——提升人们的幸福感、AI+零售——促进国民经济发展;素养篇包括人工智能伦理与法律、人工智能职业规划。基础篇第一章揭开人工智能的神秘面纱导读人工智能涉及计算机科学、哲学、认知科学、神经生理学、仿生学、心理学、数理逻辑、信息论、控制论等多个学科,它是在这些学科研究的基础上发展起来的综合性很强的交叉和边缘学科,是当今社会计算机科学中最活跃的分支之一。随着互联网技术和硬件设备的不断进步,人工智能在多个领域得到了迅速发展,并渗透到人类生活的方方面面。本章将介绍人工智能的一些基础知识。1熟悉人工智能的定义和分类。了解人工智能的发展历程和三大学派。熟悉人工智能的产业结构。学习目标23素质目标01普及身边的人工智能应用,锻炼学生观察事物的能力。02介绍人工智能的基础知识,加强学生对新技术的了解,培养学生的探索意识。目录CONTENTS人工智能基础0102人工智能的发展历程03人工智能的三大学派04人工智能的产业结构人工智能基础011.1人工智能基础1.1.1身边的人工智能科技在进步,时代在发展,人工智能也逐渐渗透到了人们生活的各个角落。不相信的话,请你打开手机,看一看你的手机中藏了多少个人工智能应用,如右图所示。手机中的人工智能应用:图
手机中的人工智能应用有能够实现个性化推荐和智能搜索的智能购物软件,如手机淘宝、京东等;有能够根据人们的喜好推荐视频的智能娱乐软件,如抖音、芒果TV等;有能够实现指纹支付和人脸支付的智能支付软件,如支付宝、云闪付等;有能够自动美颜和识别图片的智能相机,如Faceu激萌、天天P图等;有能够实现VR实景看房的智能租售房屋软件,如安居客、贝壳找房等;有能够实时查询路况的智能导航软件,如高德地图、百度地图等。1.1人工智能基础人工智能不仅在人们的生活中占有一席之地,还在现代安防、教育、医疗、交通和零售等领域中具有重要地位。人工智能在这些领域中的实际应用有人脸识别门禁、智慧课堂、手术机器人、无人驾驶汽车和自动售货机等,如下图所示。人脸识别门禁智慧课堂手术机器人无人驾驶汽车自动售货机由此可见,人工智能在现代社会中随处可见。那么,到底什么是人工智能呢?1.1人工智能基础1.1.2认识人工智能人工智能(artificialintelligence,AI)是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门学科。智能与智能的本质是古今中外许多哲学家和脑科专家一直在努力探索和研究的问题,但至今尚未完全研究清楚。因此,至今为止学术界也没有给人工智能下一个明确的定义。下面,列举部分学者对人工智能的描述。人工智能
是那些与人的思想、决策、问题求解和学习等有关活动的自动化过程。人工智能
是一种使计算机能够思考,使计算机具有智力的激动人心的新尝试。人工智能
是用计算机模型研究智力行为的技术。人工智能
是一门通过计算过程力图理解和模仿智能行为的学科。人工智能
是研究如何使计算机做事能够让人过得更好的学科。人工智能
是研究那些使理解、推理和行为成为可能的计算。人工智能
是计算机科学中与智能行为的自动化有关的一个分支。人工智能
是研究和设计具有智能行为的计算机程序,可执行人或动物所具有的智能行为。1.1人工智能基础分析以上学者们对人工智能的描述,人工智能可理解为:人工智能是指能够让计算机像人一样拥有智能,可以代替人类实现识别、认知、分析和决策等多种功能的技术。例如,智能机器服务员能够将语音识别成文字,然后进行分析理解并与人对话,最后为客户提供服务,如下图所示。智能机器服务员1.1人工智能基础1.1.3人工智能分类根据智能程度的不同,可将人工智能分为3类,即弱人工智能、强人工智能和超人工智能。1弱人工智能是指专心于且只能解决某一特定领域问题的人工智能。它只能在特定的领域、既定的规则中,表现出强大的智能。例如,战胜世界围棋冠军的AlphaGo(见右图)就属于弱人工智能,它只擅长下围棋,不会解决其他问题。目前,人们已经基本掌握了弱人工智能。2强人工智能是指能够同时解决不同领域问题的人工智能。它不受领域、规则的限制,只要是人类能干的事情,它都能干。例如,学习、思考、计划、解决问题和理解复杂理念等智能行为,强人工智能都能实现。由此可见,强人工智能才是真正的人工智能。3超人工智能可理解为在任何领域都比最聪明的人类大脑还要聪明的人工智能。它的智能行为不仅不受领域、规则的限制,甚至远远超越人类的智能。战胜世界围棋冠军的AlphaGo人工智能的发展历程021.2人工智能发展历程人工智能的发展历程跌宕起伏,总的来说可分为7个时期,依次是:孕育期起步发展期反思发展期应用发展期低迷发展期稳步发展期蓬勃发展期人工智能的三大学派031.3人工智能的三大学派人工智能在其研究发展的多年期间,许多不同学科或学科背景的学者们对人工智能做出了各自的解释,提出了不同的观点,因此产生了不同的学派。其中,对人工智能研究影响较大的学派有下列3家。(1)符号主义(symbolicism),又称逻辑主义、心理学派或计算机学派,其原理主要为物理符号系统假设(即符号操作系统)和有限合理性原理,如图1所示。(2)连接主义(connectionism),又称仿生学派或生理学派,其原理主要为神经网络及神经网络间的连接机制与学习算法,如图2所示。(3)行为主义(actionism),又称进化主义或控制论学派,其原理主要为控制论及“感知—动作”型控制系统,如图3所示。图1符号主义图2连接主义图3行为主义1.3人工智能的三大学派1.3.1符号主义符号主义认为人类认知和思维的基元是符号,认知过程是符号操作过程。也就是说,它致力于将人类的认知和思维用某种符号来描述,并把这种符号输入到计算机中,从而模拟人类的认知过程,实现人工智能。其代表人物有赫伯特·西蒙(HerbentSimon)和艾伦·纽厄尔(AllenNewell),如下图所示。赫伯特·西蒙艾伦·纽厄尔1.3人工智能的三大学派符号主义是一种基于逻辑推理的智能模拟方法。符号主义认为人工智能源于数理逻辑。20世纪30年代,数理逻辑开始用于描述智能行为。计算机的出现推动了逻辑演绎系统的实现,表明了计算机可以用于研究人的思维过程和模拟人类智能活动。后来相继发展的启发式算法、专家系统和知识工程理论与技术,都为人工智能的发展做出了重要贡献。符号主义是传统人工智能的主流学派,在人工智能中一直处于主导地位。符号主义近期的代表作是知识图谱。知识图谱也称为“语义网络”,它是把所有不同类型的信息连接在一起而得到的一个关系网络,是一种基于图的数据结构。知识图谱可应用于金融风控场景。例如,企业知识图谱分析平台HyperGraph,它是联想公司自主开发的,集大规模图数据库、高性能计算引擎和丰富图形展示于一体的企业级知识图谱分析与展示平台。该平台可在秒级别对百亿千亿规模图数据进行实时分析和挖掘,为企业用户提供一个打通多源数据、深入理解数据内涵、构建企业知识体系的可视化分析工具。1.3人工智能的三大学派该平台通过可视化的方式发掘企业上下游关系、股东关联关系等,它支持风控和决策。例如,在乐视网出现资金链断裂的情况时,银行信贷部门或风险投资机构通过HyperGraph可以快速定位乐视网及其投资的关联公司,并抽取出乐视网相关联企业的画像,如图下图所示。通过画像,银行信贷部门或风险投资机构可以对风险传导路径有很直观的理解,从而能够及时规避相关的贷款或融资申请。除此之外,知识图谱还可以应用于商业智能、公安侦查、智慧医疗、互联网大数据分析等多个场景中。1.3人工智能的三大学派1.3.2连接主义连接主义认为人工智能源于仿生学,特别是人脑模型的研究,它主张模仿人类的神经元(见下图),用神经网络的连接机制实现人工智能。连接主义的代表性成果是MP模型,它从神经元开始进而研究神经网络模型和脑模型,开创了用电子装置模拟人类脑部结构和功能的新途径,同时开辟了人工智能新的发展道路。之后,由于当时的理论模型、生物原型和技术条件的限制,脑模型研究落入低潮;直到反向神经网络、支持向量机和深度学习概念的提出,神经网络又开始换发新一轮的生命。神经元1.3人工智能的三大学派1.3.3行为主义行为主义是一种基于“感知—动作”的行为模拟方法。行为主义认为,学习是刺激与反应之间的联结,行为是学习者对环境刺激所做出的反应。学习过程是渐进地尝试错误的过程,强化是学习成功的关键。例如,小孩子学走路的时候,走到凹凸不平的路面容易摔倒,摔倒后由于疼痛会哇哇大哭。类似的经历重复几次后会产生两种行为,一是避免走凹凸不平可能会导致摔倒的路;二是摔倒后无论疼不疼第一反应都是大哭。行为主义认为人工智能源于控制论。控制论把神经系统的工作原理与信息理论、控制理论、逻辑理论及计算机联系起来。这一学派的代表作品首推六足行走机器人(见下图),它可以视为新一代的“控制论动物”,是一个基于“感知—动作”模式的模拟昆虫行为的控制系统。六足行走机器人1.3人工智能的三大学派人工智能的三大学派从不同的侧面研究了人类的智能,与人脑的思维模型有着对应的关系。对其进行粗略的划分,可认为符号主义研究抽象思维,注重数学可解释性;连接主义研究形象思维,偏向于模仿人脑模型,更加感性;行为主义研究感知思维,偏向于应用和模拟。由此可见,人工智能的三大学派将长期共存与合作,取长补短,并走向融合和集成,共同为人工智能的发展做出贡献。人工智能的产业结构041.4人工智能的产业结构人工智能以爆炸式和碾压式的姿态进入了大众的视野,伴随着其理论的逐渐完善,人工智能的应用技术得到了飞速的发展。此外,人工智能的应用领域也越来越宽广了,大到城市的建设、交通的规划和环境的保护等,小到各种智能穿戴设备、智能手机和智能家居等。由此可见,人工智能时代的来临,不仅加速了技术的进步,还推动了产业和行业格局的变革。目前,人工智能的产业结构可分为3个层次,即基础支撑层、应用技术层和行业应用层,如下图所示。人工智能的产业结构1.4人工智能的产业结构基础支撑层可简称为基础层,它是人工智能产业的基础,主要包括人工智能的理论知识、物联网、云计算和大数据,用于研究软件系统和硬件设备,为人工智能产业提供理论支撑、土壤支撑、算力支撑和数据支撑。应用技术层可简称为技术层,它是人工智能产业的核心,主要包括视觉智能技术、听觉智能技术和认知智能技术,用于实现机器对外界的感知,即看懂、听懂外界的信息,进而使机器具备认知能力,即分析判断和决策行动的能力。行业应用层可简称为应用层,它是人工智能产业的延伸,主要面向人工智能与传统行业的深度融合,为人工智能在不同行业(如安防、教育、医疗、交通和零售等)的应用提供解决方案。人工智能基础与应用第二章人工智能的基础支撑导读随着信息时代的到来,人工智能的应用也逐渐渗入到人们的生活中。人工智能技术的实现与落地除了理论的支撑外,还有物联网、云计算和大数据的支撑。其中,物联网犹如土壤一般支撑着人工智能数据的采集与传输;云计算为人工智能的实现提供了算力支撑;大数据为人工智能算法的训练提供了海量的数据,为人工智能提供了数据支撑。本章将介绍人工智能的理论支撑、土壤支撑、算力支撑和数据支撑。学习目标掌握知识表示、确定性推理、搜索策略、不确定性推理、计算智能和机器学习等人工智能理论知识。掌握物联网的定义和基本特征。掌握云计算的定义、服务模型和服务部署模式。23掌握大数据的定义、结构和数据处理流程。41素质目标01研究人工智能的基础支撑,提升学生的知识水平,培养学生的钻研精神。02探究科技前沿知识,开阔学生视野,加强学生紧跟时代发展的意识。目录CONTENTS人工智能的理论支撑0102人工智能的土壤支撑03人工智能的算力支撑04人工智能的数据支撑人工智能的理论支撑012.1人工智能的理论支撑2.1.1知识表示人类的智能活动主要是获得并运用知识,即通过对外部世界进行观察等方式获得知识,然后运用知识做出正确的判断和决策,最后采取正确的行动。由此可见,知识是实现智能的基础。为了实现计算机模拟人类的智能行为,就需要将知识以适当的方式表示出来并存储于计算机中,因此,知识表示成了人工智能中一个十分重要的研究课题。人工智能的发展离不开理论的支撑,其理论知识包括知识表示、确定性推理、搜索策略、不确定性推理、计算智能和机器学习等。知识的概念知识是人类对自然世界、人类社会、思维方式及运动规律的认识与掌握;是人类在长期的生活及社会实践中、科学研究及实验中积累起来的经验;是人的大脑通过思考,把实践中获得的有关信息关联在一起形成的信息结构。2.1人工智能的理论支撑信息之间有多种关联形式,使用最广泛的一种是用“如果……,则……”表示的关联形式,它反映了信息间的因果关系。例如,人类经过多年的观察发现,每当大雨即将来临的时候,就会看到成群结队的蚂蚁在搬家(见右图),于是就把“蚂蚁搬家”和“大雨将至”这两个信息关联在一起,得到了相应的知识,即如果蚂蚁搬家,则大雨将至。蚂蚁搬家知识反映了客观世界中事物之间的关系,不同事物或者相关事物间的不同关系形成了不同的知识。例如,“海水是咸的”是一条知识,它反映了“海水”与“咸”之间的一种关系。又如,“如果天空中乌云密布,则有可能会下雨”是一条知识,它反映了“天空中乌云密布”与“有可能会下雨”之间的一种因果关系。在人工智能中,将前一种知识称为事实,而把采用“如果……,则……”关联起来所形成的知识称为规则。2.1人工智能的理论支撑知识是人类对客观世界认识的结晶,并且长期受到实践的检验。知识是人类世界特有的概念,从不同的角度可以将知识分成不同的类别。(1)从确定性划分,知识可分为确定性知识(如“雪是白色的”)和不确定性知识(如“明天可能会下雨”)。(2)从作用范围划分,知识可分为常识性知识(如“猴子有尾巴”)和领域性知识(如“计算机中央处理器的核心部件包括运算器和控制器”)。(3)从知识结构及表现形式划分,知识可分为逻辑性知识(如“如果你感觉喉咙肿痛,则有可能是扁桃体发炎了”)和形象性知识(如“地球仪是圆形的”)。(4)从知识的作用划分,知识可分为事实性知识(如“一年有12个月”)、过程性知识(如“汽车维修技术”)和控制性知识(如“搜索策略”)。2.1人工智能的理论支撑知识表示的概念知识表示(knowledgerepresentation)是将人类知识形式化或模型化。实际上,就是对知识的一种描述,或者说是一组约定,一种计算机可以接受的用于描述知识的数据结构。知识表示过程就是把知识编码成某种数据结构的过程。从某种意义上,可以将知识表示视为数据结构及其处理机制的综合,即知识表示=知识的数据结构+知识的处理机制知识表示方法知识表示方法有很多,比较常见的有一阶谓词逻辑表示法、状态空间表示法、产生式表示法、语义网络表示法和框架表示法等。一阶谓词逻辑表示法是一种重要的知识表示方法,它以数理逻辑为基础,采用谓词公式的形式表示知识。这种表示法表示的知识不仅与人类的自然语言比较接近,还便于存储到计算机中,从而实现计算机对知识的精确处理。2.1人工智能的理论支撑谓词公式,又称合式公式,是由谓词符号、常量符号、变元符号、函数符号,以及连接词、量词、括号、逗号等按照一定语法规则组成的字符串表达式。例如,“如果明天天气晴朗,则我会去室外玩耍”可表示为。状态空间表示法是基于解答空间的问题表示和求解方法,即通过在某个可能的解空间内寻找一个最优解来求解问题的方法。它是以状态和操作符为基础来表示和求解问题的。状态空间表示法思路简单、操作方便,适用于求解简单的问题。产生式表示法,又称产生式规则表示法,是由美国数学家波斯特(E.Post)于1943年提出的一种知识表示方法。它常采用“条件→结果”的形式描述事物间的因果关系。语义网络表示法是通过概念及语义关系(或语义联系)来表示知识的一种网络图。其中,语义网络由节点和节点间的弧组成。节点表示各种事物、概念、情况、属性、状态、事件和动作等;弧表示它所连接的节点间的各种语义关系。框架表示法是以框架理论为基础发展起来的一种结构化知识表示方法,现已在多种系统中得到了应用。该理论认为人的知识是以框架结构寄存在人脑中的,当人们面临新的情况,或对问题的看法有重要变化时,总是从自己的记忆中找出一个合适的框架,然后根据细节加以修改补充,从而形成对新事物的认识。2.1人工智能的理论支撑一般来说,同一知识可以有多种不同的表示形式,而不同的表示形式所产生的效果可能不同。因此,在选择知识表示方法时,应从以下几个方面进行考虑。(1)所选知识表示方法是否能充分表示领域知识。(2)所选知识表示方法是否有利于对知识进行使用。(3)所选知识表示方法是否便于知识的获取、组织、维护和管理。(4)所选知识表示方法是否便于理解和实现。2.1人工智能的理论支撑2.1.2确定性推理知识表示方法能够将知识以某种形式表示出来并存储到计算机中,而计算机真正的智能是其具有思维能力,即能运用知识进行推理来求解问题。推理的概念推理是指从已知事实出发,按照某种策略,运用已掌握的知识,推导出其中蕴含的事实性结论或归纳出某些新的结论的过程。推理所用的事实可分为两种:一种是推理前用户提供的与求解问题有关的初始证据;另一种是推理过程中所得到的中间结论,这些中间结论可以作为进一步推理的证据。通常,智能系统的推理过程由推理机来完成。所谓推理机就是智能系统中用来实现推理的那些程序。2.1人工智能的理论支撑推理方式及分类分类依据推理方式描述按推理时所用知识的确定性分类确定性推理推理时所使用的知识都是确定的,推出的结论也都是确定的,而且它们的真值非真即假,不会有第三种情况出现不确定性推理推理时所用的知识不都是确定的,推出的结论也是不确定的,它们的真值会位于真与假之间按推理的逻辑基础分类演绎推理一种从一般到个别的推理方式,即从已知的一般性知识出发,推出蕴含在已知知识中的适合于某种个别情况的结论归纳推理一种从个别到一般的推理方式,即从大量特殊事例出发,归纳出一般性结论的推理过程默认推理在知识不完全的情况下假设某些条件成立所进行的推理按推理过程中所推出的结论是否单调地增加分类单调推理在推理的过程中随着推理的向前推进及新知识的加入,推出的结论呈单调增加的趋势,并且结论越来越接近最终目标非单调推理在推理过程中由于新知识的加入,不仅没有加强已推出的结论,反而否定了它,使得推理退回到前面的某一步,然后重新开始推理按推理过程中是否运用与问题有关的启发性知识分类启发式推理在推理过程中,运用了与问题有关的启发性知识,如解决问题的策略、技巧及经验等,以加快推理过程,求得问题最优解非启发式推理在推理过程中,不运用启发性知识,只按照一般的控制逻辑进行推理表
推理方式的分类人类的智能活动有多种思维方式,相应地,对人类智能进行模拟的人工智能也有多种推理方式。下表从不同的角度对推理方式进行了分类。2.1人工智能的理论支撑常见的确定性推理有自然演绎推理和归结演绎推理。自然演绎推理自然演绎推理是指从一组已知为真的事实出发,直接运用命题逻辑或谓词逻辑中的推理规则推出结论的过程。其中,常用的推理规则有假言推理、拒取式推理和三段论式推理等。归结演绎推理在人工智能中,几乎所有的问题都可以转化成一个定理证明问题。对于定理证明问题,如果用一阶谓词逻辑表示的话,该问题的实质就是要求对前提P和结论Q证明是永真的。然而,要证明谓词公式的永真性,必须对谓词公式中变元个体域上的每个解释进行验证,这是极其困难的。为了简化问题,在推理时常采用归结演绎推理。归结演绎推理是一种基于归结原理的机器推理技术。实际上,它是一种基于逻辑的“反证法”,把关于永真性的证明转化为关于不可满足性的证明,即要证明
,永真,只要能够证明是不可满足的就可以了。2.1人工智能的理论支撑谓词公式的永真性:如果谓词公式P对个体域D上的任何一个解释都取真值T(真),则称P在D上是永真的;如果P在每个非空个体域上均永真,则称P永真。谓词公式的不可满足性:对于谓词公式P,如果至少存在一个解释使得公式P在此解释下的真值为T(真),则称公式P是可满足的,否则,则称公式P是不可满足的。
表示“P蕴涵Q”,可理解为“如果P,则Q
”;表示“P合取非Q
”,可理解为“P与非Q
”。2.1人工智能的理论支撑2.1.3搜索策略现实世界中多数问题都是非结构化的,一般不能用直接求解的方法来求解这样的问题,而只能利用已有的知识一步一步地摸索着前进。因此,常常使用基于搜索策略的方法来求解问题。搜索策略可看成是一种在状态空间图中寻找路径的方法,它是人工智能的基本求解策略之一,在人工智能领域具有广泛的应用。目前,广大学者们已提出了许多不同的搜索策略,根据搜索过程中是否运用与问题有关的信息,可以将这些搜索策略分为盲目搜索策略和启发式搜索策略。在人工智能中,通过运用搜索策略解决问题的基本思想是:首先把问题的初始状态(即起始节点)作为当前状态,选择适用的操作符对其进行操作,生成一组子状态(即后继节点),然后检查目标状态是否在其中出现。若出现,则搜索成功,找到了问题的解;若未出现,则按某种搜索策略从已生成的状态中再选一个状态作为当前状态。重复上述过程,直到目标状态出现或者不再有可供操作的状态及操作符为止。在运用搜索策略求解问题的过程中,涉及的数据结构除了状态空间图之外,还需要两个辅助的数据结构,即存放已访问但未扩展节点的OPEN表,以及存放已扩展节点的CLOSED表。2.1人工智能的理论支撑盲目搜索策略盲目搜索策略,又称无信息搜索策略,也就是说,在搜索过程中,只按照预先规定的搜索策略进行搜索,而没有任何中间信息来改变这些策略。常用的盲目搜索策略有宽度优先搜索和深度优先搜索等。(1)宽度优先搜索,又称广度优先搜索,其基本思想是从起始节点开始,逐层对节点进行扩展(或搜索),同时考察它是否为目标节点。例如,如图1所示的搜索树,其搜索顺序应为A→B→C→D→E→F→G→H。(2)深度优先搜索的基本思想是从起始节点开始,在其子节点中选择一个节点进行考察,如果不是目标节点,则在该子节点的子节点中选择一个节点进行考察,一直如此向下搜索,如果发现不能到达目标节点,则返回到上一个节点,然后选择该节点的另一个子节点往下搜索,如此反复,直到搜索到目标节点或搜索完全部节点为止。例如,如图2所示的搜索树,其搜索顺序应为A→B→D→H→E→C→F→G。图1
宽度优先搜索图2深度优先搜索2.1人工智能的理论支撑启发式搜索策咯启发式搜索策略,又称有信息搜索策略,是指在搜索过程中,利用与问题有关的信息,引导搜索朝最有利的方向进行,从而加快搜索的速度,提高搜索效率。常用的启发式搜索策略有A搜索和A*搜索。启发式搜索策略的主要依据是问题自身的启发性信息。启发性信息是指可确定搜索方向,简化搜索过程,且可反映问题特性的控制性信息。启发性信息又是通过估价函数而作用于搜索过程的。估价函数常用于估计节点的代价,即通过充分利用启发性信息估计出经过当前节点搜索到目标节点的代价。2.1人工智能的理论支撑估计一个节点的价值,必须考虑两个重要的因素,即已经付出的代价和将要付出的代价。因此,可将估价函数定义为从初始节点S0出发,经过节点n到达目标节点G的所有路径中最优路径的代价估计值。其一般形式为
其中,表示从初始节点S0到达中间节点n的实际代价。的值是从节点S0到节点n的最优路径上所有有向边的代价之和。
表示从中间节点n到目标节点G的最优路径的估计代价。这种估计主要是源于对问题自身特性的认识,依据这些特性加快搜索的速度,体现了问题自身的启发性信息。因此,可称为启发函数。2.1人工智能的理论支撑2.1.4不确定性推理不确定性推理是从不确定的初始证据(即已知事实)出发,通过运用不确定的知识(或规则),最终推出具有一定程度的不确定性但却合理或近乎合理的结论的思维过程。不确定性推理的方法有多种,其分类如下图所示。不确定性推理方法模型方法控制方法数值方法非数值方法基于概率的方法可信度方法证据理论方法主观贝叶斯方法基于模糊理论的方法模糊推理方法语义网络推理框架推理启发式搜索相关性制导回溯机缘控制图不确定性推理方法分类2.1人工智能的理论支撑下面简单介绍一下可信度方法和证据理论方法。可信度方法在实际生活中,人们可以利用从客观世界认识过程中积累的经验,判断观察到的某一件新事物或现象的真假或为真的程度。例如,人们观察天空中乌云的情况,可根据以往经验判断会不会下雨。根据经验判断事物或现象为真的相信程度称为可信度。可信度方法是在确定性理论的基础上,结合概率论等理论提出的一种不确定性推理模型。它的推理模式合理有效,因此广泛应用于专家系统等领域。可信度具有较大的主观性和经验性,常由领域内的专家给出。由于领域内的专家具有丰富的专业知识和实践经验,因此他们给出的可信度是值得相信的。证据理论方法证据理论方法,又称D-S理论,是登普斯特(Dempster)首先提出,谢弗(Shafer)实现进一步发展的不确定性推理方法。证据理论能够区分“不确定”和“不知道”的差异,并能处理由于“不知道”带来的不确定性,具有较大的灵活性。因此,证据理论方法受到了人们的广泛关注。2.1人工智能的理论支撑2.1.5计算智能计算智能(computationalintelligence,CI)是人们受自然规律和生物智能机制的启迪,根据其原理模仿设计的一组算法,用于解决复杂的现实世界问题。目前,计算智能还没有统一的定义,下面列举部分学者对计算智能的不同描述。计算智能主要是借鉴仿生学的思想,基于人们对生物体智能机制和自然规律的认识,采用数值计算的方法去模拟和实现人类智能、生物智能和自然规律。计算智能是依靠生产者提供的数值数据进行加工处理,而不是依赖于知识。计算智能是一种智力方式的低层认知,只处理数值数据,而人工智能是一种智力方式的中级认知,可以处理符号形式的知识。如果一个系统仅处理底层的数值数据,含有的模式识别部分,没有使用人工智能意义上的知识,且具有计算适应性、计算容错性、接近人的计算速度和近乎人的误差率这4个特性,则该系统是智能计算系统。计算智能是一种以模型(包括数字模型和计算模型)为基础,以分布和并行计算为特征的自然智能模拟方法。2.1人工智能的理论支撑计算智能的研究与发展反映了当代科学技术多学科交叉融合发展的重要趋势。根据算法设计依据的原理不同,可将计算智能分为进化计算、群体智能、神经计算、模糊计算、免疫计算和人工生命等,如图下图所示。图
计算智能的分类2.1人工智能的理论支撑下面简单介绍一下进化计算和群体智能。进化计算进化计算,又称演化计算,是一种通过模拟生物进化机制而设计的具有高鲁棒性和广泛性的全局优化方法。它具有自组织、自适应、自学习的特性,能够不受问题性质的限制,有效地处理传统优化算法难以解决的复杂问题。进化计算是采用简单的编码技术来表示各种复杂的结构,并通过简单的遗传操作和优胜劣汰的自然选择来指导学习和确定搜索的方向。进化计算是一个“算法簇”,包括遗传算法、遗传规划、进化策略和进化规划等。其中,遗传算法是最初形成的一种最具影响力的模拟生物进化的优化算法。遗传算法(geneticalgorithm,GA)是模仿生物遗传学和自然选择机理而设计的计算模型,是人工构造的一种搜索最优解的方法。它常用于处理传统算法难以解决的复杂和非线性优化问题。2.1人工智能的理论支撑群体智能群体智能是一种受自然界生物群体的智能现象启发而提出的智能优化方法,是计算智能领域的关键技术之一。图常见的群体智能算法群体智能的概念来自对蚂蚁、蜜蜂等自然界中群居生物群体行为的观察和模拟。例如,通过观察蚂蚁寻找路径的行为提出蚁群算法,通过观察蜜蜂繁殖、采蜜等行为提出蜂群算法,通过观察鸟群的捕食行为提出粒子群算法,等等。常见的群体智能算法还有很多,如右图所示。2.1人工智能的理论支撑群体智能也是指无智能或者仅具有相对简单智能的个体通过合作表现出复杂智能行为的特性。其中,无智能或仅具有简单智能是相对于群体合作表现出来的智能而言的。群体智能是在模拟自然界群体生存现象的基础上,运用一定的数学手段和计算工具,设计相应的算法模型,为解决系统中的复杂行为提供了新的思路。它主要有以下4个特点。控制是分布式的,不存在控制中心。它能够适应当前网络环境下的工作状态,并且具有较强的鲁棒性,同时不会由于某一个或几个个体出现故障而影响整个问题的求解。扩充性较好。群体中个体通过改变环境实现相互通信,随着个体数目的增加,这种非直接通信的方式缓解了通信开销的增幅。因此,群体智能具有较好的扩充性。具有简单性。群体中每个个体的能力或遵循的行为规则非常简单,因而群体智能的实现比较方便和简单。具有自组织性。群体表现出来的复杂行为是通过简单个体的交互过程突显出来的智能。因此,群体智能具有自组织性。2.1人工智能的理论支撑2.1.6机器学习机器学习(machinelearning)是通过各种算法从数据中学习如何完成任务,并获得完成任务方法的一门学科。它可以对数据进行自动分析,并从中获得规律或模型,然后利用规律或模型对未知数据进行预测。它是人工智能的核心,是使计算机具有智能的重要途径。目前,机器学习还没有一个公认且准确的定义,下面列举了部分学者对机器学习的描述。机器学习是研究如何用机器模拟人类学习活动的一门学科。机器学习是研究机器如何获取新知识和新技能,并识别现有知识的学科。机器学习是研究机器如何模拟人类的学习活动,自主获取新知识和新技能,不断提升系统性能的学科。机器学习的基本思路就是使用一定的算法解析训练数据(进行模型训练);然后学习数据中存在的一些特征,得到模型;最后使用得到的模型对实际问题做出分类、决策或预测等。2.1人工智能的理论支撑机器学习有很多种学习方法,从不同的角度,根据不同的方式,可以将其划分为不同的类别,如下表所示。分类方式分类描述按学习
形式分类有监督学习从含有标签的数据集中推出一个功能的学习方法无监督学习从不含标签的数据集中推出一个功能的学习方法半监督学习综合利用有标签的数据和无标签的数据,生成合适的函数强化学习以环境反馈(奖惩信号)作为输入,以统计和动态规划技术为指导的一种学习方法按学习
目标分类概念学习学习的目标和结果为概念,典型的概念学习有示例学习规则学习学习的目标和结果为规则,典型的规则学习有决策树学习函数学习学习的目标和结果为函数,典型的函数学习有神经网络学习类别学习学习的目标和结果为对象类别,典型的类别学习有聚类分析按学习
方法分类机械式学习通过直接记忆或外部提供的信息达到学习的目的指导式学习由外部环境向系统提供指示或建议示例学习通过从环境中获取若干与某知识有关的例子,经归纳得到一般性知识类比学习把两个事物进行比较,找出它们在某一抽象层上的相似关系,并以这种关系为依据,把某一事物的有关知识加以适当整理,然后对应到另一事物,从而获得求解另一事物的知识解释学习在领域知识指导下,通过对单个问题求解实例的分析,构造出求解过程的因果解释结构,并获取控制知识,便于指导以后求解类似问题按推理
方式分类基于演绎的学习以演绎推理为基础的学习基于归纳的学习以归纳推理为基础的学习表机器学习的分类2.1人工智能的理论支撑其中,有监督学习和无监督学习是机器学习中常用且易懂的方法,下面将详细介绍这两种机器学习方法。有监督学习有监督学习是一种比较简单且直接的机器学习方式,它是利用含有标签的数据集对学习模型进行训练,然后得到预测模型,最后利用测试集对预测模型的性能进行评估的学习方法。有监督学习也可理解为“跟着老师学”,即在有老师的环境下,学生跟着老师学习知识,待他们掌握之后,再使用新的数据测试学生的认知水平。例如,老师拿两张猫咪图片,教小朋友认识猫咪,小朋友结合图片中猫咪的外在特征和老师的讲解认识猫咪,然后老师再拿出一张新的图片,询问小朋友图片中是什么动物,如右图所示。图
有监督学习2.1人工智能的理论支撑机器学习中,采用有监督学习方法建模的任务有分类任务和回归任务。(1)分类任务通常用于将事物打上一个标签,结果为离散值。例如,判断一幅图片上的动物是猫还是狗。分类的最终正确结果只有一个,错误的就是错误的,不会有相近的概念。分类是通过在已有数据的基础上进行学习,推导出一个分类函数或构造出一个分类模型,该函数或模型可以将待分类的数据集映射到某个给定的类别中,从而实现数据分类。其中,分类函数或分类模型也称为分类器。2.1人工智能的理论支撑在机器学习领域中,分类任务的实现需要先确定一个分类函数或模型,类似于数据样本中的分界线,然后对输入的新数据进行预测,即根据分界线对新数据进行分类,如下图所示。图
分类任务图中,实心的正方形和圆表示带有标签的训练数据;分界线表示经过训练后获得的分类函数或分类模型;空心的正方形和圆表示输入的新数据。分类任务中常用的核心算法有K近邻分类算法、决策树分类算法、贝叶斯分类算法、支持向量机分类算法和人工神经网络等。2.1人工智能的理论支撑(2)回归任务通常用来预测一个值,如预测房价、预测股价等。若一个产品的实际价格为500元,通过回归分析预测值为499元,则认为这是一个比较好的回归分析。回归是对真实值的一种逼近预测。回归是通过已有数据进行学习,拟合出一个回归函数或构造出一个回归模型,该函数或模型可以将待测试的数据集映射到某个给定的值,从而实现数据预测。2.1人工智能的理论支撑在机器学习领域中,回归任务的实现需要先对数据样本点进行拟合,再根据拟合出来的函数对输入的新数据进行输出预测,如下图所示。图
回归任务图中,圆表示带有标签的训练数据;回归曲线表示经过训练后获得的回归函数或回归模型。若该回归任务表示对商品价格走势的预测(x表示年份,y表示商品价格),则由回归函数可以预测未来某年的商品价格。回归任务中常用的核心算法有K近邻回归算法、决策树回归算法、贝叶斯回归算法、支持向量机回归算法和人工神经网络等。2.1人工智能的理论支撑无监督学习无监督学习是在没有标签的数据集里发现数据之间潜在关系的学习方法。例如,根据聚类或一定的模型得到数据之间的关系。无监督学习是一种没有明确目的的学习方法,无法提前知道结果,且它的学习效果几乎无法量化。无监督学习也可理解为“自学成才”,即在没有老师的环境下,学生自己观察事物的特征,将特征相似的事物聚成一类,并为该类取一个名字,当学生再次遇到相似的事物时,自然会将该事物和前面的事物归为一类。例如,学生看到几只动物,观察发现它们的外部特征相似,便将它们归为一类,并取了一个类名——“狗狗”,之后学生再看到这种动物,自然就将它归类于“狗狗”了,如右图所示。图
无监督学习2.1人工智能的理论支撑机器学习中,采用无监督学习方法建模的任务有聚类任务。聚类任务是指根据输入的特征向量寻找数据(没有标签)的规律,并将类似的样本汇聚成类,如下图所示。聚类任务常用于对目标群体进行多指标划分。例如,现有多个客户的购物记录数据,且未对数据进行标记,通过聚类任务将具有相同购物习惯的客户汇聚成类,不同类中的客户购买的商品种类不同,店铺运营即可根据该反馈信息向客户推荐相关商品。图聚类任务2.1人工智能的理论支撑聚类是按照某个特定标准把一个数据集分割成不同的类,使得同一个类内的数据对象之间相似性尽可能大,同时不在同一个类中的数据对象之间差异性也尽可能大。可见,聚类后同一类的数据尽可能聚集到一起,不同类数据尽量分离。聚类任务中常用的算法有很多,如划分聚类方法、层次聚类方法、基于密度的方法、基于网格的方法和基于模型的方法等。人工智能的土壤支撑022.2人工智能的土壤支撑物联网(internetofthings,IoT)的理念最早是由比尔•盖茨于1995年出版的《未来之路》一书中提及。在《未来之路》中,比尔•盖茨已经提及物物互联的构想,只是当时受限于无线网络、硬件及传感设备的发展,物联网并未引起世人的重视。但是,“物联网”的种子却已经深深地埋在了世人的心中。之后,随着互联网技术和硬件设备的逐渐提升,埋藏在世人心中的“物联网”种子在信息技术发展的浇灌下,开始生根发芽,并逐渐成长为参天大树。如今,物联网作为新一代信息技术的典型代表,在全球范围内呈现出爆发式增长的状态,不同行业和不同类型的物联网应用为人们开启了万物互联的时代。下图展示了物联网的主要应用场景。智能家居智能交通智能农业智慧城市食品安全环境监测2.2人工智能的土壤支撑从物联网的应用场景可以看出,智能世界的构建离不开物联网的支持。物联网需要利用人工智能技术实现智能化数据采集,同时物联网也犹如土壤一般支撑着人工智能的实现与落地。2.2.1什么是物联网1999年,美国麻省理工学院的专家们认为,物联网就是将所有物品通过射频识别(radiofrequencyidentification,RFID)等信息传感设备与互联网连接起来,实现智能化识别和管理的网络。2005年,国际电信联盟(internationaltelecommunicationunion,ITU)对物联网的含义进行了扩展,它认为信息与通信技术的目标已经从任何时间、任何地点连接任何人,发展到连接任何物品的阶段,而万物的连接就形成了物联网。也就是说,物联网是对物体具有全面感知能力,对信息具有可靠传输和智能处理能力的连接物体与物体的信息网络。2009年9月,欧盟相关组织发布了《物联网战略研究路线图》,报告中指出:物联网是未来Internet的一个组成部分,可以被定义为基于标准的和可互操作的通信协议且具有自配置能力的动态的全球网络基础架构。物联网中的“物”都具有身份标识、物理属性和实质上的个性,通过智能接口实现与信息网络的无缝整合。2.2人工智能的土壤支撑我国有学者认为,物联网是一种“泛在网络”,就是利用互联网将世界上的物体都连接在一起,使世界万物都可以上网。具体可以理解为:通过射频识别装置、红外感应器、全球定位系统、激光扫描器等各种装置与互联网结合成一个全新的巨大网络,将现有的互联网、通信网、广电网及各种接入网和专用网连接起来,实现智能化识别和管理。2010年,我国政府工作报告所附的注释中对物联网有如下说明:物联网是指通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。它是在互联网基础上延伸和扩展的网络。中国国家标准GB/T33745-2017《物联网术语》对物联网的定义为:物联网是指通过感知设备,按照约定协议,连接物(即物理实体)、人、系统和信息资源,实现对物理和虚拟世界的信息进行处理并做出反应的智能服务系统。国内普遍引用的物联网定义为:物联网是通过信息传感设备,按照约定的协议,把任何物品与互联网连接起来,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。2.2人工智能的土壤支撑根据物联网的定义,可以从技术和应用两个方面对其进行理解。技术理解。物联网是将物体的信息利用感应装置,经过传输网络,到达指定的信息处理中心,最终实现物与物、人与物的自动化信息交互与处理的智能网络。应用理解。物联网是把世界上所有的物体都连接到一个网络中,形成“物联网”,然后又与现有的互联网相连,实现人类社会与物体系统的整合,并采用更加精细和动态的方式去管理生产和生活。简而言之,物联网就是“物物相连的互联网”。在这个网络中,物体之间能够彼此进行“交流”,且无须人工干预。2.2人工智能的土壤支撑2.2.2物联网的基本特征物联网具备3个基本特征,即全面感知、可靠传输和智能处理。全面感知全面感知是指利用传感器、射频识别、定位器和二维码等手段随时随地对物体进行信息采集和获取。物联网为每一件物体植入了一个“能说会道”的高科技感应器,这样冷冰冰的、没有生命的物体就可以变得“有感受、有知觉”。例如,洗衣机可以通过物联网感应器“知晓”衣服对水温和洗涤方式的要求。射频识别、红外感应器、全球定位系统、激光扫描器等信息传感设备,就像视觉、听觉和嗅觉器官对于人的重要性一样,它们是物联网不可或缺的关键元器件。有了它们,不同物体之间才可以实现近/远距离、无接触和自动化感应,才能读取数据、发送数据等。物联网之所以又称传感器网络,就是因为传感设备在网络中起到了关键作用。2.2人工智能的土壤支撑可靠传输可靠传输是指通过各种网络与互联网的融合,对接收到的感知信息进行实时远程传输,实现信息的交互和共享,并进行各种有效的处理。在传输过程中,通常需要用到现有的网络,包括无线和有线网络。由于传感器网络只是一个局部的无线网,因此移动通信网(如5G、4G网络)自然就成为物联网的一个有力支撑。物联网与移动网络相结合,使人们的生活更加便捷,同时也大大改变了人们的生活方式。例如,人们可以通过手机远程控制家中摄像头、空调、台灯的开启和运行状态,调整它们的参数(方位、温度、亮度等),从而实现随时随地控制,既安全又节能。2.2人工智能的土壤支撑智能处理智能处理是指利用人工智能、云计算和数据挖掘等各种智能计算技术,对随时接收到的跨地域、跨行业、跨部门的海量数据进行分析和处理,提升对物理世界、经济社会各种活动和变化的洞察力,实现智能化的决策和控制。物联网通过感应芯片和射频识别装置等时时刻刻获取人和物体的最新特征、位置和状态等信息,这些信息将使网络变得更加“博闻广识”。更为重要的是,利用这些信息,人们可以开发出更高级的软件系统,使机器能变得和人一样“聪明睿智”,不仅可以眼观六路、耳听八方,还会思考、联想。例如,当人们行驶在路上时,只需要通过联网的手机就可以了解实时路况,从而绕开拥堵路段。物联网是一个智能的网络,面对采集的海量数据,必须通过智能分析和处理才能实现智能化。人工智能的算力支撑032.3人工智能的算力支撑云计算(cloudcomputing)的思想起源于1961年约翰•麦卡锡(JohnMcCarthy)提出的“效用计算”概念。此后,云计算经历了一系列演变和发展,并逐渐在众多领域获得了广泛的应用。2.3.1什么是云计算云计算是一个广泛的概念,不同机构和个人对云计算的定义不尽相同。下面列举几种常见的定义。在人工智能领域,云计算支撑了人工智能和大数据之间的数据获取、计算和存储等任务的进行,从而促进了信息化和智能化服务的实现。由此可见,云计算不仅是人工智能与大数据之间的桥梁,还是人工智能的基础计算平台,更是人工智能的算力支撑。(1)亚马逊公司的AWS官方网站对云计算的定义:云计算是基于“按需付费定价(pay-as-you-gopricing)”模式的IT资源交付服务。通过AWS这样的云计算服务提供商,用户可根据需要购买诸如计算能力、存储和数据库等IT资源,而无须再购买和维护物理数据中心和服务器。2.3人工智能的算力支撑(2)阿里巴巴公司的阿里云官方网站对云计算的定义:云计算是通过网络按需分配计算资源。计算资源包括服务器、数据库、存储、平台、架构及应用等。云计算支持按用量付费,即用户只需支付自己需要的量。(3)美国国家标准与技术研究院(nationalinstituteofstandardsandtechnology,NIST)对云计算的定义:云计算是一种模型,用于实现对可配置计算资源共享池便捷按需的网络访问。该共享池中的计算资源包括网络、服务器、存储、应用程序和服务等,这些资源可以快速地获取和释放,同时管理成本极低,而且与服务提供商的沟通成本基本为零。(4)我国工业和信息化部电信研究院发布的《云计算白皮书(2012年)》中对云计算的定义:云计算是一种通过网络统一组织和灵活调用各种信息与通信技术(informationandcommunicationstechnology,ICT)资源,实现大规模计算的信息处理方式。云计算利用分布式计算和虚拟资源管理等技术,通过网络将分散的ICT资源(包括计算与存储、应用运行平台、软件等)集中起来形成共享的资源池,并以动态按需和可度量的方式向用户提供服务。用户可以使用各种形式的终端(如PC、平板电脑、智能手机、智能电视等)通过网络获取ICT资源服务。上述各定义,虽然侧重点不同,但互不冲突。总的来说,云计算就是一种基于Internet的超级计算模式,在远程数据中心里,成千上万台计算机和服务器设备连接成一片云,用户通过计算机、手机等接入数据中心,进行按需的网络访问。2.3人工智能的算力支撑2.3.2云计算服务模型云计算服务,即云服务,是指将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池,向用户提供服务。用户通过网络按照自己的需求获得资源和服务。一般来说,云计算服务模型可分为3种,即基础设施即服务(infrastructureasaservice,IaaS)、平台即服务(platformasaservice,PaaS)和软件即服务(softwareasaservice,SaaS)。2.3人工智能的算力支撑基础设施即服务IaaS是一种将服务器、存储器、网络设备等IT基础设施虚拟化,并通过Internet租给用户的云计算服务模型。IaaS的主要对象是需要硬件资源的用户,其关键技术是虚拟化技术。右图展示了某用户使用IaaS云服务的大致过程。与传统的企业数据中心提供的服务相比,IaaS具有使用灵活、运维成本低、自助服务、计费透明和可靠性高等特点。图
某用户使用IaaS云服务的大致过程2.3人工智能的算力支撑平台即服务PaaS是一种将应用的开发、管理和运行环境集成并打包成按需付费的服务后,通过Internet租给用户的云计算服务模型。PaaS的主要对象是应用程序开发人员,其关键技术是分布式技术。右图展示了某用户使用PaaS云服务的大致过程。PaaS不仅具有部署开发环境简单、代码实时托管、服务丰富、维护方便等特点,还有助于节省应用程序开发人员的时间。因此,越来越多的开发人员选择在PaaS云服务提供的平台上开发和测试应用程序。图
某用户使用PaaS云服务的大致过程2.3人工智能的算力支撑软件即服务SaaS是一种将开发好的软件系统作为按需付费的服务,并通过Internet提供给用户的云计算服务模型。SaaS的主要对象是需要软件服务的企业、组织或个人,其关键技术是Web技术。下图展示了某企业申请SaaS云服务的大致过程。图某企业申请SaaS云服务的大致过程2.3人工智能的算力支撑2.3.2云计算服务部署模式云计算服务的部署模式主要包括4种,即公有云、私有云、社区云和混合云。公有云公有云(publiccloud)是云服务提供商对外提供的公共云服务部署模式。云服务提供商在对公有云的基础架构进行预配置后,通过Internet以免费或按需付费的方式提供给企业、组织和个人公开使用。公有云可由企业、学术机构、政府机构或它们的联合体所拥有、管理和运营,其简单视图如右图所示。图公有云对于用户而言,公有云具有成本低、可用性强和管理方便等优点,但由于数据并不存储于本地的数据中心,因此安全性和隐私性存在一定风险。2.3人工智能的算力支撑私有云私有云(privatecloud)是指某企业或组织专属的云服务部署模式,私有云拥有者对私有云具有完全的访问和控制权限,而未授权的用户则无法获取私有云的任何信息,更无法使用私有云提供的任何服务。根据承运者的不同,私有云可分为本地私有云(on-siteprivatecloud)和外包私有云(out-sourcedprivatecloud)两种。本地私有云(见图1)是指基础设施和组织架构均由企业自行搭建和维护的私有云;外包私有云(见图2)是指由第三方云服务提供商为企业搭建和维护的私有云。图1本地私有云图2外地私有云与公有云相比,私有云具有更好的隐私性和安全性,适合对自身数据安全要求较高的企业使用。但私有云的成本要远高于公有云,故个人用户一般很少选择私有云。2.3人工智能的算力支撑社区云社区云(communitycloud)是面向某社区中所有成员的云服务部署模式。“社区”是指由一组云消费者组成的集体,社区中的各成员共同制定了安全和隐私政策并统一遵守。社区云仅对社区内的各成员开放,且分为本地社区云和外包社区云两种。私有云与社区云的区别在于,私有云的服务对象是单个云消费者,而社区云的服务对象则是一组云消费者。混合云混合云(hybridcloud)是指由两个或多个不同的云计算服务部署模式(如公有云、私有云或社区云)组成的云服务获取平台。它并不是上述云的简单组合,而是云服务提供商根据企业实际情况定制的个性化云计算服务部署模式。人工智能的数据支撑042.4人工智能的数据支撑大数据(bigdata)为人工智能的实现提供了数据支撑,其战略意义不在于拥有海量的数据信息,而在于对这些含有知识的数据进行专业化处理。从技术上看,人工智能、物联网、云计算和大数据的关系是密不可分的,它们之间的联系如下图所示。其中,人工智能依托大数据的海量数据信息和云计算平台进行学习与反馈,从而实现真正的机器智能;物联网需要利用人工智能技术控制智能设备采集数据,智能设备又会产生海量数据,海量数据必然无法用单台计算机进行处理,必须采用分布式架构,分布式架构又离不开云计算平台的支持;大数据依托云计算的分布式处理、分布式数据库、云存储技术和虚拟化技术,并采用人工智能技术对海量数据进行分布式数据挖掘,进而得到有价值的信息。2.4人工智能的数据支撑2.4.1什么是大数据大数据,又称巨量资料,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。IBM公司将大数据的特征归纳为5个V,如右图所示。图大数据的特征Volume(大量)是指海量的数据规模,即大数据巨大的数据量。Velocity(高速)是指快速的数据流转,可以理解为数据的实时获取、处理和分析。Variety(多样)是指多样的数据类型。Value(价值)是大数据的最终意义,但是大数据的价值密度低,人们必须合理运用大数据,才能从数据中获取有效信息,从而实现以低成本获取高价值。Veracity(真实性)是指数据的真实性和安全性。2.4人工智能的数据支撑互联网搜索引擎是大数据最为典型的应用之一。例如,百度日处理数据量达到数十PB,并呈现高速增长的态势,如果一张光盘容量为1GB,这相当于垒在一起的几千万张光盘。又如,微软Bing(必应)搜索引擎,一周需要响应100亿次量级的搜索请求;通过和Facebook的合作,每天有超过10亿次的社交网络搜索请求通过Bing来处理。大数据最小的单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB和DB。1Byte=8bit 1KB=1024Bytes1MB=1024KB 1GB=1024MB1TB=1024GB 1PB=1024TB1EB=1024PB 1ZB=1024EB1YB=1024ZB 1BB=1024YB1NB=1024BB 1DB=1024NB2.4人工智能的数据支撑2.4.2大数据的结构随着云时代的来临,大数据吸引了越来越多学者的关注,它的结构类型有3种,即结构化数据、非结构化数据和半结构化数据。结构化数据也可称为行数据,是指存储在数据库里,可以用二维表结构进行逻辑表达和实现的数据,如企业ERP、财务系统数据库等。非结构化数据是指数据结构不规则或不完整,不方便用二维表表示的数据。例如,视频、音频、图片、图像、文档和文本等都是非结构化形式的数据。半结构化数据是指介于结构化数据和非结构化数据之间的数据,如邮件、HTML、报表和资源库等。其中,非结构化数据逐渐成了数据的主要部分。据互联网数据中心的调查报告显示,企业中80%的数据都是非结构化数据,并且这些非结构化数据还在逐年增长。2.4人工智能的数据支撑2.4.3数据处理流程数据处理流程一般包括数据采集、数据预处理、数据存储与管理、数据挖掘与分析和数据展示与应用,如下图所示。图数据处理流程数据采集数据采集,又称数据获取,它是数据挖掘和分析的基础。数据采集的对象可以是监测的物理量,如温度、湿度、水位和风力等;也可以是各类影音图文信息,如图像、音频和文本等。数据采集所使用的工具有摄像头、传声器和监测器等。2.4人工智能的数据支撑数据预处理数据预处理是指对收集的数据进行分类或分组前,做审核、筛选或排序等必要的处理,主要完成对已接收数据的标注、辨析、抽取和清洗等操作。现实世界中的数据大体上都是不完整、不一致的“脏”数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提高数据挖掘的质量,人们常采用数据预处理技术提前对数据进行处理。数据的预处理有多种方法,如数据清理、数据集成、数据变换和数据归约等。这些数据预处理技术在数据挖掘之前使用,可以大大提高数据挖掘模式的质量,降低实际挖掘所需要的时间。大数据是人工智能的“燃料”,是机器实现智能行为的必要条件。在人工智能领域,数据需要经过筛选和标记之后才能用于训练智能算法,从而实现智能行为。常见的数据标注方向有语音标注、图像标注和文本标注等。2.4人工智能的数据支撑数据存储与管理数据存储与管理是指用存储器把采集到的数据存储起来,并建立相应的数据库,对数据进行管理和调用。它主要解决数据的可存储、可表示、可处理、可靠性及有效传输等多个关键问题。数据挖掘与分析数据挖掘是从大量的、不完全的、有噪声的、模糊的和随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据分析是用适当的统计分析方法对收集来的大量数据进行分析,并采用提取有用信息和形成结论的方式对数据加以详细研究和概括总结的过程。简而言之,数据分析就是对规模巨大的数据进行分析,然后找出数据中隐含的规律或价值。2.4人工智能的数据支撑数据展示与应用数据展示主要是通过图表、文字等多种形式将数据的分析结果呈现出来。数据可视化是数据展示的一种关键技术,其主要是借助图形化手段,清晰有效地传达有效信息。由于海量数据关联分析所涉及的信息比较分散,数据结构也有可能不统一,人们借助功能强大的可视化数据分析平台,可将数据进行关联分析,并做出完整的分析图表,简单明了、清晰直观,更易于人们接受。目前,大数据已经广泛地应用于多个领域,如商业智能、政府决策和公共服务等。人工智能基础与应用第三章人工智能的应用技术导读人们主要通过视觉和听觉感知外界信息,然后由大脑对这些信息进行认知。在人工智能领域中,机器利用图像识别等技术“看”世界万物,采用语音识别等技术“听”外界的信息,使用自然语言处理和知识图谱等技术“思”万物之间的内涵。本章将介绍实现机器“看”世界、机器“听”声音、机器“思”内涵的技术,并分别设置实践体验,拉进理论知识与实践应用的距离。学习目标
熟悉图像识别、人脸识别和文字识别等机器“看”世界技术。熟悉语音识别、声纹识别等机器“听”声音技术。熟悉自然语言处理、知识图谱等机器“思”内涵技术。231素质目标01熟悉人工智能的应用技术,拓展学生的视野,增加学生的知识储备。02探究应用实践背后的技术原理,培养学生的钻研精神。
03体验技术新科技,激发学生的学习兴趣和创新思维。目录CONTENTS机器“看”世界0102机器“听”声音03机器“思”内涵机器“看”世界013.1机器“看”世界对于人们而言,可以通过眼睛看世界。要想让机器像人们一样具有“看”世界的能力,计算机就需要具备视觉感知力。计算机视觉(computervision,CV)是一门研究如何使机器“看”的学科,它属于人工智能中的视觉感知智能范畴。从人类视觉系统的角度出发,计算机视觉可形象地理解为给机器安装上“眼睛”(指摄像机等成像设备)和“大脑”(指某些智能算法),让计算机能够感知外界环境,从而实现机器“看”世界。从工程应用的角度出发,计算机视觉是指将从成像设备中获得的图像或视频进行处理、分析和理解等。计算机视觉的目标是对环境的理解和表达,核心问题是研究如何对输入的图像信息进行组织,对物体和场景进行识别,进而对图像内容给予解释。目前,实现机器“看”世界的技术有很多,其中,人们接触最多的技术有图像识别、人脸识别和文字识别。3.1机器“看”世界3.1.1图像识别图像识别是利用计算机智能算法对数字图像进行处理、分析和解释,以达到识别各种不同状态的目标和对象的技术。它的主要用途就是利用计算机对图像进行加工处理,以得到某些预期的效果,然后从中提取有用的信息,实现计算机对事物或现象的分析、描述、判断和识别。图像识别是人工智能行业应用的一个重要方向,也是机器学习最热门的领域之一。它在科学研究和工业生产中都得到了广泛应用。3.1机器“看”世界图像识别的原理人们识别图像时,会依据图像所具有的自身特征进行分类,在识别过程中,人们的大脑会根据存储记忆中已经分好的类别进行识别,查看是否有与该图像具有相同或相似特征的存储记忆,从而识别出是否见过该图像。图像识别的原理与人们进行图像识别的原理基本类似,即计算机先对图像进行处理,然后提取图像的特征,接着对这些特征进行分类,最后根据特征的分类结果确定图像的信息,从而实现图像识别。计算机对图像特征提取的效果,将直接影响计算机的图像识别效率。3.1机器“看”世界图像识别的过程图像识别的过程可归纳为3个部分,即图像获取、图像预处理和图像识别,如图1所示。图1图像识别的过程(1)图像获取部分主要是指图像采集,即借助摄像机、扫描仪或摄像头等设备(见图2)采集静态或动态图像,并将它们转换成数字图像进行存储。也可以理解为获取研究对象的基本信息并通过某种方法将其转变为机器能够认识的信息。摄像机扫描仪摄像头图2图像采集设备3.1机器“看”世界(2)图像预处理部分包括4个环节,即图像增强、图像复原、图像编码与压缩和图像分割。图像增强是指对图像进行改善,以减少图像中的干扰和噪声,突出图像中的重要特征,为后期的图像分析和理解奠定基础。图像复原是利用退化过程的先验知识去恢复已退化图像的本来面目,从而提取比较清晰的图像。图像编码与压缩是对图像的大小进行压缩,从而快速方便地在网络环境下传输图像。图像分割是指把图像分成若干个特定的、具有独特性质的区域,并提取感兴趣目标的技术和过程。(3)图像识别部分包括3个环节,即图像特征提取与选择、分类器设计和分类决策。图像特征提取与选择是指利用某种方法,研究各式各样的图像,提取图像所具有的特征,并从提取的特征中,选择对本次识别有用的特征。分类器设计是指通过训练得到一种识别规则,通过此规则可以得到特征的分类结果,提高图像识别的识别率。分类决策是指在特征空间中对待识别对象进行分类,从而更好地识别出研究对象的所属类别。图1图像识别的过程3.1机器“看”世界3.1.2人脸识别人脸识别,通常也称为人像识别、面部识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术,也是图像识别的一个研究方向。人脸识别技术主要利用摄像机或摄像头等成像设备采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行识别。人脸识别的特点人脸与人体的其他生物特征(如指纹、虹膜等)一样与生俱来,它的唯一性和不易被复制性为身份鉴别提供了必要的前提,与其他类型的生物识别技术相比较,人脸识别还具有如下特点。非强制性。人脸采集设备几乎可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版技术咨询合同(含技术成果归属与支付报酬)
- 2024版货物买卖合同的货物描述与交易条件
- 二零二四年度人才培养与产品委托加工合同
- 2024年度高铁车辆采购及安装施工合同
- 二零二四年度演出经纪合同:周杰伦演唱会经纪公司与中国移动达成合作
- 2024年度软土基坑支护施工合同
- 二零二四年度大型科学仪器共享合同
- 北京工业大学耿丹学院《论文写作》2023-2024学年第一学期期末试卷
- 2024版桥梁建设施工合同
- 2024年度物业公司提供物业节能改造合同
- 高教版【中职专用】《中国特色社会主义》期末试卷+答案
- 附件3 建设工程质量检测综合报告(住宅参考实例 )
- 2024年《宪法》知识竞赛必背100题题库带解析附答案(完整版)
- 医药公司质量负责人变更专项内审
- 江苏省2024年中职职教高考文化统考语文答案
- (正式版)SHT 3078-2024 立式圆筒形料仓工程设计规范
- 工程总承包(EPC)施工组织设计
- 2024年高考语文标点符号的基本用法大全(新标准)
- 入职申请表(完整版)
- 人工智能专业生涯发展展示
- 病理学生殖系统疾病课件
评论
0/150
提交评论