人工智能通识教程第2版课件第3、4章大数据与人工智能、智能体与智能代理

上传人：q*** IP属地：山东上传时间：2024-10-28 格式：PPTX 页数：179 大小：4.12MB 积分：20 举报 版权申诉

已阅读5页，还剩174页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第2版人工智能通识教程第3章周苏教授QQ：81505050大数据与人工智能导读案例：电子商务的推荐系统知道人们为什么对这些信息感兴趣可能是有用的，但这个问题目前并不是很重要。但是，知道“是什么”可以创造点击率，这种洞察力足以重塑很多行业，不仅仅只是电子商务。01什么是模糊逻辑02模糊逻辑系统03数据思维与变革04大数据与人工智能目录/CONTENTS模糊逻辑模仿人脑的不确定性概念判断和推理思维方式，对于模型未知或不能确定的描述系统等，应用模糊集合和模糊规则进行推理，表达过渡性界限或定性知识经验，实行模糊综合判断，推理解决常规方法难于对付的规则型模糊信息问题。

图3-1模糊推理过程第3章大数据与人工智能大数据是人工智能的基础。大数据时代，人们对待数据的思维方式主要发生了以下三个变化：第一，人们处理的数据从样本数据变成全部数据；第二，由于是全样本数据，人们不得不接受数据的混杂性，而放弃对精确性的追求；第三，人们通过对大数据的处理，减少对因果关系的渴求，转而关注相关关系。第3章大数据与人工智能PART01什么是模糊逻辑计算机的二进制逻辑通常只有两种状态，一句陈述要么是真要么是假，然而，现实生活中却很少有这么一刀切的情况。一个人如果不饿不一定就是饿，有点饿和饿昏头不是一回事儿，有点冷比冻僵了的程度也要轻得多。如果我们将含义的所有层次都纳入考虑范畴，那么写入计算机程序的规则将会变得过分的复杂难懂。3.1什么是模糊逻辑昆虫有许多本能帮助其应对不同环境。它可能倾向于远离光线，隐藏在树叶和岩石下，这样不容易被捕食者发现。然而，它也会朝食物移动，否则就会饿死。如果我们要制作一个甲虫机器人，可以考虑赋予其如下规则：如果光线亮度高于50%，食物质量低于50%，那么远离，否则接近。图3-2甲虫机器人3.1.1甲虫机器人的规则如果食物和光线所占百分比一致会怎么样？吃饱了的昆虫会为了保持安全继续藏匿在黑暗中，而饥饿的昆虫就会冒险去接近食物。光越亮，越危险；食物质量越高，昆虫越容易冒险。我们可以根据这一情况制定出更多规则，例如：如果饥饿和光线高于75%，食物质量低于25%，那么远离，否则接近。3.1.1甲虫机器人的规则但是这些规则都无法很好把握极值。如果光线为76%，食物质量为24%，机器人就会饿死，虽然这仅仅与所设置的规则相差1%。当然，我们也可以设置更多规则来应对极值和特殊情况，但这样的操作很快就会把程序变成无法理解的一团乱麻。可是，在不让其变复杂的前提下，怎么能够处理所有变数呢？3.1.1甲虫机器人的规则假设我们正在经营一家婚姻介绍所。一个客户的要求是高个子但不富有的男子。我们的记录中有一名男子，身高1.78米，年收入是全国平均水平的两倍。应该将这名男子介绍给客户吗？如何判断什么是个子高？什么是富有？怎样对资料库中的男子进行打分来找到最符合的对象？身高和收入之间不能简单加减，就像苹果和橙子不能混为一谈一样。3.1.2模糊逻辑的发明模糊逻辑的发明就是为了解决这类问题。在常规逻辑中，上述规则的情况只有两种，不是对就是错，即不是1就是0。要么有光要么没有光，要么高要么不高。而在模糊逻辑中，每一个情况的真值可以是0到1中间的任何值。假定身高超过2米的男子是绝对的高个子，身高低于1.7米的为不高，那么1.78米高的客户可以算作0.55高，既不是特别高但是也不矮。要计算他不高的程度，用1减去高的程度即可。因此，该男子是0.55高，也就是0.45不高。3.1.2模糊逻辑的发明我们同样可以对“矮”的范畴进行界定。身高低于1.6米是绝对的矮个子，身高超过1.75米为不矮。由此可以发现“高”和“矮”的定义有一部分是重叠的，也就意味着处于中间值的人在某种程度上来说是高，而在另一种程度上来说是矮。“矮”和“不高”是两个概念，“高”“矮”“不高”和“不矮”对应的值都是不同的。类似地，我们也可以说他是0.2富有，也就是0.8不富有。女性客户的要求是“高AND（和）不富有”，所以我们需要计算“0.55AND0.8”，结果是0.44。通过检索所有各选项，找到得分最高者就可以介绍给客户了。3.1.2模糊逻辑的发明在模糊逻辑中进行“AND”与“OR”运算时计算方法不同，如何选择应当根据数字所起的作用决定。本例中是将两个数字相乘。另一种纯数学方式就是选择二者中的最小值。然而，如果采取这样的方式，较大的值将不影响结果。同样身高的男子，一个0.5不富有，另一个0.8不富有，其运算结果都是一样的。同样，我们也可以为甲虫机器人设置规则，如果饥饿并且光线不太亮，那么就朝食物进发。这些例子展示了可以利用模糊逻辑解决的问题类型。3.1.2模糊逻辑的发明专家系统是利用人类专长建立起来的，可以提供程序使用的明确规则。系统可能会说“如果温度高于95度超过两分钟，或是高于97度超过一分钟，那么可以断定恒温器损坏”。但是更多情况下它们会说“如果温度过高的情况持续太久，那么恒温器可能已经损坏”。这时需要由程序员负责填进具体数字。而利用模糊逻辑，则完全可以制定与专家所言一致的规则。3.1.3制定模糊逻辑的规则如果温度过高并且温度过高的时间过长，那么恒温器已经损坏。程序将对“恒温器已经损坏”这一命题进行赋值，取值在0到1之间。如果温度只是稍微偏高并且没有持续太长时间，那么命题真值可能约为0.1，即不太可能。而其他规则得出的值可能更高。比如，假设另一条规则判定输入冷却器损坏真值为0.95，那么程序将报告造成故障最有可能的原因就是输入冷却器，这些数据被称作可能性。与概率不同，0.1并不意味着恒温器有10%的概率已经损坏。高个子真值0.55也只代表他个子高的可能性，这仅仅是我们衡量可能性的一种方式。类似地，如果是10%肯定恒温器损坏，如果是95%肯定问题出在输入冷却器。3.1.3制定模糊逻辑的规则更加复杂的专家系统可能用于决定银行是否应该向客户提供贷款，规则如下：如果薪水高并且工作稳定性高，那么风险低。如果薪水低或者工作稳定性低，那么风险中等。如果信用评分低，那么风险高。这一部分程序可能得出以下数据：风险低=0.1风险中等=0.3风险高=0.73.1.3制定模糊逻辑的规则通过数学算法，这三组数据可以转化为评估风险的单个数字，这一过程被称为去模糊化。从上述数据我们还是可以看出借贷的风险程度可能为中等偏上。3.1.3制定模糊逻辑的规则模糊逻辑的另一用途就是控制机械装置，例如控制供暖系统的部分规则如下：如果温度高，那么停止供暖。如果温度非常低，那么加强供暖。如果温度低并且升温慢，那么加强供暖。如果温度低并且升温快，那么中等供暖。如果温度稍微偏低并且升温慢，那么中等供暖。如果温度稍微偏低并且升温快，那么停止供暖。3.1.3制定模糊逻辑的规则运行所有这些规则后，我们可以得到应该停止供暖、中等供暖，以及加强供暖等的可能性。将这些可能性转化为单个数据后就可以相应地设置加热器了。模糊控制系统管控设备状态，并生成控制信号不断调整以维持理想状态。在设备非线性的情况下，某种控制可能因设备状态产生不同影响，而模糊控制系统的优势在此时就能得以展现。3.1.3制定模糊逻辑的规则所谓模糊逻辑，是建立在多值逻辑基础上，运用模糊集合的方法来研究模糊性思维、语言形式及其规律的科学。模糊逻辑模仿人脑的不确定性概念判断、推理思维方式，对于模型未知或不能确定的描述系统等，应用模糊集合和模糊规则进行推理，表达过渡性界限或定性知识经验，实行模糊综合判断，推理解决常规方法难于对付的规则型模糊信息问题。模糊逻辑善于表达界限不清晰的定性知识与经验，它区分模糊集合，处理模糊关系，模拟人脑实施规则型推理，解决种种不确定问题。3.1.4模糊逻辑的定义模糊逻辑十分有趣的原因有两点。首先，它运作良好，是将人类专长转化为自动化系统的有力途径。利用模糊逻辑建立的专家系统和控制程序能够解决利用数学计算和常规逻辑系统难以解决的问题。其次，模糊逻辑与人类思维运作模式十分匹配。它能够成功吸收人类专长，因为专家们的表达方式恰好与其向程序注入信息的模式相符。模糊逻辑以重叠的模糊类别表达世界，这也正是我们思考的方式。3.1.4模糊逻辑的定义可以看到，传统的人工智能是基于一些“清晰”的规则，这个“清晰”给出的结果往往是很详细的，比如一个具体的房价预测值。而模糊逻辑模拟人的思考方式，对预测的房价值给出一个类似是高了还是低了的结果。不少创建智能的途径，都是依赖人类程序员以不同形式编写的系列规则。程序员能够参与不同领域程序的编写，归根结底还是依赖规则的执行。这些规则的存在也正是试图以我们理解的思考过程建立起一个思考程序（图3-3）。3.1.4模糊逻辑的定义

图3-3模糊逻辑系统3.1.4模糊逻辑的定义1965年，美国加利福尼亚大学自动控制理论专家查德在关于“模糊控制”的一系列论著中首先提出了模糊集合的概念，标志着模糊数学的诞生。建立在二值逻辑基础上的原有的逻辑与数学难以描述和处理现实世界中许多模糊性的对象。模糊数学与模糊逻辑实质上是要对模糊性对象进行精确的描述和处理。3.1.5模糊理论的发展模糊集合的引入，可将人的判断、思维过程用比较简单的数学形式直接表达出来，从而使对复杂系统做出合乎实际的、符合人类思维方式的处理成为可能，为经典模糊控制器的形成奠定了基础。随后，在1974年，英国人马丹尼使用模糊控制语言建成的控制器、控制锅炉和蒸汽机，取得了良好的效果。他的实验研究标志着模糊控制的诞生。3.1.5模糊理论的发展查德为了建立模糊性对象的数学模型，把只取0和1二值的普通集合概念推广为在[0，1]区间上取无穷多值的模糊集合概念，并用“隶属度”这一概念来精确地刻画元素与模糊集合之间的关系。正因为模糊集合是以连续的无穷多值为依据的，所以，模糊逻辑可看做是运用无穷连续值的模糊集合去研究模糊性对象的科学。把模糊数学的一些基本概念和方法运用到逻辑领域中，产生了模糊逻辑变量、模糊逻辑函数等基本概念。对于模糊联结词与模糊真值表也作了相应的对比研究。查德还开展了模糊假言推理等似然推理研究，有些成果已直接应用于模糊控制器的研制。3.1.5模糊理论的发展创立和研究模糊逻辑的主要意义有：（1）运用模糊逻辑变量、模糊逻辑函数和似然推理等新思想、新理论，为寻找解决模糊性问题的突破口奠定了理论基础，从逻辑思想上为研究模糊性对象指明了方向。（2）模糊逻辑在原有的布尔代数、二值逻辑等数学和逻辑工具难以描述和处理的自动控制过程、疑难病症的诊断、大系统的研究等方面，都具有独到之处。3.1.5模糊理论的发展（3）在方法论上，为人类从精确性到模糊性、从确定性到不确定性的研究提供了正确的研究方法。此外，在数学基础研究方面，模糊逻辑有助于解决某些悖论。对辩证逻辑的研究也会产生深远的影响。当然，模糊逻辑理论本身还有待进一步系统化、完整化、规范化。3.1.5模糊理论的发展对于经典模糊控制系统稳态性能的改善，模糊集成控制、模糊自适应控制、专家模糊控制与多变量模糊控制的研究，特别是针对复杂系统的自学习与参数（或规则）自调整模糊系统方面的研究，尤其受到各国学者的重视。将神经网络和模糊控制技术相互结合、取长补短，形成了一种模糊神经网络技术。由此组成一个更接近于人脑的智能信息处理系统，其发展前景十分诱人。3.1.5模糊理论的发展PART02模糊逻辑系统模糊逻辑系统是指利用模糊概念和模糊逻辑构成的系统，它可以用来充当模糊逻辑控制器。由于选择模糊概念和逻辑的随意性，可以构造出多种模糊逻辑系统。常见的有三类：纯模糊逻辑系统、高木-关野模糊逻辑系统和具有模糊产生器以及模糊消除器的模糊逻辑系统。3.2模糊逻辑系统纯模糊逻辑系统是其他类型的模糊逻辑系统的核心部分，它提供了一种量化语言信息和在模糊逻辑原则下利用这类语言信息的一般化模式。图3-4纯模糊逻辑系统结构图3.2.1纯模糊逻辑系统纯模糊逻辑系统也可以解释为一个映射关系，其结构图中的中间部分具有类似于线性变换中变换矩阵的映射功能。纯模糊逻辑系统的缺点在于它的输入和输出均为模糊集合，这不利于工程应用。但是，它为其他具有应用价值的模糊逻辑系统提供了一个基本的样板，由此出发可以构造出其他具有实用性质的模糊逻辑系统。3.2.1纯模糊逻辑系统高木-关野模糊逻辑系统（简称T-S模糊逻辑系统）是将纯模糊逻辑系统中的每一条模糊规则的后件（即THEN以后的部分）加以定量化后形成的，也就是说，T-S模糊逻辑系统中的模糊规则，其前件是迷糊的，后件是确定的。这种模糊逻辑系统已经在许多实际问题中得到成功的应用，它的优点是模糊逻辑系统的输出为精确值，其中的参数也可以用参数估计、适应机构等方法加以确定。但是，由于模糊规则后件的确定性，T-S模糊逻辑系统不能方便地利用更多的语言信息和模糊原则，限制了其应用的灵活性。3.2.2高木-关野模糊逻辑系统具有模糊产生器及模糊消除器的模糊逻辑系统的基本框图如下图所示。它是把纯模糊逻辑系统的输入端和输出端分别接上模糊产生器和模糊消除器后构成的。图3-5具有模糊产生器和模糊消除器的模糊逻辑系统结构图3.2.3具有产生器及消除器的模糊逻辑系统具有模糊产生器及模糊消除器的模糊逻辑系统具有以下显著优点：（1）这种模糊逻辑系统提供了一种描述领域专家知识的模糊规则的一般化方法；（2）使用者在设计其中的模糊产生器、模糊推理机和模糊消除器时具有很大的自由度，因此可以根据实际情况，找到一个最适合的模糊逻辑系统；（3）其输入、输出均为精确值，因此适合在工程领域中应用。3.2.3具有产生器及消除器的模糊逻辑系统这类模糊逻辑系统是由马丹尼首先提出，已经在许多工业过程和商业产品中得到成功应用，如用在电冰箱、电饭锅、洗衣机、空调等家用电器的自动控制中，在洗衣机中感知装载量和清洁剂浓度并据此调整它们的洗涤周期，同时还广泛运用在游戏的开发中。3.2.3具有产生器及消除器的模糊逻辑系统PART03数据思维与变革生产资料是人类文明的核心。农业时代生产资料是土地，工业时代生产资料是机器，数字时代生产资料是数据。劳动方式是人类文明的重要表征。渔猎农耕时代形成的是以手工劳动为主要方式的“手工文明”，工业时代发展为以机器劳动为主要方式的“机器文明”，智能时代则基于数字劳动而不断推动和丰富着“数字文明”。3.3数据思维与变革“数字文明”折射出以大数据、人工智能等为代表的数字技术对世界和人类的影响，在广度和深度上有了质的飞跃，到了塑造一种人类文明新形态的高度。数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程，给人类生产生活带来广泛而深刻的影响。以数字技术为基座的互联网，促进交流、提高效率，也在重塑制度、催生变革，更影响社会思潮和人类文明进程。这是不可逆转的时代趋势。在人工智能时代，数据处理变得更加容易、更加快速，而“大数据”全在于发现和理解信息内容及信息与信息之间的关系，其精髓是我们分析信息时的三个思维转变，这三个转变相互联系和相互作用。3.3数据思维与变革很长时间以来，因为记录、储存和分析数据的工具不够好，为了让分析变得简单，当面临大量数据时，通常都依赖于采样分析。但是采样分析是信息缺乏时代和信息流通受限制的模拟数据时代的产物。如今信息技术的条件已经有了非常大的提高，虽然人类可以处理的数据依然是有限的，但是可以处理的数据量已经大大地增加，而且未来会越来越多。大数据时代的第一个转变，是要分析与某事物相关的所有数据，而不是依靠分析少量的数据样本。3.3.1思维转变之一：样本=总体采样的目的是用最少的数据得到更多的信息，而当我们可以处理海量数据的时候，采样就没有什么意义了。如今，计算和制表已经不再困难，感应器、手机导航、网站点击和微信等被动地收集了大量数据，而计算机可以轻易地对这些数据进行处理。但是，数据处理技术己经发生了翻天覆地的改变，而我们的方法和思维却没有跟上这种改变。在很多领域，从收集部分数据到收集尽可能多的数据的转变已经发生。如果可能的话，我们会收集所有的数据，即“样本=总体”，这是指我们能对数据进行深度探讨。3.3.1思维转变之一：样本=总体谷歌流感趋势预测不是依赖于随机样本，而是分析了全美国几十亿条互联网检索记录。分析整个数据库，而不是对一个小样本进行分析，能够提高微观层面分析的准确性，甚至能够推测出某个特定城市的流感状况。通过使用所有的数据，我们可以发现如若不然则将会在大量数据中淹没掉的情况。例如，信用卡诈骗是通过观察异常情况来识别的，只有掌握了所有的数据才能做到这一点。在这种情况下，异常值是最有用的信息，你可以把它与正常交易情况进行对比。而且，因为交易是即时的，所以你的数据分析也应该是即时的。3.3.1思维转变之一：样本=总体因为大数据是建立在掌握所有数据，至少是尽可能多的数据的基础上的，所以我们就可以正确地考察细节并进行新的分析。在任何细微的层面，我们都可以用大数据去论证新的假设。当然，有些时候，我们还是可以使用样本分析法，毕竟我们仍然活在一个资源有限的时代。但是更多时候，利用手中掌握的所有数据成为了最好也是可行的选择。于是，慢慢地，我们会完全抛弃样本分析。3.3.1思维转变之一：样本=总体当我们测量事物的能力受限时，关注最重要的事情和获取最精确的结果是可取的。直到今天，我们的数字技术依然建立在精准的基础上。我们假设只要电子数据表格把数据排序，数据库引擎就可以找出和我们检索的内容完全一致的检索记录。这种思维方式适用于掌握“小数据量”的情况，因为需要分析的数据很少，所以我们必须尽可能精准地量化我们的记录。在某些方面，我们已经意识到了差别。例如，一个小商店在晚上打烊的时候要把收银台里的每分钱都数清楚，但是我们不会、也不可能用“分”这个单位去精确度量国民生产总值。随着规模的扩大，对精确度的痴迷将减弱。3.3.2思维转变之二：接受数据的混杂性针对小数据量和特定事情，追求精确性依然是可行的，比如一个人的银行账户上是否有足够的钱开具支票。但是，在大数据时代，很多时候，追求精确度已经变得不可行，甚至不受欢迎了。大数据纷繁多样，优劣掺杂，分布在全球多个服务器上。拥有了大数据，我们不再需要对一个现象刨根究底，只要掌握大体的发展方向即可。当然，我们也不是完全放弃了精确度，只是不再沉迷于此。适当忽略微观层面上的精确度会让我们在宏观层面拥有更好的洞察力。3.3.2思维转变之二：接受数据的混杂性大数据时代的第二个转变，是我们乐于接受数据的纷繁复杂，而不再一味追求其精确性。在越来越多的情况下，使用所有可获取的数据变得更为可能，但为此也要付出一定的代价。数据量的大幅增加会造成结果的不准确，与此同时，一些错误的数据也会混进数据库。然而，重点是我们能够努力避免这些问题。3.3.2思维转变之二：接受数据的混杂性大数据在多大程度上优于算法，这个问题在自然语言处理上表现得很明显。2000年，微软研究中心的米歇尔·班科和埃里克·布里尔一直在寻求改进Word程序中语法检查的方法。但是他们不能确定是努力改进现有的算法、研发新的方法，还是添加更加细腻精致的特点更有效。所以，在实施这些措施之前，他们决定往现有的算法中添加更多的数据，看看会有什么不同的变化。很多对计算机学习算法的研究都建立在百万字左右的语料库基础上。最后，他们决定往4种常见的算法中逐新添加数据，先是一千万字，再到一亿字，最后到十亿。3.3.2思维转变之二：接受数据的混杂性结果有点令人吃惊。他们发现，随着数据的增多，4种算法的表现都大幅提高了。当数据只有500万的时候，有一种简单的算法表现得很差，但当数据达10亿的时候，它变成了表现最好的，准确率从原来的75％提高到了95％以上。与之相反地，在少量数据情况下运行得最好的算法，当加入更多的数据时，也会像其他的算法一样有所提高，但是却变成了在大量数据条件下运行得最不好的。它的准确率会从86%提高到94％。后来，班科和布里尔在他们发表的研究论文中写到，“如此一来，我们得重新衡量一下更多的人力物力是应该消耗在算法发展上还是在语料库发展上。”3.3.2思维转变之二：接受数据的混杂性这是因前两个转变而促成的。寻找因果关系是人类长久以来的习惯，即使确定因果关系很困难而且用途不大，人类还是习惯性地寻找缘由。相反，在大数据时代，我们无须再紧盯事物之间的因果关系，而应该寻找事物之间的相关关系，这会给我们提供非常新颖且有价值的观点。相关关系也许不能准确地告知我们某件事情为何会发生，但是它会提醒我们这件事情正在发生。在许多情况下，这种提醒的帮助已经足够大了。在很多时候，寻找数据间的关联并利用这种关联就足够了。这些思想上的重大转变导致了第三个变革。3.3.3思维转变之三：数据的相关关系大数据时代的第三个转变是人们尝试着不再探求难以捉摸的因果关系，转而关注事物的相关关系。例如，如果数百万条电子医疗记录都显示橙汁和阿司匹林的特定组合可以治疗癌症，那么找出具体的药理机制就没有这种治疗方法本身来得重要。同样，只要我们知道什么时候是买机票的最佳时机，就算不知道机票价格疯狂变动的原因也无所谓了。大数据告诉我们“是什么”而不是“为什么”。在大数据时代，我们不必知道现象背后的原因，只要让数据自己发声。我们不再需要在还没有收集数据之前，就把分析建立在早已设立的少量假设的基础之上。让数据发声，我们会注意到很多以前从来没有意识到的联系的存在。3.3.3思维转变之三：数据的相关关系与常识相反，经常凭借直觉而来的因果关系并没有帮助我们加深对这个世界的理解。很多时候，这种认知捷径只是给了我们一种自己已经理解的错觉，但实际上，我们因此完全陷入了理解误区之中。就像采样是我们无法处理全部数据时的捷径一样，这种找因果关系的方法也是我们大脑用来避免辛苦思考的捷径。不像因果关系，证明相关关系的实验耗资少，费时也少。与之相比，分析相关关系，我们既有数学方法，也有统计学方法，同时，数字工具也能帮我们准确地找出相关关系。3.3.3思维转变之三：数据的相关关系相关关系分析本身意义重大，同时它也为研究因果关系奠定了基础。通过找出可能相关的事物，我们可以在此基础上进行进一步的因果关系分析．如果存在因果关系的话，我们再进一步找出原因。这种便捷的机制通过实验降低了因果分析的成本。我们也可以从相互联系中找到一些重要的变量，这些变量可以用到验证因果关系的实验中去。可是，我们必须非常认真。相关关系很有用，不仅仅是因为它能为我们提供新的视角，而且提供的视角都很清晰。而我们一旦把因果关系考虑进来，这些视角就有可能被蒙蔽掉。3.3.3思维转变之三：数据的相关关系例如，Kaggle是一家为所有人提供数据挖掘竞赛平台的公司，举办了关于二手车的质量竞赛。经销商将二手车数据提供参加比赛二手车数据，统计学家们用这些数据建立一个算法系统来预测经销商拍卖的哪些车有可能出现质量问题。相关关系分析表明，橙色的车有质量问题的可能性只有其他车的一半。3.3.3思维转变之三：数据的相关关系当我们读到这里的时候，不禁也会思考其中的原因。难道是因为橙色车的车主更爱车，所以车被保护得更好吗？或是这种颜色的车子在制造方面更精良些吗？还是因为橙色的车更显眼、出车祸的概率更小，所以转手的时候．各方面的性能保持得更好？3.3.3思维转变之三：数据的相关关系马上，我们就陷入了各种各样谜一样的假设中。若要找出相关关系，我们可以用数学方法，但如果是因果关系的话，这却是行不通的。所以，我们没必要一定要找出相关关系背后的原因，当我们知道了“是什么”的时候，“为什么”其实没那么重要了，否则就会催生一些滑稽的想法。比方说上面提到的例子里，我们是不是应该建议车主把车漆成橙色呢？毕竟，这样就说明车子的质量更过硬啊！3.3.3思维转变之三：数据的相关关系考虑到这些，如果把以确凿数据为基础的相关关系和通过快速思维构想出的因果关系相比的话，前者就更具有说服力。但在越来越多的情况下，快速清晰的相关关系分析甚至比慢速的因果分析更有用和更有效。慢速的因果分析集中体现为通过严格控制的实验来验证的因果关系，而这必然是非常耗时耗力的。3.3.3思维转变之三：数据的相关关系近年来，科学家一直在试图减少这些实验的花费，比如说，通过巧妙地结合相似的调查，做成“类似实验”。这样一来，因果关系的调查成本就降低，但还是很难与相关关系体现的优越性相抗衡。还有，正如我们之前提到的，在专家进行因果关系的调查时，相关关系分析本来就会起到帮助的作用。在大多数情况下，一旦我们完成了对大数据的相关关系分析，而又不再满足于仅仅知道“是什么”时，我们就会继续向更深层次研究因果关系，找出背后的“为什么”。3.3.3思维转变之三：数据的相关关系因果关系还是有用的，但是它将不再被看成是意义来源的基础。在大数据时代，即使很多情况下，我们依然指望用因果关系来说明我们所发现的相互联系，但是，我们知道因果关系只是一种特殊的相关关系。相反，大数据推动了相关关系分析。相关关系分析通常情况下能取代因果关系起作用，即使不可取代的情况下，它也能指导因果关系起作用。3.3.3思维转变之三：数据的相关关系PART04大数据与人工智能人工智能和大数据是紧密相关的热门技术，二者既有联系，又有区别。人工智能的发展要早于大数据，在20世纪50年代就已经开始，而大数据的概念直到2010年左右才形成。人工智能受到国人关注要远早于大数据，受到广泛关注，其影响力要大于大数据。3.4大数据与人工智能在大数据时代，面对海量数据，传统的人工智能算法所依赖的单机存储和单机算法已经无能为力，建立在集群技术之上的大数据技术（主要是分布式存储和分布式计算），可以为人工智能提供强大的存储能力和计算能力。人工智能，特别是机器学习，需要数据来建立其智能。例如，机器学习图像识别应用程序可以查看数以万计的飞机图像，了解飞机的构成，以便将来能够识别出它们。人工智能应用的数据越多，其获得的结果就越准确。如今，大数据为人工智能提供了海量数据，使人工智能技术有了长足发展，甚至可以说，没有大数据就没有人工智能。3.4.1人工智能与大数据的联系人工智能技术立足于神经网络，同时发展出多层神经网络，从而可以进行深度学习，决定了它更为灵活、且可以根据不同的训练数据而拥有自优化的能力。“机器学习”“深度学习”“强化学习”等技术的发展推动着人工智能的进步。以计算机视觉为例，作为一个数据复杂领域，传统的浅层算法识别准确率并不高。自深度学习出现以后，基于寻找合适特征来让机器识别物体，计算机视觉的图像识别精准度从70%提升到95%。人工智能的快速演进，不仅需要理论研究，还需要大量的数据作为支撑。3.4.1人工智能与大数据的联系人工智能与大数据存在着明显的区别，人工智能是一种计算形式，它允许机器执行认知功能，例如对输入起作用或做出反应，类似于人类的做法。而大数据是一种传统计算，只是寻找结果，不会根据结果采取行动。另外，二者要达成的目标和实现目标的手段不同。大数据主要是为了获得洞察力，通过数据的对比分析来掌握和推演出更优的方案。就拿视频推送为例，我们之所以会接收到不同的推送内容，便是因为大数据根据人们日常观看的内容，综合考虑观看习惯，推断出哪些内容更可能产生同样的感觉，并将其推送给我们。3.4.2人工智能与大数据的区别而人工智能的开发，是为了辅助和代替我们更快、更好地完成某些任务或进行某些决定。不管是汽车自动驾驶、软件自我调整亦或者是医学样本检查工作，完成相同的任务人工智能总是比人类速度更快、错误更少，它能通过机器学习的方法，掌握我们日常进行的重复性的事项，并以计算机的处理优势来高效的达成目标。3.4.2人工智能与大数据的区别大数据定义了非常大的数据集和极其多样的数据。在大数据集中，可以存在结构化数据，如关系数据库中的事务数据，以及非结构化数据，例如图像、电子邮件数据、传感器数据等。大数据需要在数据变得有用之前进行清洗、结构化和集成的原始输入，而人工智能则是输出，即处理数据产生的智能。这使得两者有着本质上的不同。虽然有很大区别，但人工智能和大数据仍然能够很好地协同工作。这是因为人工智能需要数据来建立其智能，特别是机器学习。3.4.2人工智能与大数据的区别人工智能与大数据密不可分。大数据的许多应用可以归因于人工智能。随着人工智能的快速应用和普及，大数据不断积累，深度学习和强化学习等算法不断优化。数据技术将与人工智能技术更紧密地结合在一起，它将具有理解、分析、发现数据和对数据做出决策的能力，从而能够从数据中获得更准确、更深入的知识，挖掘数据背后的价值，并产生新的知识。3.4.3人工智能深化大数据应用人工智能是一种计算形式，它允许机器执行认知功能，例如对输入起作用或做出反应，类似于人类的做法。传统的计算应用程序也会对数据做出反应，但反应和响应都必须采用人工编码。如果出现任何类型的差错，就像意外的结果一样，应用程序无法做出反应。而人工智能系统不断改变它们的行为，以适应调查结果的变化并修改它们的反应。支持人工智能的机器旨在分析和解释数据，然后根据这些解释解决问题。通过机器学习，计算机会学习一次如何对某个结果采取行动或做出反应，并在未来知道采取相同的行动。3.4.3人工智能深化大数据应用人工智能实现最大的飞跃是大规模并行处理器的出现，特别是GPU，它是具有数千个内核的大规模并行处理单元，而不是CPU中的几十个并行处理单元。这大大加快了现有的人工智能算法的速度，现在已经使它们可行。大数据可以采用这些处理器，机器学习算法可以学习如何重现某种行为，包括收集数据以加速机器。人工智能不会像人类那样推断出结论。它通过试验和错误学习，这需要大量的数据来训练人工智能。人工智能是总的概念，机器学习，深度学习都是实现人工智能的重要途径，大数据是重要的推动力。3.4.3人工智能深化大数据应用第2版人工智能通识教程第4章周苏教授QQ：81505050智能体与智能代理导读案例：智能体：下一个颠覆性AI应用如今，越来越多的人开始关注智能体的发展。而基于大语言模型的智能体则会是AI领域接下来的重要应用方向，也引起越来越多AI从业者的重视。自主AI还处于发展的早期阶段，呈现出一个值得期待的未来愿景。01智能体和环境02智能体的良好行为03环境的本质04智能体的结构目录/CONTENTS05智能代理技术06智能代理典型应用智能体（Agents）是人工智能领域中一个很重要的概念，它是指能自主活动的软件或者硬件实体，任何独立的能够思考并可以同环境交互的实体都可以抽象为智能体。我们可以把人工智能进一步定义为“对从环境中接受感知并执行行动的智能体的研究”，“智能体”概念既能概括以机器为载体的人工智能，也能概括以有机体为载体的生物智能——生物就是感知环境并适应环境的有机智能体。更一般地，“智能是系统通过获取和加工信息而获得的一种能力，从而实现从简单到复杂的演化”，这也同时涵盖了生物智能和机器智能。第4章智能体和智能代理另一方面，所谓智能代理（IntelligentAgent，IA）在社会科学中是指一个理性并且自主的人或其他系统，它根据感知世界得到的信息来做出动作以影响这个世界。这一定义在计算机智能代理中同样适用。代理必须理性，根据可得的信息做出正确的决定；代理也必须自主，它与世界的关系包括感知世界的过程，它做出的决定源于对世界的感知及自身经历。我们不期望智能代理能像象棋程序一样获得最完美、最完备的信息，它的一部分任务就是理解周边环境，随后做出反应。它的行为将改变环境，随即改变其感知，但它仍旧需要在已经改变的世界中继续运作。第4章智能体和智能代理PART01智能体和环境任何通过传感器感知环境并通过执行器作用于该环境的事物都可以被视为智能体。我们从检查智能体、环境以及它们之间的耦合，观察到某些智能体比其他智能体表现得更好，可以自然而然地引出理性智能体的概念，即行为尽可能好。智能体的行为取决于环境的性质。图4-2智能体通过传感器和执行器

与环境交互4.1智能体和环境一个人类智能体以眼睛、耳朵和其他器官作为传感器，以手、腿、声道等作为执行器。机器人智能体可能以摄像头和红外测距仪作为传感器，各种电动机作为执行器。软件智能体接收文件内容、网络数据包和人工输入（键盘／鼠标／触摸屏／语音）作为传感输入，并通过写入文件、发送网络数据包、显示信息或生成声音对环境进行操作。环境可以是一切，甚至是整个宇宙。实际上，我们在设计智能体时关心的只是宇宙中某一部分的状态，即影响智能体感知以及受智能体动作影响的部分。4.1智能体和环境我们使用术语感知来表示智能体的传感器知觉的内容。一般而言，一个智能体在任何给定时刻的动作选择，可能取决于其内置知识和迄今为止观察到的整个感知序列，而不是它未感知到的任何事物。通过为每个可能的感知序列指定智能体的动作选择，或多或少地说明了关于智能体的内容。从数学上讲，智能体的行为由智能体函数描述，该函数将任意给定的感知序列映射到一个动作。4.1智能体和环境可以想象将描述任何给定智能体的智能体函数制成表格，对大多数智能体来说，这将是一个非常大的表，事实上是无限的（除非限制所考虑的感知序列的长度）。给定一个要进行实验的智能体，原则上，可以通过尝试所有可能的感知序列并记录智能体响应的动作来构建此表，当然，该表只是该智能体的外部特征。在内部，人工智能体的智能体函数将由智能体程序实现，区别这两种观点很重要，智能体函数是一种抽象的数学描述，而智能体程序是一个具体的实现，可以在某些物理系统中运行。4.1智能体和环境为了阐明这些想法，我们举一个简单的例子——真空吸尘器世界。在一个由方格组成的世界中，包含一个机器人真空吸尘器智能体，其中的方格可以是脏的，也可以是干净的。考虑只有两个方格——方格A和方格B——的情况。真空吸尘器智能体可以感知它在哪个方格中，以及方格中是否干净。智能体从方格A开始。可选的操作包括向右移动、向左移动、吸尘或什么都不做（其实，真正的机器人不太可能会有“向右移动”和“向左移动”这样的动作，而是采用“向前旋转轮子”和“向后旋转轮子”这样的动作）。4.1智能体和环境一个非常简单的智能体函数如下：如果当前方格是脏的，就吸尘；否则，移动到另一个方格。智能体这一概念主要作为分析系统的工具，而不是将世界划分为智能体和非智能体的绝对表征。在某种意义上，工程的所有领域都可以被视为设计与世界互动的人工制品，人工智能运行在最有趣的一端，在这一端，人工制品具有重要的计算资源，任务环境需要非凡的决策。4.1智能体和环境PART02智能体的良好行为理性智能体是做正确事情的事物。人工智能通常通过结果来评估智能体的行为。当智能体进入环境时，它会根据接受的感知产生一个动作序列，这会导致环境经历一系列的状态。如果序列是理想的，则智能体表现良好，这个概念由性能度量描述，评估任何给定环境状态的序列。4.2智能体的良好行为人类有适用于自身的理性概念，它与成功选择产生环境状态序列的行动有关，这些环境状态序列从人类的角度来看是可取的。但是机器没有自己的欲望和偏好，至少在最初，性能度量是在机器设计者的头脑中或者是在机器受众的头脑中。一些智能体设计具有性能度量的显式表示，而在其他设计中，性能度量完全是隐式的，智能体可能会做正确的事情，但它不知道为什么。4.2.1性能度量应该确保“施以机器的目的是我们真正想要的目的”，但是正确地制定性能度量可能非常困难。例如，考虑真空吸尘器智能体，我们可能会建议用单个8小时班次中清理的灰尘量来度量性能。然而，一个理性的智能体可以通过清理灰尘，然后将其全部倾倒在地板上，然后再次清理，如此反复，从而最大化这一性能度量值。更合适的性能度量是奖励拥有干净地板的智能体。例如，在每个时间步中，每个干净方格可以获得1分（可能会对耗电和产生的噪声进行惩罚）。4.2.1性能度量作为一般规则，更好的做法是根据一个人在环境中真正想要实现的目标，而不是根据一个人认为智能体应该如何表现来设计性能度量。即使避免了明显的缺陷，一些棘手的问题仍然存在。例如，“干净地板”的概念是基于一段时间内的平均整洁度。然而，两个不同的智能体可以达到相同的平均整洁度，其中一个智能体工作始终保持一般水平，而另一个智能体短时间工作效率很高但需要长时间的休息。哪种工作方式更可取，这似乎是保洁工作的好课题，而实际上还是一个具有深远影响的哲学问题。4.2.1性能度量在任何时候，理性取决于以下4方面：（1）定义成功标准的性能度量；（2）智能体对环境的先验知识；（3）智能体可以执行的动作；（4）智能体到目前为止的感知序列。于是，对理性智能体的定义是：对于每个可能的感知序列，给定感知序列提供的证据和智能体所拥有的任何先验知识，理性智能体应该选择一个期望最大化其性能度量的动作。4.2.2理性考虑一个简单的真空吸尘器智能体，如果一个方格是脏的就清理它，如果不脏就移动到另一个方格，它是理性智能体吗？首先，我们需要说明性能度量是什么，对环境了解多少，以及智能体具有哪些传感器和执行器。我们假设：·在1000个时间步的生命周期内，性能度量在每个时间步为每个干净的方格奖励1分；4.2.2理性·环境的“地理信息”是先验的，但灰尘的分布和智能体的初始位置不是先验的，干净的方格会继续保持干净，吸尘动作会清理当前方格，向左或向右的动作使智能体移动一个方格，如果该动作会让智能体移动到环境之外，智能体将保持在原来的位置；·可用的动作仅有向右、向左和吸尘；·智能体能够正确感知其位置以及该位置是否有灰尘。4.2.2理性在这种情况下，智能体确实是理性的，它的预期性能至少与任何其他智能体一样。显然，同一个智能体在不同情况下可能会变得不理性。例如，在清除所有灰尘后，该智能体会毫无必要地反复来回；如果考虑对每个动作罚1分，那么智能体的表现就会很差。在确定所有方格都干净的情况下，一个好的智能体不会做任何事情。如果干净的方格再次变脏，智能体应该偶尔检查，并在必要时重新清理。如果环境地理信息是未知的，智能体则需要对其进行探索。4.2.2理性我们需要仔细区分理性和全知。全知的智能体能预知其行动的实际结果，并据此采取行动，但在现实中，全知是不可能的，理性不等同于完美。理性使期望性能最大化，而完美使实际性能最大化。不要求完美不仅仅是对智能体公平的问题，关键是，如果期望一个智能体做事后证明是最好的行动，就不可能设计一个符合规范的智能体。因此，对理性的定义并不需要全知，因为理性决策只取决于迄今为止的感知序列。我们还必须确保没有无意中允许智能体进行低智的行动。4.2.3全知、学习和自主首先，考虑到这种缺乏信息的感知序列，过马路是不理性的：不观察路况就过马路发生事故的风险太大。其次，理性智能体在上街之前应该选择“观察”动作，因为观察有助于最大化期望性能。采取行动来改变未来的感知，有时被称为信息收集，这是理性的一个重要组成部分。4.2.3全知、学习和自主我们的定义要求理性智能体不仅要收集信息，还要尽可能多地从它所感知到的东西中学习。智能体的初始配置可以反映对环境的一些先验知识，但随着智能体获得经验，这可能会被修改和增强。在一些极端情况下，环境完全是先验已知的和完全可预测的，这种情况下智能体不需要感知或学习，只需正确地运行。当然，这样的智能体是脆弱的。4.2.3全知、学习和自主如果在某种程度上，智能体依赖于其设计者的先验知识，而不是其自身的感知和学习过程，就说该智能体缺乏自主性。一个理性的智能体应该是自主的，它应该学习如何弥补部分或不正确的先验知识，例如学习预测何时何地会出现额外灰尘的真空吸尘器就比不能学习预测的要好。4.2.3全知、学习和自主实际上，很少从一开始就要求智能体完全自主：除非设计者提供一些帮助，否则当智能体几乎没有经验时，它将不得不随机行动。正如进化为动物提供了足够的内建反射，使其能够生存足够长的时间来学习一样，为人工智能体提供一些初始知识和学习能力也是合理的。在充分体验相应环境后，理性智能体的行为可以有效地独立于其先验知识。因此，结合学习能够让我们设计单个理性智能体，它能在各种各样的环境中取得成功。4.2.3全知、学习和自主PART03环境的本质有了理性的定义，构建理性智能体还必须考虑任务环境，它本质上是“问题”，理性智能体是“解决方案”。首先是指定任务环境，然后展示任务环境的多种形式。任务环境的性质直接影响到智能体程序的恰当设计。4.3环境的本质讨论简单真空吸尘器智能体的理性时，必须为其指定性能度量、环境以及智能体的执行器和传感器，这些都归在任务环境的范畴下，称其为PEAS（Performance，Environment，Actuator，Sensor，性能、环境、执行器、传感器）描述。在设计智能体时，第一步始终是尽可能完整地指定任务环境。我们来考虑一个更复杂的问题：自动驾驶出租车的任务环境PEAS描述（表4-1）。4.3.1指定任务环境表4-1自动驾驶出租车司机任务环境的PEAS描述4.3.1指定任务环境首先，对于自动驾驶追求的性能度量，理想的标准包括到达正确的目的地，尽量减少油耗和磨损，尽量减少行程时间或成本，尽量减少违反交通法规和对其他驾驶员的干扰，最大限度地提高安全性和乘客舒适度，最大化利润。显然，其中有一些目标是相互冲突的，需要权衡。接下来，出租车将面临什么样的驾驶环境？任何出租车司机都必须能够在各种道路上行驶，如乡村车道、城市小巷以及多个车道的高速公路。道路上有其他交通工具、行人、流浪动物、道路工程、警车、水坑和坑洼。出租车还必须与潜在以及实际的乘客互动。另外，还有一些可选项。出租车可以选择在很少下雪的南方或者经常下雪的北方运营。显然，环境越受限，设计问题就越容易解决。4.3.1指定任务环境自动驾驶出租车的执行器包括可供人类驾驶员使用的器件，例如通过加速器控制发动机以及控制转向和制动。此外，它还需要输出到显示屏或语音合成器，以便与乘客进行对话，或许还需要某种方式与其他车辆进行礼貌的或其他方式的沟通。4.3.1指定任务环境出租车的基本传感器将包括一个或多个摄像头以便观察，以及激光雷达和超声波传感器以便检测其他车辆和障碍物的距离。为了避免超速罚单，出租车应该有一个速度表，而为了正确控制车辆（特别是在弯道上），它应该有一个加速度表。要确定车辆的机械状态，需要发动机、燃油和电气系统的传感器常规阵列。像许多人类驾驶者一样，它可能需要获取北斗导航信号，这样就不会迷路。最后，乘客需要触摸屏或语音输入才能说明目的地。4.3.1指定任务环境表4-2中简要列举了一些其他智能体类型的基本PEAS元素。这些示例包括物理环境和虚拟环境。注意，虚拟任务环境可能与“真实”世界一样复杂。例如，在拍卖和转售网站上进行交易的软件智能体，它为数百万其他用户和数十亿对象提供交易业务。4.3.1指定任务环境表4-2智能体类型及其PEAS描述的示例4.3.1指定任务环境人工智能中可能出现的任务环境范围非常广泛。然而，我们可以确定少量的维度，并根据这些维度对任务环境进行分类。这些维度在很大程度上决定了恰当的智能体设计以及智能体实现的主要技术系列的适用性。首先我们列出维度，然后分析任务环境，阐明思路。4.3.2任务环境的属性完全可观测与部分可观测：如果智能体的传感器能让它在每个时间点都能访问环境的完整状态，那么我们说任务环境是完全可观测的。如果传感器检测到与动作选择相关的所有方面，那么任务环境就是有效的完全可观测的，而所谓的相关又取决于性能度量标准。完全可观测的环境很容易处理，因为智能体不需要维护任何内部状态来追踪世界。由于传感器噪声大且不准确，或者由于传感器数据中缺少部分状态，环境可能部分可观测。4.3.2任务环境的属性例如，只有一个局部灰尘传感器的真空吸尘器无法判断其他方格是否有灰尘，自动驾驶出租车无法感知其他司机的想法。如果智能体根本没有传感器，那么环境是不可观测的。在这种情况下，有人可能会认为智能体的困境是无解的，但是，智能体的目标可能仍然可以实现。4.3.2任务环境的属性单智能体与多智能体：单智能体和多智能体环境之间的区别似乎足够简单。例如，独自解决纵横字谜的智能体显然处于单智能体环境中，而下国际象棋的智能体则处于二智能体环境中。然而，这里也有一些微妙的问题。首先，我们已经描述了如何将一个实体视为智能体，但没有解释哪些实体必须视为智能体。智能体A（例如出租车司机）是否必须将对象B（另一辆车）视为智能体，还是可以仅将其视为根据物理定律运行的对象，类似于海滩上的波浪或随风飘动的树叶？关键的区别在于B的行为是否被最佳地描述为一个性能度量的最大化，而这一性能度景的值取决于智能体A的行为。4.3.2任务环境的属性例如，国际象棋中的对手实体B正试图最大化其性能度量，根据国际象棋规则，这将最小化智能体A的性能度量。因此，国际象棋是一个竞争性的多智能体环境。但是，在出租车驾驶环境中，避免碰撞使所有智能体的性能度量最大化，因此它是一个部分合作的多智能体环境，它还具有部分竞争性，例如，一个停车位只能停一辆车。多智能体环境中的智能体设计问题通常与单智能体环境下有较大差异。例如，在多智能体环境中，通信通常作为一种理性行为出现：在某些竞争环境中，随机行为是理性的，因为它避免了一些可预测性的陷阱。4.3.2任务环境的属性确定性与非确定性：如果环境的下一个状态完全由当前状态和智能体执行的动作决定，那么我们说环境是确定性的，否则是非确定性的。原则上，在完全可观测的确定性环境中，智能体不需要担心不确定性。然而，如果环境是部分可观测的，那么它可能是非确定性的。4.3.2任务环境的属性大多数真实情况非常复杂，以至于不可能追踪所有未观测到的方面；出于实际目的，必须将其视为非确定性的。从这个意义上讲，出租车驾驶显然是非确定性的，因为人们永远无法准确地预测交通行为。此外，轮胎可能会意外爆胎，发动机可能会在没有警告的情况下失灵。我们描述的真空吸尘器世界是确定性的，但变化可能包括非确定性因素，如随机出现的灰尘和不可靠的吸力机制。4.3.2任务环境的属性最后注意一点，“随机”与“非确定性”的不同。如果环境模型显式地处理概率（例如，“明天的降雨可能性为25％”），那么它是随机的；如果可能性没有被量化，那么它是“非确定性的”（例如，“明天有可能下雨”）。回合式与序贯：在回合式任务环境中，智能体的经验被划分为原子式的回合，每接收一个感知，然后执行单个动作。重要的是，下一回合并不依赖于前几回合采取的动作。许多分类任务是回合式的。例如，在装配流水线上检测缺陷零件的智能体需要根据当前零件做出每个决策，而无须考虑以前的决策；而且，当前的决策并不影响下一个零件是否有缺陷。4.3.2任务环境的属性但是，在序贯环境中，当前决策可能会影响未来所有决策。国际象棋和出租车驾驶是序贯的：在这两种情况下，短期行为可能会产生长期影响。在回合式环境下智能体不需要提前思考，所以要比序贯环境简单很多。4.3.2任务环境的属性静态与动态：如果环境在智能体思考时发生了变化，就说该智能体的环境是动态的，否则是静态的。静态环境容易处理，因为智能体在决定某个操作时不需要一直关注世界，也不需要担心时间的流逝。但是，动态环境会不断地询问智能体想要采取什么行动，如果它还没有决定，那就等同于什么都不做。如果环境本身不会随着时间的推移而改变，但智能体的性能分数会改变，我们就说环境是半动态的。驾驶出租车显然是动态的，因为驾驶算法在计划下一步该做什么时，其他车辆和出租车本身在不断移动。在用时钟计时的情况下国际象棋是半动态的。填字游戏是静态的。4.3.2任务环境的属性离散与连续：这之间的区别适用于环境的状态、处理时间的方式以及智能体的感知和动作。例如，国际象棋环境具有有限数量的不同状态（不包括时钟），国际象棋也有一组离散的感知和动作。驾驶出租车是一个连续状态和连续时间的问题，出租车和其他车辆的速度和位置是一系列连续的值，并随着时间平稳地变化。出租车的驾驶动作也是连续的（转向角等）。严格来说，来自数字照相机的输入是离散的，但通常被视为表示连续变化的强度和位置。已知与未知：这种区别是指智能体（或设计者）对环境“物理定律”的认知状态。4.3.2任务环境的属性在已知环境中，所有行动的结果（如果环境是非确定性的，则对应结果的概率）都是既定的。显然，如果环境未知，智能体将不得不了解它是如何工作的，才能做出正确的决策。已知和未知环境之间的区别与完全可观测和部分可观测环境之间的区别不同。一个已知的环境很可能是部分可观测的，例如，在纸牌游戏中，知道规则但仍然无法看到尚未翻转的牌。相反，一个未知环境可以是完全可观测的，如一个全新的电子游戏，屏幕可能会显示整个游戏状态，但在尝试之前并不知道各个按钮的作用。4.3.2任务环境的属性性能度量本身可能是未知的，这可能是因为设计者不确定如何正确地描述，也可能是因为最终用户（其偏好很重要）是未知的。例如，出租车司机通常不知道新乘客是喜欢悠闲还是快速的旅程，是喜欢谨慎还是激进的驾驶风格。虚拟个人助理一开始对其主人的个人喜好一无所知。在这种情况下，智能体可以基于与设计者或用户的进一步交互来了解更多关于性能度量的信息。继而，这表明，任务环境必须被视为一个多智能体环境。4.3.2任务环境的属性最困难的情况是部分可观测的、多智能体的、非确定性的、序贯的、动态的、连续的且未知的。驾驶出租车除了驾驶员的环境大多是已知的，在所有其他方面都很难。在一个陌生的国家驾驶租来的汽车，那里有不熟悉的地理环境、不同的交通法规以及焦虑的乘客，这令人更加紧张。4.3.2任务环境的属性表4-3列举了许多熟悉环境的属性。注意，这些属性并不总是一成不变的。例如，将患者的患病过程作为智能体建模并不适合，所以我们将医疗诊断任务列为单智能体，但是医疗诊断系统还可能会应对顽固的病人和多疑的工作人员，因此环境还具有多智能体的方面。此外，如果我们将任务设想为根据症状列表进行诊断，那么医疗诊断是回合式的；如果任务包括提出一系列测试、评估治疗过程中的进展、处理多个患者等，那就是序贯的。4.3.2任务环境的属性表4-3任务环境的例子及其特征4.3.2任务环境的属性因为“已知的／未知的”不是严格意义上的环境属性。对于某些环境，例如国际象棋和扑克，很容易为智能体提供完整的规则知识，但考虑智能体如何在没有这些知识的情况下学会玩这些游戏仍然是有趣的。实验通常不是针对单个环境进行的，而是针对从环境类中抽象的许多环境进行的。例如，要在模拟交通中评估出租车司机，我们需要运行具有不同的交通状况、照明和天气条件的多次模拟，关注智能体在环境类上的平均性能。4.3.2任务环境的属性PART04智能体的结构我们通过描述行为（即在任意给定的感知序列之后执行的动作）讨论了智能体。下面我们来讨论智能体内部是如何工作的。人工智能的工作是设计一个智能体程序实现智能体函数，即从感知到动作的映射。假设该程序将运行在某种具有物理传感器和执行器的计算设备上，我们称之为智能体架构：智能体＝架构＋程序4.4智能体的结构显然，我们选择的程序必须是适合相应架构的程序。如果程序打算推荐步行这样的动作，那么对应的架构最好有腿。架构可能只是一台普通PC，也可能是一辆带有多台车载计算机、摄像头和其他传感器的机器人汽车。通常，架构使程序可以使用来自传感器的感知，然后运行程序，并将程序生成的动作选择反馈给执行器。4.4智能体的结构我们考虑的智能体程序都有相同的框架：它们将当前感知作为传感器的输入，并将动作返回给执行器。注意智能体程序框架还有其他选择。例如，可以让智能体程序作为与环境异步运行的协程。每个这样的协程都有一个输入和输出端口，并由一个循环组成，该循环读取输入端口的感知，并将动作写到输出端口。4.4.1智能体程序注意智能体程序（将当前感知作为输入）和智能体函数（可能依赖整个感知历史）之间的差异。因为环境中没有其他可用信息，所以智能体程序别无选择，只能将当前感知作为输入。如果智能体的动作需要依赖于整个感知序列，那么智能体必须记住历史感知。人工智能面临的关键挑战是找出编写程序的方法，尽可能从一个小程序而不是从一个大表中产生理性行为。有4种基本的智能体程序，它们体现了几乎所有智能系统的基本原理，每种智能体程序以特定的方式组合特定的组件来产生动作。4.4.1智能体程序（1）简单反射型智能体。这是最简单的智能体，它们根据当前感知选择动作，忽略感知历史的其余部分。4.4.1智能体程序（2）基于模型的反射型智能体。处理部分可观测性的最有效方法是让智能体追踪它现在观测不到的部分世界。也就是说，智能体应该维护某种依赖于感知历史的内部状态，从而反映当前状态的一些未观测到的方面。对于刹车问题，内部状态范围不仅限于摄像头拍摄图像的前一帧，要让智能体能够检测车辆边缘的两个红灯何时同时亮起或熄灭。对于其他驾驶任务，如变道，如果智能体无法同时看到其他车辆，则需要追踪它们的位置。4.4.1智能体程序随着时间的推移，更新这些内部状态信息需要在智能体程序中以某种形式编码两种知识。首先，需要一些关于世界如何随时间变化的信息，这些信息大致可以分为两部分：智能体行为的影响和世界如何独立于智能体而发展。例如，当智能体顺时针转动方向盘时，汽车就会向右转；而下雨时，汽车的摄像头就会被淋湿。这种关于“世界如何运转”的知识（无论是在简单的布尔电路中还是在完整的科学理论中实现）被称为世界的转移模型。4.4.1智能体程序其次，我们需要一些关于世界状态如何反映在智能体感知中的信息。例如，当前面的汽车开始刹车时，前向摄像头的图像中会出现一个或多个亮起的红色区域；当摄像头被淋湿时，图像中会出现水滴状物体并部分遮挡道路。这种知识称为传感器模型。转移模型和传感器模型结合在一起让智能体能够在传感器受限的情况下尽可能地跟踪世界的状态。使用此类模型的智能体称为基于模型的智能体。4.4.1智能体程序（3）基于目标的智能体。即使了解了环境的现状也并不总是能决定做什么。例如，在一个路口，出租车可以左转、右转或直行。正确的决定还取决于出租车要去哪里。换句话说，除了当前状态的描述之外，智能体还需要某种描述理想情况的目标信息，例如设定特定的目的地。智能体程序可以将其与模型相结合，并选择实现目标的动作。4.4.1智能体程序（4）基于效用的智能体。在大多数环境中，仅靠目标并不足以产生高质量的行为。例如，许多动作序列都能使出租车到达目的地，但有些动作序列比其他动作序列更快、更安全、更可靠或者更便宜。这个时候，目标只是在“快乐”和“不快乐”状态之间提供了一个粗略的二元区别。更一般的性能度量应该允许根据不同世界状态的“快乐”程度来对智能体进行比较。经济学家和计算机科学家通常用效用这个词来代替“快乐”，因为“快乐”听起来不是很科学。4.4.1智能体程序我们已经看到，性能度量会给任何给定的环境状态序列打分，因此它可以很容易地区分到达出租车目的地所采取的更可取和更不可取的方式。智能体的效用函数本质上是性能度量的内部化。如果内部效用函数和外部性能度量一致，那么根据外部性能度量选择动作，以使其效用最大化的智能体是理性的。4.4.1智能体程序在图灵早期的著名论文中，曾经考虑了手动编程实现智能机器的想法。他估计了这可能需要多少工作量，并得出结论，“似乎需要一些更快捷的方法”。他提出的方法是构造学习型机器，然后教它们。在人工智能的许多领域，这是目前创建最先进系统的首选方法。任何类型的智能体（基于模型、基于目标、基于效用等）都可以构建（或不构建）成学习型智能体。4.4.2学习型智能体学习还有另一个优势：它让智能体能够在最初未知的环境中运作，并变得比其最初的能力更强。学习型智能体可分为4个概念组件（图4-4），其中，“性能元素”框表示我们之前认为的整个智能体程序，“学习元素”框可以修改该程序以提升其性能。最重要的区别在于负责提升的学习元素和负责选择外部行动的性能元素。性能元素是我们之前认为的整个智能体：它接受感知并决定动作。学习元素使用来自评估者对智能体表现的反馈，并以此确定应该如何修改性能元素以在未来做得更好。4.4.2学习型智能体图4-4通用学习型智能体4.4.2学习型智能体学习元素的设计在很大程度上取决于性能元素的设计。当设计者试图设计一个学习某种能力的智能体时，第一个问题是“一旦智能体学会了如何做，它将使用什么样的性能元素？”给定性能元素的设计，可以构造学习机制来改进智能体的每个部分。4.4.2学习型智能体评估者告诉学习元素：智能体在固定性能标准方面的表现如何。评估者是必要的，因为感知本身并不会指示智能体是否成功。例如，国际象棋程序可能会收到一个感知，提示它已将死对手，但它需要一个性能标准来知道这是一件好事。确定性能标准很重要。从概念上讲，应该把它看作完全在智能体之外，智能体不能修改性能标准以适应自己的行为。4.4.2学习型智能体学习型智能体的最后一个组件是问题生成器。它负责建议动作，这些动作将获得全新和信息丰富的经验。如果性能元素完全根据自己的方式，它会继续选择已知最好的动作。但如果智能体愿意进行一些探索，并在短期内做一些可能不太理想的动作，那么从长远来看，它可能会发现更好的动作。问题生成器的工作是建议这些探索性行动。这就是科学家在进行实验时所做的。伽利略并不认为从比萨斜塔顶端扔石头本身有价值。他并不是想要打碎石头或改造不幸行人的大脑。他的目的是通过确定更好的物体运动理论来改造自己的大脑。4.4.2学习型智能体学习元素可以对智能体图中显示的任何“知识”组件进行更改。最简单的情况是直接从感知序列学习。观察成对相继的环境状态可以让智能体了解“我的动作做了什么”以及“世界如何演变”以响应其动作。例如，如果自动驾驶出租车在湿滑路面上行驶时进行一定程度的刹车，那么它很快就会发现实际减速多少，以及它是否滑出路面。问题生成器可能会识别出模型中需要改进的某些部分，并建议进行实验，例如在不同条件下的不同路面上尝试刹车。无论外部性能标准如何，改进基于模型的智能体的组件，使其更好地符合现实几乎总是一个好主意。4.4.2学习型智能体（从计算的角度来看，在某些情况下简单但稍微不准确的模型比完美但极其复杂的模型更好。）当智能体试图学习反射组件或效用函数时，需要外部标准的信息。从某种意义上说，性能标准将传入感知的一部分区分为奖励或惩罚，以提供对智能体行为质量的直接反馈。更一般地说，人类的选择可以提供有关人类偏好的信息。例如，假设出租车不知道人们通常不喜欢噪声，于是决定不停地按喇叭以确保行人知道它即将到来。随之而来的人类行为，如盖住耳朵、说脏话甚至可能剪断喇叭上的电线，将为智能体提供更新其效用函数的证据。4.4.2学习型智能体总之，智能体有各种各样的组件，这些组件可以在智能体程序中以多种方式表示，因此学习方法之间似乎存在很大差异。然而，主题仍然是统一的：智能体中的学习可以概括为对智能体的各个组件进行修改的过程，使各组件与可用的反馈信息更接近，从而提升智能体的整体性能。4.4.2学习型智能体智能体程序由各种组件组成，组件表示了智能体所处环境的各种处理方式。我们通过一个复杂性和表达能力不断增加的方式来描述，即原子表示、因子化表示和结构化表示。例如，我们来考虑一个特定的智能体组件，处理“我的动作会导致什么”。这个组件描述了采取动作的结果可能在环境中引起的变化。

图4-5表示状态及其转移的3种方法4.4.3智能体程序组件的工作图4-5（a）中，原子表示一个状态（如B或C）是没有内部结构的黑盒；图4-5（b）中因子化表示状态由属性值向量组成，值可以是布尔值、实值或一组固定符号中的一个；图4-5（c）中结构化表示状态包括对象，每个对象可能有自己的属性以及与其他对象的关系。4.4.3智能体程序组件的工作在原子表示中，世界的每一个状态都是不可分割的，它没有内部结构。考虑这样一个任务：通过城市序列找到一条从某个国家的一端到另一端的行车路线。为了解决这个问题，将世界状态简化为所处城市的名称就足够了，这就是单一知识原子，也是一个“黑盒”，唯一可分辨的属性是与另一个黑盒相同或不同。搜索和博弈中的标准算法、隐马尔可夫模型以及马尔可夫决策过程都基于原子表示。4.4.3智能体程序组件的工作因子化表示将每个状态拆分为一组固定的变量或属性，每个变量或属性都可以有一个值。考虑同一个驾驶问题，即我们需要关注的不仅仅是一个城市或另一个城市的原子位置，可能还需要关注油箱中的汽油量、当前的北斗导航坐标、油量警示灯是否工作、通行费、收音机频道等。两个不同的原子状态没有任何共同点（只是不同的黑盒），但两个不同的因子化状态可以共享某些属性（如位于某个导航位置），而其他属性不同（如有大量汽油或没有汽油），这使得研究如何将一种状态转换为另一种状态变得更加容易。人工智能的许多重要领域都基于因子化表示，包括约束满足算法、命题逻辑、规划、贝叶斯网络以及各种机器学习算法。4.4.3智能体程序组件的工作此外，我们还需要将世界理解为存在着相互关联的事物，而不仅仅是具有值的变量。例如，我们可能注意到前面有一辆卡车正在倒车进入一个奶牛场的车道，但一头奶牛挡住了卡车的路。这时就需要一个结构化表示，可以明确描述诸如奶牛和卡车之类的对象及其各种不同的关系。结构化表示是关系数据库和一阶逻辑、一阶概率模型和大部分自然语言理解的基础。事实上，人类用自然语言表达的大部分内容都与对象及其关系有关。4.4.3智能体程序组件的工作PART05智能代理技术大部分的人工智能应用都是一个独立和庞大的程序系统，通常系统在前期的实验性操作取得成功之后，却无法按比例放大至所需要的规模，因为系统将变得太过庞大而运作太慢。当然，也可以利用其他途径来扩大规模，但常常又伴随着难以理解甚至无法理解作为代价。因此，人们开发了智能代理来解决这些问题。智能代理的复杂性源于不同简单程序间的相互作用。由于程序本身很小，行动范围有限，所以系统是能够被理解的。4.5智能代理技术智能代理是定期地收集信息或执行服务的程序，它不需要人工干预，具有高度智能性和自主学习性，可以根据用户定义的准则，主动地通过智能化代理服务器为用户搜集最感兴趣的信息，然后利用代理通信协议把加工过的信息按时推送给用户,并能推测出用户的意图，自主制订、调整和执行工作计划。通常，广义的智能代理包括人类、物理世界中的移动机器人和信息世界中软件机器人，而狭义的智能代理则专指信息世界中的软件机器人，它是代表用户或其他程序，以

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

人工智能通识教程第2版课件第3、4章大数据与人工智能、智能体与智能代理

文档简介

温馨提示

最新文档

评论

人工智能通识教程 第2版 课件 第3、4章 大数据与人工智能、智能体与智能代理

文档简介

温馨提示

最新文档

评论

相关文档

人工智能通识教程第2版课件第3、4章大数据与人工智能、智能体与智能代理