版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六讲博弈与启发式及极大极小思想博弈:诸如下棋、打牌、战争等一类竞争性的智能活动。其中最简单的一种称为双方完备博弈
博弈是AI研究的起源和动力之一,是启发式算法所针对的一个重要领域1、提供了可构造的任务领域,能明确判断成功或失败2、博弈问题是对AI研究提出了严峻的挑战。
如何表示博弈问题的状态、博弈的过程和博弈的知识?博弈是二人博弈、全信息、非偶然博弈、博弈双方利益完全对立,过程:(1)对垒双方MAX和MIN轮流采取行动。结果:MAX胜、MIN败;MAX败,MIN胜;和局。(2)对垒过程中,任何一方都了解当前的格局和过去的历史(3)任何一方在采取行动前都要根据当前实际情况,进行得失分析,选自对己最有利而对对方最不利的对策,不存在碰运气成分。6.1博弈过程6.2博弈树博弈树当某一方当前有多个行动方案可供选择时,他总是选择对自己最为有利而对对方最为不利的那个行动方案。当轮到A方走棋时,则可供A方选择的若干个行动方案之间是“或”的关系。轮到B方走棋时,B方也有若干个可供选择的行动方案,但此时这些行动方案对A方来说它们之间是“与”的关系。使用与或图(与或树)来表示博弈过程,叫做博弈树。6.3示例例子:假设有7枚硬币,任一选手只能将已分好的1堆钱币分成两堆个数不等的钱币,2位选搜轮流进行,直到每一堆都只有1枚或2枚钱币,不能再分为止,哪个选手遇到不能再分的情况,则为输。6.3示例分析每种状态把钱币分成一堆或多堆.每一层根据根据这一步由谁来执行,标上MAX/MIN。如下图MIN7表示只有1个7枚钱币的堆,由MIN来选择划分。每个叶子节点有一个1或0的值,代表MAX获胜还是MIN获胜
(1)如果父状态是MAX节点,将孩子中最大的值赋给它(2)如果父状态是MIN节点,将孩子中最小的值赋给它MIN76,15,24,35,1,14,2,13,2,23,3,14,1,1,13,2,1,12,2,2,13,1,1,1,12,1,1,1,1,12,2,1,1,11111011110000MAXMINMAXMINMAX06.4极大极小搜索思想1、极大极小策略是考虑双方对弈若干步之后,从可能的步中选一步相对好的步法来走,即在有限的搜索深度范围内进行求解定义一个静态估价函数f,以便对棋局的态势作出优劣评估
规定:MAX和MIN代表对弈双方P代表一个棋局(即一个状态)有利于MAX的态势,f(p)取正值有利于MIN的态势,f(p)取负值态势均衡,f(p)取零值2、MINMAX的基本思想:(1)当轮到MIN走步时,MAX应该考虑最坏的情况(即f(p)取极小值)(2)当轮到MAX走步时,MAX应该考虑最好的情况(即f(p)取极大值)(3)评价往回倒推时,相应于两位棋手的对抗策略,交替使用(1)和(2)两种方法传递倒推值。6.5算法分析和举例例子:一字棋(或井字棋)算法分析设棋局为P,估价函数为e(P)。规定:(1)若P对任何一方来说都不是获胜的位置,则e(P)=e(所有空格都放上MAX的棋子后三字成一线的总数)-e(所有空格都放上MIN的棋子后三字成一线的总数)(2)若P是MAX必胜的棋局,则e(P)=+∞。(3)若P是MIN必胜的棋局,则e(P)=-∞。
比如P如右图示,则e(P)=6-4=2叉代表MAX
方,圆圈代表MIN方
向上值的传播规则:若父状态在MIN层,那么孩子中最小值被传递上去若父状态在MAX层,那么孩子中最大值被传递上去6.7算法分析②
现在图中MAX有两个可能“最好的”优先走步,假设MAX走了图上指明的那一步
MAXMIN6.9总结不足:1、地平线效应:即由于被搜索有限层深度时所发现特别好的状态引诱而遭到沉重打击它有限搜索状态空间中搜索,具体数字是由可用的时间和空间资源来决定的。我们称这种策略为N-层预判。其中n是要搜索的层数。由于这个子图的叶子节点不是博弈的最终状态,所以按照胜利或失败来为这些状态赋值是不可能的。相反需要根据某个启发评估函数给每个节点赋一个值。这个向上传播的值并不表示最佳状态的启发值,它只代表从当前节点通过N次移动可以达到的最佳状态的启发值。也是最重要的一点,在固定层深情况下作出的评估可能完全是误导性的。因为当把一个启发用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高中英语 课文语法填空 新人教版必修
- 第2章 动物体的基本结构与机能课件
- 学校公共场所卫生管理与监督课件
- 安全生产课件下载
- 2024届山西省太原市六十六中高三一轮摸底数学试题
- 第3章 圆的基本性质 浙教版数学九年级上册综合测试卷(含答案)
- 常用的脑筋急转弯及答案
- 5年中考3年模拟试卷初中道德与法治七年级下册第四单元素养综合检测
- 高考语文作文主题讲解之 人才评价
- 代管保安人员协议书
- 阀门手册:使用与维修
- 部编版语文八年级上册第二单元字音字形练习题(含解析)
- 四川卷烟营销战略及策略的中期报告
- 临床诊疗指南第三版电子书
- 我国民营企业发展中存在的问题及对策研究
- PFMEA-注塑过程模板
- 2023矿业权评估师考试题库大全(附答案)
- 广东省建设用地土壤污染修复工程环境监理技术指南(试行)
- 《基础医学概论》教学大纲
- 维吾尔自治区某引水枢纽施工组织设计
- 劳动教育《蒸馒头》课件
评论
0/150
提交评论