版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能原理与应用5.2-博弈树搜索第一页,共46页。20世纪60年代,研制出的西洋跳棋和国际象棋的博弈程序达到了大师级的水平。1958约翰•麦卡锡提出博弈树搜索算法1997年,IBM公司研制的“深蓝”国际象棋程序,采用博弈树搜索算法,该程序战胜了国际象棋世界冠军卡斯帕罗夫。1.概述第二页,共46页。正在与深蓝下棋的卡斯帕罗夫第三页,共46页。博弈问题特点:双人对弈,轮流走步。信息完备,双方所得到的信息是一样的。零和,即对一方有利的棋,对另一方肯定是不利的,不存在对双方均有利或无利的棋。1.概述第四页,共46页。博弈的特性两个棋手交替地走棋;比赛的最终结果,是赢、输和平局中的一种;可用图搜索技术进行,但效率很低;博弈的过程,是寻找置对手于必败态的过程;双方都无法干预对方的选择。1.概述第五页,共46页。2.Grundy博弈下棋的双方是对立的,命名博弈的双方,一方为“正方”,这类节点称为“MAX”节点;另一方为“反方”,这类节点称为“MIN”节点。正方和反方是交替走步的,因此MAX节点和MIN节点会交替出现。第六页,共46页。2.Grundy博弈Grundy博弈是一个分钱币的游戏。有一堆数目为N的钱币,由两位选手轮流进行分堆,要求每个选手每次只把其中某一堆分成数目不等的两小堆。例如,选手甲把N分成两堆后,轮到选手乙就可以挑其中一堆来分,如此进行下去,直到有一位选手先无法把钱币再分成不相等的两堆时就得认输。第七页,共46页。2.Grundy博弈设初始状态为(7,MIN),建立问题的状态空间图,图中所有终结点均表示该选手必输的情况,取胜方的目标是设法使棋局发展为结束在对方走步时的终结点上。第八页,共46页。MIN先走MAX必胜2.Grundy博弈第九页,共46页。结点A是MAX的搜索目标,而结点B,C则为MIN的搜索目标。2.Grundy博弈第十页,共46页。搜索策略要考虑的问题是:对MIN走步后的每一个MAX结点,必须证明MAX对MIN可能走的每一个棋局对弈后能获胜,即MAX必须考虑应付MIN的所有招法,这是一个与的含意,因此含有MAX符号的结点可看成与结点。
2.Grundy博弈第十一页,共46页。对MAX走步后的每一个MIN结点,只须证明MAX有一步能走赢就可以,即MAX只要考虑能走出一步棋使MIN无法招架就成,因此含有MIN符号的结点可看成或结点。2.Grundy博弈第十二页,共46页。对弈过程的搜索图呈现出与或图表示的形式。实现一种取胜的策略就是搜索一个解图的问题,解图就代表一种完整的博弈策略。2.Grundy博弈第十三页,共46页。中国象棋一盘棋平均走50步,总状态数约为10的161次方。假设1毫微秒走一步,约需10的145次方年。结论:不可能穷举。3.极小极大搜索过程第十四页,共46页。对各个局面进行评估评估的目的:对后面的状态提前进行考虑,并且以各种状态的评估值为基础作出最好的走棋选择。评估的方法:用评价函数对棋局进行评估。赢的评估值设为+∞,输的评估值设为-∞,平局的评估值设为0。评估的标准:由于下棋的双方是对立的,只能选择其中一方为评估的标准方。3.极小极大搜索过程第十五页,共46页。MAX节点和MIN节点命名博弈的双方,一方为“正方”,对每个状态的评估都是对应于该方的输赢的。例如,赢2个,输1个等,都是指正方的。正方每走一步,都在选择使自己赢得更多的节点,因此这类节点称为“MAX”节点;3.极小极大搜索过程第十六页,共46页。另一方为“反方”,对每个状态的评估都是对应于对手的输赢的。例如,赢2个,输一个,其实是指自己输2个,赢1个的。反方每走一步,都在选择使对手输得更多的节点,因此这类节点称为“MIN”节点。3.极小极大搜索过程第十七页,共46页。由于正方和反方是交替走步的,因此MAX节点和MIN节点会交替出现。3.极小极大搜索过程第十八页,共46页。正方(MAX节点)从所有子节点中,选取具有最大评估值的节点。反方(MIN节点)从其所有子节点中,选取具有最小评估值的节点。反复进行这种选取,就可以得到双方各个节点的评估值。这种确定棋步的方法,称为极小极大搜索法。
3.极小极大搜索过程第十九页,共46页。3.极小极大搜索过程第二十页,共46页。5-333-3022-30-23541-30689-3MINMAX0MAXMIN3.极小极大搜索过程第二十一页,共46页。015-333-3022-30-23541-30689-30-33-3-3-21-36-3031601MAXMINMAXMIN3.极小极大搜索过程第二十二页,共46页。
在九宫格棋盘上,两位选手轮流在棋盘上摆各自的棋子(每次一枚),谁先取得三线的结果就取胜。设程序方MAX的棋子用(×)表示,MAX先走。对手MIN的棋子用(o)表示。例如:3.极小极大搜索过程MIN取胜第二十三页,共46页。
估计函数f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成线数)-(所有空格都放上MIN的棋子之后,MIN的三子成线的总数)
若P是MAX获胜的格局,则f(p)=+∞;若P是MIN获胜的格局,则f(p)=-∞。3.极小极大搜索过程第二十四页,共46页。3.极小极大搜索过程估计函数值f(p)=6-4=2估计函数f(p)=(所有空格都放上MAX的棋子之后,MAX的三子成线(行、列、对角)数)-(所有空格都放上MIN的棋子之后,MIN的三子成线(行、列、对角)的总数)当前棋局f(p)=2第二十五页,共46页。3.极小极大搜索过程一字棋第一阶段搜索树第二十六页,共46页。3.极小极大搜索过程一字棋第二阶段搜索树第二十七页,共46页。3.极小极大搜索过程一字棋第三阶段搜索树第二十八页,共46页。
设有一个摆放三个子的棋盘残局,如下图所示,〇和╳在结束前有三步棋可以走,而且设走第一步的是╳。这时存在着三个空格A,B,C,用博弈树搜索算法判断应该把棋子放到哪一格内。
AB╳╳╳〇〇C〇棋盘残局举例:3.极小极大搜索过程第二十九页,共46页。AB╳╳╳〇〇C〇╳B╳╳╳〇〇C〇╳〇╳╳╳〇〇C〇╳B╳╳╳〇〇〇〇0A╳╳╳╳〇〇C〇〇╳╳╳╳〇〇C〇A╳╳╳╳〇〇〇〇AB╳╳╳〇〇╳〇〇B╳╳╳〇〇╳〇A〇╳╳╳〇〇╳〇-1-0-10--0MAX节点MIN节点终端节点3.极小极大搜索过程第三十页,共46页。
对于棋盘残局中的╳来说,最好的选择,是将╳放在C的位置上,这时可以导致平局局面。
3.极小极大搜索过程第三十一页,共46页。-剪支法的引入在极小极大法中,必须求出所有终端节点的评估值,当预先考虑的棋步比较多时,计算量会大大增加。为了提高搜索的效率,引入了通过对评估值的上下限进行估计,从而减少需进行评估的节点范围的-剪支法。4.-搜索过程第三十二页,共46页。
作为正方出现的MAX节点,假设它的MIN子节点有N个,那么当它的第一个MIN子节点的评估值为时,则对于其它的子节点,如果有高过的,就取那最高的值作为该MAX节点的评估值;如果没有,则该MAX节点的评估值为。总之,该MAX节点的评估值不会低于,这个就称为该MAX节点的评估下限值。4.-搜索过程
MAX节点的评估下限值
第三十三页,共46页。MIN节点的评估上限值
作为反方出现的MIN节点,假设它的MAX子节点有N个,那么当它的第一个MAX子节点的评估值为时,则对于其它子节点,如果有低于的,就取那个低于的值作为该MIN节点的评估值;如果没有,则该MIN节点的评估值取。总之,该MIN节点的评估值不会高过,这个就称为该MIN节点的评估上限值。4.-搜索过程第三十四页,共46页。剪支法
MAX节点MIN节点=剪支ABCD4.-搜索过程
设MAX节点的下限为,则其所有的MIN子节点中,其评估值的上限小于等于的节点,其以下部分的搜索都可以停止了,即对这部分节点进行了剪支。第三十五页,共46页。
设MIN节点的上限为,则其所有的MAX子节点中,其评估值的下限大于等于的节点,其以下部分的搜索都可以停止了,即对这部分节点进行了剪支。MAX节点MIN节点=剪支ABCD4.-搜索过程剪支法
第三十六页,共46页。ABCDEFGHIJKLNOM4.-搜索过程MAX节点MAX节点MIN节点终端节点35652164第三十七页,共46页。MAX节点(5,)35652164(6,)(2,)(-,5)(-,2)(5,)MIN节点终端节点剪支剪支ABCDEFGHIJKLNOMMAX节点4.-搜索过程第三十八页,共46页。一字棋第一阶段-剪支方法4.-搜索过程第三十九页,共46页。4.-搜索过程极大节点的下界为。极小节点的上界为。剪支的条件:后辈节点的值≤祖先节点的值时,剪支后辈节点的值≥祖先节点的值时,剪支简记为:极小≤极大,剪支极大≥极小,剪支第四十页,共46页。4.-搜索过程86-31453-3503-3022-30-2309-300-303305411-31661abcdefghijkmnMAXMINMAXMIN第四十一页,共46页。改进方法
使用-剪支技术,当不满足剪支条件(即)时或值比值大不了多少或极相近时,这时也可以进行剪支,以便有条件把搜索集中到会带来更大效果的其他路径上,这就是中止对效益不大的一些子树的搜索,以提高搜索效率。
4.-搜索过程第四十二页,共46页。
不严格限制搜索的深度。当到达深度限制时,如出现博弈格局有可能发生较大变化时,则应多搜索几层,使格局进入较稳定状态后再中止,这样可使倒推值计算的结果比较合理,避免考虑不充分产生的影响,这是等候状态平稳后中止搜索的方法。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《机械设计基础》-试卷8
- 《机床电气控制》试卷13
- 吉林艺术学院《透视学》2021-2022学年第一学期期末试卷
- 吉林艺术学院《改革开放史》2021-2022学年第一学期期末试卷
- 2024年公园绿化经营合同范本
- 吉林师范大学《艺术实践与创作》2021-2022学年第一学期期末试卷
- 2022年河北省公务员录用考试《行测》真题及答案解析
- 2024年大客车出租租赁合同范本
- 绞肉机买卖合同协议书范文
- 2022年公务员多省联考《申论》真题(重庆二卷)及答案解析
- 桥湾750kV变电站工程330kV构支架安装技术措施(1)
- 电动机的维护与保养毕业论文
- 部编版二年级上册道德与法治第二单元 我们的班级 达标测试卷及答案28
- 模拟真实天平(flash模拟型课件)
- 山东生态功能区划(文字)
- DFMEA模板(完整版)
- 发电机组达标投产自查报告
- 2021年贵州高考理综试题含答案
- 《财务管理学》知识点归纳(精华)
- 管道缩写代号.xlsx
- 英格索兰空压机服务协议
评论
0/150
提交评论