第一部分用搜索方法求解问题_第1页
第一部分用搜索方法求解问题_第2页
第一部分用搜索方法求解问题_第3页
第一部分用搜索方法求解问题_第4页
第一部分用搜索方法求解问题_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.8博弈作者朱福喜朱三元1.8.1概述博弈一向被认为是富有挑战性的智力的游戏,有着难以言语的魅力。博弈问题常与对策问题联系在一起。对策论(GameTheory)用数字方法研究对策问题。一般将对策问题分为零和对策和非零和对策。最典型的零和对策问题是我国古代齐王与田忌赛马的问题。该问题是齐王与田忌都有可分为上、中、下三匹马。齐王的上马、中马、下马都比田忌相应的上马、中马、下马好,但田忌的上马比齐王的中马好,田忌的中马比齐王的下马好,聪明的田忌采取了下述对策后一举取胜:作者朱福喜朱三元作者朱福喜朱三元非零和对策的例子有:囚犯难题(Theprisonerdilemma)。该问题是有两个嫌疑犯A和B,暂时还没有获得他们犯罪的确定的证据。现对他们判刑的规则是:作者朱福喜朱三元博弈虽然自古就是人与人的对弈,但自从有了计算机以后,人们开始就有用计算机下棋的想法,早在60年代就已经出现若干博弈程序,并达到较高的水平,现已出现计算机博弈程序能够与人类博弈大师抗衡的局面。举世瞻目的人机对弈是1997年IBM公司编制的深蓝(deepblue)计算机与国际象棋大师卡斯帕罗夫对弈,取得了三胜二和一负的好成绩。博弈的研究不断为人工智能提出新的课题,可以说博弈是人工智能研究的起源和动力之一。作者朱福喜朱三元博弈问题对人的深层次的知识研究提出了严峻的挑战。如何表示博弈问题的状态,博弈过程和博弈取胜的知识,这是目前人类仍在探讨之中的问题。要提高博弈问题求解程序的效率,应作到如下两点:改进生成过程,使之只生成好的走步,如按棋谱的方法生成下一步;改进测试过程,使最好的步骤能够及时被确认。作者朱福喜朱三元要达到上述目的有效途径是使用启发式方法引导搜索过程,使其只生成可能赢的走步。而这样的博弈程序应具备:一个好的(即只产生可能赢棋步骤的)生成过程。一个好的静态估计函数。下面介绍博弈中两种最基本的搜索方法。作者朱福喜朱三元1.8.2极小极大搜索过程1.极小极大搜索的思想极小极大搜索策略是考虑双方对弈若干步之后,从可能的步中选一步相对好的走法来走,即在有限的搜索深度范围内进行求解。为此要定义一个静态估计函数f,以便对棋局的势态作出优劣估计。这个函数可根据棋局优劣势态的特征来定义。作者朱福喜朱三元这里规定:MAX代表程序方MIN代表对手方P代表一个棋局(即一个状态)有利于MAX的势态,f(P)取正值有利于MIN的势态,f(P)取负值势态均衡,f(P)取零f(P)的大小由棋局势态的优劣来决定。作者朱福喜朱三元使用静态函数进行估计必须以下述两个条件为前提:(1)双方都知道各自走到什么程度、下一步可能做什么。(2)不考虑偶然因数影响。在这个前提下,博弈双方必须考虑:(1)如何产生一个最好的走步。(2)如何改进测试方法,能尽快搜索到最好的走步。作者朱福喜朱三元MINMAX的基本思想是:(1)当轮到MIN走步的结点时,MAX应考虑最坏的情况(因此,f(p)取极小值)。(2)当轮到MAX走步的结点时,MAX应考虑最好的情况(因此,f(p)取极大值)。(3)当评价往回倒推时,相应于两位棋手的对抗策略,不同层上交替的使用(1)、(2)两种方法向上传递倒推值。作者朱福喜朱三元2.极小极大搜索算法极小极大过程的算法如下:1.T:=(s,MAX),OPEN:=(s),CLOSED:=();{开始时树由初始结点构成,OPEN表只含有s.}2.LOOP1:IFOPEN=()THENGOLOOP2;3.n:=FIRST(OPEN),REMOVE(n,OPEN),ADD_TO_LAST(n,CLOSED);//约定加到尾部作者朱福喜朱三元4.IFn可直接判定为赢、输或平局THENf(n):=∞∨-∞∨0,GOLOOP1ELSEEXPAND(n)→ni,ADD({ni},T)IFd({n})<kTHENADD_TO_LAST({ni},OPEN),GOLOOP1ELSE计算f(ni),GOLOOP1;{n达到深度k,计算各端结点f值}5.LOOP2:IFCLOSED=NILTHENGOLOOP3ELSEnp:=LAST(CLOSED);作者朱福喜朱三元6.IF(np∈MAX)∧(f(nc∈iMIN)有值)(其中nci为np的下一层节点)THENf(np):=MAX{f(nci)},REMOVE(np,CLOSED);{若MAX所有子节点均有值,则该MAX取其极大值。}IF(np∈

MIN)∧(f(nci

∈MAX)有值)THENf(np):=MIN{f(nci)},REMOVE(np,CLOSED);{若MIN所有子节点均有值,则该MIN取其极小值。}作者朱福喜朱三元7.GOLOOP2;8.LOOP3:IFf(s)=NILTHENEXIT(END∨Mark(Move,T));{s有值,或结束或标记走步}其中ADD_TO_LAST约定加入节点到表的尾部,END表示失败或成功或平局退出,MARK标记一个走步。作者朱福喜朱三元3.算法膏分析添与举鸟例该算贴法分掏三个虚阶段课进行征。第一太阶段汉为步梨骤2-4,使写用宽糠度优凝先法贴生成环规定乱深度娇的全侍部博兰弈树境,然插后对乌其所内有端螺节点基计算鄙其静授态估移计函么数值钟。第二阁阶段办为步醋骤5-7是从拼底向津上逐孕级求净非终缸结点贸的倒方推估害计值古,直块到求哈出初屯始节脱点的烈倒推闻值f(弯s)为止订。f(相s)的值块应为ma扶x肉mi冠n…除.饥{f够(ni1堆i2格i3着…ik)},其吼中nik表示膊深度袍为k的端镰节点被。第三桃阶段彼,根川据f(s)可选炕的相赤对好卖的走榜步,验由Ma葛rk插(裳Mo阁ve窑,嘴T成)标记衫走步寻。作者余朱怜福喜击朱三叨元例1.拴25在九轮宫格晚棋盘泳上两眉位选纪手轮肉流在葡棋盘势上摆均各自瓣的棋底子,朝每次烫一枚殿,谁戴先取镜得三饶子一矮线的垦结果祝就取拿胜。设程薄序方MA和X的棋女子用X表示对手顾方MI表N的棋至子用O表示.作者盒朱明福喜练朱三佳元静态伤估计挪函数窃为:+∞当p为MA士X赢f(愈p)新=距-∞当p为MI漫N赢全部纤空格所放X后三畏字成注一线疾的总景数)-(全贱部空鼓格放O后三尘字成刘一线吧的总旱数)例如君,P的格过局为宝:作者驳朱赞福喜竞朱三托元则可覆得f(陆p)=项5惨–消6价=响-1。现在衣考虑苗走两妈步的条搜索沿过程可,即维算法董中K=馅2。利控用棋黎盘对鬼称性迷条件绍,则MA环X走第衔一步射棋调罢用算绪法产楼生搜某索树浮如图2-单46所示浇。作者穷朱退福喜办朱三微元作者漂朱阔福喜肢朱三秀元作者级朱芽福喜且朱三鉴元作者疮朱唇福喜炭朱三村元1.朴8.彩3α-隙β剪枝秆算法作者狠朱澡福喜椒朱三团元这时穿其中邪一个MI枝N节点萄要生聋成A,蜓B,租C,绵D四个犁节点秧,然踪蝶后逐闻个计疯算其评静态摊估计狮值,距最后话求得舰倒推溪值-∞,把零它赋目给这粒个结抗点。素其实组生成名节点A后,烘如果稿马上仔进行衫静态疫估计拿,得讯知F(阶A)库=伪-∞之后伐,就糖可以倍断定歼生成B,扔C,颠D以及党进行佣估计却是多贴余的辜,该MI血N节点转的倒研推值疏一定皮是-∞。作者绵朱病福喜课朱三炉元α-递β剪枝妖法就心是把鸣生成也后继浆和倒础推值肥估计稍结合行起来按,及呜时剪某掉一乔些无陶用分期枝,悠以此彩来提荷高算茶法的昼效率严。α-吊β剪枝阁法,享采用亩有界促深度淘优先电策略伶进行召搜索掘,当教生成哲节点绣达到奇规定抗的深色度时悔,就疮立即贤进行竞静态伞估计框,而规一旦由某个初非端已节点阶有条绢件确仆定倒稿推值细时,俘就立纳即赋患值。作者挣朱倍福喜锡朱三份元当生芦成到球节点6后,照节点1的倒瘦推值剖可确砌定为-1。作者骑朱躲福喜寇朱三港元这时龟对于熄初始巧节点S来说酿,虽纵然其辟他子痒节点比尚未阔生成岸,但铅由于S属于茄极大发层,厦所以介可以榆推断求它的管倒推拖值不遵会小垃于-1。我们由定义触极大棍层的么这个薪下界番值为α。因石此S的α=该-史1。S的α值为-1,说帖明的S倒推邪值不招会比-1更小心,但论会不纯会比-1更大仿,还皱取决驼于其顷他后哭继节累点倒秩推值您。我孤们继寻续生革成搜唯索树录。当第8个节调点生胞成后谜,其尝估计调值为-1,就踢可以箭断定助节点7的倒晒推值害不可阔能大弹于-1。作者番朱饱福喜迅朱三础元定义蹈极小厘层的玻这个左上界哨值为β。因此匙现在奸可以咸确定冷节点7的β=拘-交1。有了死极小娃层的β值茄,容例易发夹现α≥盐β时,颠节点7的其扁他子括节点督不必司生成克,因饱为S的极头大值咬不可恨能比弯这个β值小迹,再色生成量无疑汇是多布余的辅,因孟此可喘以进递行剪乐枝。只要家在搜勇索过登程中太记住辅倒推碰值的虑上下盗界并干进行泥比较溉,当α≥哪β时就糠可以恢实现公修剪萍操作坏。作者发朱子福喜思朱三作元α,β值还诊可以饼随时涉修正伸,但幕极大悠层的α倒推蔬值下课界永布不下懂降,售因为嫁实际勒的倒蹲推值蜻取后禽继节公点最眠终确喂定的敏倒推县值中擦的最冬大者秧。同理恰,极崖小层嚼的倒捏推值营上界β永不波上升弹,因病为实竹际倒何推值景取后戒继节笔点最庭终确俭定的狸倒推冶值中姑的最漏小者道。作者银朱搭福喜乳朱三具元α-蛋β过程辣的剪兼枝规众则(1)α剪枝屋:若寸任一雕极小醒值层修节点授的β值小恨于或翁等于天它任夫一先卸辈极撞大值亮层节问点的α值,锦即α(先阳辈层保)≥β(后茄继层钩),刚则可固中止渴该极父小值艰层中蝇这个巧节点衣以下脱的搜顷索。抹该节阳点最呀终

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论