第三讲动态博弈及逆向归纳法

上传人：6*** IP属地：湖北上传时间：2021-10-17 格式：PPT 页数：79 大小：146.50KB 积分：28 举报 版权申诉

已阅读5页，还剩74页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、趣味博弈论杨驭云华南师范大学南海校区第三讲动态博弈与逆向归纳法动态博弈博弈的本质在于各参与者的决策相互依博弈的本质在于各参与者的决策相互依存，这种相互作用或者互动通过两种方式体存，这种相互作用或者互动通过两种方式体现出来。现出来。第一种方式：参与者同时行动或者虽非第一种方式：参与者同时行动或者虽非同时行动，但后行动者并不知道先行动者的同时行动，但后行动者并不知道先行动者的选择。比如石头、剪刀、布，还有囚徒困境。选择。比如石头、剪刀、布，还有囚徒困境。这一类博弈称为静态博弈。这一类博弈称为静态博弈。第二种方式：参与者的行动有先后顺序，第二种方式：参与者的行动有先后顺序，后行动者

2、可以观察到先行动者做了什么选择，后行动者可以观察到先行动者做了什么选择，先行动者的选择影响后行动者的选择空间。先行动者的选择影响后行动者的选择空间。此类博弈称为动态博弈。此类博弈称为动态博弈。21支旗游戏美国哥伦比亚广播公司的电视真人秀节美国哥伦比亚广播公司的电视真人秀节目目Survivor （幸存者）中有这样一个（幸存者）中有这样一个游戏：游戏：地面插着地面插着21支旗，两个人轮流移走这支旗，两个人轮流移走这些旗。每个人在轮到自己时可以选择移走些旗。每个人在轮到自己时可以选择移走1支、支、2支或支或3支旗。拿走最后支旗。拿走最后1支旗的人获胜，支旗的人获胜，无论这支旗是最后无论这支旗是

3、最后1支，还是支，还是2支或支或3支中的支中的一支。一支。请大家两两配对来玩这个游戏，轮流充请大家两两配对来玩这个游戏，轮流充当先行者。时间为当先行者。时间为10分钟。分钟。你是跟着感觉走来玩这个游戏吗？你是跟着感觉走来玩这个游戏吗？你是否发现越玩到后面、剩下的旗越少你是否发现越玩到后面、剩下的旗越少的时候就越清晰地知道自己正确的策略是什的时候就越清晰地知道自己正确的策略是什么？么？那就让我们向前展望、倒后推理，即面那就让我们向前展望、倒后推理，即面向未来，思考现在，站在未来的立场来确定向未来，思考现在，站在未来的立场来确定现在的最优行动。现在的最优行动。倒数第二步，你必须留给对方倒

4、数第二步，你必须留给对方4支旗。支旗。倒数第三步，你必须留给对方倒数第三步，你必须留给对方8支旗。支旗。依此类推，你必须依次给对方留下依此类推，你必须依次给对方留下12、16、20支旗来确保取胜。支旗来确保取胜。所以，在这个游戏中，先行者能确保取所以，在这个游戏中，先行者能确保取胜。胜。但如果游戏开始时是但如果游戏开始时是20支旗，那么后支旗，那么后行者能确保取胜行者能确保取胜。n这是一个典型的完全完美信息动态博弈。这是一个典型的完全完美信息动态博弈。n完全信息：每个参与者的策略集合及收益函完全信息：每个参与者的策略集合及收益函数均为博弈各方的共同知识。数均为博弈各方的共同知识。 n完

5、美信息：每个参与者都知道先前行动的参完美信息：每个参与者都知道先前行动的参与者采取了什么策略。与者采取了什么策略。n序贯理性：每个参与者在其每一个决策时点序贯理性：每个参与者在其每一个决策时点上都将重新优化自己的选择，并且会把自己上都将重新优化自己的选择，并且会把自己将来会重新优化其选择这一点也纳入当前的将来会重新优化其选择这一点也纳入当前的优化决策当中。优化决策当中。n在序贯理性下不会有在序贯理性下不会有“后悔后悔”出现。出现。n“每个参与者是序贯理性的每个参与者是序贯理性的”是博弈的共同是博弈的共同知识。知识。序贯理性n逆向归纳法：按与博弈进行顺序相反的方向逆向归纳法：按与博弈进行顺序相反

6、的方向逐一找出每个参与者在其所有决策时点上的逐一找出每个参与者在其所有决策时点上的最优策略选择，直到第一个决策时点为止。最优策略选择，直到第一个决策时点为止。n“每个参与者是序贯理性的每个参与者是序贯理性的”是逆向归纳法是逆向归纳法的基础。的基础。逆向归纳法索马里海盗人力资源部招聘启事你忍心蜗居在不到你忍心蜗居在不到10平米的小屋里吗？你忍平米的小屋里吗？你忍心看着自己的女友和你奋斗一辈子还供不起一套房心看着自己的女友和你奋斗一辈子还供不起一套房吗？你忍心看着父母缩衣节食把仅有的一点养老金吗？你忍心看着父母缩衣节食把仅有的一点养老金帮你还房贷吗？帮你还房贷吗？这里才是实现你梦想的地方。加入

7、我们，待遇这里才是实现你梦想的地方。加入我们，待遇从优，装备齐全，食宿全免，一条大裤衩，一双人从优，装备齐全，食宿全免，一条大裤衩，一双人字拖，一把字拖，一把AK47，800美元底薪美元底薪+提成，全天移提成，全天移动式海景套房，多劳多得。只要大干一票，在大都动式海景套房，多劳多得。只要大干一票，在大都市买楼不再是梦想；干两票，跻身上层社会，直接市买楼不再是梦想；干两票，跻身上层社会，直接与奥巴马对话不再是距离。别再犹豫了，给你一片与奥巴马对话不再是距离。别再犹豫了，给你一片海域，换你一生奇迹！海域，换你一生奇迹！海盗分金有有10名海盗抢得了名海盗抢得了100块金子，并打算瓜分这块金子，并打

8、算瓜分这些战利品。这是一些讲民主的海盗，也就是遵循少些战利品。这是一些讲民主的海盗，也就是遵循少数服从多数原则，他们按照习惯的方式进行分配：数服从多数原则，他们按照习惯的方式进行分配：最厉害的一名海盗提出分配方案，然后所有的海盗最厉害的一名海盗提出分配方案，然后所有的海盗包括提出方案本人就此方案进行表决。如果半数以包括提出方案本人就此方案进行表决。如果半数以上（含半数）的海盗赞同这一方案，那么这一方案上（含半数）的海盗赞同这一方案，那么这一方案就获得通过并按照这一方案进行战利品的分配；否就获得通过并按照这一方案进行战利品的分配；否则，提出方案的海盗将被扔进海里喂鲨鱼，然后剩则，提出方案的海盗将

9、被扔进海里喂鲨鱼，然后剩余海盗中最厉害的海盗又重复上述过程。余海盗中最厉害的海盗又重复上述过程。假设：没有两名海盗是同等厉害的；这假设：没有两名海盗是同等厉害的；这些金块不能再分，也不允许几名海盗共有些金块不能再分，也不允许几名海盗共有1块金子。块金子。那么，最厉害的一名海盗应该提出什么那么，最厉害的一名海盗应该提出什么样的分配方案呢？样的分配方案呢？考虑到分析的便利，这里按照这些海盗考虑到分析的便利，这里按照这些海盗能力的差异给他们编上序号。最怯懦的海能力的差异给他们编上序号。最怯懦的海盗为盗为1 1号海盗，次怯懦的海盗为号海盗，次怯懦的海盗为2 2号海盗，号海盗，依此类推，最厉害的海

10、盗为依此类推，最厉害的海盗为1010号海盗。号海盗。海盗们基于三个因素来做决定：首先，海盗们基于三个因素来做决定：首先，自己要能存活下来；其次，自己得到的利益自己要能存活下来；其次，自己得到的利益最大化；最后，在所有其它条件相同的情况最大化；最后，在所有其它条件相同的情况下，优先选择把别人扔进海里。下，优先选择把别人扔进海里。这些海盗残酷的分配规则给人的第一印这些海盗残酷的分配规则给人的第一印象是：最厉害的那名海盗是个多么不幸的人象是：最厉害的那名海盗是个多么不幸的人啊！因为作为头一个提出方案的人，仅仅能啊！因为作为头一个提出方案的人，仅仅能活下来的机会都微乎其微：即使他自己一分活下来的机

11、会都微乎其微：即使他自己一分不要，把金子全部送给另外不要，把金子全部送给另外9人，那些人可人，那些人可能也不赞同他的分配方案，那么他只有死路能也不赞同他的分配方案，那么他只有死路一条！一条！真的是这样吗？真的是这样吗？任何一个海盗想让自己的方案获得通过任何一个海盗想让自己的方案获得通过的关键是事先考虑清楚的关键是事先考虑清楚“继承者继承者”的分配方的分配方案是什么，然后拉拢案是什么，然后拉拢“继承者继承者”分配方案中分配方案中最不得意的人们，争取用最小的代价获取最最不得意的人们，争取用最小的代价获取最大收益。大收益。因此，推理过程应该是从后向前，因为因此，推理过程应该是从后向前，因为越往

12、后策略越容易看清。越往后策略越容易看清。分析的出发点应该是博弈进行到只剩两分析的出发点应该是博弈进行到只剩两名海盗，即名海盗，即1号和号和2号的时候。这时最厉害的号的时候。这时最厉害的海盗是海盗是2号，而他的最佳分配方案一目了然：号，而他的最佳分配方案一目了然：100块金子全归他一人所有，块金子全归他一人所有，1号海盗什么号海盗什么也得不到。也得不到。为什么呢？为什么呢？现在加上现在加上3号海盗。号海盗。 1号海盗知道：如果号海盗知道：如果3号的方案被否决，号的方案被否决，那么最后只剩两个海盗，而那么最后只剩两个海盗，而1号将肯定一无号将肯定一无所获；另外，所获；另外，3号也明白号也明白

13、1号了解形势。因此，号了解形势。因此，只要只要3号的分配方案给号的分配方案给1号一点儿甜头使他不号一点儿甜头使他不至于空手而归，那么不论至于空手而归，那么不论3号提出什么样的号提出什么样的分配方案，分配方案，1号都将投赞成票，因此号都将投赞成票，因此3号需要号需要分出尽可能少的一点儿金子来收买分出尽可能少的一点儿金子来收买1号海盗。号海盗。那么，那么，3号海盗会提出什么样的分配方号海盗会提出什么样的分配方案呢？案呢？答案是：答案是：3号海盗分得号海盗分得99块金子，块金子，2号号海盗一无所获，海盗一无所获，1号海盗分得号海盗分得1块金子。块金子。 4号海盗的策略也差不多。他需要有半号海盗的

14、策略也差不多。他需要有半数以上的支持票，因此同数以上的支持票，因此同3号一样也需要再号一样也需要再找一人做同谋。他可以给同谋的最低贿赂是找一人做同谋。他可以给同谋的最低贿赂是1块金子，在这里，他可以用这块金子来收块金子，在这里，他可以用这块金子来收买买2号海盗。因为如果号海盗。因为如果4号被否决而号被否决而3号得以号得以通过，则通过，则2号将一无所获。号将一无所获。因此，因此，4号的分配方案就是：号的分配方案就是：99块金子块金子归自己，归自己，2号得号得1块金子，块金子，1号和号和3号什么也号什么也得不到。得不到。 5号海盗的策略略有不同。他需要收买号海盗的策略略有不同。他需要收买另外两名

15、海盗，因此至少得用两块金子来贿另外两名海盗，因此至少得用两块金子来贿赂才能使自己的方案得到采纳。他的分配方赂才能使自己的方案得到采纳。他的分配方案应该是：案应该是： 98块金子归自己，块金子归自己，1块金子给块金子给3号，号，1块金子给块金子给1号。号。这一分析过程可以按照上述思路继续进这一分析过程可以按照上述思路继续进行下去。每个分配方案都是唯一确定的，它行下去。每个分配方案都是唯一确定的，它可以让提出这个方案的海盗获得尽可能多的可以让提出这个方案的海盗获得尽可能多的金子，同时保证该方案肯定能获得通过。金子，同时保证该方案肯定能获得通过。 10号海盗提出的方案将是：号海盗提出的方案将是：9

16、6块金子块金子归自己所有，其他编号为偶数的海盗各得归自己所有，其他编号为偶数的海盗各得1块金子，而编号为奇数的海盗什么也得不块金子，而编号为奇数的海盗什么也得不到。到。如果海盗的人数变成了如果海盗的人数变成了100人，金子仍人，金子仍然是然是100块。那么，最厉害的海盗，也就是块。那么，最厉害的海盗，也就是编号编号100的海盗，他的方案应该是什么呢？的海盗，他的方案应该是什么呢？ 100号海盗提出的方案将是：号海盗提出的方案将是：51块金子块金子归自己所有，其他编号为偶数的海盗各得归自己所有，其他编号为偶数的海盗各得1块金子，而编号为奇数的海盗什么也得不到。块金子，而编号为奇数的海盗什么也得

17、不到。如果海盗的人数变成了如果海盗的人数变成了200人，金子仍人，金子仍然是然是100块。那么，最厉害的海盗，也就是块。那么，最厉害的海盗，也就是编号编号200的海盗，他的方案应该是什么呢？的海盗，他的方案应该是什么呢？所有偶数号的海盗将各得所有偶数号的海盗将各得1块金子，而所块金子，而所有奇数号的海盗将一无所获。有奇数号的海盗将一无所获。如果海盗人数为如果海盗人数为201201人呢？人呢？ 201201号海盗的分配方案是：给号海盗的分配方案是：给1 1到到199199号号的所有奇数号海盗每人一块金子，自己则一的所有奇数号海盗每人一块金子，自己则一块也不要。虽然分不到金子，至少保证了自块

18、也不要。虽然分不到金子，至少保证了自己不会被扔进海里喂鲨鱼。己不会被扔进海里喂鲨鱼。如果海盗人数为如果海盗人数为202202人呢？人呢？ 202202号海盗同样别无选择，只能号海盗同样别无选择，只能1 1块金子块金子都不要了，他必须把这都不要了，他必须把这100100块金子全部用来块金子全部用来收买收买100100名海盗，而且这名海盗，而且这100100名海盗还必须是名海盗还必须是那些按照那些按照201201号方案将一无所获的人。由于号方案将一无所获的人。由于这样的海盗有这样的海盗有101101名，因此名，因此202202号的方案将不号的方案将不再是唯一的，因为贿赂方案有再是唯一的，因为贿赂

19、方案有101101种。种。如果海盗人数为如果海盗人数为203203人呢？人呢？ 203203号海盗必须获得号海盗必须获得102102张赞成票，但他张赞成票，但他显然没有足够的金子去收买显然没有足够的金子去收买101101名同伙。因名同伙。因此，无论提出什么样的分配方案，他都注定此，无论提出什么样的分配方案，他都注定会被扔进大海喂鲨鱼。会被扔进大海喂鲨鱼。悲催啊！悲催啊！如果海盗人数为如果海盗人数为204204人呢？人呢？ 204204号海盗知道，号海盗知道，203203号为了能保住性命，就必号为了能保住性命，就必须避免由他自己来提出分配方案这样一种局面，因须避免由他自己来提出分配方案这样

20、一种局面，因此不管此不管204204号提出什么样的方案，号提出什么样的方案，203203号都一定会投号都一定会投赞成票。这样，赞成票。这样，204204号海盗总算可以拣到一条命：号海盗总算可以拣到一条命：他可以得到他自己的他可以得到他自己的1 1票、票、203203号的号的1 1票以及另外票以及另外100100名被收买的海盗的赞成票，刚好达到保命所需的一名被收买的海盗的赞成票，刚好达到保命所需的一半票数。获得金子的海盗，就是根据半票数。获得金子的海盗，就是根据202202号方案肯号方案肯定一无所获的那定一无所获的那100100名海盗，即名海盗，即1 1到到199199号的所有奇号的所有奇数号海

21、盗。数号海盗。如果海盗人数为如果海盗人数为205205人呢？人呢？ 205205号海盗没有那么走运了。他不能指号海盗没有那么走运了。他不能指望望203203号和号和204204号支持他的方案，因为如果他号支持他的方案，因为如果他们投票反对们投票反对205205号方案，就可以看到号方案，就可以看到205205号被号被扔进海里，而他们自己的性命却仍然能够保扔进海里，而他们自己的性命却仍然能够保全。这样，无论全。这样，无论205205号海盗提出什么方案都号海盗提出什么方案都活不了命。活不了命。 206号海盗的命运也是这样。他肯定可号海盗的命运也是这样。他肯定可以得到以得到205号的支持，但这不足以

22、救他一命。号的支持，但这不足以救他一命。同样，同样，207号海盗需要号海盗需要104张赞成票，除了他收张赞成票，除了他收买的买的100张赞成票以及他自己的张赞成票以及他自己的1张赞成票之外，他张赞成票之外，他还需还需3张赞成票才能免于一死。他可以获得张赞成票才能免于一死。他可以获得205号和号和206号的支持，但还差号的支持，但还差1张票却是无论如何也弄不到张票却是无论如何也弄不到了，因此了，因此207号海盗的命运也是被扔进大海里。号海盗的命运也是被扔进大海里。可是，可是，208号海盗却又时来运转了。他需要号海盗却又时来运转了。他需要104张赞成票，而张赞成票，而205、206、207都会

23、支持他，加上他都会支持他，加上他自己一票及收买的自己一票及收买的100票，他得以过关保命。获得票，他得以过关保命。获得他贿赂的必定属于那些根据他贿赂的必定属于那些根据204号方案肯定将一无号方案肯定将一无所获的人，候选人包括所获的人，候选人包括2到到200号中所有偶数号的数，号中所有偶数号的数，以及以及201、202、203、204号。号。现在，出现了一条新的并在此之后会持续有效现在，出现了一条新的并在此之后会持续有效的规律：那些方案能过关的海盗的分配方案全都是的规律：那些方案能过关的海盗的分配方案全都是把金子用来收买把金子用来收买100名同伙而自己一点都得不到，名同伙而自己一点都得不到，他

24、们相隔的距离越来越远，而在他们之间的海盗则他们相隔的距离越来越远，而在他们之间的海盗则无论提什么样的方案都会被扔进大海，因此为了保无论提什么样的方案都会被扔进大海，因此为了保命，他们必定会投票支持比他们厉害的海盗提出的命，他们必定会投票支持比他们厉害的海盗提出的任何分配方案。任何分配方案。得以避免葬身鱼腹的海盗包括：得以避免葬身鱼腹的海盗包括：201、202、204、208、216、232、264、328、456号，也就是其号码等于号，也就是其号码等于200加上加上2的某一的某一幂的海盗。幂的海盗。那么，哪些海盗是获得贿赂（那么，哪些海盗是获得贿赂（1块金子）块金子）的人呢？的人呢？分配

25、贿赂的方法不是唯一的，其中一种分配贿赂的方法不是唯一的，其中一种方法是让方法是让201号海盗把贿赂分给号海盗把贿赂分给1到到199号号的所有奇数编号的海盗，让的所有奇数编号的海盗，让202号分给号分给2到到200号的所有偶数编号的海盗，然后是让号的所有偶数编号的海盗，然后是让204号贿赂奇数编号的海盗，号贿赂奇数编号的海盗，208号贿赂偶号贿赂偶数编号的海盗，依此类推，也就是轮流贿赂数编号的海盗，依此类推，也就是轮流贿赂奇数编号和偶数编号的海盗。奇数编号和偶数编号的海盗。如果表决的规则是必须超过半数赞同时如果表决的规则是必须超过半数赞同时才通过分配方案，假设是才通过分配方案，假设是5名海盗和

26、名海盗和100块块金子。金子。5号海盗应该提出什么样的分配方案号海盗应该提出什么样的分配方案呢？呢？蜈蚣博弈悖论悖论，是一种逻辑矛盾，它指这样一个悖论，是一种逻辑矛盾，它指这样一个命题：由它的真可以推出它的假；相反，由命题：由它的真可以推出它的假；相反，由它的假又可以推出它的真。它的假又可以推出它的真。理发师悖论小城里的理发师放出豪言：小城里的理发师放出豪言：“我帮且只我帮且只帮城里所有不自己刮脸的人刮脸帮城里所有不自己刮脸的人刮脸”。理发师该给自己刮脸吗？理发师该给自己刮脸吗？蜈蚣博弈是由罗森塞尔（蜈蚣博弈是由罗森塞尔（Rosenthal ）在在1981年提出的一个完全完美信息条件

27、下的年提出的一个完全完美信息条件下的动态博弈问题。由于这个博弈的扩展形式很动态博弈问题。由于这个博弈的扩展形式很像一条蜈蚣，因此被称为像一条蜈蚣，因此被称为“蜈蚣博弈蜈蚣博弈”。两个参与者两个参与者A、B轮流进行策略选择，可供选择的策轮流进行策略选择，可供选择的策略有略有“合作合作”和和“不合作不合作”两种。当出现两种。当出现“不合作不合作”时，时，博弈结束。博弈结束。规则是：规则是：A、B两次决策为一组，进行至第两次决策为一组，进行至第n组时，若组时，若A决策结束，则决策结束，则A、B的收益都是的收益都是n；若；若B决策结束，则决策结束，则A得得n-1，B得得n+2。假定假定A先选，然

28、后是先选，然后是B，接着是，接着是A，如此交替进行。另，如此交替进行。另外，外，A、B之间的博弈次数为有限次，比如之间的博弈次数为有限次，比如198次。若双次。若双方始终选择方始终选择“合作合作”，则最后，则最后A、B的收益都是的收益都是100。 A、B该如何进行策略选择呢？该如何进行策略选择呢？当当A决策时，他考虑博弈的最后一步即第决策时，他考虑博弈的最后一步即第198步。步。B在在“合作合作”和和“不合作不合作”之间作出选之间作出选择时，因择时，因“合作合作”给给B带来带来100的收益，而的收益，而“不不合作合作”带来带来101的收益，根据的收益，根据“理性人理性人”的假定，的假定，B会

29、选择会选择“不合作不合作”。但是，要经过第但是，要经过第197步才到第步才到第198步。在第步。在第197步，步，A考虑到考虑到B在第在第198步时会选择步时会选择“不合不合作作”，此时他的最优策略是，此时他的最优策略是“不合作不合作”“不不合作合作”的收益的收益99大于大于“合作合作”的收益的收益98。因此，在第因此，在第197步时步时A会选择会选择“不合作不合作”。同样，要经过第同样，要经过第196步才到第步才到第197步。在第步。在第196步时，步时，B考虑到考虑到A在第在第197步时会选择步时会选择“不合不合作作”，此时他的最优策略是，此时他的最优策略是“不合作不合作”“不不合作

30、合作”的收益的收益100大于大于“合作合作”的收益的收益99。因此，在第因此，在第196步时步时B会选择会选择“不合作不合作”。如此推论下去，最后的结论是：在第如此推论下去，最后的结论是：在第1步时步时A将选择将选择“不合作不合作”，博弈结束，此时，博弈结束，此时双方的收益均为双方的收益均为1。这个结果是令人悲伤的。这个结果是令人悲伤的。从逻辑推理来看，逆向归纳法是严密的，但从逻辑推理来看，逆向归纳法是严密的，但结论是违反直觉的。结论是违反直觉的。直觉告诉我们，一开始就采取直觉告诉我们，一开始就采取“不合作不合作”的的策略获取的收益只能为策略获取的收益只能为1，而采取，而采取“合作合

31、作”策略策略有可能获取的收益为有可能获取的收益为100，因此，因此A应采取应采取“合作合作”的策略。而从逻辑的角度，一开始的策略。而从逻辑的角度，一开始A就应采取就应采取“不合作不合作”的策略。的策略。有实验经济学家做过蜈蚣博弈的实验，实验有实验经济学家做过蜈蚣博弈的实验，实验的结果显示不会出现一开始选择的结果显示不会出现一开始选择“不合作不合作”策略策略而使双方获得收益而使双方获得收益1的情况。参与者都会自动选的情况。参与者都会自动选择合作性策略，从而走向合作。择合作性策略，从而走向合作。人们在博弈中的真实行动人们在博弈中的真实行动“偏离偏离”了运用逆了运用逆向归纳法关于博弈的理论预测，

32、造成二者间的矛向归纳法关于博弈的理论预测，造成二者间的矛盾和不一致，这就是蜈蚣博弈的悖论。盾和不一致，这就是蜈蚣博弈的悖论。逆向归纳法在逻辑上是严密的，然而逆向归纳法在逻辑上是严密的，然而它存在着它存在着“困境困境”，蜈蚣博弈悖论恰好反，蜈蚣博弈悖论恰好反映了这种映了这种“困境困境” 。蜈蚣博弈悖论的产生其实是源于逆向归纳法蜈蚣博弈悖论的产生其实是源于逆向归纳法的适用范围问题，即逆向归纳法只是在一定的条件的适用范围问题，即逆向归纳法只是在一定的条件下和一定的范围内有效，忽略了这一点笼统去谈论下和一定的范围内有效，忽略了这一点笼统去谈论逆向归纳法的有效性不是科学的研究思路。逆向归纳法的有效性

33、不是科学的研究思路。第一，从逆向归纳法的适用范围来看，第一，从逆向归纳法的适用范围来看，应当避免在较长阶段的动态博弈中使用逆向应当避免在较长阶段的动态博弈中使用逆向归纳法。博弈的阶段数不同，博弈方的策略归纳法。博弈的阶段数不同，博弈方的策略选择会有很大的差异。选择会有很大的差异。以下象棋为例说明这个问题。下象棋是一种完以下象棋为例说明这个问题。下象棋是一种完全完美信息动态博弈，而且博弈阶段和路径数量是全完美信息动态博弈，而且博弈阶段和路径数量是有限的，但由于象棋博弈的路径数量很大、分支选有限的，但由于象棋博弈的路径数量很大、分支选择很多，即使用最先进的电子计算机也无法在短时择很多，即使用最

34、先进的电子计算机也无法在短时间内找出每步的最优决策，因此不可能有人一开始间内找出每步的最优决策，因此不可能有人一开始就用逆向归纳法下棋。但是实践却表明，下棋人往就用逆向归纳法下棋。但是实践却表明，下棋人往往在象棋博弈的局部阶段，即在有限步数、有限选往在象棋博弈的局部阶段，即在有限步数、有限选择的范围内局部地使用逆向归纳法。正因为如此，择的范围内局部地使用逆向归纳法。正因为如此，才有才有“下一步看三步下一步看三步”的说法。的说法。又如，在蜈蚣博弈中，如果蜈蚣博弈的阶段又如，在蜈蚣博弈中，如果蜈蚣博弈的阶段数大大减少，比如说只有数大大减少，比如说只有6步，那么开始时合作步，那么开始时合作的可能性就小得多，因为选择合作的潜在利益减的可能性就小得多，因为选择合作的潜在利益减少了很多，而承担的初始风险却

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三讲动态博弈及逆向归纳法

文档简介

温馨提示

最新文档

评论

第三讲 动态博弈及逆向归纳法

文档简介

温馨提示

最新文档

评论

相关文档

第三讲动态博弈及逆向归纳法