第三讲完全信息动态博弈

上传人：姚*** IP属地：广东上传时间：2023-05-03 格式：PPT 页数：23 大小：2.04MB 积分：18 举报 版权申诉

已阅读5页，还剩18页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三讲完全信息动态博弈第1页，共23页，2023年，2月20日，星期三一、子博弈精炼纳什均衡

子博弈精炼纳什均衡的创立者.——1994年诺贝尔经济学奖获奖者、莱茵哈德·泽尔腾。

泽尔腾则在60年代中期将纳什均衡概念引入动态分析。在1965年发表《需求减少条件下寡头垄断模型的对策论描述》一文，提出了“子博弈精炼纳什均衡”的概念，又称“子对策完美纳什均衡”。这一研究对纳什均衡进行了第一次改进，选择了更具说服力的均衡点。海萨尼在60年代末把不完全信息引入博弈分析。第2页，共23页，2023年，2月20日，星期三

将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的，决策者要“随机应变”，“向前看”，而不是固守旧略。

由于剔除了不可置信的威胁，在许多情况下，精炼纳什均衡也就缩小了纳什均衡的个数。这一点对预测分析是非常有意义的。

用动态博弈理论来讨论实际究竟发生哪个纳什均衡。

只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说，组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。第3页，共23页，2023年，2月20日，星期三在动态博弈中，参与人的行动有先后顺序，后行动的参与人在自己行动之前就可以观察到先行动者（参与人）的行为，并在此基础上选择相应的策略。而且，由于先行动者拥有后行动者可能选择策略的完全信息，因而先行动者在选择自己的策略时，就可以预先考虑自己的选择对后行动者选择的影响，并采取相应的对策。第4页，共23页，2023年，2月20日，星期三我们关于房地产开发的例子，讨论子博弈精炼纳什均衡。表3－1给出了静态条件下双方参与人的收益情况。表3－1房地产开发博弈（静态）的收益矩阵

第5页，共23页，2023年，2月20日，星期三从表3－1可以知道，该博弈有两个纳什均衡，即（Ａ开发，Ｂ不开发）和（Ａ不开发，Ｂ开发），我们无法确定是开发商Ａ选择开发，开发商Ｂ选择不开发，还是恰恰相反的结果。

现在，我们讨论动态博弈。假定房地产开发商Ａ是先行动者。在行动之前，开发商Ａ对对手开发商Ｂ的策略进行了预测。在行动开始之前的Ａ看来，如果不计得失，Ｂ有四种策略可供选择：第6页，共23页，2023年，2月20日，星期三策略一：无论Ａ是否选择开发，Ｂ选择开发。策略二：若Ａ选择开发，Ｂ也选择开发；若Ａ选择不开发，Ｂ也选择不开发。策略三：若Ａ选择开发，Ｂ就选择不开发；若Ａ选择不开发，Ｂ就选择开发。策略四：无论Ａ是否选择开发，Ｂ都选择不开发。第7页，共23页，2023年，2月20日，星期三在表3－1的基础上，结合Ａ先行动，Ｂ可能选择的四种策略，不难得出表3－2。表3－2先行动者Ａ对Ｂ预测结果的收益矩阵第一列为策略一收益展示（也就是说第一列两个收益组合对应策略一），第二列为策略二收益展示，以此类推第8页，共23页，2023年，2月20日，星期三

由表3－2可以看出，在开发商Ａ先行动的情况下，开发商Ｂ可供选择的策略中，策略一只包括了上述两个纳什均衡中的后一种均衡，即（Ａ不开发，Ｂ开发），而没有包括前一种纳什均衡，即（Ａ开发，Ｂ不开发）；策略二上述两种纳什均衡都没有包括；策略四只包括了上述两种纳什均衡中的前一种均衡，即（Ａ开发，Ｂ不开发），而未包括后一种纳什均衡，即（Ａ不开发，Ｂ开发）；只有策略三既包括了上述两种纳什均衡中的前一种均衡，又包括了后一种均衡。也就是说，如果Ｂ选择策略三，那么，无论Ａ作出什么选择，Ｂ的回应都能达到纳什均衡。反过来，在给定Ｂ会选择策略三来回应Ａ的选择的前提下，开发是Ａ的占优选择。因此，Ａ一定会选择开发。第9页，共23页，2023年，2月20日，星期三

以上的分析，就是子博弈精炼纳什均衡解的过程。策略（Ａ开发，Ｂ不开发）就是上述子博弈精炼纳什均衡解。所谓“子博弈”（sub-game）是指它本身可以作为一个独立的博弈进行分析，它是原博弈的一部分。例如，在表3－1中，每一行或每一列都是整个博弈的一个子博弈。而且，任何博弈本身可被称为自身的一个子博弈。只有当某一策略组合在每一个子博弈（包括原博弈）上都构成一个纳什均衡，这一策略组合才是子博弈精炼纳什均衡解。显然，如果整个博弈是惟一的子博弈，纳什均衡与子博弈精炼纳什均衡是完全相同的。第10页，共23页，2023年，2月20日，星期三二、重复博弈

上述子博弈精炼纳什均衡有这样一个特征，这就是，参与人在前一个阶段的行动选择决定了随后的子博弈的结构。因此，同样结构的子博弈只出现一次。在上述房地产开发博弈的例子中，开发商Ａ选择开发后的子博弈甲不同于开发商Ａ选择不开发后的子博弈乙，当开发商Ａ选择开发后，子博弈乙就被排除了。这样的动态博弈称为“序贯博弈”（sequentialgames）。动态博弈中另一类特殊但非常重要的博弈是所谓的“重复博弈”（repeatedgames）。顾名思义，重复博弈是指同样结构的博弈重复许多次，其中的每次博弈称为“阶段博弈”（stagegames）第11页，共23页，2023年，2月20日，星期三

以下我们用一个产品定价的例子讨论重复博弈。表3－3给出了一次性完全信息静态博弈的收益矩阵。表3－3产品定价博弈的收益矩阵第12页，共23页，2023年，2月20日，星期三

Ａ、Ｂ两个参与人都有两种定价代选择：定高价或定低价。如果两个参与人都定低价，则每个参与人的收益均为２０个单位；如果两人都定高价，则每人的收益均为３０个单位；如果其中某一参与人定低价，而另一参与人定高价，则定低价的参与人有占有更多的市场份额获得４０个单位的收益，定高价的参与人由于失去一部分市场份额而只获得１０个单位的收益。显然，在这个一次性完全信息静态博弈中，两个参与人均有占优策略，占优策略均衡为Ａ、Ｂ双方都定低价。第13页，共23页，2023年，2月20日，星期三如果Ａ、Ｂ之间的定价博弈是多次进行的，那么，问题就不是如此简单了。我们先来分析博弈重复次数为无限次的情况。第14页，共23页，2023年，2月20日，星期三

如果Ａ、Ｂ双方都选择合作，都保持定高价，则双方在每个阶段的收益均为３０个单位，记为（３０，３０，３０，…）；如果Ａ、Ｂ中有一方（如Ａ）采取投机行为，在实际定价中选择不与对方合作，在第一阶段就通过选择定价策略使得选择高价策略的对手Ｂ受损，则受损的一方Ｂ一定会在第二阶段及其以后的定价中也选择低价策略，加以报复，这样一来，首先选择不合作的一方Ａ在个阶段的收益为（４０，２０，２０，…），显然，其总收益远远小于合作、维持高价情况下的总收益。因为，首选选择不合作的一方Ａ，只是在第一阶段获得了“额外”收益，但在以后个阶段的收益将因为对手Ｂ的报复性选择而减少，并且，重复若干此后，首先选择不合作的一方Ａ将得不偿失。第15页，共23页，2023年，2月20日，星期三在这里，Ｂ选择的策略称为“冷酷策略”（grimstrategies）。冷酷策略是指重复博弈中的任何参与人的一次性不合作将引起其他参与人的永远不合作，从而导致所有参与人的收益减少。因此，所有参与人具有维持合作的积极性。我们再来讨论博弈重复次数为有限时的情况。第16页，共23页，2023年，2月20日，星期三重复次数有限博弈与重复次数无限博弈之间的惟一区别，是所有参与人都可以明确无误地了解重复的次数，即可以准确地预测到最后一个阶段博弈。而在最后阶段的博弈中，任何一个参与人选择不合作，不会导致其他参与人的报复。因此，所有参与人都会在最后阶段的博弈中选择自己的占优策略，那就是不合作。上例中，在最后阶段博弈中选择低价是所有参与人的占优策略。既然所有参与人都会在最后阶段选择不合作，那么，在倒数第二阶段博弈中任何参与人也就没有必要担心由于自己选择不合作，导致其他参与人在最后阶段博弈中的报复。因此所有参与人在倒数第二阶段博弈中，也都会选择不合作。即在倒数第二阶段博弈中，所有参与人都会选择占优策略。第17页，共23页，2023年，2月20日，星期三由此类推，可以得出以下结论：在阶段性博弈存在惟一的纳什均衡时，阶段博弈的纳什均衡解就是重复次数有限博弈的唯一子博弈精炼纳什均衡解。即重复次数有限博弈的每个阶段的均衡解都是一次性博弈的纳什均衡解。注意，上述推论成立的前提条件是阶段性博弈纳什均衡的惟一性。例如，在上例中，每个阶段博弈的收益矩阵都与表3－3完全一致，纳什均衡都是每个参与人选择低价。第18页，共23页，2023年，2月20日，星期三三、动态博弈策略行动在动态博弈中，由于参与人的行动有先后顺序，而参与人行动顺序直接影响博弈的结果。因此，参与人为了使其他参与人的选择对自己有利，往往会主动采取一些行动影响其他参与人对自己行为的预期，从而达到对自己有利的结果。参与人所采取的这些行为称之为“策略行”（strategicmove）。第19页，共23页，2023年，2月20日，星期三

以下通过两个例子加以说明。１、先行优势（first-moveadvantage）所谓现行优势是指在博弈中首先作出策略选择并采取相应行动的参与人可以获得更多的利益。在上面提到的性别战中，存在两个纳什均衡，即男女双方一起去看足球赛或一起去逛商店。我们无法确定结果到底如何。在这种情况下，如果男方首先采取行动，在约会前就买好足球票，就会对女方产生影响。女方可能因为男方的这一行动表明“男朋友十分想看这场足球比赛”或因“既然已经买了票，不看怪可惜”，从而接受双方一起看足球赛的选择。第20页，共23页，2023年，2月20日，星期三２、确信威胁（credible）确信威胁是指博弈的某一参与人通过承诺某种行动改变自己的收益函数，使得其他参与人认为自己的威胁确实可信，从而迫使其他参与人在充分考虑自己的承诺的情况下作出相应的选择。例如，在上述房地产开发博弈中，如果房地产开发商Ｂ在房地产开始Ａ作出选择之前就采取行动，与客户签订合同，规定Ｂ在一定期限内，向客户交付一定面积的住房，倘若Ｂ不能按时履约，则总共赔偿客户６个单位。在有这样一个承诺的情况下，上述表3－1和表3－2就相应地变成了表3－4和表3－5。第21页，共23页，2023年，2月20日，星期三表3－4Ｂ承诺后的腹地开发博弈的收益矩阵表3－5Ｂ承诺后Ａ对Ｂ的预

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第三讲完全信息动态博弈

文档简介

温馨提示

最新文档

评论

第三讲完全信息动态博弈

文档简介

温馨提示

最新文档

评论

相关文档