第十章10博弈论初步_第1页
第十章10博弈论初步_第2页
第十章10博弈论初步_第3页
第十章10博弈论初步_第4页
第十章10博弈论初步_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十章 博弈论初步微观经济学微观经济学 要想在现代社会做要想在现代社会做一个有价值的人,一个有价值的人,你必须对博弈论有你必须对博弈论有一个大致了解。一个大致了解。经济学家保罗经济学家保罗.萨缪尔森萨缪尔森3纳什美丽心灵博弈论博弈论&美丽心美丽心目 录第一节博弈论和博弈论和策略行为策略行为第二节纯策略均衡纯策略均衡第三节混合策略均衡混合策略均衡第四节序贯博弈序贯博弈l 寡头博弈和支付矩阵寡头博弈和支付矩阵;条件策略和策略组合条件策略和策略组合;l 纳什均衡和下划线法纳什均衡和下划线法;纳什均衡的特性纳什均衡的特性;l 二人同时博弈的一般理论二人同时博弈的一般理论 l 竞争者竞争者- -

2、垄断者博弈垄断者博弈;l 博弈树的纳什均衡博弈树的纳什均衡;l 逆向归纳法逆向归纳法;优势与理性优势与理性l 博弈的定义博弈的定义;l 基本的要素基本的要素;l 博弈的类型博弈的类型l 混合策略与策略组合混合策略与策略组合;l 混合策略的纳什均衡混合策略的纳什均衡;l 混合博弈的一般理论混合博弈的一般理论5第一节第一节 博弈论和策略行为博弈论和策略行为1.1.博弈论的含义博弈论的含义 博弈论是研究在策略性环境中如何进行策略性决策和博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。采取策略性行动的科学。 策略性环境:每一个人进行的决策和采取的行动都会策略性环境:每一个人进行的决

3、策和采取的行动都会对其他人产生影响;对其他人产生影响; 策略性决策和策略性行动:每个人要根据其他人的可策略性决策和策略性行动:每个人要根据其他人的可能反应来决定自己的决策和行动。能反应来决定自己的决策和行动。(Game Theory又称对策论又称对策论)62 2. .博弈的三个基本要素博弈的三个基本要素 三个基本要素:参与人、参与人的策略和参与人的支付。三个基本要素:参与人、参与人的策略和参与人的支付。参与人参与人(Player) (或称局中人:在博弈中进行决策的个体;(或称局中人:在博弈中进行决策的个体;参与人的策略参与人的策略(Strategies) :是一项规则,根据该规则,参与:是一项

4、规则,根据该规则,参与人在博弈的每一时点上选择如何行动;人在博弈的每一时点上选择如何行动;参与人的支付或得益参与人的支付或得益Payoffs :在所有参与人都选择了各自的:在所有参与人都选择了各自的策略且博弈已经完成之后,参与人获得的效用(或期望效用)。策略且博弈已经完成之后,参与人获得的效用(或期望效用)。第一节第一节 博弈论和策略行为博弈论和策略行为次序次序(Order)(Order) 各博弈方的决策有先后之分各博弈方的决策有先后之分2022年5月11日星期三73.3.博弈的简单分类博弈的简单分类参与人的数量:二人博弈和多人博弈;参与人的数量:二人博弈和多人博弈;参与人的支付情况:零和博弈

5、和非零和博弈;参与人的支付情况:零和博弈和非零和博弈;参与人拥有的策略的数量多少:有限博弈和无限博弈;参与人拥有的策略的数量多少:有限博弈和无限博弈;参与人在实施策略上是否有时间的先后:同时博弈和序贯博弈。参与人在实施策略上是否有时间的先后:同时博弈和序贯博弈。第一节第一节 博弈论和策略行为博弈论和策略行为8 8博弈理论框架91. 1. “囚徒困境囚徒困境”囚徒困境 两个小偷甲和乙联手作案,私入民宅被警方逮住但未获证据。警方将两人分别置于两间房间分开审讯,政策是若一人招供但另一人未招,则招者立即被释放,未招者判入狱10年;若二人都招则两人各判刑8年; n若两人都不招则未获证据但因私入民宅各拘留

6、1年。囚徒困境博弈 乙 招 不招 招 甲 不招(问题:甲、乙如何选择?) -8,-80,-10-10,0-1,-1坦白从宽坦白从宽2:农夫杀鸡农夫杀鸡 结论:结论: 当参与者知道对手的策略后,他会选择最有利于自己的策略 纳什均衡 猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就会有10单位的猪食进槽,但每按一下按钮会耗去相当于2单位猪食的成本。如果大猪先到食槽,则大猪吃到9单位食物,小猪仅能吃到1单位食物;如果两猪同时到食槽,则大猪吃7单位,小猪吃3单位食物;如果小猪先到,大猪吃6单位而小猪吃4单位食物。给出这个博弈的支付矩阵。3.智猪博弈 智猪博弈 小

7、猪 按 等待 按 大猪 等待 5,14,49, -10,0n“等待等待”是小猪的占优战略是小猪的占优战略案例 沙滩上的饮料销售商1/21/2 11/2 11/24. 沙滩上的饮料销售商有有M必有必有KFC 孔明曰:“亮夜观乾象,操贼未合身亡。留这人情, 教云长做了,亦是美事。” 玄德曰:“先生神算,世所罕及!”孔孔明明曹操小道小道 大路大路小小道道大大路路擒住擒住被擒被擒逃脱逃脱空等空等擒住擒住被擒被擒逃脱逃脱空等空等案例“华容道”里的纳什均衡(1)案例 “华容道”里的纳什均衡(1)孔孔明明曹操小道小道 大路大路小小道道大大路路擒住擒住被擒被擒逃脱逃脱空等空等擒住擒住被擒被擒逃脱逃脱空等空等案

8、例 “华容道”里的纳什均衡(1)案例“华容道”里的纳什均衡(2)案例 “华容道”里的纳什均衡(2)刘刘备备孙权孙权联联合合 反目反目放放走走捉捉拿拿1210-15-5-202015 刘备军事集团参与赤壁之战有三个战略目标: 首先,必须联合孙权打败曹操,从而为自己赢得生存的时间与空间; 其次,又不能让曹操一方消失,曹操的存在使刘备的存在具有价值; 最后,还要争取在混乱中尽可能地多捞私利。按按键键 等待等待按按键键等等待待159-10044小小猪猪大猪大猪案例 孙刘联合的“智猪博弈”案例 孙刘联合的“智猪博弈” 孔明笑曰: “亮借一帆风,直至江东,凭三寸不烂之舌,说南北两军互相吞并。若南军胜,共诛

9、 曹操 以取荆州之地;若北军胜,则我乘势以取江南可也。” 荆州是赤壁之战最重要的战果之一,却被出力很少的刘备摘去了。 诸葛亮对司马懿的思想轨迹是相当了解; 诸葛亮的行径司马懿也能做出理性判断。 诸诸葛葛司司马马进进攻攻 撤退撤退守守城城弃弃城城平手平手逃脱逃脱大胜大胜被擒被擒被擒被擒大胜大胜曹曹家家司司马马擒拿擒拿 放走放走使使用用除除掉掉2010-15-1-158-103案例“空城计”中的占优策略均衡案例 “空城计”中的占优策略均衡资料 囚徒困境坦坦 白白 不坦白不坦白坦坦白白不不坦坦白白-5-5-7-1-2-2-1-7甲甲方方乙方乙方 双方都存在着偷换策略的诱惑,处于不稳定状态。 即使两个

10、囚徒事先订立了攻守同盟(死不坦白), 他们最终也会背叛同盟。 每个囚徒都希望对方选择抵赖,而自己坦白获释。当他们都这么想并这么做的时候,就形成了都坦白的左上角结局。 资料 囚徒困境22第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡 假定在某个寡头市场上,只有甲、乙两个厂商。假定在某个寡头市场上,只有甲、乙两个厂商。每个厂商都有两个可供选择的策略,即合作和不合作。每个厂商都有两个可供选择的策略,即合作和不合作。两个厂商各自选择的策略共形成四个两个厂商各自选择的策略共形成四个组合组合。一、例子:寡头博弈一、例子:寡头博弈231.1.支付矩阵支付矩阵 使用支付矩阵来描述和分析只有两人参加且两

11、人同使用支付矩阵来描述和分析只有两人参加且两人同时进行决策的简单博弈。时进行决策的简单博弈。 矩阵的左边表示甲厂商的策略,上边表示乙厂商的矩阵的左边表示甲厂商的策略,上边表示乙厂商的策略;矩阵中四个单元格里的数字组合分别表示博弈策略;矩阵中四个单元格里的数字组合分别表示博弈的四个结果即支付,其中每一个数字组合的第一个数的四个结果即支付,其中每一个数字组合的第一个数字是甲厂商得到的支付,第二个数字是乙厂商得到的字是甲厂商得到的支付,第二个数字是乙厂商得到的支付。支付。二、支付矩阵二、支付矩阵第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡242.2.子矩阵子矩阵 支付矩阵可以一分为二,即拆

12、成两个支付矩阵可以一分为二,即拆成两个“小小”的子支的子支付矩阵。其中付矩阵。其中, ,一个为甲厂商的支付矩阵,由原矩阵每一个为甲厂商的支付矩阵,由原矩阵每一单元格中的第一个数字组成;另一个为乙厂商的支一单元格中的第一个数字组成;另一个为乙厂商的支付矩阵,由原矩阵每一单元格中的第二个数字组成。付矩阵,由原矩阵每一单元格中的第二个数字组成。二、支付矩阵二、支付矩阵第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡2022年5月11日星期三251.1.甲厂商的甲厂商的条件策略和条件策略组合条件策略和条件策略组合 把甲厂商在乙厂商选择合作条件下的最优策略即合作把甲厂商在乙厂商选择合作条件下的最优

13、策略即合作叫做甲厂商的条件优势策略或相对优势策略,简称条件叫做甲厂商的条件优势策略或相对优势策略,简称条件策略。策略。 把与甲厂商的条件策略相联系的策略组合叫做甲厂商把与甲厂商的条件策略相联系的策略组合叫做甲厂商的条件优势策略组合或相对优势策略组合,简称条件策的条件优势策略组合或相对优势策略组合,简称条件策略组合。略组合。 甲厂商分别有两个甲厂商分别有两个条件策略和条件策略组合。条件策略和条件策略组合。三、条件策略和条件策略组合三、条件策略和条件策略组合第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡2022年5月11日星期三262.2.乙厂商的乙厂商的条件策略和条件策略组合条件策略和条

14、件策略组合 把乙厂商在甲厂商选择合作条件下的最优策略即合把乙厂商在甲厂商选择合作条件下的最优策略即合作叫做乙厂商的条件优势策略或相对优势策略,简称条作叫做乙厂商的条件优势策略或相对优势策略,简称条件策略。件策略。 把与乙厂商的条件策略相联系的策略组合叫做乙厂把与乙厂商的条件策略相联系的策略组合叫做乙厂商的条件优势策略组合或相对优势策略组合,简称条件商的条件优势策略组合或相对优势策略组合,简称条件策略组合。策略组合。 乙厂商也分别有两个乙厂商也分别有两个条件策略和条件策略组合。条件策略和条件策略组合。三、条件策略和条件策略组合三、条件策略和条件策略组合第二节第二节 同时博弈:纯策略均衡同时博弈:

15、纯策略均衡2022年5月11日星期三271.1.博弈均衡的概念博弈均衡的概念 当两个厂商的条件策略组合恰好相同,从而,两当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。达到了均衡,即博弈均衡。 博弈均衡是博弈各方最终选取的策略组合,是博博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。弈的最终结果,是博弈的解。四、纳什均衡四、纳什均衡第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡282.2.纳什均衡的概念纳什均衡的概念第一,纳什均衡的概念第一,纳什均衡的概念

16、所谓纳什均衡,指的是参与人的这样一种策略组所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不合,在该策略组合上,任何参与人单独改变策略都不会得到好处。或者说,在一个策略组合中,如果所有会得到好处。或者说,在一个策略组合中,如果所有其他人都不改变策略时,没有人会改变自己的策略,其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。则该策略组合就是一个纳什均衡。四、纳什均衡四、纳什均衡第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡292.2.纳什均衡的概念纳什均衡的概念第二,对纳什均衡的理解第二,对纳什均衡的理解 一是一是“单独改

17、变策略单独改变策略”是指任何一个参与人在所是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其有其他人都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列。他人也同时改变策略的情况不在考虑之列。 二是二是“不会得到好处不会得到好处” ” 是指任何一个参与人在单是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情独改变策略之后自己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。况:或者支付减少,或者支付不变。四、纳什均衡四、纳什均衡第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡2022年5月11日星期三301.1.基本方法

18、基本方法 先用下划线法分别表示甲厂商和乙厂商的条件策先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均衡(就是找到在两个数字之下略,最后确定博弈的均衡(就是找到在两个数字之下都划线的单元格即可,与这些单元格相对应的策略组都划线的单元格即可,与这些单元格相对应的策略组合就是所要求的均衡策略组合)。合就是所要求的均衡策略组合)。五、寻找纳什均衡的方法五、寻找纳什均衡的方法 条件策略下划线法条件策略下划线法第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡2022年5月11日星期三312.2.条件策略下划线方法的五步法条件策略下划线方法的五步法第一,把整个的支付矩阵分解为甲厂商的支付

19、矩阵和第一,把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵乙厂商的支付矩阵第二,在甲厂商的支付矩阵中,找出每一列的最大者第二,在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能不只一个),并在其下划线(每列的最大者可能不只一个),并在其下划线五、寻找纳什均衡的方法五、寻找纳什均衡的方法 条件策略下划线法条件策略下划线法第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡322.2.条件策略下划线方法的五步法条件策略下划线方法的五步法第三,在乙厂商的支付矩阵中,找出每一行的最大者第三,在乙厂商的支付矩阵中,找出每一行的最大者(每行的最大者也可能不只一个),并在其下划线(每行的

20、最大者也可能不只一个),并在其下划线第四,将已经划好线的甲厂商的支付矩阵和乙厂商的第四,将已经划好线的甲厂商的支付矩阵和乙厂商的支付矩阵再合并起来,得到整个的有下划线的支付矩支付矩阵再合并起来,得到整个的有下划线的支付矩阵阵五、寻找纳什均衡的方法五、寻找纳什均衡的方法 条件策略下划线法条件策略下划线法第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡2.2.条件策略下划线方法的五步法条件策略下划线方法的五步法第五,在带有下划线的整个的支付矩阵中,找到两个第五,在带有下划线的整个的支付矩阵中,找到两个数字之下均划有线的支付组合,则由该支付组合代表数字之下均划有线的支付组合,则由该支付组合代表

21、的策略组合就是均衡的策略组合的策略组合就是均衡的策略组合五、寻找纳什均衡的方法五、寻找纳什均衡的方法 条件策略下划线法条件策略下划线法第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡2022年5月11日星期三343.3.总结总结 在一个单元格中,如果两个数字之下均划有线,则两个参在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列与人

22、都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面最大值和行最大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的动没线,则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略的动机。机,没线的数字所代表的参与人有单独改变策略的动机。五、寻找纳什均衡的方法五、寻找纳什均衡的方法 条件策略下划线法条件策略下划线法第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡35第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡1.1.存在性存在性 在同时博弈中在同时博弈中, ,(

23、纯策略的)纳什均衡既可能存在(纯策略的)纳什均衡既可能存在, ,也可能不也可能不存在。存在。2.2.唯一性唯一性 在纳什均衡存在的条件下在纳什均衡存在的条件下, ,它既可能是唯一的它既可能是唯一的, ,也可能不唯一。也可能不唯一。3.3.最优性最优性 如果纳什均衡存在如果纳什均衡存在, ,则它既可能是最优的则它既可能是最优的, ,也可能不是最优的。也可能不是最优的。六、纳什均衡的六、纳什均衡的存在性、唯一性和最优性存在性、唯一性和最优性2022年5月11日星期三361.811.81种可能的支付矩阵种可能的支付矩阵 A A的支付矩阵有的支付矩阵有9 9种可能,种可能,B B的支付矩阵也有的支付矩

24、阵也有9 9种可种可能,因此,整个博弈(亦即能,因此,整个博弈(亦即A A与与B B两人合在一起)的两人合在一起)的支付矩阵总共就有支付矩阵总共就有9 99=819=81种可能。种可能。七、七、二人同时博弈的一般理论二人同时博弈的一般理论第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡372.2.纳什均衡的五种类型纳什均衡的五种类型 全部的纳什均衡可分为五种类型,分别有四个均全部的纳什均衡可分为五种类型,分别有四个均衡(包括衡(包括1 1种情况)、三个均衡(包括种情况)、三个均衡(包括1212种情况)、种情况)、两个均衡(包括两个均衡(包括3838种情况)种情况) 、一个均衡(包括、一个

25、均衡(包括2828种种情况)和零个均衡(包括情况)和零个均衡(包括2 2种情况)。种情况)。七、七、二人同时博弈的一般理论二人同时博弈的一般理论第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡38第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡1.1.混合策略混合策略第一,第一,“确定性确定性”选择选择 在没有纳什均衡的同时博弈里,所有参与人对策略的选在没有纳什均衡的同时博弈里,所有参与人对策略的选择都是择都是“确定确定”的,即某参与人在选择某个策略的时候,的,即某参与人在选择某个策略的时候,他不能再同时选择其他的策略,此时相应的条件策略也是他不能再同时选择其他的策略,此时相应

26、的条件策略也是“确定确定”的;最后,当参与人的条件策略是的;最后,当参与人的条件策略是“确定确定”的时的时候,最终的博弈均衡(如果有的话)也是候,最终的博弈均衡(如果有的话)也是“确定确定”的。的。一、一、不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡2022年5月11日星期三391.1.混合策略混合策略第二,第二,“混合性混合性”选择选择 在现实生活中,人们对策略的选择常常并不像前面所说在现实生活中,人们对策略的选择常常并不像前面所说的那样的那样“非此即彼非此即彼”,而是会以一定的可能性来选择某个策,而是会以一定的可能性来选择某个策略,又以另外的可能性选择另外一些策略。略,

27、又以另外的可能性选择另外一些策略。第三,第三,“混合混合”策略的概念策略的概念 把甲厂商和乙厂商原来的策略叫做把甲厂商和乙厂商原来的策略叫做“纯纯”策略,把赋予策略,把赋予这些纯策略的概率向量叫做这些纯策略的概率向量叫做“混合混合”策略。策略。第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡一、一、不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡402.2.混合策略组合混合策略组合 参与人的混合策略组合是一个概率向量组合,其中,每一参与人的混合策略组合是一个概率向量组合,其中,每一个概率向量是相应参与人的一个混合策略。个概率向量是相应参与人的一个混合策略。3.3.期望

28、支付期望支付 在混合策略博弈中,对于每一个混合策略组合,也存在一在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参与人在该混合策略个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。不过,由于现在每个参与人都是组合条件下所得到的支付。不过,由于现在每个参与人都是以一定的概率来选择其纯策略的,故相应的支付也就成了所以一定的概率来选择其纯策略的,故相应的支付也就成了所谓的谓的“期望支付期望支付”,即支付的期望值。,即支付的期望值。第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡一、一、不存在纯策略均衡时的混合策略均衡不存在纯策略

29、均衡时的混合策略均衡414.4.条件混合策略条件混合策略 利用计算期望支付的公式可以求得甲厂商和乙厂利用计算期望支付的公式可以求得甲厂商和乙厂商的条件混合策略(即具有相对优势的混合策略)。商的条件混合策略(即具有相对优势的混合策略)。第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡一、一、不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡425.5.混合策略的纳什均衡混合策略的纳什均衡 参与人的条件混合策略可以分别确定,确定了条件混合参与人的条件混合策略可以分别确定,确定了条件混合策略,就可以进一步来确定混合策略的纳什均衡。策略,就可以进一步来确定混合策略的纳什均衡。第

30、三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡一、一、不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡2022年5月11日星期三43第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡 求解混合策略纳什均衡的方法不仅适用于纯策略求解混合策略纳什均衡的方法不仅适用于纯策略纳什均衡不存在的情况,而且也适用于纯策略纳什均纳什均衡不存在的情况,而且也适用于纯策略纳什均衡存在的情况。在后面这种情况下,纯策略纳什均衡衡存在的情况。在后面这种情况下,纯策略纳什均衡将作为特例被包含在相应的混合策略纳什均衡之中。将作为特例被包含在相应的混合策略纳什均衡之中。二、二、存在纯策略均衡

31、时的混合策略均衡存在纯策略均衡时的混合策略均衡第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡1.1.模型模型 使用与纯策略博弈的一般均衡相对应的混合策略博弈使用与纯策略博弈的一般均衡相对应的混合策略博弈的一般的一般模型进行分析。模型进行分析。三、三、混合策略博弈的一般理论混合策略博弈的一般理论452.2.混合策略与混合策略混合策略与混合策略组合组合 两个参与人的全部策略分别包括了各自的两个纯策略。两个参与人的全部策略分别包括了各自的两个纯策略。3.3.期望支付期望支付 运用两个参与人的混合策略组合,可以分别表示出运用两个参与人的混合策略组合,可以分别表示出两个两个参与人参与人得到得

32、到的支付。的支付。第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡三、三、混合策略博弈的一般理论混合策略博弈的一般理论4.4.参与人参与人A A的条件混合策的条件混合策略略 根据根据A A的期望支付公式,可以确定其条件混合策略的期望支付公式,可以确定其条件混合策略。第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡三、三、混合策略博弈的一般理论混合策略博弈的一般理论图图104 A的条件混合策略(二)的条件混合策略(二)2022年5月11日星期三47图图104 A的条件混合策略(二)的条件混合策略(二)2022年5月11日星期三48图图105 A的条件混合策略(三)的条件混合策

33、略(三)2022年5月11日星期三49图图106 A的条件混合策略(四)的条件混合策略(四)2022年5月11日星期三502022年5月11日星期三51第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡5.5.参与人参与人B B的条件混合策的条件混合策略略 根据根据B B的期望支付公式,可以确定其条件混合策略的期望支付公式,可以确定其条件混合策略。三、三、混合策略博弈的一般理论混合策略博弈的一般理论526.6.纳什均衡纳什均衡第一,混合策略纳什均衡的决定第一,混合策略纳什均衡的决定 给定给定A A的一个支付矩阵,就有的一个支付矩阵,就有A A的一个条件混合策略的一个条件混合策略曲线,给

34、定曲线,给定B B的一个支付矩阵,又有的一个支付矩阵,又有B B的一个条件混合的一个条件混合策略曲线。如果把这两个条件混合策略曲线放在同一个策略曲线。如果把这两个条件混合策略曲线放在同一个图中,则其交点就决定了相应情况下的混合策略纳什均图中,则其交点就决定了相应情况下的混合策略纳什均衡。衡。第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡三、三、混合策略博弈的一般理论混合策略博弈的一般理论536.6.纳什均衡纳什均衡第二,第二,A A与与B B的条件混合策略的的条件混合策略的8181种种“搭配搭配”可能可能 A A的条件混合策略曲线有的条件混合策略曲线有9 9种情况,种情况,B B的

35、条件混合策的条件混合策略曲线也有略曲线也有9 9种情况,因此,种情况,因此,A A与与B B的条件混合策略曲线的条件混合策略曲线之间的两两之间的两两“搭配搭配”共有共有9 99=819=81种可能,并最终形成种可能,并最终形成混合策略纳什均衡的混合策略纳什均衡的7 7种类型的种类型的“集合集合”,即,即“单位平单位平面面”、三条线段、两条线段、一条线段、三个点、两个、三条线段、两条线段、一条线段、三个点、两个点和一个点点和一个点。三、三、混合策略博弈的一般理论混合策略博弈的一般理论第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡54第四节第四节 序贯博弈序贯博弈1.1.两个参与者两个

36、参与者 在该博弈中,在该博弈中,两个参与者是两个参与者是竞争者和垄断者。竞争者和垄断者。2.2.两个参与者的决策顺序及其两个参与者的决策顺序及其策略策略 竞争者先决策,它决定进入还是不进入由垄断者独霸的市竞争者先决策,它决定进入还是不进入由垄断者独霸的市场;垄断者后决策,它根据竞争者的行动决定对其场;垄断者后决策,它根据竞争者的行动决定对其“容忍容忍” ” 还是还是“抵抗抵抗” ” 。 竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗竞争者有进入和不进入两个策略,垄断者也有容忍和抵抗两个策略。因此,总共有四个策略组合。两个策略。因此,总共有四个策略组合。 每一策略组合中,第一项是先行动者即竞

37、争者的策略,第每一策略组合中,第一项是先行动者即竞争者的策略,第二项是后行动者即垄断者的策略。二项是后行动者即垄断者的策略。一、一、例子例子:竞争者:竞争者垄断者博弈垄断者博弈55第四节第四节 序贯博弈序贯博弈1.1.博弈树的起点博弈树的起点 “ “起点起点”又叫做又叫做“初始决策点初始决策点”,通常只有一个。起点是,通常只有一个。起点是博弈树的博弈树的“根根”,是序贯博弈开始的地方,是博弈的最先行,是序贯博弈开始的地方,是博弈的最先行动者进行决策的地方。动者进行决策的地方。二、博弈树二、博弈树56第四节第四节 序贯博弈序贯博弈2.2.博弈树的线段博弈树的线段 从初始决策点出发,向右伸展两条线

38、段,分别表示竞从初始决策点出发,向右伸展两条线段,分别表示竞争者可以采取的两个行动或策略。争者可以采取的两个行动或策略。3.3.博弈树的中间点博弈树的中间点 中间点又叫做中间点又叫做“中间决策点中间决策点”,通常至少应有两个。,通常至少应有两个。通常在这些中间决策点的旁边标上通常在这些中间决策点的旁边标上另一另一参与人,表示参与人,表示中间中间点点是是另一参与人另一参与人做决策的地方。做决策的地方。二、博弈树二、博弈树57第四节第四节 序贯博弈序贯博弈4.4.博弈树的博弈树的终终点点第一,第一,终点不是决策点终点不是决策点 终点是博弈结束的地方。终点是博弈结束的地方。 与起点和中间点不同,终点

39、不是决策点:既不是初始与起点和中间点不同,终点不是决策点:既不是初始决策点,也不是中间决策点。因此,终点不属于任何的决策点,也不是中间决策点。因此,终点不属于任何的参与人,终点的旁边没有标注任何的参与人。参与人,终点的旁边没有标注任何的参与人。二、博弈树二、博弈树2022年5月11日星期三58第四节第四节 序贯博弈序贯博弈4.4.博弈树的博弈树的终终点点第二,第二,终点的两层含义终点的两层含义 一是代表博弈的一个策略组合一是代表博弈的一个策略组合从起点开始导向某从起点开始导向某个终点的所有线段按先后秩序排列的一个组合。个终点的所有线段按先后秩序排列的一个组合。 二二是是代表与某一个策略组合相对

40、应的一个支付组合代表与某一个策略组合相对应的一个支付组合在每一个终点的旁边,有一对用圆括号围住的数字,其在每一个终点的旁边,有一对用圆括号围住的数字,其中的第一个数字是先行动者的支付,第二个数字是后行动中的第一个数字是先行动者的支付,第二个数字是后行动者的支付。者的支付。二、博弈树二、博弈树2022年5月11日星期三59第四节第四节 序贯博弈序贯博弈1.1.序贯博弈中的纳什均衡序贯博弈中的纳什均衡 在竞争者在竞争者垄断者博弈中,第一个终点,即旁边标垄断者博弈中,第一个终点,即旁边标有支付组合(有支付组合(1 1,4 4)所代表的策略组合(进入,容忍)所代表的策略组合(进入,容忍)是一个纳什均衡。因为在该策略组合上,没有哪个参与是一个纳什均衡。因为在该策略组合上,没有哪个参与人愿意单独改变自己的策略。人愿意单独改变自己的策略。三、纳什均衡三、纳什均衡60第四节第四节 序贯博弈序贯博弈2.2.序贯博弈中的纳什均衡也可能不止一个序贯博弈中的纳什均衡也可能不止一个 比如,在情侣博弈中,有两个纳什均衡,一个是比如,在情侣博弈中,有两个纳什均衡,一个是(足球,足球),即男方先选择足球,女方然后也选(足球,足球),即男方先选择足球,女方然后也选择足球;另一个是(芭蕾,芭蕾),即男方先选择芭择足球;另一个是(芭蕾,芭蕾),即男方先选择芭蕾,女方然后也选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论