版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第八章博弈论
要解决的问题:人们之间决策的相互作用、相互影响。第八章博弈论要解决的问题:人们之间决策的相互1
博弈论又称为对策论或游戏论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。严格地说,博弈论并不是经济学的一个分支。它是一种方法,应用范围并不局限于经济学。在政治学、军事学、外交学甚至犯罪学等多个领域都涉及到博弈论知识。实际上,它属于数学知识。近20年来,博弈论在经济学中得到了广泛的应用,它对寡头理论、信息经济学等方面的发展做出了重要贡献。博弈论又称为对策论或游戏论,是研究决策主体的行为21994年度的诺贝尔经济学奖授予三位从事对策论研究的经济学家:纳什、泽尔腾、海萨尼。2005年诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。
博弈在经济学中应用最广、最成功,其根本原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。1994年度的诺贝尔经济学奖授予三位从事对策论研3在一个博弈中,基本要素包括参与人或游戏者、行动、信息、战略、收益或支付、结果、均衡等。第一节博弈论基本概念一、博弈的基本要素在一个博弈中,基本要素包括参与人或游戏者、行动、信4参与人(players):指的是在博弈中选择行动以最大化自己效用的决策主体(可能是个人,也可能是团体)。
行动(actions):指的是参与人的决策变量。
战略(strategies):参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。
信息(Information):指的是参与人在博弈中的知识,特别是有关其它参与人的特征和行动的知识。
参与人(players):指的是在博弈中选择行动以最大化自己5在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选择的策略。作为博弈的结局,每个参与者都得到各自的报酬。每一个参与者的报酬都是所有参与者各自所选择的策略的共同作用的结果,或者说是所有参与者所采用的策略的函数——报酬函数或支付函数。可以用一个支付矩阵来描述和分析一个博弈。在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选6假定两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果都坦白,两人要被各判刑7年;如果都抵赖,两人可以各判1年;如果一人坦白而另一人抵赖,则坦白的放出去,抵赖的要被判刑9年。囚徒困境假定两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子7-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白战略式表述囚犯A坦白不坦白囚犯B坦白不坦白战略式表述8二、博弈的分类可以从不同的角度对博弈进行分类1、双人博弈和n人博弈根据局中人的数量,博弈可以划分为双人博弈和n人博弈2、合作博弈与非合作博弈二、博弈的分类可以从不同的角度对博弈进行分类93、根据行动的先后顺序:静态博弈:是指参与人同时行动或不同时行动,但后行动者并不知道先行动者采取了什么具体行动。
—田忌赛马、猜硬币、古诺模型动态博弈:是指参与人行动有先后顺序,且后行动者能观察到先行动者所选择的行动。
—弈棋、市场进入、斯塔克尔伯格模型3、根据行动的先后顺序:104、根据参与人掌握的信息完全信息博弈:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。不完全信息博弈:至少部分参与人不完全了解其他参与人的特征、战略空间及支付函数的情况,也称为“不对称信息博弈”4、根据参与人掌握的信息完全信息博弈:每一个参与人对所有其他11
行动顺序
信息静态动态完全信息完全信息静态博弈纳什均衡纳什完全信息动态博弈子博弈精炼纳什均衡泽尔腾不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾、克瑞普斯、威尔逊、泰勒尔行动顺序静态动态完全完全信息静态博弈完全信息动态博12第二节完全信息静态博弈
占优战略均衡是指参与人的最优战略不依赖于其他参与人的战略选择。不论其他参与人选择什么战略,他的最优战略是唯一的,这个最优战略被称为占优战略。在一个博弈中,如果所有参与人都有占优战略,那么所有参与人的占优战略组合便是该博弈的唯一均衡,叫占优战略均衡。一、占优战略均衡第二节完全信息静态博弈占优战略均衡是指参与人的13-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境()囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境(141701608018020050150100厂商A1020厂商B1020练习:价格竞争策略()厂商A1020厂商B1020练习:价格竞争策略(15二、重复剔除的占优均衡首先找出某一参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略的新的博弈,然后继续剔除这个新的博弈中某一参与人的严格劣战略,直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人的战略组合,就是博弈的均衡解,称为“重复剔除的占优战略均衡”。二、重复剔除的占优均衡首先找出某一参与人的严格劣16有一头大猪和一头小猪住在同一个猪圈里,猪圈的一侧放者猪食槽,另一侧安装着一个控制食物供应的按钮。按一次按钮,有8个单位的食物进槽,但需承担2个单位的成本。偌大猪小猪同时到达猪食槽,大猪吃到5个单位的食物,小猪吃到3个单位的食物;若大猪先到,大猪吃7个单位的食物,小猪只能吃到1个单位;若小猪先到,小猪吃到4个单位食物,大猪也吃到4个单位食物。例子:智猪博弈有一头大猪和一头小猪住在同一个猪圈里,猪例子:智猪博弈17007-12431大猪按等待小猪按等待小猪的理性选择是“等待”,那么大猪就会正确的预测到小猪的选择而将“等待”剔除,(按,等待)是该博弈的唯一均衡。大猪的收益外部化,小猪不劳而获,免费搭了大猪的便车。大猪按等待小猪按等待小猪的理性选择是“等待”,那么大猪就会正183,67,15,1
8,26,06,2游戏者B
U
V游戏者AXYZ练习:寻找占优战略均衡?()3,67,15,119三、纳什均衡纳什均衡是指这样一种均衡状态,在这一均衡状态中,每一个参与人选择的战略必须是针对其他参与人选择战略的最优反映,没有人愿意独立放弃他所选择的战略。纳什均衡要求任何一个参与者在其他参与者的策略选择给定的条件下,其选择的策略是最优的。在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略。三、纳什均衡纳什均衡是指这样一种均衡状态,在这一均衡状态中,20占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者任何策略选择来说,其最优策略都是唯一的。而纳什均衡只要求任何一个参与者在其他参与者的策略选择给定的条件下,其选择的策略是最优的。所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡。占优策略均衡是比纳什均衡更强的一个博弈均衡概念。21-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境220,66,07,56,0
0,67,55,75,58,8游戏者B
U
VW游戏者AXYZ练习:寻找纳什均衡?0,66,07,523囚徒困境的启示个体理性与集体理性的矛盾。可以解释的问题:寡头厂商关于价格、产量的博弈公共资源的供给问题军备竞赛一种制度安排或一种体制选择,要发生效力,它必须是纳什均衡。否则,这种制度安排是不能成立的。囚徒困境的启示个体理性与集体理性的矛盾。24例子:性别战12000021男看足球看电影女看足球看电影例子:性别战男看足球看电影女看足球看电影25纳什均衡常常不是唯一的,在这种条件下,纳什均衡的存在性并不意味着均衡结果会出现,即使结果是一个纳什均衡,但也是我们无法准确预测的;经济学家的建议是:可以增加更多的限制条件,如增加参与人的其他信息,使得纳什均衡的数目减少,从而做出预测。纳什均衡常常不是唯一的,在这种条件下,纳什均衡的存在性并不意26纳什均衡纳什均衡是博弈的结局,在该均衡中每个局中人均不能因单方面改变自己的策略选择而获益。纳什均衡是一个僵局:给定别人不动的情况下,没有人有兴趣动。纳什均衡可以理解为一种具有自我强制力的协议,即这种协议没有外加力量保证实施却使每个参与者都自愿遵守,原因就在背叛协议无利可图。纳什均衡纳什均衡是博弈的结局,在该均衡中每个局中人均不能因单27四、混合战略纳什均衡混合战略指的是参与人以一定的概率钻则某种战略,导致其他人不能准确的猜出它实际的选择。甲乙两个人玩同时掷硬币游戏。两人约定,如果两枚硬币正面或反面同时朝上,则甲付给乙1块钱;如果出现一正一帆,则乙付给甲1块钱。四、混合战略纳什均衡混合战略指的是参与人以一定的28-111-11-1-11甲正面反面乙正面反面例子:猜硬币甲正面反面乙正面反面例子:猜硬币29如果每一个参与人完全清楚对手将会采取什么样的战略,则不会出现均衡。在实际博弈中,每个参与人都试图猜中对方的战略,然后自己采用相应的战略,因此双方都以随机的方法去出示硬币是最安全的,也是最优的。这样一来,参与人的战略选择变成不确定的,是遵从某一概率分布的随机选择。假设参与人甲选择正面的概率为p,选择背面的概率为1-p;参与人乙选择正面的概率为q,选择背面的概率为1-q。参与人甲的收益是:如果每一个参与人完全清楚对手将会采取什么样的战略,则不会出现30这表明当甲乙两个人分别以50%的概率选择正面和背面的次数时,对策达到了纳什均衡。这表明当甲乙两个人分别以50%的概率选择正面和背31第三节完全信息动态博弈在上面的分析中,所有的对局者仅对抗一次,不会重复进行。这是一种静态博弈。但是在现实中,同样结构的博弈可能要重复许多次。在对局可以多次重复的情况下,每个对局者在选择策略的时候,不仅需要考虑当前的对局,可能还要考虑当前选择的策略对于以后的对局将产生什么影响。一、重复博弈第三节完全信息动态博弈在上面的分析中,所有的对32如果博弈重复多次,每个参与人都有机会树立合作的信誉,并鼓励对方也树立起合作的信誉以换取双赢的机会。1451451803018030100100厂商A1020厂商B1020如果博弈重复多次,每个参与人都有机会树立合作的信33二、序列博弈在实践中,还存在着另一种情况,参与者的行动有先后顺序,而且后行动的参与者在自己行动之前可以观测到先行动者的行动,并选择相应的战略。这种博弈称为序列博弈,是动态博弈的一种形式。二、序列博弈在实践中,还存在着另一种情况,参与者340001001000-50-50厂商A进入不进入厂商B进入不进入厂商A进入不进入厂商B进入不进入35ABB不进入进入不进入不进入进入进入(-50,-50)(100,0)(0,100)(0,0)ABB不进入进入不进入不进入进入进入(-50,-50)(1036第八章博弈论
要解决的问题:人们之间决策的相互作用、相互影响。第八章博弈论要解决的问题:人们之间决策的相互37
博弈论又称为对策论或游戏论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。严格地说,博弈论并不是经济学的一个分支。它是一种方法,应用范围并不局限于经济学。在政治学、军事学、外交学甚至犯罪学等多个领域都涉及到博弈论知识。实际上,它属于数学知识。近20年来,博弈论在经济学中得到了广泛的应用,它对寡头理论、信息经济学等方面的发展做出了重要贡献。博弈论又称为对策论或游戏论,是研究决策主体的行为381994年度的诺贝尔经济学奖授予三位从事对策论研究的经济学家:纳什、泽尔腾、海萨尼。2005年诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们通过博弈理论的分析增强世人对合作与冲突的理解。
博弈在经济学中应用最广、最成功,其根本原因是经济学和博弈论的研究模式是一样的,都强调个人理性,即追求给定条件下效用最大化。1994年度的诺贝尔经济学奖授予三位从事对策论研39在一个博弈中,基本要素包括参与人或游戏者、行动、信息、战略、收益或支付、结果、均衡等。第一节博弈论基本概念一、博弈的基本要素在一个博弈中,基本要素包括参与人或游戏者、行动、信40参与人(players):指的是在博弈中选择行动以最大化自己效用的决策主体(可能是个人,也可能是团体)。
行动(actions):指的是参与人的决策变量。
战略(strategies):参与人选择行动的规则,它告诉参与人在什么时候选择什么行动。
信息(Information):指的是参与人在博弈中的知识,特别是有关其它参与人的特征和行动的知识。
参与人(players):指的是在博弈中选择行动以最大化自己41在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选择的策略。作为博弈的结局,每个参与者都得到各自的报酬。每一个参与者的报酬都是所有参与者各自所选择的策略的共同作用的结果,或者说是所有参与者所采用的策略的函数——报酬函数或支付函数。可以用一个支付矩阵来描述和分析一个博弈。在每一个博弈中,都至少有两个参与者,每一个参与者都有一组可选42假定两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果都坦白,两人要被各判刑7年;如果都抵赖,两人可以各判1年;如果一人坦白而另一人抵赖,则坦白的放出去,抵赖的要被判刑9年。囚徒困境假定两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子43-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白战略式表述囚犯A坦白不坦白囚犯B坦白不坦白战略式表述44二、博弈的分类可以从不同的角度对博弈进行分类1、双人博弈和n人博弈根据局中人的数量,博弈可以划分为双人博弈和n人博弈2、合作博弈与非合作博弈二、博弈的分类可以从不同的角度对博弈进行分类453、根据行动的先后顺序:静态博弈:是指参与人同时行动或不同时行动,但后行动者并不知道先行动者采取了什么具体行动。
—田忌赛马、猜硬币、古诺模型动态博弈:是指参与人行动有先后顺序,且后行动者能观察到先行动者所选择的行动。
—弈棋、市场进入、斯塔克尔伯格模型3、根据行动的先后顺序:464、根据参与人掌握的信息完全信息博弈:每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识。不完全信息博弈:至少部分参与人不完全了解其他参与人的特征、战略空间及支付函数的情况,也称为“不对称信息博弈”4、根据参与人掌握的信息完全信息博弈:每一个参与人对所有其他47
行动顺序
信息静态动态完全信息完全信息静态博弈纳什均衡纳什完全信息动态博弈子博弈精炼纳什均衡泽尔腾不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼不完全信息动态博弈精炼贝叶斯纳什均衡泽尔腾、克瑞普斯、威尔逊、泰勒尔行动顺序静态动态完全完全信息静态博弈完全信息动态博48第二节完全信息静态博弈
占优战略均衡是指参与人的最优战略不依赖于其他参与人的战略选择。不论其他参与人选择什么战略,他的最优战略是唯一的,这个最优战略被称为占优战略。在一个博弈中,如果所有参与人都有占优战略,那么所有参与人的占优战略组合便是该博弈的唯一均衡,叫占优战略均衡。一、占优战略均衡第二节完全信息静态博弈占优战略均衡是指参与人的49-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境()囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境(501701608018020050150100厂商A1020厂商B1020练习:价格竞争策略()厂商A1020厂商B1020练习:价格竞争策略(51二、重复剔除的占优均衡首先找出某一参与人的严格劣战略,将它剔除掉,重新构造一个不包括已剔除战略的新的博弈,然后继续剔除这个新的博弈中某一参与人的严格劣战略,直到剩下唯一的参与人战略组合为止。这个唯一剩下的参与人的战略组合,就是博弈的均衡解,称为“重复剔除的占优战略均衡”。二、重复剔除的占优均衡首先找出某一参与人的严格劣52有一头大猪和一头小猪住在同一个猪圈里,猪圈的一侧放者猪食槽,另一侧安装着一个控制食物供应的按钮。按一次按钮,有8个单位的食物进槽,但需承担2个单位的成本。偌大猪小猪同时到达猪食槽,大猪吃到5个单位的食物,小猪吃到3个单位的食物;若大猪先到,大猪吃7个单位的食物,小猪只能吃到1个单位;若小猪先到,小猪吃到4个单位食物,大猪也吃到4个单位食物。例子:智猪博弈有一头大猪和一头小猪住在同一个猪圈里,猪例子:智猪博弈53007-12431大猪按等待小猪按等待小猪的理性选择是“等待”,那么大猪就会正确的预测到小猪的选择而将“等待”剔除,(按,等待)是该博弈的唯一均衡。大猪的收益外部化,小猪不劳而获,免费搭了大猪的便车。大猪按等待小猪按等待小猪的理性选择是“等待”,那么大猪就会正543,67,15,1
8,26,06,2游戏者B
U
V游戏者AXYZ练习:寻找占优战略均衡?()3,67,15,155三、纳什均衡纳什均衡是指这样一种均衡状态,在这一均衡状态中,每一个参与人选择的战略必须是针对其他参与人选择战略的最优反映,没有人愿意独立放弃他所选择的战略。纳什均衡要求任何一个参与者在其他参与者的策略选择给定的条件下,其选择的策略是最优的。在一个纳什均衡里,任何一个参与者都不会改变自己的策略,如果其他参与者不改变策略。三、纳什均衡纳什均衡是指这样一种均衡状态,在这一均衡状态中,56占优策略均衡是比纳什均衡更强的一个博弈均衡概念。占优策略均衡要求任何一个参与者对于其他参与者任何策略选择来说,其最优策略都是唯一的。而纳什均衡只要求任何一个参与者在其他参与者的策略选择给定的条件下,其选择的策略是最优的。所以,占优策略均衡一定是纳什均衡,而纳什均衡不一定就是占优策略均衡。占优策略均衡是比纳什均衡更强的一个博弈均衡概念。57-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境580,66,07,56,0
0,67,55,75,58,8游戏者B
U
VW游戏者AXYZ练习:寻找纳什均衡?0,66,07,559囚徒困境的启示个体理性与集体理性的矛盾。可以解释的问题:寡头厂商关于价格、产量的博弈公共资源的供给问题军备竞赛一种制度安排或一种体制选择,要发生效力,它必须是纳什均衡。否则,这种制度安排是不能成立的。囚徒困境的启示个体理性与集体理性的矛盾。60例子:性别战12000021男看足球看电影女看足球看电影例子:性别战男看足球看电影女看足球看电影61纳什均衡常常不是唯一的,在这种条件下,纳什均衡的存在性并不意味着均衡结果会出现,即使结果是一个纳什均衡,但也是我们无法准确预测的;经济学家的建议是:可以增加更多的限制条件,如增加参与人的其他信息,使得纳什均衡的数目减少,从而做出预测。纳什均衡常常不是唯一的,在这种条件下,纳什均衡的存在性并不意62纳什均衡纳什均衡是博弈的结局,在该均衡中每个局中人均不能因单方面改变自己的策略选择而获益。纳什均衡是一个僵局:给定别人不动的情况下,没有人有兴趣动。纳什均衡可以理解为一种具有自我强制力的协议,即这种协议没有外加力量保证实施却使每个参与者都自愿遵守,原因就在背叛协议无利可图。纳什均衡纳什均衡是博弈的结局,在该均衡中每个局中人均不能因单63四、混合战略纳什均衡混合战略指的是参与人以一定的概率钻则某种战略,导致其他人不能准确的猜出它实际的选择。甲乙两个人玩同时掷硬币游戏。两人约定,如果两枚硬币正面或反面同时朝上,则甲付给乙1块钱;如果出现一正一帆,则乙
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园小班2024年新学期教研工作计划
- 行政科的工作计划
- 一:某年卫生院传染病防治工作计划
- icu院感工作计划
- 苏教版五年级语文下册教学计划学校工作计划
- 志愿服务西部计划的个人总结范文
- 学年校本培训计划培训工作计划
- 汽车配件经理工作总结4s店配件工作计划
- 咖啡店经验计划
- 市场监督管理局2024年工作总结和来年工作计划范文
- 《囚歌》教学课件
- 营养快餐计划书
- 幼儿园大班科学课件:《植物的生长》
- 国家开放大学《学前儿童游戏指导》期末复习题参考答案
- 中国老年糖尿病诊疗指南(2024)解读
- 汽轮机本体检修三措两案
- 索道应急救援培训课件
- 2023-2024学年湖南省长沙市雅礼教育集团七年级(上)期末数学试卷(含解析)
- 普洱茶与黑茶
- 译林版小学六年级Unit7单元测试卷
- 合规管理在国际贸易中的要求
评论
0/150
提交评论