纳什均衡及应用举例博弈论

上传人：1*** IP属地：广西上传时间：2024-01-20 格式：PPT 页数：116 大小：633.50KB 积分：18 举报 版权申诉

已阅读5页，还剩111页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第一章完全信息静态信息博弈-纳什均衡一博弈的根本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例博弈论的根本概念与求解引例：房地产开发博弈设一个房地产开发商A打算开发一栋写字楼，面临的选择是开发或不开发；假设开发，投入资金1亿元，不开发资金投入为0另有一个开发商B也面临同样的选择。影响因素：市场需求的大小影响因素：竞争对手的选择引例：房地产开发博弈如果市场上有两栋楼出售，需求大时，每栋售价1.4亿元，需求小时7000万元如果市场上只有一栋楼出售，需求大时。每栋售价1.8亿元，需求小时1.1亿元需求大，A开发,B开发,利润各4000万元需求大，A开发，B不开发，A8000万元，B为0需求大，A不开发,B开发，B为8000万元，A为0需求大，A不开发,B不开发,都为0需求小，A开发,B开发，AB各为-3000万元需求小，A开发,B不开发。A为1000万元B为0需求小，A不开发,B开发A为0，B为1000万元需求小，A不开发,B不开发，都为0房地产开发博弈房地产开发博弈4000，40008000，00，80000，0不开发开发商A开发不开发开发-3000，-30001000，00，10000，0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况假设双方同时决策假设市场需求假设市场需求未知，是否开发依赖于各自在多大程度上认为需求是大的，以对方是否开发房地产开发博弈假设双方不同时决策，且市场需求不确定设B在A之前决策，且只有B了解市场需求假设需求是大的,B选择开发假设需求是小的，B的选择依赖于他多大程度上相信A会开发，而A是否开发依赖于A在多大程度上认为需求是大的。房地产开发博弈博弈的根本概念PlayersActionStrategies&strategiessetInformationPayoff&payofffunctionOutcome&EquilibriumPlayers决策主体：单人博弈、两人博弈和多人博弈。目的是通过选择行动或策略以最大化自己的支付或效用水平自然人或团体，如企业、国家、OPEC、EU重要的是每个决策主体必须有可供选择的行动或策略和一个很好定义的偏好而不做决策的被动主体只当作环境参数虚拟参与人：“自然〞〔nature〕作为“虚拟参与人〞〔pseudo-player〕来处理。这里的自然指决定外生随机变量的概率分布的机制房地产开发博弈4000，40008000，00，80000，0不开发开发商A开发不开发开发-3000，-30001000，00，10000，0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况N高低[P][1-P]不进入进入不进入进入BB合作斗争合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)市场进入博弈行动action行动：是参与人的决策变量参与人的行动可以是离散的，也可以是连续的。如Ai={开发，不开发}行动组合：n个参与人的行动有序集(如〔不开发，开发〕)行动顺序：有关静态博弈和动态博弈的区分在博弈论中，一般假定参与人的行动空间和行动顺序是所有参与人的共同知识Strategies&strategiesset战略：是参与人选择行动的规那么，它告诉参与人在什么时候选择什么行动战略组合战略与行动是两个不同的概念，战略是行动的规那么而不是行动本身“人不犯我，我不犯人；人假设犯我，我必犯人〞是一种战略，这里的“犯〞与“不犯〞是两种行动，战略规定了什么时候选择“犯〞，什么时候选择“不犯〞静态博弈中参与人同时行动。战略和行动是相同的作为一种行动规那么，战略必须是完备的，就是说，它要给出参与人在每一种可想象到的情况下的行动选择，即使参与人并不预期这种情况会实际发生房地产开发博弈4000，40008000，00，80000，0不开发开发商A开发不开发开发-3000，-30001000，00，10000，0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况如果B在市场需求情况未知下先行动，A在得知B的行动后再行动。B的战略SB=(开发，不开发)A的战略SA=({开发，开发},{开发，不开发},{不开发，开发},{不开发，不开发})一个战略组合s=({不开发，开发},开发)，A的战略是“如果B开发，我不开发；如果B不开发，我开发〞，B的战略是“开发〞。类似的可以列出其他7个战略组合Information是Player有关博弈的知识，特别是有关其他参与人〔对手〕的特征和行动的知识.它是重要的决策依据和决定博弈结果的重要因素。信息集：参与人在特定时刻有关变量的值的信息CommonKnowledge即共同知识〔所有参与人知道，所有参与人知道所有参与人知道，〕CompleteandPerfect

——完全信息与完美信息两者主要区别是在对博弈结果与博弈进程知识的掌握情况有差异：假设每一个参与人都知道所有其他参与人的支付或结果，称为完全信息博弈〔CIG〕.假设有一个人不知道其他人的支付,称不完全信息博弈IIG.假设每一个参与人都知道所有其他参与人的博弈进程，即动态博弈中轮到行为的博弈方完全了解此前行为的各博弈方的行为，即了解全部博弈进程，称为完美的,否那么就是不完美的.如房地产开发博弈中，如果至少有一个参与人不知道市场需求的大小，信息是不完全的也是不完美的如果两个参与人都知道市场需求是大的还是小的，信息是完全的，但如果A不知道B选择了什么行动，那么A的信息是不完美的。CompleteandPerfect

——完全信息与完美信息支付Payoff它是指在一个特定的策略组合下player得到确实定的效用水平，或者指参与人得到的期望效用水平。这是player真正关心的东西，是player博弈后所得利益。他的目标就是在自己可以选择的战略集合里，选择某个战略以最大化自己的期望效用函数〔v-N-M预期效用函数〕。支付如果有n人博弈，令ui为Playeri的支付(效用水平〕，u=(u1,…ui…un)为支付组合payoffprofile,博弈的一个根本特征是一个参与人的支付不仅取决于自己的战略选择，而且取决于所有其他参与人的战略选择，即ui是所有参与人的战略选择的函数：ui=ui(s1,,…si,…sn),其中si是Playeri的战略选择。房地产开发博弈参与人的利润水平即是他们的支付，如果A,B同时行动UA(需求大，A开发,B开发)=UB(需求大，A开发,B开发)=4000UA(需求小，A开发,B开发)=UB(需求小，A开发,B开发)=-3000UA(需求大，A开发,B不开发〕=8000UB(需求小，A不开发,B开发〕=1000。。。。。。例如A认为高需求的概率是0.5，给定B选择开发，A选择开发的期望效用为:EuA(开发，开发)=0.5*4000+0.5*(-3000)=500Outcome&Equilibrium

——结果与均衡博弈的结果是所有博弈方所关心的，如均衡策略组合，均衡行动组合，均衡支付组合。在房地产开发博弈中，可能的结果是〔高需求，开发，开发)，(uA,uB)=(4000,4000)〔低需求，开发，不开发)，(uA,uB)=(1000,0)均衡均衡是所有参与人的最优战略的组合，一般记为S*=〔S1*，…,Si*,…,Sn*)其中，Si*是Playeri在均衡情况下的最优策略。在一般均衡理论中，均衡指由个人最优化行为导致的一组价格，而在博弈论里，这一组价格只是均衡的结果而不是均衡本身：均衡是指所有个人的买卖规那么〔战略〕的组合，均衡价格是这种战略组合的结果在这里，“均衡〞和“均衡结果〞是两个不同的概念博弈分类博弈中的博弈方

单人博弈

两人博弈

多人博弈

博弈中的策略

有限策略博弈无限策略博弈

博弈中的得益

零和博弈

常和博弈

变和博弈

博弈的过程

静态博弈

动态博弈

重复博弈单人博弈00M0A左B左A左B右A右B左A右B右单人迷宫得益矩阵

入口出口（奖金M）单人迷宫

AB单人博弈（M）AB（0）（0）单人迷宫扩展形两人博弈两人博弈就是在两个各自独立决策，相互具有策略依存关系的博弈方之间的决策问题两人博弈是博弈中最普通、最常见，也是研究得最多的博弈类型。如，囚徒的困境、齐威王与田忌赛马、猜硬币、石头·剪子·布，日常生活中的棋牌、球类比赛，以及经济活动中两厂商之间的竞争、谈判、兼并收购、劳资纠纷等等都是两人博弈问题两人博弈中的本卷须知

两个博弈方之间并不总是相互对抗，有时也会利益一致掌握信息较多并不能保证得益较多个人追求自身最大利益的行为常常并不能导致实现社会的最大利益。多人博弈例子11，1，100，5，55，0，52，2，2新技术老技术新技术老技术厂商2厂商

厂商3—新技术（A）1

厂商3—老技术2，2，21，10，110，1，15，5，0新技术新技术老技术老技术厂商2厂商（B）有限策略和无限策略不同的博弈问题中各博弈方可选策略的多少不同，一般分为：有限策略博弈和无限策略博弈有限策略〔所有博弈方都只有有限种可选策略〕的博弈只有有限种结果〔一种结果就是每个博弈方各一种可选策略构成的一个组合，全部可能的结果的数量因而就等于各博弈方可选策略数的连乘积〕有限策略博弈往往用支付矩阵、扩展形法将所有策略、结果及支付罗列出来。无限策略博弈其策略数种往往是一个连续数，只能用数集或函数式加以表示。有限策略与无限策略同时存在一个博弈问题中零和博弈

零和博弈：

社会总得益，即各博弈方得益之和总是为0

-1，11，-11，-1-1，1正面反面猜硬币方盖硬币方正面反面零和博弈零和博弈的特点：各博弈方之间的利益对立，“你死我活〞的关系，结果不能完全确定，不能让他们猜出自己将选择的策略用零和博弈构成的重复博弈与非零和博弈构成的重复博弈会表现出很大的不同，零和博弈重复进行屡次不改变博弈方之间相互对立的关系，其他博弈的重复博弈产生新的时机常和博弈

常和博弈：每种结果之下各博弈方的得益之和不等于0，但总是等于一个非零常数，零和博弈本身可被看作是常和博弈的特例常和博弈的特点：各博弈方之间的利益关系也是对立的，博弈方之间的根本关系也是竞争不一定要有输家，利益的对立性表达在利益的多少，结果可能出现大家分得合理或者说满意的一份，因此也比较容易相互妥协和和平共处。这种博弈往往有一个确定的结果在重复博弈中，因为常和博弈的重复能使总得益增加，因此情况就会复杂得多，并会创造出许多新的结果变和博弈

变和博弈：意味着在不同策略组合〔结果〕下各博弈方的得益之和不相同的变和博弈的特点：最一般的博弈类型，常和博弈和零和博弈那么都是它的特例存在着社会总得益较大的策略组合和社会总得益较小的策略组合之间的区别，博弈方之间存在互相配合〔不是指公开的合作，只是指各博弈方在利益驱动下各自自觉、独立采取的合作的态度和行为〕，争取较大的社会总得益和个人得益的可能性。这种博弈的结果可以从社会总得益的角度分为“有效率的〞或“无效率的〞、“低效率的〞各博弈方之间的关系复杂，它们的重复博弈就更加复杂了博弈的过程〔1〕静态博弈：所有博弈方同时或可看作同时选择策略的博弈动态博弈：各博弈方不是同时，而是先后、依次进行选择、行动，后选择、行动的博弈方在自己选择行动之前一般能看到此前其他博弈方的选择、行动的博弈动态博弈与静态博弈中“策略〞有差异：静态博弈中，博弈方都只有一次选择、行为的时机，“策略〞是唯一的选择或行为，“策略〞与“选择〞、“行为〞等价动态博弈中，一个博弈方可能有屡次选择、行为，后选择、行为的博弈方在轮到选择、行为时会面临不同的情况，博弈方的决策内容就不是一个简单的单一选择，而是在每次轮到选择、行为时，面临各种情况，如何选择、行为的“完整的方案〞，“策略〞是指这种方案，策略与选择、行为之间不能简单等同博弈的过程〔2〕重复博弈：同一个博弈反复进行所构成的博弈过程重复博弈的分类：有限次重复博弈和无限次重复博弈重复博弈本卷须知：重复博弈关心的不是某一次重复的结果或得益，而是原博弈重复进行以后的总体效果或平均效果，不能把重复博弈割裂为一次次独立的博弈进行分析，而是要将它们作为一个完整的过程和整体来进行分析，重复博弈是一种动态博弈，是一种特殊的动态博弈，要用动态博弈的分析方法加以分析大多数重复博弈都是由静态博弈作为原博弈构成的，要利用静态博弈的性质和研究方法博弈的过程〔2〕重复博弈本卷须知：一次性博弈，特别是静态博弈，各博弈方决策时只需要考虑眼前的利益，不存在“将来〞利益的问题，博弈方是不惜“欺骗〞“伤害〞其他博弈方的博弈不止进行一次，而是要反复进行屡次，那么各博弈方可能会在开头的各次博弈中试图合作，采取对大家长期来说都较有利的策略，因为一旦任何一方觉察他方不合作，都有时机在以后阶段进行报复，也就是说，重复博弈给博弈提供了新的实现更有效率的结果的可能性，重复博弈的重复次数越多，这种可能性就越大如何求解一个博弈问题？什么是博弈问题的解是一个策略组合，也是最优策略组合；即在给定条件下，每一个博弈方最大化自己效用选择的结果。如在G={S1,…Sn;u1,…un}中，如果所有策略组合〔S1*，…,Si*,…,Sn*)，其中任一博弈方i的策略Si*都是对其余博弈方的策略组合S-i*=〔S1*，…,S*i-1,S*i+1…,Sn*)的最正确对策,那么这个策略组合就是博弈的解。博弈的根本分析思路和方法严格下策反复消去法划线法箭头法严格下策反复消去法

严格下策：不管其他博弈方的策略如何变化，自己的某一策略给他带来的得益总是比其他某些〔不必是全部〕策略给他带来的得益要小，该“某一策略〞称为相对于“其他某些策略〞的“严格下策〞严格下策反复消去法例子

2,00,20,40,11,31,0左右中上下博弈方2博弈方1

图1严格下策反复消去法

0，20，41，31，0上下左中博弈方2博弈方图2消去右策后得益矩阵

1，31，0博弈方2左中上博弈方图3再消去的“下”策后得益矩阵注意：严格下策反复消去法不局限于用在可用得益矩阵表示的博弈

严格下策反复消去法步骤：找出某博弈方的某策略是相对于他的其他某些策略的严格下策，将它从该博弈方的策略空间中去掉在该博弈方余下的策略空间和其他博弈方的策略构成的策略组合中，检查是否还存在严格下策，如有，那么再将其从相应博弈方的策略空间中去掉，如此反复，直到找不出任何严格下策如果最后只有唯一的一个策略组合幸存下来，那么它一定就是该博弈的解严格下策反复消去法

划线法

划线法：通过在每一博弈方针对对方每一策略的最大可能得益下划线以求解博弈的方法结论：图中得益矩阵所表示的博弈中就存在唯一的两数字下都划有短线的得益数组，即对应策略组合〔上，中〕的得益数组〔1，3〕，因此策略组合〔上，中〕是该得益矩阵表示的博弈的具有稳定性的解例子：2，00，20，40，11，31，0下上右中左博弈方2博弈方划线法分析囚徒困境

结论：策略组合〔坦白，坦白〕对应数组〔-5，-5〕是该得益矩阵表示的博弈的具有稳定性的解-1，-1-8，00，-8-5，-5坦白不坦白坦白不坦白囚徒2囚徒划线法分析猜硬币困境

结论：猜硬币博弈中没有一种策略组合中的双方策略正好相互都是关于对方策略的最正确对策，即没有一个策略组合会是双方都自愿接受的，该博弈不可能有确定的，或者至少是具有稳定性的结果-1，11，-11，-1-1，1正面反面正面反面猜硬币方盖硬币方划线法分析夫妻之争结论：存在两个所有数字下都划有短线的得益数组。意味着而在夫妻之争博弈中，由于有两个双方策略都是对对方策略的最正确对策组成的策略组合〔时装表演，时装表演〕和〔足球，足球〕，因此，虽然一旦选了该两策略组合中任何一个都不会有哪一方愿意单独改变策略〔一方单独改变策略只能使自己的得益减少〕，但却无法确定到底会出现哪个，因此该博弈有稳定性的解却没有确定性的解1，30，00，02，1时装足球时装足球丈夫妻子箭头法

箭头法：通过反映各博弈方选择倾向的箭头寻找稳定性的策略组合求解博弈的方法思路：对博弈中的每个策略组合，判断各博弈方能否通过单独改变自己的策略而改善自己的得益，如能，那么从所考察的策略组合的得益引一箭头到改变策略后的策略组合对应的得益。这样对每个可能的策略组合都考察过以后，根据箭头反映的情况来判断博弈的结果箭头法分析例子

在图中只有指向的箭头而没有指离的箭头的唯一一个得益数组是对应〔上，中〕策略组合的〔1，3〕，其余5个得益数组那么至少有一个指离的箭头，因此〔上，中〕是该博弈唯一稳定的策略组合并且也是博弈的解2,00,20,40,11,31,0左右中上下博弈方2博弈方1箭头法分析猜硬币

图中猜硬币博弈中没有一个得益数组只有指向的箭头，因此没有任何具有稳定性的策略组合和确定的解-1，11，-11，-1-1，1正面反面猜硬币方盖硬币方正面反面箭头法分析夫妻之争结论：图中夫妻之争博弈的得益矩阵中，有〔时装，时装〕和〔足球，足球〕两策略组合的得益只有指向的箭头，没有指离的箭头，即有两个具有稳定性的策略组合1，30，00，02，1时装足球丈夫妻子时装足球博弈的战略式表述博弈的战略式表述：非合作博弈论

不完全信息动态博弈；精炼贝叶斯纳什均衡；泽尔腾（1975），Kreps和Wilson（1982），Fudenberg和Tirole（1991）不完全信息静态博弈；贝叶斯纳什均衡；海萨尼（1967－1968）不完全信息完全信息动态博弈；子博弈精炼纳什均衡；泽尔腾（1965）完全信息静态博弈；纳什均衡；纳什（1950，1951）完全信息动态静态行动顺序信息非合作博弈的分类及对应的均衡概念第一章完全信息静态信息博弈-纳什均衡一博弈的根本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例二占优战略均衡完全信息静态博弈完全信息：每个参与人对所有其他参与人的特征〔包括战略空间、支付函数等〕完全了解静态：所有参与人同时选择行动且只选择一次。同时：只要每个参与人在选择自己的行动时不知道其他参与人的选择，就是同时行动博弈分析的目的是预测均衡结果二占优战略均衡案例1-囚徒困境-8，-80，-10-10，0-1，-1囚徒A囚徒B坦白抵赖坦白抵赖-8大于-100大于-1-8大于-100大于-1抵赖是A的严格劣战略抵赖是B的严格劣战略二占优战略均衡占优战略：不管其他人选择什么战略，参与人的最优战略是唯一的，这样的最优战略称为“占优战略〞(dominantstrategy)。二占优战略均衡占优战略均衡定义：在博弈的战略表达式中，如果对于所有的i，Si*是i的占优战略，以下战略组合称为占优战略均衡：二占优战略均衡注意：如果所有人都有〔严格〕占优战略存在，那么占优战略均衡就是可以预测的唯一均衡。占优战略只要求每个参与人是理性的，而不要求每个参与人知道其他参与人是理性的〔也就是说，不要求理性是共同知识〕。为什么？二占优战略均衡4000，40008000，00，80000，0不开发开发商A开发不开发开发-3000，-30001000，00，10000，0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述A严格劣战略B严格劣战略

5，14，49，-10，0等待小猪大猪按等待按案例2-智猪博弈等待是小猪的严格占优战略大猪有无严格占优战略？4大于10大于-1第二章完全信息静态信息博弈-纳什均衡一博弈的根本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例三重复剔除的占优均衡重复剔除严格劣战略：思路：首先找到某个参与人的劣战略〔假定存在〕，把这个劣战略剔除掉，重新构造一个不包含已剔除战略的新的博弈，然后再剔除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡〞。三重复剔除的占优均衡注意：

与占优战略均衡中的占优战略和劣战略不同，这里的占优战略或劣战略可能只是相对于另一个特定战略而言。三重复剔除的占优均衡

5，14，49，-10，0等待小猪大猪按等待按案例2-智猪博弈按是小猪的严格劣战略-剔除4大于10大于-1“按〞是大猪的占优战略，纳什均衡：大猪按，小猪等待三重复剔除的占优均衡重复剔除的占优均衡战略组合称为重复剔除的占优均衡，如果它是重复剔除劣战略后剩下的唯一战略组合。如果这种唯一战略组合是存在的，我们就说该博弈是重复剔除占优可解。注意：如果重复剔除后的战略组合不唯一，该博弈就不是重复剔除占优可解的。三重复剔除的占优均衡1，01，20，30，1M列先生行先生UDL0，12，0R行：没有占优战略列：M严格优于R剔除R行：U优于D列：无占优战略剔除DM优于L〔U，M〕是重复剔除的占优均衡三重复剔除的占优均衡练习：在以下战略式表达中，找出重复剔除的占优均衡4，35，16，22，18，43，63，09，62，8C2R1R2C1C3R3弱劣的概念定义：弱劣于战略〔isweaklydominatedby〕，如果对于所有的，，且对于某些，严格不等式成立。称为相对于的弱占优战略。三重复剔除的占优均衡三重复剔除的占优均衡注意：1、重复剔除的占优均衡结果与劣战略的剔除顺序是否有关取决于剔除的是否是严格劣战略。〔如果每次剔除的是严格劣战略，均衡结果与剔除的顺序无关。然而如果剔除的是弱劣战略，均衡结果可能与剔除顺序有关。〕2、重复剔除的占优均衡要求每个参与人是理性的，而且要求“理性〞是参与人的共同知识。即：所有参与人知道所有参与人是理性的，所有参与人知道所有参与人知道所有参与是理性的三重复剔除的占优均衡2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除顺序：R3、C3、C2、R2，战略组合〔R1，C1〕故一般使用严格劣战略剔除，可以看到，〔R1，C3〕〔R1，C1〕都是纳什均衡，但在这里是不可解的。剔除顺序：C2、R2、C1、R3，战略组合〔R1，C3〕举例：三重复剔除的占优均衡尽管许多博弈中重复剔除的占优均衡是一个合理的预测，但并不总是如此，尤其是大概支付某些极端值的时候。8，10-1000，97，66，5参与人B参与人AUDLRU是A的最优选择，但是，只要有1/1000的概率B选R，A就会选D房地产开发中需求小情况4000，40008000，00，80000，0不开发开发商A开发不开发开发-3000，-30001000，00，10000，0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况博弈的战略式表述斗鸡博弈-3，-32，00，20，0退BA进退进独木桥纳什均衡：A进，B退；A退，B进对于相当多的博弈，我们无法运用重复剔除劣战略的方法找出均衡解。为了找出这些博弈的均衡解，需要引入纳什均衡。第二章完全信息静态信息博弈-纳什均衡一博弈的根本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例四纳什均衡假设n个参与人在博弈之前达成一个协议，规定每一个参与人选择一个特定的战略，另代表这个协议，在没有外在强制力的情况下，如果没有任何人有积极性破坏这个协议，那么这个协议是自动实施的。这个协议就构成了一个纳什均衡。四纳什均衡通俗地说，纳什均衡的含义就是：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。四纳什均衡寻找纳什均衡0，44，05，34，00，45，33，53，56，6C2R1R2C1C3R3参与人B参与人A〔R3，C3〕是纳什均衡四纳什均衡2，121，101，120，120，100，110，120，100，13C2R1R2C1C3R3剔除顺序：R3、C3、C2、R2，战略组合〔R1，C1〕可以看到，〔R1，C3〕〔R1，C1〕都是纳什均衡。剔除顺序：C2、R2、C1、R3，战略组合〔R1，C3〕请用上述划线法寻找以下纳什均衡四纳什均衡纳什均衡与占优战略均衡及重复剔除的占优均衡：〔1〕每一个占优战略均衡及重复剔除的占优均衡一定是纳什均衡，但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡；〔2〕纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合，但没有被剔除掉的组合不一定是纳什均衡，除非它是唯一的〔不适用于严格弱劣战略的情况〕案例-市场进入阻挠40，50-10，00，3000，300斗争在位者进入者进入不进入默许纳什均衡：进入，默许；不进入，斗争四纳什均衡用重复剔除弱劣战略的方法找均衡第二章完全信息静态信息博弈-纳什均衡一博弈的根本概念及战略表述二占优战略均衡三重复剔除的占优均衡四纳什均衡五纳什均衡应用举例五纳什均衡应用举例诺贝尔经济学奖获得者萨缪尔森有一句话：你可以将一只鹦鹉训练成一个经济学家，因为它只需要学习两个词：供给和需求。博弈论专家坎多瑞引申说：要成为现代经济学家，这只鹦鹉必须再多学一个词，就是“纳什均衡〞。五纳什均衡应用举例案例1库诺特〔Cournot〕寡头竞争模型案例2公共地的悲剧案例3豪泰林价格竞争模型案例4公共物品的私人供给案例1库诺特〔Cournot〕寡头竞争模型企业1企业2参与人：企业1、企业2战略：选择产量支付：利润，利润是两个企业产量的函数案例1库诺特〔Cournot〕寡头竞争模型qi：第i个企业的产量Ci〔qi〕代表本钱函数P=P〔q1+q2〕：价格是两个企业产量的函数第i个企业的利润函数为：企业1企业2案例1库诺特〔Cournot〕寡头竞争模型〔q1*，q2*〕是纳什均衡意味着：

找出纳什均衡的方法是对每个企业的利润函数求一阶导数，使其为0。案例1库诺特〔Cournot〕寡头竞争模型q2q1每个企业的最优产量是另一个企业的产量的函数。交叉点即纳什均衡点案例1库诺特〔Cournot〕寡头竞争模型假定每个企业有不变的单位本钱：假定需求函数为：最优化的一阶条件是：解反响函数得纳什均衡为：纳什均衡利润为：案例1库诺特〔Cournot〕寡头竞争模型为什么说库诺特〔Cournot〕寡头竞争模型是典型的囚徒困境问题？垄断企业的问题：垄断企业的最优产量：垄断利润为：寡头竞争的总产量大于垄断产量的原因是：每个企业在选择自己的最优产量时，只考虑对本企业利润的影响，而无视了对另外一个企业的外部负效应。案例1库诺特〔Cournot〕寡头竞争模型在独立决策、缺乏协调机制的两企业之间，合作不容易出现，各自生产垄断产量一半的产量组合不是纳什均衡战略组合。只有到达纳什均衡的产量组合时，没有任何一方有单独改变自己产量的动力。此类博弈对于市场经济的组织、管理，对于产业组织和社会经济制度的效率判断，都具有非常重要的意义。对于市场的管理，政府对市场的监管和调控都是必需的。从囚徒困境中解放出来1971年，美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是，财大气粗的各大烟草公司反响相当平静，并没有动用其庞大的社会资源和影响力阻止这个法律的通过。政府管制最终的结果是，尽管烟草广告因受到限制而减少，可是烟草公司的利润却提高了。实际上，政府禁令不仅没有打击烟草公司，反而是把陷入白热化广告战的各大烟草集团从“囚徒困境〞中解放了出来。

在20世纪60年代，美国烟草行业竞争剧烈，为了争夺市场，各大烟草公司都必须消耗巨额费用大做广告，这无疑降低了它们的利润水平。也就是说，如果烟草公司都不做广告，它们的利润要更高。可是，如果其中一家公司不做广告，它的市场份额就会被其他公司抢走。这正是一个囚徒困境：某公司放弃做，而其它公司仍然大作广告抢占市场，放弃做广告的公司必然利益受损。在这种情况下，做广告就是每一个广告公司的优势策略。即使烟草公司能够达成都不做广告的协议，但是这个协议的约束力太低并不能将烟草行业从广告战的泥潭中解救出来。这个时候国家出台法令对于烟草行业来说反而是个好事，烟草公司靠自己做不到的事情，政府做到了。因为国家法律具有强制性的作用，相当于是烟草集团之间签订了极具约束力的协议，同时政府承担了监督烟草公司是否违反协议的本钱。

案例2公共地的悲剧公共地的悲剧证明：如果一种资源没有排他性的所有权，就会导致资源的过度使用。公海捕鱼小煤窑的过度开展……最初由英国留学生哈定〔GarritHadin〕1968年在《科学》杂志上发表的文章《TragedyofCommons》(公共策略)中提出案例2公共地的悲剧有n个农民的村庄共同拥有一片草地，每个农民都有在草地上放牧的自由。每年春天，农民要决定自己养多少只羊。gi：第i个农民饲养的数量，i=1,2,…,n.

n个农民饲养的总量V:代表每只羊的平均价值,v是G的函数,v=v(G),因为每只羊至少要一定数量的草才不至于饿死,有一个最大的可存活量Gmax,：

当G<Gmax时,v(G)>0;当G>=Gmax时,v(G)=0。案例2公共地的悲剧当草地上羊很少时，增加一只羊也许不会对其他羊的价值有太大影响，但随着羊的不断增加，每只羊的价值将急剧下降。GGmaxv参与人：农民战略：养羊的数量支付：利润案例2公共地的悲剧假设一只羊羔的价格为c，对于农民i来讲，其利润函数为：最优化的一阶条件为：上述一阶条件可以解释为：增加一只羊有正负两方面的效应，正的效应是这只羊本身的价值v，负的效应是这只羊使所有之前的羊的价值降低。案例2公共地的悲剧其最优解满足边际收益等于边际本钱：上述n个一阶条件定义了n个反响函数：因为：所以：案例2公共地的悲剧第i个农民的最优饲养量随其他农民的饲养量增加而递减。n个反响函数的交叉点就是纳什均衡。尽管每个农民在决定自己增加饲养量时考虑了对现有羊价值的影响，但是他考虑的只是对自己羊的影响，而并不是对所有羊的影响，因此，最优点上的个人边际本钱小于社会边际本钱，纳什均衡总饲养量大于社会最优饲养量。案例2公共地的悲剧案例2公共地的悲剧再次说明非合作博弈的结果有可能是低效率的。原因是每个利用公共资源的人都面临着一种囚徒的困境：在总体上加大利用资源可能时，自己加大利用而他人不加大利用那么自己有利，自己加大利用而他人也加大利用自己不至于吃亏，最终是所有人都加大利用资源直至再加大会减少利益的纳什均衡水平。公共地悲剧哈定指出：“在共享公有物的社会中，每个人，也就是所有人都追求各自的最大利益。这就是悲剧的所在。每个人都被锁定在一个迫使他在有限范围内无节制地增加牲畜的制度中。消灭是所有人都奔向的目的地。因为在信奉公有物自由的社会当中，每个人均追求自己的最大利益。公有物自由给所有人带来了消灭。〞公共地悲剧比方市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡〞状态。公共地悲剧要解决公共地悲剧，就必须要明晰公共地产权、牧民之间有效沟通形成共同愿景、采取违规行为之后的及时惩罚、牧民自身道德素质的提高、改善牛或者草的品种甚至是牧民也可以换个职业等都是可行的方法。这些解决方法对我国建设节约型社会也有很大的启发，比方增加资源环境危机的宣传和教育以形成群众心理暗示，对公共自由物中的不可再生资源采用国家管理的形式，严格控制使用；对可再生资源采取委托管理的形式，培育社会力量加以保护，国家起到监督和引导作用等。案例3豪泰林价格竞争模型在库诺特模型中，产品是同质的〔homogenous〕而在豪泰林价格竞争模型中，我们探讨的是产品存在差异性的情况。如果不同企业生产的产品是有差异的，替代弹性就不会是无限的，此时消费者对不同企业的产品有着不同的偏好，价格不是他们感兴趣的唯一变量。在存在产品差异情况下，均衡价格不会等于边际本钱。产品的差异有多种。我们现在考虑一种特殊的差异，即空间上的差异〔specialdifferentiation〕，这就是经典的豪泰林〔Hotelling,1929〕模型。在豪太林模型中，产品在物质性能上是相同的，但在空间位置上有差异。因为不同位置上的消费者要支付不同的运输本钱，他们关心的价格与运输本钱之和，而不是单价格。案例3豪泰林价格竞争模型假定有一个长度为一的线性城市，消费者均匀地分布在【0，1】区间里，分布密度为1。假定有两个商店，分别位于城市的两端，商店1在x=0，商店2在x=1，出售物质性能相同的产品。每个商店提供单位产品的本钱为c，消费者购置商品的旅行本钱与离商店的距离成比例，单位距离的本钱为t。这样住在x的消费者如果在商店1采购，要花费tx的旅行本钱；如果在商

人人文库> 全部分类> 行业资料 > 管理策划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

纳什均衡及应用举例博弈论

文档简介

温馨提示

最新文档

评论

纳什均衡及应用举例博弈论

文档简介

温馨提示

最新文档

评论

相关文档