




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
--------“囚徒困境”两个犯罪嫌疑人被捕并受到指控,但除非至少一个人招人犯罪,警方并无充足证据将其按罪判刑.警方把他们关入不同的牢室,并对他们说明不同行动带来的后果.如果两个人都不坦白,将均被判为轻度犯罪,入狱一个月;如果两人都坦白招认,都将被判入狱6个月;最后,如果一人招认而另一人拒不坦白,招认的一方将马上获释,而另一人将判入狱9个月.博弈论经典例子第1章完全信息静态博弈(StaticGamesofCompleteInformation)第1章完全信息静态博弈一个博弈由三部分构成:参与者
,参与者的战略(空间),参与者的收益构成.动)构成的集合.参与者的收益是参与者在博弈中的参与者的战略空间是参与者可选择的战略(行得益.参与者的“共同知识”.完全信息是指:所有参与者的收益函数是每个静态博弈是指所有参与者同时选择行动或战略.同时:(彼此没有信息交流).假设每个参与者选择且仅选择一次战略(行动).参与者是理性的.参与者是理性的是指参与者总是追求收益最大(参与者唯一的目标).1.1·A
博弈的标准式表述
经典例子;“囚徒困境”(prisoner,sdilemma)
囚徒1-6-60-9-90
-1-1
沉默招认
囚徒2沉默招认在此博弈中,每个囚徒有两个可供选择的战略:
坦白,沉默.在一组特定的战略被选定后,两人的收益由上表中的数字给出,习惯上横行代表的参与者1的收益
在两个数字中放在前面,列代表的参与者2的收益放在后面.一般情况下,博弈的标准式包括:(1)博弈的参与者,(2)每一参与者的战略集,(3)针对所有参与者可能选择的战略组合,每一个参与者获得的收益.一般来讲,我们只考虑n个参与者的博弈,其中参与者从1到n排序,设其中任一参与者的序号为i,令Si
代表参与者i
可以选择的战略集合(称为i的战略空间),其中任意一个特定的战略用si表示
表示战略si是战略集Si中的要素)
(有时写成令后形成的战略组合.间,表示为定义在一个n
人博弈的标准表达式中,参与者的战略空间为我们用
表示此博弈.表示每个参与者选定一个战略所有战略组合构成战略组合空表示第i个参与者选择战略si
时,i的收益函数,即收益函数为注意:
参与者同时选择战略(行动)并不意味着各方行动必须是同时的,只要每一个参与者在选择行动时没有信息交流即可.参与者永远是理性的!博弈模型已经构建,我们的任务是如何预知博弈的结果(?),
换言之,如何寻找博弈的解.1·1·B重复剔除严格劣战略
定义在标准式的博弈中,令和代表参与者的两个可行战略,如果对其他参与者每一个可能的战略组合,参与者i
或者相对与是严选择的收益都小于其选择的收益,则称战略相对于是严格劣战略,格占优战略,即:(DS)每一组可能的战略组合都成立.对其他参与者在其战略空间中的理由:理性的参与者不可能选择严格劣战略,“囚徒困境”(prisoner,sdilemma)
囚徒1-6-60-9-90
-1-1
沉默招认
囚徒2沉默招认用重复剔除严格劣战略方法解决“囚徒困境”
不难验证,在囚徒困境中,对每一个参与者,沉默和招认相比是严格劣战略.因此每一个囚徒都会选择招认.故“囚徒困境”博弈的重复剔除严格劣战略解是(招认,招认).下面再看一个二人博弈的例子:参与人12,00,10,30,11,21,0左中右上下参与人2图1.1.1参与人1有两个可选战略,参与人2有三个可选战略S1={上,下},S2={左,中,右},如果2选择左,上优于下(1大于0),但如果2选择右,下就会优于上(因为2>0).但对参与人2来讲,右严格劣于中(2>1且1>0),因此理性的参与者2不会选择右的.那么如果参与人1知道参与人2是理性的,他就可以把右从参与人2的战略空间中剔除掉,即如果参与人1知道参与人2是理性的,他就可以把图1.1.1所示博弈视同为图1·1·2所示的博弈:1,01,20,30,1
参与人2
左中参与人1上下图1·1·2在图1·1·2中,对于参与人1来讲,下就成了上的严格劣战略,于是如果参与人1是理性的,(并且参与人1知道参与人2是理性的,这样才能把原博弈化为图1.1.2所示的博弈),参与人1就可以把下从参与人1的战略空间中剔除,余下图1·1·3所示博弈.但这时对参与人2,左又成为中的严格劣战略,参与人2可以剔除左,得博弈的解为(上,中).1,01,2
参与人2左中参与人1
上图1·1·3上面的过程可称为“重复剔除严格劣战略”.战略的原则之上,但它仍有两个缺陷:注意此过程建立在理性参与者不会选择严格劣第一每一步剔除都需要参与者间相互了解的意多步就需要假定“参与者是理性”是共同知识.的还要假定所有参与人都知道所有参与人是理性更进一步假设,如果我们要把这一过程应用到任这意味着,我们不仅需要假定所有参与人是理性的如此等等,以至无穷.第二对博弈预测的结果经常是不精确的.或者此方法根本不能使用.例如:6,63,53,55,30,44,05,34,00,4左中右上中下此博弈就不能用以上方法求解.由此引出纳什均衡的概念.纳什均衡概念是博弈理论的基石!它为博弈理论提供了分析框架.它的思想是:设想在博弈论预测的博弈结果中,给每个参与者选定各自的战略,为使该预测是正确的,必须使参与者自愿选择理论给它推导出的战略.这样每一个参与者要选择的战略必须是针对其他参与者选择战略的最优反应,这种理论推测的结果可以叫做“战略稳定”或“自动实施”的,因为没有参与者愿意独自离弃他所选定的战略,这一状态称做纳什均衡(NashEquilibrium).定义:在n个参与者的标准式博弈中,如果战略组合满足对每一个参与者i
,
是(至少不劣于)他针对其他(n-1)个参与者所选战略的最优反应战略,则称战略组合是该博弈的一个纳什均衡(纯战略).即:对所有中的都成立,(NE)亦即是以下最优化问题
的解:关于纳什均衡解求解方法的说明:纳什均衡(纯战略)的定义提供好了求解纳什均衡的思路:1.假如最优化问题对每一个参与者i都有最大值点
则为其他参与者选定战略的函数,即这样就会得到n个等式或方程,2.解以上n个方程联立的方程组,3.如果以上方程组有解,即得纳什均衡解.反之,不是针对其他参与人战略选不是博弈Si中存在另外一个战略
使得如果战略组合G的纳什均衡,就意味着至少存在一个参与人
i,参与人
i的战略选择的最优反应战略,即在择如果博弈论提供的战略组合解不是纳什均衡的解,离理论的预测,则至少有一个参与者有动因偏使得博弈进行和理论预测不一致.和纳什均衡推导密切相关的是协议的理念:如果参与者之间要商定一个协议决定博弈如何进行,那么一个有效的协议中的战略组合必须是纳
议.什均衡的略组合,否则至少有一个参与者不遵守协看下面几个例子:例一“囚徒困境”
-1,-1
-9,0
0,-9
-6,-6囚徒2
沉默招认囚徒1沉默招认对于囚徒1来讲,如果囚徒2选择战略“沉默”,那么,囚徒1选择“沉默”的收益为-1,选择“招认”
的收益为0,当然选择“招认”.同理可得囚徒2的战略选择也是“招认”.因此,此博弈的纳什均衡解为
(招认,招认).此时双方的收益为(-6,-6),很明显(-1,-1)
的收益好于(-6,-6).但纳什均衡
的结果是达不到的,此所谓的“囚徒困境”.这也正是博弈论的有趣之处,均衡的结果告诉我们一个很重要的结论:“囚徒困境”纳什
个体理性和集体理性的矛盾,每个个体都追求个体收益最优,其结果可能是都达不到最优,相反,集体利益可能也受到损害.注:亚当.斯密:每个个体追求最优,结果集体最优.
影响.纳什认为亚当.斯密忽略了个体选择时的相互
6
,63,53,55,30,44
,05,34
,00,4左中右上中下例2对于参与者1,如果参与者2选择左,则参与者1选择中(4>3>0),此时参与者1的收益为4,在4下面划一横线,同理可以求出参与者2选择中、右时,1的选择和收益.对于参与者2可用同样的方法求解.格子内数字都划线的对应的双方的战略组合(下,中)即为博弈的纳什均衡解.1,2
0
,
0
0,02
,1
帕特歌剧拳击克里斯歌剧拳击例3—性别战博弈易知此博弈有两个纳什均衡,(歌剧,歌剧);(拳击,拳击)结果到底是那一个呢?不得而知.此
为纳什均衡解的多重性,是纳什均衡的缺陷之一,也是博弈论的一大难题.此博弈无纳什均衡(纯战略).例4—猜硬币博弈-1,1
1
,-11
,-1
-1,1参与人2正面反面参与人1正面反面例5博弈双方1和2就如何分100元钱进行讨价还价.假设确定了以下规则:双方同时提出自己的要求的数额和如果,则博弈双方的要求都能得到满足,即分别得到和但如果则该笔钱就被没收.求该博弈的纳什为什么?均衡,若你是其中一个博弈方,你会选择什么数额,解根据题意,参与者1,2要求的份额分别为因此,参与者1,2的战略空间都为参与者1的收益函数为因此,参与者1的最优反应函数是由对称性2的最优反应函数为双方的反应函
方程有无数解,所以该博数完全相同,弈有无数个纯战略纳什均衡
其中解.为方程另外,当参与者1均衡解是时,参与者2的一个均衡解为1,但是,依照题意,当时,依照纳什均衡解的定义,此时参与者也是纳什均衡解.参与者2的收益所以,当参与者1均衡时,2战略于是,以及解是该博弈的所有的所有解如果我是其中的一个参与者,我会选择得到50.因为在该博弈的无穷个纳什均衡中,(50,50)是比较
称为“聚点”均衡.公平容易被双方接受的.纳什均衡解为满足方程例6
考虑一个有
N个人参加的游戏:每个人可以放最多100元钱到一部可以生钱的机器里,机器把所有人放进去的钱的总和增加到原来的3倍,然后再平均分给这N
个人.求此博弈的纳什均衡.解:容易得出当N=1,2时,此博弈有唯一的纳什均衡.双方都放进100元钱,即(100,100)为纳什均衡.当N=3时的情况如何?参与者i的收益函数为其中m,n,p分别为三个参与者放进机器里的钱数,m为参与者i放进机器里的钱数,n,p分别为其他两个参与者放进机器里的钱数,由可以看出,i的最优选择是:中的任意一个数.同理可分析另外两个参与者的选择.当N=4时情况如何?
因此博弈有无数个纳什均衡.参与者的收益函数为:其中m,n,p,Q分别为四个参与者放进机器里的钱数,m为参与者i放进机器里的钱数,n,p,Q分别其他三个参与者放进机器里的钱数.由于所以参与者i的最优选择是:所以任何一个参与者都不放钱到机器里.此时博弈m=0.有唯一的纳什均衡:例7
“智猪博弈”猪圈里有两头猪.一头大猪,一头小猪,猪圈一头有一个猪食槽,另一头安装一个按钮控制着猪食的供应.按一下按钮会有10个单位的猪食进槽,但谁按按钮谁需要付出2个单位的的成本.若大猪先到,大猪吃到9个单位,小猪只能吃到1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位.求此博弈的纳什均衡.解5,14,49,-10,0小猪按等待大猪按等待此博弈的收益矩阵:容易求出此博弈的纳什均衡为:(按,等待).此纳什均衡显然是不合理的.例如:股份公司中,股东承担着监督经理的职能,但股东中有大股东和小股东之分,他们从现实中类似的现象.监督中得到的收益并不一样,因监督经理是要有成本的.在监督成本相同的情况下,大股东从监督中得到的收益显然小于小股东.大股东类似于“大猪”,小股东类似于“小猪”.纳什均衡是,大股东担当起监督经理的责任,小股东则搭大股东的便车.股票市场上炒股票的大户和小户的关系,市场上大企业和小企业的关系也是如此.命题1
在n个参与者的标准式博弈中,如果重复剔除严格劣战略剔除掉除外的所有战略,那么这一战略组合为该博弈的唯一纳什均衡.两个重要的命题:命题2
在n个参与者的标准式博弈中,如果战略组合那么它一定不会被重复剔除严格劣战略所剔除.是一个纳什均衡,证明:首证命题2假设战略组合(反证法).是标准式博弈的一个纳什均衡,且假设被剔除掉了,该战略组合中一定有由重复剔除严格劣战略过程,一个战略首先被剔除,不妨假设第i个战略首先被剔除,则在第i个参与者的战略空间中一定存在另一个尚未被剔除的战略严格优于.代如(DS)公式,得到(1·1·1)对每一个其他参与者尚未被剔除的战略空间中可能形成的战略组合都成立.是纳什均衡战略由于中第一个被剔除的战略,以上纳什均衡战略组合中其它参与人的战略尚未被剔除,于是上面不等式的特例,下式成立.但是(1·1·2)和公式(NE)显然是矛盾的.(1·1·2)根据(NE),
必须是针对的最优反应,这一矛盾证明了原命题成立.那么就不可能存在一个战略严格优于下证命题1,在证命题2的过程中,实际上已证明了1的一部分.所需证明的只是如果重复剔除严格劣战略剔除了除之外的所有战略,该战略组合是纳什均衡.由命题2任何其它纳什均衡必定同样未被剔除,这已证明了在该博弈中均衡的唯一性.下面只需证明余下的战略组合是纳什均衡即可.为简单假设博弈G是有限博弈.用反证法假设通过重复剔除严格劣战略剔除掉除外的所有战略,该战略不是纳什均衡,那么一定有某一参与者i,在他的战略集中存在使公式(NE)不成立,但同时又必须是在剔除过程中某一阶段的严格劣战略.上述两点的正规表述为:中存在使得(1·1·3)并且在参与者i的战略集中存在,在剔除过程中的某一阶段有(1·1·4)对所有其他参与者在该阶段剩余战略可能的战略组合由于其他参与都成立.始终未被剔除,于是下式作为(1·1·4)的一个特例成立:(1.1.5)如果(即是的严格占优战略),则(1·1·5)和(1·1·3)相互矛盾,此时证明结束.如果由于在最终被剔除掉了,则者的战略一定有其他战略在其后严格优于
.等式(1·1·4)和(1·1·5)中,分别用这样在不和后不等式仍然成立.换下和明结束,再一次,如果则证否则还可构建两个相似的不等式.是Si中唯一未被剔除的战略,由于重复这一论证过程(在一个有限的博弈中)最终一定能完成证明.奥古斯汀•古诺(Augustin
Cournot)是19世纪著名的法国经济学.法国经济学强调以数理方法对经济事实进行抽象,这与传统的英国学派重视经验事实,主张从事实中进行归纳的经验论风格迥然不同的.古诺可以说是法果经济学派的开山鼻祖.他在1838年发表的《对财富理论的数学原理的研究》(ResearchesintotheMatheMaticalPrinciplesoftheTheoryofwealth),给出了两个企业的博弈均衡的经典式证明,直到今天仍具生命力.(平新桥《微观经济学18讲》167页)古诺均衡1·2
应用举例古诺(1838)提出了纳什所定义的均衡(但只是在特定的双头垄断模型中),但是他并没有从理论上系统的定义均衡的意义.古诺的研究被为是最早的博弈论的经典文献之一.此模型告诉我们;(1)如何对一个问题的非正式描述转化为一个博弈的标准式表述;(2)如何通过计算解出博弈的纳什均衡;(3)重复剔除严格劣战略的步骤.古诺的双头垄断模型.令和分别表示企业1,2生产的同质的产品的产量,市场中该产品的总供给为令表示市场的出清时的价格.更为精确一点的表述为当时,当时,为,
产每单位品的边际成本为常数c,这里假设设企业i生产qi
的总成本即企业不存在固定成本,且生产根据古诺的假定,两个企业同时进行产量决策.下面将此问题化为标准式博弈:三个要素
(1)参与人(企业1和企业2);(2)参与人可以选择的战略(3)针对每一个可能出现的参与人的战略组合,每一个参与人的收益.企业的收益是自己所选战略与其它企业所选战略的函数,假定企业的收益就是其利润为一对战略如是纳什均衡,则对每个参与者,应满足:(NE)上式对中每一个可选战略都成立,这一条件等价于:对每个参与者,
必须是下面最优化问题的解最优化问题的一阶条件是对收益函数关于求导,并令其等于零,其解为(1·2·1)那么,如果产量组合要成为纳什均衡,企业产量选择必须满足:解这一对方程组得均衡解小于
,满足上面的假设.且两个企业的利润为另外,每家企业当然都希望成为市场的垄断者.于
是双方有可能结成联盟!事实上,该博弈的纳什均衡未必立刻形成!那么,双方的联盟(双头垄断)能否结成呢?设想两者达成共同利润最大化和平分市场的协议.容易求出利润最大化时的产量为:设Q为两者的产量和.总利润为此时两个企业的最优产量都为:此时两个企业的利润都为:已经求出古诺模型时利润为显然,垄断状态时的产量低于古诺模型时的产量,而利润高于古诺模型时的利润.但这种安排存在一个问题,有动机偏离它,就是每家企业都因为垄断产量较低,相应的产品的市场出清价格就比较高.在这一价格下,的增加会降低市场出清价格.每家企业都会倾向于提高产量,而不顾这种产量也就是说,这种结盟不能形成!前提是:双方都按照垄断产量生产产品.因为双方联盟(双头垄断)能结成的双方是否都会按照垄断产量生产产品呢?或者说双方是否都会遵守协议呢?下面分析两者是否会遵守协议决策,两者有两种战略选择:遵守协议和不遵守协议.此时,双方又要进行博弈.若企业1遵守协议,选择产量2不遵守协议.而企业根据利润最大化的一阶条件:企业2的产量选择为则企业1和企业2的利润分别为和;同理可得企业2遵守协议而企业1不遵守协议时的利润于是可建立下列博弈模型:博弈模型:遵守不遵守遵守不遵守容易求出此博弈的纳什均衡为:(不遵守,不遵守).协议无效.下面介绍推广的古诺模型.将古诺模型推广到n个企业的情形.存在n个企业条件下的古诺均衡.如果一个行业中存在n个相同的企业,并且第(n+1)个企业会被行业有效地排斥在外,每一个现存企业的成本函数相同,即成本为(1)设市场需求(函数)为(2)当然(否则会有问题,后面可以看到)由(1)与(2)两式易知企业j的利润为所谓古诺均衡,便是存在一个产量使得每个企业的利润都达到最优.(3)必须使(3)式最即当所有别的企业的产量时,于是有(4)即(5)大化.于是令将这n个式子相加得行业的总产量为注意到(5)式在均衡时每个企业的产量相等,于是在均衡时每个企业的产量为价格为每个企业的利润为注意:古诺均衡时价格和边际成本的差为:每个企业的利润为零.也就是说,当企业个数很大时,所以说明当企业个数无穷多时,即价格会接近边际
成本,也即,当企业个数无穷多时,市场结构会趋于完全竞争.1·2B
贝特兰德的双头垄断模型贝特兰德(1883)提出企业在竞争时选择的是产品价格,而古诺模型中选择产量.贝特兰德的双头垄断模型和古诺的双头垄断是两个不同的模型.体现在:参与者的战略空间不同,收益函数不同,并且两个模型中企业的行为不同.考虑两种同类但不同质的产品(古诺模型中两个企业的产品完全相同).如果企业1和企业2分别选择价格p1和p2,消费者对企业i的产品的需求为其中即只限于求函数在现实中并不存在,因为只要企业j的产品企业i的产品为企业j产品的替代品的情况(这个需品的需求都是正的).下面将会看到只有在价格足够高,无论企业i要多高的价格,对其产时问题才有意义).假定企业生产没有固定成本,
行动(选择各自的价格).并且边际成本为常数c,两个企业是同时每个企业的战略空间其中企业i的一个典型战略si是所选择的价格pi.每个企业的收益函数等于其利润额,当企业
i选择价格pi
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 代驾司机岗位面试问题及答案
- 2025届湖北省示范初中高一下化学期末检测模拟试题含解析
- 太原市重点中学2025年高一化学第二学期期末综合测试模拟试题含解析
- 河北省衡水滁州分校2025届化学高一下期末考试试题含解析
- 河南文物钻探管理办法
- 机构合作管理暂行办法
- 北京药品直供管理办法
- 智慧治理视角下基层指挥中心数字化管理效能提升研究
- 关键绩效指标体系构建与应用研究
- 民族院校师生管理办法
- 陕西省专业技术人员继续教育2025公需课《党的二十届三中全会精神解读与高质量发展》20学时题库及答案
- 2024-2025学年人教版数学五年级下学期期末试卷(含答案)
- 教师专业发展与职业生涯规划
- 会计师事务所员工绩效考评新版制度
- 气钉枪安全培训教材PPT学习教案
- 小学数学图形与几何知识点归纳汇总
- APQP培训教材PPT课件
- JC∕T 1083-2008 水泥与减水剂相容性试验方法
- 食品工程原理(李云飞)第二章ppt 传热
- 二氧化碳气体保护焊.ppt
- 仪表工程质量控制点等级划分表
评论
0/150
提交评论