版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.界定博弈论的一些基本概念;2.界定优势策略和纳什均衡3.理解囚犯困境的含义及其应用;4.推导重复性博弈的纳什均衡;5.推导序列博弈的纳什均衡;本章要点2学完本章,你将能够
11博弈论基础©2011WangQiushi2/100
6.理解为什么存在着先动优势;7.理解进入威慑的可信性问题8.推导混合策略的纳什均衡本章要点3学完本章,你将能够
11博弈论基础©2011WangQiushi3/100博弈就是一种比赛©2011WangQiushi比赛可以比快,也可以比慢4/100博弈论的基本概念博弈论(gametheory):又称对策论,是用于分析策略性行为的一种工具。博弈的分析步骤第一步是寻找到某种有用的方式来描述这场博弈;第二步是寻找某种方式来预测结果。博弈的要素(1)选手;(2)规则;(3)策略;(4)收益;(5)结果。©2011WangQiushi5/100“剪子、石头、布”的博弈该游戏有两个选手(players),即参与此博弈的行为者;每个选手有三种策略(strategies)可供选择:1出剪子;2出石头;3出布。通俗点说,策略就是出招儿。该游戏有个规则:如果两人出了相同的策略(如石头对石头等三种可能性),双方为打平;如果两人出手不一(如石头对剪子等六种可能性),则可决定出胜负,石头赢剪子、剪子赢布、布赢石头(即石头砸剪子、剪子剪布、布包石头)。©2011WangQiushi6/100“剪子、石头、布”的博弈在游戏之前,双方达成奖惩协议:如赢家赚1元,输家输1元;或者赢家不喝酒,而输家罚酒一杯等等。假如是输赢1元的协议,表(11.1)就是这个游戏的收益表(Payofftable),把选手的收益状况用表的形式描述,有时亦称收益矩阵(Payoffmatrix)。©2011WangQiushi7/100收益表如果A出石头,B也出石头,各自收益均为0;©2011WangQiushi8/100收益表如果A出石头,B出剪子,A的收益为1,B的收益为(-1);©2011WangQiushi9/100收益表如果A出石头,B出布,A的收益为(-1),而B的收益为1。©2011WangQiushi余此类推10/100博弈论的基本概念一般来说,在每个小方框内,第一个数据为排在左边的选手A的收益,第二个数据为排在上方的选手B的收益,中间用逗号隔开,即(A,B)=(0,0)等等。上表是一种常见的用表格描述一场博弈的方法,简称常规式博弈(normalform)。同时博弈:要求选手同时出招的博弈。序列博弈:选手可以分先后时间出招的博弈。©2011WangQiushi11/100优势策略假定A、B两人在玩一个十分简单的博弈,A在纸上可以写“上”或“下”,B在另外一张纸上可以写“左”或“右”,其收益矩阵如下表所示。©2011WangQiushi每个选手都是自我利益极大化者。12/100优势策略如果B选左,A选上的收益为1,而选下的收益为2,那么,A选下;©2011WangQiushi如果B选右,A在收益0与1之间选择,A选择下。13/100优势策略优势策略:无论对方选择什么策略,该选手总是选择某种固定的策略,又称占优策略。在本例中,无论B出什么招,A总是选下。因此,选下是A的优势策略。所谓优势策略,就是无论你出什么招,我就出这一招。选手B也有优势策略吗?©2011WangQiushi14/100优势策略给定A选上,B选左的收益为1,而选右的收益为2,那么,B选左;©2011WangQiushi如果A选下,B在收益0与1之间选择,
B选左。15/100优势策略无论选手A如何选择,B将始终选择左。B选择左是优势策略。在某个博弈中,如果每个选手都有一种优势策略,那么,两个选手的优势策略组合就是这一博弈的均衡。所谓博弈的均衡就是会发生的一种结局。©2011WangQiushi16/100优势策略在上例中,(A,B)=(下,左)=(2,1)就是该博弈优势策略的均衡结果。©2011WangQiushi17/100优势策略大学成功秘诀:不管你如何,我始终把努力学习作为我的优势策略。©2011WangQiushi18/100纳什均衡并非所有的博弈都存在优势策略均衡。©2011WangQiushi在以下改进的博弈中,如果B选左,A就选上;如果B选右,A就选下;因此,A没有优势策略。?19/100纳什均衡同理可以分析,B也没有优势策略。©2011WangQiushi?那么该博弈是否存在着均衡呢?20/100纳什均衡优势策略均衡的要求也许太高了点。它要求无论B出什么招,A有一个优势策略;而且还要求无论A出什么招,B也有一个优势策略。这两个优势策略的组合才构成一个优势策略均衡。如果给定B的选择,A的选择是最佳的;同时给定A的选择,B的选择也是最佳的,那么,A和B的这组最佳选择的组合就是纳什均衡。©2011WangQiushi21/100约翰纳什这是以1994年诺贝尔经济学奖得主、美国经济学家约翰·纳什的名字命名的。瑞典皇家科学院的公报称:“纳什由于引入了合作博弈与非合作博弈的区分,并为非合作博弈创立了一种均衡概念。这种均衡概念现在被命名为‘纳什均衡’”©2011WangQiushi22/100约翰·纳什纳什均衡如果B选左,A的最佳选择为上;©2011WangQiushi如果B选右,A的最佳选择为下;如果A选上,B的最佳选择为左;如果A选下,B的最佳选择为右。两箭头所指就是纳什均衡。23/100纳什均衡给定B选左,A的最佳选择为上;给定A选择上,B的最佳选择为左
;所以,(上,左)为纳什均衡。©2011WangQiushi同理,(下,右)为另一组纳什均衡。24/100优势均衡与纳什均衡的联系与区别优势策略:无论你做什么,我做我最好的;无论我做什么,你做你最好的。纳什均衡:给定你的策略,我做我最好的;给定我的策略,你做你最好的。由此可见,优势策略均衡便是纳什均衡的一种特例。通俗地讲,如果是优势策略均衡,就一定是纳什均衡;反之,则不然。©2011WangQiushi25/100囚犯困境有两个嫌疑犯A和B因合伙偷窃自行车被警方捉拿归案,且证据确凿,可判他们每人各2年的徒刑。如果他俩都承认犯有抢劫银行罪,当局就以两罪并罚,各判10年监禁;如果两嫌疑犯都否认犯有抢劫银行罪,当局则以偷自行车罪各判2年刑;如果一方承认犯有抢劫银行罪并提供有效证据,而另一方拒绝承认的话,当局以“坦白从宽,抗拒从严”的原则,对承认犯罪者不再追究偷窃自行车罪而释放,而对否认者三罪并罚(偷自行车、抢劫银行和不诚实罪)投监20年。©2011WangQiushi26/100囚犯困境在这个游戏中,有两个选手:囚犯A和B,每个选手均有两种策略。承认或否认犯有抢劫银行罪,有可能出现四种结果,其收益矩阵如表11.4所示。表中第一列,如果A和B同时承认犯罪各坐牢10年;如果A否认犯罪,而B承认犯罪,A坐牢20年,而B却可自由,表的第二列依此类推。©2011WangQiushi27/100囚犯困境对策论的一个中心问题如果我相信我的对手是理性的,我如何给定他的行为做出我的一个最优决策,即给定对手行为,我如何做出最佳选择。这个对策存在着均衡吗?©2011WangQiushi28/100囚犯困境给定对方承认,你也承认;给定对方否认,你承认。(承认,承认)=(-10,-10)就是是优势策略均衡;于是(承认,承认)也是囚犯困境的纳什均衡。©2011WangQiushi29/100囚犯困境为什么把它称为“囚犯困境”
呢?(承认,承认)=(-10,-10)是纳什均衡。如果他们都否认犯罪,每人只需坐牢2年,而不是10年。(否认,否认)是一种帕累托效率,而(承认,承认)一种帕累托非效率。囚犯困境的“困惑”就在于为什么纳什均衡并非是帕累托最优,而帕累托效率又不是纳什均衡的结果呢?©2011WangQiushi30/100囚犯困境及其应用囚犯困境隐含着,合谋也许是一个更为有效的结果。囚犯困境是在向看不见手的挑战。亚当.斯密的看不见的手理论认为,市场经济中的每个人都在追求自我利益,但在追求自我利益的过程中同时也实现了社会的公共利益。囚犯困境却揭示社会中的每个人都在追求自我利益,然而,人类社会的公共利益却不可能实现。©2011WangQiushi31/100囚犯困境一种表现©2011WangQiushi32/100你急我急大家急急成一团(请对下联)广告困境做广告导致需求增加,将激励企业大量做广告。其一,广告之后,原本没使用过本产品的人了解了产品,其中一部分可能购买之;其二,一些在使用其它同类品牌的人可能转换过来消费本产品。现假定有两家寡头面临着两个选择:(大量)做广告和不(大量)做广告。在现实经济中,他们要选择做多少广告的问题。为了简化起见,也不失一般性,就假定只有这两种选择。©2011WangQiushi33/100可口可乐与百事可乐之争©2011WangQiushi34/100可口可乐与百事可乐之争©2011WangQiushi35/100广告困境之一无论A如何,B始终要做广告,做广告是B的优势策略;同理,做广告也是A的优势策略。©2011WangQiushi■因此,(做广告,做广告)=(300,300)便成为此博弈的优势策略均衡,同时也是纳什均衡。36/100广告困境之二企业B的优势策略是做广告,而企业A却没有优势策略。如果B做广告,A最好跟着做广告;但如果B不做广告,A最好的策略也是不做广告。©2011WangQiushi37/100广告困境因此,(做广告,做广告)=(200,300)依然是纳什均衡。©2011WangQiushi■但是,(不做广告,不做广告)=(500,600)却是一种帕累托最优,但对这种非合作性博弈就偏偏实现不了。38/100禁播香烟广告的法案1971年1月1日,美国众议院通过了禁止在电视上播出香烟广告的法案.但法案的制定者当初并不知道它有利于解决香烟广告困境问题。它使得美国烟草制造商们花在香烟上的广告费从此法案实施前一年的3亿美元下降到了实施后一年的6000多万美元,这其中大部分都转化为烟草行业的利润了。©2011WangQiushi39/100研发博弈研发是指企业研究新技术、开发新产品的活动。现假定有两个实力相当的寡头在两大策略中选择研发和不研发,其假定的收益矩阵如表11.7所示。©2011WangQiushi40/100研发博弈寡头A和寡头B都存在着一种优势策略——研发,所以,(研发,研发)成为本博弈中的纳什均衡。其实,双方达到合谋都不研发或者少研发是一种帕累托改进。©2011WangQiushi41/100
产量困境:古诺解
我们在第10章介绍古诺模型时假设,有两家寡头生产同质的矿泉水,每家寡头的边际成本为零,其共同的市场需求曲线为:
p=120-q■企业A和企业B的数量反应函数分别为:©2011WangQiushi■求解古诺解为:42/100
产量困境:古诺解
如果两家组成卡特尔,像一个垄断者那样生产,那么,MR=MC=0,平分市场后有:©2011WangQiushi■如果A生产30,但B违约生产40,这样,p=50,πA=1500,πB
=2000,因此,B有违约的激励。■同理,如果B生产30,但A违约生产40,这样p=50,πA=2000,πB=1500,因此,A有违约的激励。43/100
产量困境:古诺解
把上述情况用利润矩阵描述成下表。©2011WangQiushi44/100
产量困境:古诺解
给定B合作,A违约,给定B违约,A违约;©2011WangQiushi给定A合作,B违约,给定A违约,B违约;45/100
产量困境:古诺解
(违约,违约)=(1600,1600)成为纳什均衡。©2011WangQiushi■合谋性垄断产量(各为30)使得双方利润都更高(1800,1800),但它不是一种纳什均衡。46/100囚犯困境及其应用以上几个例子都有一个共同特征:合作性博弈的解优越于非合作性博弈,但合作又不是纳什均衡。在现实生活中毕竟有一些(短暂)合作成功的案例。《核武器不扩散条件》、《有核国家不首先使用核武器条约》,甚至《两国导弹互不对准条约》。在现实生活中,有些囚犯就是不承认犯罪,原因是这些博弈不是玩一次,而是在重复性地玩。©2011WangQiushi47/100重复性博弈在现实生活中,寡头间关于彼此产量和价格的决策远不止一次,他们根据对手的行为在不断地调整自己的产量和价格。这种不断调整其策略并改变收益的博弈被称为重复性博弈。当囚犯困境的双方只能进行一次性博弈时,很难进行有效的惩罚;而在重复性博弈时,有效的惩罚对方或者威胁对方就成为可能了。重复性博弈——摆脱囚犯困境。©2011WangQiushi48/100重复性博弈20世纪60年代进行的实验性研究寻找到了一种简单的办法——以牙还牙(tit-for-tat)策略——能够有效地让意欲违约者保持克制。以牙还牙策略是指在重复性博弈过程中某一选手对对方在前一期的合作同样也采取合作的态度,对对方不合作则采取报复性的策略。在囚犯困境的重复性博弈中,大家都清楚地知道,合作的巨大收益提供了合作的正面激励,对方的有效威胁和潜在伤害则提供了合作的负面激励。©2011WangQiushi49/100重复性博弈:价格在固定价格的一次性博弈中,哪怕有约在先,双方都保持垄断价格同时分享市场需求,最后的均衡为各自采用竞争性价格获得零经济利润。但在重复性博弈中,情况有所不同。双方知道,如果我降价,对方一定会降价,可能降得还更惨,对方要置我于死地而后快;如果我采取合作态度,对方很可能也会合作。为什么我不首先采取合作态度——把价格定在垄断价格呢?©2011WangQiushi50/100重复性博弈:日常生活在公交车上,我们很少为素不相识的乘客买车票,因为这大凡是一次性博弈。而我们很可能为朋友买车票,我们与朋友的交往是重复性博弈。如果他是个吝啬鬼,你可以选择不与他同车等。在重复性博弈中,每个人都比较关心自己的声誉,正是这种声誉机制使得人们大量采取合作性策略。©2011WangQiushi51/100重复性博弈:军事合作牙还牙策略在军事上也有所表现。《有核国家首先不使用核武器的协议》到目前为止遵守得很好的原因就是这个以牙还牙策略。但是,《两国导弹互不对准协议》遵循得就会差一些,两国关系一旦恶化,很有可能都在暗地里违约。©2011WangQiushi52/100重复性博弈:战地医院以牙还牙策略可以使战地医院享受爱情的浪漫。如果你专门轰炸对方的战地医院,你自己的医院也就处于危险之中。如果你打我的战地医院,我绝对要以牙还牙,报仇雪恨。以上这些对人类行为的观察能够帮助我们更好地认识人类的行为方式。©2011WangQiushi53/100重复性博弈以牙还牙策略能否成功实施取决于博弈的次数。我们将重复性博弈按次数分类为有限次重复性博弈和无限次重复性博弈。有限次重复性博弈就是未来博弈的次数已经确定的博弈,也被称为固定次数的重复性博弈。无限次重复性博弈就是可以无限次数地、重复性地玩的一种博弈。©2011WangQiushi54/100有限次重复性博弈假定我们知道囚犯困境博弈只玩十次,现在就是最后一次,结果会如何呢?最后玩的那次博弈就像只玩一次的博弈。因此,两者的结果应该是相同的。第九轮会如何呢?我们已知在第十轮双方都会承认犯罪,为什么在第九轮就要合作呢?同理,第八轮、第七轮……都会出现只玩一次博弈的纳什均衡。只要这一博弈重复的次数已知,每一轮的结果都是原纳什均衡的结果。©2011WangQiushi55/100无限次重复性博弈以牙还牙策略只有在无限次重复性博弈中才能有效。欧佩克(OPEC)是一个合作比较成功的卡特尔组织,其原因之一就是无限次重复性博弈所隐含的各种惩罚机制。无限次重复性博弈所形成的合作均衡解并不是稳定的,它较为容易被打破。©2011WangQiushi56/100序列博弈到目前为止所讨论的博弈都是两个选手要同时选择策略。例如,在古诺模型中,两家企业同时决定产量。在序列博弈中,选手们按先后顺序进行选择。因此,序列博弈就是选手依次出招的博弈。斯坦伯格模型就是序列博弈的一个例子,一企业是领导者,率先决定其产量,另一企业是跟随者,相应决定其产量。©2011WangQiushi57/100序列博弈经过分析,我们知道该博弈有两个纳什均衡:(上,左)和(下,右)。但是,我们将说明其中的一个均衡不大合理。©2011WangQiushi58/100扩展型博弈图11.1是表11.9中的博弈的扩展型博弈,它有些像树状,故被称为博弈树。因此,用博弈树表示的博弈被称为扩展型,用表格所表示的博弈被称为常规型。©2011WangQiushi59/100扩展型博弈©2011WangQiushi■如何求解扩展型博弈的纳什均衡呢?■假定A已经选择了上,B一定会选择左,收益为(1,9);■但如果A选择下,B只好选择右,收益为(2,1)。60/100扩展型博弈©2011WangQiushiA是先动者,在信息完备时,当他看到博弈树端点的收益情况后,他一定会选择下。这样(上,左)就不再是一个合理的均衡了。从扩展型博弈看,(下,右)是唯一的纳什均衡。61/100“先动优势”A好开心,他享受到了“先动优势”。一步为先,步步为先。再看看选手B,他有些可怜,他本可享受9,最后只好收益为1。他要看人家的脸色行事。©2011WangQiushi62/100“先动优势”当然,他可以向A发出威胁:如果A选下,他报复性地选左,两人都同归于尽,各自收益为零。如果A相信B会实施威胁,A只好选择上,这样,A的收益至少为1,而不是零。但这个威胁可信吗?在一次性博弈中,一旦A选择了下,B就没办法了,只有在0和1的收益中进行理性选择,只好有气无力地选择右啰。©2011WangQiushi63/100“先动优势”现在我们这样思考:在此博弈中,如果由于种种原因,B为先动者,均衡点又何在呢?它是否证明了所谓“先动优势”?如果上例中的B先动,他会选择左,然后A没办法,只好选择上。先动者得到了9的收益,后动时他只得到1。这就说明了的确存在着所谓的“先动优势”,即在序列博弈中,首先采取策略的选手通常得利更大。©2011WangQiushi64/100先动优势:斯塔克伯格解用前一章学过的斯塔克伯格模型进一步解释先动优势。需求曲线依然为
p=120-q,假定企业A为领导者,企业B为跟随者,斯塔克伯格解为:q*A=60,q*B=30,p=30,πA=1800,πB=900。现在以表11.8为基础,再加上斯塔克伯格解,我们得到下表:©2011WangQiushi65/100先动优势:斯塔克伯格解©2011WangQiushi此博弈是否存在纳什均衡呢?如果A选30,B选40;如果A选40,B也选40;如果A选60,B选30。如果B选30,A选40;如果B选40,A也选40;如果B选60,A选30。这样,两个天真的跟随者的产量(40,40)才是纳什均衡。66/100先动优势:斯塔克伯格解现假定A为领导者,B为跟随者,把表11.10改为扩展型的博弈树。©2011WangQiushi■这三对策略都是子博弈的均衡。67/100先动优势:斯塔克伯格解哪一个会成为整个博弈的均衡呢?既然我先动,我选60啦,我的利润最大。©2011WangQiushi■斯塔克尔伯格的解为(A,B)=(60,30)=(1800,900)。68/100几个寡头模型解的比较给定需求函数p=120-q,MC=0,E点(40,40)为古诺解SA(60,30)为A先动的斯塔克伯格解,SB(30,60)为B先动的斯塔克伯格解;C点(60,60)为竞争性均衡;M点(30,30)为合谋性均衡。©2011WangQiushi69/100
进入威慑
在一些寡头行业,乃至垄断行业中,总是存在着企业进入的可能性。一般来说,谁都希望自己是个垄断者。因此,现有垄断者总是会采取一些措施威慑新企业的进入。有些威胁是可信的,但也有些威胁是不可信的。潜在进入者(定义为A)为先动者,它有两种选择:进入或放弃。现有垄断者(定义为B)为后动者,它有两种策略:一是降低价格实施反击,二是不反击。©2011WangQiushi70/100进入威慑©2011WangQiushi■如果A不进入,B也不反击,这是事件的起点,A和B的利润分别为0和8,这是最后一行。71/100进入威慑©2011WangQiushi■如果A不进入,B还要反击,这是一组没有实际意义的策略组合,利润也假定同前,这是倒数第二行。72/100进入威慑©2011WangQiushi■如果A选择进入,B发出威胁信号,要以降价为手段反击,(A,B)=(-1,4).73/100进入威慑©2011WangQiushi■如果A选择进入,B不反击的收益为6,大于反击时的4,它的威胁是不可信的。■因此,A决定进入。最后,均衡解为(A,B)=(进入,不反击)。74/100不可信威胁在现实生活中,不可信威胁还是比较多见的。比如“老师,你不让我及格我无脸见朋友我就跳楼”,“你不嫁给我,我就跟你同归于尽”,“如果你硬要嫁给那臭小子,你就不是我的女儿,我也不是你爹”,“如果你要侵略我的盟国,我就对你实施核打击”等等。这里所讲的“不可信”是在正常状态对收益和成本比较所做出的一种理性判断。但的确存在着一些非理性的人。这种人的威胁往往是成功的,可信的,这被称为“非理性的理性”。©2011WangQiushi75/100爱的心语©2011WangQiushi如果你不买那件衣服给我,我就不给你烧饭。76/100可信的威胁在本例中,现有垄断者如何实现可信的承诺呢?其中一种办法就是在潜在进入者尚未考虑进入之前,就做好了扩大生产能力的物资准备,一旦有潜在进入者进入,它就可以以更低的平均成本生产更多的产量,为打价格战做好了充分的准备。此时,利润分配状况会发生实质变化。到时就别怪我不客气。©2011WangQiushi77/100可信的威胁©2011WangQiushi78/100可信的威胁这种威胁可信吗?如果A选择进入,B一定会选择反击。因为反击的收益为3,大于不反击的收益2。一旦B反击,A的利润为(-2)。如果A选择不进入,利润为零。那就不进入吧!最后,A选择放弃进入,B威慑成功。生命的机会成本为零的人的威胁大多可行吗?©2011WangQiushi79/100纯粹策略在上述博弈中,我们所考察的所有策略都是有特定的策略或行动的,例如,进入或不进入,承认或否认,定价为3元或为5元等。这种选手采用特定策略的策略就是纯粹策略。让我们看一个“手心手背博弈”。©2011WangQiushi80/100手心手背博弈给定A出手心,B的最佳策略是手背;给定A出手背,B的最佳策略是手心。©2011WangQiushi■给定B出手心,A的最佳策略是手心;给定B出手背,A的最佳策略是手背。■这里不存在任何一组策略使得两人都同时满足,因此,没有纳什均衡。(不存在两个同时所指的箭头)81/100混合策略在纯粹策略中,选手要么选手心,要么选手背;而在混合策略中,选手可以50%的概率出手心,50%的概率出手背;或者其他什么概率。这种基于一组选择的概率对其结果进行随机选择的策略就是混合策略。尽管从纯粹策略而言,手心手背博弈不存在着纳什均衡;但从混合策略上讲,它是存在着纳什均衡的。©2011WangQiushi82/100混合策略如何求解混合策略的纳什均衡呢?纳什均衡的实质是:它必然是一个选手对另外一个选手最佳策略的一种最佳反应。如果是你的最佳策略,但不是我的,这不是纳什均衡;如果是我的最佳策略,但不是你的,这也不是纳什均衡。只有两个同时为最佳策略才为纳什均衡。在选手A看来,如果他选手心的概率几乎为1,选手B几乎选手背,但A对此的最佳反应都是选手背,没有均衡。同理,如果A选手心的概率几乎为0(即更可能选手背),B的最佳选择是手心,但A对此的最佳反应又是手心,也没有均衡。©2011WangQiushi83/100混合策略要使得这一博弈存在均衡的关键是A要选择出手心的一个概率p(那么,出手背的概率便为1-p),使得对手B不会选择一个确定性策略,而是对几种选择无差异。这样,如果A以p的概率选手心,(1-p)的概率选手背,那么,B选手心的预期收益(或效用)等于:©2011WangQiushi■同理,B选手背的预期效用等于:84/100混合策略欲使B对选手心和手背的预期效用无差异,就必须使得以上两式相等,1-2p=2p-1,
p=1/2■即A以1/2的概率各出手心与手背,B在选择手心手背之间无差异。
如果p>1/2,B从选择手背中得到更大的效用;
如果p<1/2,B从选择手心中得到更大的效用。©2011WangQiushi85/100混合策略同理,选手B要选择出手心的概率q(出手背的概率为1-q),使得A在两种选择中无差异。这样,A选手心的预期效用UE(手心)要恰好等于选手背的预期效用UE(手背),即:©2011WangQiushi86/100混合策略即B以1/2的概率各出手心与手背,A在选择手心和手背之间无差异。如果q>1/2,A从选择手心中得到更大效用;如果q<1/2,A从选手背中得到更大效用。这样,(这一策略组合p=1/2,q=1/2)便是混合策略的纳什均衡。©2011WangQiushi87/100混合策略一般地说,一个2人和2种策略的博弈的收益矩阵以及相应概率(p,q)可以写成表11.12。©2011WangQiushi88/100混合策略混合策略的纳什均衡必须满足以下两个条件:第一,A选择S1A的概率为p时,使得B选择S1B和S2B无差异:©2011WangQiushi第二,B选择S1B的概率为q时,使得A选择S1A和S2A无差异:89/100混合策略求解出p*和q*便是混合策略的纳什均衡。我们为什么要考虑求解混合策略的纳什均衡呢?原因之一就是有些博弈的纯粹策略没有纳什均衡,然而,一旦允许玩混合策略,每一个博弈至少有一个纳什均衡。因此,混合策略对没有纯粹策略纳什均衡的博弈提供了一种解。这个解是否合理取决于具体的博弈。在上述博弈中,手心手背各随机地出,其概率为1/2,你的效用就实现了极大化。©2011WangQiushi90/100
性别冲突博弈
性别冲突博弈是既有纯粹策略纳什均衡,又有混合策略纳什均衡的一个例子。丈夫和妻子很想在某一个周六晚上呆在一起,但对娱乐的偏好不尽相同。妻子喜欢听音乐会,丈夫偏爱看足球赛,同时这对新婚夫妇都认为在一起的效用比单独行动的效用更大。©2011WangQiushi91/100
性别冲突博弈
给定妻子看足球赛,丈夫的最佳选择也是看足球赛,此时他最幸福,效用最大;给定妻子听音乐会,丈夫的最佳选择也是听音乐会,因为他讨厌一人孤独地看足球赛。©2011WangQiushi给定丈夫看足球赛,妻子的最佳选择也是看足球赛(因为她讨厌一人孤独地听音乐会);给定丈
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《光电信息实验1》课程教学大纲
- 《人际关系学》课程教学大纲
- 2024年出售门禁集装箱合同范本
- 2024年出品商委托生产合同范本
- 2024年承接潜水工程合同范本
- 医疗技术与医疗道德
- 2024防松螺母行业市场趋势分析报告
- 2024技术咨询合同模板
- 2024工程工程合同范本
- 2024至2030年中国平开纱窗行业投资前景及策略咨询研究报告
- 医院呼吸机运行期预防性维护全面管理方案包括巡检维护保养各种表格
- 流浪人你若到斯巴
- Unit6NurturingnatureUsingLanguage现在完成进行时教学设计高中英语外研版选择性
- 高中心理健康教育辽宁师大版高二第16课《走进职业世界》优质课公开课教案教师资格证面试试讲教案
- 重度子痫前期、胎盘早剥急救演练
- 大学生职业规划4篇汇编
- GB/T 42461-2023信息安全技术网络安全服务成本度量指南
- eCASH的临床实践课件
- 毛栗煤矿 矿业权价款计算结果的报告
- 黄桃种植技术 种植黄桃如何浇水
- Q-CR 783.1-2021 铁路通信网络安全技术要求 第1部分:总体技术要求
评论
0/150
提交评论