章完全信息静态博弈_第1页
章完全信息静态博弈_第2页
章完全信息静态博弈_第3页
章完全信息静态博弈_第4页
章完全信息静态博弈_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一篇非合作博弈理论完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈1.完全信息静态博弈1.1博弈论的基本概念及战略式表述1.2纳什均衡1.3纳什均衡应用举例1.4混合战略纳什均衡1.5纳什均衡的存在性和多重性的讨论1.1博弈论的基本概念及战略式表述开发商A下在考虑是否要在北京的某一地段开发一栋新的写字楼。你面临的选择是开发或者不开发。如果决定开发,你必须投入1亿资金;如果决定不开发,你的资金投入为0。开发商B也面临与你同样的决策问题。假定,如果市场上有两栋楼出售,需求大时,每栋售价达1.4亿元,需求小时,售价为7千万;如果市场上只有一栋楼出售,需求大时售价为1.8亿,需求小时为1.1亿,这样,有以下8种可能的结果:引例:“房地产开发博弈”1.1.1基本概念1.需求大,你开发,他不开发;你的利润为8千万,他的利润为0。2.需求大,你不开发,他开发;你的利润为0,他的利润为8千万。3.需求大,你开发,他也开发;你和他的利润各为4千万。4.需求大,你不开发,他不开发;你和他的利润为0。5.需求小,你开发,他不开发;你的利润为1千万,他的利润为0。6,需求小,你不开发,他开发;你的利润为0,他的利润为1千万。7.需求小,你开发,他也开发;你和他的利润各为-3千万。8.需求小,你不开发,他不开发;你和他的利润都为0。博弈论的基本概念包括:参与人、行动、信息、战略、支付(效用)、结果和均衡其中参与人、战略和支付是描述一个博弈所需要的最少的要素,而行动和信息是其“积木”。参与人、行动和结果统称为“博弈规则”(therulesofthegame).1.参与人(players)

参与人指的是一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用)水平。参与人可以是自然人,也可以是团体。在博弈论中,“自然”(nature)作为“虚拟参与人”(pseudo-player)来处理。这里,“自然”是指决定外生的随机变量的概率分布的机制。“自然”没有自己的支付和目标函数。2.行动(actionsormoves)

行动是参与人在博弈的某个时点的决策变量

一般地,我们用ai表示第i个参与人的一个特定行动,Ai={ai}表示供i选择的所有行动的集合(actionset,即策略集/行动集)。在n人博弈中,n个参与人的行动的有序集a=(a1,…,ai,…an)称为“行动组合”(actionprofile),其中的第i个ai是第i个参与人的行动。3.信息(information)

信息是参与人有关博弈的知识,特别是有关“自然”的选择、其他参与人的特征和行动的知识。信息集(informationset)是博弈论中描述参与人信息特征的一个基本概念,可理解为参与人在特定时刻有关变量的值的知识。一个参与人无法准确知道的变量的全体属于一个信息集。在博弈论中,“完美信息”和“完全信息”是两个有联系但又不完全的概念。

完美信息(perfectinformation)是指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值;完全信息(completeinformation)是指自然不首先行动或自然的初始行动被所有参与人准确观察到的情况,即没有事前的不确定性。“共同知识”(commonknowledge)指的是“所有参与人知道所有参与人知道,所有参与人知道所有参与人知道所有参与人知道……”的知识。一般地,我们用si表示第i个参与人的一个特定战略,Si={si}代表第i个参与人的所有可选择的战略的集合(strategyset)。如果n个参与人每人选择一个战略,n维向量s=(s1…,si,…sn)称为一个战略组合(strategyprofile),其中si第i个参与人选择的战略。4.战略(strategies);战略与行动是两个不同的概念,战略是行动的规则而不是行动本身。在静态博弈中,战略和行动是相同的。作为一种规则,战略必须是完备的。战略是参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。

在现实有许多博弈中,即使所有参与人“共同”享有某种知识,每个参与人也许并不知道其他参与人知道这些知识,或者并不知道其他人知道自己拥有这些知识。这种情况被称为“一致信念”(concordantbeliefs)。

博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择即,ui是所有参与人的战略选择的函数:

ui=ui(s1,…,si,…sn)5.支付(payoff)在博弈论中,支付或者是指在一个特定的战略组合下参与人行到的确定效用水平,或者是指人得到的期望效用水平。令ui为第i个参与人的支付(效用水平)u=(u1,…,ui,…un)为n个参与人的支付组合(payoffprofile)。6.结果(e):结果是博弈分析者所感兴趣的所有东西,如果均衡战略组合,均衡行动组合,均衡支付组合等。7.均衡(equilibrium):均衡是所有参与人的最优战略的组合,一般记为s*=(s*1,…,s*i,…,s*n)其中,s*i是第i个参与人在均衡情况下的最优战略,它是i的所有可能战略中ui或Eui最大化的战略。博弈论中的均衡概念与一般均衡理论中市场供应的均衡概念的区别。“均衡”和“均衡结果”(equilibriume)的区别,人们说“均衡”时他常常是指“均衡结果”。Static(orsimultaneous-move)gamesofcompleteinformation(完全信息静态博弈)一个参与人集合(至少两个参与人)每个参与人都有一个策略集/行动集每个参与人针对策略组合,或者说对他所偏好的策略组合所获得的收益{Player1,Player2,...Playern}S1S2...Snui(s1,s2,...sn),forall

s1

S1,s2

S2,...sn

Sn.一个静态(或同时行动)博弈包括的要素:GameTheory--Chapter111同时行动(Simultaneous-move)每个参与人在选择他/她的策略时不知道其他参与人的选择.完全信息(Completeinformation)每个参与人的策略和收益函数都是所有参与人的共同知识(commonknowledge).对参与人的假设理性(Rationality)参与人的目的是使他的收益最大化参与人是完美的计算者每个参与人都知道其他参与人是理性的Static(orsimultaneous-move)gamesofcompleteinformation(完全信息静态博弈)参与人是否合作?不.我们仅仅考虑非合作博弈(non-cooperativegames)时间顺序每个参与人

i

在不知道其他人的选择的情况下选择他/她的策略si.然后每个参与人

i

得到他/她的收益

ui(s1,s2,...,sn).博弈结束.Static(orsimultaneous-move)gamesofcompleteinformation(完全信息静态博弈)1.1.2博弈的战略式表述博弈的两种不同的表述方式:战略式表述(strategicformrepresentation)扩展式表述(extensiveformrepresentation)战略式表述更适合于静态博弈,而扩展式表述更适合于讨论动态博弈。战略式表述又称为标准式表述(normalformrepresentation),在这种表述中,所以参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。更为准确地讲,战略式表述给出:博弈的参与人集合:每个参与人的战略空间:每个参与人的支付函数:我们将用

代表战略式表述博弈。在两寡头博弈里,企业是参与人,产量是战略空间,利润是支付;战略式博弈为:这里,qi和πi分别是第i个企业的产量和利润。一个博弈被称为有限博弈(finitegame)

第一、参与人的个数是有限的;第二、每个参与人可选择的战略是有限的

两人有限博弈的战略式表述可以用矩阵表来直观地给出。表1.1是房地产开发博弈中开发商A和B同时行动博弈的战略式表述开发商B开发不开发

开发商B开发不开发

开发商A开发不开发4000,40008000,00,80000,0-3000,-30001000,00,10000,0(a)高需求情况(b)低需求情况开发商A开发不开发如果完全静态博弈是一种最简单的博弈,在这种博弈中,由于每个人是在不知其他人行动的情况下选择自己的行动,战略和行动实际上是一回事。博弈分析的目的是预测博弈的均衡结果,即给定每个参与人都是理性的(rational)。纳什均衡是完全信息静态博弈解的一般概念,也是所有其他类型博弈解的基本要求。1.2纳什均衡1.2.1占优战略均衡一个参与人的最优战略可能并不依赖于其他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优战略是唯一的,这样的最优战略被称为“占优战略”(dominantstrategy).例如,“囚徒困境”。囚犯B坦白抵赖

坦白囚犯A

抵赖-8,-80,-10-10,0,-1,-1一般地,s*i称为参与人i的(严格)占优战略,如果对应所有的s-i,s*i是i的严格最优选择,即:对应地,所有的

被称为“劣战略”(dominatedstrategies).记住,这里是i之外所有参与人战略的组合。定义:

在博弈的战略式表述中,如果对于所有的i,s*i是i的占优战略,那么,战略组合

称为占优战略均衡(dominant-strategyequilibrium)。占优战略均衡只要求每个参与人是理性的,而并不要求每个参与人知道其他参与人是理性的(也就是说,不要求“理性”是共同知识)。囚徒困境反映了一个深刻的问题,即个人与团体理性的冲突。这是合作博弈与非合作博弈的区别。1.2.2

重复剔除占优均衡在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理的预测,但在绝大多数博弈中,占优战略均衡是不存在的。尽管如此,在有些博弈中,我们仍可以应用占优的逻辑找出均衡。在“智猪博弈”的例子中。显然,这个博弈没有占优战略均衡,所以不能应用占优战略找出均衡。小猪按等待3,12,47,-1,0,0那么,什么是这个博弈的可能的均衡解呢?假定小猪是理性的,那么理性的小猪会选择“等待”。再假定大猪知道小猪是理性的,那么大猪的最优选择只能是“按”。这是一个“多劳不多得,少劳不少得”的均衡。以上实际上是应用了“重复剔除严格劣战略”的思路

定义:令和是参与人i可选择的两个战略(即)。如果对于任意的其他参与人的战略组合,参与人从选择得到的支付严格小于从选择得到的支付,即:

我们说战略严格劣于战略(isstrictlydominatedby)。通常,

称为相对于的劣战略;对应地,称为相对于的优战略。占优战略均衡中的占优战略是相对于所有的占优战略。定义:

弱劣于战略(

isstrictlydominatedby

),如果对于所有的,且对于某些严格不等式成立。称为相对于的弱占优战略。

按大猪等待重复剔除的占优均衡:战略组合称为重复剔除的占优均衡,如果重复剔除劣战略后剩下的唯一的战略组合。如果这种唯一的战略组合是存在的,我们说该博弈是重复剔除占优可解的(dominantcesolvable)。一个抽象的例子:

在这个例子中,参与人A有两个战略:SA=(U,D),参与人B有三个战略:SB=(L,M,R)。A的战略中没有一个严格优于另一个:如果B选择L或M,U是最优的(1>0),但如果B选择R,D是最优的(2>0)。然而,对B来说,M严格优于R,故理性的参与人B不会选择R。如果参与人A知道参与人B是理性的,R被剔除,A将选择自己的战略,似乎面对的是如表1.4(b)所代表的博弈。在这个新的中,U严格优于D。这样,如果B知道A是理性的,并且B知道A知道B是理性的(从而B知道1.4表(b)是适用的),D将被从其战略中剔除,我们行到如表1.4(C)所示的博弈。这个博弈实际上是一个单人决策问题,M严格优于L,L将被剔除。这样,(U,M)是剩下的唯一的战略组合。参与人BLM1,01,20,10,30,12,01,01,20,30,11,01,2参与人BLMR

参与人BLM参与人AU

D参与人AU

(a)(b)(c)参与人AU

D如果每次剔除的是严格,均衡结果与剔除的顺序无关。如果的是弱劣战略,均衡结果可能与剔除顺序有关。如表1.5参与人BC1C2C32,121,101,120,120,100,110,120,100,13参与人的战略空间越大,需要的步骤就越多,对共同知识的要求就越严格。由于这个原因,尽管在许多博弈中得利剔除的占优均衡是一个合理的,但这一点并非总是如此,特别是当支付取某些极端值的时候。参与人BLR

U参与人AD8,10-1000,97,66,5这个例子说明,在类似右表所示的博弈中,博弈的结果对行为的不确定性是很敏感的,即使是很小的不确定性。在单人决策分析里,只有一个决策人,他面临的唯一不确定性是“自然”可能的行动,他对自然选择不同行支的概率有一个固定的、外生的信念。相反,在博弈分析中,有多个,每个决策人有关其他决策人的行为的信念并不是外生的。由于这个区别,许多我们所熟悉的决策论中的比较静态结论并不能推广到博弈论中。参见表1.7,1.8博弈分析与单人分析的一个重要区别

R1参与人AR2R31.2.3纳什均衡纳什均衡是完全信息博弈解的一般概念,构成纳什均衡的战略一定是重复剔除严格劣过程中不能被剔除的战略,就是说,没有任何一个战略严格优于纳什均衡战略。定义:有n个参与人的战略式表述博弈,战略组合是一个纳什均衡,如果对于每一个i,是给定其他参与人选择的情况下第i个参与人的最优战略,即:或者用另一种表述方式,是下述最大化问题的解:(1)每一个占优战略均衡、重复剔除的占优均衡一定是纳什均衡,但并非每一个纳什均衡都是占优战略均衡或重复剔除的占优均衡。(2)纳什均衡一定是在重复剔除严格劣战略过程中没有被剔除掉的战略组合,但没有被剔除战略组合,不一定是纳什均衡,除非它是唯一的。纳什均衡与占优战略均衡及重复剔除的占优均衡之间的关系。如果使用弱劣战略剔除的办法,均衡结果可能与剔除顺序有关。例如:一个市场进入的例子:有一个垄断者已在市场上(称为“在位者”),另一个企业虎视眈眈想进入(称为“进入者”)。进入者有两可以选择:(进入,不进入);在位者也有两个战略:(默许,斗争)。假定进入之前的垄断利润为300,进入之后寡头利润为100,进入成本为10。各种战略组合下的支付矩阵如下表所示:

在位者默许 斗争40,50-10,00,3000,300进入进入者不进入这个例子说明,(弱)纳什均衡允许弱劣战略的存在纳什均衡是参与人将如何博弈的“一致性”(consistent)预测:如果所有参与人预测一个特定的纳什均衡将会出现,那么,没有人有兴趣作不同的选择从而,纳什均衡且只有纳什均衡具有这样的特征:

参与人预测到均衡,参与人预测到其他参与人预测到均衡,等等1.3纳什均衡应用举例1.3.1库诺特(Cournot)寡头竞争模型1.3.2豪泰林(Hotelling)价格竞争模型1.3.3公共地的悲剧1.3.4公共物品的私人自愿供给1.3.5基础设施建设:中央政府和地方政府之间的博弈

(不要求)1.3.1库诺特(Cournot)双寡头竞争模型库诺特寡头竞争模型里,有两个参与人,分别称为企业1和企业2;每个企业的战略是选择产量;支付是利润,它是两个企业产量的函数是纳什均衡产量意味着:找出纳什均衡的一个办法是对每个企业的利润函数求一阶导数并令其等于零:用代表第i个企业的产量,Ci(qi)代表成本函数,P=P(q1+q2)代表逆需求函数(P是价格;Q(P)是原需求函数)。第i个企业的利润函数为:上述两个一阶条件分别定义了两个反应函数(reactionfunction):反应函数意味着每个企业的最优战略(产量)是另一个企业产量的函数。两个反应函数的交叉点就是纳什均衡R1(q2)R2(q1)NE为了得到更具体的结果,考虑上述模型的简单情况。假定每个企业具有相同的单位成本,即:需求函数取如下线性形式:

那么,最优化的一阶条件分别为:反应函数为:就是说,j每增加1个单位的产量,i将减少1/2单位的产量。解两个反应函数,得纳什均衡为:每个企业的纳什均衡利润分别为:为了与情况作比较,计算垄断企业的最优产量和均衡利润。垄断企业的问题是:最优产量为:垄断利润为:思考结果是满足这样的:若一开始就假设:结论是否仍然是(q待定)寡头竞争的总产量大于垄断产量的原因在于每个企事业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。这是典型的囚徒困境问题。库诺特模型也可以使用重复剔除严格劣战略的方法找出均衡解重复剔除严格劣战略过程产生为唯一均衡,即纳什均衡

在上述讨论中,我们隐含地假定稳定的均衡是存在的,且是唯一的,满足这个要求的条件是,利润函数是严格凹的交叉函数偏导数是负的此外,还要求两曲线只交叉一次,且在交叉点R1比R2更陡。满足这些条件的库诺模型是重复剔除严格劣战略可解的。如果这些条件不满足,我们就无法用重复剔除的办法找到均衡解。此外,如果存在3个以上的寡头企业,重复剔除也无法给出均衡解。这两个条件意味着反应函数R1和R2是斜率为负的连续函数;补充:伯川德寡头竞争模型(同质产品)两企业(企业1,企业2)进行价格竞争,企业1价格p1,企业2价格p2,Ifp1<p2

,企业1的市场需求函数q1=a-p1企业2的市场需求函数为0;反之类似;If

p1=p2=p

,企业1,2的市场需求函数

q1=q2=(a-p)/2

边际成本为常数c,c<a,两个企业同时选择价格,则纳什均衡定价为c

.此时,企业利润为零,(BertrandParadox)

伯川德双寡头竞争模型(异质产品)伯川德(Bertrand)(1983)Bertrand均衡(选择产量)VsCournot均衡(选择价格)企业1和2选择价格P1

和P2,消费者选择对企业i

的产品的需求为:伯川德双寡头竞争模型(异质产品)其中,b>0,企业的边际成本为c,c<a,两企业同时行动。

均衡求解:企业i的利润为:pi应该是最优化问题的解,因此,因此,伯川德双寡头竞争模型(异质产品)1.3.2豪泰林(Hotelling)价格竞争模型Pi为商店i的价格,Di(p1,p2)为需求函数,i=1,2。如果住在x的消费者在两个商店之间是无差异的,那么,所有住在x左边的将都在商店1购买…需求分别为D1=x,D2=1-x。x满足:“伯川德悖论”(BertrandParedox):即使只有两个企业,在均衡情况下,价格等于边际成本,企业的利润为零,与完全竞争商场均衡一样。解决办法之一是引入产品的差异性。空间上的差异(spacialdifferentiation),即经典的豪泰林(hotelling)模型。物质上有差异的模型(Bertrand寡头竞争模型,Gibbons,P17)产品在物质性能上是相同的,但在空间位置上有差异。因为不同位置上的消费者要支付不同的运输成本。考虑两商店之间价格竞争的纳什均衡。解上式得需求函数分别为:利润函数分别为:商店i选择自己的价格pi最大化利润,给定,两个一阶条件分别是:解上述两个一阶条件,得最优解为:每个企事业的均衡利润为:以上分析中,我们假定两个商店分别位于城市的两个极端。另一个极端的情况,假定两个商店位于同一个位置x。,此时,伯川德均衡是唯一的均衡:更为一般地,我们可以讨论商店位于任何位置的情况。假定商店1位于,商店2位于(这里)。需求函数分别为:

,当纳什均衡为:当时,即为第一种情况:当时,为第二种情况:1.3.3公共地的悲剧这个例子证明,如果一种资源没有排他性的所有权,就会导致对这种资源的过度使用考虑一个有n个农民的村庄共同拥有一片草地,每个农民都有在草地上放牧的自由。每年春天,每个农民要决定自己养多少只羊。用,代表第i个农民饲养的数量,,代表n个农民饲养的总数量;v代表每只羊的平均价值。v是G的函数,一个重要的假设是最大可存活的数量:当假定:如图:每只羊的价值随饲养总数量的增加而下降在这个博弈里,每个农民的问题是选择以最大化自己的利润。假定购买一只羊羔的价格为c,那么,利润函数为:

最优化的一阶条件是:上述n个一阶条件定义了n个反应函数:因为所以即第i个农民的最优饲养量随其它农民的饲养量的增加递减N个反应函数的交叉点就纳什均衡:纳什均衡的总饲养量为将n个一阶条件相加,得到:社会最优的目标是最大化如下定义的社会总剩余价值:最优化的一阶条件为:比较社会最优的一阶条件与个人最优的一阶条件可以看到:这就是公共地的悲剧。推导过程?比较的方法1.3.4公共物品的私人自愿供给公共物品的私人自愿供给会导致供给不足。设想一个由n个居民组成的社团正建设一座防洪大堤的情况……第i个居民的贡献为gi,总供给为。i的效用函数为,这里是私人物品的消费量。假定,且私人物品和公共物品之间的边际替代率是递减的。令为私人物品的价格,为沙袋的价格,为个人总预算收入。那么,每个居民面临的问题是给定其他居民的选择的情况下,选择自己的最优战略以最大化下列目标函数:最优化的一阶条件为:故假定其他人的选择给定。n个均衡条件决定了公共物品自愿供给的纳什均衡:考虑帕累托(Pareto)最优解。假定社会福利函数采取下列形式:总预算约束为:帕累托最优的一阶条件是用n个等式消除掉,我们得到均衡条件:这就是存在公共物品情况下帕累托最优的萨缪尔逊条件。上述条件可重写为:结论:Pareto最优供给>Nash均衡供给假定个人效用函数取柯布-道格拉斯形式,即这里,则个人最优的均衡条件为:将预算条件代入整理,得反应函数为一般地,如果所有居民有相同的收入水平M,均衡情况下所有居民提供相同的公共物品,纳什均衡为:纳什均衡的总供给为:在所有人具有相同收入的假设下,帕累托最优的一阶条件为:将预算约束代入,得到单个人的帕累托最优贡献为公共物品的总供给为:纳什均衡的总供给与帕累托最优的总供给的比率为:就是说,公共物品的纳什均衡供给小于帕累托最优供给,且二者之间的差距随着社区居民人数的增加而扩大。此外,供给不足的程度会随着收入分配差距的扩大而减弱(Olson,1982)。比如说,假定社区由两人组成,如果,纳什均衡为:纳什均衡总供给为:对比这下,如果居民1的收入是居民2的2倍即,假定,纳什均衡为:容易验证,收入平均分配下的纳什均衡总供给小于收入分配不均时的纳什均衡供给:上述例子表明,当收入分配不平均时,公共物品的自愿供给可能变成一个智猪博弈。在有些情况下,公共物品的提供也可能变成一个斗鸡博弈问题。如下:公共物品的斗鸡博弈

富人B修不修

富人A修不修1.3.5基础设施建设:

中央政府和地方政府之间的博弈3,32,44,21,1总结:公共物品的供给可能是一个囚徒困境问题,也可能是智猪博弈问题,还可能是一个斗鸡博弈问题,依环境而定。静态博弈分析解释中央政府和地方政府基础设施建设上的博弈:假定中央政府和地方政府投资的收益函数分别取如下柯布-道格拉斯形式:中央政府:地方政府:

用和分别代表中央政府和地方政府可用于投资的总预算资金。假定中央政府和地方政府的都是在满足预算约束的前提下最大化各自的收益函数。那么,中央政府的问题是:地方政府的问题是:解之,得反应函数分别为:中央政府:地方政府:上述反应意味着:

Odbca图1.4基础设施投资的博弈即在均衡点,至少有一方的最优解是角点解。

代表中央政府的反应曲线,代表地方政府的反应曲线;使用重复剔除严格劣战略的方法,经过不断重复剔除,(0,OC)是唯一剩下的战略组合。命题1:如果纳什均衡是:,即地方政府将全部资金投资于加工业,中央政府满足所有基础设施投资的需求,然后将剩余资金投资于加工业。考虑 的情况。

使用图1.4容易证明:命题2:如果,纳什均衡为:纳什均衡为:即地方政府将全部资金投资于加工业,中央政府将全部资金投资于基础设施。再考虑的情况,有:命题3:如果,纳什均衡为:即中央政府将全部资金投资于基础设施建设,地方政府“弥补”中央投资的不足直到地主政府的理想状态,然后将剩余资金投资于加工业。综合上述三种情况,在第一种情况下,投资资金的分配格局满足了中央政府的偏好:在第二种情况下,投资资金的分配格局介于中央政府的偏好和地方政府的偏好之间:在第三种情况下,投资资金的分配格局满足了地方政府和偏好:上述模型大致可以解释改革开放以来中国基础设施投资格局的变化过程

1.4混合战略纳什均衡-1,11,-11,-1-1,1在前面,我们将纳什均衡定义为一组满足所有参与人的效用最大化要求的战略组合,根据这一定义,有些博弈不存在纳什均衡。考虑下面两个例子:流浪汉寻找工作游荡

政府救济不救济3,2-1,3-1,10,0儿童B正面反面儿童A正面反面社会福利博弈猜謎游戏

上述两个博弈的显著特征是,每一个参与人都想猜透对方的战略,而每一个参与人又都不能让对方猜透自己的战略。在这类博弈中,都不存在纳什均衡。如果一个战略规定参与人在每一个给定的信息情况下只选择一种特定的行动,我们称该战略为。相反,如果一个战略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,我们称该战略为。在博弈的战略式表述中,混合战略可以定义为在纯战略空间上的概率分布。在静态博弈里,纯战略等价于特定的行动,混合战略是不同行动之间的随机选择。纯战略混合战略定义:在n个参与人博弈的战略式表述中,假定参与人i有K个纯战略:,那么,概率分布称为i的一个混合战略,这里是i选择的概率,对于所有的使用上述定义,纯战略可以理解为混合战略的特例。((用代表i的混合战略空间代表混合战略空间组合,其中为的一个混合战略,代表混合战略组合空间。))重新定义纳什均衡:定义:在n个参与人博弈的战略式表述中,混合战略组合是一个纳什均衡,如果对于所有的下式成立:纳什均衡也可以表述如下:定义:是一个纳什均衡,如果对于所有的参与人i,以社会福利博弈为例求解混合战略纳什均衡假定政府的混合战略为,流浪汉的混合战略为政府的期望效用函数为:对上述效用函数求微分,得到政府最优化的一阶条件为:因此,即,在混合战略均衡中,流浪汉以0.2的概率选择寻找工作,以0.8的概率选择游荡。为了找出政府的均衡混合战略,我们需要求解流浪汉的最优化问题。给定流浪汉的期望效用函数为:最优化的一阶条件为:因此我们可以使用反应对应的概念来描述一个参与人对应与其他参与人混合战略的最优选择。在上述博弈中,政府和流浪汉的反应对应分别为:政府:流浪汉:

0.20.5

11图1.5混合战略纳什均衡海萨尼对混合战略的解释是,混合战略均衡等价于不完全信息下的纯战略均衡。尽管混合战略不像纯战略那样直观,但它确实是一些博弈中参与人的合理行为方式。经注学上的监督博弈也是这样的一个例子:给定,纳税人选择逃税和不逃税的期望收益分别为:用代表税收机关检查的概率,代表纳税人逃税的概率。给定,税收机关选择检查和不检查的期望收益分别为:监督博弈表1.14概括了对应不同纯战略组合的支付矩阵。纳税人逃税 不逃税税收机关检查不检a-C+F,-a-Fa-C,-a0,0a,-a解,得:解得:因此,混合战略纳什均衡是:

以上讨论的是不存在纯战略纳什均衡但存在混合战略纳什均衡的博弈。有些博弈既存在纯战略均衡,也存在混合战略均衡。所谓的“性别战”就是这样一个博弈。女足球芭蕾男足球2,10,0芭蕾0,01,2这个博弈有两个纯战略纳什均衡:(足球,足球),(芭蕾,芭蕾)。事实上,这个博弈还有一个混合战略纳什均衡:男的以2/3的概率选择足球赛,1/3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论