博弈论与信息经济学04_第1页
博弈论与信息经济学04_第2页
博弈论与信息经济学04_第3页
博弈论与信息经济学04_第4页
博弈论与信息经济学04_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章:不完全信息动态博弈主要内容:一、精炼贝叶斯纳什均衡二、信号传递博弈三、不完全信息重复博弈与声誉成语故事:黔驴技穷-驴虎博弈开始老虎将驴当作神奇的东西,后来老虎渐渐地接近它;一天,驴子一声长鸣,老虎非常害怕,远远地逃走,认为驴子将要咬自己,非常恐惧。然而老虎来来往往地观察它,觉得驴子好像没有什么特殊的本领似的,但老虎始终不敢和驴子搏击。慢慢地,老虎又靠近了驴子,态度更为随便,碰擦倚靠、冲撞冒犯它。驴非常愤怒,用蹄子踢老虎。老虎因此而欣喜,心想驴子的本领只不过如此,于是咬断驴的喉咙,吃完了它的肉。一、基本思路尽管老虎对毛驴有一个初始的评价和判断,但是,初始评价和判断在后来不断发生变化;老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的,毛驴也是如此。最终老虎将毛驴吃掉。简单的情形:老虎对毛驴的评价与判断得以修正,是与毛驴的行动有关;复杂的情形:如果行动不能反映参与人的真实类型,怎么办?参与人:在位者,进入者;动态博弈情形下,包含两个阶段:T=1和T=2;类型:在位者有两种类型,高成本或低成本,进入者在博弈开始时只知道在位者高成本的概率是x,低成本概率是1-x。T=1时,市场上只有一个垄断企业——在位者,一个潜在进入者考虑是否进入;如果进入者进入,两个企业进行古诺博弈。市场进入博弈对于在位者:

价格P=4P=5P=6

在位者高成本时的利润267

在位者低成本时的利润698进入者只有一种类型:进入成本为2。如果进入,生产成本函数与在位者高成本函数相同。在T=2阶段,如果进入者已进入,在位者成本函数为共同知识;若在位者为高成本,企业成本函数相同,对称的古诺均衡产量下的价格p=5,每个企业的利润为3,扣除进入成本2,进入者利润为1;若在位者为低成本,两个企业成本函数不同,非对称古诺均衡产量下的价格p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。如果进入者不进入,在T=2阶段,在位者仍然是一个垄断者,不同价格选择下的利润水平仍与第一阶段相同。

价格P=4P=5P=6

在位者高成本时的利润267

在位者低成本时的利润698

进入者进入在位者进入者

在位者高成本p=531

在位者低成本p=45-1N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入P=4进入者进入不进入进入不进入[x][1-x]在位者P=5P=6P=4(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)(2,0)(2,0)(8,0)(8,0)第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)第一阶段在第二阶段,企业的行动选择是一个简单的静态博弈决策问题,但在第一阶段,情况要复杂得多:进入者是否进入依赖于它对在位者成本函数(成本类型)的判断:给定在位者是高成本时,进入者进入的净利润是1,低成本时进入者的利润是-1,当且仅当进入者认为在位者是高成本的概率大于1/2时,进入者才选择进入。与静态博弈不同的是,在观测到在位者第一阶段的价格选择后,进入者可以修正对在位者成本函数的先验概率x,因为在位者的价格可能包含其成本函数的信息;但是,在位者同时也会考虑价格选择的信息效应:不同的价格如何影响进入者的后验概率,从而影响进入者的进入决策;先验概率和后验概率先验概率(priorprobability):修正之前的判断;后验概率(posteriorprobability):修正之后的判断。例如:低成本的在位者不会选择p=6,因此,如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本,选择进入是有利可图的。预测到p=6会招致进入者进入,即使高成本的在位者也可能不会选择p=6。类似的,如果选择价格p=5会招致进入者进入,低成本的在位者也不会选择p=5。

价格P=4P=5P=6

在位者高成本时的利润267

在位者低成本时的利润698在静态贝叶斯均衡中,参与人的信念是事前给定的,均衡概念没有规定参与人如何修正自己的信念。但是,如果进入者可以任意修订自己有关在位者成本函数的信念,上述不完全信息动态博弈可以有任意均衡。例如,假定x<1/2,下列战略组合是一个贝叶斯均衡:不论在位者选择什么价格,进入者总认为在位者是低成本的概率为x*<1/2,总是选择不进入;高成本在位者选择p=6,低成本在位者选择p=5。显然,这个均衡是不合理的,因为它包含了一个不可置信威胁:进入者不会修正对在位者成本函数的信念。这是因为,p=6不可能是低成本在位者的最优选择,如果在位者选择了p=6,进入者为什么仍认为在位者是高成本的概率小于1/2呢?为了剔除那些不可置信的威胁,在完全信息动态博弈中引入了子博弈精练纳什均衡的概念;但是,在不完全信息动态博弈中,只有一个子博弈,不能将上述方法直接用于求不完全信息动态博弈的均衡解,但可以借用这一方法的逻辑。将从每个信息集开始的博弈的剩余部分称为一个“后续博弈”,一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。我们将通过这种方式得到的纳什均衡称为精炼贝叶斯纳什均衡。精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼纳什均衡和贝叶斯推断的结合。它要求:

1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);

2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;

3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。假定参与人i有K个类型,同时有H个行动,用

k和sh分别代表一个特定的类型和战略,假定i属于k的先验概率是p(k)0,且p(k)=1,参与人i选择sh的条件概率为p(sh

k),且p(sh

k)=1。假如观测到i选择了sh,则i属于类型

k的后验概率Prob(ksh)为:贝叶斯法则二、精炼贝叶斯纳什均衡

精炼贝叶斯均衡是战略组合s*(

)=(s1*(

1),…,sn*(

n))

和后验概率组合,满足:(P)对于所有的参与人i,在每一个信息集h上,存在

(B)是使用贝叶斯法则从先验概率

pi(

-i

i)、观测到的a-ih和最优战略s-i*(.)得到的。精炼贝叶斯纳什均衡是均衡战略和均衡信念的结合,给定信念,战略是最优的;给定战略,信念是使用贝叶斯法则从均衡战略和所观测到的行动得到的。当x<1/2时,精炼贝叶斯均衡为:不论高成本还是低成本,在位者选择p=5;当且仅当进入者观察到p=6时,进入者进入。当x>=1/2时,精炼贝叶斯均衡为:低成本在位者选择p=4,高成本在位者选择p=6;如果观测到p=4,进入者选择不进入;如果观测到p=6,进入者选择进入。三、市场进入博弈的精炼贝叶斯纳什均衡N高低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入P=4进入者进入不进入进入不进入[x][1-x]在位者P=5P=6P=4(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)(2,0)(2,0)(8,0)(8,0)第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)第一阶段高-在位者P=6进入者进入在位者利润:7+31、x<1/2的情形高-在位者P=5进入者不进入在位者利润:6+7牺牲1单位换取4单位利润是合算的在位者P=5

给定在位者的后验概率和战略低-在位者P=5进入者不进入在位者利润:9+9最优选择给定两类在位者都选p=5,进入者不能从观测到价格中得到任何信息,x(5)=(1*x)/(1*x+1*(1-x))=x<1/2,进入的期望利润x(1)+(1-x)*(-1)=2x-1<0,不进入的期望利润为0,因此不进入是最优的。价格P=4P=5P=6在位者高成本时的利润267在位者低成本时的利润698因为两类在位者选择同样的价格,直观地讲,因为x<1/2,如果进入者不能从在位者的价格选择中得到新的信息,她选择不进入。因此,高成本在位者可以通过选择与低成本在位者相同的价格隐藏自己是高成本的事实,低成本在位者也没有必要批露自己是低成本的事实。混同均衡低-在位者P=4进入者不进入在位者利润:6+92、X>=1/2的情形低-在位者P=5进入者进入在位者利润:9+5最优选择在位者P=4给定在位者的后验概率和战略高-在位者P=4进入者不进入在位者利润:2+7高-在位者P=6进入者进入在位者利润:7+3最优选择在位者P=6给定进入者的后验概率和战略,低成本在位者选择p=6(认为他是高成本,进入),u1=8+5=13;选择p=5,进入者进入,u1=9+5=14;选择p=4,进入者不进入,u1=6+9=15。因此,最优战略为p=4,进入者不进入。给定进入者的后验概率和战略,高成本在位者选择p=4,进入者不进入,u1=2+7=9;选择p=5,进入者进入,u1=6+3=9;选择p=6,进入者进入,u1=7+3=10。因此p=6是最优的。如果低成本在位者选择p=5,无法将自己与高成本在位者分开,进入者将进入,但如果他选择p=4,高成本在位者不会模仿,进入者不进入,因此低成本在位者宁愿放弃3单位的现期利润换取4单位的下期利润。高成本在位者之所以不选择p=4,是因为成本太高,下阶段多获取的4单位利润不足以弥补现期5单位的损失。当x>=1/2时,精炼贝叶斯均衡为:

低成本在位者选择p=4,高成本在位者选择p=6;如果观测到p=4,进入者选择不进入;如果观测到p=6,进入者选择进入。分离均衡第二节

信号传递博弈一、信号传递博弈

(SignallingGame)劳动力市场(Spence,1973):假定一个人的生产率是100,另一个人的生产率是200;假定高能力接受教育的成本是40,低能力接受教育的成本是120;此时,教育就可以成为传递能力的信号;如果低能力接受教育的成本低于100,就会出现混同均衡。

问题的关键关键是不同类型的人传递信号的成本不同;只有成本差异足够大,才有可能传递信号;中国古代的科举制度:重要的不是所学是否有用,而是只有足够聪明的人才能通过考试。企业招聘:重学校名气,不看重所学专业;

负债与企业质量在国外,一些资金实力雄厚的公司通常也会向银行贷款。更加令人感到奇怪的是,一些好的公司,一方面自己借钱给别的公司,同时,另一方面又向银行借钱。为什么会出现这种情况呢?对于一家公司来说,负债增加会增大公司破产的可能性;但是,对于实力雄厚的公司,在同样负债比例下,其破产可能性要小一些。每个公司都会向社会吹嘘自己是好的公司,实力雄厚,但公众不会仅凭口头宣传就相信的。于是,真正好的公司通过向银行借钱来增大自己破产的可能性,令其它实际上不好的公司难以模仿。这种负债比例的增加要做到恰到好处,它既可令其它实力稍弱的公司难以模仿,又使自己能够承受。这样,公众就能识别出谁是好的公司,从而竞相购买好的公司的股票,导致公司股票价格上涨,结果这家负债公司会因其股价上涨而获资本增值,破产的可能性反而下降了。信号传递博弈是一种比较简单的但有广泛应用意义的不完全信息动态博弈。参与人:两个,信号发送者1和信号接收者2;1的类型是私人信息,2的类型是公共信息(即只有一个类型)。

信号传递博弈描述信号博弈顺序:

(1)“自然”首先选择1的类型,参与人1知道自己的类型,但参与人2不知道,只知道1属于的先验概率p=p();

(2)1在观测到类型后选择发出信号mM,M={m1,…,mJ}是信号空间;

(3)2观测到m(而非)使用贝叶斯法则从先验概率p得到后验概率,然后选择战略s;

(4)支付函数分别为u1(m,s,),u2(m,s,)。信号传递博弈的精炼贝叶斯均衡是战略组合(m*(

),s*(m))和后验概率的结合,它满足:

(P1)s*(m)极大化

u2(m,s,)(P2)m*(

)极大化u1(m,s*(m),

);

(B)

是参与人2使用贝叶斯法则从先验概率p=p()、观测到的信号m和参与人1的最优战略m*()得到的。信号传递博弈的所有可能的精练贝叶斯均衡可以划分为3类:分离均衡(Separatingequilibrium

):不同类型的发送者以1的概率选择不同的信号,或者说,没有任何类型选择与其他类型相同的信号。在分离均衡下,信号准确地揭示出类型。混同均衡(poolingequilibrium):不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率。准分离均衡(semi-separatingequilibrium):一些类型的发送者随机地选择信号,另一些类型的发送者选择特定的信号。如果m1是类型

1的最优选择,m1就不可能是

2的最优选择,并且m2一定是类型2的最优选择,即:

u1(m1,s*(m),1)>u1(m2,s*(m),1)u1(m2,s*(m),2)>u1(m1,s*(m),2)

后验概率为:分离均衡

混同均衡假定mj是均衡战略,那么:

u1(mj,s*(m),1)u1(m,s*(m),1)u1(mj,s*(m),2)u1(m,s*(m),2)

准分离均衡假定类型

1的发送者随机选择m1和m2,类型2的发送者以概率1选择m2,如果该战略组合是均衡战略,那么:

u1(m1,s*(m),1)=u1(m2,s*(m),1)u1(m1,s*(m),2)<u1(m2,s*(m),2)

是类型

1的发送者选择m1的概率

二、劳动力市场上的信号博弈考虑一个雇员和一个雇主,雇员的能力有两个取值:雇员知道自己的真实能力,雇主只知道的概率均为1/2。雇员在与雇主签约之前选择教育水平,其中代表接受教育,代表不接受教育;接受教育的成本为。教育的成本函数采取这一形式,具有什么含义?雇主在观察到雇员的教育水平后决定雇员的工资水平,雇员选择接受或者不接受;如果接受,企业的期望产出为,雇员的效用为,这种情形下企业的期望利润为。如果不接受,则。同时,假定劳动力市场是完全竞争的,从而在均衡情况下企业的预期利润为零,工资等于劳动生产率;在对称信息下,教育对于每一种不同类型的人而言没有任何价值;原因:因为此时雇主能够直接观察到雇员的能力水平;因此,此时的均衡为:在对称信息情形下,不能能力高低,雇员将选择(不接受教育),低能力雇员的工资水平为,高能力雇员的工资水平为。

对称信息下的均衡在非对称信息下,雇主只能观察到而不能观察到,因此工资只能以而定;假定为雇主观察到雇员选择教育水平时,雇主认为雇员是低能力的后验概率;精炼贝叶斯均衡意味着

1、雇员选择教育水平;

2、雇主根据观察到的得出后验概率和支付工资,使:(1)给定预期的工资水平,是能力为的雇员的最优选择;(2)给定,是与贝叶斯法则一致的,是雇主的最优选择。

非对称信息下的均衡混同均衡意味着:不同能力的雇员选择相同的教育水平,从而得到相同的工资;此时有:

1、混同均衡注意到,当雇主不知道雇员的能力类型时,企业的预期产出为。此时,由于雇主之间的竞争,使雇主的提供的工资水平等于预期产出,即;给定雇主支付的工资与教育水平无关和雇主的后验概率,雇员的最优选择是不接受教育;给定雇员选择不接受教育,雇主不能分辨雇员能力的真实类型,是最优的工资水平。假如雇主的后验概率为,此时意味着选择接受教育的雇员一定是高能力的雇员,因此上述混同均衡将不再成立;此时,给定,当雇员选择,雇主将选择,高能力的雇员将选择接受教育从而得到,而不是选择不受教育得到,我们得到一个分离均衡。

2、分离均衡这种情形下,低能力的雇员选择不接受教育,高能力的雇员选择接受教育;分离均衡雇主认为接受教育的是高能力,支付工资w=2;不接受教育的一定是低能力,因而支付工资w=1。高能力雇员接受教育:低能力雇员不接受教育:在分离均衡的情形下,教育水平便成为传递雇员能力的信号,这主要是由教育的成本函数所决定。第三节

不完全信息重复博弈与声誉在重复博弈中,我们已经提到,对于有限次的囚徒困境重复博弈,子博弈精炼纳什均衡是每个参与人选择与单阶段静态博弈纳什均衡一样的策略;对于无限次重复博弈:只要未来足够重要,合作行为可以是无限次重复博弈的子博弈精炼纳什均衡。一、完全信息重复博弈的一些结论连锁店悖论进入者在位者进入不进入默许斗争(40,50)(-10,0)(0,100)假定在位者有20个市场。直观告诉我们,如果进入者在第一个市场进入,在位者应该选择斗争,因为尽管从一个市场看,斗争是不值得的,但这样做可以遏止进入者在其他市场上的进入。唯一的子博弈精炼纳什均衡是:进入者总是进入;在位者总是默许。在重复囚徒困境博弈中,单阶段最优的均衡结果(抵赖,抵赖)没有实现;而在“连锁店悖论”中,也出现了有违想象的结果;之所以会存在这些问题,原因在于我们前面假定参与人的理性是共同知识,而且每个参与人可以选择的策略和效用函数都是共同知识。在现实的博弈中,参与人对其他参与人的支付及知识都可能存在不完全信息。例如,一个参与人对其对手支付的不确定,以及对其对手的知识(如对手是否理性、理性程度如何)的不确定等等。KMRW声誉模型证明:正是博弈中的这种不完全信息会对博弈的均衡产生影响,使得在完全信息中不可能出现的“合作”,在不完全信息情况下出现。二、KMRW声誉模型KMRW模型(1982):如果参与人对其他参与人的效用函数和战略空间的信息不完全,即使博弈重复的次数是有限的,人们也有积极性建立一个合作的声誉(reputation),合作会出现。这一结论由Kreps、Milgrom、Roberts和Wilsom在1982年的一个文章里提出(JET),因此我们称之为KMRW声誉模型。KMRW声誉模型的关键在于:假设关于参与人类型的信息是不完全信息,类型不同,预期的博弈方式也不同,所以每个参与人关心其他参与人对自己类型的推断。这样,在声誉模型中每个参与人的声誉就可概括为其他参与人关于他的类型的推断。KMRW模型的阶段博弈为:

表1阶段博弈的矩阵式描述假设参与人1为完全理性的参与人,而参与人2可能是完全理性的,也可能是非完全理性的,是否完全理性参与人2自己清楚,但参与人1不知道。在这种情况下参与人2就存在两种类型。假设参与人2是非完全理性的可能性为p,是完全理性的可能性为1-p。这里关于参与人2类型的推断即为参与人2的声誉。假设非完全理性的参与人在博弈中只会采取“一报还一报”的战略。参与人2一旦偏离了“一报还一报”战略,则“参与人是完全理性的”就成为共同知识,于是此后就不会再有参与人选择合作。在这种情况下,理性的参与人2就有动机去假扮“非完全理性”类型。

特殊之处:在重复博弈中,博弈的顺序如下:“自然”选择参与人2的类型。参与人2选择“一报还一报”战略的概率为p,可以选择任意战略(即“完全理性”)的概率为1-p。参与人2知道自己的类型,但参与人1不知道参与人2的类型;参与人1和2进行以表1所示的博弈为阶段博弈的有限重复博弈;参与人1和2在重复博弈中的支付为各个阶段博弈支付的简单之和,即不考虑贴现。1、讨论T=2的情况(合作的条件):用C表示“合作”,B表示“背叛”。与在完全信息有限重复囚徒困境中最后一个阶段的情况相同,在上述重复博弈的第二阶段即最后阶段,参与人1和完全理性的参与人2都将选择C;非完全理性的参与人2的选择依赖于参与人1在第一阶段的选择;在博弈的第一阶段,非完全理性的参与人2选择C,而完全理性的参与人2则会选择B。

三、KMRW声誉模型的分析现在只需考虑参与人1在第一阶段的选择(用X表示),他的选择将会影响到非完全理性的参与人2在第二阶段的选择。如果X=C,则参与人1在重复博弈中的期望收益为如果X=B,则参与人1在重复博弈中的期望收益为因此,如果,则参与人2将会选择C(即选择合作)。此时有p≥3/10。也就是说,如果参与人2为非完全理性的可能性不小于3/10的话,参与人1在第一阶段的最优选择为C,即选择“合作”。在以下的讨论中,假设p≥3/10。2、讨论T=3的情况(合作的条件):给定p≥3/10,如果参与人1和完全理性的参与人2在第一阶段选择C,则参与人1在第二阶段开始前对参与人2类型的推断仍为[p,1-p],所以博弈在第二、三阶段的均衡路径就与前面X=C相同。考察完全理性的参与人2的选择假设参与人1在第一阶段选择C,完全理性的参与人2选择C的收益为8+10+1=19,选择B的收益为10+1+1=12,所以,当参与人1在第一阶段选择C时,完全理性的参与人2的最优选择为C。考察参与人1的最优选择给定完全理性的参与人2在第一阶段选择C,考察参与人1的最优选择。由于我们假定p≥3/10,因此,只需考虑参与人1的以下三类战略:战略——在第一、二阶段选择C,第三阶段选择B;战略——在第一阶段选择B,第二阶段选择C,第三阶段选择B;战略——在三个阶段都选择B。给定完全理性的参与人2在第一阶段选择C,如果参与人1选择战略,参与人1的期望收益为:1、(C,C,B)

给定完全理性的参与人2在第一阶段选择C,如果参与人1选择战略,参与人1的期望收益为:2、(B,C,B)

如果下列条件满足即p≥2/10,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论