




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第七章 不完全信息动态博弈 本章讨论不完全信息动态博弈,也就是动态贝叶斯博弈。动态贝叶斯博弈与静态贝叶斯博弈在许多方面是相似的,差别只是动态贝叶斯博弈转化成的不是两阶段有同时选择的特殊不完美信息动态博弈,而是更一般的不完美信息动态博弈,因此可以直接利用不完美信息动态博弈的均衡概念进行分析。本章主要介绍信息传递条件、机制和效率方面的模型。本章分四节7.1 不完全信息动态博弈及其转换7.2 声明博弈7.3 信号博弈7.1 不完全信息动态博弈及其转换7.1.1 不完全信息动态博弈问题7.1.2 类型和海萨尼转换7.1.1 不完全信息动态博弈问题n古玩市场等各种议价博弈n不完全信息先后选择产量的寡头市
2、场产量博弈n彩礼问题n广告对消费者的影响n学历、成绩在招聘人才、员工中的作用n人寿保险前的体检n学生考试前和毕业论文中的诚信承诺7.1.2 类型和海萨尼转换与静态贝叶斯博弈基本相似,动态贝叶斯博弈也可以通过海萨尼转换,引进自然对博弈方类型的选择,转化为完全但不完美信息动态博弈。经过海萨尼转换以后,动态贝叶斯博弈与一般不完美信息动态博弈基本相似,可以直接用完美贝叶斯均衡进行分析。基本思路-不完全信息动态博弈n类型:自然首先选择参与人的类型,参与人自己知道,其他参与人不知道。-不完全信息n行动:行动有先有后,后行动者能观测到先行动者的行动,但不能观测到其类型。-动态博弈 但是,参与人是类型依存型的
3、,每个参与人的行动都传递有关自己类型的信息,后行动者可以通过观察先行动者的行动来推断自己的最优行动。先行动者预测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息。n不完全信息动态博弈过程不仅是参与人选择行动的过程,而且是参与人不断修正信念的过程。n精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精练纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。基本思路-不完全信息动态博弈n成语故事:黔之驴-驴虎博弈 老虎通过不断试探来修正对毛驴的看法,每一步行动都是给定它的信念下最优的,毛驴也是如此。最终老虎将毛驴吃掉。 基本思路-不完全信息动态博弈n市场进入博弈:参与人:在位者,进入者; T=
4、1,市场上只有一个垄断企业,在位者,一个潜在进入者考虑是否进入;如果进入者进入,两个企业进行古诺博弈,如果进入者不进入,则在位者获得垄断利润。类型:在位和有两种类型,高成本或低成本,进入者在博弈开始时只知道在位者高成本的概率是x,低成本概率是1-x。称为先验概率。对于在位者:价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8基本思路-不完全信息动态博弈 进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在位者高成本函数相同。 T=2,如果进入者已进入,在位者成本函数为共同知识,
5、若在位者为高成本,企业企业成本函数相同,对称古诺均衡产量下的价格p=5时,每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本,两个企业成本函数不同,非对称古诺均衡产量下的价格p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8进入者进入进入者进入在位者在位者进入者进入者在位者高成本在位者高成本p=5p=53 31 1在位者低成本在位者低成本p=4p=45 5-1-1N高 低在位者P=5P=6进入不进入进
6、入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在位者高成本函数相同。T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为高成本,p=5时,每个企业利润为3,扣除进入成本2,进入者利润为
7、1。若在位者为低成本,p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。基本思路-不完全信息动态博弈nT=2, 企业的行动选择是一个简单的静态博弈决策问题,但在第一阶段,情况要复杂得多:n进入者是否进入依赖于它对在位者成本函数的判断:给定在位者是高成本时,进入者进入的净利润是1,低成本时进入者的利润是-1,当只当进入者认为在位者是高成本的概率大于1/2时,进入者才选择进入。n但与静态博弈不同的是,在观测到在位者第一阶段的价格选择后,进入者可以修正对在位者成本函数的先验概率x,因为在位者的价格可能包含其成本函数的信息。价格价格P=4P=4P=5P=5P=6P=6在位者高成本时
8、的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8N高 低在位者P=5P=6进入不进入进入不进入进入不进入进入不进入(6,0)(6,0)(7,0)(6,0)(6,0)(9,0)(9,0)P=4进入者进入不进入(2,0)(2,0)进入不进入(8,0)(8,0)x1-x在位者P=5P=6P=4第一阶段第二阶段(3,1)(7,0)(3,1)(7,0)(5,-1)(9,0)(5,-1)(9,0)(3,1)(7,0)(5,-1)(9,0)市场进入博弈-2阶段不完全信息动态博弈 进入者只有一种类型:进入成本为2,如果进入,生产成本函数与在位者高成本函数相
9、同。T=2,如果进入者已进入,在位者成本函数为共同知识,若在位者为高成本,p=5时,每个企业利润为3,扣除进入成本2,进入者利润为1。若在位者为低成本,p=4,在位者利润是5,进入者成本为1,扣除进入成本2,其利润为-1。(7,0)高成本在位者不会选择p=6低成本在位者不会选择p=5基本思路-不完全信息动态博弈n如:低成本的在位者不会选择p=6,因此,如果进入者观察到在位者选择了p=6,就可以推断在位者一定是高成本,选择进入是有利可图的。预测到p=6会招致进入者进入,即使高成本的在位者也可能不会选择p=6,而招致进入者的进入。相反,低成本在位者也不会选择p=5,如果p=5会招致进入者进入的话。
10、n问题的核心是:不同的价格如何影响进入者的后验概率从而影响进入者的进入决策。价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8基本思路-不完全信息动态博弈n一个非单阶段最优价格会减少现期利润,但如果它能阻止进入者进入,从而使在位者在第二阶段得到的是垄断利润而不是古诺均衡利润,如果垄断利润与古诺均衡利润的差距足够大,则在位者有足够的信心选择一个非单阶段最优价格可能是最优的。n在均衡情况下,在位者究竟选择什么价格,不仅与成本函数有关,而且与进入者的先验概率x有关。基本思路-不完全信息动态博
11、弈 完全信息动态博弈中引入了子博弈精练纳什均衡的概念剔除那些不可置信的威胁,但是不完全信息动态博弈中,只有一个子博弈,不能将上述方法直接用于求不完全信息动态博弈的均衡解,但可以借用这一方法逻辑。 将每个信息集开始的博弈的剩余部分称为一个“后续博弈”,一个“合理”的均衡应该满足如下要求:给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈上构成贝叶斯均衡。 剔除这种不可信行为的方式是:假定参与人(在所有可能情况下)根据贝叶斯规则修正先验概念,并且,每个参与人都假定其他参与人选择的是均衡战略。基本思路-不完全信息动态博弈n精练贝叶斯均衡是贝叶斯均衡、子博弈精练均衡和贝叶斯
12、推断的结合。它要求:1、在每个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);2、给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;3、每一个参与人根据贝叶斯法则和均衡战略修正后验概率。贝叶斯法则n在日常生活中,当面临不确定时,我们对某事件发生的可能性有一个判断,然后,会根据新的信息来修正这个判断。统计学上,修正之前的判断称为“先验概率”修正后的判断称为“后验概率”n贝叶斯法则贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。贝叶斯法则n假定参与人的类型是独立分布的,参与人i有K个类型,有H个可能的行动,k和ah分别代表一
13、个特定的类型和一个特定的行动。n如果我们观察到i选择了ah,i属于k的后验概率是多少?kjjjhkkhhkkhhkpappapaobpapaob1)()()()(Pr)()(Pr贝叶斯法则人:好人(GP),坏人(BP)事:好事(GT),坏事(BT)n一个人干好事的概率等于他是好人的概率p(GP)乘以好人干好事的概率p(GT|GP),加上他是坏人的概率p(BP)乘以坏人干好事的概率p(GT|BP):ProbGT= p(GT|GP)* p(GP)+ p(GT|BP)* p(BP) 假定观测到一个人干了一件好事,那么这个人是好人的后验概率是:Pr)()(PrGTobGPpGPGTpGTGPob贝叶斯
14、法则Pr)()(PrGTobGPpGPGTpGTGPob 假定我们认为这个人是好人的先验概率是1/2,观测到他干了好事之后如何修正他的先验概率依赖于他干的好事好到什么程度:1、是一件非常好的好事,坏人绝对不可能干,则p(GT|GP)=1 p(GT|BP)=02、这是一个非常一般的好事,好人会干,坏人也会干:p(GT|GP)=1 p(GT|BP)=13、介于上述两种情况之间:好人肯定会干,但坏人可能会干也可能不会干:p(GT|GP)=1 p(GT|BP)=1/212/102/112/11PrGTGPob212/112/112/11PrGTGPob322/12/12/112/11PrGTGPob贝
15、叶斯法则Pr)()(PrGTobGPpGPGTpGTGPob 假定我们观测到他干了一件坏事,我们相信,好人绝对不会干坏事,那么可以肯定他绝对不是一个好人。 假定我们原来认为他是个坏人,但突然发现他干了一件好事,我们如何看待呢?02/12/102/10PrpBTGPob1101PrpqpGTBPob精练贝叶斯纳什均衡n精练贝叶斯均衡是均衡战略和均衡信念的结合,给定信念: 是使用贝叶斯法则从均衡战略和所观测到的行动得到的。因此,精练贝叶斯均衡是一个对应的不动点:),(),(),(),(1*1*1*1nnnnpppssssssppp信念给定战略是最优的;战略)();(*psppspss精练贝叶斯纳什
16、均衡n合并均衡n因为两类在位者选择同样的价格,直观地讲,因为x1/2,如果进入者不能从在位者的价格选择中得到新的信息,她选择不进入。因此,高成本在位者可以通过选择与低成本在位者相同的价格隐藏自己是高成本的事实,低成本在位者也没有必要批露自己是低成本的事实。精练贝叶斯纳什均衡分开均衡分开均衡 因为不同类型的在位者选择了不同的价格。低成本在位者选择了非单阶段最优价格p=4;高成本在位者选择了单阶段最优垄断价格p=6 如果低成本在位者选择p=5,无法将自己与高成本在位者分开,进入者将进入,但如果他选择p=4,高成本在位者不会模仿,进入者不进入,因此低成本在位者宁愿放弃3单位的现期利润换取4单位的下期
17、利润。 高成本在位者之所以不选择p=4,是因为成本太高,下阶段的4单位例如不足以弥补现期5单位的损失。 不完全信息带来的唯一后果是,低成本在位者损失3单位的利润,这也可以说是他为了证明自己是低成本而支付的“认证”费用。 价格价格P=4P=4P=5P=5P=6P=6在位者高成本时的利润在位者高成本时的利润2 26 67 7在位者低成本时的利润在位者低成本时的利润6 69 98 8精练贝叶斯纳什均衡n啤酒-蛋糕博弈n参与人1是一个善于打架的强者的概率是0.9,是一个不善于打架的弱者的概率是0.1,但是,即使参与人1知道自己能打赢,也不想和别人打架。如果参与人1是弱者,参与人2就想和他打架。参与人2
18、不知道参与人1的类型,但他能够观察参与人1早餐吃什么,如。参与人2知道若者喜欢以蛋糕为早餐,而强者喜欢以啤酒为早餐。 均衡:无论参与人1是什么类型,都选择啤酒做早餐,参与人2选择不打架; 7.2 声明博弈7.2.1 声明的信息传递作用7.2.2 连续型声明博弈7.2.1 声明的信息传递作用n声明声明:消费者偏好,企业新闻发布会,国家间威胁恐吓。n声明不直接影响事物、利益,但往往影响接受声明者行为,通过接受声明者行为对利益产生影响。n声明无或几乎无成本,接受者不一定采取有利于声明者的行为,因为双方利益往往不一致,因此声明的真实性没有保证。接受者不会轻易相信声明。n声明的影响取决于接受者的理解、判
19、断和反应。n当声明者和接受者利益一致或没有冲突时,声明会使接受者相信。房客声明不喜欢暖气太足房东会相信;工人提出有恐高症不适合高空作业雇主会相信;顾客喜欢甜或咸厨师会相信。工人声明自己高素质雇主并不会轻易相信因为相信。22声明博弈2, 11, 01, 0a1a2t1t2行为方行为行为方行为声明方声明方类型类型2, 12, 11, 02, 0a1a2t1t2行为方行为行为方行为声明方声明方类型类型1, 12, 01, 11, 1a1a2t1t2行为方行为行为方行为声明方声明方类型类型2, 02, 11, 01, 1a1a2t1t2行为方行为行为方行为声明方声明方类型类型2, 0离散型声明博弈模型
20、),(),(. 4,. 3. 21)()(,),(,. 1, 111, 1kiRkiSKKjijjiTiiTTiatuatuaaaAttttTttptptpttTt,行为方的得益为声明方的得益为中选合后,在可选择的行为集声明行为方在听到声明方的以不同(说假话)相同(说真话),也可可以与当然作为自己声明的类型。中选择以后,从声明方了解对自己的随机抽取,其中中以概率分布集合,抽取的方法是从类型自然抽取声明方的类型7.2.2 连续型声明博弈n声明方类型标准分布于区间0,1,即T=0,1,行为方的行动空间A= 0,1。n声明方得益函数 ,行为方得益函数 。 可以看出,当声明方类型为t时,声明方最希望的
21、行为方行为是 ,而行为方对自己最有利的行动是 。2)(),(btaatUS2)(),(taatURbtata 克劳馥和索贝尔证明,当b不等于0时,存在一种“部分合并均衡”的完美贝叶斯均衡。其基本特征是类型空间0,1被分成n个区间 ,属于同一区间类型的声明方作同样声明,在不同区间类型的声明方作不同声明。 先对n=2的简单分割进行论证。 这时类型空间分为 ,属于前一区间的声明方作一个同样声明,属于后一区间的声明方作另一同样声明。行为方听到前一种声明时根据期望利益最大化分析,确定出最佳行动是 ,后一种情况时最佳行动是 。 声明方清楚行为方的判断和决策思路,因此只有当声明方偏好 时,才会声明自己属于
22、,另一区间类似。而当行为方的行为离 越近时,声明方得益越大,反之则越小,即声明方的偏好对称于 点的。) 1 ,),), 01211nxxxx, 1 ,), 011xx 和21x2) 1(1x21x), 01xbt bt 因此,两区间分界点 必须满足,小于 的偏好 ,大于 的都偏好 那么 所代表类型的声明方最希望的行为方行为正好处于 和 的中点,即: 整理得: 由于 ,则 。即只有当 时才有可能存在两部分合并均衡,如果 ,则双方偏好相差太大,这种最低限度的信息传递也不可能存在。 21x1tu0t+b连续型声明博弈的部分合并均衡1x4121x2121x),( atUS1x1x21x2) 1(1x1
23、x21x2) 1(1x2212111xxbxbx25 . 0101x25. 0b1x25. 0b25. 0b不在均衡路径上的声明声明问题n如果声明的类型只有 和 两种,那么出现其余所有类型的声明都不在均衡路径上。采用任何其他特定类型作为共同的声明也都会有该问题。n上述问题的实质是分两个区间以后,如何作出声明的问题精确到具体类型则还是会存在对方不信的问题。n克劳鳆和索贝尔采用的一种随机选择的混合策略可以克服这种问题。21x2) 1(1x部分合并完美贝叶斯均衡的区间划分和数量n在分两个区间的部分合并均衡中,以 为分界点的两个区间长度不等长, 。前一个区间的长度是 ,后一个区间长度 ,后一个区间比前
24、一个区间长4b。 n结论对更多区间的部分合并均衡也成立。n区间, 是之一,长度为c,行为方对该区间类型最优行为 ,对后一区间 中类型的最佳行为 。两个区间交界处类型声明方偏好的行为,须在 和 间无差异:bx25 . 01bx25 . 001bx25 . 011kkxx,11,kkxx2)(1kkxx2)(1kkxx2)(1kkxx2)(1kkxx222111kkkkkxxxxbx1xn因为( + )/2 = c/2,代入上式,得: b = 化简得 = c4b。后一个区间比前一个区间长4b。xkxkxk112221xcxxkkkxkxk1xk设将类型区间0,1分n个小区间时第一个区间长度d,第二
25、个区间长度必须d + 4b,第三个区间长度必须d + 8b。n个区间总长度必须为1。d(d + 4b)d + (n1)(4b)= ndn(n1)(2b) =1 给定任何一个满足n(n1)(2b) 1的n,都存在满足上述等式的d。因此存在分n个区间的部分合并均衡的必要条件是不等式n(n1)(2b) 1必须成立。 从该关于n的一元二次不等式中可解得,部分合并均衡可以分成的最大区间个数n*(b)必须小于 。2211b结论(1)b越小,则信息交流越充分,b越大,则信息交流越少越困难;(2)当b0.25时,n*(b)=1,即信息交流完全不可能发生,因为双方的偏好差距太大;(3)当b趋向于0时,n*(b)趋向于无穷大,也即信息接近充分交流,声明方接近能声明自己的真实类型;(4)只要b不等于0,即双方偏好不完全一致,信息交流不可能真正完全。7.3 信号博弈7.3.1 行为传递的信息和信号机制7.3.2 信号博弈模型和完美贝叶斯均衡7.3.3 股权换投资7.3.4 劳动市场信号博弈7.3.1 行为传递的信息和信号机制n萨摩亚岛居民的文身;波那佩岛的山药;坦桑尼亚马萨伊族的求婚;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 初级资格计算机技术新变化试题及答案
- 茶艺知识掌握与试题及答案详解
- 妇幼健康教育的创新方式试题及答案
- 学习茶艺的艺术表现力试题及答案在考试中的应用
- 编程思维与技巧试题及答案
- 2025茶艺师考试指南及注意事项试题及答案
- 趣味全媒体运营师考试试题及答案
- 人力资源管理师人际交往试题及答案2024
- 健康管理师科学依据试题及答案2025年
- 2025年河边农业土地承包与生态循环农业合作协议
- 中小学十五五发展规划(2025-2030)
- EPLAN电气设计 课件全套 陈乾 任务1-15 初识Eplan、Eplan的安装-图纸设计与电气元件选型练习
- 电站锅炉压力容器检验规程
- 华润集团BSC6S与战略管理
- 油气集输与矿场加工
- 手术中获得性压力性损伤护理课件
- 2024可信数据服务多方数据价值挖掘体系框架
- 故事绘本一园青菜成了精
- 卫健系统消防安全培训课件
- 转氨酶升高患者护理查房
- 读后续写:万能升华主旨句3-脱险型(解析版)-新高考英语读后续写满分攻略
评论
0/150
提交评论