四川大学 骆帧博弈论与经济分析(不完全信息动态)_第1页
四川大学 骆帧博弈论与经济分析(不完全信息动态)_第2页
四川大学 骆帧博弈论与经济分析(不完全信息动态)_第3页
四川大学 骆帧博弈论与经济分析(不完全信息动态)_第4页
四川大学 骆帧博弈论与经济分析(不完全信息动态)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第六章 不完全信息动态博弈第一节 完美贝叶斯均衡引入“完美贝叶斯均衡”的目的是进一步“精炼”贝叶斯纳什均衡。就像子博弈完美的条件是为了“精炼”动态博弈中的纳什均衡一样,其是为了剔除不可置信的威胁(或者承诺)。子博弈完美不仅要求参与者的策略组合是一个纳什均衡,而且要求其在每一个子博弈中都是纳什均衡。和子博弈完美纳什均衡类似,当不完全信息博弈由静态发展到动态之后,我们也面临对原有“均衡”概念进一步精炼的要求。当然,本章中,我们不是考虑“子博弈”,而是考虑更加广义的“后续博弈(continuation game)”,和子博弈相比,它可以不是始于单节的信息集。(请联系后面“完美贝叶斯均衡”“序贯均衡”

2、的定义,思考:不同的“均衡”定义是如何以何种方式考虑到前面提到的“后续博弈”的) 和上一章一样,本章中的博弈存在“不完全信息”,这涉及到参与者行动时所依据的“信念”。因此,对均衡解的“精炼”,就必须设计对“信念”的考察。而我们对不完全信息的处理,仍然沿用上章的“海塞尼转换”,假设有个0博弈方“自然”,决定各参与人的类型但是只将类型告诉本人。于是,“不完全信息”可以转变为“不完美信息”。当然,处理“不完全信息动态”博弈中“均衡”的“精炼”问题时,子博弈完美并不能“胜任”。但是,既然“不完全信息”可以通过“海塞尼转换”转变为“不完美信息”,则对“不完全信息”的精炼方法,同样适用于“不完美信息动态博

3、弈”。(回忆前面的“完全但不完美信息动态博弈”,为什么没用考虑到进一步的“精炼”,或者说本章将要进行的对“信念”的精炼?因为前面的信息“不完美”是由于“同时选择”造成的,而且我们假定其“同时选择的子博弈”中有唯一的纳什均衡,因此,不需要对信念进行进一步的精炼)首先,我们通过以下例子来说明进一步“精炼”的必要性:(0, 0) R L R L 2 M L R 1 (1, 3) (2, 1) (0, 2) (0, 1) LRL2, 10, 0M0, 20, 1R1, 31, 3 此博弈有两个NE:(L,L)和(R,R),而且本博弈没有子博弈,因此,子博弈完美的要求自然满足。然而,(R,R)却依赖一个

4、明显不可信的威胁。为了“精炼”掉这样的NE,我们提出以下要求:要求1:在每一个信息集中,应该行动的参与者必须对博弈进行到该信息集中的哪一个节点有一个推断(信念belief)。要求2:给定参与者的推断,参与者的策略必须满足序贯理性(sequentially rational)的要求。比如上例中:p 1-p (0, 0) R L R L 2 M L R 1 (1, 3) (2, 1) (0, 2) (0, 1) 给定推断(p,1-p),L的期望得益=p1+(1-p)2=2-pR的期望得益=1-p。因此,就排除了(R,R)。这是一种特殊情况,那么,参与者的信念是否有都是“理性”的呢?定义:对于一个给

5、定的扩展式博弈中给定的均衡,如果博弈根据均衡策略进行时,将以正的概率到达的信息集,我们称是处于均衡路径上的;反之,则称为是非均衡路径上的信息集。要求3:在处于均衡路径上得信息集中,推断由贝叶斯法则及参与者的均衡策略给出。(信念要与策略相容)以上三个要求包含了完美贝叶斯均衡的主要内容,Wilson and Kreps(1982)将推断(信念)提到了和策略同等重要的位置。在这里,一个均衡不再只是一个策略组合,还包括每一个行动集的推断。In dynamic Bayesian games, an assessment consists of a strategy profile and a syste

6、m of belief . The belief i of player i is strategically consistent with the strategy profile, if it is derived from the Bayesian rule when its along the equilibrium path.The strategy i of player i is sequentially rational if given i and all other players strategy, i maximizes is (expected) payoff st

7、arting from each of his information set.An assessment , is said to be a weak perfect Bayesian equilibrium, if (1) every players belief is strategically consistent with , and (2) every players strategy is sequentially rational.但是,这并不足够。如下例所示:1 A 2, 0, 0 B 2 U D p 1-p l r l r 3 1, 2, 1 3, 3, 3 0, 1, 2

8、 0, 1, 1 12AB33lrLrU2,0,02,0,01,2,13,3,3D2,0,02,0,00,1,20,1,1 NE: (A, U, l) (A, D, l) (A, D, r) (B, U, r) 除(A, D, r)中2的策略不满足“序贯理性要求”外,其他都是WPBNE然而,只有(B, U, r)是子博弈完美的。这是因为,WPBNE并没有考虑到“均衡路径”外的情况。对于“均衡路径”外地信念的精炼,有两种思路:(1)序贯均衡sequential equilibriumLet be an assessment. Let (v) be any sequence of complete

9、ly mixed behavior strategy profile which converges to as v tends to infinitely. For each v, let v be the beliefs computed by the Bayesian rule according tov. Let be the limit of v . Then is said to be consistent with .对于上例:(2)要求4:处于均衡路径之外的信息集,推断有贝叶斯法则和可能情况下的参与者均衡策略决定。定义 满足要求1到4的策略及其推断(信念)构成博弈的完美贝叶斯均

10、衡。对于上例:但仍有缺陷:完美贝叶斯均衡要求参与者不可威胁使用始于任何信息集的严格劣策略,即使是处于均衡路径之外的。(思考子博弈完美为什么不足够?一是有可能没有子博弈,二是完美贝叶斯均衡要求给定信念,策略要最优,同时给定策略,信念要理性如此循环,逆推归纳是很难满足的。) 上述例子事实上还隐含了要求5:在均衡路径之外的推断中,如果一个节点只有在另一参与者选择始于某些信息集的严格劣策略时才能到达,则到达该节点的概率为0.第二节 信号博弈信号发送者S;信号接受者R1、自然从可行的类型集T中依据概率p(ti)赋予发送者i某种类型ti,p(ti)=12、S观察到ti后从可行的信号集M中选择信号mj发送3

11、、接受者观测到mj(但是看不到ti),从可行的行动集A中选择行动ak4、双方收益为, 简单情况T=t1,t2,M=m1,m2,A=a1,a2,prot1=pa2 a2 a2 a2 a1 a1 a1 a1 t1 t2 0 P 1-p m1 m1 m2 m2 接受者和发送者都有四个纯策略:混同(pooling)策略,如果类型多于两种还可能存在部分混同(partially pooling)或者称为准分离(semi-separating)策略。分离策略“杂合策略”(hybrid strategies),比如t1选择m1,t2却随机地选择m1或m2.如果最后的均衡中,若发送者的策略是混同的,则称为混同均

12、衡,如果是分离的,则称分离均衡。我们把前面完美贝叶斯均衡的要求替换为以下信号要求:信号要求1:在观测到M中任何信号mj后,接受者对哪些类型会发送mj有个推断:,且。信号要求2R:对M中每一mj,在给定哪些类型可能发送mj的推断条件下,接受者的行动必须使接受者的期望收益最大化。信号要求2S:对于T中的每一ti,在给定接受者策略的条件下,发送者选择信号必须使发送者的收益最大化。信号要求3:对于每一M中的mj,如果T中存在ti使得,则接受者在对应于mj的信息集中所持有的信念取决于贝叶斯法则和发送者策略:其中,Tj是根据S的策略,所有可能选择mj的ti的集合。定义 信号博弈中一个纯策略完美贝叶斯均衡为

13、一对策略和以及信念,满足上述信号要求1,2S,2R,3.(以上定义中Tj不是空集,说明其信息要求没有考虑“均衡路径”之外的信念,但是后面的例子中,我们在分析中仍然考虑了均衡路径之外的信息集,注意是怎么分析的)例子:1-q 1-p p d d d d u u u u t1 t2 0 0.5 0.5 L L R R 1,3 4,0 2,4 0,1 2,1 0,0 1,0 1,2 q 只考虑纯策略1、混同于L2、混同于R3、分离t1选L4、分离t1选R1-q 1-p p d d d d u u u u t1 t2 0 0.5 0.5 L L R R 3,2 2,0 1,0 1,1 1,0 0,1 2

14、,1 0,0 q 考虑混同均衡L,L要求5通常思路:给出S的策略根据贝叶斯法则和先验概率计算看到某信号后的“推断(信念)” R根据该推断选择最大化自己期望得益的行动给定R的推断和行动,考察S的策略是否是最优的,即有没有偏离的动机(某些情况下要考虑非均衡路径上的选择)。这背后的纳什均衡的思路包括了对信念的考察,简单说,给定策略,该信念是理性的,给定该信念,该策略是最优的,那么,给定该策略和信念组合,没有人会有偏离的动机。第三节 信号博弈应用1、劳动力市场上的教育信号(1)没有信号的情形否 否 聘 聘 好0.1 差0.9 0 10,20 5,0 10,-3 5,0 (2)信号成本c=2,C=6差0

15、.9 好0.1 N N N Y Y N Y Y 0 D D N N 10-c,20 5-c,0 10,20 5,0 10-C,-3 5-C,0 10,-3 5,0 差0.9 好0.1 N N N Y Y N Y Y 0 D D N N 8,20 3,0 10,20 5,0 4,-3 -1,0 10,-3 5,0 (3)Spence1973、1974模型A、自然决定工人的生产能力=H or L,prob=H=qB、工人知道自己的能力,并选择一个教育水平e0C、两个企业看到教育水平e,并开出工资水平wD、工人接受着两个工资中较高的一个,若相等则随机选择工人的收益,其中为能力的工人获得e教育的成本。

16、企业收益为,其中为能力且获得e教育的工人的产出,产出不仅取决于能力,教育水平也能提高工人的生产能力。不考虑教育的时间持续性以及由此带来的动态选择问题。关键假设1:对于,有关键假设2:竞争使得企业的期望利润为0.即信息要求2R变为,给定观测到e之后的推断,开出的工资要等于工人的期望产出: (1)完全信息条件下:工人可以获得工资,他选择e,最大化以下问题:工人能力为私人信息的时候:A、 低能力冒充高能力的成本过高,及时获得高工资也不足以补偿:B、 低能力的人有动机冒充高能力的人,即我们几种均衡的例子:(i)两种类型的工人都选择单一的教育水平ep 给定工人的信息策略,经验概率等于先验概率,即,于是,

17、工资等于 (2)为完成均衡条件,我们还必须给出其他教育水平的w,并考察两种工人混同于ep是否是最优选择。比如我们可以考虑以下推断:虽然这个推断显得不那么合理,并且在后面我们附加条件会将其“精炼”掉,但是信号博弈的三个条件对非均衡路径上的信念并没有任何规定。根据该推断,企业的工资为:由下图可知,在给定上述推断和策略下,两种类型的工人混同于ep是最优选择。 从该图还可构造出更多的完美贝叶斯均衡。(ii)分离均衡最自然而然的分离均衡给定该策略,于是工资为,为完成均衡的考察,还必须给出其他教育水平的推断和工资,并证明在这些条件下,工人采取该分离策略是最优的。比如:则若“假冒”成本太高,即,则该策略和信

18、念组合下,该分离均衡对低能力的工人也是最优的。但是,如果不满足,则低能力的工人会假冒高能力的工人使得该均衡不成立,那么高能力的工人必须选择更高的教育水平(牺牲福利水平)来证明自己的能力:当然,还有更多的分离均衡。(iii)杂合均衡:一种类型选择某一教育水平,另一类型随机地选择是否混同。 假设高能力的工人选择eh,低能力的以概率选择eh或者以概率(1-)选择eL。给定该策略,有以下推断:,。由可得,那么根据该推断和策略,低能力工人选择“分离”信号时,最大化自己得益,因此。下面确定eh:低能力工人对两种策略无差异: (3)企业期望得益为0: (4)未知数:给定,若(3)所得则可通过(4)确定唯一的

19、,否则该均衡不存在。第四节 空谈博弈特征:信号不需要成本,也无义务和约束空谈在Spence模型中不起作用,为什么?空谈起作用的三个条件:1、自然从可行的类型集T中依据概率p(ti)赋予发送者i某种类型ti,p(ti)=12、S观察到ti后从可行的信号集M中选择信号mj发送3、接受者观测到mj(但是看不到ti),从可行的行动集A中选择行动ak4、双方收益为,双方的得益与信号无关,总存在混同均衡:1、 两种类型例子:2、连续类型类型T=0, 1切服从均匀分布,M=T,A=0, 1下面是赠送的团队管理名言学习,不需要的朋友可以编辑删除!谢谢!1、沟通是管理的浓缩。2、管理被人们称之为是一门综合艺术-

20、“综合”是因为管理涉及基本原理、自我认知、智慧和领导力;“艺术”是因为管理是实践和应用。3、管理得好的工厂,总是单调乏味,没有任何激动人心的事件发生。4、管理工作中最重要的是:人正确的事,而不是正确的做事。5、管理就是沟通、沟通再沟通。6、管理就是界定企业的使命,并激励和组织人力资源去实现这个使命。界定使命是企业家的任务,而激励与组织人力资源是领导力的范畴,二者的结合就是管理。7、管理是一种实践,其本质不在于“知”而在于“行”;其验证不在于逻辑,而在于成果;其唯一权威就是成就。8、管理者的最基本能力:有效沟通。9、合作是一切团队繁荣的根本。10、将合适的人请上车,不合适的人请下车。11、领导不

21、是某个人坐在马上指挥他的部队,而是通过别人的成功来获得自己的成功。12、企业的成功靠团队,而不是靠个人。13、企业管理过去是沟通,现在是沟通,未来还是沟通。14、赏善而不罚恶,则乱。罚恶而不赏善,亦乱。15、赏识导致成功,抱怨导致失败。16、世界上没有两个人是完全相同的,但是我们期待每个人工作时,都拥有许多相同的特质。17、首先是管好自己,对自己言行的管理,对自己形象的管理,然后再去影响别人,用言行带动别人。18、首先要说的是,CEO要承担责任,而不是“权力”。你不能用工作所具有的权力来界定工作,而只能用你对这项工作所产生的结果来界定。CEO要对组织的使命和行动以及价值观和结果负责。19、团队

22、精神是从生活和教育中不断地培养规范出来的。研究发现,从小没有培养好团队精神,长大以后即使天天培训,效果并不是很理想。因为人的思想是从小造就的,小时候如果没有注意到,长大以后再重新培养团队精神其实是很困难的。20、团队精神要从经理人自身做起,经理人更要带头遵守企业规定,让技术及素质较高的指导较差的,以团队的荣誉就是个人的骄傲启能启智,互利共生,互惠成长,不断地逐渐培养员工的团队意识和集体观念。21、一家企业如果真的像一个团队,从领导开始就要严格地遵守这家企业的规章。整家企业如果是个团队,整个国家如果是个团队,那么自己的领导要身先士卒带头做好,自己先树立起这种规章的威严,再要求下面的人去遵守这种规

23、章,这个才叫做团队。22、已所不欲,勿施于人。23、卓有成效的管理者善于用人之长。24、做企业没有奇迹而言的,凡是创造奇迹的,一定会被超过。企业不能跳跃,就一定是(循着)一个规律,一步一个脚印地走。25、大成功靠团队,小成功靠个人。26、不善于倾听不同的声音,是管理者最大的疏忽。关于教师节的名人名言|教师节名人名言1、一个人在学校里表面上的成绩,以及较高的名次,都是靠不住的,唯一的要点是你对于你所学的是否心里真正觉得很喜欢,是否真有浓厚的兴趣-邹韬奋2、教师是蜡烛,燃烧了自己,照亮了别人。-佚名3、使学生对教师尊敬的惟一源泉在于教师的德和才。-爱因斯坦4、三人行必有我师焉;择其善者而从之,其不

24、善者而改之。-孔子5、在我们的教育中,往往只是为着实用和实际的目的,过分强调单纯智育的态度,已经直接导致对伦理教育的损害。-爱因斯坦6、举世不师,故道益离。-柳宗元7、古之学者必严其师,师严然后道尊。-欧阳修8、教师要以父母般的感情对待学生。-昆体良9、机会对于不能利用它的人又有什么用呢?正如风只对于能利用它的人才是动力。-西蒙10、一日为师,终身为父。-关汉卿11、要尊重儿童,不要急于对他作出或好或坏的评判。-卢梭12、捧着一颗心来,不带半根草去。-陶行知13、君子藏器于身,待时而动。-佚名14、教师不仅是知识的传播者,而且是模范。-布鲁纳15、教师是人类灵魂的工程师。-斯大林16、学者必求师,从师不可不谨也。-程颐17、假定美德既知识,那么无可怀疑美德是由教育而来的。-苏格拉底18、好花盛开,就该尽先摘,慎莫待美景难再,否则一瞬间,它就要凋零萎谢,落在尘埃。-莎士比亚19、养体开智以外,又以德育为重。-康有为20、无贵无贱,无长无少,道之所存,师之所存也。-韩愈21、谁若是有一刹那的胆怯,也许就放走了幸运在这一刹那间对他伸出来的香饵。-大仲马22、学贵得师,亦贵得友。-唐甄23、故欲改革国家,必先改革个人;如何改革个人?唯一方法,厥为教育。-张伯苓24、为学莫重于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论