高级微观14贝叶斯均衡_第1页
高级微观14贝叶斯均衡_第2页
高级微观14贝叶斯均衡_第3页
高级微观14贝叶斯均衡_第4页
高级微观14贝叶斯均衡_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1第十二章 贝叶斯纳什均衡及其精炼 第一节第一节 不完全信息博弈与贝叶斯纳什均衡不完全信息博弈与贝叶斯纳什均衡 第二节第二节 精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡 第三节第三节 信号传递博弈信号传递博弈 2第一节第一节 不完全信息博弈与贝叶斯纳什均衡不完全信息博弈与贝叶斯纳什均衡 一、不完全信息博弈一、不完全信息博弈 完全信息博弈指博弈中的参与人对所有其他参与人的支付完全信息博弈指博弈中的参与人对所有其他参与人的支付(偏好)函数有完全的了解,并且支付函数是所有参与人的共同(偏好)函数有完全的了解,并且支付函数是所有参与人的共同知识(知识(common knowledgecommon knowl

2、edge)的博弈。反之,不满足完全信息博弈)的博弈。反之,不满足完全信息博弈假设的博弈称为不完全信息博弈。假设的博弈称为不完全信息博弈。3 二、海萨尼转换二、海萨尼转换 在博弈中,信息不完全使得博弈参与人必须预测其他参与在博弈中,信息不完全使得博弈参与人必须预测其他参与人的类型。至于人的类型。至于“类型类型”概念,以两个企业博弈的例子说明。概念,以两个企业博弈的例子说明。假设参与人假设参与人1 1为在位者企业,参与人为在位者企业,参与人2 2为进入者企业。进入者依为进入者企业。进入者依据在位者的生产成本高低选择是否进入该行业,高则进,低则据在位者的生产成本高低选择是否进入该行业,高则进,低则不

3、进。但是进入者不知道在位者的成本是高还是低。因此,进不进。但是进入者不知道在位者的成本是高还是低。因此,进入者必须预测在位者的成本入者必须预测在位者的成本“类型类型”,究竟是高成本的还是低,究竟是高成本的还是低成本的。海萨尼提出通过引入成本的。海萨尼提出通过引入“自然自然”概念解决这个问题。由概念解决这个问题。由自然实现行动,确定其他参与人的类型,从而转换成我们已讨自然实现行动,确定其他参与人的类型,从而转换成我们已讨论过的扩展式动态博弈结构。即通过自然选择类型,实现不完论过的扩展式动态博弈结构。即通过自然选择类型,实现不完全信息向完全信息的转换,我们称之为海萨尼转换。全信息向完全信息的转换,

4、我们称之为海萨尼转换。 4不完全信息意味着,至少有一个参与人拥有多种类型不完全信息意味着,至少有一个参与人拥有多种类型。用i表示参与人表示参与人i的一个特定类型,的一个特定类型,i表示参与人表示参与人i所有可能类型的所有可能类型的集 合 ,集 合 ,ii, 并 假 定并 假 定nii1取 自 某 个 客 观 的 分 布 函 数取 自 某 个 客 观 的 分 布 函 数),(1nP。 为简化假定只有参与人为简化假定只有参与人i本人观察到自己的类型本人观察到自己的类型i,其他人都不能察到其他人都不能察到i。我们假定分布函数我们假定分布函数),(1nP是所有参与是所有参与人的共同知识,在博弈开始时,

5、所有参与人关于自然行动的信念人的共同知识,在博弈开始时,所有参与人关于自然行动的信念是相同的。是相同的。 我们用我们用),(111niii表示除表示除i之外的所有参与之外的所有参与人的类型组合,这样,人的类型组合,这样,),(),(1iin。定义定义)(iiip为为参与人参与人i的条件概率即给定参与人的条件概率即给定参与人i属于类型属于类型i的条件下, 其他参的条件下, 其他参与人属于与人属于i的概率。的概率。 5根据条件概率规则:根据条件概率规则: iiiiiiiiiiiiiiiippppp),(),()(),()( (12.1) 这里,这里,)(iip是边缘概率。如果类型的分布是独立的,是

6、边缘概率。如果类型的分布是独立的,)()(iiiiipp。 6三、战略表达式三、战略表达式 不完全信息静态博弈又称静态贝叶斯博弈。如同在完全信息静不完全信息静态博弈又称静态贝叶斯博弈。如同在完全信息静态博弈中一样, 静态贝叶斯博弈的所有参与人同时行动, 参与人态博弈中一样, 静态贝叶斯博弈的所有参与人同时行动, 参与人i的战略空间的战略空间iS等同于他的行动空间等同于他的行动空间iA。 所不同的是, 参与人所不同的是, 参与人i的的行动空间行动空间iA可能依赖于他的类型可能依赖于他的类型i,即行动空间是类型依存的。即行动空间是类型依存的。 用用)(iiA表示参与人表示参与人i的类型依存行动空间

7、,的类型依存行动空间,)()(iiiiAa表示表示i的一个特定行动。类似地,参与人的一个特定行动。类似地,参与人i的支付函数也是类型依存的。的支付函数也是类型依存的。我们用我们用),(iiiiaau表示参与人表示参与人i的效用函数。于是,可以用下列战的效用函数。于是,可以用下列战略式表述静态贝叶斯博弈。其定义为:略式表述静态贝叶斯博弈。其定义为: 7n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间人静态贝叶斯博弈的战略式表述包括:参与人的类型空间n,1, 条件概率条件概率npp,1, 类型依存战略空间类型依存战略空间)(.),(11nnAA,和类型依存支付函数和类型依存支付函数);,(,)

8、,;,(1111nnnnaauaau。 参与人参与人i知知道自己的类型道自己的类型ii,条件概率条件概率)(iiiipp描述给定自己属描述给定自己属于于i的情况下,参与人的情况下,参与人i有关其他参与人类型有关其他参与人类型ii的不确定性。不确定性。,;,;,;.,1111nnnnuuppAAG代表这个博弈。代表这个博弈。 静态贝叶斯博弈的时间顺序如下:静态贝叶斯博弈的时间顺序如下: (1 1)自然选择类型向量自然选择类型向量),(1n,其中其中ii,参与人参与人i观测到观测到i,但参与人但参与人)( ij 只知道只知道)(jjjp,观测不到观测不到i。 (2 2)n个参与人同时选择行动个参与

9、人同时选择行动),(1naaa,其中其中iiAa 。 (3 3)参与人参与人i得到得到);,(1iniaau。 8给出四点讨论给出四点讨论 (1 1)如果所有参与人的类型空间只包含一个元素,即对于所)如果所有参与人的类型空间只包含一个元素,即对于所有的有的i,i, 不完全信息静态博弈就退化为完全信息静态博弈,不完全信息静态博弈就退化为完全信息静态博弈,所以后者是前者的一个特例。所以后者是前者的一个特例。 (2 2)我们给出参与人类型相互独立的意义在于其保证不完全)我们给出参与人类型相互独立的意义在于其保证不完全信息的存在。信息的存在。 (3 3)准确地说,其他参与人不知道参与人)准确地说,其他

10、参与人不知道参与人i的支付函数是指,的支付函数是指,其 不 知 道 参 与 人其 不 知 道 参 与 人i的 支 付 函 数 是的 支 付 函 数 是);,(1iniaau, 还 是还 是);,(1iniaau,这里这里ii,ii,ii。 (4 4)参与人)参与人i的期望效用函数为的期望效用函数为: ),);(),()(iiiiiiiiiiiaaupvi) 9四、贝叶斯纳什均衡四、贝叶斯纳什均衡 n人不完全信息静态博弈人不完全信息静态博弈 ,;,;,;.,1111nnnnuuppAAG 的纯战略贝叶斯纳什均衡是一个类型依存战略组合的纯战略贝叶斯纳什均衡是一个类型依存战略组合niiia1)(,

11、其其中每个参与人中每个参与人i在给定自己类型在给定自己类型i和其他参与人类型依存战略和其他参与人类型依存战略)(iia的情况下最大化自己的期望效用函数的情况下最大化自己的期望效用函数iv。 换言之,战略组合换言之,战略组合)(,),(11nnaaa 是一个贝叶斯纳什是一个贝叶斯纳什均衡,如果对于所有的均衡,如果对于所有的i,)(iiiAa,有:有: ),);(),()(maxarg)(iiiiiiiiiiaiiaaupai (12.3) 10五、一个例子:不完全信息古诺模型五、一个例子:不完全信息古诺模型 1.1.基本假定。参与人的类型是成本函数,假定逆需求函数为基本假定。参与人的类型是成本函

12、数,假定逆需求函数为21qqaP,令令ic为企业企业i的单位成本,那么企业的利润函数为:的单位成本,那么企业的利润函数为: )(21iiicqqaq,2 , 1i (12.412.4) 假定企业假定企业 1 1 只有一种类型,企业只有一种类型,企业 2 2 有两种类型,企业有两种类型,企业 1 1 的单位的单位成本成本1c是共同是共同知识,企业知识,企业 2 2 的单位成本是私人信息。企业的单位成本是私人信息。企业 2 2 知道自知道自己的真实成本类型, 而企业己的真实成本类型, 而企业 1 1 只知道只知道Lcc22的概率为的概率为,Hcc22的的概率为概率为)1 (;是共同知识。是共同知识

13、。 为了简化讨论,进一步假定为了简化讨论,进一步假定2a,11c,432Lc,452Hc,21。 112.2.均衡求解。均衡求解。 给定企业给定企业 2 2 知道企业知道企业 1 1 的成本, 企业的成本, 企业 2 2 将选择将选择2q以最大化利润以最大化利润函数:函数:)(2122qqtq,其中其中4543 at或或4345 at,依赖于企业依赖于企业 2 2 的实际成本。 由一阶条件, 得到企业的实际成本。 由一阶条件, 得到企业 2 2 的反应函数为:的反应函数为: )(21);(112qttqq (12.612.6) 这意味着,企业这意味着,企业 2 2 的最优产量不仅依赖于企业的最

14、优产量不仅依赖于企业 1 1 的产量,而且的产量,而且依赖于自己的成本 (或类型) 。依赖于自己的成本 (或类型) 。Lq2为45t时企业时企业 2 2 的最优产量,的最优产量,Hq2为为43t时企业时企业 2 2 的最优产量。那么,的最优产量。那么, )45(2112qqL,)43(2112qqH (12.712.7) 12企业企业 1 1 不知道企业不知道企业 2 2 的真实成本,进而无法判断企业的真实成本,进而无法判断企业 2 2 的反应的反应函数是函数是Lq2还是还是Hq2,因此企业因此企业 1 1 将选择将选择1q最大化下面的期望效用函最大化下面的期望效用函数:数: )1 (21)1

15、 (212112111HLqqqqqqE (12.812.8) 解最优化的一阶条件,得到企业解最优化的一阶条件,得到企业 1 1 的反应函数为:的反应函数为: )1 (21)21211 (212221EqqqqHL (12.912.9) 均衡意味着两个反应函数同时成立,解两个反应函数得到贝叶均衡意味着两个反应函数同时成立,解两个反应函数得到贝叶斯均衡为:斯均衡为: 311q;24112Lq,2452Hq 133.3.结论。结论。 比较不完全信息下贝叶斯均衡与完全信息下的纳什均衡,会比较不完全信息下贝叶斯均衡与完全信息下的纳什均衡,会有助于我们对二者区别与联系的理解。完全信息下,如果企业有助于我

16、们对二者区别与联系的理解。完全信息下,如果企业 2 2的成本是的成本是432c, 而且企业而且企业 1 1 知道知道432c, 则反应函数分别为:则反应函数分别为: )45(21)1 (211221qqqq (12.1012.10) 纳什均衡产量为:纳什均衡产量为:411NELq,212NELq,其中下标中的其中下标中的L表表示企业示企业 2 2 为低成本的情况。为低成本的情况。 14类似可以得到,当类似可以得到,当452c时,纳什均衡产量为:时,纳什均衡产量为:1251NEHq,612NEHq。因此,我们有:因此,我们有: 314111qqNEL,24112122LNELqq 3112511

17、qqNEH,2456122HNEHqq 在不完全信息情况下,低成本企业的产量相对较低,而高成本在不完全信息情况下,低成本企业的产量相对较低,而高成本企业的产量却相对较高。其原因在于,企业企业的产量却相对较高。其原因在于,企业 1 1 不知道企业不知道企业 2 2 的真实的真实类型, 因此只能生产预期的最优产量, 追求期望效用函数的最大化。类型, 因此只能生产预期的最优产量, 追求期望效用函数的最大化。图图 12121 1 对上述讨论给出了一个直观的表示。对上述讨论给出了一个直观的表示。 1516第二节第二节 精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡 一、基本思想一、基本思想 精炼贝叶斯均衡是不完全

18、信息动态博弈均衡的基本均衡概念,精炼贝叶斯均衡是不完全信息动态博弈均衡的基本均衡概念,它是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡和海萨尼的不它是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡和海萨尼的不完全信息静态博弈贝叶斯均衡的结合。精炼贝叶斯均衡要求,给定完全信息静态博弈贝叶斯均衡的结合。精炼贝叶斯均衡要求,给定有关其他参与人的类型的信念,参与人的战略在每一个信息集开始有关其他参与人的类型的信念,参与人的战略在每一个信息集开始的的“后续博弈后续博弈”上构成贝叶斯均衡;并且,在所有可能的情况下,上构成贝叶斯均衡;并且,在所有可能的情况下,参与人使用贝叶斯法则修正有关其他参与人类型的信念。参与

19、人使用贝叶斯法则修正有关其他参与人类型的信念。 精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合。它要求:的结合。它要求: (1 1)在每一个信息集上,决策者必须有一个定义在属于该信)在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);息集的所有决策结上的一个概率分布(信念); (2 2)给定该信息集上的概率分布和其他参与人的后续战略,)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;参与人的行动必须是最优的; (3 3)每一个参与人根据贝叶斯法则和均衡战略修正后验

20、概率。)每一个参与人根据贝叶斯法则和均衡战略修正后验概率。17二、贝叶斯法则二、贝叶斯法则 贝叶斯法则正是根据新的信息从先验概率得到后验概率的基本贝叶斯法则正是根据新的信息从先验概率得到后验概率的基本方法。方法。 首先假定参与人的类型是独立分布的,首先假定参与人的类型是独立分布的,i有有K个可能的类型,个可能的类型,有有H个可能的行动。个可能的行动。k和和ha分别代表一个特定的类型和一个特定分别代表一个特定的类型和一个特定的行动,假定的行动,假定i属于类型属于类型k的先验概率是的先验概率是0)(kp,1)(1Kkkp;给定给定i属于属于k,i选择选择ha的条件概率为的条件概率为)(khap,1

21、)(hkhap。那么那么i选择选择ha的边缘概率为:的边缘概率为: 18KkkkhKKhhhpappappapaob111)()()()(,)()(Pr (12.1112.11) 即参与人即参与人i选择行动选择行动ha的“总”概率是每一种的“总”概率是每一种i选择选择ha的条件概的条件概率率)(khap的加权平均, 权数是他属于每种类型的加权平均, 权数是他属于每种类型k的先验概率的先验概率)(kp。 如果观察到如果观察到i选择了选择了ha,那么那么i属于类型属于类型k的后验概率可以记为的后验概率可以记为Prhkaob,表示给定表示给定ha的情况下的情况下i属于类型属于类型k的概率。根据概率的

22、概率。根据概率公式:公式: PrPr)()(,Prhhkkkhkhaobaobpapaob (12.1212.12) 19即即i属于属于k并选择并选择ha的联合概率等于的联合概率等于i属于属于k的先验概率的先验概率乘以乘以k类型的参与人选类型的参与人选择ha的概率,或等于的概率,或等于i选择选择ha的总概率的总概率乘以给定乘以给定ha的情况下的情况下i属于属于k的后验概率。的后验概率。 Kjjjhkkhhkkhhkpappapaobpapaob1)()()()(Pr)()(Pr (12.1312.13) 精炼贝叶斯均衡假定参与人根据贝叶斯法则修正先验概率。精炼贝叶斯均衡假定参与人根据贝叶斯法则

23、修正先验概率。不过贝叶斯法则要求不过贝叶斯法则要求 0Prhaob, 即参与人即参与人 i i 必须以正的概率选择必须以正的概率选择ha,否则后验概率没有定义。如果否则后验概率没有定义。如果 0Prhaob,我们允许在我们允许在00,11区间取任何值,只要该取值与均衡战略相容。在动态博弈中,区间取任何值,只要该取值与均衡战略相容。在动态博弈中, 0Prhaob对应着非均衡路径上的信息集。对应着非均衡路径上的信息集。 20三、精炼贝叶斯均衡三、精炼贝叶斯均衡 假定有假定有n个参与人,参与人个参与人,参与人i的类型是的类型是ii,i是私人信息,是私人信息,)(iiip是属于类是属于类型i的参与人的

24、参与人i认为其他认为其他1n个参与人属于类型个参与人属于类型),(111niii的先验概率的先验概率。 令令iS是参与人是参与人i的战略空间,的战略空间,iiSs 是 一 个 依 赖 于 类 型是 一 个 依 赖 于 类 型i的 特 定 的 战 略的 特 定 的 战 略 。),(111hnhihihhiaaaaa是在第是在第h个信息集个信息集i观察到其他观察到其他1n个个参与人的行动组合,参与人的行动组合,它是战略组合它是战略组合),(111niiisssss所规定所规定的行动的一部分。的行动的一部分。)(hiiiap是在观察到是在观察到hia的情况下,参与人的情况下,参与人i认认为其他为其他

25、1n个参与人属于类型个参与人属于类型),(111niii的后验概的后验概率。率。ip是所有后验概率是所有后验概率)(hiiiap的集合,的集合,),(iiiissu表示参与人表示参与人i的效用函数。于是,精炼贝叶斯均衡可以定义如下:的效用函数。于是,精炼贝叶斯均衡可以定义如下: 21精炼贝叶斯均衡是一个战略组合精炼贝叶斯均衡是一个战略组合)(,),()(11nnsss和一和一个后验概率组合个后验概率组合),(1nppp,满足:满足: (P)(P)对于所有参与人对于所有参与人i,在每一个信息集在每一个信息集h, );,()(maxarg),(iiiihiiisiiissuapssii (B)(B

26、)(hiiiap是使用贝叶斯法则从先验概率是使用贝叶斯法则从先验概率)(iiip,观测到的观测到的hia和最和最优战略优战略)(is得到的(在可能的情况下) 。得到的(在可能的情况下) 。 对上述定义给出五点讨论对上述定义给出五点讨论 (1)(1)(P)(P)是精炼条件是精炼条件。 即给定其他参与人的战略即给定其他参与人的战略),(111niiisssss和参与人和参与人i的后验概率的后验概率)(hiiiap,每个参与人每个参与人i的战略在所有从信息集的战略在所有从信息集h开始开始的后续博弈上都是最优的,或者说所有参与人都是序贯理性的的后续博弈上都是最优的,或者说所有参与人都是序贯理性的。 2

27、2(2 2)(B)(B)对应的是贝叶斯法则的应用。对应的是贝叶斯法则的应用。 如果参与人是多次行动的,修正概率涉及到贝叶斯法则的重复如果参与人是多次行动的,修正概率涉及到贝叶斯法则的重复运用。应该注意,战略作为行动规则而非行动本身,它是不可观察运用。应该注意,战略作为行动规则而非行动本身,它是不可观察的,因此的,因此参与人参与人i只能根据观测到的只能根据观测到的),(111niiiaaaaa修正修正概 率 , 但 他 假 定 所 观 测 到 的 行 动 是 最 优 战 略概 率 , 但 他 假 定 所 观 测 到 的 行 动 是 最 优 战 略),(111niiisssss规定的行动。规定的行

28、动。 限制条件“在可能的情况下”的含义是:如果限制条件“在可能的情况下”的含义是:如果ia不是均衡战不是均衡战略下的行动,观测到的略下的行动,观测到的ia是一个零概率事件,此时贝叶斯法则对是一个零概率事件,此时贝叶斯法则对后验概率没有定义,任何后验概率没有定义,任何 1 , 0 )(hiiiap都是允许的,只要保证与都是允许的,只要保证与均衡战略相容。均衡战略相容。 23(3 3)上述定义的要点)上述定义的要点是,精炼贝叶斯均衡是均衡战略和均衡是,精炼贝叶斯均衡是均衡战略和均衡信念的结合:给定信念信念的结合:给定信念),(1nppp,战略战略),(1nsss是最优是最优的;给定战略的;给定战略

29、),(1nsss,信念信念),(1nppp是使用贝叶斯法是使用贝叶斯法则从均衡战略和所观测到的行动得到的。因此精炼贝叶斯均衡是一则从均衡战略和所观测到的行动得到的。因此精炼贝叶斯均衡是一个对应的不动点:个对应的不动点:)(spss;)(pspp (12.1412.14) (4 4)需要特别强调,)需要特别强调,因为精炼贝叶斯均衡是一个不动点,后因为精炼贝叶斯均衡是一个不动点,后验概率依赖于战略,战略依赖于后验概率。由于我们无法知道先行验概率依赖于战略,战略依赖于后验概率。由于我们无法知道先行动者的选择,也就无法知道后行动者的选择,因此完全信息博弈中动者的选择,也就无法知道后行动者的选择,因此完

30、全信息博弈中采用的逆向归纳法(采用的逆向归纳法(backward inductionbackward induction)求解精炼均衡的方法并)求解精炼均衡的方法并不适用。我们必须使用前向法(不适用。我们必须使用前向法(forward mannerforward manner)进行贝叶斯修正。)进行贝叶斯修正。 (5 5)注意,)注意,我们在此只写出纯战略均衡,上述定义也适用于我们在此只写出纯战略均衡,上述定义也适用于混合战略(行为战略)概念。混合战略(行为战略)概念。 24第三节第三节 信号传递博弈信号传递博弈一、基本理论分析框架一、基本理论分析框架 1.1.基本假定。基本假定。博弈中有两个

31、参与人博弈中有两个参与人,2 , 1i;参与人参与人 1 1 称为信称为信号发送者, 参与人号发送者, 参与人 2 2 称为信号接收者。 参与人称为信号接收者。 参与人 1 1 的类型是私人信息,的类型是私人信息,参与人参与人 2 2 的类型是公共信息。的类型是公共信息。 2.2.行动顺序。行动顺序。该博弈的行动顺序如下:该博弈的行动顺序如下: ( 1 1) “ 自 然 ” 首 先 选 择 参 与 人) “ 自 然 ” 首 先 选 择 参 与 人 1 1 的 类 型的 类 型,其 中其 中,1K是参与人是参与人 1 1 的类型空间,参与人的类型空间,参与人 1 1 知道知道,但参与人但参与人2

32、 2 不知道不知道,只知道参与人只知道参与人 1 1 属于属于的先验概率的先验概率)(pp ,1)(kkp。只有参与人只有参与人 1 1 的类型为私人信息,所以可以将表示的类型为私人信息,所以可以将表示参与人的下标参与人的下标 i 省去省去不写。 25(2 2)参与人)参与人 1 1 在观测到类型在观测到类型后选择发出信号后选择发出信号Mm(而不是(而不是类型类型) ,这里) ,这里,1JmmM是信号空间。是信号空间。 (3 3)参与人)参与人 2 2 观测到参与人观测到参与人 1 1 发出的信号发出的信号m后,由贝叶斯法后,由贝叶斯法则从先验概率则从先验概率)(pp 得到后验概率得到后验概率

33、)(mpp,然后选择行动然后选择行动Aa,这里这里,1HaaA是参与人是参与人 2 2 的行动空间。的行动空间。 (4 4)两个参与人的支付函数分别为)两个参与人的支付函数分别为),(1amu和),(2amu。 图图 12122 2 给出了一个简单的信号传递博弈的扩展式表述,其中给出了一个简单的信号传递博弈的扩展式表述,其中2HJK,)(11mpp,)(21mpq。图中省略了支付向量。图中省略了支付向量。 26273.3.定义。定义。令令)(m是参与人是参与人 1 1 类型依存的信号战略,类型依存的信号战略,)(ma是参是参与人与人 2 2 的行动战略, (这里,仍然允许混合战略的存在,如参与

34、人的行动战略, (这里,仍然允许混合战略的存在,如参与人 1 1以某种概率随机地选择不同信号,参与人以某种概率随机地选择不同信号,参与人 2 2 以某种概率随机地选择以某种概率随机地选择行动) 。信号传递博弈精炼贝叶斯均衡可以定义如下:行动) 。信号传递博弈精炼贝叶斯均衡可以定义如下: 信号传递博弈的精炼贝叶斯均衡是战略组合信号传递博弈的精炼贝叶斯均衡是战略组合)(),(mam和和后验概率后验概率)(mp的结合,其满足:的结合,其满足: (P(P1 1) ),()(maxarg)(2amumpmaa (P(P2 2) ),(,(maxarg)(1mamumm (B)(B)(mp是参与人是参与人

35、 2 2 使用贝叶斯法则从先验概率使用贝叶斯法则从先验概率)(p,观测观测到的信号到的信号m和参与人和参与人 1 1 的最优战略的最优战略)(m得到的(在可能的情况得到的(在可能的情况下) 。下) 。 28 (P (P1 1) )和和(P(P2 2) )等价于精炼贝叶斯均衡定义中的(等价于精炼贝叶斯均衡定义中的(P P) ,是精炼条) ,是精炼条件。件。(P(P1 1) )是说给定后验概率是说给定后验概率(B)(B)(mp,参与人参与人 2 2 对参与人对参与人 1 1 发出发出的信号作出最优反应;的信号作出最优反应;(P2)(P2)是说预测到参与人是说预测到参与人 2 2 的最优反应的最优反

36、应)(ma, 参与人参与人 1 1 选择自己的最优战略。选择自己的最优战略。 (B)(B)是贝叶斯法则的应用。是贝叶斯法则的应用。限制条件“在可能的情况下”的含义是与前述定义中相同。限制条件“在可能的情况下”的含义是与前述定义中相同。 294.4.均衡分类。均衡分类。信号传递博弈的所有可能的精炼贝叶斯均衡可以划信号传递博弈的所有可能的精炼贝叶斯均衡可以划分为三类,即:分离均衡、混同均衡和准分离均衡。分为三类,即:分离均衡、混同均衡和准分离均衡。 (1 1)分离均衡:)分离均衡:不同类型的发送者(不同类型的发送者(参与人参与人 1 1)以)以 1 1 的概率选择的概率选择不同的信号,或者说,没有

37、任何类型选择与其他类型相同的信号。在不同的信号,或者说,没有任何类型选择与其他类型相同的信号。在分离均衡之下,信号准确的揭示类型。假定分离均衡之下,信号准确的揭示类型。假定2 JK(即只有两个类(即只有两个类型,两个信号) ,那么分离均衡意味着:如果型,两个信号) ,那么分离均衡意味着:如果1m是类型是类型1的最优选择,的最优选择,1m就不可能是类型就不可能是类型2的最优选择,并且的最优选择,并且2m一定是类型一定是类型2的最优选的最优选择。择。 用公式表示为:用公式表示为: ),(,(),(,(121111mamumamu;),(,(),(,(211221mamumamu; 因此,后验概率是

38、:因此,后验概率是: 1)(11mp,0)(21mp,0)(12mp,1)(22mp 30(2 2)混同均衡:)混同均衡:不同类型的发送者(不同类型的发送者(参与人参与人 1 1)选择相同的信)选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号。因此,号,或者说,没有任何类型选择与其他类型不同的信号。因此,参参与人与人 1 1 的信号选择没有信息量,的信号选择没有信息量,接收者(接收者(参与人参与人 2 2)不据此修正先)不据此修正先验概率。验概率。假定假定jm是均衡战略,那么:是均衡战略,那么: ),(,(),(,(1111mamumamuj;),(,(),(,(2121mamum

39、amuj; )()(kjkpmp (3 3)准分离均衡:)准分离均衡:一些类型的发送者随机地选择信号,另一一些类型的发送者随机地选择信号,另一些类型的发送者选择特定的信号。假定类型些类型的发送者选择特定的信号。假定类型1的发送者随机地选择的发送者随机地选择1m和和2m,其选择其选择1m的概率为的概率为;类型类型2的发送者以的发送者以 1 1 的概率选择的概率选择2m,如果这个战略组合是均衡战略组合,那么满足:如果这个战略组合是均衡战略组合,那么满足: 31),(,(),(,(121111mamumamu ),(,(),(,(221211mamumamu1)(0)()()(21111pppmp

40、)()(1)()1 ()()1 ()(121121ppppmp )()(1)()1 ()(1)(221222ppppmp 32参与人参与人 2 2 根据参与人根据参与人 1 1 的信号选择修正信念的规则是:如的信号选择修正信念的规则是:如果观测到果观测到1m, 则认定参与人则认定参与人 1 1 的类型一定是的类型一定是1, 因为类型因为类型2不不会选择会选择1m;如果观测到如果观测到2m,参与人,参与人 2 2 不能准确地知道参与人不能准确地知道参与人1 1 的真实类型,但是他会推断其属于类型的真实类型,但是他会推断其属于类型1的概率下降了,而的概率下降了,而属于类型属于类型2的概率上升了。的

41、概率上升了。这个思想是易于理解的。这个思想是易于理解的。 33 二、应用举例:用负债比率显示企业质量二、应用举例:用负债比率显示企业质量 1.1.模型简介。模型简介。 罗斯模型中,假设企业经理知道企业利润的分布函数,而罗斯模型中,假设企业经理知道企业利润的分布函数,而外部投资者不知道;企业的利润的分布函数是一阶随机占优排外部投资者不知道;企业的利润的分布函数是一阶随机占优排序的。经理的效用函数是企业市场价值的增函数,是企业破产序的。经理的效用函数是企业市场价值的增函数,是企业破产概率的减函数。经理使用企业的负债比例向投资者传递企业利概率的减函数。经理使用企业的负债比例向投资者传递企业利润分布的

42、信息。负债比例之所以能够传递企业质量的信息是基润分布的信息。负债比例之所以能够传递企业质量的信息是基于投资者如下的信念:企业破产概率与企业质量负相关,与企于投资者如下的信念:企业破产概率与企业质量负相关,与企业负债率正相关,只有高质量的企业才有能力承担较高负债率,业负债率正相关,只有高质量的企业才有能力承担较高负债率,而低质量的企业不敢用过度举债的办法模仿高质量企业。换言而低质量的企业不敢用过度举债的办法模仿高质量企业。换言之,越是好企业,负债率越高。之,越是好企业,负债率越高。342 2. .基基本本假假定定。假假定定有有两两个个时时期期,两两个个参参与与人人,即即经经理理和和投投资资者者。

43、企企业业第第二二时时期期的的利利润润记记作作,在在区区间间, 0上上服服从从均均匀匀分分布布;经经理理知知道道企企业业类类型型,投投资资者者只只知知道道的的概概率率分分布布)(而而不不知知道道的的真真实实情情况况。第第一一时时期期,经经理理首首先先选选择择负负债债水水平平D并并向向投投资资者者发发布布这这一一信信号号,投投资资者者据据此此决决定定企企业业是是市市场场价价值值0V;在在第第二二时时期期,企企业业利利润润实实现现。 我我们们仅仅分分析析第第一一时时期期,这这是是一一个个两两阶阶段段博博弈弈。经经理理的的目目标标是是最最大大 化化 企企 业业 第第 一一 时时 期期 的的 市市 场场 价价 值值 和和 扣扣 减减 破破 产产 惩惩 罚罚 后后 的的 第第 二二 时时 期期 期期 望望价价值值的的加加权权平平均均数数。即即: )2()()1 (),(,(00DLDVDVDu (12.1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论