不完全信息动态博弈ppt课件

上传人：海*** IP属地：广东上传时间：2021-12-12 格式：PPT 页数：61 大小：691KB 积分：22 举报 版权申诉

已阅读5页，还剩56页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE POWERPOINT TEMPLATE

2、POWERPOINT TEMPLATE 第五章第五章不完全信息动态博弈不完全信息动态博弈v 在不完全信息动态博弈中，至少有一个博弈参与者对博弈在不完全信息动态博弈中，至少有一个博弈参与者对博弈的构造、博弈参与者类型、博弈收益等信息不完全了解。的构造、博弈参与者类型、博弈收益等信息不完全了解。v 博弈参与者的行动存在先后顺序。博弈参与者的行动存在先后顺序。v 与不完全信息静态博弈类似，可以经过海萨尼转换将不完与不完全信息静态博弈类似，可以经过海萨尼转换将不完全信息动态博弈转化为完全但不完美信息动态博弈。全信息动态博弈转化为完全但不完美信息动态博弈。一、波音与空客博弈的根本假设一、波音与空客博弈的

3、根本假设v 假设波音公司先于空中客车公司进入市场。假设波音公司先于空中客车公司进入市场。v 波音公司能够是一个波音公司能够是一个“有先发优势的公司，也能够是一个有先发优势的公司，也能够是一个“无无先发优势的公司。先发优势的公司。v 波音公司波音公司“有先发优势时，其本钱函数为：有先发优势时，其本钱函数为：C(q1) = q1。v 波音公司波音公司“无先发优势时，其本钱函数为：无先发优势时，其本钱函数为：C(q1) = 2q1。v 空中客车公司的消费函数没有不确定性。空中客车公司的消费函数没有不确定性。v 空中客车公司的消费函数为：空中客车公司的消费函数为：C(q2) = 2q2。v 空中客车公

4、司进入市场需求付出一个额外的固定本钱。空中客车公司进入市场需求付出一个额外的固定本钱。v 假设国际市场飞机需求函数为：假设国际市场飞机需求函数为：P = 10 Qv 其中：其中：Q = q1 + q2。v 波音公司和空中客车公司的行动存在先后顺序。波音公司和空中客车公司的行动存在先后顺序。v 波音公司先进入市场，空中客车公司后进入市场。波音公司先进入市场，空中客车公司后进入市场。v 波音公司和空中客车公司都明确知道空中客车公司的消费函数。波音公司和空中客车公司都明确知道空中客车公司的消费函数。v 波音公司明确知道本人的消费函数，但空中客车公司不知道波波音公司明确知道本人的消费函数，但空中客车公

5、司不知道波音公司的消费函数。存在不完全信息。音公司的消费函数。存在不完全信息。v 所以，这个博弈是一个不完全信息动态博弈。所以，这个博弈是一个不完全信息动态博弈。专栏：专栏：“先发优势与先发优势与“规模经济规模经济v 传统经济学实际建立在完全竞争市场和规模报酬不变的前提下。传统经济学实际建立在完全竞争市场和规模报酬不变的前提下。v 在传统经济学实际中，完全竞争条件下企业利润为零，并且企在传统经济学实际中，完全竞争条件下企业利润为零，并且企业的利润与企业进入市场的时间先后没有必然联络。业的利润与企业进入市场的时间先后没有必然联络。v 在在 20 世纪世纪 50 年代以后，伴随着机械化大消费的迅猛

6、开展，年代以后，伴随着机械化大消费的迅猛开展，企业消费过程中企业消费过程中“规模经济规模经济Economy of Scale特征越特征越发明显。消费规模越大，企业消费本钱越低。发明显。消费规模越大，企业消费本钱越低。v 规模经济的消费方式催生不完全竞争的市场构造。规模经济的消费方式催生不完全竞争的市场构造。v 具有规模经济消费特征的企业越做越大，逐渐在市场中占据一具有规模经济消费特征的企业越做越大，逐渐在市场中占据一定垄断位置，进而突破完全竞争的市场构造，产生垄断竞争、定垄断位置，进而突破完全竞争的市场构造，产生垄断竞争、寡头、甚至垄断等不完全竞争的市场构造方式。寡头、甚至垄断等不完全竞争的市

7、场构造方式。v 在规模经济和不完全竞争市场构造下，先进入市场的企业具有在规模经济和不完全竞争市场构造下，先进入市场的企业具有垄断优势。垄断优势。v 先进入的企业可以利用规模经济原理扩展规模，降低本钱。先进入的企业可以利用规模经济原理扩展规模，降低本钱。v 后进入的企业在开展之初，规模小、消费本钱高，较难与曾经后进入的企业在开展之初，规模小、消费本钱高，较难与曾经具备一定规模的先发企业进展抗衡。具备一定规模的先发企业进展抗衡。v 即：先进入的企业即：先进入的企业“有先发优势。有先发优势。v 假设先进入的企业没有充分利用本身的便利条件，未建立起本假设先进入的企业没有充分利用本身的便利条件，未建立起

8、本身的竞争优势，那么当后来者进入市场时，两家企业在将在同身的竞争优势，那么当后来者进入市场时，两家企业在将在同一个起跑线上进展竞争。一个起跑线上进展竞争。v 在此种情况下，先进入市场的企业常被称为在此种情况下，先进入市场的企业常被称为“无先发优势。无先发优势。内部规模经济内部规模经济学习曲线与先发优势学习曲线与先发优势二、博弈过程二、博弈过程v 波音公司先行动。波音公司先行动。v 当波音公司选择产量时，可以视波音公司为一个垄断者。当波音公司选择产量时，可以视波音公司为一个垄断者。v 当空中客车进展决策时，假设空中客车公司选择当空中客车进展决策时，假设空中客车公司选择“进入，进入，那么波音公司和

9、空中客车公司在市场中进展寡头博弈。那么波音公司和空中客车公司在市场中进展寡头博弈。v 假设寡头博弈服从古诺寡头博弈的方式。假设寡头博弈服从古诺寡头博弈的方式。1波音公司的决策根据波音公司的决策根据v 波音公司经过选择产量最大化本人的利润。波音公司经过选择产量最大化本人的利润。v 首先行动的波音公司假设是一个首先行动的波音公司假设是一个“有先发优势的公司有先发优势的公司v 平衡产量为：平衡产量为：4.5v 平衡利润为：平衡利润为：20.25v 首先行动的波音公司假设是一个首先行动的波音公司假设是一个“无先发优势的公司无先发优势的公司v 平衡产量为：平衡产量为：4v 平衡利润为：平衡利润为：162

10、空中客车公司的决策根据空中客车公司的决策根据v 当轮到空中客车公司行动时，假设空中客车公司选择当轮到空中客车公司行动时，假设空中客车公司选择“不进入，不进入，那么波音公司将继续本人在市场中的垄断位置。那么波音公司将继续本人在市场中的垄断位置。v 假设空中客车公司选择假设空中客车公司选择“进入，那么空中客车公司将和波音公进入，那么空中客车公司将和波音公司在市场上进展古诺寡头博弈。司在市场上进展古诺寡头博弈。v 寡头博弈下寡头博弈下v 首先行动的波音公司假设是一个首先行动的波音公司假设是一个“有先发优势的公司有先发优势的公司v 产量：产量：q1 = 10/3; q2 = 7/3；利润：；利润：1

11、= 100/9； 1 = -5/9。v 首先行动的波音公司假设是一个首先行动的波音公司假设是一个“无先发优势的公司无先发优势的公司v 产量：产量：q1 = 8/3; q2 = 8/3；利润：；利润：1 = 64/9； 1 = 10/9。v 假设波音公司是一个假设波音公司是一个“有先发优势的公司，那么空中客车公司有先发优势的公司，那么空中客车公司与波音公司在市场上进展古诺寡头竞争时，空中客车公司的利与波音公司在市场上进展古诺寡头竞争时，空中客车公司的利润为负。润为负。v 假设波音公司是一个假设波音公司是一个“无先发优势的公司，那么空中客车公司无先发优势的公司，那么空中客车公司与波音公司在市场上进

12、展古诺寡头竞争时，空中客车公司的利与波音公司在市场上进展古诺寡头竞争时，空中客车公司的利润为正。也就是说：润为正。也就是说：v 当波音公司是一个当波音公司是一个“有先发优势的公司时，空中客车公司将选有先发优势的公司时，空中客车公司将选择择“进入；进入；v 当波音公司是一个当波音公司是一个“无先发优势的公司时，空中客车公司将选无先发优势的公司时，空中客车公司将选择择“不进入。不进入。三、先验信心与战略互动三、先验信心与战略互动v 由于空中客车公司并不知道波音公司的本钱函数，因此空中客由于空中客车公司并不知道波音公司的本钱函数，因此空中客车公司只能根据本人的先验信心进展决策选择。车公司只能根据本人

13、的先验信心进展决策选择。v 先行动的波音公司可以经过本人传送的信息影响空中客车公司先行动的波音公司可以经过本人传送的信息影响空中客车公司的信心。的信心。v 空中客车公司先验的以为波音公司为空中客车公司先验的以为波音公司为“有先发优势的公司的概有先发优势的公司的概率为率为 p，波音公司为，波音公司为“无先发优势的公司的概率为无先发优势的公司的概率为 1 p。v 当当 p 2/3 时，空中客车公司选择时，空中客车公司选择“不进入。不进入。v 作为先行动的波音公司，可以经过本人的行为改动空中客车公作为先行动的波音公司，可以经过本人的行为改动空中客车公司的信心。司的信心。v 详细说来，先行动的波音公司

14、作为市场中的垄断者，假设波音详细说来，先行动的波音公司作为市场中的垄断者，假设波音公司曾经建立起公司曾经建立起“先发优势，那么波音公司选择先发优势，那么波音公司选择 p = 5.5可可以最大化本人的垄断利润。以最大化本人的垄断利润。v 假设波音公司假设波音公司“无先发优势，那么波音公司选择无先发优势，那么波音公司选择 P = 6 可以可以最大化本人的垄断利润。最大化本人的垄断利润。v 波音公司会思索本人的定价传送给空中客车公司的信息。波音公司会思索本人的定价传送给空中客车公司的信息。v 假设波音公司把价钱定在假设波音公司把价钱定在 P = 6 的程度，那么等价于通知空的程度，那么等价于通知空中

15、客车公司：波音公司是一个中客车公司：波音公司是一个“无先发优势的公司。无先发优势的公司。v 当轮到空中客车公司进展决策时，空中客车公司一定会选择当轮到空中客车公司进展决策时，空中客车公司一定会选择“进进入。入。v 空中客车公司的进入会攫取部分本来属于波音公司的垄断利润。空中客车公司的进入会攫取部分本来属于波音公司的垄断利润。v 波音公司理想的结果是经过本人传送的信息，让空中客车公司波音公司理想的结果是经过本人传送的信息，让空中客车公司“知难而退，不进入市场。知难而退，不进入市场。v 即使波音公司是一个即使波音公司是一个“无先发优势的公司，它也有动机把本人无先发优势的公司，它也有动机把本人伪装成

16、一个伪装成一个“有先发优势的公司，从而改动空中客车公司的信有先发优势的公司，从而改动空中客车公司的信心，将空中客车公司排斥在市场之外。心，将空中客车公司排斥在市场之外。阶段阶段特点特点情形情形利润情况利润情况阶段阶段1市场中只需波音公司市场中只需波音公司一家企业一家企业波音公司为波音公司为“有先发优有先发优势的公司势的公司波音公司：波音公司：20.25波音公司为波音公司为“无先发优无先发优势的公司势的公司波音公司：波音公司：16阶段阶段2空中客车公司选择空中客车公司选择“进入：市场中有进入：市场中有波音公司和空中客车波音公司和空中客车两家公司两家公司波音公司为波音公

17、司为“有先发优有先发优势的公司势的公司波音公司：波音公司：100/9空中客车公司：空中客车公司：-5/9波音公司为波音公司为“无先发优无先发优势的公司势的公司波音公司：波音公司：64/9空中客车公司：空中客车公司：10/9空中客车公司选择空中客车公司选择“不进入不进入波音公司为波音公司为“有先发优有先发优势的公司势的公司波音公司：波音公司：20.25空中客车公司：空中客车公司：0波音公司为波音公司为“无先发优无先发优势的公司势的公司波音公司：波音公司：16空中客车公司：空中客车公司：0不同情况下波音公司和空中客车公司的利润情况不同情况下波音公司和空中客车公司的利润情

18、况v 当空中客车公司没有察看到波音公司的定价战略时，空中客车当空中客车公司没有察看到波音公司的定价战略时，空中客车公司有一个先验信心。公司有一个先验信心。v 当博弈开场后，空中客车公司可以察看到先行动的波音公司的当博弈开场后，空中客车公司可以察看到先行动的波音公司的定价战略，但察看不到波音公司的本钱函数。定价战略，但察看不到波音公司的本钱函数。v 根据波音公司的定价战略，空中客车公司会修正本人的先验信根据波音公司的定价战略，空中客车公司会修正本人的先验信心，产生后验概率。心，产生后验概率。v 空中客车公司如何根据察看到的波音公司价钱的战略修正本人空中客车公司如何根据察看到的波音公司价钱的战略修

19、正本人的先验信心呢？的先验信心呢？v “后行动的博弈参与者怎样根据察看到的信息修正本人的先验概后行动的博弈参与者怎样根据察看到的信息修正本人的先验概率，得到后验概率。这是贝叶斯统计的一个经典问题：率，得到后验概率。这是贝叶斯统计的一个经典问题：第二节第二节先验概率与后验概率先验概率与后验概率v 在贝叶斯统计中，人们根据历史以及阅历对某随机事件概在贝叶斯统计中，人们根据历史以及阅历对某随机事件概率分布的先验信心称为先验概率。率分布的先验信心称为先验概率。v 先验概率构成后，根据之后得到信息对先验概率进展修正，先验概率构成后，根据之后得到信息对先验概率进展修正，得到后验概率。得到后验概率。v 贝

20、叶斯公式是衔接先验概率和后验概率的桥梁。贝叶斯公式是衔接先验概率和后验概率的桥梁。一、贝叶斯公式一、贝叶斯公式v 贝叶斯公式逆概公式：设实验贝叶斯公式逆概公式：设实验 E 的的样本空间为的的样本空间为。事件事件 A1,A2,An 构成样本空间构成样本空间的一个划分或构的一个划分或构成一个完备事件组，且成一个完备事件组，且 P(Ai) 0，i = 1,2,n那么对恣意一个事件那么对恣意一个事件 BP(B) 0，有：，有：1() (/)(/)() (/)jjjniiiP A P B AP ABP A P B A1,2,.,jn二、贝叶斯公式运用实例二、贝叶斯公式运用实例v 某公司思索从某公司思

21、索从 F 大学招聘毕业生。大学招聘毕业生。v 经理甲以为：经理甲以为：F 大学的毕业生为大学的毕业生为“高才干的概率为高才干的概率为 0.9，为，为“低才干的概率为低才干的概率为 0.1。v 经理乙以为：经理乙以为：F 大学的毕业生为大学的毕业生为“高才干的概率为高才干的概率为 0.7，为，为“低才干的概率为低才干的概率为 0.3。v 人事主管先验概率：经理甲正确的概率为人事主管先验概率：经理甲正确的概率为 0.4，经理乙正确的，经理乙正确的概率为概率为 0.6。v 该公司人力主管决议尝试着先招聘该公司人力主管决议尝试着先招聘 5 个个 F 大学的毕业生，经大学的毕业生，经过察看这过察看这 5

22、个毕业生的实践才干，对本人的先验概率进展修正。个毕业生的实践才干，对本人的先验概率进展修正。v 假设招聘来的假设招聘来的 5 个个 F 大学的毕业生都是大学的毕业生都是“高才干的。这时，高才干的。这时，该公司人力资源主管如何修正其先验概率？该公司人力资源主管如何修正其先验概率？v 定义事件定义事件 A1 和和 A2v A1 = F大学毕业生大学毕业生“高才干的概率为高才干的概率为 0.9，“低才干的概低才干的概率为率为 0.1。v A2 = F大学毕业生大学毕业生“高才干的概率为高才干的概率为 0.7，“低才干的概低才干的概率为率为 0.3。v 公司人力主管的先验概率为：公司人力主管的先验概

23、率为：P(A1) = 0.4, P(A2) = 0.6v 定义事件定义事件 B = 招聘了招聘了 5 个个 F大学的学生，都是大学的学生，都是“高才干高才干v 需求求解需求求解 P(A1/B) 和和 P(A2/B)v 根据：根据：v 根据贝叶斯公式，得到：根据贝叶斯公式，得到：v 公司人力主管将本人的信心进展了调整，调整后的信心为：公司人力主管将本人的信心进展了调整，调整后的信心为：51(/)0.90.59049P B A52(/)0.70.16807P B A1111122() (/)0.4*0.59049(/)0.7() (/)() (/)0.4*0.590490.6*0.16807P A

24、 P B AP ABP A P B AP A P B A2221122() (/)0.6*0.16807(/)0.3() (/)() (/)0.4*0.590490.6*0.16807P A P B AP ABP A P B AP A P B A1(/)0.7P AB 2(/)0.3P AB 2先验概率的再修正先验概率的再修正v 假设该公司人力主管决议再进展一次实验假设该公司人力主管决议再进展一次实验。v 该公司又从该公司又从 F 大学招聘了大学招聘了 10 名毕业生。名毕业生。v 经过一段时间的察看，发现这经过一段时间的察看，发现这 10 名毕业生中，有名毕业生中，有 9 名是名是“高高才

25、干，有才干，有 1 名是低才干。名是低才干。v 定义事件定义事件 C = 招聘了招聘了 10 个个 F 大学的学生，有大学的学生，有 9 个是个是“高才高才干，干，1 个是个是“低才干。低才干。v 根据贝叶斯公式，求解后验概率根据贝叶斯公式，求解后验概率v 需求求解需求求解 P(A1/C) 和和 P(A2/C)v 定义事件定义事件 A1 和和 A2v A1 = F大学毕业生大学毕业生“高才干的概率为高才干的概率为 0.9，“低才干的概低才干的概率为率为 0.1。v A2 = F大学毕业生大学毕业生“高才干的概率为高才干的概率为 0.7，“低才干的概低才干的概率为率为 0.3。v 公司人力主管的

26、先验概率为：公司人力主管的先验概率为：P(A1) = 0.7, P(A2) = 0.3v 根据贝叶斯公式根据贝叶斯公式v 公司人力主管将本人的信心再次进展了调整。公司人力主管将本人的信心再次进展了调整。1111122() (/)0.7*0.38742(/)0.88() (/)() (/)0.7*0.387420.3*0.12106P A P C AP A CP A P C AP A P C A2221122() (/)0.3*0.12106(/)0.12() (/)() (/)0.7*0.387420.3*0.12106P A P C AP ACP A P C AP A P C A三、不断累积

27、的阅历对信心的影响三、不断累积的阅历对信心的影响v 新添加的信息，也能够导致人力主管向另一个方向调整信心新添加的信息，也能够导致人力主管向另一个方向调整信心。v 假设该公司从假设该公司从 F 大学招聘了大学招聘了 5 名毕业生。名毕业生。v 经过一段时间的察看，发现这经过一段时间的察看，发现这 5 名毕业生都是低才干。名毕业生都是低才干。v 定义事件定义事件 B = 招聘了招聘了 5 个个 F 大学的学生，都是大学的学生，都是 “低才干。低才干。v 根据贝叶斯公式，求解后验概率根据贝叶斯公式，求解后验概率1111122() (/)0.4*0.00001(/)0.0027() (/)() (/

28、)0.4*0.00001 0.6*0.00243P A P B AP ABP A P B AP A P B A2221122() (/)0.6*0.0.00243(/)0.9973() (/)() (/)0.4*0.000010.6*0.00243P A P B AP ABP A P B AP A P B Av 不完全信息动态博弈中，博弈参与者在博弈开场前具备先验信心。不完全信息动态博弈中，博弈参与者在博弈开场前具备先验信心。v 当博弈开场后，后行动的博弈参与者察看到先行动博弈参与者的当博弈开场后，后行动的博弈参与者察看到先行动博弈参与者的部分信息。根据察看到的信息，后行动的博弈参与者会修正本

29、人部分信息。根据察看到的信息，后行动的博弈参与者会修正本人的先验概率，得到后验概率。的先验概率，得到后验概率。v 先行动的博弈参与者知道本人泄漏的信息会影响后行动博弈参与先行动的博弈参与者知道本人泄漏的信息会影响后行动博弈参与者的信心。者的信心。v 因此，先行动的博弈参与者在泄漏信息时，也要经过沉思熟虑、因此，先行动的博弈参与者在泄漏信息时，也要经过沉思熟虑、理性权衡，尽能够让本人泄漏的信息能诱导后行动者构成有利于理性权衡，尽能够让本人泄漏的信息能诱导后行动者构成有利于先行动者的信心。先行动者的信心。第三节第三节不完全信息动态博弈的平衡不完全信息动态博弈的平衡v 与不完全信息静态博弈类似，可

30、以经过海萨尼转换将一个不完全与不完全信息静态博弈类似，可以经过海萨尼转换将一个不完全信息动态博弈写成博弈树的表达方式。信息动态博弈写成博弈树的表达方式。v 一、平衡概述一、平衡概述v 思索这样一个简单的不完全信息动态博弈：思索这样一个简单的不完全信息动态博弈：v 两名博弈参与者两名博弈参与者 1 和和 2。v 博弈参与者博弈参与者 1 先行动，博弈参与者先行动，博弈参与者 2 后行动。后行动。v 参与者参与者 1 能够选择战略能够选择战略 L，也能够选择战略，也能够选择战略 R。v 后行动的参与者后行动的参与者 2 不知道参与者不知道参与者 1 的战略选择。的战略选择。v 后行动的参与者后行动

31、的参与者 2 具备关于参与者具备关于参与者 1 选择的先验信心。选择的先验信心。v 参与者参与者 2 以为参与者以为参与者 1 选择战略选择战略 L 的概率为的概率为 p，选择战略，选择战略 R 的概率为的概率为 1 - p。v 参与者参与者2有两个战略可以选择：有两个战略可以选择：U 和和 V。参与者参与者2战略战略U战略战略V参与者参与者1战略战略L2，30，1战略战略R1，40，2v 参与者参与者 2 的两个节点位于一个信息集内。的两个节点位于一个信息集内。v 与完全信息动态博弈不同，这里假设参与者与完全信息动态博弈不同，这里假设参与者 2具有先验信心。具有先验信心。v 根据参与者根据参

32、与者 2 的先验信心，参与者的先验信心，参与者 2 选择战略选择战略 U 的预期收益为：的预期收益为：v 参与者参与者 2 选择战略选择战略 V 的预期收益为：的预期收益为：v 容易得到：对于恣意的容易得到：对于恣意的 0 = p = 1，参与者，参与者 2 选择战略选择战略 U的收益都高于选择战略的收益都高于选择战略 V 的收益。的收益。 v 参与者参与者 2 会选择战略会选择战略 U。v 参与者参与者 1 预期到参与者预期到参与者 2 的选择逻辑，参与者的选择逻辑，参与者 1 会选择战略会选择战略 L。v 博弈的平衡是博弈的平衡是L，U。*3(1)*44ppp*1(1)*22pppv 不完

33、全信息动态博弈的平衡应具备两个特点。不完全信息动态博弈的平衡应具备两个特点。v 特点特点 1：博弈参与者在每个博弈节点上都有一个客观信心：博弈参与者在每个博弈节点上都有一个客观信心v 假设某个博弈参与者的信息集为单点信息集，那么可以以假设某个博弈参与者的信息集为单点信息集，那么可以以为该信息集上的博弈参与者赋予此博弈节点的客观概率为为该信息集上的博弈参与者赋予此博弈节点的客观概率为 1。v 特点特点2：平衡必需满足序贯理性：平衡必需满足序贯理性Sequentially Rational。v 序贯理性指：在博弈的每个信息集上，博弈参与者的决策序贯理性指：在博弈的每个信息集上，博弈参与者的决策都是

34、最优的。都是最优的。二、精炼贝叶斯纳什平衡二、精炼贝叶斯纳什平衡v 完全信息动态博弈中完全信息动态博弈中v 子博弈精炼纳什平衡是对纳什平衡的一种子博弈精炼纳什平衡是对纳什平衡的一种“精炼，精炼，v 剔除了纳什平衡中包含着剔除了纳什平衡中包含着“空洞要挟的平衡。空洞要挟的平衡。v 不完全信息动态博弈中不完全信息动态博弈中v 精炼贝叶斯纳什平衡精炼贝叶斯纳什平衡Perfect Bayesian Nash Equilibrium指剔除了贝叶斯纳什平衡中包含指剔除了贝叶斯纳什平衡中包含“空洞要空洞要挟的平衡，挟的平衡，v 是对贝叶斯纳什平衡的是对贝叶斯纳什平衡的“精炼。精炼。1精炼贝叶斯纳什平衡实例精

35、炼贝叶斯纳什平衡实例包含包含“空洞要挟的博弈空洞要挟的博弈v 博弈参与者博弈参与者 1 有三个战略：有三个战略：L、R 和和 M。v 当参与者当参与者 1 选择战略选择战略 M 时，博弈终了。参与者时，博弈终了。参与者 1 获得收益获得收益 1，参与者参与者 2 获得收益获得收益 10。v 当参与者当参与者 1 选择战略选择战略 L 或者战略或者战略 R 时，轮到参与者时，轮到参与者 2 进展战进展战略选择。略选择。v 参与者参与者 2 能察看到参与者能察看到参与者 1 没有选择战略没有选择战略 M，但参与者，但参与者 2 不不知道参与者知道参与者 1 终究选择了战略终究选择了战略 L 还是选

36、择了战略还是选择了战略 R。v 此博弈不存在子博弈。此博弈不存在子博弈。v 根据根据“划横线法求解博弈的纳什平衡。划横线法求解博弈的纳什平衡。v 博弈有两个纳什平衡：博弈有两个纳什平衡：L，U和和M，V。v 纳什平衡仅思索在平衡处的情况，而不思索通往平衡的途径。纳什平衡仅思索在平衡处的情况，而不思索通往平衡的途径。v M，V虽然是纳什平衡，但在实践博弈中，没有通往这个纳虽然是纳什平衡，但在实践博弈中，没有通往这个纳什平衡的途径。什平衡的途径。参与者参与者2战略战略U战略战略V参与者参与者1战略战略L2，30，1战略战略R1，40，2战略战略M1，101，10v 博弈参与者博弈参与者 1 先行动

37、，但参与者先行动，但参与者 1 在选择本人的战略时，会思在选择本人的战略时，会思索本人的战略对博弈参与者索本人的战略对博弈参与者 2 决策的影响。决策的影响。v 假设参与者假设参与者 1 没有选择战略没有选择战略 M，那么参与者，那么参与者 2 会根据本人的客会根据本人的客观信心以及收益情况选择本人的战略。可以证明：参与者观信心以及收益情况选择本人的战略。可以证明：参与者 2 必必然会选择战略然会选择战略 U。v 理性的参与者理性的参与者 1 可以预期到：假设本人不选战略可以预期到：假设本人不选战略 M，而是选择，而是选择战略战略 L 或者战略或者战略 R，那么参与者，那么参与者 2 必然选择

38、战略必然选择战略 U。v 在这种序贯理性条件下，参与者在这种序贯理性条件下，参与者 1 会选择战略会选择战略 L，参与者，参与者 1 得得到收益到收益 2，参与者，参与者 2 得到收益得到收益 3。v 假设参与者假设参与者 1 选择战略选择战略 M，那么参与者，那么参与者 1 仅能得到收益仅能得到收益 1。v 所以先行动参与者所以先行动参与者 1 不会选择战略不会选择战略 M。v 虽然参与者虽然参与者 2 不知道参与者不知道参与者 1 选择了战略选择了战略 L 还是战略还是战略 R，但参，但参与者与者 2 必然会选择战略必然会选择战略 U。v 所以，作为一个动态博弈，博弈途径必然是：参与者所以

39、，作为一个动态博弈，博弈途径必然是：参与者 1 选择战选择战略略 L，参与者，参与者 2 选择战略选择战略 U。v 博弈参与者博弈参与者 2 最希望看到的结果是：参与者最希望看到的结果是：参与者 1 选择战略选择战略 M，从，从而博弈终了。在这种情况下参与者而博弈终了。在这种情况下参与者 2 可以获得收益可以获得收益 10。但是，。但是，怎样才干让参与者怎样才干让参与者 1 选择战略选择战略 M 呢？呢？2不可置信的要挟不可置信的要挟v 参与者参与者 2 假设放出这样的要挟：假设放出这样的要挟：“假设参与者假设参与者 1 没有选择战略没有选择战略 M，而是选择了战略，而是选择了战略 L 或战略

40、或战略 R，那么参与者，那么参与者 2 必然选择战必然选择战略略 V。v 参与者参与者 2 的这种要挟假设成立，那么不论参与者的这种要挟假设成立，那么不论参与者 1 选择战略选择战略 L 还是战略还是战略 R，参与者，参与者 1 的收益都只需的收益都只需 0。假设选择战略。假设选择战略 M，参与者参与者 1 可以得到收益可以得到收益 1。v 假设参与者假设参与者 2 的要挟是可置信的，那么参与者的要挟是可置信的，那么参与者 1 就会选择战就会选择战略略 M，得到收益，得到收益 1。参与者。参与者 2 得到收益得到收益 10。v 然而，参与者然而，参与者 2 的这种要挟是不可置信的要挟。的这种要

41、挟是不可置信的要挟。v 参与者参与者 1 知道，假设本人没有选择战略知道，假设本人没有选择战略 M，那么参与者，那么参与者 2 会放弃要挟，理性的选择战略会放弃要挟，理性的选择战略 U。v 博弈平衡为博弈平衡为L，U。v 参与者参与者 1 得到收益得到收益 2，高于选择战略，高于选择战略 M 的收益的收益 1。v 参与者参与者 2 怎样将这种空洞的要挟变成可置信的要挟呢？怎样将这种空洞的要挟变成可置信的要挟呢？3可置信的要挟可置信的要挟v 假设参与者假设参与者 2 找到一个具有法律约束力的公正机构，并作出承找到一个具有法律约束力的公正机构，并作出承诺：假设参与者诺：假设参与者 1 没有选择战略

42、没有选择战略 M，那么参与者，那么参与者 2 假设选择假设选择战略战略 U，那么捐给出，那么捐给出10，口说无凭，立字为据。，口说无凭，立字为据。v 在这种情况下，博弈的收益就相应发生了变化。在这种情况下，博弈的收益就相应发生了变化。v 容易得到：参与者容易得到：参与者 2 选择战略选择战略 U 的收益都低于选择战略的收益都低于选择战略 V 的收的收益。参与者益。参与者 2 会选择战略会选择战略 V。v 根据序贯理性原那么，参与者根据序贯理性原那么，参与者 1 预期到参与者预期到参与者 2 必然选择战略必然选择战略 V。v 假设参与者假设参与者 1 选择了战略选择了战略 L 或者战略或者战略

43、R，那么参与者，那么参与者 1 只能得只能得到收益到收益 0。v 假设参与者假设参与者 1 选择战略选择战略 M，会得到收益，会得到收益 1。 v 因此理性的参与者因此理性的参与者 1 会选择战略会选择战略 M。博弈的平衡为：。博弈的平衡为：(M，V)。v 因此，当参与者因此，当参与者 2 将本人将本人“必然选择战略必然选择战略 V的要挟变为可置信的要挟变为可置信的要挟时，参与者的要挟时，参与者 1 会选择战略会选择战略 M 而不是战略而不是战略 L。v 博弈只需一个纳什平衡：博弈只需一个纳什平衡：M，V。v 这个纳什平衡也是一个精炼贝叶斯纳什平衡。这个纳什平衡也是一个精炼贝叶斯纳什平衡。参与

44、者参与者2战略战略U战略战略V参与者参与者1战略战略L2，-70，1战略战略R1，-60，2战略战略M1，101，10“可置信要挟下的战略型表达方式可置信要挟下的战略型表达方式第四节第四节不完全信息动态博弈的运用不完全信息动态博弈的运用v 在不完全信息动态博弈中，一个重要的研讨领域是：怎样有效在不完全信息动态博弈中，一个重要的研讨领域是：怎样有效传送信号传送信号Signal以及存在信号传送条件下的博弈平衡。以及存在信号传送条件下的博弈平衡。v 迈克尔迈克尔斯宾塞斯宾塞Michael Spence教授研讨了劳动力市教授研讨了劳动力市场上的不完全信息、信号传送及平衡问题，为信息经济学的开场上的

45、不完全信息、信号传送及平衡问题，为信息经济学的开展奠定了重要根底。展奠定了重要根底。v 一、劳动力市场信号博弈概述一、劳动力市场信号博弈概述v 在劳动力市场中，雇主不能在招聘时明确知道应聘者的才干。在劳动力市场中，雇主不能在招聘时明确知道应聘者的才干。v 即使被录用者已在任务岗位上时，雇主也往往无法立刻获知劳即使被录用者已在任务岗位上时，雇主也往往无法立刻获知劳动者的真实才干。动者的真实才干。v 雇主不能够随意解聘一个曾经得到雇佣合同的员工。雇主不能够随意解聘一个曾经得到雇佣合同的员工。v 劳动力市场可以看作是一个具备不对称信息特征的投资市场。劳动力市场可以看作是一个具备不对称信息特征的投资市

46、场。v 雇主虽然察看不到劳动者的才干，但是可以察看到劳动者的外雇主虽然察看不到劳动者的才干，但是可以察看到劳动者的外部特征。如：性别、年龄、种族、受教育程度等。部特征。如：性别、年龄、种族、受教育程度等。v 雇主可以经过察看劳动者的外部特征来构成对劳动者实践才干雇主可以经过察看劳动者的外部特征来构成对劳动者实践才干的客观信心。的客观信心。v 像性别、年龄、种族这些不受劳动者本身控制的特征，通常被像性别、年龄、种族这些不受劳动者本身控制的特征，通常被称为称为“目的目的Indices，只需劳动者能自我控制的特征：，只需劳动者能自我控制的特征：如受教育程度，才被称为如受教育程度，才被称为“信号信号S

47、ignal。v 劳动者可以经过向雇主传送信号，还改动雇主的客观信心。劳动者可以经过向雇主传送信号，还改动雇主的客观信心。v 通常说来，劳动者的受教育程度越到，雇主以为其是高才干的通常说来，劳动者的受教育程度越到，雇主以为其是高才干的劳动者的概率越大。劳动者的概率越大。v 因此，劳动者的受教育程度是一个信号。因此，劳动者的受教育程度是一个信号。v 劳动者的受教育程度越高，劳动者得到雇佣的能够性越大。劳动者的受教育程度越高，劳动者得到雇佣的能够性越大。v 假设拿到高学历不需求本钱，那么一切的劳动者都会选择高学假设拿到高学历不需求本钱，那么一切的劳动者都会选择高学历。历。v 实践上，受教育需求付出本

48、钱：膂力、脑力和时间等。实践上，受教育需求付出本钱：膂力、脑力和时间等。v 为了得到某些有利于本人的信号而付出的本钱，通常被称为为了得到某些有利于本人的信号而付出的本钱，通常被称为“信信号本钱号本钱Signaling Cost。v 假设劳动者获得高学历的本钱和他的才干负相关：才干越高的假设劳动者获得高学历的本钱和他的才干负相关：才干越高的劳动者获得高学历所需付出的本钱越低；才干越低的劳动者获劳动者获得高学历所需付出的本钱越低；才干越低的劳动者获得高学历所需付出的本钱越高。得高学历所需付出的本钱越高。v 由于劳动者获得高教育程度需求付出本钱，即由于劳动者获得高教育程度需求付出本钱，即“信号本钱，

49、因信号本钱，因此劳动者在决议本人接受多少年教育时，会思索此劳动者在决议本人接受多少年教育时，会思索“多接受一年教多接受一年教育所带来的收益和所要付出的本钱的相对大小。育所带来的收益和所要付出的本钱的相对大小。v 在平衡处，应满足边沿收益等于边沿本钱。这就是在平衡处，应满足边沿收益等于边沿本钱。这就是“劳动者的信劳动者的信号决策过程。号决策过程。劳动力市场和信号传送劳动力市场和信号传送v 虽然雇主以为：受教育程度越高，劳动者为高才干劳动者的概虽然雇主以为：受教育程度越高，劳动者为高才干劳动者的概率越大。率越大。v 但是终究受教育程度和才干之间是怎样的量化关系呢？但是终究受教育程度和才干之间是怎样

50、的量化关系呢？v 雇主会根据以往的阅历不断修正本人的判别。雇主会根据以往的阅历不断修正本人的判别。v 假设以往雇佣的高学历劳动者都是高才干、低学历劳动者都是假设以往雇佣的高学历劳动者都是高才干、低学历劳动者都是低才干，那么雇主会以为受教育程度和才干之间存在很强的相低才干，那么雇主会以为受教育程度和才干之间存在很强的相关性。反之，假设雇主以往雇佣的高学历劳动者才干并不高、关性。反之，假设雇主以往雇佣的高学历劳动者才干并不高、低学历劳动者才干并不低，那么雇主就会逐渐以为受教育程度低学历劳动者才干并不低，那么雇主就会逐渐以为受教育程度和才干之间不存在很强的相关性。和才干之间不存在很强的相关性。v 假

51、设雇主以为受教育程度和才干之间存在很强的相关性，那么假设雇主以为受教育程度和才干之间存在很强的相关性，那么雇主就会更倾向于招聘那些高学历的劳动者，并更情愿为高学雇主就会更倾向于招聘那些高学历的劳动者，并更情愿为高学历的劳动者支付高工资。历的劳动者支付高工资。v 反之，假设雇主以为受教育程度和才干之间不存在很强的相关反之，假设雇主以为受教育程度和才干之间不存在很强的相关性，那么雇主能够并不情愿为高学历的劳动者提供太高的工资。性，那么雇主能够并不情愿为高学历的劳动者提供太高的工资。v 雇主的信心对雇主的信心对“劳动者的信号决策也会产生影响。劳动者的信号决策也会产生影响。v 假设劳动者预期到雇主情愿

52、为高学历的劳动者支付高工资，那假设劳动者预期到雇主情愿为高学历的劳动者支付高工资，那么劳动者就更有能够添加本人的受教育程度。反之，劳动者添么劳动者就更有能够添加本人的受教育程度。反之，劳动者添加本人受教育程度的热情会减少。加本人受教育程度的热情会减少。二、数理模型二、数理模型v 可以经过一个简单的数理模型调查不完全信息劳动力市场的博可以经过一个简单的数理模型调查不完全信息劳动力市场的博弈过程和平衡。弈过程和平衡。v 假设劳动人口中有两种劳动者：低才干的和高才干的。假设劳动人口中有两种劳动者：低才干的和高才干的。v 低才干的劳动者的边沿产值为低才干的劳动者的边沿产值为 1；高才干的劳动者的边沿产

53、值；高才干的劳动者的边沿产值为为 2。v 低才干劳动者占劳动者总人数的比例为：低才干劳动者占劳动者总人数的比例为：q1，高才干劳动者占，高才干劳动者占劳动者总人数的比例为：劳动者总人数的比例为：1 q1。v 劳动者的受教育年数用劳动者的受教育年数用 y 表示。低才干的劳动者要想获得表示。低才干的劳动者要想获得 y 年教育阅历需求付出的本钱为年教育阅历需求付出的本钱为 y；高才干的劳动者要想获得；高才干的劳动者要想获得 y 年教育阅历需求付出的本钱为年教育阅历需求付出的本钱为 y/2。v 假设雇主的客观信心为：假设劳动者的受教育年数大于等于一假设雇主的客观信心为：假设劳动者的受教育年数大于等于一

54、个临界值个临界值 y*，那么雇主将按照高才干劳动者的边沿产值给该，那么雇主将按照高才干劳动者的边沿产值给该劳动者付工资。劳动者付工资。v 假设劳动者的受教育年数小于该临界值假设劳动者的受教育年数小于该临界值 y*，那么雇主将按照，那么雇主将按照低才干劳动者的边沿产值给该劳动者付工资。低才干劳动者的边沿产值给该劳动者付工资。v 因此，雇主付给劳动者的工资因此，雇主付给劳动者的工资 w 与劳动者的受教育程度与劳动者的受教育程度 y 有有关。关。*1( )2ifyyw yifyyv 劳动者的受教育年限只能够是两种：劳动者的受教育年限只能够是两种：0年或者年或者 y* 年。年。v 雇主应该选择一个适宜

55、的雇主应该选择一个适宜的 y*，使得低才干的劳动者选择的受，使得低才干的劳动者选择的受教育年限为教育年限为0、高才干劳动者选择的受教育年限为、高才干劳动者选择的受教育年限为 y*。v 这样的这样的 y* 可以使得雇主正确的将高才干劳动者和低才干劳动可以使得雇主正确的将高才干劳动者和低才干劳动者区分开，可以正确地按照劳动者的边沿产值给劳动者付工资。者区分开，可以正确地按照劳动者的边沿产值给劳动者付工资。v 这样的机制满足自我确认这样的机制满足自我确认Self-Confirming的特征。的特征。v 求解求解 y* 的过程就是求解信号平衡的过程就是求解信号平衡Signal Equilibriam的

56、过程。的过程。三、博弈平衡三、博弈平衡v 当当 1 y* 2 时时v 低才干的劳动者选择的受教育年限为低才干的劳动者选择的受教育年限为 0，v 高才干的劳动者选择的受教育年限为高才干的劳动者选择的受教育年限为 y*。v 不同才干的劳动者选择的受教育年限不同。这样的平衡被称为不同才干的劳动者选择的受教育年限不同。这样的平衡被称为分别平衡分别平衡Separating Equilibrium。v 当当时时 y* 2 时时v 不论是低才干的劳动者还是高才干的劳动者都会选择受教育程不论是低才干的劳动者还是高才干的劳动者都会选择受教育程度为度为 0。v 不同才干的劳动者选择的受教育年限一样。这样的平衡被

57、称为不同才干的劳动者选择的受教育年限一样。这样的平衡被称为混同平衡混同平衡Pooling Equilibrium专栏：迈克尔专栏：迈克尔斯宾塞简介斯宾塞简介v 迈克尔迈克尔斯宾塞教授斯宾塞教授 1943 年出生于美国，年出生于美国，1962-1966 年年就读于普林斯顿大学，获得哲学学士学位。就读于普林斯顿大学，获得哲学学士学位。v 1968年获牛津大学数学硕士学位，年获牛津大学数学硕士学位，1972年获哈佛大学经济年获哈佛大学经济学博士学位。学博士学位。v 斯宾塞曾供职于斯坦福大学、哈佛大学等，并曾任哈佛大学商斯宾塞曾供职于斯坦福大学、哈佛大学等，并曾任哈佛大学商学院院长、国家科技及经济政策研讨委员会主席等职。学院院长、国家科技及经济政策研讨委员会主席等职。v 斯宾塞主要研讨的是具有不完全信息的市场中各决策主体的经斯宾塞主要研讨的是具有不完全信息的市场中各决策主体的经济行为。济行为。v 在不完全信息市场中，往往存在逆向选择在不完全信息市场中，往往存在逆向选择Adverse Choice / Adverse Selection。v 在劳动力市场中，存在高才干的劳动者和低才干的劳动者。在劳动力市场中，存在

人人文库> 全部分类> 应用文书 > 工作计划

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

不完全信息动态博弈ppt课件

文档简介

温馨提示

最新文档

评论

不完全信息动态博弈ppt课件

文档简介

温馨提示

最新文档

评论

相关文档