博弈论3完全且完美信息动态博弈

上传人：6*** IP属地：湖北上传时间：2021-10-26 格式：PPT 页数：159 大小：708KB 积分：30 举报 版权申诉

已阅读5页，还剩154页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第三章第三章完全且完美信息动态博弈完全且完美信息动态博弈所有博弈方都对博弈过程和得益完全了解的所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈完全且完美信息动态博弈。这类博弈也是现这类博弈也是现实中常见的基本博弈类型。由于动态博弈中实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。方面，都与静态博弈有很大区别。3.1 3.1 阶段和扩展性表示阶段和扩展性表示o阶段：动态博弈中一个博弈方的一次选择行为阶段：动态博弈

2、中一个博弈方的一次选择行为o例例 1 1：仿冒和反仿冒博弈：仿冒和反仿冒博弈模型描述：略模型描述：略扩展式表示：扩展式表示：ABBA不制止制止（-2，5）（2，2）（10，4）（5，5）不仿冒（0，10）仿冒不制止制止仿冒不仿冒例例2 2：市场进入阻挠：市场进入阻挠( (动态博弈动态博弈) )假设条件假设条件: :企业企业A A、企业、企业B B经营同样产品经营同样产品企业企业A A已占领市场已占领市场; ;企业企业B B想打进该市场想打进该市场企业企业A A完全知道企业完全知道企业B B的行为的行为分析：分析：企业企业A A与企业与企业B B对市场的占领有先有后，因对市场的占领有先有后，因

3、此该此该博弈又称为：博弈又称为：“先来后到先来后到博弈博弈市场进入阻挠市场进入阻挠博弈的扩展形博弈的扩展形 Cont(0, 10) (-2, 3) (5, 5)打打进进不进不进打击打击和平和平企业企业B企业企业A 圈圈B B与圈与圈A A分别是分别是企业企业B B与企业与企业A A的的决策结或选择节决策结或选择节点点 ( (又称决策信又称决策信息集或选择信息息集或选择信息集集), ), 即两博弈方即两博弈方各自轮到选择各自轮到选择的位置的位置. . o博弈树博弈树n（1 1）结）结n（2 2）枝）枝n（3 3）信息集）信息集AABAAAB3.13.1.1.1动态博弈的表示法和特点动态博

4、弈的表示法和特点动态博弈动态博弈 (Dynamic Games)(Dynamic Games)的定义的定义: : 博弈方的策略选择和行动有先后次序博弈方的策略选择和行动有先后次序, ,而且后选择、后行动的博弈方在自己而且后选择、后行动的博弈方在自己选择、行动之前选择、行动之前, ,可以看到其他博弈方可以看到其他博弈方的选择、行动的选择、行动, ,甚至还包括自己的选择、甚至还包括自己的选择、行动的博弈行动的博弈. . 注：动态博弈各个博弈方的选择行动有先后次序，注：动态博弈各个博弈方的选择行动有先后次序，每个博弈方的选择行为会形成依次相连的时间每个博弈方的选择行为会形成依次相连的时间阶段，因此博

5、弈方的一次选择称为一个阶段，因此博弈方的一次选择称为一个“阶阶段段”。也有可能存在几个博弈方同时选择的情。也有可能存在几个博弈方同时选择的情况，这些博弈方的一次选择也构成一个况，这些博弈方的一次选择也构成一个“阶阶段段” ” 。一个动态博弈至少有两个阶段。因此态博弈又称一个动态博弈至少有两个阶段。因此态博弈又称为多阶段博弈为多阶段博弈(Multistage Games)(Multistage Games)3.1.2 3.1.2 动态博弈的基本特点动态博弈的基本特点一、动态博弈的策略一、动态博弈的策略1 1、完全信息静态博弈的策略和结果（略）、完全信息静态博弈的策略和结果（略）2 2、动态博弈的

6、策略特点：、动态博弈的策略特点：各博弈方的选择和行为各博弈方的选择和行为（1 1）行为有先后之分（）行为有先后之分（2 2）博弈方要多次选择且）博弈方要多次选择且每次选择有内在联系，是不能分割的整体。每次选择有内在联系，是不能分割的整体。注：各博弈方在整个博弈中轮到选择的每个阶段，注：各博弈方在整个博弈中轮到选择的每个阶段，针对以及由不同博弈方的这种计划构成的组合。针对以及由不同博弈方的这种计划构成的组合。这种计划就是动态博弈的博弈方的策略这种计划就是动态博弈的博弈方的策略Cont.二、动态博弈的结果二、动态博弈的结果指各博弈方在上面类型的策略构成的策略组合指各博弈方在上面类型的策略构成的策

7、略组合下，各博弈方的策略组合形成的一条联结各个下，各博弈方的策略组合形成的一条联结各个阶段的阶段的“路径路径”的结果。的结果。三、动态博弈的非对称性三、动态博弈的非对称性o先后次序决定动态博弈必然是非对称的。先后次序决定动态博弈必然是非对称的。o先选择、行为的博弈方常常更有利，有先选择、行为的博弈方常常更有利，有“先行先行优势优势”。3.2 3.2 可信性和纳什均衡的问题可信性和纳什均衡的问题3.2.1 3.2.1 相机选择和策略中的可信性问题相机选择和策略中的可信性问题3.2.2 3.2.2 纳什均衡的问题纳什均衡的问题3.2.3 3.2.3 逆推归纳法逆推归纳法3.2.1 3.2.1 相机

8、选择和策略中的可信性问题相机选择和策略中的可信性问题在实施中，只要符合自己的利益就可以在博弈在实施中，只要符合自己的利益就可以在博弈过程中改变计划。过程中改变计划。这种问题称为这种问题称为“相机选择相机选择”（Contingent play） “相机选择相机选择”的存在，使得博弈方在各个阶段、的存在，使得博弈方在各个阶段、各种情况下会采取行为的各种情况下会采取行为的“可信性可信性”产生怀产生怀疑？疑？一、开金矿博弈一、开金矿博弈I I的扩展形的扩展形模型描述：模型描述：甲开采一甲开采一价值价值4 4亿元的金矿亿元的金矿时缺时缺1 1亿元资金亿元资金, ,乙有乙有1 1亿元可亿元可投资资金。甲希

9、望乙能投资自投资资金。甲希望乙能投资自己己1 1亿亿元资金用于开矿，元资金用于开矿，并许诺在采到金子后与乙对半分成并许诺在采到金子后与乙对半分成问题：问题：乙是否该将钱投资给甲呢？乙是否该将钱投资给甲呢？乙甲（0，4）（2，2）（1，0）不投资投资分不分开金矿博弈二、有法律保障的开金矿博弈二、有法律保障的开金矿博弈II II的扩展形的扩展形 o确实可信的威胁确实可信的威胁通过法律武器通过法律武器确实可信的威胁确实可信的威胁（credible threatcredible threat）是指，博弈的参与人通过是指，博弈的参与人通过某种行动改某种行动改变自己的支付函数，变自己的支付函数，从而使得自

10、己的从而使得自己的威胁显得可信。参与人为改变博弈结威胁显得可信。参与人为改变博弈结果而采取的措施称为果而采取的措施称为承诺承诺（commitmentcommitment）不投资乙甲乙投资不分分（1，0）不打打（0，4）（1，0）（2，2）有法律保障的开金矿博弈分钱打官司都可信乙的完整策略：第一阶段乙的完整策略：第一阶段选择选择“投资投资”，若第二阶段甲若第二阶段甲选择选择“不分不分”，第三阶段选择，第三阶段选择“打打”甲的完整策略：第二阶段选择甲的完整策略：第二阶段选择“分分”。动态博弈的解。动态博弈的解。三、法律保障不足的开金矿博弈三、法律保障不足的开金矿博弈IIIIII的扩的扩展形展形

11、o不可信的空头威胁不可信的空头威胁乙在第三个阶段乙在第三个阶段“打官司打官司”的威胁的威胁是一种是一种不可信的不可信的空头威胁空头威胁 (incredible (incredible empty threats)empty threats)乙甲乙打（2，2）不分分不投资投资（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈分钱打官司都不可信3.2.2 3.2.2 纳什均衡的问题纳什均衡的问题博弈中（不投资博弈中（不投资- -不打，不打，不分）不分）和（投资和（投资- -打，分）打，分）都是纳什均衡。都是纳什均衡。但后者不可信，但后者不可信，不可能实现或不可能实现或稳定。稳定。为什么会

12、出现这种情为什么会出现这种情况呢？况呢？乙甲乙打（2，2）不分分不投资投资（0，4）（-1，0）不打（1，0）法律保障不足的开金矿博弈分钱打官司都不可信o结论：纳什均衡在动态博弈结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在在完全信息静态博弈中稳定的纳什均衡，在动态博弈中动态博弈中可能可能是不稳定的，不能作为预是不稳定的，不能作为预测的基础。测的基础。Cont.o根源：纳什均衡本身不能排除博弈方策略根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的

13、可信性问题态博弈的相机选择引起的可信性问题3.2.3 3.2.3 逆推归纳法逆推归纳法定义定义：从动态博弈的最后：从动态博弈的最后一个阶段博弈一个阶段博弈方的行为开始分析，方的行为开始分析，逐步倒推回前一个逐步倒推回前一个阶段相应博弈方的行为选择，阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，一直到第一个阶段的分析方法，称为称为“逆推归纳法逆推归纳法”乙甲（0，4）（2，2）（1，0）不投资投资分不分开金矿博弈逻辑基础逻辑基础：动态博弈中先行为的理性的博：动态博弈中先行为的理性的博弈方，在前面阶段选择行为时必然会考虑弈方，在前面阶段选择行为时必然会考虑后行为博弈方在后面阶段中将会怎样选

14、择行为，后行为博弈方在后面阶段中将会怎样选择行为，只有在博弈方的最后一个阶段选择的，不再只有在博弈方的最后一个阶段选择的，不再有后续阶段牵制的博弈方，才能直接做出明有后续阶段牵制的博弈方，才能直接做出明确选择。确选择。注：逆推归纳法是动态博弈分析最重要、注：逆推归纳法是动态博弈分析最重要、基本的方法基本的方法。3.3 3.3 子博弈和子博弈完美纳什均衡子博弈和子博弈完美纳什均衡3.3.1 3.3.1 子博弈子博弈3.3.2 3.3.2 子博弈完美纳什均衡子博弈完美纳什均衡3.3.1 3.3.1 子博弈子博弈定义定义：由一个动态博弈第一阶段以外的：由一个动态博弈第一阶段以外的某阶段开始的后续博弈

15、阶段构成某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所的，有初始信息集和进行博弈所需要的全部信息，能够自成一个需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原博弈的原博弈的一部分，称为原动态博弈的一个动态博弈的一个“子博弈子博弈”。注注: :(1)(1)并不是任何博弈都有子并不是任何博弈都有子博弈博弈(2)(2)博弈本身不是子博弈博弈本身不是子博弈（3 3）必须有一个明确必须有一个明确的初始的信息集的初始的信息集乙甲不投资投资不分分（1，0）（0，4）（2，2）乙（-1，0）3.3.2 3.3.2 子博弈完美纳什均衡子博弈完美纳什均衡19651965年年seltonselto

16、n定义：如果一个完美信息的动态博弈中，定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个略组合称为该动态博弈的一个“子博子博弈完美纳什均衡弈完美纳什均衡”。o子博弈完美纳什均衡能够排除均衡策略中子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。不可信的威胁和承诺，因此是真正稳定的。o逆推归纳法逆推归纳法是求完美信息动态博弈子博弈是求完美信息动态博弈子博弈完美纳什均衡的基

17、本方法。完美纳什均衡的基本方法。3.4 3.4 几个经典动态博弈模型几个经典动态博弈模型3.4.1 3.4.1 寡占的斯塔克博格寡占的斯塔克博格( (Stackelberg)Stackelberg)模型模型3.4.2 3.4.2 讨价还价博弈讨价还价博弈3.4.3 3.4.3 委托委托代理理论代理理论3.4.43.4.4委托委托代理理论（续）代理理论（续）3.4.1 3.4.1 寡占的斯塔克博格寡占的斯塔克博格( (Stackelberg)Stackelberg) 模型模型假设市场上有两个厂商，决策内容是产量，假设市场上有两个厂商，决策内容是产量，一个是领头一个是领头( (leader)lea

18、der)企业，一个是跟随企业，一个是跟随( (follower)follower)企业。领头企业先选择自己的企业。领头企业先选择自己的产量，跟随企业根据领头企业的产量选择，产量，跟随企业根据领头企业的产量选择，选择自己的产量。选择自己的产量。显然，他们选择有先有后，所以是一个显然，他们选择有先有后，所以是一个动态博弈。动态博弈。斯塔克博格斯塔克博格( (Stackelberg)Stackelberg)模型模型假设条件假设条件: : 在一个寡头市场上两企业生产销售同质产品在一个寡头市场上两企业生产销售同质产品, ,市场总产量市场总产量Q Q = =q q1 1+ +q q2 2 , ,企业企

19、业1 1是领头是领头( (leader)leader)企企业业, , 企业企业2 2是追随是追随( (follower)follower)企业企业. .2. 2. 市场出清价格市场出清价格 P P=8 - =8 - QQ3. 3. 生产无固定成本生产无固定成本, ,边际成本边际成本 c c= =c c1 1= =c c2 2=2=24. 4. 二企业先后决定各自的产量二企业先后决定各自的产量q q1 10, 0, q q2 2 0 0 问题：问题：两个企业应如何决策？两个企业应如何决策？该动态的寡头市场产量博弈是一无限策略动态该动态的寡头市场产量博弈是一无限策略动态博弈博弈Stackelbe

20、rgStackelberg模型分析模型分析企业企业1 1的得益的得益( (利润利润): ):u u 1 1 ( (q q1 1, , q q2 2) ) = =P Pq q1 1c c1 1q q1 1 = (8- = (8-QQ) ) q q1 1 - 2- 2q q1 1 = 6 = 6 q q1 1- - q q1 1 q q2 2- - q q1 12 2 企业企业2 2的得益的得益: :u u 2 2 ( (q q1 1, , q q2 2) ) = = P Pq q2 2 c c2 2q q2 2 = (8-= (8-QQ) ) q q2 2 - 2- 2q q2 2 = 6 =

21、6 q q2 2- - q q1 1 q q2 2- - q q2 22 2用逆推归纳法用逆推归纳法求子博弈完美纳什均衡求子博弈完美纳什均衡在第在第2 2个阶段个阶段, ,企业企业2 2是在企业是在企业1 1选择定选择定q q1 1下求解下求解: :max max q q2 2 u u 2 2 ( (q q1 1, , q q2 2) ) = max = max q q2 2 (6 (6 q q2 2- - q q1 1 q q2 2- - q q2 22 2) ) 一阶条件：一阶条件： 6- 6- q q1 1 - 2- 2q q2 2=0=0有有企业企业2 2对企业对企业1 1产量的反应

22、函数产量的反应函数: :q q2 2= ( 6 - = ( 6 - q q1 1 ) /2 = 3 - ) /2 = 3 - q q1 1 /2 (1)/2 (1)Cont.将式将式(1)(1)代入企业代入企业1 1的的得益函数的的得益函数u u 1 1 ( (q q1 1, , q q2 2) ) = 6 = 6 q q1 1- - q q1 1 q q2 2- -q q1 12 2 =3 =3 q q1 1 q q1 12 2 /2/2 max max q q1 1 (3 (3 q q1 1 q q1 12 2 /2) /2) 一阶条件：一阶条件： 3 - 3 - q q1 1* *= 0

23、= 0有有 q q1 1* *=3 (=3 (单位单位), ), q q2 2* *=3 - =3 - q q1 1* * /2 = 1.5 (/2 = 1.5 (单位单位), ), 使使 u u 1 1= 4.5 , = 4.5 , u u 2 2 = 2.25= 2.25使市场总产量使市场总产量 Q Q = =q q1 1+ +q q2 2=4.5, =4.5, 得二企业总得益得二企业总得益U U = = u u 1 1 + + u u 2 2 =4.5+2.25=6.75=4.5+2.25=6.75模型的均衡解模型的均衡解StackelbergStackelberg寡头竞争模型的子博弈完

24、美纳什寡头竞争模型的子博弈完美纳什均衡解均衡解: : 企业企业1 1在第在第1 1个阶段选择产量个阶段选择产量q q1 1为为3 3 单位单位, , 企业企业2 2在第在第2 2个阶段选择产量个阶段选择产量q q2 2为为1.51.5单位单位产量产量得益得益厂商厂商1 3单位单位 4.5厂商厂商2 1.5单位单位 2.25先行优势信息的悖论信息的悖论在在StackelbergStackelberg模型中企业模型中企业1 1与与2 2得益得益: :u u1 1= 4.5 = 4.5 u u2 2 = 2.25= 2.25 信息不对称的博弈中信息不对称的博弈中, ,信息较多的博弈方有可信息较多

25、的博弈方有可能吃亏能吃亏即是：尽管跟随企业看到了领头企业的决策，即是：尽管跟随企业看到了领头企业的决策，掌握了更多的信息，但最终收益反而低。掌握了更多的信息，但最终收益反而低。与与CournotCournot模型的比较模型的比较与与CournotCournot静态博弈模型的比较静态博弈模型的比较 QQs s=3+1.5=4.5 =3+1.5=4.5 QQc c=2+2=4=2+2=4P Ps s=8 - =8 - QQs s=3.5 =3.5 P Pc c=8 - =8 - QQc c=4 =4 U Us s= = u us s1 1 + + u us s2 2 =4.5+2.25=6.75

26、=4.5+2.25=6.75 U Uc c= = u uc c1 1 + + u uc c2 2 =4 + 4 = 8=4 + 4 = 8文献阅读文献阅读中国中国3G3G时代运营策略分析时代运营策略分析供应链企业的竞争与合作供应链企业的竞争与合作电力市场寡头竞争模型的市场力分析比较电力市场寡头竞争模型的市场力分析比较3.4.23.4.2讨价还价与耐心讨价还价与耐心BargainingBargaining问题的普遍性问题的普遍性o几乎所有的交易都涉及讨价还价：几乎所有的交易都涉及讨价还价：o买卖双方之间；买卖双方之间；o雇员与顾主之间；雇员与顾主之间；o合伙人之间；合伙人之间；o竞争企业之

27、间竞争企业之间o夫妻之间；夫妻之间；o政治领域之间；政治领域之间；o中央政府与地方政府；中央政府与地方政府；o国家之间；国家之间；所有讨价还价的共同之处所有讨价还价的共同之处o达成某种协议是当事人的共同利益，但他们之间在达成某种协议是当事人的共同利益，但他们之间在究竟达成哪一个协议的问题上存在利益冲突；协议究竟达成哪一个协议的问题上存在利益冲突；协议的多重行可能阻止任何协议的出现；的多重行可能阻止任何协议的出现；o典型的典型的“合作与竞争合作与竞争”问题；问题；o合作意味着存在着帕累托改进，但不同的当事人偏合作意味着存在着帕累托改进，但不同的当事人偏好不同的帕累托状态。好不同的帕累托状态。o不

28、同与集体选择（唯一均衡）和其他多重均衡；不同与集体选择（唯一均衡）和其他多重均衡；o不是零和博弈。不是零和博弈。两种思路两种思路o合作博弈思路（合作博弈思路（cooperative game approach)cooperative game approach)：参与人联合作出决定，协议对双方具有约束力；强参与人联合作出决定，协议对双方具有约束力；强调的是集体理性；调的是集体理性；o非合作博弈思路非合作博弈思路(non-cooperative approach)(non-cooperative approach)：每个参与人独立决策，协议是一个纳什均衡，没有每个参与人独立决策，协议是一个纳什均

29、衡，没有约束力；强调的是个人理性；约束力；强调的是个人理性；o注意：这里注意：这里“合作合作”与与“非合作非合作”指的是指的是“联合决联合决策策”(joint action)(joint action)和和“独立决策独立决策”(separate (separate action)action)。纳什合作解纳什合作解o考虑一个画家与拍卖商之间的讨价还价问题：考虑一个画家与拍卖商之间的讨价还价问题：如果画家自己出售画，可得如果画家自己出售画，可得10001000元；如果元；如果拍卖商干其他事情（如拍卖别人的画），收拍卖商干其他事情（如拍卖别人的画），收入是入是500500元；如果画家委托拍卖商出售

30、画，元；如果画家委托拍卖商出售画，画的价格是画的价格是30003000元。元。o他们之间如何分配这他们之间如何分配这30003000元？元？o请同学们给出建议。请同学们给出建议。问题的一般化问题的一般化o设想两个人，设想两个人，A A和和B B，之间要就总价值等于，之间要就总价值等于V V的分配问题讨价还价；如果他们之间能达成的分配问题讨价还价；如果他们之间能达成协议，协议，V V按照协议规定分配；如果不能达成按照协议规定分配；如果不能达成协议，协议，A A得到得到a a，B B得到得到b b。(a,b)(a,b)被被称称“威胁威胁点点”或非合作状态（或非合作状态（status quo),st

31、atus quo),是不能达是不能达成协议是的最好选择成协议是的最好选择. .oa+bV; S=V-a-ba+bV; S=V-a-b是合作带来的剩余是合作带来的剩余(surplus)(surplus)分配规则分配规则o我们用我们用x x表示表示A A得到的价值，得到的价值，y y表示表示B B得到的得到的价值，假定价值，假定A A和和B B分别从剩余价值分别从剩余价值S S中达到中达到h h和和k k的份额，那么：的份额，那么：ox=a+hx=a+h（V-a-bV-a-b）；）；x-a=hx-a=h（V-a-bV-a-b）oy=b+ky=b+k（V-a-bV-a-b）；）；y-b=ky-b=k

32、（V-a-bV-a-b）hkaxby分配方法之一分配方法之一：纳什谈判模型o对对n2的多人谈判问题，的多人谈判问题，Nash-Harsanyi谈判模型为：谈判模型为：o上述模型的解称作上述模型的解称作Nash平衡解。平衡解。 , 1max():,1,2,iniixiiiixcST xcin分配方法之二分配方法之二：等效用法等效用法(Kalai,1975) o对一般的非规范化谈判问题，设威胁点为对一般的非规范化谈判问题，设威胁点为(Xc,Yc)，谈判集为，谈判集为x=g(y)，谈判集中甲、，谈判集中甲、乙两个谈判者的最大效用分别是乙两个谈判者的最大效用分别是Xmax与与Yman，则，则maxma

33、x()()ccccxxxxyyyyxgy协议点为方程组的解协议点为方程组的解 o示例示例用等效用法求解图用等效用法求解图13.2之（之（b）所示）所示的谈判问题的谈判问题u2u1B (0.5,0.5)11R1(a)u2u111R2(b)B (0.5,0.5)图13.2 对公理四的质疑R1AAOOo用有关数值代入可得用有关数值代入可得o 该方程组的解为该方程组的解为(2/3，1/3)，它就是用，它就是用等效用法求得的协议点。等效用法求得的协议点。分配方法之三分配方法之三：中间中间中间法中间法o略固定谈判成本固定谈判成本o谈判的另一类成本是固定成本，如劳资谈判谈判的另一类成本是固定成本，如劳资

34、谈判拖延的话，企业可能要为客户支付违约金。拖延的话，企业可能要为客户支付违约金。o这类似于蛋糕随时间而变小。这类似于蛋糕随时间而变小。谈判成本不同谈判成本不同o如果如果A A每次谈判成本是每次谈判成本是c c，B B每次的谈判成本每次的谈判成本是是d d；o如果如果c=dc=d，结果是不确定的；，结果是不确定的；o如果如果cd, Acdcd，B B 将得到整个蛋糕；将得到整个蛋糕；外部机会成本外部机会成本o固定成本的一种特殊形式是外部机会损失：固定成本的一种特殊形式是外部机会损失：如果谈判期间，外部机会就不能利用。如果谈判期间，外部机会就不能利用。o此时，外部机会损失越大，对谈判越不利；此时，

35、外部机会损失越大，对谈判越不利；o考虑夫妻离婚谈判。考虑夫妻离婚谈判。信息与谈判信息与谈判o原因是：我们前面假定当事人具有完全信息：原因是：我们前面假定当事人具有完全信息：知道价值知道价值V V和每个人的机会成本或谈判砝码，和每个人的机会成本或谈判砝码，每个人的耐心，谈判的时限等等。并且，每每个人的耐心，谈判的时限等等。并且，每个人知道每个人知道；每个人知道每个人知个人知道每个人知道；每个人知道每个人知道每个人知道，如此等等。道每个人知道，如此等等。o但在现实中，谈判面临的最大问题是信息不但在现实中，谈判面临的最大问题是信息不完全。完全。o价值价值V V，生产成本，谈判砝码（，生产成本，谈判砝

36、码（a a，b b），耐），耐心，机会成本；心，机会成本；谈判与信息谈判与信息o谈判的过程实际上是信息揭示和窥探的过程；谈判的过程实际上是信息揭示和窥探的过程；oScreening and SignalingScreening and Signalingo( (沈阳的砍价公司）沈阳的砍价公司）o由于信息不对称，谈判的结果并不总是帕累由于信息不对称，谈判的结果并不总是帕累托最优的；事实上，许多帕累托改进没有被托最优的；事实上，许多帕累托改进没有被利用。利用。非合作博弈思路非合作博弈思路o谈判实际上是一个讨价还价的过程，一个动谈判实际上是一个讨价还价的过程，一个动态博弈；态博弈；o用非合作博弈的方

37、法更合理；用非合作博弈的方法更合理；轮流出价谈判轮流出价谈判o基本特征：两人，基本特征：两人，1 1和和2 2，分一块钱；，分一块钱；1 1先出先出价，价，2 2决定接受还是拒绝；如果接受，按照决定接受还是拒绝；如果接受，按照A A提出的方案分配，谈判结束；如果提出的方案分配，谈判结束；如果2 2拒绝，拒绝，2 2提出方案，提出方案，1 1决定接受还是拒绝；如果接受，决定接受还是拒绝；如果接受，按按2 2的方案分配，谈判结束；如果不接受，的方案分配，谈判结束；如果不接受，再由再由1 1提出方案；如此等等。提出方案；如此等等。o博弈有无穷多个纳什均衡，但精炼纳什均衡博弈有无穷多个纳什均衡，但精炼

38、纳什均衡可能是唯一的。可能是唯一的。变量说明变量说明o我们先考虑没有固定谈判成本的情况；我们先考虑没有固定谈判成本的情况；o假定假定nx x：1 1得到的份额；得到的份额；ny y：2 2得到的份额；得到的份额；x+y=1x+y=1ns s：1 1的无风险利率；的无风险利率； a=1/ a=1/（1+s1+s）：）：1 1的贴现因子；的贴现因子；nr r：2 2的无风险利率；的无风险利率；nb=1/b=1/（1+r1+r）：）：2 2的贴现因子；的贴现因子；有限期谈判有限期谈判o如果只有一次谈判：逆向归纳意味着精炼纳什如果只有一次谈判：逆向归纳意味着精炼纳什均衡是：均衡是：x=1x=1，y=0

39、y=0；o如果允许谈判两次：精炼纳什均衡是：如果允许谈判两次：精炼纳什均衡是：x=1-bx=1-b，y=by=b；如果贴现率不很大，就有后动优势；如果贴现率不很大，就有后动优势；o如果谈判三次，如果谈判三次，PNEPNE是：是：nx=1-b(1-a), y=b(1-a);x=1-b(1-a), y=b(1-a);o如果谈判四次，如果谈判四次，PNEPNE是：是：nx=1-b(1-a(1-b), y=b(1-a(1-b) x=1-b(1-a(1-b), y=b(1-a(1-b) 一般结论一般结论o如果两人的贴现率都不是很高，也就是对未如果两人的贴现率都不是很高，也就是对未来有足够的耐心，谈判有来

40、有足够的耐心，谈判有“后动优后动优势势”(last-mover advantage)(last-mover advantage)（在奇数次谈（在奇数次谈判，先动和后动是一个人）判，先动和后动是一个人）; ;但这个优势随但这个优势随允许谈判次数的增加而递减；允许谈判次数的增加而递减；o无论如何，一个人对未来越没有耐心，得到无论如何，一个人对未来越没有耐心，得到的越少：的越少：无限次谈判无限次谈判o没有最后一次，我们不能用逆向归纳法求解，没有最后一次，我们不能用逆向归纳法求解，但可以使用类似的思路得到均衡解（但可以使用类似的思路得到均衡解（x x，y y）；）；o假定在时间假定在时间t3t3时，时

41、，1 1出价，得到出价，得到x x；时间；时间t-1t-1时，时，2 2出价，给出价，给1 1为为axax就可以了就可以了,2,2给得到给得到y=1-axy=1-ax；时间；时间t-2t-2时，时，1 1出价，给出价，给2 2为为b(1-ax)b(1-ax)就可以了，自己得到就可以了，自己得到x=1-b(1-ax)x=1-b(1-ax)精炼纳什均衡解精炼纳什均衡解ababyabbx1)1 ( ;11基本结论基本结论o无限次谈判具有无限次谈判具有“先动优势先动优势”(first-(first-mover advantage);mover advantage);o一个人的耐心越大（贴现率越小），一

42、个人的耐心越大（贴现率越小），谈判中的优势就越大。谈判中的优势就越大。如果如果B B先出价先出价abayabbax11 ;1)1 (3.4.2 3.4.2 讨价还价博弈讨价还价博弈o三三回合讨价还价博弈回合讨价还价博弈Bargaining:Bargaining: 假设有甲乙两假设有甲乙两方方就如何分割就如何分割1000010000元进行元进行谈判，并且定下规则：谈判，并且定下规则：由甲由甲方方先提出一个分割方案，对此，乙先提出一个分割方案，对此，乙方方可以接受也可以接受也可以拒绝可以拒绝; ;如果乙如果乙方方拒绝，则乙拒绝，则乙方方自己提出另一个分自己提出另一个分割方案，让甲割方案，让甲方方选

43、择接受与否。如此循环。选择接受与否。如此循环。在循环过程中，只要有任何一方接受对方的方案在循环过程中，只要有任何一方接受对方的方案, ,博博弈就告结束弈就告结束. .如果方案被拒绝，则被拒绝的方案与以如果方案被拒绝，则被拒绝的方案与以后的讨价还价过程不再有关系。后的讨价还价过程不再有关系。讨价还价博弈讨价还价博弈( (ContCont) )每次一方提出一个方案和另一方选择是否接每次一方提出一个方案和另一方选择是否接受为一个回合。讨价还价每多进行一个回合，受为一个回合。讨价还价每多进行一个回合，由于谈判费用和利息损失等，双方的得益都由于谈判费用和利息损失等，双方的得益都要打一次折扣，折扣率为要打

44、一次折扣，折扣率为 (0(0 1) 2 2(10000-(10000-S S)= )= 1000010000 2 2- 2 2S S 第一回合：甲的选择甲乙开始就知道，自己的得益是甲乙开始就知道，自己的得益是 2 2S S，也知也知道乙会在第二回合出价道乙会在第二回合出价S S2 2= = S S ，甲的得益为甲的得益为 2 2S ,S ,乙的得益为乙的得益为 (10000-S(10000-S2 2)= )= 10000 10000 - - 2 2S S。因此甲在第一个回合就给乙因此甲在第一个回合就给乙10000 10000 - - 2 2S S，同时自己所得比同时自己所得比 2 2S S多，

45、就比较理想。多，就比较理想。因此甲希望出价因此甲希望出价S S1 1使得满足使得满足10000-S10000-S1 1= = 10000 10000 - - 2 2S S 有有S S1 1= = 10000(1 - 10000(1 - )+ )+ 2 2S S 2 2S S 讨价还价博弈的讨价还价博弈的均衡解均衡解三三回合讨价还价博弈模型的子博弈完美纳什均回合讨价还价博弈模型的子博弈完美纳什均衡解衡解: : 在甲在甲方第三方第三回合会出回合会出S, S, 且在且在乙方必须接受下乙方必须接受下, ,在第一在第一回合中甲回合中甲方方出价出价: : S S1 1 =10000-10000=1000

46、0-10000 + 2 2S S, 乙乙方方接受接受此时此时, ,甲方得益甲方得益S S1 1 = = 10000-1000010000-10000 + 2 2S S, 乙方得益乙方得益10000- 10000- S S1 1 =10000=10000 - 2 2S S三回合讨价还价博弈结果的讨论三回合讨价还价博弈结果的讨论甲方得益甲方得益S S1 1 = = 10000-1000010000-10000 + + 2 2S S = 10000-10000 = 10000-10000 + + 2 21000010000 = = 10000(1-10000(1- + + 2 2) ) 乙方得益

47、乙方得益10000- 10000- S S1 1 =10000 =10000 - - 2 2S S益越大甲的得益越小，乙的得越大，时，当益越小甲的得益越大，乙的得越大，时，当5 . 0015 . 03.4.3 3.4.3 委托委托( (Principle)Principle)代理代理( (Agents)Agents)理论理论一、委托一、委托代理关系代理关系o经济活动和社会活动中有很多委托人经济活动和社会活动中有很多委托人代代理人关系，有明显的，也有隐蔽的。经理和理人关系，有明显的，也有隐蔽的。经理和员工、店主和店员、客户和律师、市民和政员工、店主和店员、客户和律师、市民和政府、基金购买者和基金

48、管理人等都是。府、基金购买者和基金管理人等都是。o委托人委托人代理人的关键特征：不能直接控代理人的关键特征：不能直接控制，监督不完全，信息不完全，利益相关性制，监督不完全，信息不完全，利益相关性o委托人委托人代理人涉及问题：激励机制设计、代理人涉及问题：激励机制设计、机制设计理论，委托合同设计问题等机制设计理论，委托合同设计问题等二、无不确定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0R(0),0122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束： w(E)-E w(S)-S w(E) w(S)+E-S参与约束：22R(E)-w(E

49、), w(E)-E拒绝接受拒绝接受R(0),0R(S)-w(S), w(S)-SR(0),0接受：w(E)-E0接受：w(S)-S0参与约束o委托人的选择11不委托委托委托R(S)-w(S), w(S)-SR(0),0R(E)-w(E), w(E)-E不委托R(0),0委托： R(E)-w(E) R(0)不委托： R(E)-w(E) R(0)不委托： R(S)-w(S) 0不委托： 0.1*20-w(S) +0.9*10-w(S)0不委托：0.9*20-w(E)+0.1*10-w(E)0.1*w(20)-S+0.9*w(10)-S接受：0.9*w(20)-E+0.1*w(10)-E00.1*w

50、(20)-S+0.9*w(10)-S0委托：0.9*20-w(20)+0.1*10-w(10)0 0.1*20-w(20)+0.9*10-w(10)0激励相容约束促使代理人努力的激励相容约束、参与约束，以及委托人选择委托的条件参与约束对于委托人来说，就是要根据上述两个条件，以及 E、S的值，选择最佳的工资水平w(20)和w(10)，或者它们的差额w(20) -w(10)五、选择报酬和连续努力水平的委托人代理人博弈 ( )( ) ( )( ) ( )( )w R eC eUw R eC eUw R eC eU参与约束：委托人当然希望支付的工资越少越好，于是参与约束为：从而：Cont.max()

51、( )max( )max( ): max()( )( )( )ewwew ReC eR ewR ewstw ReC ew R eC eU激励相容约束：代理人选择努力希望他的收益越大越好，于是有：而委托人也希望他的收益越大越好：即：综合上面得到该委托代理模型：应用：店主和店员的问题应用：店主和店员的问题商店的利润商店的利润，是均值为是均值为0 0的随机变量的随机变量店员的负效用店员的负效用，是店员的努力是店员的努力机会成本为机会成本为1 1店主采用的报酬计算公式店主采用的报酬计算公式店员的得益店员的得益店员期望得益为店员期望得益为店主的得益为店主的得益为 eR42eC (4)SRe4(4

52、) 4(1)(1)eee 24 eee2(4)ee参与约束：参与约束：激励相容：激励相容：店主的得益函数：店主的得益函数：综上，模型为：综上，模型为：2(4)1ee 2max(4)eee 22max44:max(4)(4)1eEeestEeeEee cont.假设店员和店主都是风险中性。假设店员和店主都是风险中性。模型变为模型变为将将(2)(3)(2)(3)式代入式代入(1)(1)式式: :(,)2max44(1):2()(2)41eesteee 求解激励相容约束（参与约束变形）(3)2max81 4(4) Cont.o(4)(4)式的一阶条件：式的一阶条件： =1,=1,从而：从而：e=2,

53、 =-3.e=2, =-3.So :So :工资合同：工资合同：-3+ -3+ R= R= -3+-3+R R 最有努力水平：最有努力水平： e e* *=2=23.4.4. 3.4.4. 风险规避代理人确定性等价收风险规避代理人确定性等价收益的计算益的计算o代理人追求的不是收益的最大化，而是收益代理人追求的不是收益的最大化，而是收益所带来的效用的最大化，代理人会在既定的所带来的效用的最大化，代理人会在既定的约束条件下选择适当的行动约束条件下选择适当的行动a a使自己的期望使自己的期望效用最大化。效用最大化。o现在假定代理人的效用函数为现在假定代理人的效用函数为 ( )rxu xe Conto

54、对于绝对分险规避程度对于绝对分险规避程度，。如果代理人喜欢冒险，则效用函数时。如果代理人喜欢冒险，则效用函数时凸函数，凸函数，；如果代理人是分险中性的，；如果代理人是分险中性的，效用函数是线性的，效用函数是线性的，；如果是规避的，；如果是规避的，效用函数为凹函数，效用函数为凹函数，。这一函数的一。这一函数的一个重要特征就是可以用值个重要特征就是可以用值来度量代理人来度量代理人的风险规避程度。的风险规避程度。( )( )( )au xR xu x ( )aR xr( )0aR x ( )0aR x ( )0aR x rConto如果代理人的效用函数的形式为如果代理人的效用函数的形式为

55、，其中收益服从均值为其中收益服从均值为、方差为、方差为的正的正态分布，那么：态分布，那么：( )rxu xe ( )E x( )V x2( )( ) ( )2 ( )21( ( )2( )x E xrV xr E xrxV xEu xeedxeV xConto定义代理人在不确定条件下的收益的确定性定义代理人在不确定条件下的收益的确定性等值（等值（certainty equivalentcertainty equivalent）为）为，由，由于于，所以，所以o即即。CE()( ( )u CEE u x( )( )2rV xr E xrCEee 1( )( )2CEE xrV xCon

56、to采取适当的行动使得自己的确定性等值最大采取适当的行动使得自己的确定性等值最大化即化即1maxmax ( )( )2CEE wc arV wc a3.4.53.4.5委托委托-代理理论代理理论( (续续) )委托委托-代理问题试图模型化如下一类问题：一个参代理问题试图模型化如下一类问题：一个参与人（称为委托人）想使另一个参与人（称为代理与人（称为委托人）想使另一个参与人（称为代理人）按照委托人的利益选择行动，但委托人不能直接人）按照委托人的利益选择行动，但委托人不能直接观察代理人选择了什么行动，能观测到的只是另一些观察代理人选择了什么行动，能观测到的只是另一些变量变量, ,这些变量由代理人的

57、行动和外生的随机因素共同这些变量由代理人的行动和外生的随机因素共同决定。决定。委托人的问题是如何根据这些观测到的信息来奖惩委托人的问题是如何根据这些观测到的信息来奖惩代理人，以激励其选择对委托人最有利的行动。代理人，以激励其选择对委托人最有利的行动。Cont.o用用A A表示代理人所有可选择的行动的组合，表示代理人所有可选择的行动的组合，a Aa A表示代理人的一个特定行动。注意，尽管再许多表示代理人的一个特定行动。注意，尽管再许多模型中模型中a a被简单地假定为代表工作努力水平的一维被简单地假定为代表工作努力水平的一维变量，理论上讲，行动变量，理论上讲，行动a a可以是任何维度的决策向可以

58、是任何维度的决策向量。量。o比如说，如果比如说，如果a a（a1,a2a1,a2）, ,一种可能的解释是一种可能的解释是a1a1和和a a分别代表代理人花在分别代表代理人花在“数量数量”和和“质量质量”上的工作时间。不过，在本章中，未来分析的方上的工作时间。不过，在本章中，未来分析的方便，我们假定便，我们假定a a是代表代理人努力水平的一维变量。是代表代理人努力水平的一维变量。 Conto令令是不受代理人（和委托人）控制的外生随机是不受代理人（和委托人）控制的外生随机变量（称为变量（称为“自然状态自然状态”），），是是的取值范围，的取值范围，在在上的分布函数和密度函数分别为上的分布函数和

59、密度函数分别为GG（）和和g g（）。）。o在代理人选择行动在代理人选择行动a a后，外生变量后，外生变量实现。实现。a a和和共同决定一个可观测的结果共同决定一个可观测的结果x x（a a，）和一个）和一个货币收入（货币收入（“产出产出”）（a a，），其中），其中（a a，）的直接所有权属于委托人。）的直接所有权属于委托人。 Conto假定假定是是a a的严格递增的凹函数（即给定的严格递增的凹函数（即给定，代，代理人工作越努力，产出越高，但努力的边际产理人工作越努力，产出越高，但努力的边际产出递减），出递减），是是的严格增函数（即较高的的严格增函数（即较高的代代

60、表较有利的自然状态）。表较有利的自然状态）。o委托人的问题是设计一个激励合同委托人的问题是设计一个激励合同s s（x x），根），根据观测到的据观测到的x x对代理人进行奖惩。要分析的问题对代理人进行奖惩。要分析的问题是是s s（x x）具有什么样的特征？）具有什么样的特征？Conto假定委托人和代理人的假定委托人和代理人的v vN NMM期望效用函数分期望效用函数分别为别为v(-s(x)v(-s(x)和和u(s()-c(a)u(s()-c(a)，其中，其中o即委托人和代理人都是风险规避者或风险中性者，即委托人和代理人都是风险规避者或风险中性者，努力的边际负效用是递增的。委托人和代理努力的边际

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论3完全且完美信息动态博弈

文档简介

温馨提示

最新文档

评论

博弈论3完全且完美信息动态博弈

文档简介

温馨提示

最新文档

评论

相关文档