第三章完全且完美信息动态博弈_第1页
第三章完全且完美信息动态博弈_第2页
第三章完全且完美信息动态博弈_第3页
第三章完全且完美信息动态博弈_第4页
第三章完全且完美信息动态博弈_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章完全且完美信息动态博弈

本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型。本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论逆向归纳法的应用例子

私奔博弈

在我国汉代,有个青年作家叫司马相如,有个年轻的寡妇叫卓文君。但这门亲事遭到文君父亲的反对。父亲对文君说,你若跟司马相如结婚,那么就将脱离父女关系。现在,卓文君应该怎样选择?是屈从父亲,还是跟心上人结婚?海盗分赃

话说有5个海盗抢来了100枚金币,大家决定分赃的方式是:由海盗一提出一种分配方案。如果同意这种方案的人达到半数,那么该提议就通过并付诸实施;若同意这种方案的人未达半数,则提议不能通过且提议人将被扔进大海喂鲨鱼,然后由接下来的海盗继续重复提议过程,假设每个海盗都绝顶聪明,也不相互合作,并且每个海盗都想尽可能多得到金币,那么,第一个提议的海盗将怎样提议即可以使得提议被通过又可以最大限度得到金币呢?如果他们就是第一个海盗会怎么分。答案五花八门,但是大多数是表示平均分—这可能是现实中的情况,公平观念在博弈中发挥着作用。但是标准博弈论是研究人们完全理性的情况下极端复杂的策略互动后果,这里的平均分配并不符合标准博弈论的逻辑。那么答案究竟是什么呢?使用逆向归纳法可以求解如下:首先,考虑只剩下最后的海盗五,显然他会分给自己100枚,并赞成自己。再回溯到只剩下海盗四和海盗五的决策,海盗四分给自己100枚并赞成五自己;海盗五被分得0枚,即使反对也无用。回到海盗三,海盗三可以分给海盗五的决策1枚得到海盗五的同意;分给自己99枚,自己也同意;分给海盗0枚,海盗四反对但无用。回到海盗二,海盗二分给海盗四1枚得的海盗四同意;分给自己99枚,自己也同意;海盗三、五分得0枚,他们会反对但反对没有用。回到海盗一,他可以分给海盗三、五各1枚,获得海盗三、五的同意;分给自己98,自己也同意;分给海盗二、四各0枚,他们会反对但反对不起作用。因此这个海盗分赃问题的答案是(98,0,1,0,1)。还可以演化不同的版本。(1)如果要求包括提议海盗在内的所有海盗过半数(超过1/2)同意才能使提议通过,那么海盗一应该怎么提方案?(2)如果要求提议海盗之外的海盗过半数同意才能通过,那么海盗一又该怎么提方案?(3)或者海盗的数目增加到10个、100个,海盗一又怎么提方案?问题1(97,0,1,2,0)或(97,0,1,0,2)问题2(97,0,1,1,1)问题3逐渐增加海盗的数量,将会发现答案是有规律可循的。3.1动态博弈的表示法和特点3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点3.1.1阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择行为例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合,构成一条路径得益对应每条路径,而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利,有“先行优势”。3.2可信性和纳什均衡的问题3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题3.2.3逆推归纳法3.2.1相机选择和策略中的可信性问题不同版本的开金矿博弈——分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信3.2.2纳什均衡的问题第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。博弈的策略形:分不分借打2,2-1,0借不打2,20,4不借1,01,0结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.2.3逆推归纳法定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3子博弈和子博弈完美纳什均衡3.3.1子博弈3.3.2子博弈完美纳什均衡3.3.1子博弈定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2子博弈完美纳什均衡定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4几个经典动态博弈模型3.4.1寡占的斯塔克博格模型3.4.2劳资博弈3.4.3讨价还价博弈3.4.4委托人—代理人理论3.4.1寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。222126qqqq--=产量得益厂商13单位4.5厂商21.5单位2.25先行优势寡占的斯塔克博格模型由于本博弈是一个动态博弈,因此我们考虑用递推归纳法来分析。根据逆推归纳法的思路,首先分析第二阶段厂商2的决策,为此,我们先假设厂商1的选择为q1,是已经确定的,这实际上就是在q1确定下来求使u2实现最大值的q2这样的必须满足:

6-2q2-q1=0

即q2=(1/2)(6-q1)=3-q1/2(1)

实际上它就是厂商2对厂商1的策略的一个反应函数。厂商1知道厂商2的这种决策思路,因此他在选择q1的知道q2*将是根据(1)代入他自己得益函数,然后再求最大值。即求使寡占的斯塔克博格模型寡占的斯塔克博格模型与两寡头同时选择的古诺模型的结果u1=u2=4相比,斯塔伯克模型的结果有很大不同。它的产量大于古诺模型,价格低于古诺模型,总利润(两厂商得益之和)小于古诺模型。但是,厂商1的得益却大于古诺模型中厂商1的得益,更大于厂商2的得益。这当然是因为该模型中两厂商所处地位不同,厂商1具有先动的主动,且他又把握住理性的厂商2总归会根据自己的选择q1而合理抉择的心理,选择较大的产量得到了好处。

本博弈也揭示了这一一个事实,即在信息不对称的博弈中,信息较多的博弈方(如厂商2,他在决策之前可先知道厂商1的实际选择,因此知道较多的信息)不一定能得到较多的得益。3.4.2劳资博弈先由工会决定工资率,再由厂商决定雇用多少劳动力RL0WL厂商的反应函数R(L)斜率为WLW0工会的误差异曲线序贯讨价还价和耐心

在价格谈判中最常见的谈判方式是序贯讨价还价。它的规则是由甲先提议分配方案;然后,乙若同意则实施该方案,否则由乙提议方案;然后再由甲表示是否同意,若不同意则由甲提方案;然后再由乙来表决同意否,若不同意则由乙提方案…如此往复,直到谈判结束(达成协议或谈判破裂)。

序贯讨价还价分有限回合和无限回合两种情况。对于有限回合情况,不管多少次,都可以用逆向归纳方法来推导其均衡结果。由于序贯谈判中会耗费时间,面临机会成本,因此我们不妨假设分配的物品不是蛋糕,而是冰激凌---它会随着时间而融化,假设冰激凌重量为100克,每一个回合冰激凌都会融化掉10克(那么10个回合冰激凌就会融化完毕)。假设甲先提议,然后是乙,在两个回合的谈判中,均衡的结果是什么?用逆向归纳法可以这样推导均衡结果:在第二个回合,因为乙提议之后博弈结束,因此相当于他在此时面临独裁博弈,他将把全部的冰激凌分给自己,而由于冰激凌此时已经融化掉1/10,因此尽管乙得到了全部的冰激凌,但他实际得到的冰激凌为100-10=90克,而甲在第二回合什么也没得到;再回溯到第一回合,甲享有提议权,此时为让乙不至于反对其提议,他必须使得乙所获得的冰激凌实额不低于乙在第二回合可获得数量,即90克—而此时冰激凌并未融化,因此甲应当分给乙0.9的比例(实额为90克),而剩下的0.1比例(10克)则分给自己。在这里,我们发现,甲自己所分得的部分,实际上正好是冰激凌将融化掉的部分,因为只有这样,才可能保证乙不反对。回合分给甲分给乙比例实额比例实额10.1100.990200190谈判三个回合,情况将会怎样?此时提议顺序应当为“甲-乙-甲”,显然最后的主动权在甲手里面。相应的均衡结果仍可用逆向归纳法来获得:在第三回合,冰激凌融化到只剩下80克,此时甲提议,他将80克全部分给自己;在第二回合,乙为了获得甲的同意,只好按照不低于80克的标准分给甲,此时溶化后的冰激凌是90克,所以他分给甲的比例是8/9,择机得到1/9;然后回到第一回合,甲分配时只需要给乙10克就可以得到乙的同意,而自己得到了90克,回合分给甲分给乙比例实额比例实额19/10901/101028/9801/910318000同样的方法和道理,可以推导出9和10谈判回合下的均衡分配结果。回合(提议人)九回合十回合可分配克数甲乙甲乙1(甲)604050501002(乙)50404050903(甲)50304040804(乙)40303040705(甲)40203030606(乙)30202030507(甲)30102020408(乙)20101020309(甲)20010102010(乙)--01010至少可以得到以下几个结论

谁掌握谈判的最后主动权,谁就可以得到更多的冰激凌。谈判的回合越多,则两个人的利益分享额就越接近平均分配。如果谈判回合足够长,一直可以到分配的合作利益消耗殆尽,那么最终的讨价还价均衡结果就是平均合作利益。上述的结论也间接的反映出谈判中耐心的重要。只有足够的耐心的前提下,讨价还价才可能重复进行很多回合—当然,这里不是说真的要使讨价还价进行那么多回合,而是双方都表现出耐心的话,那么双方就知道应当提早做出让步,不要一直耗下去。这当中或许有几个回合的试探,不过对于双方来说的确没有必要真的耗到那么多回合,但若一方显示急于结束讨价还价,那么另一方就不大会做出让步。关于耐心之重要,也可以从无限回合的讨价还价博弈之均衡结果看到。

分配货币,由于每个人的耐心不一样,所以他们对将来的货币的主观贴现率也不一样。为此可以假设他们分配1元钱,甲的主观贴现率为r1,乙的主观贴现率是r2,那么对于甲来说,将来的1元钱与现在的1元钱之兑换比率可用贴现因子s1=1/(1+r1)表示;乙的贴现因子为s2=1/(1+r2)。这里s1、s2越大,说明谈判越有耐心,因为对他们来说将来的钱也很值钱,反之越小,s1、s2说明他们越没有耐心。

给定上面这些信息,在无限回合的讨价还价博弈中,均衡结果是:第一个提议者将建议分给自己x*的比例,分给乙(1-x*)的比例。这里:

上述结果是博弈论学者鲁宾斯坦(1982)证明的一个定理。通过求导容易发现x*关于s1的偏导数大于0,而关于s2的偏导数小于0,其表达的含义是:甲的耐心越高或乙的耐心越低,都会导致甲得到更高的分享比例。当然,甲得到更高的分享比例也就意味着乙在这样的情形下将得到更低的分享比例。可以得出如下一般的结论:耐心优势。直观地讲,有绝对耐心的人总可以通过拖延时间使自己独吞所分物品;即使放弃绝对耐心,“耐心优势”在一般情况下也是成立的。先动优势.当两个耐心相同,但并非都是绝对耐心的时候(s1=s2=s<1).x*=1/(1+s)>1/2,即甲总是会得到比乙更多的份额。先动优势的丧失。当两人绝对耐心(s1=s2=s=1),则x*=1/2,结果是两人平均所要分割的物品。

当然,主观贴现因子s1、s2可以表示耐心,不过也可以做出其他的解释,比如用它表示固定资产的成本----一般来说,如果企业不能早日达成协议,那么它承担的成本包括三种:一是固定资产的维护费用在日益增加,二是推迟出售固定资产的利息损失的日益增加,三是不能按期交付产品的违约罚款(一般随时间增加)。显然,这些成本越高则谈判越处于不利地位,因为它不能长期耗下去,而希望可以迅速结束谈判,结果只好向对手出较大幅度的让步。3.4.3讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S13.4.3讨价还价博弈三回合讨价还价博弈结果的讨论无限回合讨价还价宏观经济政策的动态一致性3.4.4委托人—代理人理论一、委托人——代理人关系经济活动和社会活动中有很多委托人——代理人关系,有明显的,也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人——代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性委托人——代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等二、无不确定性的委托人—代理人模型[R(S)-w(S),w(S)-S][R(E)-w(E),w(E)-E][R(0),0][R(0),0]122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束:w(E)-E>w(S)-Sw(E)>w(S)+E-S参与约束:22[R(E)-w(E),w(E)-E]拒绝接受拒绝接受[R(0),0][R(S)-w(S),w(S)-S][R(0),0]接受:w(E)-E>0接受:w(S)-S>0参与约束委托人的选择11不委托委托委托[R(S)-w(S),w(S)-S][R(0),0][R(E)-w(E),w(E)-E]不委托[R(0),0]委托:R(E)-w(E)

>R(0)不委托:R(E)-w(E)

<R(0)委托:R(S)-w(S)

>R(0)不委托:R(S)-w(S)<R(0)数值例子[12,2][0,0][0,0]122偷懒努力拒绝接受不委托委托[7,1]E=2,S=1,w(E)=4,w(S)=2w(E)-E=2>w(S)-S=1满足使代理人努力努力的激励相容w(E)-E=2>0满足代理人接受的参与约束,R(E)-w(E)=12>0也满足委托人提出的委托条件。三、有不确定性但可监督的

委托人—代理人博弈10022[0,0][0,0][10-w(S),w(S)-S][20-w(S),w(S)-S][10-w(E),w(E)-E][20-w(E),w(E)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托偷懒:委托:

0.1*[20-w(S)]+0.9*[10-w(S)]>0不委托:

0.1*[20-w(S)]+0.9*[10-w(S)]<0努力委托:0.9*[20-w(E)]+0.1*[10-w(E)]>0不委托:0.9*[20-w(E)]+0.1*[10-w(E)]<0因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。四、有不确定性且不可监督的

委托人—代理人博弈122[0,0][0,0][10-w(S),w(10)-S][20-w(20),w(20)-S][10-w(10),w(10)-E][20-w(20),w(20)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托0只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。努力:0.9*[w(20)-E]+0.1*[w(10)-E]>0.1*[w(20)-S]+0.9*[w(10)-S]接受:0.9*[w(20)-E]+0.1*[w(10)-E]>0委托:0.9*[20-w(20)]+0.1*[10-w(10)]>0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20)-w(10)五、选择报酬和连续努力水平的

委托人—代理人博弈R,CC(e)+R(e)委托人希望的代理人努力水平(满足参与约束)店主和店员的问题商店的利润,是均值为0的随机变量店员的负效用,是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为参与约束:当店员风险中性时符合其最大利益店主选择下限代入得益公式得:,期望得益为,易求得令得,再代入参与约束得,求数学期望得解得,则店主的最优激励工资计算公式是3.5有同时选择的动态博弈模型3.5.1标准模型3.5.2间接融资和挤兑风险3.5.3国际竞争和最优关税3.5.4工资奖金制度3.5.1标准模型博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合

中分别选择和

第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择和以后,同时在各自的可选策略(行为)集合

中分别选择和各博弈方的得益都取决于所有博弈方的策略即博弈方i的得益是各个博弈方所选择策略的多元函数3.5.2间接融资和挤兑风险下一阶段1,11,11,1不存存款客户2不存存款客户1第一阶段0.8,0.80.6,11,0.61.2,1.2提前到期客户2提前到期客户1第二阶段(到期,到期)(存款,存款)(提前,提前)(不存,不存)1.2,1.2第二阶段建立信贷保证、保险制度,对存款进行保护、保险的原因非法集资问题

现代更容易引发金融、社会风险的主要是不正规的非法金融活动,如地下钱庄和非法集资等。因为非法金融活动常常通过恶意欺骗的手段吸引人们参加,用借新债还旧债的方法,而不是经营利润偿还到期资金,信用差、管理差而且缺乏保险措施,引起金融风险并引发社会问题的可能性要大得多。3.5.3国际竞争和最优关税厂商的得益函数为:第二阶段厂商选择:第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:政府的得益函数;3.5.4工资奖金制度模型假设:1.雇员i(i=1,2)的产出函数为,为雇员努力水平,为随机扰动。服从分布密度,均值为0的随机变量。雇员努力的负效用函数为,且。2.产量高的雇员得到高工资,产量低的得到低工资。3.两雇员在已知雇主宣布的工资奖金制度下,同时独立选择各自的努力程度。雇员选择雇主决定了工资以后,雇员同时决定努力程度:一阶条件这是雇员所选择努力程度必须满足的基本条件。利用条件概率的贝叶斯法则:

代入得:两雇员情况一样,对努力程度的选择也相同,即:,这样就得到:这就是两雇员之间的静态博弈纳什均衡。若进一步假设,那么雇主选择由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都是0.5,假设雇能得到其他工作机会提供的得益是,则保证雇员接受工作的基本条件是:此即“参与约束”。由于在雇员接受工作的前提下,雇主必然尽可能压低工资

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论