03完全且完美信息动态博弈汇总_第1页
03完全且完美信息动态博弈汇总_第2页
免费预览已结束,剩余30页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、经济博弈论完全且完美信息动态博弈本部分内容简介讨论动态博弈,所有博弈方都对博弈过程和得益 完全了解的完全且完美信息动态博弈。动态博弈与静态博弈的区别主要体现在博弈方的选择、 行为有先后次序等方面,故它们在表示方法、利益关系、 分析方法和均衡概念等有所不同。2.2.介绍动态博弈分析的概念和方法,特别是子博弈 完美均衡和逆推归纳法,并介绍各种经典的动态博 弈模型。本部分主要内容3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3 4几个经典动态博弈模型3 5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论3.1动态博弈的表示法和特点动态博弈各博弈方先

2、后选择行为,使得其 在表示方法与策略方面与静态博弈有所不 同。3.1.1阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择 行另扩展形可以反映动态博弈中博弈方的选择 次序和博弈的阶段,常用来表示动态博弈动态博弈的其它名称:多阶段博弈;序列博弈;扩展形博弈例子:仿冒和反仿冒博弈设有一家企业的产品被另一家企业仿冒,如果 被仿冒企业采取措施制止,仿冒企业就会停止 仿冒;否则,它将继续仿冒。被仿冒企业:理论上,应当采取措施制止仿冒;现实中,制止仿冒需要代价仿冒企业:不被制止可能获得利益,但被制止 可能“偷鸡Hi3.1.1阶段和扩展性表示3.1.1阶段和扩展性表示不成蚀把米”。两个企业在仿冒和制止仿冒

3、的问题上,存在着 一个行为和利益相互储存的博弈问题。它是一 个动态博弈。3.1.1阶段和扩展性表示当动态博弈的阶段很多,或博弈方在一个 阶段有许多可以选择的行为,此时将难以 用扩展形表示动态博弈,此时常直接用文 字描述和数学函数式表示。如:下棋博弈产量博弈A:3.1.2动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划;结果是上述“计划型”策略的策略组合,构成一条路 径;得益对应每条路径,而不是对应每步选择.行为 一个动态博弈中,博弈的结果包括双方(多方)采用 的策略组合,实现的博弈路径和各博弈方的得益。有时也用得益矩阵表示动态博弈,但不如扩展形好, 因为其无法反映动态博弈的次序关系,及

4、不同阶段之 间的内在影响和联系。3.1.2动态博弈的基本特点先选择、行为的博弈方常常更有利,有“先行优势FMAWo后行动的博弈方更具信息优势,但却不一定总能得到 较好的结果。动态博弈动态博弈动态博弈的非对称性是非对称的;先后次序3.2可信性和纳什均衡的问题问题:纳什均衡在动态博弈中失效,关键 是动态博弈中各博弈方策略选择行为上的 “可信性”问题。3.2.1相机选择和策略中的可信性问题动态博弈中,各博弈方的策略是他们自己预先设 定的,在各个博弈阶段,针对各种情况的相应行 为选择的计划。这些策略实际上并没有强制力, 而且实施起来有一个过程,因此,只要符合博弈 方自己的利益, 他们完全可以在博弈过程

5、中改变 计划。我们称这种问题为动态博弈中的“相机选 择”(Contingent(ContingentPlay)Play)问题。3.2.1相机选择和策略中的可信性问题开金矿博弈:甲在开采一价值 4 4 万元的金矿时缺丄 万元资金,而乙正好有 1 1万元资金可以投资。设 甲想说服乙将这 1 1 万元资金借给自己用于开矿,并许诺在釆到金子后与乙对半分成,乙是否该将 钱借给甲呢?假定金矿的价值无可质疑,乙关心的是:甲采到3.2.1相机选择和策略中的可信性问题金后是否会履行诺言跟自己平分。3.2.1相机选择和策略中的可信性问题不同使合作虽终不可能。我们一般假设博弈方 都是以自身利益最大化为目标,即他们不

6、考虑道德能把道德因素折算成 数量化的效用综合进得益中。左图中,开金矿博弈为乙1.1.不可信的许诺,0)3.2.1相机选择和策略中的可信性问题要充分保障社会公平和经济活动的效率,分丸忌公正的 律制炭 来他悌倍障牡舍的公年, 而JLit健提名私是实豚最韦it埠的私 金今工合作絵吻婁标叭3.2.1相机选择和策略中的可信性问题法律制度必须要满足两方面的要求:对人们正当权益的保护力度足够大;对侵害他人利益者有足够的震慑作用。如果达不到这种水平,则法律制度的作用就是很有限的,甚至完全无效。J 3.2.1相机选择和策略中的可信性问题分钱打官司都不可信的情形:(T, 0)的现实 意义:法律诉讼非 常劳民伤财,

7、因此 有时可能打贏官司 只是让被告破财受 一点惩罚(贏了官 司输了钱),在经 济上并不一定合算。右3.2.2纳什均衡的问题第三种开金矿博弈中的纳什均衡:(不借不打,不分)(借打,分)不可信,不可能实现或稳定。注:在双方的策略下,乙第三阶段的“打”并不需要真 正的实施,但因为它是保证第二阶段甲会选择“分”的 关键,因此乙的策略必须包含这个选择。法律保障3 2 2纳什均衡的问题纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完 全信息静态博弈中稳定的纳什均衡,在动态博弈中可能 是不稳定的,不能作为预测的基础。-纳什均衡本身不能排除博弈方策略中包含的不可信的行 为设定,不能解决动态博弈的相机选择引起的

8、可信性问 题就上例而言,乙在第三阶段“打官司”是不可信的,不可能真 正实施,因为该行为对乙自身也不利,追求自身利益最大化的 乙的理性不允许他这么做。甲稍做分析,就可以掌握乙的弱点,故不理睬乙“打官司”的 威胁,故在第二阶段选择不分;乙在第一阶段也自然不会冒险将资金借给甲。3.2.3逆推归纳法分析,逐步倒推回前一个阶段相应博弈方的行为选择, 一直到第一个阶段的分析方法,称为“逆推归纳法”。面阶段选择行为时必然会先考虑后行为博弈方在后面 阶段中将会怎样选择行为,只有在博弈的最后一个阶 段选择的,不再有后续阶段牵制的博弈方,才能直接结论根源定义,从动态博逻辑基础:动态博弈中先行动的理性的博弈方,在前

9、作出明确选择。而当后面阶段惮弈方的选择确定以后, 前一阶段博弈方的行为也就容易确定了。逆推归纳法是动态博弈分析最重要、基本的方法。右3.2.3逆推归纳法法律保障不足开金矿博弈的等价博弈3.3子博弈和子博弈完美纳什均衡3.3.1子博弈3.3.2子博弈完美纳什均衡3.3.1子博弈定义:由一个动态博弈第一阶段以外的某阶段 开始的后续博弈阶段构成的,有初始信息集和 进行博弈所需要的全部信息,能够自成一个博 弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。么IIff! F方的策略构成的一个策略组合满足,在整个动态 博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完

10、美纳什均衡”。.子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。子博弈完美纳什均衡必须对博弈方在所有选择节点处的选择做出规定,包括最终不在均衡路径上的节点。.逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。 3 4几个经典动态博弈模型3.4.1寡占的斯塔克博格模型3.4.2劳资博弈3.4.3讨价还价博弈3.4.4委托人一代理人理论3.4寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商先选择,厂商 2 2 后选择,而 非同时选择即可。Q = q/ =尸(2) = 8 Qci= c2= 2旳二4|P(0)-的二-(+的)-2竹二6-比 -分u2

11、=q2P(Q)-c2q2=q2S-(q+q2)-2q2二6的-屈-彳;根据逆推归纳法的思路,先分析第二阶段 厂商2的决策。在第二阶段,厂商2决策时,厂商丄选择的弔实际上已经决定了,并且 厂商2知道因此,对厂商2来说,相当 于是在给定6_4_2/=0;=3_牛勿22厂商2对厂商丄产量 的一个反应函数。3 4:L寡占的斯塔克博格模型厂商 1 1 知道厂商 2 2 的决策思路,因此,在选择时 就知道厂商 2 2 的产量 q?q?水会依上述反应函数确定, 所以可以直接将上式代入自己的得益函数,这样, 厂商丄的得益函数实际上转化为自身产量的一元 函数:旳仏,9;)二一加;拥=6%-% 3-才-q;3.4

12、.1寡占的斯塔克博格模型可见,当把厂商 2 2 的反应函数考虑进来以后,厂 商 1 1 的得益就完全可以由他自己控制了,因此,他可以直接根据自己的得益函数求出使其最大化的产量:得益厂商丄3 3 单位4.54.5厂商 2 2丄 5 5 单位2.252.25启示:在信息不对称的博弈中,信息较多 的博弈方不一定以得到较多的利益。区别于单人博弈此厂商 2 2 的最佳产量是:=3-1.5该博弈过程为:先由工会决定工资率,再由厂商 决定雇用多少劳动力工会代表的劳方效用:“(w(w 丄)厂商的利润函数;兀(W(W 丄)=尺(1)-1)-拠其中:W W:工资率;L L:厂商雇佣的工人数第一步:先分析第二阶段厂

13、商的选择,即厂商对工会选择的工资率W的反应函数L(W)设工会提出的工资率为 W,W,则厂商实际自己最 大利益的雇佣数 L L 为以下最大值问题。max力(W丄)=max7?(L)- WL对上式关于 L L 求导, 解出 L,L,就是在给定工会选 择工资率 W W时厂商的最优雇佣数量。一阶导为零Rr(L)-W=O的经济意义:厂商增加雇 佣的边际收益。3.4.2劳厂商取得最大利润的雇佣数对应的曲线上点A处的切线斜率一定等于工资率W,在l/(W)处,R(L)与WL间的距 离(正是厂商的利润)最大。第二步: 分析第一阶段工会的选择。由于工会了解厂商的决策方法,因此它完全清 楚对应自己选择的每种工资率

14、W,W,厂商将会选 择的雇佣数一定是由上述方式决定的 L*(W)oL*(W)o 因此,工会需要解决的决策问题变成选择 VTVT ,使它满足如下最大化问题:maxuW,LXW)W0如果给出工会效用函数的具体形式,就可以通 过解这个最大值问题,求出符合工会最大利益 的工资率 WJWJ3.4.2劳右3.4.3讨价还价博弈讨价还价;两人就如何分享1万元现金进行谈判, 并定下如下规则:先由甲提出一个分割比例,对甲提出的比例乙可以接受也可以拒绝;如果乙拒绝甲的方案,则他自己应提出另一个方案, 让甲选择接受与否;只要任何一方接受对方的方案,博弈就结束,而如果方案被拒绝,则被拒绝方案与以后的讨价还价不再有 关

15、系。-每一次,一方提出一个方案,与另一方选择是否接受 为一个回合,讨价还价每多进行一个回合,由于谈判 费用和利息损失等,双方的利益都要打一个折扣 (其 值在O-丄之间,3.4.2劳工会的无差异曲线我们称为消耗系数。右3.4.3讨价还价博弈三回合讨价还价:在第三回合,乙必须接受甲的方 案。第三回合,甲出 S,S,双方的利益分别为 JSJS 和6 62 2(10000-S)(10000-S)(由于乙必须接受,故 S S 通常为 10000)10000)第二回合,乙的选择。乙知道一旦博弈进行到 第三回合,甲的策略及双方的得益。如果乙已 经拒绝第一回合甲的方案,此时他该怎样出价 才能使自己的利益最大化

16、?出价时的利益,就愿意接受对方的出价故乙在第二回合能让甲接受的,也是可能使自己得最大利益的S2,应满足使甲的二、三回合得益相同,此时,乙的得益为8 (10000-8S) o-利用逆推归纳法分析:i则:任何一博弈方只要利益不少于下一回合自己第一回合:(Sv100000)第二回合:(SS2/S(10000-S2)第三回合:(82Sf82(1OOOO-S)第一回合:甲一开始就知道第三回合的得 益,也知道乙在第二回合的出价,因此, 进行到第三回合自己的得益为而乙则 会满足于得到100005-82S,因此,如果甲 在第一回合就给乙100005-S2S,而同时自 己又能得到比2S更大的利益,那当然是更 理

17、想的。实现这一想法只要令S满足1OOOO-SX=100008-82S, BPS 10000-100005-82SBPnTo甲的得益乙的得益到了第三回合,甲将提出:S=S= 1000010000第三第二52S52(10000-S)SihlOOSihlOO0000 1000010000 5 5 +5+52 2S=10000(lS=10000(l 6 6 +5+52 2) )当时,甲得益6有最大值为 0.250.25三回合讨价还价博弈结果的讨论当 0.5610.561 时,越大,甲的得益越大,乙的 得益越小;当 OvBvO.5OvBvO.5 时,越大,甲的得益越小,乙的得益越大。启示:乙仗以讨价还价

18、的筹码:跟甲拖时间。现实的例子:利润分配、债务纠纷、财产 继承等。无限回合讨价还价与三回合博弈不同的地方在于:无限回合的讨价还价博弈在第三回合并不会强制结束,只要 双方互不接受对方的出价方案,则博弈就要不断进行下去,奇数回合由甲出价乙选择是否接 受,偶数则相反。对于无限回合博弈,从第一回合还是从第三回 合开始,并不影响最终的结果。第三回合出价S第一回合出价S =10000IOOOO + FSS=S|S = 10000 10000 + ysE10000s =1+510000-S*l(XXX)l+s3-4.4委托人一代理人理论一、委托人代理人关系经济活动和社会活动中有很多委托人一代理人 关系,有明显的,也有隐蔽的。工厂和工人.店 主和店员、客户和律师、市民和政府、基金购买 者和基金管理人等都是。委托人理人关系的关键特征.不能直接控制,监督不完全,信息不完全,利益的相 关性第三回合出价S根据松散程度、委托内容、监督难易等的不同, 委托人一代理人关系有多种不同的情况,最关键 的差异是监督的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论