重复博弈完全且非完美信息动态博弈_第1页
重复博弈完全且非完美信息动态博弈_第2页
重复博弈完全且非完美信息动态博弈_第3页
重复博弈完全且非完美信息动态博弈_第4页
重复博弈完全且非完美信息动态博弈_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2009-03-16张醒洲,大连1重复博弈完全且非完美信息动态博弈2009-03-16张醒洲,大连2第3章和第4章要点博弈类型举例解的概念简单的完全且完美信息动态博弈Stackelberg (1934) 双寡头垄断模型鲁宾斯坦 (1982) 讨价还价模型Backwards Induction Outcome (BIO)后向归纳结果2人两阶段重复博弈 (“同时行动” 意味着 “不完美信息”)Lazear&Rosen Tournaments (1981 ) 工作竞赛模型Subgame Perfect Outcome (SPO)子博弈完美结果动态博弈主题: 可信威胁与承诺会影响现在的行为下一次博弈开

2、始前的所有博弈的结果都能被观察到的重复博弈Subgame-perfect Nash equilibrium子博弈完美NE2009-03-16张醒洲,大连3完全信息动态博弈表述Normal-form / Strategic-form 标准式/策略式Extensive-form 扩展式解的概念Nash Equilibrium (NE)Nash均衡Subgame-perfect Nash equilibrium (SPNE)子博弈完美Nash均衡Central Issue中心问题 credibility threats or promise (self-enforcement)可信性威胁或承诺The

3、me 主题思想一个完全信息动态博弈可能会有很多个纳什均衡,但是有些均衡包含了不可置信的威胁和承诺。子博弈完美纳什均衡就是通过了可信任检测的均衡。第3章和第4章要点2009-03-16张醒洲,大连4重复博弈要点当参与人重复进行策略互动时,某个参与人对于未来行动的威胁或承诺是否影响其他参与人当前的行动?直观 大部分直观的结论是由两阶段的例子给出的 一些观点需要讨论无限次的情况概念:子博弈完美纳什均衡我们还将定义重复博弈中子博弈完美纳什均衡的概念 这一定义在重复博弈的条件下表述比较容易理解,而在2.4.B. 节分析一般完全信息动态博弈中则要复杂一些;我们在本节先作简要介绍,以便后面的展开。2009-

4、03-16张醒洲,大连5两阶段重复博弈两阶段囚徒困境两阶段博弈的阶段博弈有多个纳什均衡预测第二阶段的行动重复博弈的子博弈完美结果2009-03-16张醒洲,大连6两阶段囚徒困境考虑囚徒困境给定如图2.3.1的标准式 纳什均衡为(L1 , L2) 同时行动博弈 参与人 2 参与人 1L2R2L11, 1 5, 0R10, 5 4, 4图 2.3.1让两个参与人进行两次囚徒困境博弈,第二次博弈开始之前可以观察到第一次博弈的结果,并假设整个过程博弈的总收益等于两阶段博弈收益的简单相加 (即不考虑贴现因素) 。2009-03-16张醒洲,大连7“2 2 2” 博弈和子博弈完美结果两阶段囚徒困境博弈是“

5、22 两人同时行动”博弈的一个特殊例子。在这个博弈中,我们在上一节利用后向归纳法的思路分析了“子博弈完美结果”,具体见2.2.1。子博弈完美结果 如果参与人1和2预测到参与人3和4在第二阶段的行动将由(a3*(a1,a2),a4*(a1,a2)给出,则参与人1和2在第一阶段的问题就可以用以下的同时行动博弈表示: 1. 参与人1和2同时从各自的可行集A1和A2中选择a1和a2; 2. 收益情况为ui(a1,a2,a3*(a1,a2),a4*(a1,a2),i=1,2; 假定(a1*,a2*)为以上同时行动博弈唯一的纳什均衡,我们称 (a1*,a2*,a3*(a1*,a2*),a4*(a1*,a2

6、*)为这一两阶段博弈的子博弈完美结果。2009-03-16张醒洲,大连8两阶段囚徒困境得到 a3*(a1,a2),a4*(a1,a2)根据第一阶段的行动a1和 a2 ,预测第二阶段参与人的反应;请注意,在囚徒困境博弈中存在唯一的纳什均衡,因此参与人的反应独立于其在第一阶段的行动。计算 ui(a1,a2,a3*(a1,a2),a4*(a1,a2),i=1,2支付等于两个阶段博弈支付的简单和. 2009-03-16张醒洲,大连9两阶段囚徒困境第二阶段博弈的结果为纳什均衡 (L1 , L2) ,两人收益为(1, 1);参与 人在两阶段囚徒困境博弈中第一阶 段的交互行动如图2.3.2所示;这个一次性博

7、弈有唯一的纳什均衡 (L1 ,L2) 。 参与人 2 参与人 1L2R2L12, 2 6, 1R11, 6 5, 5图 2.3.2两阶段囚徒困境唯一的子博弈完美结果就是第一阶段的 (L1,L2) 和第二阶段的 (L1,L2)。在子博弈完美结果中,任意阶段都不能达成相互合作 (R1,R2)。2009-03-16张醒洲,大连10有限重复博弈:重复独立 令 G = A1, .,An; u1, ., un 表示一个完全信息博弈,其中参与人1 到n同时从各自的行动空间A1到An中分别选择行动a1到an ,得到的 收益分别为u1(a1, ., an) , ., un(a1, ., an),我们称博弈G为重

8、复博弈 中的阶段博弈。定义1 对给定的阶段博弈G,令 G(T)表示G重复进行T次的有限博弈,并且在下一次博弈开始前,所有以前博弈的进行都可以被观察到。G(T)的收益为T次阶段博弈收益的简单相加。定理1 如果阶段博弈G有唯一的纳什均衡,则对任意有限的T,重复博弈G(T)有唯一的子博弈完美结果:即G的纳什均衡结果在每一阶段重复进行。2009-03-16张醒洲,大连11两阶段重复博弈:阶段博弈有多个纳什均衡设图2.2.3表示的阶段博弈重复进行两次,并在第二阶段开始前可以观察到第一阶段的结果。我们可以证明在这一重复博弈中存在一个子博弈完美结果,其中第一阶段的策略组合为 (M1,M2)。 参与人 2参与

9、人 1L2M2R2L11, 15, 0 0, 0M10, 54, 4 0, 0R10, 00, 03, 3图 2.3.3图2.2.3中表示的博弈有两个纳什均衡 (L1,L2),(R1,R2)2009-03-16张醒洲,大连12两阶段重复博弈:阶段博弈有多个纳什均衡由于这个阶段博弈有不止一个纳什均衡,因此参与人可能会预测: 根据第一阶段的不同结果,在第二阶段的博弈中将会出现不同的纳什均衡。关键问题是:预测对第一阶段的行动a1 和a2 的反应。 参与人 2 参与人 1L2M2R2L11, 15, 0 0, 0M10, 54, 4 0, 0R10, 00, 03, 3第一阶段第二阶段收益(L1, L

10、2)(1,1)+(?,?)(R1, R2)(3,3)+(?,?)(M1, M2)(4,4)+(?,?)(M1, L2)(0,5)+(?,?)(L1, M2)(5,0)+(?,?)others(0,0)+(?,?)图 2.3.3第二阶段的结果 ?2009-03-16张醒洲,大连13信 号假设:如果参与人预测到第一阶段的结果是(M1,M2),第二阶段的结果将会是 (R1,R2) ;如果第一阶段出现其他8个结果中任何一个,第二阶段的结果就会是 (L1,L2)。那么,这个两阶段博弈就如同图2.3.4的一次性博弈。 参与人2 参与人 1L2M2R2L12, 26, 1 1, 1M11, 67, 7 1,

11、 1R11, 11, 14, 4图 2.3.4在图2.3.4所示的博弈中有3个纯策略纳什均衡: (L1,L2), (M1,M2) 和(R1,R2)。和图2.3.2中一样,这个一次性博弈中的纳什均衡对应着重复博弈的子博弈完美结果。2009-03-16张醒洲,大连14两阶段重复博弈的子博弈完美结果标记令 (w, x), (y, z)表示重复博弈的一个结果第一阶段和第二阶段 的行动分别为 (w, x) 和(y, z) 。图2.3.4中的纳什均衡 (L1,L2) 对应着重复博弈的子博弈完美结果 (L1,L2), (L1,L2) ,因为除第一阶段的结果是(M1,M2) 外,其他任何情 况发生时,第二阶段

12、的结果都是 (L1,L2)。类似地,图2.3.4 中的纳什均衡 (R1,R2) 对应了重复博弈的子博弈完美 结果 (R1,R2), (L1,L2) 。重复博弈的这两个子博弈完美结果都简单地 由两个阶段博弈的纳什均衡解相串而成。第一阶段的非合作倾向在第二阶段遭到报复或惩罚!2009-03-16张醒洲,大连15两阶段重复博弈的子博弈完美结果图2.3.4 里的第三个纳什均衡结果与前两者存在质的差别: 图2.3.4中的 (M1,M2)对应的重复博弈子博弈完美结果为 (M1,M2),(R1,R2),因为对(M1,M2)之后第二阶段结果预期是(R1,R2) , 亦即正如我们前面讲过的,在重复博弈的子博弈完

13、美结果中,合作 可以在第一阶段达成。下面是更为一般的情况如果 G = A1, .,An; u1, ., un 是一个有多个纳什均衡的完全信息静态 博弈,则重复博弈G(T)可以存在子博弈完美结果,其中对每一 t 0, 企业的收益是 y-w, 工人的收益是 w-e。2009-03-16张醒洲,大连24工资效率: 一阶段偷懒模型工人的努力程度企业无法观测,但是 企业和工人都可以观测到工人的产出 水平。 产出可能高也可能低,为简单起见, 我们认为低水平的产出为0,高水平 的产出为y 0假设如果工人努力工作则肯定可 以得到高产出;但是如果工人偷懒则以p 的概率 得到高产出,1 - p 的概率的到低产出;

14、从而,在这个模型中,低产出是偷懒 无可辩驳的证据。显然地,企业不能强 制工人努力工作- 偷懒总是存在的。为了聘请工人,企业 只需要支付工人w0-支付更多的工资是没有意义的,因为偷懒总是存在。2009-03-16张醒洲,大连25工资效率: 社会效率如果企业以工资 w 雇佣工人 ,则参与人的收益为如果工人努力工作并带来高产出,则 企业收益为:y - w ,工人收益为:w e;如果工人偷懒,则e = 0 ; 如果出现低产出,则y = 0;我们假定y - e w0 py 这就使得 工人付出努力工作是有社会效率的工人自我雇佣要优于受雇于企业并偷懒 同样意味着 企业不会事先预付工资,因为最低工资将超出期望

15、产出! 2009-03-16张醒洲,大连26工资效率: 阶段博弈这一阶段的子博弈完美结果是使人失望的:因为企业先付给工人工资w,工人没有动机去努力工作,于是企业将会开出w w0 ,且工人会选择自我雇佣。在无限重复博弈中,企业给工人高于wc 的工资水平w, 并且威胁一旦出现低产出,就将工人开除。下面我们将证明在某些取值范围内,企业给出较高的工资并借此激励工人努力工作是值得的。2009-03-16张醒洲,大连27 考虑无限重复博弈中下面的战略,其中包含了将在以后决定的 。如果所有前面的工资开价都是 ,所有的开价都被接受了,并且所有前期的产出都是高的,我们就称博弈的过程是“高工资、高产出”。 企业的

16、策略为第一阶段开出工资水平 ,并且在其后的每一阶段,如果博弈的过程是高工资、高产出,则继续开出工资水平 ;但其他情况下开出 。 工人的策略为如果 ,则接受企业的工资(否则,选择自我雇佣),并且如果博弈的过程(包括本阶段的工资)是高工资、高产出,则努力工作(否则偷懒)。请注意,如果 ,但 ,则工人将接受企业的工资但选择偷懒。效率工资: 无限重复博弈2009-03-16张醒洲,大连28子博弈一个子博弈是全部博弈的一部分,当全部博弈进行到任何 一个阶段,到此为止的进行过程已成为参与各方的共同知 识,而其后尚未开始进行的部分就是一个子博弈。定义 在有限重复博弈G(T) 中,由第t + 1阶段开始的一个

17、子博弈为G 进行T t次的重复博弈,表示为G(T- t)。由第t + 1阶段开始有许多子博弈;到第 t 阶段为止的每一可能的进 行过程之后都是不同的子博弈。 在无限重复博弈G(,)中,由第t + 1阶段开始的每个子博弈都等同于初始博弈G(,)与在有限情况下相似,博弈G(,) 到第 t 阶段为止有多少不同 的可能进行过程,就有多少从t + 1阶段开始的子博弈。2009-03-16张醒洲,大连29子博弈请注意,重复博弈的第 t 阶段本身(在有限情况下假 定 t 0 (2.3.7)2009-03-16张醒洲,大连36效率工资:子博弈完美纳什均衡 前面我们已假定y- e wo (即对工人而言,选择受雇于企业并努

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论