博弈论完全信息动态博弈课件

上传人：加*** IP属地：贵州上传时间：2023-08-16 格式：PPT 页数：77 大小：406.21KB 积分：25 举报 版权申诉

已阅读5页，还剩72页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二章完全信息动态博弈(3)五、重复博弈重复博弈

有限次重复博弈：连锁店悖论无限次重复博弈无名氏定理无限重复博弈的例子参与人不固定时的重复博弈不确定环境下的重复博弈第二章完全信息动态博弈(3)五、重复博弈0、重复博弈

动态博弈：序惯博弈：参与人在前一阶段的选择将决定随后的子博弈的结构。

重复博弈：是指同样结构的博弈重复多次，其中的每次博弈称为阶段博弈。

重复博弈的基本特征：（1）阶段博弈之间没有物质上的联系（前一阶段博弈不改变后一阶段博弈的结构）；（2）所有人都观察到过去博弈的历史；（3）参与人的总支付是所有阶段博弈支付的贴现值之和或加权平均值。

0、重复博弈动态博弈：在重复博弈的每个阶段博弈中，参与人可同时行动，也可不同时行动。在后一情形中，每一阶段博弈本身就是一个动态博弈。影响重复博弈均衡结果的主要因素：博弈的重复次数：参与人可能为了长期利益而牺牲眼前利益从而选择不同的均衡策略。信息的完备性：当一个参与人的支付函数不为其他人所知时，该参与人可能有积极性建立一个好的声誉以换取长远利益（声誉模型）。在重复博弈的每个阶段博弈中，参与人可同时行动，也可不同时行动重复博弈的分类根据阶段博弈的重复次数，可分为：有限重复博弈和无限重复博弈根据信息结构的出现，重复博弈可分为：（1）可观察行动的重复博弈：①连锁店悖论、重复囚徒困境博弈、古诺寡头垄断重复博弈等；②参与人不确定时的重复博弈（2）不完美信息重复博弈：双寡头重复博弈：厂商观察到每期的市场价格下选择产量，但不知道对手的产量；重复合伙关系：参与人观察到实现的产出但不知对方的努力水平。重复博弈的分类根据阶段博弈的重复次数，可分为：有限重复博弈和1、有限次重复博弈（1）市场进入阻挠博弈通常，进入门槛越低的行业，其平均利润率越低。一种解释是，在位者为了阻止潜在进入者的进入，主动放弃高定价，选择较低的竞争性价格（以此表示自己是低成本），从而阻止潜在进入者进入。另一种解释是，潜在进入者只要看到有利可图，由于其进入成本低，就将进入该行业。1、有限次重复博弈（1）市场进入阻挠博弈进入阻挠博弈模型设定：一个新企业（进入者）想进入被垄断企业（在位者）所把持的市场。进入者有两种策略可选择：进入还是不进入；在位者也有两种策略：默许还是斗争。设进入前垄断利润为300，进入之后寡头利润为100，进入成本为10，进入后双方争斗时利润均为0。该博弈有两个纯策略纳什均衡（默许，进入）和（斗争，不进入）。潜在进入者进入不进入在位者默许100，90300，0斗争0，－10300，0进入阻挠博弈模型设定：一个新企业（进入者）想进入被垄断企业（市场进入阻挠博弈的子博弈精炼纳什均衡进入者在位者不进入进入默许斗争（0，-10）（100，90）（300，0）

在单阶段博弈中，唯一的子博弈精炼纳什均衡结果是在位者默许，潜在进入者选择进入。市场进入阻挠博弈的子博弈精炼纳什均衡进入者在位者不进入进入默有限重复次的市场进入阻挠博弈现在假定同样的市场有100个（理解为在位者有100家连锁店），进入者每次进入一个市场，博弈就变成了100次重复博弈。在位者是否可以以斗争来威胁以阻止潜在进入者进入？在有限次重复博弈中，斗争并不是一个值得置信的威胁。有限重复次的市场进入阻挠博弈现在假定同样的市场有100个（理连锁店悖论首先考虑第100个市场，在博弈最后阶段，斗争已没有任何意义，在位者将默许，进入者将选择进入。再考虑第99个市场，因为不论在位者选择什么行动，第100个市场的均衡结果不受影响，在位者的最优选择仍然是默许。如此一直倒推回去，得到该博弈的唯一的子博弈精炼纳什均衡是在位者在每一个市场上都选择默许，进入者在每一个市场上选择进入。其他的纳什均衡如“在位者总选择斗争，进入者总选择不进入”，但不是子博弈精炼的。

连锁店悖论首先考虑第100个市场，在博弈最后阶段，斗争已没有（2）有限次重复囚徒困境博弈在有限次重复囚徒困境博弈同样如此，“总是坦白”是唯一的子博弈精炼纳什均衡。囚徒B抵赖坦白囚徒A抵赖－1，－1－10，

0坦白0，－10－8，－8（2）有限次重复囚徒困境博弈在有限次重复囚徒困境博弈同样如此定理定理：令G是阶段博弈，G（T）是G重复T次的重复博弈（T＜∞）。那么，如果G有唯一的纳什均衡，则重复博弈G（T）的唯一子博弈精炼纳什均衡是阶段博弈G的纳什均衡重复T次（即每个阶段博弈出现的都是一次性博弈的均衡结果）。G有唯一的纳什均衡是必不可少的条件。定理定理：令G是阶段博弈，G（T）是G重复T次的重复博弈（T例：有两个纯策略纳什均衡的重复博弈在单阶段博弈中有两个纯策略纳什均衡（L1，L2）和（R1，R2）。现考虑两阶段重复博弈情形。在子博弈精炼纳什均衡中，参与人能否在第一阶段实现合作（M1，M2），使其收益最大化？参与人2L2M2R2参与人1L11，15，00，0M10，54，40，0R10，00，03，3例：有两个纯策略纳什均衡的重复博弈在单阶段博弈中有两个纯策略预期若参与人均有这样的预期，若第一阶段出现合作（M1，M2），则第二阶段预期的纳什均衡是（R1，R2），若第一阶段出现其他结果，则第二阶段预期的纳什均衡是（L1，L2）。考虑策略：参与人1（2）在第一阶段首先选择M1（M2）；在第二阶段，若第一阶段的博弈结果是（M1，M2），则第二阶段选择合作的纳什均衡策略R1（R2），否则选择惩罚的纳什均衡策略L1

（L2）。该策略是一个子博弈精炼纳什均衡。预期若参与人均有这样的预期，若第一阶段出现合作（M1，M2）两个阶段第二阶段参与人2L2M2R2参与人1L11，15，00，0M10，54，40，0R10，00，03，3第一阶段参与人2L2M2R2参与人1L12，26，11，1M11，67，71，1R11，11，14，4两个阶段第二参与人2L2M2R2参与人L11，15，0模型启示上述模型说明，对将来行动所作的可信的威胁或承诺可以影响当前的行动。上述模型亦表明，子博弈精炼的概念对可信性的要求并不严格。因为参与人会认为，过去的反正已经过去，即使第一阶段双方未能合作，在第二阶段选择较低的纳什均衡（1，1）也是一种愚蠢的行为。故参与人没有动机在第二阶段实施惩罚行为。模型启示上述模型说明，对将来行动所作的可信的威胁或承诺可以影参与人没有动机在第二阶段实施惩罚第二阶段参与人2L2M2R2参与人1L11，15，00，0M10，54，40，0R10，00，03，3第一阶段参与人2L2M2R2参与人1L14，48，33，3M13，87，73，3R13，33，36，6参与人没有动机在第二阶段实施惩罚第二参与人2L2M2R参与人有动机实施惩罚的例子L2M2R2P2Q2L11，15，00，00，00，0M10，54，40，00，00，0R10，00，03，30，00，0P10，00，00，04，1/20，0Q10，00，00，00，01/2，4参与人有动机实施惩罚的例子L2M2R2P2Q2L11，15，第二阶段L2M2R2P2Q2L11，15，00，00，00，0M10，54，40，00，00，0R10，00，03，30，00，0P10，00，00，04，1/20，0Q10，00，00，00，01/2，4第二阶段预期策略（可视为一种谈判协议）：若第一阶段出现合作(M1，M2)或(x，y)，这里x、y分别是除M1、M2外的任何策略，则第二阶段结果为(R1，R2)；若第一阶段出现(M1，y)，y是除M2外的任何策略，为(P1，P2)；若第一阶段出现(x，M2)，x是除M1外的任何策略，为(Q1，Q2)。第二阶段L2M2R2P2Q2L11，15，00，00，00，第一阶段L2M2R2P2Q2L14，411/2，43，33，33，3M14，11/27，74，1/24，1/24，1/2R13，31/2，46，63，33，3P13，31/2，43，37，7/23，3Q13，31/2，43，33，37/2，7（(M1，M2)，(R1，R2)）是重复博弈的子博弈精炼均衡结果，且是帕累托最优的。而（(R1，R2)，(R1，R2)）、（(L1，L2)，(L1，L2)）也是子博弈精炼均衡结果。第一阶段L2M2R2P2Q2L14，411/2，43，33，评析G中纳什均衡的唯一性是一个重要条件：当阶段博弈有多个纳什均衡时，在博弈最后阶段，参与人可以使用不同的纳什均衡惩罚第一阶段的不合作行为或奖励第一阶段的合作行为。评析G中纳什均衡的唯一性是一个重要条件：当阶段博弈有多个纳什解开连锁店悖论的方法解开连锁店悖论的办法之一是引入信息的不完全性（声誉模型）。解开连锁店悖论的办法之二是引入无限重复博弈（或以某一概率随机地确定是否继续开张新的连锁店）。当博弈重复无限多次时，存在着完全不同于一次博弈的子博弈精炼纳什均衡。解开连锁店悖论的方法解开连锁店悖论的办法之一是引入信息的不完2、无限次重复博弈与无名氏定理（1）无限重复囚徒困境博弈与有限次重复博弈不同，即使在每个阶段中有唯一纳什均衡的无限次重复博弈也存在多重纳什均衡。例如，在无限重复囚徒困境博弈中，单阶段博弈中不可能实现的合作也能作为子博弈精炼纳什均衡的结果出现。重复博弈的特点是参与人在每一阶段的行动空间和支付函数是完全一样的，新均衡的出现在于参与人的选择基于他们之前阶段获得的信息。2、无限次重复博弈与无名氏定理（1）无限重复囚徒困境博弈无限次重复囚徒困境博弈的冷酷策略“冷酷策略（grimstrategies）”，又称“触发策略(triggerstrategies)，是指：开始选择抵赖（合作），然后一直选择抵赖（合作），直至有一方选择坦白（背叛），然后永远选择坦白（背叛）。囚徒B抵赖坦白囚徒A抵赖－1，－1－10，

0坦白0，－10－8，－8无限次重复囚徒困境博弈的冷酷策略“冷酷策略（grimstr只要参与人有足够耐心（贴现因子δ≥1/8，这里δ=1/(1+r)，r为贴现率)，每一阶段（抵赖，抵赖）是一个子博弈精炼纳什均衡结果，双方都坚持“冷酷策略（触发策略）是一个子博弈精炼纳什均衡。

囚徒B抵赖坦白囚徒A抵赖－1，－1－10，

0坦白0，－10－8，－8只要参与人有足够耐心（贴现因子δ≥1/8，这里δ=1/(1+纳什均衡首先，（冷酷策略，冷酷策略）是一个纳什均衡。给定对方选择冷酷策略，选择冷酷策略对自己是最优的：给定对方坚持冷酷策略（δ≥1/8)

，自己不会选择首先坦白；给定对方坚持冷酷策略，一旦某方选择坦白，由于对方将坚持坦白，因而自己坚持冷酷策略永远坦白也是最优的。囚徒B抵赖坦白囚徒A抵赖－1，－1－10，

0坦白0，－10－8，－8纳什均衡首先，（冷酷策略，冷酷策略）是一个纳什均衡。给定对方子博弈精炼纳什均衡其次，（冷酷策略，冷酷策略）是子博弈精炼的纳什均衡。将子博弈划分为两类：（1）类型A，没有任何参与人曾经坦白（与原博弈相同）；（2）类型B，至少有一个参与人曾经坦白。在类型B中，冷酷策略要求参与人只是重复单阶段博弈的纳什均衡，自然也是整个子博弈的纳什均衡。子博弈精炼纳什均衡其次，（冷酷策略，冷酷策略）是子博弈精炼的其他但该博弈还有许多其他子博弈精炼均衡，例如，参与人在每一个阶段都选择坦白。针锋相对策略（tit-for-tatstrategy）（又称投桃报李，一报还一报，以牙还牙）：

1）每个参与人开始选择抵赖（合作）；

2）然后，在阶段t，简单地重复t-1阶段对手的行动。若贴现因子为1，该策略是否是子博弈精炼的纳什均衡策略？其他但该博弈还有许多其他子博弈精炼均衡，例如，参与人在每一个分析若囚徒B选择针锋相对策略：首先，囚徒A没有激励在开始时选择坦白（即囚徒B的针锋相对策略在均衡路径上是最优的）。其次，如果囚徒A开始时选择坦白，囚徒B对其进行惩罚是不理性的行为（即囚徒B在非均衡路径上不是最优的）。因此，针锋相对策略不是一个子博弈精炼纳什均衡策略。分析若囚徒B选择针锋相对策略：无名氏定理无名氏定理（弗里德曼，1971）：令G为一个n人阶段博弈，G（∞，δ）为以G为阶段博弈的无限次重复博弈，a*是G的一个纳什均衡（纯策略或混合策略），e=(e1,e2,…,en)是a*决定的支付向量，v=(v1,v2,…,vn)是一个任意可行的支付向量，V是可行的支付向量的集合。那么，对于任何满足vi＞ei的v∈V，存在一个因子δ*＜1使得对于所有的δ≥δ*，v=(v1,v2,…,vn)是一个特定的子博弈精炼纳什均衡结果。

无名氏定理无名氏定理（弗里德曼，1971）：令G为一个n人阶囚徒困境博弈中的可行支付集(-8,-8)(-1,-1)(-10,0)(0,-10)（抵赖，抵赖）（坦白，坦白）（坦白，抵赖）（抵赖，坦白）囚徒困境博弈中的可行支付集(-8,-8)(-1,-1)(-1子博弈精炼均衡可达到的可行集(-8,-8)(-1,-1)(-10,0)(0,-10)（抵赖，抵赖）（坦白，坦白）（坦白，抵赖）（抵赖，坦白）子博弈精炼均衡可达到的可行集(-8,-8)(-1,-1)(-（2）古诺寡头垄断的无限重复博弈在古诺寡头垄断重复博弈中，某种形式的合谋就有可能作为均衡结果出现。考虑冷酷策略：首先选择生产qi=qM/2（qM表示垄断情形下的最优产量）；继续选择qi=qM/2，直到有一个企业选择qj≠qM/2，然后永远选择qi=qic（qic表示企业i的古诺均衡产量）。如果：即当δ≥9/17，则默契合作（合谋）将是一个子博弈精炼均衡结果。（2）古诺寡头垄断的无限重复博弈在古诺寡头垄断重复博弈中，某特别地，对任何q*∈[qM/2,qic]都是冷酷策略精炼纳什均衡的一个特定结果。设想参与人选择如下冷酷策略：首先选择生产qi=q*；继续选择qi=q*，直到有一个企业选择qj≠q*，然后永远选择qi=qic（qic表示企业i的古诺均衡产量）

。则当以下条件满足时，企业i没有积极性偏离q*：特别地，对任何q*∈[qM/2,qic]都是冷酷策略精炼纳其中，

于是，只要又因对任何q*∈[qM/2,qic]都有：故当δ≥9/17时，对任何的πi*∈[πic,πM/2]都将是一个子博弈精炼均衡结果。其中，故当δ≥9/17时，对任何的πi*∈[πic,πM当δ＜9/17时，若触发策略是一个子博弈精炼纳什均衡，则寡头公司的产量q*将满足：当δ→9/17时，q*下限接近于(a-c)/4，当δ→0时，q*下限接近于古诺产量(a-c)/3。当δ＜9/17时，若触发策略是一个子博弈精炼纳什均衡，则寡头古诺重复博弈的可行集合π1π2πMπM(π1C,π2C)古诺重复博弈的可行集合π1π2πMπM(π1C,π2C)时间偏好性与博弈结束不确定性解释无名氏定理意味着在无限次重复博弈中，对任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼纳什均衡得到。在上述分析中，δ一直被解释为参与人时间偏好的变量，δ也可用来解释博弈在某个时间结束的不确定性。设博弈在某个阶段结束的概率为p，则博弈达到阶段t的概率为(1-p)t-1，于是参与人在阶段t的期望支付现值为δt-1(1-p)t-1πt，这可以完善无名氏定理：如果博弈重复无限次或每次结束的概率足够小，并且δ充分接近于1，则任何个人理性的可行支付向量都可以作为子博弈精炼均衡结果出现。时间偏好性与博弈结束不确定性解释无名氏定理意味着在无限次重复（3）无名氏定理的扩展Fudenberg-Maskin证明，无名氏定理中的纳什均衡支付e=(e1,e2,…,en)可用其保留支付v=(v1,v2,…,vn)代替，表示参与人i可能受到的最大惩罚支付。（3）无名氏定理的扩展Fudenberg-Maskin证明，古诺重复博弈的最大可行集合π2π1πMπM(π1C,π2C)古诺重复博弈的最大可行集合π2π1πMπM(π1C,π2C胡萝卜加大棒Abreu（1986）证明，即使δ不够大，如果使用最严厉（使不合作者得到最低可能支付）的可信惩罚（是子博弈精炼均衡）则能保证最大可能的合作策略。考虑古诺模型中的“胡萝卜加大棒”策略：首先选择生产qi=qM/2（qM表示垄断情形下的最优产量）；在阶段t，如果两个企业在时期t-1都生产qM/2或x，继续生产qM/2，否则生产x，这里x为最大惩罚产量（大于古诺均衡产量）。

胡萝卜加大棒Abreu（1986）证明，即使δ不够大，如果使在合作子博弈中，参与者愿意合作，则：

πM/2+δ/(1-δ)·πM/2≥πd+δV(x)其中，V(x)=π(x)+δ/(1-δ)·πM/2即：πM/2+δ·πM/2≥πd+δ·π(x)等价于：δ[πM/2-π(x)]≥πd-πM/2由π(x)=(a-c-2x)x，πd=9(a-c)2/64，取δ=1/2，得：

x≤(a-c)/8或x≥3(a-c)/8。在惩罚子博弈中，企业愿意执行惩罚产量，则：

V(x)≥πdp(x)+δ·V(x)由πdp(x)

=(a-c-x)2/4，即得：3(a-c)/10≤x≤(a-c)/2在合作子博弈中，参与者愿意合作，则：从而可得，当δ=1/2时，“胡萝卜加大棒”策略能保证垄断利润作为子博弈精炼均衡结果出现，条件是惩罚产量x满足：从而可得，当δ=1/2时，“胡萝卜加大棒”策略能保证垄断利虽然惩罚是一把双刃剑，但严厉的目的是阻止不合作行为的发生（处罚必须可信），惩罚实际并不发生。法律威信关键在于违法必究，否则，再严厉的法律也没用。市场经济中的信用问题：虽然惩罚是一把双刃剑，但严厉的目的是阻止不合作行为的发生（处无名氏定理（推广）无名氏定理：令G（∞，δ）是一个n人无限次重复博弈，则任何一个有限次重复博弈中能观察到的任何一个行动组合都将是某个子博弈精炼纳什均衡结果，若：

1）博弈在任何一个重复阶段上结束的概率充分小。

2）贴现因子充分接近于1，即存在一个贴现因子δ*＜1使得对于所有的δ≥δ*时均成立。

3）该行动组合的支付向量v=(v1,v2,…,vn)满足，vi＞vi，这里是参与人i的最小最大支付，v=(v1,v2,…,vn)

是该博弈的最小最大支付组合。无名氏定理（推广）无名氏定理：令G（∞，δ）是一个n人无限次3、无限重复博弈的例子（1）可观察行动的重复博弈（参与人确定）：无限重复囚徒困境博弈古诺寡头垄断重复博弈效率工资时间一致性的货币政策

3、无限重复博弈的例子（1）可观察行动的重复博弈（参与人确定

（a）效率工资若产出完全由努力水平（道德）确定时，就业高工资和失业市场并存是有效率的。类似于古诺双头垄断下的共谋，在如下效率工资模型中，采用触发策略，能得到高产出高工资的均衡结果。高薪养廉：

（a）效率工资若产出完全由努力水平（道德）确定时，就业高模型设定企业为激励工人努力工作，一方面支付很高的薪水；同时又威胁一旦被发现偷懒，立即开除。作为这种高薪的一个后果，企业减少了对劳动力的需求，造成部份工人的高薪就业和其他工人的非自愿失业并存。在竞争均衡条件下，工资水平w和失业率u恰好可以使工人不去偷懒，并且企业在工资水平w下的劳动需求恰好使失业率等于u。以下分析一个企业和一个工人的情形。模型设定企业为激励工人努力工作，一方面支付很高的薪水；同时又阶段博弈考虑如下的阶段博弈：（1）企业对工人开出一个工资水平w；（2）工人接受或拒绝企业的开价。如果工人拒绝，则成为自我雇佣者，保留收益为w0；如果工人接受，则工人选择是否努力工作（努力带来负效用e）。工人的态度：如果努力工作，则肯定可以得到高产出y；如果偷懒，则以p的概率得到高产出，不妨设低产出为0（y＞0）。工人的博弈：工人偷懒时企业的期望收益为py。假设y-e>w0>py：这意味着对工人来说，受雇于企业并且努力工作是有效率的；对企业来说，工人自我雇佣要优于受雇于企业并偷懒。阶段博弈考虑如下的阶段博弈：该阶段博弈的子博弈精炼解是失望的，由于企业先付工资，工人没有动机努力工作，于是企业将开出0工资且工人选择自我雇佣。但在无限重复博弈中，触发策略将是一个子博弈精炼纳什均衡。如果企业在第一阶段开出工资w*(w*>w0)。给定企业的策略，工人接受是最优的。如果工人努力工作，企业将再次开出高工资，工人在下一阶段进行相同的博弈。该阶段博弈的子博弈精炼解是失望的，由于企业先付工资，工人没有对企业给定的工资w*来讲，如果工人努力工作，则工人收益的现值为

Ve=(w*-e)+δVe

即Ve=(w*-e)/(1-δ)如果工人偷懒，则偷懒的现值为

Vs=w*+δ[pVs+(1-p)w0/(1-δ)]

即Vs=[(1-δ)w*+δ(1-p)w0]/(1-δp)(1-δ)对工人来讲，如果Ve≥Vs，则选择努力工作是最优的，即：

w*≥w0+e(1-δp)/δ(1-p)=w0+e[1+(1-δ)/δ(1-p)]

对企业给定的工资w*来讲，如果工人努力工作，则工人收益的

w*≥w0+e(1-δp)/δ(1-p)=w0+e[1+(1-δ)/δ(1-p)]

这就是说，企业向工人支付的必须包括工人的自我机会收益、努力负效用和工资升水。自然地，如果偷懒很难被发现（p

1），则工资升水必须非常高才能激励工人努力工作。另一方面，如果偷懒必然被发现（p=0），则当w*≥w0+e/δ时，工人将选择努力工作。w*≥w0+e(1-δp)/δ(1-p)=w0+e[1+(给定工人的策略，则企业在第一阶段的参与约束条件为：y-w*≥0。此即：

y-e≥w0+e(1-δ)/δ(1-p)至此，我们已经得到，触发策略（企业在第一阶段开出高工资w*，并且在其后的每一阶段，若博弈过程是高工资、高产出，则继续开出高工资；工人的策略是如果w≥w0，则接受企业的工资，并且如果博弈的过程是高工资、高产出，则努力工作）是一个纳什均衡。给定工人的策略，则企业在第一阶段的参与约束条件为：y-w*要证明其是子博弈精炼均衡，只要证明对不是始于“高工资、高产出”之后的子博弈，上述策略也是一个纳什均衡即可。这是成立的：对企业来说，由于将来工人都不会努力工作，因而将永远开出0工资；对工人来说，工人在当前阶段也不会努力工作，并且只有在w≥w0时，才会接受给付的工资。要证明其是子博弈精炼均衡，只要证明对不是始于“高工资、高产出在劳动力市场上，同时存在多个企业，并且每一企业雇佣多名工人，此时，企业一般不会再雇佣因偷懒而被自己开除的工人，但是否会雇佣被其他企业因偷懒而开除的工人？合理的结果可能是“否”，因为这会使努力工作的工人失望。这可以解释日本大企业间白领雇员缺乏流动性。与此相对的是，若被解雇工人能很快找到新工作，则无法提供对偷懒的有效惩罚。日本和美国的工作观：在劳动力市场上，同时存在多个企业，并且每一企业雇佣多名工人，如果一个债务国能够在国际资本市场上通过短期交易重复从债权国借入长期贷款，则在无限重复博弈中对债务国的违约行为没有一个可行的惩罚方案。如果企业能很容易地从资本市场上融资，那么企业将热衷于资本游戏。如果一个债务国能够在国际资本市场上通过短期交易重复从债权国借（b）时间一致性的货币政策在单阶段博弈中，政府的货币政策具有动态不一致。现实中，政府与企业进行的是多阶段动态博弈，这是否会改变博弈结果呢？在无限重复博弈中，运用触发策略能使货币政策具有动态一致性。（b）时间一致性的货币政策在单阶段博弈中，政府的货币政策具有

假设货币当局与政府的贴现因子都为δ。考虑触发策略：雇主在第一阶段持有预期πe=0，在其后各阶段，如果所有前期的预期和真实的通货膨胀率π都为0，则继续预期πe=0，否则雇主持有预期πe=πs；在当前预期和所有以前的预期都为0，且所有以前的真实通货膨胀率都为0时，货币当局选择令π＝0的货币供给，否则货币当局选择πs＝π*(πe)。

假设货币当局与政府的贴现因子都为δ。给定雇主第一阶段的0通货膨胀预期和触发策略，货币当局的选择是：（1）π＝0，其效用为Mp，在下一阶段货币当局面临同样的选择；（2）选择π＝π*(0)，此时效用为Mf，但这将使得其后的πe=πs。此后，货币当局将永远选择π=πs，其效用为Ms。从而，当下式成立时，货币当局的0通货膨胀政策是对雇主策略的最优反应：

Mp/(1-δ)≥Mf+Msδ/(1-δ)给定雇主第一阶段的0通货膨胀预期和触发策略，货币当局的选择是由此可得，只要δ≥(Mf-Mp)/(Mf-Ms)，则货币当局的策略是对雇主策略的最优反应。在前面效用函数的假设下，条件为：δ≥c/(2c+β2)。同样，雇主策略是对货币当局策略的最优反应。与前面证明相同，上述触发策略是子博弈精炼均衡。由此可得，只要δ≥(Mf-Mp)/(Mf-Ms)，则货币当局（2）参与人不固定时的重复博弈

无名氏定理可以扩展到一部份参与人不固定的重复博弈：长期参与者和短期参与者。消费品市场交易就是一个典型例子。厂商是长期的固定参与人，不断重复提供产品（决定产品是高质量还是低质量），而消费者是不固定的，每个消费者只购买一次或有限次。（2）参与人不固定时的重复博弈无名氏定理可以扩展到一部份参产品质量博弈模型参与人：无限多的潜在企业和连续的消费者博弈顺序：

1）企业进入市场成本为F，企业进入数量n由进入成本决定；

2）进入市场的企业选择生产高质量的产品（成本为c）还是低质量的产品（成本为0），并选择价格p，消费者观察不到企业的质量选择；

3）消费者决定购买企业i的商品数量为qi，所有消费者观察到其购买商品的质量，博弈回到2），重复进行。支付：消费者从低质量的产品中得到支付为0；若认为产品是高质量的，则购买量为q(p)=∑qi，其中dq/dp<0。如果企业不进入市场，支付为0；如果企业进入市场（固定支付为-F），若生产低质量产品，则该期期末支付为qip，若生产高质量产品则期末支付为qi(p-c)。产品质量博弈模型参与人：无限多的潜在企业和连续的消费者同质厂商和同质消费者情形假定只有一个厂商提供产品，每个阶段只有一个消费者。在博弈的每一阶段，厂商选择提供高质量产品还是低质量产品，消费者选择是否购买。阶段博弈的支付矩阵如图。在一次性博弈中，唯一的纳什均衡是（不购买，低质量）。厂商高质量低质量消费者购买1，1－1，2不购买0，00，0同质厂商和同质消费者情形假定只有一个厂商提供产品，每个阶段只但在无限次重复博弈中，只要δ≥1/2，下列触发策略组合是一个子博弈精炼纳什均衡：厂商从生产高质量产品开始；继续生产高质量产品，除非曾经生产过低质量产品；如果上一次生产了低质量产品，则永远生产低质量产品。第一个消费者选择购买；只要厂商不曾生产过低质量产品，随后的消费者继续购买；如果厂商曾经生产过低质量产品，之后的消费者不再购买。此均衡的结果是（购买，高质量）。品牌的价值：但在无限次重复博弈中，只要δ≥1/2，下列触发策略组合是一个迭代模型与马尔可夫均衡参与人：两个企业A、B和一系列的消费者，每个消费者开始时是年轻人，然后是老年人。博弈顺序：

1a）企业A首先作为在位者企业，选择在位者价格p1i；企业B首先作为进入者企业，选择进入者价格p1e。

1b）老年人选择一个企业，年轻人选择一个企业，吸引了年轻人的那个企业成为进入者企业；

1c）老年人去世，年轻人变成老年人。

2a）博弈回到1a）重新开始，此时在位者和进入者的身份可能改变。支付：贴现率为

。消费者的保留价格为R，转换成本为c；企业j=(i,e)在t期的当前支付

tj分别是0(没吸引顾客)、ptj

(吸引1个顾客)和2ptj

(吸引2个顾客)。老年人、年轻人从在位者和进入者企业购买的t期支付分别为：

toi=R-pti，toe=R-pte-c，tyi=R-pti，tye=R-pte。迭代模型与马尔可夫均衡参与人：两个企业A、B和一系列的消费者分析

toi=R-pti，toe=R-pte-c，tyi=R-pti，tye=R-pte首先，在位者的价格需保持对老年人有足够吸引力，即进入者的价格应满足pe≥pi-c。在位者的选择pi将使进入者是否争夺老年人是无差异的，即使得进入者选择pe=pi和pe=pi-c的利润无差异，即：pi=2(pi-c).于是在位者和进入者价格满足：pi=pe=2c。均衡中，在位者和进入者轮流转换，且制定同样的价格。分析toi=R-pti，toe=R-pte-c，马尔可夫策略指参与人在每个节点上的行动只取决于上一期的行动（或参与人在上一期的行动集合），而和博弈的历史无关的策略。在马尔可夫均衡中，由

e*=pe+i*

i*=pi+e*由此，即得i*=e*=2c/(1-)。马尔可夫策略指参与人在每个节点上的行动只取决于上一期的行动（4、不完美信息重复博弈

“参与人过去的行为是共同信息”这一假设通常很难满足。在多数重复博弈中，在每一期末，所有参与人观察到一个共同结果，每个参与人实现的收益只和他自己的行为和公共结果有关。每个参与人只是通过他们对结果分布的作用来影响其他参与人的收益。4、不完美信息重复

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论完全信息动态博弈课件

文档简介

温馨提示

最新文档

评论

博弈论完全信息动态博弈课件

文档简介

温馨提示

最新文档

评论

相关文档