第8章-重复博弈课件

上传人：w*** IP属地：中国上传时间：2023-08-21 格式：PPT 页数：125 大小：983.66KB 积分：25 举报 版权申诉

已阅读5页，还剩120页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第二部分：完全信息动态博弈第二部分：1第八章重复博弈

主要内容：一、有限重复博弈二、无限重复博弈三、讨价还价博弈第八章重复博弈主要内容：2第八章重复博弈

主要内容：一、有限重复博弈二、无限重复博弈三、讨价还价博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng第八章重复博弈主要内容：ControlScience一、有限重复博弈重复博弈所关心的议题：将来可信的威胁或承诺如何影响到当前的行动ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng一、有限重复博弈重复博弈所关心的议题：ControlS考察下列博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考察下列博弈ControlScienceandEngi上述博弈存在唯一的Nash均衡。将上述博弈重复两次，其中第二次博弈开始时，第一次博弈的结果已知。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng上述博弈存在唯一的Nash均衡。Cont两次重复博弈的博弈树ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng两次重复博弈的博弈树ControlScienceand上述重复博弈只存在唯一的Nash均衡：在每次博弈中，参与人1都选择U，参与人2都选择L，即((U,U,U,U,U),(L,L,L,L,L))可以证明：该均衡为精炼Nash均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng上述重复博弈只存在唯一的Nash均衡：在ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin前面的分析说明：在两次重复博弈中，合作仍无法到达。同样可证明：在n阶段重复博弈(即博弈重复n次且每次博弈开始时，前面博弈的结果都已知)中，合作同样无法到达。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng前面的分析说明：在两次重复博弈中，合作仍重复博弈定义对于给定的阶段博弈G，令G(T)表示G重复进行T次的有限重复博弈，并且在下一此博弈开始前，所有以前博弈的进程都可被观测到,G(T)的收益为T次阶段博弈收益的简单相加。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng重复博弈定义对于给定的阶段博弈G，令G在重复博弈中，当全部博弈进行到任何一个阶段，到此为止的进行过程就成为参与各方的共同知识，而其后尚未开始进行的部分就是一个子博弈。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在重复博弈中，当全部博弈进行到任何一个定理：如果阶段博弈G有唯一的Nash均衡，则对任意有限的T，重复博弈G(T)有唯一的子博弈精炼解，即G的Nash均衡结果在每一个阶段重复进行。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng定理：如果阶段博弈G有唯一的Nash均考察下列博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考察下列博弈ControlScienceandEngi上述博弈存在两个Nash均衡：(L1,L2)和(R1,R2)将上述博弈重复两次。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng上述博弈存在两个Nash均衡：Control1)战略：每个局中人都有个战略；ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng1)战略：ControlScienceand2)战略组合：一共存在个战略组合；

ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng2)战略组合：ControlSciencea3)均衡：可以根据以下原则构造均衡：由第一阶段的结果，预测第二阶段的均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng3)均衡：ControlSciencean例如：若第一阶段出现(M1,M2)(即出现合作)，则第二阶段为(R1,R2)(即“好的均衡”)；

若第一阶段没有出现(M1,M2),则第二阶段为(L1,L2)(即“差的均衡”)。

ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng例如：ControlScienceandEnginee根据上述原则，可构造如下策略：S1：第一阶段选择M1；如第一阶段结果为(M1，M2)，则下一阶段选R1；否则选择L1。S2：第一阶段选择M2；如第一阶段结果为(M1，M2)，则下一阶段选R2；否则选择L2。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng根据上述原则，可构造如下策略：S1：第一阶段选择M1；如第一在上述策略下，博弈可表示为：这意味着：合作可以在第一阶段达到ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在上述策略下，博弈可表示为：这意味着：合作可以在第一阶段定理：如果G=<T,(Ai),(ui)>是一个有多个Nash均衡的完全信息静态博弈，则G(T)可以存在子博弈精炼解，其中对每一t<T,t阶段的结果都不是G的Nash均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng定理：如果G=<T,(Ai),(上述结论说明：对将来行动所作的可信威胁或承诺可以影响到当前的行动。考察下列博弈。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng上述结论说明：ControlSciencControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin

如果第一阶段出现(Y1,Y2),则第二阶段(Z1,Z2);

如果第一阶段出现(Y1,w),其中(w

Y2),则第二阶段为(P1,P2)；ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng如果第一阶段出现(Y1,Y2),则第二阶

如果第一阶段出现(w,Y2),其中(w

Y1),则第二阶段(Q1,Q2);

如果第一阶段出现(w1,w2),其中(w1

Y1,w2

Y2),则第二阶段为(Z1,Z2)。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng如果第一阶段出现(w,Y2),其中(wControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin显然，上述策略构成博弈的Nash均衡，且为子博弈精炼Nash均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng显然，上述策略构成博弈的Nash均衡，第八章重复博弈

主要内容：一、有限重复博弈二、无限重复博弈三、讨价还价博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng第八章重复博弈主要内容：ControlScience二、无限重复博弈定义(无线重复博弈)给定一阶段博弈G，令表示相应的无限重复博弈，其中G将无限次低重复进行，且参与人的贴现率为。对每个t，之前t-1次阶段博弈的结果在t阶段开始进行前都可以被观测到，每个参与人在中的收益都是该参与人在无限次的阶段博弈中所得受益的现值。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng二、无限重复博弈定义(无线重复博弈)给定一阶段博弈G，令

在有限重复博弈G(T)中，由第t+1阶段开始的一个子博弈为G进行T-t次的重复博弈，可表示为G(T-t)。

由第t+1阶段开始有许多子博弈，到t阶段为止的每一可能的进行过程之后都是不同的子博弈。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在有限重复博弈G(T)中，由第t+1

在无限重复博弈中，由t+1阶段开始的每个子博弈都等同于初始博弈，和在有限情况下相似，博弈到t阶段为止有多少不同的可能进行过程，就有多少从t+1阶段开始的子博弈。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在无限重复博弈

对于无限重复博弈，参与人在博弈的每一时点，都不必考虑过去的得失，也就是说，无限重复博弈中，参与人过去的得失并不重要，可以看成是沉没成本(或收入)。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng对于无限重复博弈，参与人在博弈的每一时点下列博弈重复无限次。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng下列博弈重复无限次。ControlScienceand对于阶段博弈为上述博弈的有限重复博弈，合作不可能形成。但对于无限重复博弈，在一定的贴现率下，合作有可能形成。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng对于阶段博弈为上述博弈的有限重复博弈，合构造如下触发策略：S1：第i阶段选择D；如第i阶段结果为(D，R)，则下一阶段选D；否则以后一直选择U。S2：第i阶段选择R；如第i阶段结果为(D，R)，则下一阶段选R；否则以后一直选择L。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng构造如下触发策略：S1：第i阶段选择D；如第i阶段结果为(D

可用证明：在一定的贴现率下，上述触发策略构成Nash均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng可用证明：在一定的贴现率下，上述触发策略贴现率的求解所以ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng贴现率的求解所以ControlScienceandEn可行收益

一组收益为阶段博弈G的可行收益，如果它们是G的纯战略收益的凸组合(即纯战略收益的加权平均，权重非负且和为1)。

前述阶段博弈的可行收益集合如下图所示。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng可行收益一组收益阴影部分为上述博弈的可行收益区间(0,5)(1,1)(0,0)(4,4)(5,0)ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng阴影部分为上述博弈的可行收益区间(0,5)(1,1)(0,0平均收益

给定贴现率，无限的收益序列的平均收益ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng平均收益给定贴现率，无限的收所以故ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng所以故ControlScienceandEnginee令G为一个有限的完全信息静态博弈，令为G的一个Nash均衡下的收益，且用表示G的其它任何可行收益。若存在则存在足够接近1的贴现率，使无限重复博弈存在一个子博弈精炼Nash均衡，其平均收益可达到定理：ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng令G为一个有限的完全信息静态博弈，令定理：ControlS子博弈精炼Nash均衡的可行收益区间(0,5)(1,1)(0,0)(4,4)(5,0)ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng子博弈精炼Nash均衡的可行收益区间(0,5)(1,1)(0在贴现因子并不“足够接近于1”时，子博弈精炼Nash均衡能达到什么样的平均收益?ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在贴现因子并不“足够接近于1”时，子博

思路之一：令贴现率等于一个固定值，并在假设参与者运用触发战略，一旦发生任何偏离就永远转到阶段博弈的Nash均衡的条件下，计算可以达到的平均收益。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng思路之一：ControlScienceandEn

在决定当前阶段是否偏离时，贴现率越小，下一阶段开始进行惩罚的效果就越小。然而，一般来讲参与者总可以比简单重复阶段博弈的Nash均衡得到更高的收益。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在决定当前阶段是否偏离时，贴现率越小，

思路之二：由阿布勒(Abreu，1988)最先提出，它基于如下思路，即阻止一个参与者偏离既定战略的最有效的方法是威胁该参与者，一旦偏离，就将受到最严厉的可信的惩罚，即威胁该参与者，一旦偏离，就将选择使偏离者收益最低的无限重复博弈的子博弈精炼Nash均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng思路之二：ControlScienceandEn

在绝大多数博弈中，永远转到阶段博弈的Nash均衡并不是最严厉的可信惩罚，于是有些使用触发战略方法无法达到的平均收益，运用阿布勒的方法可以达到。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在绝大多数博弈中，永远转到阶段博弈的N

考虑古诺博弈为阶段博弈的无限重复博弈，两企业的贴现率都为。计算两个企业的下述触发战略成为无限重复博弈的Nash均衡时，贴现率的值。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考虑古诺博弈为阶段博弈的无限重复博弈，两触发战略

在第一阶段都生产垄断产量的一半。第t阶段，如果前面t-1个阶段两个企业的产量都为，则生产；否则，生产古诺产量。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng触发战略在第一阶段都生产垄断产量的一半当双方都生产时，每个企业的利润为，用来表示。当双方都生产时，每个企业的利润为我们用表示。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng当双方都生产时，每个企业若企业i将在本期生产，则使企业j本期利润最大化的产量为下式的解其解为，其利润水平为ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng若企业i将在本期生产，则使企业j本期利润最大ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin首先计算对任意一个给定贴现率，如果双方都采用触发战略，一旦出现背离就永远转到古诺产出，企业可以达到的利润最大化的产量。显然，该产量处于古诺产出与垄断产出之间。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng首先计算对任意一个给定贴现率，如果双方考虑如下的触发战赂：第一阶段生产。在第t阶段，如果在此之前的t-1个阶段两企业的产量都是，生产；否则，生产古诺产出。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考虑如下的触发战赂：ControlControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin考虑下面的“两面”(亦称胡萝卜加大棒)战略：在第一阶段生产垄断产量的一半，即；第t阶段，如果两个企业在第t－1阶段都生产，则生产；如果两个企业在t-1阶段的产量都是x，则生产；其他情况下生产x。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考虑下面的“两面”(亦称胡萝卜加大棒)战略上述战略为参与者提供了两种手段：其一是(单阶段的)惩罚，这时企业生产x；其二是(潜在无限阶段的)合作，这时企业的产量为。如果任何一个企业偏离了合作，则惩罚开始，如果任何一个企业背离了惩罚，则会使博弈进入又一轮惩罚。如果两个企业都不肯离惩罚，则在下一阶段又回到合作。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng上述战略为参与者提供了两种手段：ControlScControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin

如果两企业都采用上面的“两面”战略，则无限重复博弈里的子博弈就可归为两类：(1)合作的子博弈，其前面一个阶段的结果是或(x,x)；(2)惩罚的子博弈，其前面一个阶段的结果既非，又不是(x,x)。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng如果两企业都采用上面的“两面”战略，则两企业都采取上面的“两面”战略要成为一个子博弈精炼Nash均衡，则在其每一类子博弈中遵循该战略必须是Nash均衡。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng两企业都采取上面的“两面”战略要成为具体地说，在合作的子博弈中，每一企业与本期得到的收益，且下期得到惩罚的现值收益V(x)相比，必须更愿意永远得到垄断收益的一半，即ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng具体地说，在合作的子博弈中，每一企业与

在惩罚的子博弈中，每一企业与本期得到的收益，且下期又开始惩罚相比，企业更愿意共同执行惩罚产量，即ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng在惩罚的子博弈中，每一企业与本期得到ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin罗伯特·爱克斯罗德实验罗伯特·爱克斯罗德(政治科学家)，对合作的问题具有研究兴趣。为了进行关于合作的研究，他组织了一场计算机竞赛。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng罗伯特·爱克斯罗德实验罗伯特·爱克斯这个竞赛的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角色。他们把自己的策略编入计算机程序，然后他们的程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择，并且游戏重复多次。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng这个竞赛的思路非常简单：Control竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是，竞赛的桂冠属于其中最简单的策略：一报还一报(TITFORTAT)。这是多伦多大学心理学家阿纳托·拉帕波特提交上来的策略。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng竞赛的第一个回合交上来的14个程序中包一报还一报的策略是这样的：它总是以合作开局，但从此以后就采取以其人之道还治其人之身的策略。也就是说，一报还一报的策略实行了胡萝卜加大棒的原则。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng一报还一报的策略是这样的：它总是以合作一报还一报的策略永远不先背叛对方，从这个意义上来说它是“善意的”。

一报还一报策略会在下一轮中对对手的前一次合作给予回报（哪怕以前这个对手曾经背叛过它），从这个意义上来说它是"宽容的"。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng一报还一报的策略永远不先背叛对方，从但一报还一报策略会采取背叛的行动来惩罚对手前一次的背叛，从这个意义上来说它又是“强硬的”。

而且，一报还一报策略的策略极为简单，对手程序一望便知其用意何在，从这个意义来说它又是"简单明了的"。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng但一报还一报策略会采取背叛的行动来惩罚为了验证上述结果的合理性，爱克斯罗德又举行了第二轮竞赛，特别邀请了更多的人，看看能否从一报还一报策略那儿将桂冠夺过来。这次有62个程序参加了竞赛，结果是一报还一报又一次夺魁。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng为了验证上述结果的合理性，爱克斯罗德又竞赛的结论无可争议地证明：好人，或更确切地说，具备以下特点的人，将总会是赢家。1．善意的；2．宽容的；3．强硬的；4．简单明了的。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng竞赛的结论无可争议地证明：好人，或更确切一报还一报策略的胜利对人类和其他生物的合作行为的形成具有深刻地含义。爱克斯罗德在《合作进化》一书中指出，一报还一报策略能导致社会各个领域的合作，包括在最无指望的环境中的合作。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng一报还一报策略的胜利对人类和其他生物的典型的例子就是第一次世界大战中自发产生的“自己活，也让他人活”的原则。

当时，前线战壕里的军队约束自己不开枪杀伤人，只要对方也这么做。使这个原则能够实行的原因是，双方军队都已陷入困境数月，这给了他们相互适应的机会。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng典型的例子就是第一次世界大战中自发产生的一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。这样的例子很多：真菌从地下的石头中汲取养分，为海藻提供了食物，而海藻反过来又为真菌提供了光合作用；金蚁合欢树为一种蚂蚁提供了食物，而这种蚂蚁反过来又保护了该树；无花果树的花是黄蜂的食物，而黄蜂反过来又为无花果树传授花粉，将树种撒向四处。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng一报还一报的相互作用使得自然界即使没有更广泛地说，共同演化会使一报还一报的合作风格在这个充满背信弃义劣行的世界上蔚然成风。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng更广泛地说，共同演化会使一报还一报的假设少数采取一报还一报策略的个人在这个世界上通过突变而产生了。那么，只要这些个体能互相遇见，足够在今后的相逢中形成利害关系，他们就会开始形成小型的合作关系。一旦发生了这种情况，他们就能远胜于他们周围的那些背后藏刀的类型。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng假设少数采取一报还一报策略的个人在这这样，参与合作的人数就会增多。很快，一报还一报式的合作就会最终占上风。而一旦建立了这种机制，相互合作的个体就能生存下去。如果不太合作的类型想侵犯和利用他们的善意，一报还一报政策强硬的一面就会狠狠地惩罚他们，让他们无法扩散影响。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng这样，参与合作的人数就会增多。很快，一第八章重复博弈

主要内容：一、有限重复博弈二、无限重复博弈三、讨价还价博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng第八章重复博弈主要内容：ControlScience讨价还价博弈亦称序贯谈判。其具体过程如下。三、讨价还价博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng讨价还价博弈亦称序贯谈判。其具体过程如下参与人1和参与人2就一美元的分配进行谈判。他们轮流提出方案：首先参与人1提出一个分配建议，参与人2可以接受或拒绝；如果参与人2拒绝，就由参与人2提出分配建议，参与人1选择接受或拒绝；如此一直进行下去。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng参与人1和参与人2就一美元的分配进行谈注意：在博弈中，一个条件一旦被拒绝，它就不再具有任何约束力，并和博弈下面的进程不再相关。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng注意：ControlScienceandEngi第一阶段：在第一阶段开始时，参与人1建议他分得1美元的s1，参与人2得1-s1；参与人2接受这一建议，则博弈结束，否则博弈进入第二阶段。考察三阶段的序贯谈判ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng第一阶段：考察三阶段的序贯谈判ControlScience第二阶段：在第二阶段开始时，参与人2建议参与人分得1美元的s2，参与人2得1-s2；参与人1接受这一建议，则博弈结束，否则博弈进入第三阶段。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng第二阶段：ControlScienceandEngin第三阶段：在第三阶段，参与人1得1美元的s，参与人2得1－s。博弈结束。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng第三阶段：ControlScienceandEngin如不考虑贴现，由逆向归纳法很容易求得均衡结果——(s，1－s)。

博弈的结果就是外界强加的结果。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng如不考虑贴现，由逆向归纳法很容易求得均衡假设参与人的贴现率都为。

首先考察参与人2在第二阶段的最优选择。

ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng假设参与人的贴现率都为。Cont由于若博弈进入第三阶段，参与人1可得s，相当于第二阶段的，因此，ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng由于若博弈进入第三阶段，参与人1可得s，考察参与人1在第一阶段的最优选择。参与人1在第一阶段即可预测到参与人2在第二阶段的最优选择ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考察参与人1在第一阶段的最优选择。ConControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin假设参与人的贴现率分别为：首先考察参与人2的最优选择。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng假设参与人的贴现率分别为：ControlSci考察参与人1在第一阶段的最优选择。

ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考察参与人1在第一阶段的最优选择。ContrControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerin

考虑以上述讨价还价博弈为阶段博弈的无限重复博弈。

假设贴现率为。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng考虑以上述讨价还价博弈为阶段博弈的无限

由于在无限重复博弈中，由t+1阶段开始的每个子博弈都等同于初始博弈，因此，从第t阶段开始的子博弈等同于t+2阶段开始的子博弈。ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfeng由于在无限重复博弈ControlScienceandEngineering,HUSTAllRights

Reserved,

2007,LuoYunfengControlScienceandEngineerinControlScienceandEngineering

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第8章-重复博弈课件

文档简介

温馨提示

最新文档

评论

第8章-重复博弈课件

文档简介

温馨提示

最新文档

评论

相关文档