版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二十七章寡头垄断寡头垄断垄断市场只有一个厂商。双寡头市场仅有两个厂商。寡头市场有几个厂商构成。特别的是,每个厂商的价格和生产量决策影响到它竞争者的利润。寡头垄断我们分析供给为寡头垄断的市场?考虑生产同质产品的双寡头情况。数量竞争假设厂商通过选择产量来竞争。假如厂商1 生产y1 单位产品,厂商 2生产 y2 单位产品,那么市场的总供给量为y1 + y2. 市场价格为p(y1+ y2)。厂商的总成本函数为: c1(y1) 和c2(y2).数量竞争假设厂商1将厂商2的产量视为给定,那么厂商1的利润函数为:给定 y2, 产量y1 为多少时可最大化厂商1的利润?数量竞争; 一个例子假设市场的反需求函数
2、为:厂商的总成本函数为:和数量竞争; 一个例子对于给定的y2, 厂商1的利润函数为:数量竞争; 一个例子对于给定的y2, 厂商1的利润函数为:对于给定的y2, 厂商1的利润最大化产量可通过解下式获得:数量竞争; 一个例子对于给定的y2, 厂商1的利润函数为:对于给定的y2, 厂商1的利润最大化产量可通过解下式获得:例如, 厂商1的反应函数为:数量竞争; 一个例子y2y16015厂商1的反应曲线 数量竞争; 一个例子类似地,给定y1, 厂商2的利润函数为:数量竞争; 一个例子类似地,给定y1, 厂商2的利润函数为:因此给定y1, 厂商2的利润最大化产量可通过解下式获得:数量竞争; 一个例子类似地
3、,给定y1, 厂商2的利润函数为:因此给定y1, 厂商2的利润最大化产量可通过解下式获得:例如, 厂商2的反应函数为:数量竞争; 一个例子ey2y1厂商2的反应曲线45/445数量竞争; 一个例子但每个厂商的产量为其它厂商的反应函数产量时市场达到均衡,因为此时双方都不想改变产量。一对产出水平(y1*,y2*) 为古诺-纳什均衡假如和数量竞争; 一个例子和数量竞争; 一个例子和将y2*代入可得数量竞争; 一个例子和将y2*代入可得数量竞争; 一个例子和将y2*代入可得因此数量竞争; 一个例子和将y2*代入可得因此因此古诺-纳什均衡为:数量竞争; 一个例子y2y1厂商2的反应曲线6015厂商1的反
4、应曲线45/445数量竞争; 一个例子y2y1厂商2的反应曲线4860厂商1的反应曲线813古诺-纳什均衡数量竞争一般来说, 给定厂商2选择的产出水平y2, 厂商1的利润函数为:利润最大化的y1 产量可通过解解得y1 = R1(y2), 为厂商1对于y2的古诺-纳什反应。数量竞争类似地,给定厂商1选择的产出水平y1, 厂商2的利润函数为:利润最大化的y2 值可通过解解得y2 = R2(y1), 为厂商2对y1的古诺-纳什反应。数量竞争y2y1厂商2的反应曲线厂商1的反应曲线古诺-纳什均衡y1* = R1(y2*) 和y2* = R2(y1*)等利润曲线对于厂商1, 一条等利润曲线包含了所有能产
5、生利润P1的产出对 (y1,y2)。等利润线是什么样子?y2y1厂商1的等利润曲线y1 固定,厂商1的利润随着y2上升而下降。y2y1厂商1的利润上升。厂商1的等利润曲线y2y1厂商1的等利润曲线Q: 厂商2的产量为y2 = y2时,厂商1最大化利润产出水平为多少?y2y2y1厂商1的等利润曲线Q: 厂商2的产量为y2 = y2时,厂商1最大化利润产出水平为多少? A: 达到厂商1最高等利润线那一点为其利润最大化点。y2y1y2y1厂商1的等利润曲线Q: 厂商2的产量为y2 = y2时,厂商1最大化利润产出水平为多少? A: 达到厂商1最高等利润线那一点为其利润最大化点。y1 为厂商1对厂商2
6、 产量y2 = y2 的最佳反应生产量。 y2y1y2y1厂商1的等利润曲线Q: 厂商2的产量为y2 = y2时,厂商1最大化利润产出水平为多少? A: 达到厂商1最高等利润线那一点为其利润最大化点。y1 为厂商1对厂商2 产量y2 = y2 的最佳反应生产量。y2R1(y2)y2y1y2R1(y2)y2”R1(y2”)厂商1的等利润曲线y2y1y2y2”R1(y2”)R1(y2)厂商1的反应函数通过厂商1等利润线的最高点。厂商1的等利润曲线y2y1厂商2的等利润线厂商2的利润上升。y2y1厂商2的等利润线厂商2的反应函数通过其等利润线的最高点。y2 = R2(y1)串谋Q: 古诺-纳什均衡所
7、获利润是否为两厂商所能获利润的最大值?串谋y2y1y1*y2*是否还有其它产出对 (y1,y2) 能使两个厂商获得更多的利润?(y1*,y2*) 为古诺-纳什均衡点。串谋y2y1y1*y2*是否还有其它产出对 (y1,y2) 能使两个厂商获得更多的利润?(y1*,y2*) 为古诺-纳什均衡点。串谋y2y1y1*y2*是否还有其它产出对 (y1,y2) 能使两个厂商获得更多的利润?(y1*,y2*) 为古诺-纳什均衡点。串谋y2y1y1*y2*(y1*,y2*) 为古诺-纳什均衡点。更高的 P2更高的 P1串谋y2y1y1*y2*更高的 P2更高的P1y2y1串谋y2y1y1*y2*y2y1更高
8、的 P2更高的 P1串谋y2y1y1*y2*y2y1更高的 P2更高的 P1(y1,y2) 比(y1*,y2*)使得两厂商能获得更多的利润。串谋因此两个厂商存在通过合作降低产量而获得更多利润的动机。我们称为串谋。串谋的厂商称为卡特尔。假如厂商构成一个卡特尔,它们会如何行动?串谋假设两厂商想最大化其利润并平分所得利润。它们的目标就是通过合作选择产量y1 和y2使得下式最大化串谋厂商不可能通过串谋而受损,因为它们可以合作选择古诺-纳什产量且获得古诺-纳什均衡利润。因此串谋所得 利润至少要比古诺-纳什均衡一样大。串谋y2y1y1*y2*y2y1更高的 P2更高的 P1(y1,y2) 比(y1*,y2
9、*)能使两厂商获得高的利润。串谋y2y1y1*y2*y2y1更高的P2更高的 P1(y1,y2) 比(y1*,y2*)能使两厂商获得高的利润。(y1”,y2”) 能使两厂商获得高多利润。y2”y1”串谋y2y1y1*y2*y2y1(y1,y2) 使得厂商1的利润最大化,但使厂商2的利润保留在古诺-纳什 均衡水平。串谋y2y1y1*y2*y2y1(y1,y2) 使得厂商1的利润最大化,但使厂商2的利润保留在古诺-纳什 均衡水平。y2_y2_(y1,y2) 使得厂商2的利润最大化,但使厂商1的利润保持在古诺-纳什均衡水平。串谋y2y1y1*y2*y2y1y2_y2_蓝色线即为最大化厂商1的利润但同
10、时使得厂商2的利润至少保持在古诺-纳什均衡利润的产出对路径。串谋y2y1y1*y2*y2y1y2_y2_蓝色线即为最大化厂商1的利润但同时使得厂商2的利润至少保持在古诺-纳什均衡利润的 产出对路径。 线中必有一点能最大化 卡特尔的联合利润。串谋y2y1y1*y2*y2my1m(y1m,y2m) 表示最大化卡特尔总利润的产量。串谋这样的卡特尔是否稳定?厂商是否有欺骗其它厂商的动机?例如, 假如厂商1保持y1m 的产量, 最大化利润的厂商2是否会保持y2m的产量?串谋厂商2对厂商1产量y1 = y1m的利润最大化反应函数为y2 = R2(y1m)。串谋y2y1y2my1my2 = R2(y1m)
11、为对厂商1产量y1 = y1m的最佳反应产量。R2(y1m)y1 = R1(y2), 厂商1的反应函数y2 = R2(y1), 厂商2的反应曲线。串谋厂商2对厂商1产量y1 = y1m的利润最大化反应产量为:y2 = R2(y1m) y2m.厂商2通过欺骗厂商1将产量从y2m提高至R2(y1m)可以使其利润上升。串谋类似地,厂商1可以通过欺骗厂商2将产量从y1m提升至R1(y2m)来增加利润。串谋y2y1y2my1my2 = R2(y1m) 为厂商2对厂商1产量y1 = y1m反应的最佳产量。R1(y2m)y1 = R1(y2), 厂商1的反应曲线y2 = R2(y1), 厂商2的反应曲线串谋
12、因此通过合作来确定其产量水平以获取利润的卡特尔组织是不稳定的。例如, OPEC组织内部成员的毁约。串谋因此通过合作来确定其产量水平以获取利润的卡特尔组织是不稳定的。例如, OPEC组织内部成员的毁约。但是假如这种博弈持续很多次而不是一次,那么卡特尔是不是稳定的?因为这样会对欺骗者有一个惩罚机制。串谋与惩罚策略为了了解这样的卡特尔是否稳定,我们需要知道3个条件:(i) 每家厂商每期在卡特尔组织中的利润?(ii) 假如厂商在第一期中欺骗其它厂商,那么它能获得的利润为多少?(iii) 厂商在第一期欺骗其它厂商后,它在今后每期所能获得利润为多少?串谋与惩罚策略假设两厂商的市场反需求函数为:p(yT)
13、= 24 yT 总成本函数为:c1(y1) = y21 和 c2(y2) = y22.串谋与惩罚策略(i) 卡特尔组织中的每家厂商每期利润维多?p(yT) = 24 yT , c1(y1) = y21 , c2(y2) = y22.假如厂商串谋,那么它们的总利润为:M(y1,y2) = (24 y1 y2)(y1 + y2) y21 y22.产出y1 和 y2为多少时能最大化卡特尔的利润?串谋与惩罚策略M(y1,y2) = (24 y1 y2)(y1 + y2) y21 y22.产出y1 和 y2为多少时能最大化卡特尔的利润?解如下式子:串谋与惩罚策略M(y1,y2) = (24 y1 y2)
14、(y1 + y2) y21 y22.产出y1 和 y2为多少时能最大化卡特尔的利润?解如下式子:解为yM1 = yM2 = 4.串谋与惩罚策略M(y1,y2) = (24 y1 y2)(y1 + y2) y21 y22.yM1 = yM2 = 4 最大化卡特尔的利润。最大化利润为: M = $(24 8)(8) - $16 - $16 = $112.假设厂商平分利润, 每家厂商每期获得 $112/2 = $56的利润。串谋与惩罚策略(iii)厂商在第一期欺骗其它厂商后,它在今后每期所能获得利润为多少?这要取决于对欺骗厂商所实施的惩罚。串谋与惩罚策略(iii)厂商在第一期欺骗其它厂商后,它在今后
15、每期所能获得利润为多少?这要取决于对欺骗厂商所实施的惩罚。假如另一厂商以后都不与欺骗厂商合作来惩罚它厂商在不合作情况下的古诺-纳什均衡利润为多少?串谋与惩罚策略厂商在不合作情况下的古诺-纳什均衡利润为多少?p(yT) = 24 yT , c1(y1) = y21 , c2(y2) = y22.给定 y2, 厂商1的利润函数为:1(y1;y2) = (24 y1 y2)y1 y21.串谋与惩罚策略厂商在不合作情况下的古诺-纳什均衡利润为多少?p(yT) = 24 yT , c1(y1) = y21 , c2(y2) = y22.给定 y2, 厂商1的利润函数为: 1(y1;y2) = (24 y
16、1 y2)y1 y21.厂商1对于厂商2的产量y2的最佳反应产量通过下式解得:串谋与惩罚策略厂商在不合作情况下的古诺-纳什均衡利润为多少?1(y1;y2) = (24 y1 y2)y1 y21. 类似地, 串谋与惩罚策略厂商在不合作情况下的古诺-纳什均衡利润为多少?1(y1;y2) = (24 y1 y2)y1 y21. 类似地, 古诺-纳什均衡时的产量(y*1,y*2)为: y1 = R1(y2) 和 y2 = R2(y1) y*1 = y*2 = 48.串谋与惩罚策略厂商在不合作情况下的古诺-纳什均衡利润为多少?1(y1;y2) = (24 y1 y2)y1 y21. y*1 = y*2
17、= 48.每家厂商在古诺-纳什均衡时每期的利润为:*1 = *2 = (144)(48) 482 $46。串谋与惩罚策略(ii) 假如厂商在第一期中欺骗其它厂商,那么它能获得的利润为多少?在给定厂商2合作的产量为yM2 = 4的前提下,厂商1欺骗厂商2而选择选择其利润最大化产量yCH1,其值为多少?串谋与惩罚策略(ii) 假如厂商在第一期中欺骗其它厂商,那么它能获得的利润为多少?在给定厂商2合作的产量为yM2 = 4的前提下,厂商1欺骗厂商2而选择选择其利润最大化产量yCH1,其值为多少?yCH1 = R1(yM2) = (24 yM2)/4 = (24 4)/4 = 5.厂商1在欺骗厂商2的
18、当期所获利润为:CH1 = (24 5 1)(5) 52 = $65.串谋与惩罚策略为了了解这样的卡特尔是否稳定,我们需要知道3个条件:(i) 每家厂商每期在卡特尔组织中的利润?$56。(ii) 假如厂商在第一期中欺骗其它厂商,那么它能获得的利润为多少? $65。(iii) 厂商在第一期欺骗其它厂商后,它在今后每期所能获得利润为多少?$46。串谋与惩罚策略每家厂商的折现因子为:1/(1+r).厂商1不欺骗时所获利润的现值为多少?串谋与惩罚策略每家厂商的折现因子为:1/(1+r).厂商1不欺骗时所获利润的现值为:串谋与惩罚策略每家厂商的折现因子为:1/(1+r).厂商1不欺骗时所获利润的现值为:
19、厂商1当期欺骗时所获总利润的现值为多少?串谋与惩罚策略每家厂商的折现因子为:1/(1+r).厂商1不欺骗时所获利润的现值为:厂商1当期欺骗时所获总利润的现值为:串谋与惩罚策略因此卡特尔是稳定的,假如:行动的次序到目前为止我们都假定两个厂商同时选择其产量水平。厂商之间的竞争为同步博弈,而产量则为决策变量。行动的次序假如厂商1先选择产量水平,然后厂商最其行为做出反应,结果如何?厂商1为领导者,厂商2为追随者。竞争变为序贯博弈,而产出水平为决策变量。行动的次序这样的博弈称为斯塔克尔伯格博弈。做领导者更好?还是做追随者更好?斯塔克尔伯格博弈Q: 对于领导厂商1的产出水平y1 ,厂商2的最佳反应产量为多
20、少?斯塔克尔伯格博弈Q: 对于领导厂商1的产出水平y1 ,厂商2的最佳反应产量为多少?A: 选择 y2 = R2(y1)。斯塔克尔伯格博弈Q: 对于领导厂商1的产出水平y1 ,厂商2的最佳反应产量为多少?A: 选择 y2 = R2(y1)。厂商1知道厂商2会根据自己的产量作出决策,并且能完好地预期厂商2对其自身产量y1的反应。斯塔克尔伯格博弈市场领导者的利润函数:斯塔克尔伯格博弈市场领导者的利润函数:市场领导者选择产量y1来最大化其利润。斯塔克尔伯格博弈市场领导者的利润函数:市场领导者选择产量y1来最大化其利润。Q: 市场领导者是否会获得至少比古诺-纳什均衡利润一样多的利润?斯塔克尔伯格博弈A
21、: 是的。市场领导者会选择古诺-纳什均衡的产出水平, 因为追随者也会选择古诺-纳什均衡水平。此时领导者的利润即为古诺-纳什均衡利润。但是领导者不必要这么做,因此它的利润至少有古诺-纳什均衡那么多。斯塔克尔伯格博弈; 一个例子市场的反需求函数为:p = 60 yT。厂商的成本函数为:c1(y1) = y12 和 c2(y2) = 15y2 + y22。厂商2为追随者,其反应函数为:斯塔克尔伯格博弈; 一个例子领导者的利润函数为:斯塔克尔伯格博弈; 一个例子领导者的利润函数为:对于利润最大化的厂商1有:斯塔克尔伯格博弈; 一个例子Q: 厂商2对于领导者的产出 的产出反应为多少?斯塔克尔伯格博弈;
22、一个例子Q: 厂商2对于领导者的产出 的产出反应为多少?A:斯塔克尔伯格博弈; 一个例子Q: 厂商2对于领导者的产出 的产出反应为多少?A:均衡产出水平为 (y1*,y2*) = (13,8),因此领导者的产量比古诺纳什均衡产量高,而追随者产量比古诺-纳什均衡产量低。斯塔克尔伯格博弈y2y1y1*y2*(y1*,y2*) 为古诺纳什均衡产量。更高的 P2更高的 P1斯塔克尔伯格博弈y2y1y1*y2*(y1*,y2*) 为古诺纳什均衡产量。更高的 P1追随者的反应函数斯塔克尔伯格博弈y2y1y1*y2*(y1*,y2*) 为古诺纳什均衡产量。(y1S,y2S) 为斯塔克伯格均衡产量。更高的P1
23、y1S追随者的反应函数y2S斯塔克尔伯格博弈y2y1y1*y2*(y1*,y2*) 为古诺纳什均衡产量。(y1S,y2S) 为斯塔克伯格均衡产量。y1S追随者的反应曲线y2S价格竞争假如厂商仅用价格竞争而不是产量竞争策略,情况如何?厂商仅用价格竞争策略并同时做出决策的博弈称为伯特兰博弈。伯特兰博弈每家厂商的边际产品成本为常数c。所有厂商同时决定它们的价格。Q: 是否存在纳什均衡?伯特兰博弈每家厂商的边际产品成本为常数c。所有厂商同时决定它们的价格。Q: 是否存在纳什均衡?A: 存在。且恰好存在一个纳什均衡。伯特兰博弈每家厂商的边际产品成本为常数c。所有厂商同时决定它们的价格。Q: 是否存在纳什
24、均衡?A: 存在。且恰好存在一个纳什均衡。所有的厂商都将价格设在边际成本c的水平。为什么?伯特兰博弈假设有一家厂商设定的价格高于其它厂商的价格。伯特兰博弈假设有一家厂商设定的价格高于其它厂商的价格。那么价格高的厂商将不会有购买者。伯特兰博弈假设有一家厂商设定的价格高于其它厂商的价格。那么价格高的厂商将不会有购买者。因此,均衡时,所有的厂商都必须设定相同的价格。伯特兰博弈假设共同的价格高于边际成本才c。伯特兰博弈假设共同的价格高于边际成本c。那么一家厂商就可以将价格设得稍微低一点,然后卖给所有消费者,那么它的利润就会上升。伯特兰博弈假设共同的价格高于边际成本才c。那么一家厂商就可以将价格设得稍微
25、低一点,然后卖给所有消费者,那么它的利润就会上升。唯一的防止降价的价格为边际成本c。因此,这是唯一的纳什均衡情况。序贯价格博弈假如所有的厂商不是同时做出价格决策,而是其中的一家厂商在其它厂商之前确定价格。这种关于价格策略的序贯博弈称为价格领导模型。在其它厂商之前设定价格的厂商称为价格领导者。序贯价格博弈假设一个比较大的厂商(领导者)和许多竞争性的小厂商(追随者)。小厂商为价格接受者,它们对于市场价格p的集中供给反应为其总供给函数Yf(p)。序贯价格博弈市场的需求函数为:D(p)。领导者知道假如它设定一个价格p,它面对的需求为市场的剩余需求。因此领导者的利润函数为:序贯价格博弈领导者的利润函数为
26、:因此领导者会选择价格水平p*来最大化其利润。追随者集中供给Yf(p*)单位产出而领导者供给剩余需求量D(p*) - Yf(p*)。第二十八章博弈论博弈论博弈论能够帮助我们来对市场中主体的行为受到其他主体行为的影响的策略行为进行建模。博弈论的一些应用寡头垄断的研究 (行业中仅包含几个厂商)卡特尔的研究; 例如 OPEC外部性的研究; 例如对于公共资源的使用比如捕鱼。对于军事策略的研究。讨价还价。市场的运行机制。博弈是什么?一个博弈包含:一些参与者每个参与者的策略每个参与者选择不同决策行为的收益矩阵。两人博弈一个仅包含两个参与者的博弈称为两人博弈。我们研究的博弈仅包含两个参与者,每个参与者可以选
27、择两种不同的行为策略。两人博弈的一个例子参与者A 和 B。A 可以采取两种行为:“上” 和 “下”。B 可以采取两种行为: “左” 和 “右”。包含了四种可能决策组合支付的表格称为博弈的收益矩阵。两人博弈的一个例子这是博弈的收益矩阵参与者 B参与者 A左边显示A的收益右边显示B的收益LRUD(3,9)(0,0)(1,8)(2,1)两人博弈的一个例子博弈的一组策略为一对决策组合如(U,R) ,其中第一个元素为参与者A的策略,第二个元素为参与者B的策略。LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子例如. 假如A采取上而B采取右的策略,那么A的收益为1,B的
28、收益为8。博弈收益矩阵LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者A两人博弈的一个例子假如A采取下的策略而B采取右的策略,那么A的收益为2,B的收益为1。博弈的收益矩阵LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子我们可能看到哪种策略组合结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子(U,R) 是否为一个有可能的策略组合结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的一个例子假如B采取右的策略那么A的最优策略为下,因为它能使得A的收益从1变为2。因此(U
29、,R)不是一个有可能出现的策略组合结果。LRUD(3,9)(0,0)(1,8)(2,1)(U,R) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子LRUD(3,9)(0,0)(1,8)(2,1)(U,R) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如B采取右的策略,A的最佳策略为下。LRUD(3,9)(0,0)(1,8)(2,1)(D,R) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如B采取右的策略,A的最佳策略为下。假如A采取下的策略,B的最佳策略为右。因此(D,R) 是一个可能出现的策略组合结果。LRUD(
30、3,9)(0,0)(1,8)(2,1)(D,R) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子LRUD(3,9)(0,0)(1,8)(2,1)(D,L) 是否为一个有可能的策略组合结果?参与者B参与者 A两人博弈的一个例子假如A采取下的策略,B的最佳策略为右。因此 (D,L)不是一个可能出现的策略组合结果。LRUD(3,9)(0,0)(1,8)(2,1)(D,L) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子LRUD(3,9)(0,0)(1,8)(2,1)(U,L) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如A
31、采取上的策略,B的最佳策略为左。LRUD(3,9)(0,0)(1,8)(2,1)(U,L) 是否为一个有可能的策略组合结果?参与者 B参与者 A两人博弈的一个例子假如A采取上的策略,B的最佳策略为左。假如B采取左的策略,A的最佳策略为上。因此(U,L) 为一个可能出现的策略组合结果。LRUD(3,9)(0,0)(1,8)(2,1)(U,L) 是否为一个有可能的策略组合结果?参与者 B参与者 A纳什均衡博弈论中的策略组合中,每个参与者的决策都是对其它参与者决策的最佳反应决策时所达到的均衡称为 纳什均衡。我们的例子中有两个纳什均衡 (U,L) 和(D,R)。两人博弈的例子(U,L) 和 (D,R)
32、 为此博弈的纳什均衡。LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A两人博弈的例子(U,L) 和 (D,R) 为此博弈的纳什均衡。但是我们发现: 对两个参与者来说,(U,L) 比 (D,R) 更受偏好。我们是否一定仅会看到 (U,L)的博弈均衡结果?LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A囚徒困境为了了解帕累托偏好结果是否一定就是一个博弈的结果。考虑一个很有名的囚徒困境博弈问题。囚徒困境这个博弈的可能结果是什么样子?克莱德邦妮(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC囚徒困境假如邦妮选择沉默,克莱德的最佳策略为供认
33、。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境假如邦妮选择沉默,克莱德的最佳策略为供认。假如邦妮选择供认,克莱德的最优策略为供认。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境因此不论邦妮选择什么策略,克莱德的最优策略总是供认。供认对于克莱德来说是一个占优策略。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮囚徒困境同样地,不论克莱德选择什么策略,邦妮的最佳策略为供认。供认对于邦妮来说也是占优策略。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克
34、莱德邦妮囚徒困境唯一的纳什均衡为 (C,C),尽管 (S,S) 能使得邦妮和克莱德的处罚更轻。这个唯一的纳什均衡是无效率的。(-5,-5)(-30,-1)(-1,-30)(-10,-10)SCSC克莱德邦妮决策时机在上面来两个例子中,参与者同时做出他们的决策。这样的博弈称为同步博弈。决策时机在上面来两个例子中,参与者同时做出他们的决策。这样的博弈称为同步博弈。首先行动的参与者称为领导者,后行动的参与者称为追随者。序贯博弈的例子有时一个博弈可能含有几个纳什均衡,很难确定哪一种均衡结果更有可能发生。当一个博弈为一个序贯博弈时,那么就有可能其中的一个纳什均衡比其它均衡更有可能发生。序贯博弈的例子参与
35、者 B参与者 A(U,L) 和 (D,R) 都为同时决策时的纳什均衡,我们无法判断哪种均衡更有可能发生。LRUD(3,9)(0,0)(1,8)(2,1)序贯博弈的例子假设这个博弈为序贯博弈,A为领导者而B为追随者。我们可以把这个博弈的拓展形式写出来。LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A序贯博弈的例子UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子(U,L) 为一个纳什均衡。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子UDLLRR(3,9)(1,8)(0,0)(2,1)AB
36、BA 先行动B 后行动(U,L) 为一个纳什均衡。 (D,R)也是一个纳什均衡。这两个均衡哪个更有可能发生?序贯博弈的例子假如A先选择决策U ,B后选择策略L;A 所得收益为3。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子假如A先选择决策U ,B后选择策略L;A 所得收益为3。假如A先选择策略D,B后选择策略R;A 所得收益为2。UDLLRR(3,9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动序贯博弈的例子假如A先选择决策U ,B后选择策略L;A 所得收益为3。假如A先选择策略D,B后选择策略R;A 所得收益为2。UDLLRR(3,
37、9)(1,8)(0,0)(2,1)ABBA 先行动B 后行动因此(U,L)很可能为均衡结果。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A在考虑我们之前的例子。假设博弈是同步的,我们发现这个博弈有两个纳什均衡; (U,L) 和 (D,R)。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A参与者A 已经被考虑了上或者下的决策,但没有把这两种策略联合起来考虑。例如,仅做出单纯的上或下决策。上和下为参与者A的纯策略。序贯博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者B参与者A类似地,左和右为参与者B的纯策略。序贯
38、博弈的例子LRUD(3,9)(0,0)(1,8)(2,1)参与者 B参与者 A因此,(U,L)和(D,R) 为纯策略纳什均衡。是否每一个博弈都至少有一个纯策略纳什均衡?纯策略参与者 B参与者 A这是一个新的博弈。是否存在纯策略的纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A (U,L)是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?不是。(U,R) 是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?不是。(U
39、,R)是否为一个纳什均衡?不是。(D,L)是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者A(U,L)是否为一个纳什均衡?不是。(U,R)是否为一个纳什均衡?不是。(D,L)是否为一个纳什均衡?不是。(D,R) 是否为一个纳什均衡?(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A(U,L)是否为一个纳什均衡?不是。(U,R)是否为一个纳什均衡?不是。(D,L)是否为一个纳什均衡?不是。(D,R) 是否为一个纳什均衡?不是。(1,2)(0,4)(0,5)(3,2)UDLR纯策略参与者 B参与者 A因此但采取纯策略时,该博弈没有纳
40、什均衡。但是这个博弈在采取混合策略时有一个纳什均衡。(1,2)(0,4)(0,5)(3,2)UDLR混合策略参与者A选择一个概率分布(pU,1-pU),表示参与者A有pU的概率选择策略上,有1-pU的概率选择策略下;而不是单纯的选择上或者下的策略。参与者A混合了上和下的纯策略。概率分布(pU,1-pU)为参与者A的混合策略。混合策略类似地,参与者B选择概率分布 (pL,1-pL),表示有pL的概率他会选择左,有1-pL的概率他会选择右。参与者B混合了左和右的纯策略。概率分布(pL,1-pL)为参与者B的混合策略。混合策略参与者 B参与者 A这个博弈没有纯策略纳什均衡,当有混合策略纳什均衡。混合
41、纳什均衡结果是如何计算的?(1,2)(0,4)(0,5)(3,2)UDLR混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, LR, 1-L混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, LR, 1-LA选择上策略时的预期收益为多少?混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, LR, 1-LA选择上策略的预期收益为L。A选择下策略的预期收益为多少?混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, LR, 1-LA选
42、择上策略的预期收益为L。A选择下策略的预期收益为3(1 - L)。A选择上策略的预期收益为L。A选择下策略的预期收益为3(1 - L)。假如 L 3(1 - L) 那么A仅选择上的策略,但是当A采用上的纯策略时没有纳什均衡。混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, LR, 1-L混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, LR, 1-LA选择上策略的预期收益为L。A选择下策略的预期收益为3(1 - L)。 假如 L 4U + 2(1 - U) 那么B仅选择左的策略,但是当B仅采用左的策略时不存
43、在纳什均衡。混合策略参与者B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, 3/4R, 1/4B选择左的策略的预期收益为2U + 5(1 - U)。B选择右的策略的预期收益为4U + 2(1 - U) 。 假如2U + 5(1 - U) 4U + 2(1 - U)那么B仅采取右的策略,但是当B仅采取右的策略时不存在纳什均衡。混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, UD, 1-UL, 3/4R, 1/4存在纳什均衡的必要条件为:2U + 5(1 - U) = 4U + 2(1 - U) U = 3/5;A使用上和下的混合策略必须要使得
44、B采取左和右的策略时所得收益无差异。混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4A的混合策略为 (3/5, 2/5)而B的混合策略为(3/4, 1/4)时,此博弈存在唯一的纳什均衡。混合策略参与者 B参与者 A(1,2)(0,4)(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4出现收益(1,2)的概率为: 3/5 3/4 = 9/20。混合策略参与者 B参与者 A(1,2) 9/20(0,4)(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4出现收益 (0,4) 的概率为: 3/5 1/4 = 3/20。混合策略参与者 B参与者 A(1,2) 9/20(0,4)3/20(0,5)(3,2)U, 3/5D, 2/5L, 3/4R, 1/4出现收益(0,5)的概率为: 2/5 3/4 = 6/20。混合策略参与者 B参与者 A(1,2) 9/20(0,4)3/20(0,5) 6/20U, 3/5D, 2/5L, 3/4R, 1/4(3,2)出现收益 (3,2) 的概率为: 2/5 1/4 = 2/20。混合策略参与者 B参与者 A(1,2) 9/20(0,4)3/20(0,5) 6/2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年家具家电购买合同
- 2025年分期付款汽车销售合同
- 2025年天然气输气管道合作协议
- 2025版住宅小区水电暖消防系统改造与节能评估服务合同3篇
- 2025年健身健康检测合同
- 2025年二手房合同样本
- 二零二五至二零二五年度通信设备采购合同2篇
- 2025版屋面防水劳务分包合同(含防水检测服务)3篇
- 医院互联网医院2025年度运营合同3篇
- 二零二五版奶牛牧场废弃物资源化利用承包合作协议2篇
- 狮子王影视鉴赏
- 一年级数学加减法口算题每日一练(25套打印版)
- 2024年甘肃省武威市、嘉峪关市、临夏州中考英语真题
- DL-T573-2021电力变压器检修导则
- 绘本《图书馆狮子》原文
- 安全使用公共WiFi网络的方法
- 2023年管理学原理考试题库附答案
- 【可行性报告】2023年电动自行车相关项目可行性研究报告
- 欧洲食品与饮料行业数据与趋势
- 放疗科室规章制度(二篇)
- 中高职贯通培养三二分段(中职阶段)新能源汽车检测与维修专业课程体系
评论
0/150
提交评论