博弈论复习题及答案

上传人：奔*** IP属地：河北上传时间：2023-12-26 格式：PDF 页数：47 大小：7.09MB 积分：12 举报 版权申诉

已阅读5页，还剩42页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

囚徒困境说明个人的理性选择不一定是集体的理性选择。（V）

子博弈精炼纳什均衡不是一个纳什均衡。（X）

博弈中知道越多的一方越有利。（X）

纳什均衡一定是上策均衡。（X）

上策均衡一定是纳什均衡。（J）

在一个博弈中只可能存在一个纳什均衡。（X）

在一个博弈中博弈方可以有很多个。（V）

在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（J）

在博弈中纳什均衡是博弈双方能获得的最好结果。（X）

在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益

减少。（X）

上策均衡是帕累托最优的均衡。（X）

因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零

和博弈就是非合作博弈。

（X）

在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选

择行为，因此总是有利的。（X）

在博弈中存在着先动优势和后动优势，所以后行动的人不一定总

有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。

囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想

的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎

不能比对方坐牢的时间更长。

(X)

纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策

略组合。（J）

不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博

弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原

博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复

采用原博弈的纳什均衡。（J）

多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均

衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流

采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，

或者混合战略和纯战略轮流采用。（J）

零和博弈的无限次重复博弈中，所有阶段都不可能发生合作，局

中人会一直重复原博弈的混合战略纳什均衡。（J）（或：零

和博弈的无限次重复博弈中，可能发生合作，局中人不一定会一

直重复原博弈的混合战略纳什均衡。（X））

根据参与人行动的先后顺序，博弈可以划分为静态博弈（static

game）和动态博弈（dynamicgame）o

如果阶段博弈G有唯一的Nash均衡，那么对任意有限次T,重复博

弈G（T）有唯一的子博弈完美结局：在每一阶段取G的Nash均衡策

略。（J）

四、名词解释(每小题3分，共15分)

参与人(player)

指的是博弈中选择行动以最大化自己效用(收益)的决策主体,

参与人有时也称局中人，可以是个人，也可以是企业、国家等

团体；

策略(strategy)

是参与人选择行动的规则，如“以牙还牙”是一种策略；

信息(information)

是指参与人在博弈中的知识,尤其是有关其他参与人的特征和

行动的知识；

支付(payoff)函数

是参与人从博弈中获得的效用水平,它是所有参与人策略或行

动的函数，是每个参与人很关心的东西；

结果(outcome)

是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩

阵来表示；

均衡(equilibrium)

是所有参与人的最优策略或行动的组合。

静态博弈

指参与人同时选择行动或虽非同时但后行动者并不知道先行

动者采取什么样的行动;

动态博弈

指参与人的行动有先后顺序，且后行动者能够观察到先行动者

所选择的行动。

博弈

就是一些个人、队组或其他组织，面对一定的环境条件，在一

定的规则下，同时或先后，一次或多次，从各自允许选择的行

为或策略中进行选择并加以实施，各自取得相应结果的过程。

零和博弈：

也称“严格竞争博弈”。博弈方之间利益始终对立，偏好通常

不同

变和博弈：

零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效

率问题的重要性。

完全信息静态博弈

即各博弈方同时决策，且所有博弈方对各方得益都了解的博

弈。

上策：

不管其它博弈方选择什么策略,一博弈方的某个策略给他带来

的得益始终高于其它的策略，至少不低于其他策略的策略

合作博弈

非合作博弈

零和博弈

常和博弈

变和博弈

上策均衡

纳什均衡G={E，……%}

纳什均衡：在博弈⑸一心中，如果由各个

博弈方的各一济篦喝组就的某企第略组合s*S*中，任一

博弈方的策略，都是对其余博弈方策略的组合

的最佳对策，也即

对任意

⑹…s；）

都成立，则称为的一个纳什均衡

（或纳什均衡是指这样一种策略组合，这种策略组合由所有参与

人的最优策略组成，即给定别人策略的情况下，没有任何单个参

与人有积极性选择其他策略，从而没有任何参与人有积极性打破

这种均衡。）

完全信息博弈G={£,…S"；/,…%}

混合篥暗;，祚博弈P,=（P乐乐）博弈方i的

策略窖间为外*.则博弈方以概率分布

随机在其k个可选策略中选择的“策略”，称为一个“混合策

略”，其中

对=LY都成立，且

帕累托上策均衡

风险上策均衡

聚点均衡

重复博弈

指同样结构的博弈重复多次，其中的每次博弈称为“阶段博

弈”。

阶段博弈

重复博弈中的每次博弈称为“阶段博弈”。

贴现因子

下一期的一单位支付在这一期的价值。

触发战略（TriggerStrategy）

首先试探合作，一旦发现对方不合作，则也用不合作相

报复的战略。

子博弈精炼纳什均衡

（夫妻博弈）一对新婚夫妻为晚上看什么电视节目争执不下，

丈夫（记为I方）要看足球比赛节目，而妻子（记为n方）要看

戏曲节目.他们新婚燕尔，相亲相爱，所以若这方面的行动不一

致，则是很伤感情的.因此，这对夫妻间的争执是一次非零和对

二、计算与分析题（每小题15分，共45分）

1、无限次重复博弈与有限重复博弈的区别:

a.无限次重复博弈没有结束重复的确定时间。在有限次

重复博弈中，存在最后一次重复正是破坏重复博弈中

局中人利益和行为的相互制约关系，使重复博弈无法

实现更高效率均衡的关键问题。

b.无限次重复博弈不能忽视不同时间得益的价值差异和

贴现问题，必须考虑后一期得益的贴现系数，对局中

人和博弈均衡的分析必须以平均得益或总得益的现值

为根据。

c.无限次重复博弈与有限次重复博弈的共同点：试图

“合作”和惩罚“不合作”是实现理想均衡的关键，

是构造高效率均衡战略的核心构件。

2、可口可乐与百事可乐（参与者）的价格决策：双方都可以保

持价格不变或者提高价格（策略）；博弈的目标和得失情况体现

为利润的多少（收益）；利润的大小取决于双方的策略组合（收

益函数）；博弈有四种策略组合，其结局是：

（1）如果双方都不涨价，各得利润10单位；

（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100,

百事可乐利润-30；

（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20,

百事可乐利润30；

（4）如果双方都涨价，可口可乐利润140,百事可乐利润35；

求纳什均衡。

博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称

为博弈的解。

3、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，

另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位

饲料进槽，但谁按谁就要付出2个单位的成本。谁去按按纽则谁

后到；都去按则同时到。若大猪先到，大猪吃到9个单位，小猪

吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；

若小猪先到，大猪吃六个单位，小猪吃4个单位。各种情况组合

扣除成本后的支付矩阵可如下表示（每格第一个数字是大猪的得

益，第二个数字是小猪的得益）：

小猪

按等待

大猪按5,14,4

等待9,-10,0

求纳什均衡。

在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待,

大猪选择不按，小猪还是最好选择等待。即不管大猪选择按还是

不按，小猪的最佳策略都是等待。也就是说，无论如何，小猪都

只会选择等待。这样的情况下，大猪最好选择是按，因为不按的

话都饿肚子，按的话还可以有4个单位的收益。所以纳什均衡是

(大猪按，小猪等待)。

4、根据两人博弈的支付矩阵回答问题:

2,30,0

0,04,2

(1)写出两人各自的全部策略，并用等价的博弈树来重新表示

这个博弈(6分)

(2)找出该博弈的全部纯策略纳什均衡，并判断均衡的结果是

否是Pareto有效。

(3)求出该博弈的混合策略纳什均衡。(7分)

(1)策略

甲：AB

乙：ab

博弈树(草图如下：

⑵PureNE(A,a);(B,b)

都是Pareto有效，仅(B,b)是K-H有效。

(3)MixedNE((2/5,3/5);(2/3,1/3))

5、用反应函数法求出下列博弈的所有纯战略纳什均衡。

参与

人2

abed

A2,33,23,40,3

参与B4,45,20,11,2

人1

C3,14,11,410,2

D3,14,1-1,210,1

解答：

纯策略纳什均衡为（B,a）与（A,c）

分析过程：设两个参与人的行动分别为4和

氏如果%=a

playerl的反应函数4（%）=«民?/"=占

A,如果生=c

C或者D,如果%=d

c,如果q=A

player2的反应函数0⑷一丁坐=，

C,如果4=C

G如果q=D

交点为（B,a）与（A,c）,因此纯策略纳什均衡为（B,a）与

(A,c)o

6、(entrydeterrence市场威慑)考虑下面一个动态博弈：首

先，在一个市场上潜在的进入者选择是否进入，然后市场上的已

有企业(在位者)选择是否与新企业展开竞争。在位者可能有两

种类型，温柔型(左图)和残酷型(右图),回答下面问题。

左图温柔型

右图：残酷型

(1)找出给定在位者的两种类型所分别对应的纳什均衡，以及

子博弈精炼纳什均衡(12分)

(2)已有企业为温柔型的概率至少多少时，新企业才愿意进入

(8分)

(1)温柔NE(in,accommodate)和(out,fight)oSPNE

为(in,accommodate)

残酷NE(out,fight).SPNE同理

(2)20〃—10(1-〃)>=0得到p>=l/3

8、博弈方1和博弈方2就如何分10,000元钱进行讨价还价。

假设确定了以下规则：双方同时提出自己要求的数额A和B,0

WA,BW10,000o如果A+BW10,000,则两博弈方的要求得到

满足，即分别得A和B,但如果A+B>10,000,则该笔钱就没

收。问该博弈的纳什均衡是什么？如果你是其中一个博弈方，你

会选择什么数额？为什么？

答十、纳什均衡有无数个。最可能的结果是（5000,5000）这个

聚点均衡。

9、北方航空公司和新华航空公司分享了从北京到南方冬天度假

胜地的市场。如果它们合作，各获得500000元的垄断利润，但

不受限制的竞争会使每一方的利润降至60000元。如果一方在价

格决策方面选择合作而另一方却选择降低价格，则合作的厂商获

利将为零，竞争厂商将获利900000元。

（1）将这一市场用囚徒困境的博弈加以表示。

（2）解释为什么均衡结果可能是两家公司都选择竞争性策略。

答：（1）用囚徒困境的博弈表示如下表：

北方航空公司

合作竞争

合作500000,0,900000

新华航空公

500000

司

竞争900000,060000,60000

（2）如果新华航空公司选择竞争，则北方航空公司也会选

择竞争（60000>0）；若新华航空公司选择合作，北方航空公司仍

会选择竞争（900000>500000）o若北方航空公司选择竞争，新华

航空公司也将选择竞争（60000>0）；若北方航空公司选择合作，

新华航空公司仍会选择竞争（900000>0）。由于双方总偏好竞争,

故均衡结果为两家公司都选择竞争性策略，每一家公司所获利润

均为600000元。

12、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低

价啤酒，相应的利润（单位：

万元）由下图的得益矩阵给出：

厂商B

低价高价

低价100,80050,50

厂商A-20,-30900,600

（1）有哪些结果是纳什均衡？

（2）两厂商合作的结果是什么？

答（1）（低价，高价），（高价，低价）

（2）（低价，高价）

13、A、B两企业利用广告进行竞争。若A、B两企业都做广告，

在未来销售中，A企业可以获得20万元利润，B企业可获得8万

元利润；若A企业做广告，B企业不做广告，A企业可获得25万

元利润，B企业可获得2万元利润；若A企业不做广告，B企业

做广告，A企业可获得10万元利润，B企业可获得12万元利润;

若A、B两企业都不做广告，A企业可获得30万元利润，B企业

可获得6万元利润。

（1）画出A、B两企业的支付矩阵。

（2）求纳什均衡。

3.答：（1）由题目中所提供的信息，可画出A、B两企业的

支付矩阵（如下表）。

B企业

做广告不做广告

做广告20,825,2

A企业

不做广告10,1230,6

（2）因为这是一个简单的完全信息静态博弈，对于纯策纳

什均衡解可运用划横线法求解。

如果A厂商做广告，则B厂商的最优选择是做广告，因为做

广告所获得的利润8大于不做广告获得的利润2,故在8下面划

一横线。如果A厂商不做广告，则B厂商的最优选择也是做广告,

因为做广告获得的利润为12,而不做广告的利润为6,故在12

下面划一横线。

如果B厂商做广告，则A厂商的最优选择是做广告，因为做

广告获得的利润20大于不做广告所获得的利润10,故在20下面

划一横线。如果B厂商不做广告，A厂商的最优选择是不做广告,

因为不做广告获得的利润30大于做广告所获得的利润25,故在

30下面划一横线。

在本题中不存在混合策略的纳什均衡解，因此，最终的纯策

略纳什均衡就是A、B两厂商都做广告。

15、求出下面博弈的纳什均衡（含纯策略和混合策略）。

乙

5,00,8

2,64,5

由划线法易知，该矩阵博弈没有纯策略Nash均衡。

可得如下不等式组

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-l

可得混合策略Nash均衡（0却，（粉）

16、某产品市场上有两个厂商，各自都可以选择高质量，还是

低质量。相应的利润由如下得益矩阵给出：

（1）该博弈是否存在纳什均衡？如果存在的话，哪些结果是纳什

均衡？

参考答案：

由划线法可知，该矩阵博弈有两个纯策略Nash均衡，即（低质量,

高质量），（高质量，低质量）。

乙企业

高质量低质量

高

50,50100,800

质900,600-20,-30

量

该矩阵博弈还有一个混合的纳什均衡

Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630,可得

1263

X-?7，y-138

因此该问题的混合纳什均衡为喏，第，播,来）。

17、甲、乙两企业分属两个国家，在开发某种新产品方面有如下

收益矩阵表示的博弈关系。试求出该博弈的纳什均衡。如果乙企

业所在国政府想保护本国企业利益，可以采取什么措施？

乙企业

不开

开发

发

甲开

-10,-10100,0

企发

业不^

开0,1000,0

发III

解：用划线法找出问题的纯策略纳什均衡点。

--10-10100,0'

0,1000,0

所以可知该问题有两个纯策略纳什均衡点（开发,不开发）和（不

开发,开发）。

该博弈还有一个混合的纳什均衡（（当杂，（当杂）。

如果乙企业所在国政府对企业开发新产品补贴a个单位,则收益

矩阵变为：口㈱匕一雷卜要使（不开发,开发）成为该博弈的唯一

纳什均衡点，只需a>10o此时乙企业的收益为100+ao

18、博弈的收益矩阵如下表:

乙

左右

上a,bc,d

甲

下e,fg,h

（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、

f、g、h之间必然满足哪些关系？（尽量把所有必要的关系式都

写出来）

(2)如果(上，左)是纳什均衡，则(1)中的关系式哪些

必须满足？

(3)如果(上，左)是占优策略均衡，那么它是否必定是

纳什均衡？为什么？

(4)在什么情况下，纯战略纳什均衡不存在？

答：(1)a>e,c>g,h>dtf>ho本题另外一个思考角度是从

占优策略均衡的定义出发。对乙而言，占优策略为©/)>(”,〃)；而

对甲而言，占优策略为(a,c)>(e,g)o综合起来可得到所需结论。

(2)纳什均衡只需满足：甲选上的策略时，b>d,同时乙选

左的策略时，故本题中纳什均衡的条件为：b>dta>eo

(3)占优策略均衡一定是纳什均衡，因为占优策略均衡的

条件包含了纳什均衡的条件。

(4)当对每一方来说，任意一种策略组合都不满足纳什均

衡时，纯战略纳什均衡就不存在。

19、Smith和John玩数字匹配游戏，每个人选择1、2、3,如果

数字相同，John给Smith3美元，如果不同，Smith给John1

美元。

(1)列出收益矩阵。

(2)如果参与者以1/3的概率选择每一个数字，证明该混合

策略存在一个纳什均衡，它为多少？

答：(1)此博弈的收益矩阵如下表。该博弈是零和博弈，无

纳什均衡。

John

123

13,-3-1,1-1,1

Smith2-1,13,-3-1,1

3-1,1-1,13,-3

(2)Smith选(1/3,1/3,1/3)的混合概率时,

John选1的效用为：U\=gx(-3)+gxl+gxl=-g

John选2的效用为：U2=1xl+lx(-3)+1xl=-1

John选3的效用为：6=gxi+；xi+gx(-3)=-g

类似地，John选(1/3,1/3,1/3)的混合概率时，

Smith选1的效用为：U\=gx3+；x(_l)+gx(-l)=g

Smith选2的效用为：U2=gx(_l)+；x3+gx(T)=g

Smith选3的效用为：i/；=^x(-i)+lx(-i)+lx3=1

因为U\=lh=U3,U[=U'2=U39所以：

上34袅]是纳什均衡，策略值分别为John：u=T；Smith：

JJJJJ。J

U=o

20、假设双头垄断企业的成本函数分别为：C,=200],Ci=1QI,市场

需求曲线为0=400—2。9其中，Q=Qi+Q。

(1)求出古诺(Cournot)均衡情况下的产量、价格和利润,

求出各自的反应和等利润曲线，并图示均衡点。

(2)求出斯塔克博格(Stackelberg)均衡情况下的产量、

价格和利润，并以图形表示。

(3)说明导致上述两种均衡结果差异的原因。

答：(1)对于垄断企业1来说：

max[400-2(21+Q2)lQi-20Qi

这是垄断企业1的反应函数。

其等利润曲线为：m=3802,-2(2,22-2Q,2

对垄断企业2来说：

max[400-2(a+。2)]。2-22

=02=50-

这是垄断企业2的反应函数。

其等利润曲线为：万2=40022-2QQ-4Q9

在达到均衡时，有：

190-150-^-1,

2,=一1一口=枚尸8。

⑵2122=30

均衡时的价格为：P=400-2x(80+30)=18()

两垄断企业的利润分别为：

4=380x80-2x80x30-2x802=12800

"2=400x30-2x80x30-4x302=3600

均衡点可图示为：

(2)当垄断企业1为领导者时，企业2视企业1的产量为

既定，其反应函数为:

Qz=5（）-Q"4

则企业1的问题可简化为:

max400-2（Q1+50-号）卜-2（XZ

21=280/3

Q2=80/3

均衡时价格为：P=400_*2+与=160

利润为：办=39200/39和=25600/9

该均衡可用下图表示:

企业2领先时可依此类推。

(3)当企业1为领先者时，其获得的利润要比古诺竞争下多。

而企业2获得的利润较少。这是因为，企业1先行动时，其能考

虑企业2的反应，并以此来制定自己的生产计划，而企业2只能

被动地接受企业1的既定产量，计划自己的产出，这是一种“先

动优势”

21、在一个由三寡头操纵的垄断市场中，逆需求函数为

p=a-qi-q2-q3,这里Qi是企业i的产量。每一企业生产的单位成

本为常数Co三企业决定各自产量的顺序如下：(1)企业1首先选

择(2)企业2和企业3观察到5,然后同时分别选择q2

和q30试解出该博弈的子博弈完美纳什均衡。

答：该博弈分为两个阶段，第一阶段企业1选择产量5,第二阶

段企业2和3观测到5后，他们之间作一完全信息的静态博弈。

我们按照逆向递归法对博弈进行求解。

(1)假设企业1已选定产量5,先进行第二阶段的计算。设企

业2,3的利润函数分别为：

-cc

兀2=(a-q!-q2一口3用212

7u3=(a-ql-q2-q3)q2-cq3

由于两企业均要追求利润最大，故对以上两式分别求一阶条件：

——二a—q、-2^2-%-c=0(1)

阳2

^-=a-q,-q2-2q3-c=0(2)

因3

求解(1)、(2)组成的方程组有：

(3)

（2）现进行第一阶段的博弈分析：

对与企业1,其利润函数为；

7ii=（a-q1-q2-q3）ql-cq|

将（3）代入可得：

兀产qG.D（4）

式（4）对qi求导：

=a-2q[-c=0

的।41

解得：

q；=；（a-c）（5）

此时，7i；=J（a-c）2

（3）将式（5）代回（3）和（4）有该博弈的子博弈完美纳什均

衡：

q；=!（a-c）,q；=q；=：（a-c）

25、某寡头垄断市场上有两个厂商，总成本均为自身产量的20

倍,市场需求函数为Q=200-Po

求（1）若两个厂商同时决定产量，产量分别是多少？

（2）若两个厂商达成协议垄断市场，共同安排产量，则各自的

利润情况如何？

答:（1）分别求反应函数,180-2Ql-Q2=0,180-Ql-2Q2=0,

Ql=Q2=60

(2)200-2Q=20,Q=90,Q1=Q2=45

26、一个工人给一个老板干活，工资标准是100元。工人可以选

择是否偷懒，老板则选择是否克扣工资。假设工人不偷懒有相当

于50元的负效用，老板想克扣工资则总有借口扣掉60元工资,

工人不偷懒老板有150元产出，而工人偷懒时老板只有80元产

出，但老板在支付工资之前无法知道实际产出，这些情况双方都

知道。请问：

(D如果老板完全能够看出工人是否偷懒，博弈属于哪种类型？

用得益矩阵或扩展形表示

该博弈并作简单分析。

(2)如果老板无法看出工人是否偷懒，博弈属于哪种类型？用

得益矩阵或扩展形表示该博

弈并作简单分析。

(1)完全信息动态博弈。

(40,40)(100,-20)(-10.110)(50,50)

博弈结果应该是工人偷懒，老板克扣。

（2）完全信息静态博弈，结果仍然是工人偷懒，老板克扣。

老板

克扣不克扣

-20,-30900,600

工人

100,80050,50

不偷懒

27、举一个你在现实生活中遇到的囚犯两难困境的例子。

答：在校园的人行道交叉路口，无需红绿灯。现在两人分别

骑车从东西方向和南北方向通过路口。若同时往前冲，必定相撞,

各自支付为（-2,-2）；若同时停下，都不能按时前进，支付为

（0,0）；若一人前进一人停下，支付为（2,0）或（0,2）。相

应的策略和支付矩阵如下表。

乙

前进停卜

前进-2,~22,0

甲

停卜0,20,0

28、给定两家酿酒企业A、B的收益矩阵如下表:

A企业

白酒啤酒

白酒700,600900,1000

B企业

啤酒800,900600,800

表中每组数字前面一个表示B企业的收益，后一个数字表示

B企业的收益。

（1）求出该博弈问题的均衡解，是占优策略均衡还是纳什

均衡？

（2）存在帕累托改进吗？如果存在，在什么条件下可以实

现？福利增量是多少？

（3）如何改变上述A、B企业的收益才能使均衡成为纳什均

衡或占优策略均衡？如何改变上述A、B企业的收益才能使该博

弈不存在均衡？

答：（1）有两个纳什均衡，即（啤酒，白酒）、（白酒，啤

酒），都是纳什均衡而不是占优策略均衡。

（2）显然，（白酒，啤酒）是最佳均衡，此时双方均获得其

最大收益。若均衡解为（啤酒，白酒），则存在帕累托改善的可

能。方法是双方沟通，共同做出理性选择，也可由一方向另一方

支付报酬。福利由800+900变为900+1000,增量为200。

（3）如将（啤酒，白酒）支付改为（1000,1100）,则（啤

酒，白酒）就成为占优策略均衡。比如将（啤酒，白酒）支付改

为（800,500）,将（白酒，啤酒）支付改为（900,500）,则该

博弈就不存在任何占优策略均衡或纳什均衡。

30、在纳税检查的博弈中，假设A为应纳税款，C为检查成本，F

是偷税罚款，且C<A+F；S为税务机关检查的概率，E为纳税人逃

税的概率；不存在纯战略纳什均衡。

(1)写出支付矩阵。

(2)分析混合策略纳什均衡。

答：(1)该博弈的支付矩阵如下表：

纳税人

逃税不逃税

检查A-C+F,-A-FA-C,-A

税收机关

不检查0,0A,-A

(2)先分析税收检查边际：因为S为税务机关检查的概率,

E为纳税人逃税的概率。给定E,税收机关选择检查与否的期望

收益为：

K(\,E)=(A-C+F)E+(A-C)(l-E)=EF+A-C

Xr(O,E)=OxE+A(l-E)+A(l-E)

解K(l,E)=K(0,E),得：E=C/(A+F)o

如果纳税人逃税概率小于E,税收机关的最优决策是不检查,

否则是检查。

再分析逃税边际：给定S,纳税人选择逃税与否的期望收益

是:

K(S,1)=(-A-F)S+0x(1-S)=-(A+F)S

K(S,0)=-AS+(-A)(l-S)=-A

解K（S,1）=K（S,O）,得：S=A/（4+F）。即如果税收机关检查的概率小

于S,纳税人的最优选择是逃税，否则是交税。

因此，混合纳什均衡是（S,E）,即税收机关以S的概率查

税，而纳税人以E的概率逃税。

31、判断下列说法正确：

（1）斯塔克博格产量领导者所获得的利润的下限是古诺均

衡下它得到的利润。

（2）由于两个罪犯只打算犯罪一次，所以被捕后才出现了

不合作的问题即囚徒困境。但如果他们打算重复合伙多次，比如

说20次，那么对策论预测他们将采取彼此合作的态度，即谁都

不招供。

答：（1）正确。在斯塔克博格模型中，领导者可以根据跟随

者的反应曲线来制定自己的最优产量。其利润一定不会小于古诺

均衡下的利润，否则，领导者将采取古诺博弈中双方同时行动的

策略而获得古诺均衡的利润。

（2）错误。只要两囚犯只打算合作有限次，其最优策略均

为招供。比如最后一次合谋，两小偷被抓住了，因为将来没有合

作机会了，最优策略均为招供。回退到倒数第二次，既然已经知

道下次不会合作，这次为什么要合作呢。依此类推，对于有限次

内的任何一次，两小偷均不可能合作。

32、简要评论博弈论在微观经济学运用中的优缺点。

答：博弈论是描述和研究行为者之间策略相互依存和相互作

用的一种决策理论。它被广泛应用于政治、外交、军事、经济等

研究领域，但在微观经济学中的应用是最成功的。博弈论的研究

方法和特征与经济学结合得非常紧密。它强调个人理性，即在给

定的约束条件下追求效用最大化。但博弈论又比传统的经济学更

进一步，它研究的不是面临非人格化的价格参数下的决策问题，

而是研究效用随各个主体的行为改变而改变的效用最大化问题。

除了国际贸易、金融、拍卖等经济领域，博弈论在企业理论特别

是寡头竞争研究方法方面做了大量的有益工作。

20世纪80年代以来，博弈论开始出现在西方经济学的教科

书中，都将其作为经济学研究的最新成果与前沿。特别是产业组

织理论方面的教材，几乎都是以博弈论为基础的。博弈论反映了

经济学的研究对象越来越个体化、微观化；反映了经济学越来越

重视人与人之间关系与相互作用的研究，特别是协调人际的利益

与冲突的最佳制度安排倾向；反映了经济学越来越重视信息，即

接近现实的有关信息不完全对个人选择与制度安排及其影响的

倾向。总之，博弈论在经济学中的广泛应用，大大提高了经济学

对现实的解释能力。

应该看到，博弈论在微观经济学运用中还存在许多疑难问

题。它无法提供唯一解，无法完整地探讨个人发展与社会发展之

间的相互依存关系。现有的博弈论结构可强有力地证明“合作比

不合作好”这一命题，但无法解释清楚在现实中冲突与合作之间

的复杂关系，认为个人组成的集团会采取合作行动以实现他们共

同的利益。实际上，除非一个集团中的人数很少或者存在强制或

其他某些特殊手段以使个人按照他们的共同利益行事，有理性

的、寻求个人利益最大化的个人不会采取行动以实现共同的利

益。即使他们采取行动实现共同的利益之后都能获益，他们也仍

然可能不会自愿地采取合作行动以实现共同利益的目标。

33、“囚徒困境”的内在根源是什么？举出现实中囚徒的困境的

具体例子。

答八：内在根源是个体之间存在行为和利益相互制约的博弈结构

中，个体理性与集体理性的矛盾。

34、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲

线：

P=30-Q

其中Q为两厂商的总产量，即、=0什€)2。

TR।=PQ|=(30-Q)Q|=30Q-Q”QQ

再假设边际成本为零，即

MCI=MC2=0

解释并讨论此例的纳斯均衡，为什么其均衡是一种囚徒困境。

TR।=PQi=(30-Q)Q|=30Q-Q：-Q,Q2

厂商1的总收益TRi由下式给出：

厂商1的边际收益MRi为：

MRI=30-2QI-Q2

利用利润最大化条件MREC尸0,得厂商1的反应函数

(reactionfunction)或反应曲线为：

Qi=15-0.5Q2(6-1)

同理可得厂商2的反应曲线为：

Q2=15-0.5QI(6-2)

均衡产量水平就是两反应曲线交点和Q2的值，即方程组6-1

和6-2的解。可以求得古诺均衡时的均衡产量水平为：Q1=Q2=10O

因此，在本例中，两个寡头的总产量Q为Q1+Q2=20,均衡价格

为P=30-Q=10o

刚才我们讨论了两寡头厂商相互竞争时的均衡产量。现在我们

放松第(6)条不能串谋的假设，假定两寡头可以串谋。它们能共

同确定产量以使总利润最大化。

这时，两厂商的总收益TR为：

TR=PQ=(30-Q)Q=30Q-Q2

其边际收益MR为：

MR=30-2Q

根据利润最大化条件MR=MC=0,可以求得当Q=15时总利润最大。

如果两厂商同意平分利润，每个寡头厂商将各生产总产量的一

半,即QLQ2=7.5。其实,任何相加为15的产量Qi和CL的组合都

使总利润最大化，因此，把。+Q2=15称为契约曲线，而@=Q2=7.5

是契约曲线上的一个点。

我们还可以求得当价格等于边际成本时，Qi=Q2=15,各厂商的

利润为零。

35、两家电视台竞争周末黄金时段晚8点到10点的收视率，可选

择把较好的节目放在前面还是后面。他们决策的不同组合导致收

电彳月台1

前面后面

电视前面18,1823,20

视率如下:台2后面4,2316.16

U）如果两家是同时决策，有纳什均衡吗?

有（前面，后面）

电视台1

前山后面

电视前面18,：823,20

台2后面・4,2.1rd.id

电视台1

前面后面

电视前面至，1823,20

台2后面4,2216・16

(2)如果双方采用规避风险的策略，均衡的结果是什么？

此题应用的思想是最大最小收益法：

也就是说，在对手采取策略时，所获得的最小收益中的最大值。

电视台1：对方采取前面战略的最小收益为18

对方采取后面战略的最小收益为16

固电视台1会选择收益为18的战略一一前面

电视台2：前面的策略是一个优超策略一一前面

策略均衡为(前面，前面)

⑶如果电视台1先选择，结果有什么？若电视台2先选择呢？

电视台2

（4）如果两家谈判合作，电视台1许诺将好节目放在前面，这许

诺可信吗？结果能是什么？

电视台1许诺将好节目放在前面的许诺不可信。

因为电视台2,前面为占优策略，

而在电视台2,选择前面的时候，电视台1选择后面的收益要大

于前面的收益。

所以，最终结果为（前面，后面）

36、如果将如下的囚徒困境博弈重复进行无穷次，惩罚机制为触

发策略，贴现因子为6。试问8应满足什么条件，才存在子博

弈完美纳什均衡？

坦不坦

X白白

坦白4,40,5

不坦5,01,1

白

参考答案：

由划线法求得该博弈的纯策略纳什均衡点为（不坦白，不坦白），

均衡结果为（1,1）,采用触发策略，局中人i的策略组合s的最

好反应支付G（s）=maxR（s_i，Si）=5,Pi（S*）=4,Pi（S）=1o若存在子博弈

SicSj

完美纳什均衡，必须满足：腔附）-吃）导9即只有当贴现因

a（s）”甘）5-14

子Q1/4时，才存在子博弈完美纳什均衡。

37、在Bertrand价格博弈中，假定有n个生产企业，需求函数为

P=a-Q,其中P是市场价格，Q是n个生产企业的总供给量。假定博

弈重复无穷多次，每次的价格都立即被观测到，企业使用“触发

策略”(一旦某个企业选择垄断价格，则执行“冷酷策略”)。求

使垄断价格可以作为完美均衡结果出现的最低贴现因子5是多

少。并请解释5与n的关系。

分析：此题可分解为3个步骤

(1)n个企业合作，产量总和为垄断产量，价格为垄断价格，然

后平分利润。

(2)其中一个企业采取欺骗手段降价，那个这家企业就占有的

全部市场，获得垄断利润

(3)其他企业触发战略，将价格降到等于边际成本，所有的企

业利润为零。

参考答案：

(1)设每个企业的边际成本为c,固定成本为0

P=a-Q

TR=P*Q=(a-Q)*Q

MR=a-2Q

因为：MR=MC

a-2Q=c

则:Q=(a-c)/2

P=(a+c)/2

n=(P-c)*Q=(a-c)2/4

每家企业的利润为(a-c)2/4n

(2)假设A企业自主降价，虽然只是微小的价格调整，但足以占

领整个市场，获得所有的垄断利润一一(a-c)2/4

(3)其他企业在下一期采取冷酷策略，使得所有企业的利润为0

考虑：

A企业不降价：(a-c)2/4n,(a-c)2/4n,...

A企业降价：(a-c)2/4,0,……

使垄断价格可以作为完美均衡结果，就要使得不降价的贴现值大

于等于降价的贴现值。

设贴现因子为8

A不降价的贴现值：[(a-c)2/4n][l/(l-8)]

A降价的现值：(a-c)2/4

于是：[(a-c)2/4n][1/(1-于]2(a-c)2/4

解得：521T/n

38、假设某劳动市场为完全竞争市场，其供求函数如下：

SL：W=120+2LDL：W=360-L

n505

已知某厂商(在完全竞争市场下)的生产函数为f(L,K)=10LK

(K=100)

且其产品的需求与供给函数分别为

D:P=60-2qS:P=20+2q

试求（a）该厂商的AQ,MQ及VMR各为多少？

（b）劳动工资为多少?厂商会雇用多少劳动？

由：解得：W=280

由于产品市场为完全竞争市场，且要素市场也为完全竞争市场

所以，满足：产品市场均衡：P=MR=MC=W/MPL

要素市场均衡：W=AC=MC=VMPL

得到：AC=MC=VMP=280

由：D=S解得:P=40,q=10

厂商追求利润最大化的情况下：

.0.5

W*=VMPL=P*MPL=P*50/L

L*=[100/2*PW*]=51（取整数）

论述题（每小题20分，共20分）

解释“囚犯困境”，并举商业案例说明。

囚徒困境是博弈论里最著名的例子之一,几乎所有的博弈论著

作中都要讨论这个例子。这个例子是这样的：两囚徒被指控是一

宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各

囚徒都被要求坦白罪行。如果两囚徒都坦白，各将被判入狱5年;

如果两人都不坦白，则很难对他们提起刑事诉讼，因而两囚徒可

以期望被从轻发落入狱2年；另一方面，如果一个囚徒坦白而另

一个囚徒不坦白，坦白的这个囚徒就只需入狱1年，而不坦白的

囚徒将被判入狱10年。表6-2给出了囚徒困境的策略式表述。

这里，每个囚徒都有两种策略：坦白或不坦白。表中的数字分别

代表囚徒甲和乙的得益。(注意，这里的得益是负值。)

表6-2囚徒困境

囚徒乙

坦白不坦

白

囚徒坦白-5,-1,

甲5-10

不坦-10,~2,

白-1-2

在囚徒困境这个模型中，纳什均衡就是双方都坦白，给定甲坦

白的情况下，乙的最优策略是坦白；给定乙坦白的情况下，甲的

最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡，而且

是一个上策(dominantstrategy)均衡，即不论对方如何选择，

个人的最优选择是坦白。因为如果乙不坦白，甲坦白的话就被轻

判1年，不坦白的话就判2年，坦白比不坦白要好；如果乙坦白，

甲坦白的话判5年，不坦白的话判10年，所以，坦白仍然比不

坦白要好。这样，坦白就是甲的上策，当然也是乙的上策。其结

果是双方都坦白。这个组合是纳什均衡。

寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头

厂商选择产量时，如果寡头厂商们联合起来形成卡特尔，选择垄

断利润最大化产量，每个厂商都可以得到更多的利润。但卡特尔

协定不是一个纳什均衡，因为给定双方遵守协议的情况下，每个

厂商都想增加生产，结果是每个厂商都只得到纳什均衡产量的利

润，它远小于卡特尔产量下的利润。

解释“智猪博弈(boxedpigs)”，并举商业案例说明。

智猪博弈的例子讲的是：猪圈里有一头大猪和一头小猪，猪圈

的一头有一个猪食槽，另一头安装一个按扭，控制着猪食的供应。

每按一下按扭会有10个单位的猪食进槽,但谁按按扭谁就要付2

个单位的成本并且晚到猪食槽。若大猪先到猪食槽，大猪吃到9

个单位，小猪只能吃到1个单位；若小猪先到猪食槽，大猪吃到

6个单位，小猪吃4个单位；若同时到，大猪吃到7个单位，小

猪只能吃3个单位。表6-3列出了对应于不同策略组合的得益水

平。例如，表中第一格表示大猪小猪同时按按扭，从而同时走到

猪食槽，大猪吃7个，小猪吃3个，除去2个单位成本，得益分

别为5和1。

表6-3智猪博弈

小猪

按|不按

大猪按5,14,4

不按9,0,0

-1

从表6-3可以看到，对于小猪来说，如果大猪按，它则不按更

好；如果大猪不按，它

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论复习题及答案

文档简介

温馨提示

最新文档

评论

相关文档