(完整word版)经济博弈论期末复习资料(word文档良心出品)_第1页
(完整word版)经济博弈论期末复习资料(word文档良心出品)_第2页
(完整word版)经济博弈论期末复习资料(word文档良心出品)_第3页
(完整word版)经济博弈论期末复习资料(word文档良心出品)_第4页
(完整word版)经济博弈论期末复习资料(word文档良心出品)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、经济博弈论复习资料一、名词解释1、零和博弈:是指参与博弈的各方,在严格竞争下,一方的收益必然意味着另 一方的损失,博弈各方的收益和损失相加总和永远为“零”,双方不存在合作可 能的博弈。2、常和博弈:是指各博弈方的得益之和是一个非零常数的博弈。常和博弈中各 博弈方之间利益关系也是对立的,博弈方之间的基本关系也是竞争关系。3、纳什均衡:在博弈G=s,,Sn;Ui,,Un中,如果由各个博弈方的各一个策略组成的某个策略组合(s*,sn)中,任一博弈方i的策略s*,都是对其余博弈方策略的组合(S*,,s*,s*十,,s*)的最佳对策,也即u i (S1 , s i _1 , s i , s i -H ,

2、 s - u S1 ,Si_i,Sij,Si+i, s n )对任意Sij S都成立,则称(s*,£ )为G的一个纳什均衡。4、混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。5、纳什定理:在一个有n个博弈方的博弈G=S,,Sn;U1,,Un中,如果n是有限的,且Si都是有限集(对i=1,,n),则该博弈至少存在一个纳什均衡,但可能包含混合策略。(这个定理就是说,每一个有限博弈都至少有一个混合策略纳 什均衡)6帕累托上策均衡:是指帕累托效率意义上的优劣关系,因此用这种方法选择 出来的纳什均衡,也称为“帕累托上策均衡”。7、风险上策均衡:如果所有博弈方在预计其他博弈方采用两种纳

3、什均衡的策略 的概率相同时,都偏爱其中某一个纳什均衡,则该纳什均衡就是一个风险上策均 衡。8、子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的, 有初始信息和进行博弈所需要的全部信息。9、子博弈完美纳什均衡:如果在一个完美信息的动态博弈中,各博弈方的策略 构成一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡” 10、重复博弈:是原博弈的简单重复,重复博弈的子博弈完美纳什均衡是每次重 复采用原博弈的纳什均衡。11、有限次重复博弈:给定一个基本博弈 G (可以是静态博弈,也可以是动态博 弈),重复进行T次G

4、并且在每次重复G之前各博弈方都能观察到以前博弈的 结果,这样的博弈过程称为“ G的T次重复博弈”,记为G(T) 0 12、无限次重复博弈:如果一个基本博弈G一直重复博弈下去,这样的重复博弈 就叫“无限次重复博弈”,记为G(处)0味着13、有限理性:意味着一般至少有部分博弈方不会采用完全理性博弈的均衡策 略,他们会在博弈过程中学习、博弈通过试错寻找较好的策略; 有限理性意味着 均衡是不断调整和改进而不是一次性选择的结果,而且即使到达了均衡也可能再 次偏离。14、有限理性博弈:存在有限理性博弈方的博弈。15、最优反应动态:有快速学习能力的小群体成员的反复博弈, 相应的动态机制 称为“最优反应动态”

5、 。策略调16、复制动态:学习速度很慢的成员组成的大群体随机配对的反复博弈, 整用生物进化的“复制动态”机制模拟。17、完全但不完美信息动态博弈:在不完美信息动态博弈中,各博弈方对博弈结 束时每个博弈方的得益是完全清楚的,因此博弈方是有“完全信息”的,这类博 弈我们称之为“完全但不完美信息动态博弈”。18、不完全信息静态博弈(静态贝叶斯博弈):可表示为G=A,人;Tn; P1,,P n;U1,u。其中A为行为空间,Ti是类型空间(ti -T);得益Ui(ai,,an,ti是策略组合(ai,,內)和类型七的多元函数;Pi = pi«_Jti是条件概率函数,即博弈方i在自己的类型为ti时

6、,对其他博弈方类型的组合_的判断。19、不完全信息动态博弈(动态贝叶斯博弈):在动态博弈中,行动有先后次序; 在不完全信息条件下,博弈的每一参与人知道其他参与人的有哪几种类型以及各 种类型出现的概率,即知道“自然”参与人的不同类型与相应选择之间的关系, 但是,参与人并不知道其他的参与人具体属于哪一种类型。由于行动有先后顺序,后行动者可以通过观察先行动者的行为, 获得有关先行动者的信息,从而证实或 修正自己对先行动者的行动。20、进化博弈论:有限理性博弈的有效分析框架是借鉴生物进化博弈理论发展起 来的进化博弈论,也称为“经济学中的进化博弈论”。二、简答题1、设定一个博弈模型必须确定哪几个方面 ?

7、答:设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承 担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择, 也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相 应后果、结果,必须是数量或者能够折算成数量:博弈次序,即博弈方行为、 选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为 或最终利益的了解程度;(6)行为逻辑和理性程度,即博弈方是依据个体理性还是 集体理性行为,以及理性的程度等。如果设定博弈模型时不专门设定后两个方面, 就是隐含假定是完全、完美信息和完全理性的非合作博弈。2、“囚徒的困境”的内在

8、根源是什么?举出现实中囚徒的困境的具体例子。答:“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博 弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方 面的利益,并实现整体、个体利益共同的最优。简单地说,“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。 现实中“囚徒的困境”类型的问题是很 多的。例如厂商之问的价格战、恶性的广告竞争,初等、中等教育中的应试教育 等,其实都是“囚徒的困境”博弈的表现形式。3、纳什均衡的一致预测性质答:如果所有博弈方都预测特定的博弈结果会出现, 那么所有博弈方都不会 利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪

9、个博弈方有偏离预测结果的愿望,因此预测结果最终真会成为博弈的结果。正是由于纳什 均衡是一致预测,因此各博弈方可以预测它,可以预测他们的对手会预测它, 还 可以预测他们的对手会预测自己会预测它预测博弈结果是非纳什均衡,意味着要么各博弈方的预测不同,要么预期至少一个博弈方会“犯错误”,会选择错误的策略或者在实施策略时会出现差错。因为只有纳什均衡才具有一致预测的性 质,因此一致预测性是纳什均衡的本质属性。一致预测性是保证纳什均衡价值的 两个重要性质之一。4、相机选择和策略中的可信性问题答:由于动态博弈中博弈方的策略是多阶段的行动计划,实施起来有一个过程,而且又没有强制力,因此博弈方完全可以在博奔过程

10、中改变计划。我们称这种问题为“相机选择”问题。相机选择的存在使得动态博弈中各博弈方策略设定 的行为选择的“可信性”有了疑问。各个博弈方是否会真正、始终按照自己的策 略所设定的方案行为,还是可能临时改变自己的行动方案?纳什均衡不能解决这 种可信性问题,无法排除博弈方策略中不可信的行为设定, 因此在动态博弈中不 是真正稳定的。动态博弈分析中具有真正稳定性的均衡概念是子博弈完美纳什均 衡。5、动态博弈分析中为什么要引进子博弈完美纳什均衡,它与纳什均衡是什么关系?答:子博弈完美纳什均衡即动态博弈中具有这样特征的策略组合:它们不仅 在整个博弈中构成纳什均衡,而且在所有的子博弈中也都构成纳什均衡。在动态博

11、弈分析中引进子博弈完美纳什均衡概念的原因在于, 动态博弈中各 个博弈方的行为有先后次序,因此往往会存在相机抉择问题,也就是博弈方可能 在博弈过程中改变均衡策略设定的行为, 从而使得均衡策略存在可信性问题,而 且纳什均衡无法消除这种问题,只有子博弈完美纳什均衡能够解决它。子博弈完美纳什均衡一定是纳什均衡,但纳什均衡不一定是子博弈完美纳什 均衡。因此一个动态博弈的所有子博弈完美纳什均衡是该博弈所有纳什均衡的一 个子集。6民间定理答:(1)有限次重复博弈民间定理:设原博弈的一次性博弈有均衡得益数组 优于各博弈方在一次性博弈中最差均衡得益构成的得益数组,那么在多次重复博弈中,所有不小于个体理性得益(1

12、ndividual rationalityPayoff,即博弈方保证能获得的得益)的可实现得益(feasible payoff,博弈中所有纯策略组合得益的加权平均数组).都至少有一个子博弈完美纳什均衡的极限的平均得益来实现 它们。这个定理在有人正式证明并发表之前就是博弈理论界众所周知和认为当然 成立的,因此称“民间定理”。设G是一个完全信息的静态博弈。用(e 1,Xn)表示G的任意可实现得益。如果 XiA 足够接近1,那么无限次重复博弈G(g, S)各博弈方平均得益是(Xl,Xn)。这个(2)无限次重复博弈民间定理: en)记G的纳什均衡的得益。用(Xl, > ei对任意博弈方i都成立,

13、而中一定存在一个子博弈完美纳什均衡。无限次重复博弈的民间定理是弗里德曼(Fried-man)于1971年提出的,也称为民 间定理是因为它与有限次重复博弈民间定理的相似性。7、根据最优反应动态和复制动态进行的进化博弈分析的结论,有什么理论和现 实意义,对预测当前的经济均衡有没有作用?答:以最优反应动态和复制动态为核心的进化博弈分析,对于加深我们对社 会经济问题本质特征的认识,对博弈论和一般决策、经济理论作用和局限性的认 识,对于指导我们的社会经济实践,都有重要的理论和实践意义。因为进化博弈 分析是以有限理性而不是完美理性为基础的,因此比较符合实际,对解释现实中事物的内在规律,指导人们的实践活动价

14、值更大,而且对揭示建立在理想化行为 主体基础上的经济、决策理论的内在缺陷有重要作用;进化博弈分析也有筛选、 检验完全理性博弈分析均衡、结论的作用。此外,由于最优反应动态和复制动态 与经济主体的理性层次密切相关,因此进化博弈分析对加深我们对自身理性特征 和局限性的认识也有重要的作用。一般来说进化博弈分析研究的主要是社会经济现象和问题的长期动态趋向 和稳定性,不一定能准确预测当前经济问题的均衡结果。只有对已有较长期发展 过程的问题,才能对当前的经济均衡做较有效地预测。8、完美贝叶斯均衡需满足的要求:答:(1在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信 息集中各节点的概率的“判断”。(

15、非单节点上,相当于一个概率分布,单节点 概率为1);(2) 给定各博弈方的“判断”,他们的策略必须是“序列理性”的。(即以 得益或期望得益最大为目标);(3)在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策 略决定;(4) 在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在 此处可能有的均衡策略决定。9、用柠檬原理和逆向选择的思想解释老年人投保困难的原因?答:“柠檬原理”是在信息不完美且消费者缺乏识别能力的市场中,劣质品 赶走优质品,最后搞垮整个市场的机制。“逆向选择”是在同样不完美信息和消 费者缺乏识别能力的市场中,当价格可变时,价格和商品质量循环下降,市场不 断向

16、低端发展的机制。高龄人群的保险市场是一个典型的柠檬原理和逆向选择会起作用,从而会导致发展困难的市场。老年人的健康情况差别很大,比年轻人之间的差别要大得多, 而保险公司了解老年人投保人的实际健康状况又很困难或成本很高,这就造成了保险公司对老年投保人健康状况的信息不完美。缺乏准确的信息,保险公司就无法根据每个老年投保人的实际健康情况确定 不同的保费率,只能根据平均健康情况确定保费率。 这种平均保费率对健康情况 很差的老年人是合算的,但对健康状况较好的老年人则不合算。 因此前者倾向于 投保,后者则不愿意投保,投保老年人的平均健康情况会很差。 这使得保险公司 的赔付风险大大提高,不仅不能赢利而且要亏损

17、,从而失去经营老年保险的积极 性,最终导致老年人的投保难问题。这就是柠檬原理作用的结果。如果允许调整保费率,那么保险公司为了避免亏损会上调保费率。而这又会 使得原来投保或者准备投保者中相对较健康的老人退出, 从而投保老人的平均健 康状况会变得更差。如此循环,最终保费会升得很高而投保老人的平均健康情况 则会越来越差,对市场的发展当然是很不利。这就是逆向选择机制在老年保险市 场作用的结果。10、用完全但不完美信息动态博弈的思想,讨论我国治理假冒伪劣现象很困难 的原因?答:商品交易中的质量问题可以用完全但不完美信息动态博弈描述,商品交易中的假冒伪劣现象正是这种市场博弈低效率均衡的表现形式。根据对不完

18、美信息市 场博弈完美贝叶斯均衡的讨论,不难知道我国市场经济中假冒伪劣现象难以治理 的原因主要包括:(1)信息不完美程度比较严重。我国发展市场经济的时间不长,因此在企业 和个人商誉、信誉的建立,资讯的获得和传递等方面,与发达市场经济国家相比 有很大差距。这使得我国市场经济活动中的信息不完全和不对称情况更加严重, 这是我国市场交易博弈容易出现低效率均衡,假冒伪劣现象严重的主要根源之(2)消费者识别能力低下而且麻木。长期的经济落后和物质贫困使得我国消 费者的消费知识缺乏,判断商品质量的能力较差。根据不完美信息市场博弈分析 可知,消费者识别能力低等于不法厂商制假成本低, 而这正是导致不利市场均衡, 假

19、冒伪劣盛行的关键条件。事实上,我国消费者不仅识别能力低,还经常对假冒 伪劣容忍麻木,甚至知假买假,我国的假冒伪劣很难治理就更不奇怪了。(3)暴利空间的存在。我国许多市场的结构和价格水平不是很合理,许多商 品定价过高,存在明显的垄断暴利。这给制假者提供了很大的获利空间。 根据不 完美信息市场博弈分析的结论,暴利的存在也是假冒伪劣问题严重的重要原因。(4)对假冒伪劣的打击不力。由于地方、部门利益,以及管理体制等方面的原因,政府管理、执法部门对假冒伪劣管理和打击的力度往往是不够的,甚至还有反过来保护制假的情况。这当然会使造假者和打假者之间的博弈向不利的均衡方向发展,使假冒伪劣现象越来越严重。(5)我

20、国社会经济环境的变动太大, 稳定性比较差也是重要原因。在不稳定的市场中,管理者和经营者都不可能对长远利益有足够的重视,不可能对培育和 维护商誉有很大的积极性。这对市场博弈的均衡也有很大的影响, 会对假冒伪劣 现象起推波助澜的作用。当前我国市场经济中严重的假冒伪劣现象正是这些因素综合作用的结果, 根治假冒伪劣必须先解决好上述问题。三、计算题(课后习题 2、3、4、5章)18道题(自己整理)四、理论推导题(13道题)1、古诺的寡头模型(P59)解:寡头产量竞争以两厂商产量竞争为例设一市场有两家厂商生产同样的产品。如果厂商1的产量为q1 ,厂商2的产 量为q2,则市场总产量为 Q =qi +q2。设

21、市场出清价格P (可以将产品全部卖出去的价格)是市场总产量的函数:P = P(Q)=8-Q。再设两厂商的生产都无固定成本,且每增加一单位产量的边际成本相等,G =C2 =2。最后强调两厂商同时决定各自的产量,即他们在决策之前都不知道另一方的产量。两博弈方的策略空间:产量(假设产量是连续可分的,两厂商都有无限多种 可选策略,生产能力限制产量上限)得益:各自利润,销售收益减去各自成本。博弈得益即:q 二 qP(Q) - qq厂 qP-(q + q2) - 2= 6q1-q1q2-q12U2 = q2P(Q)-C2q2 = q28-(q + q?) - Zq?C2=6q2 - qa - q2不难看出

22、,两博弈方的得益(利润)都取决于双方的策略(产量) 。怎样才能找出这个博弈的纳什均衡策略组合呢?最大化问题,即:假设策略组合(qi,q2 )是本博弈的纳什均衡,那么(qi , q2 )必须是2max (6qi-qiq2*-qi ) qimax(6q2 - qi* q2- q22)q2*r 6-q2*-2q1*=0分别对q ,, q2求导,就一定能实现两式的最大值,得出:JI 6 一 q1* -2q2* = 0对方程组求解,得出q* = q2 =2。因此,策略组合(2,2)是本博弈唯一的纳 什均衡,也是本博弈的结果。厂商,都会选择生产2单位丿 双方各自得益(利润) 从两厂商的总体来看, 两厂商更

23、多考虑合作,根据上述分析,模型中独立同时作产量决策,以自身最大化利益为目标的两 量,最终市场总产量为2+2=4,市场价格为8-4=4, 2X( 8-4) -2 X 2=4,两厂商利润总和为 4+4=8。根据总体利益最大化确定产量效率更高,换句话说,如果联合起来决定产量,先定出总利益最大化的产量后各自生 产一般(1.5单位),则各自可分享到的利益为4.5,比只考虑自身利益的独立决 策行为得到的利益更高。但是,在缺乏强制作用的协议等保障手段的情况下, 这种情况是不可能出现 的,因为两厂商早晚都会增产,只有达到纳什均衡的产量水平( 2,2 )时才会稳 定下来,因为只有这时候任一厂商单独改变产量不利于

24、自己。2、伯特兰德寡头模型(P63)解: 1883年,伯特兰德提出把反映函数应用到伯特兰德模型分析这种模型与产 量的古诺模型的差别在于,各厂商选择的是价格而不是产量。 因此,它是价格竞 争寡头的博弈模型。产品:两厂商生产同类产品,在品牌、质量、包装等方面有 一定差别产品之间有很强替代性,但又不是完全可替代的,价格较高的不会完全 销不出去。假设:厂商1产品价格为:P1厂商2产品价格为:P2各自需求函数为:qq,P2 )=ab1 +*巳q2 = q2(Pi,卩2 )= a2+ d2Pi其中d1,d2>0,即两厂商产品的替代系数。再假设两厂商无固定成本,边际生产成本分别为c1,c2。两厂商同时

25、决策。博弈方:厂商1,厂商2;博弈策略:价格p;博弈策略空间:厂商1为S仁O,Pmax ,厂商2为S2 = O,F2max。 Pmax和Rmax表 示厂商1与厂商2能卖出产品的最高价格;博弈得益:各自利润u,即销售收益减去成本。则双方价格的函数,即得益函数:Ui = Ui(R,P2) = Rqi - eg(R-G)qi = (R-Ci)(ai-biP + diF2)U2 =U2(R,F2)= Rcb-QCb(F-C2)q2 = (F2-C2)(a2-bzPz + dbP)运用反应函数法分析这个博弈, 容易求出两厂商对对方策略(价格)的反应函数。即:i (ai 中 biCi + diP2)2 b

26、i i(a2 + b2C d2Pi ) 2 b2利用上述函数在偏导数为0时有最大值,很r Pi如果要得到一个纳什均衡,则必须有(P* , P* )是两反应函数的交点。 即必须满足:P2i*(ai + biCi + diP2 ) 2 b ii*(a 2 + b 2 e 2 + d 2 Pi ) 2 b 2解方程组:Pidi2b24bib did2 a 十 be" 40 - did2(aiP2*d2(a + Lq )中(a24bib did24bib did2十 b2C2 )代入两得益函数就可得出两厂商的均衡得益。* *将P ,巳上述是伯特兰德模型简单的情况。若对于n个寡头的价格决策,并

27、且产品也可以是无差别的。3、公共资源问题(P65)解:随着社会经济的不断发展,我们越来越无法回避公共资源利用、公共设施提供和公共环境保护等方面的问题。而在这些问题中,也包含了众多博弈关系。 公共资源的特征:(i)没有哪个人、哪个企业或组织拥有所有权;(2) 大家都可以自由利用;(3) 即具有非排他性和非竞争性。由于公共资源有上述两个特征,因而利用这些资源时不支付任何代价, 除非政府将这些资源收归国有,并对使用者征收资源税或收取类似的费用。 但一旦政府采取了上述措施,这些资源也就不再是公共资源,而更是国有资源了。公共草地放牧问题:博弈方:n个农户博弈策略:羊的数量博弈策略空间:qi(i =1,2

28、,3,n)博弈得益:U j假设:各户养羊数为q1,q2,q3,qn。得出:在公共草地上放牧羊只得总数,以及每只羊的产出(应是羊只总数Q的减函数)为:Q = q1 + qnV =V(Q)u厂 qV (Q)- qen=3,每只羊的产出函数再假设:购买和照料每只羊的成本为:c 最后得出:农户i养qi只羊的得益函数为: 为了更直观的观察,我们假设:有三家农户,即c=4。V=100-Q=100- (q1+q2+q3);养每只羊的成本为:得出:三家农户的得益函数分别为:U1 二 q1100 (q +q2 +q3)4q1U2 =q2 100 (q1 +q2 +q3)4q2Us = q3100 (q1 + q

29、2 + q3 )】4q3由于羊的数量不是连续可分的,因此上述函数不是一个连续函数。但在技术 上可以进行处理,把它当作连续函数。求出三个农户各自对其他两个农户的反应函数。即求q1,q2,q3最大化问题。得出:q 1=Ri(q2,q3)= 481 1-2q 2q3q2=R2(qi,q3) =481 12q?q3q3-R3(qi,q2 ) = 481 1?q7q2三个反映函数的交点(qi , q2 , q3 )就是博弈的纳什均衡。将这个纳什均衡代入三个反应函数。就得到:q1 = q2 = q3 = 24Ui = U2 = U3 = 576Q =12u =17284、夫妻之争的混合策略纳什均衡(P81

30、)解: 一对夫妻得到了两张时装表演票和同一时间的两张足球比赛票。妻子更想 去看时装表演而丈夫更想去看足球, 但又不愿或不能分头行动,争执不下就决定 投票决定。若同时选择时装则去看时装表演,同选足球则去看足球比赛,如选择 不一致则哪儿都不去。2, 丈夫得益1 ;3, 妻子得益1;0.假设:丈夫与妻子同时去看时装表演,妻子得益 丈夫与妻子都去看足球比赛,则丈夫得益 双方选择不同而没有出门,则双方得益都为如果一方知则前者唯一明智的选择就是与对方保持一致, 以免这个博弈与没有纯策略纳什均衡的严格竞争博弈时明显不同的, 道另一方已选择了某种策略, 得最差得益0。时装2, 10,足球0,01,妻子的混合策

31、略Pw(C广1 十 Pw(Fr0= Pw(C)7+ Pw(Fy 3丈夫的混合策略2+ Ph(r0= Ph(CY4(F)r夫妻之争博弈的混合策略纳什均衡策略得益博弈方1(0.75, 0.25)0.67博弈方2(1/3,2/3)0.75我们不难发现,这个结果明显不如夫妻双方能交流协商时,任何一方迁就 另一方时双方的得益好,因为那时任何一方都至少得1.这是因为双方缺乏沟通时很可能出现最差结果而造成的。5、寡占的斯塔博格模型(P121)解:两个厂商(一方较强,一方较弱),先后选择产量的产量竞争博弈较强一方先行选择,较弱一方根据较强一方的产量选择自己的产量。由于此博弈决策的是 产量,因此这是一个两博弈方

32、都有无限多种可选策略的无限策略动态博弈, 无法 用扩展形表示,只能用描述得益函数的方法表示。1,厂商2博弈方:厂商策略:产量CCmax ,Qmax可看作不至于使价格降到亏本的最大限度产量=P (Q ) = 8 Q ,其中 Q = q1 + q2q + C2 = 2,没有固定成本。策略空间:0,两厂商的边际成本为价格函数 P两厂商的得益函数为:2U1 = U1(qi,q2)= qiP(Q) -Qq = 58-(qi + Cb) - 2q1 = 6qi - qq? - qU2 = U2, q2)= q2 P(Q) C2q2 = q28 (q 中q?) - 2q 6q qq q2运用逆推归纳法分析这

33、个博弈。 先分析第二阶段厂商2的决策。在第二阶段厂商2决策时,厂商1选择qi实际上已经决定了,并且厂商 2知道q1,因此对厂商2来说,相当于在给定q1的情况下求使U2实现最大值的q2 。 即对 6q2 - CA 一 q2求导的问题。即6-2q2 7 =0求得1q1q2(6 7)=3 号再分析第一阶段厂商1的决策。厂商1知道厂商2的这种决策思路,因此在选择q1时就知道厂商2的产量q2,会根据公式进行确定,所以厂商1可以直接将该公式代入自己的得益函数,这样厂商1的得益函数实际上转化成了他自己的产量的一元函数。即:因此,厂商1可以直接利用该公式求出使自己的得益最大的q;*2q 21 2U1 =U1(

34、q1,q2)=6q1-qq2 q1 =6q1-q1(3-孑)一q =3q =U1(q1)令qqi代入该公式,并对q求导,可得:3 - q 1=0求得q1 =3最后得出,厂商1的最佳产量是生产3单位,厂商2的最佳产量是1.5单位, 此时市场价格为3.5,双方得益(利润)分别为4.5和2.25单位。6、无不确定性的委托人-代理人模型(P131)解:假设:代理人的工作成果没有不确定性;代理人的产出是努力程度的确定性函数;因此,委托人完全可以根据成果掌握代理人的工作情况,不存在监督问题。 再假设:委托关系是基于一种标准合同,第一阶段委托人有委托和不委托第二阶段代理人有接受和拒绝第三阶段代理人有努力(高

35、努力水平)和偷懒(低努力水平 ) 第一阶段:委托人有委托和不委托不委托得益:R(0),0。R(0)可能是0,甚至为负值;R(0)也可以是正值;代理人的服务对委托人至关紧要时, 代理人的服务对委托人不关键时, 例子:职业经理人第二阶段:代理人选择拒绝,则回到第一阶段;选择接受,则进行第三阶段第三阶段:高努力水平:R(E)代表委托人得到较高产出,w(E),代表委托人支付给代理人较高报酬,-E代表代理人有较高的负效应(重病成本,大机会成 本)低努力水平:R(S)代表委托人得到较低产出,w(S )代表委托人支付给代理 人较低报酬,-S代表代理人有较低的负效应(小病成本,小机会成本) 下图:无不确定性的

36、委托人-代理人模型(P132)逆推归纳法:第三阶段:代理人努力和偷懒的选择代理人得益情况,如果 w(E)-E> w(S)-S,也就是: w(E)> w(S)+E-S此时,代理人会选择努力。上述不等式也称为代理人努力的“激励相容约束”:这是促使代理人努力工作必须满足的条件。P133如果,w(S)-S>w(E)-E时,代理人肯定会选择偷懒。该不等式成为代理人偷懒的 “激励相容约束”。据此推论出:由于偷懒的负效应肯定小于努力工作的负效应, 如果偷懒和努力得到的报酬相同,即 w(S)=w(E),那么偷懒的激励相容约束自动 满足,代理人必然选择偷懒。第二阶段:代理人是否接受委托的选择对

37、应第三阶段的努力和偷懒的可能性选择,第二阶段有两种情况。参与约束:O拒绝接受接受:w(S)-S>0参与约束:代表代理人愿意接受委托人委托的基本条件。另一种情况:要代理人在第二阶段选择接受, 而不是拒绝,则必须使代理人在第 二阶段的得益大于放弃其他机会的机会成本。第一阶段:委托人有委托和不委托两种选择如果代理人在第二阶段选择的是拒绝, 那么委托人的选择其实是无关紧要的, 因 为委托人委托与不委托的结果一样。现在考虑代理人在第二阶段选择接受的情况,那么仍然有两种情况也就是代理人第三阶段选择努力和偷懒的情况。不不委委托: R(E)-w(E) > R(0) 不委托:R(E)-w(E) &l

38、t; R(0)委托: R(S)-w(S) > R(0) 不委托:R(S)-w(S) < R(0)最后得到:一个子博弈完美纳什均衡。即委托人的委托,代理人的接受一努力 数值例子:假设:努力的投入产出函数为:代理人努力水平2单位,偷懒水平1单位,而且努力的负效应等于努力水平的数值,即 E=2, S=1,得到:R(0)=0,R(E)=R(2)=16,R(S)=R(1)=9.再假设:W(E)=4, w(S)=2最后得出:w(E)-E=4-2=2 >w(S)-S=2-1=1,此时满足促使代理人努力的激励相容约束;w(E)-E=4-2=2 > 0,此时满足代理人接受委托的参与约束;

39、R(E)-w(E)=16-4=12 > R(0)=0,此时满足委托人选择委托的条件。下图:无不确定性的委托人-代理人模型(数值例子)(P135)7、有不确定性但可监督的委托人-代理人博弈(P135)解:代理人的努力成果有不确定性,但委托人对代理人有完全监督的情况。存在完全监督的情况下:委托人支付给代理人的报酬是根据工作情况,而不是工作成果。意味着,产出不确定性的风险完全由委托人承担, 原因:风险主要来源于环境或 随即因素,与代理人无关。也意味着,代理人工作成果的不确定性直接影响的只有委托然的选择,不会影响代理人的选择,但是通过委托人的选择会对代理人的利益产生间接影响。假设:有两种产出可能

40、20和 代理人努力时产出 代理人偷懒时产出再假设:R(0)=0引进一个“自然”博弈方0反映不确定性。 下图:努力成果不确定但可监督的委托人1020的概率为0.9,产出10的概率为0.1;20的概率为0.1,产出10的概率为0.9.-代理人模型(P136)逆推归纳法分析 第三阶段:考虑的是代理人选择努力和偷懒的情况,两种情况,即 w(E)-E> w(S)-S时,选择努力, 第二阶段:考虑代理人选择接受和拒绝的情况,(激励相容约束)w(S)-S > w(E)-E时,选择偷懒(参与约束)两种情况,即 w(E)-E>0和w(S)-S>0时,代理人会选择接受,否则选择拒绝。 第一

41、阶段:考虑委托人选择委托和不委托的情况,由于委托人对代理人的工作完全监督,也完全清楚代理人的选择,此时仍有两种情况。努力(委托人选择委托的期望得益) 委托:0.9*20-w(E)+0.1*10-w(E)>0不委托:0.9*20-w(E)+0.1*10-w(E)<0偷懒(委托人选择委托的期望得益) 委托:0.1*20-w(S) +0.9*10-w(S)>0不委托:0.1*20-w(S) +0.9*10-w(S)<08囚徒困境式博弈的无限次重复(P190)解:囚徒困境式博弈的无限次重复寡头销价竞争博弈一次性博弈中:(L,L )纯策略纳什均衡,而(H,H )虽不是一次性博弈中

42、的纳什 均衡,但却是效率较好的一个结果(潜在合作利益)H,进行t个阶段,如果假设两个博弈方都采用触发策略:第一阶段采用否则采用L。前t-1阶段的结果都是(H,H),则继续采用 假设:博弈方1首先采用这种触发策略, 然后讨论博弈方2针对博弈方1的这种策 略的最佳反应策略。4, 40, 55, 01,1博弈方2针对博弈方1触发策略的最佳反应策略的后半部分与触发策略的后半部 分是一样的。关键看博弈方2在第一阶段的最优选择是什么?第一种情况:第一阶段博弈方2采用L,得益是 后的阶段一致采用L报复,博弈方2也只能一直采用 博弈方2的总得益的现在值为:5,那么引起博弈方1在此 得益永远是1。此时,=5+1

43、咒右+1天62+下一阶段又面临同样的第二种情况:第一阶段博弈方2采用H,得益是4,选择。假设V为博弈方2在该重复博弈中每阶段都采用最佳选择的总得益现在 值,那么从第二阶段开始的无限次重复博弈因为与从第一阶段开始的只差一阶 段,因而在无限次重复时可看作相同的,其总得益的现在值折算成第一阶段的得 益为6V,因此当第一阶段的最佳选择是 H时,整个无限次重复博弈总得益的 现在值为:因此 6> i / 4 时,博弈方2会采用H策略,否则会采用L策略。那么,满足这个条件,只要博弈方i采用上述触发策略,博弈方2的最佳反应策 略始终是选择H策略。如果博弈方i偏离H策略,博弈方2也必须用L策略来报复。9、

44、古诺模型的无限次重复博弈和支持垄断产量的条件(P佃4)解:古诺的寡头模型寡头产量竞争以两厂商产量竞争为例设一市场有两家厂商生产同样的产品。如果厂商 i的产量为qi ,厂商2的产量 为q2,则市场总产量为 Q = Ci + q2。设市场出清价格 P (可以将产品全部卖出去的价格)是市场总产量的函数:P= P (Q) = 8-Q再设两厂商的生产都无固定成本,且每增加一单位产量的边际成本相 等Ci = C2 =20最后强调两厂商同时决定各自的产量, 即他们在决策之前都不知道另一方的产量。两博弈方的策略空间:产量(假设产量是连续可分的,两厂商都有无限多种可选 策略,生产能力限制产量上限)得益:各自利润

45、,销售收益减去各自成本。 博弈得益即:UiqP(Q)-qqU26qi - qiAf -C2P(Q)-C2C2= qi8(q"q2)2q2Ci飞8- (q/q2)-2q2qfmax(6qi - qq*qi-qi2)6q qiq2 -不难看出,两博弈方的得益(利润)都取决于双方的策略(产量)。怎样才能找出这个博弈的纳什均衡策略组合呢?假设策略组合(q* ,q2*)是本博弈的纳什均衡,那么(q*,q2*)必须 是最大化问题,即:max(6q2 - qi*q2 - q22)q2分别对 q , q2求导,就一定能实现两式的最大值,得出:-q 2 * -2q 1*-q 1 * -2 q 2*Z

46、*对方程组求解,得出q = 纳什均衡,也是本博弈的结果。q2* =2。因此,策略组合(2,2)是本博弈唯一的量,根据上述分析,模型中独立同时作产量决策,以自身最大化利益为目标的两 厂商,都会选择生产2单位产量,最终市场总产量为2+2=4,市场价格为8-4=4, 双方各自得益(利润)2X( 8-4) -2 X 2=4,两厂商利润总和为4+4=8。里,从两厂商的总体来看,根据总体利益最大化确定产量效率更高,换句话说, 如果两厂商更多考虑合作,联合起来决定产量,先定出总利益最大化的产量后各 自生产一般(1.5单位),则各自可分享到的利益为4.5,比只考虑自身利益的独 立决策行为得到的利益更高。但是,在缺乏强制作用的协议等保障手段的情况下, 这种情况是不可能出现 的,因为两厂商早晚都会增产,只有达到纳什均衡的产量水平( 2,2)时才会稳 定下来,因为只有这时候任一厂商单独改变产量不利于自己。当贴现率满足一定条件时,两厂商都采用如下触发策略构成的一个子博弈完 美那身均衡:第一阶段生产垄断产量的一般1.5;进行t个阶段,在前t-1阶段的结果都是 (1.5,1.5),则继续生产1.5,否则生产古诺产量2.第一种情况:两厂商都采用触发策略,则每期得益 4.5,无限次重复博弈总得益的现在值 为:第二种情况:如果厂商2第一阶段就偏离触发策略,此后引起厂

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论