第六章博弈论初步_第1页
第六章博弈论初步_第2页
第六章博弈论初步_第3页
第六章博弈论初步_第4页
第六章博弈论初步_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#第六章博弈论初步教学目的和要求:在寡头垄断的市场上,厂商之间的决策是相互影响的,可以用博弈论的有关理论来分析具有相互影响的厂商之间的决策行为。通过本章的学习,学生应该了解博弈论的基本概念,能够运用博弈论的有关理论分析厂商的行为,并且重点掌握古诺模型、斯塔克博格模型、伯特兰模型、价格领导模型等几个有关厂商价格和产量决策的模型。教学重点与难点:纳什均衡、古诺模型、伯特兰模型、价格领导模型教学时数:8课时第一节博弈论和博弈简介博弈论是研究产业组织的有效方法,著名经济学家泰勒尔说:“正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式”。博弈论与传统经济学有关决策理论的区别在于:后者涉及的个人决策,个人效用只依赖于自己的选择,而外在于他人的选择;然而博弈论看来,个人效用不仅依赖于自己的选择,而且依赖于他人的选择。一、博弈论的基本知识博弈个人,团体或组织在面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自从中取得相应结果的过程。博弈论英文为Gametheory,是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。描述博弈的要素参与人(player),参与人指的是博弈中选择行动以最大化自己效用的决策主体 (可以是个人,也可以是团体);行动(actions),行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策;信息(information) 信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识;策略(strategy) 策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排;支付(payoff)函数支付函数是参与人在博弈结束后从博弈中获得的效用, 一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西;结果(outcome),结果是指博弈分析者感兴趣的要素的集合,常用支付矩阵或收益矩阵来表示。均衡(equilibrium) ,均衡是指所有参与人的最优策略或行动的组合博弈的分类行动顺序信息静态动态完全信息完全信息静态博弈;纳什均衡;纳什(1950,1951)完全信息动态博弈;子博弈精炼纳什均衡;泽尔腾(1965)不完全信息不完全信息静态博弈;贝叶斯纳什均衡;海萨尼(1967-1968)不完全信息动态博弈;精炼贝叶斯纳什均衡;泽尔腾(1975)

二、占优策略、劣策略和纳什均衡占优策略均衡当参与的一方拥有一种策略,该策略无论何时,无论其他参与者选择什么策略,都优于可选择的其他策略时,我们就称该参与者拥有占优策略 (dominantstrategy)。如果所有参与者都有占优策略存在,那么所有参与者占优策略的组合就构成了占优策略均衡。LRTLRT7758B8566参与者2参与者1重复剔除劣策略的占优均衡实际生活中,通常只有很少的博弈拥有占优策略,当存在一种策略,不论其他参与人选择什么策略,该策略的收益都比其他策略差时,称之为严格劣策略,严格劣策略参与者不会选择,可以剔除。如果是重复剔除劣策略后剩下的唯一的策略组合, 则存在重复剔除的占优均衡。 该博弈是重复剔除占优可解的(dominancesolvable),策略组合称之为重复剔除劣战略占优均衡。纳什均衡纳什均衡的含义:纳什均衡是一种策略组合, 这种策略组合由所有参与人的最优策略组成,即给定别人策略的情况下,没有任何单个参与人有积极性选择其他策略,从而没有任何参与人有积极性打破这种均衡。(1)囚徒困境(prisoners'dilemma)囚徒乙坦白不坦白囚徒甲坦白-5 ,-50,-10不坦白-10,0-2,-2⑵智猪博弈(boxedpigs)小猪按二「不按大猪按5,14,4不按9,-10,0纳什均衡的数学表达:纳什均衡:有n个参与人的战略式表述博弈 G={S,,,Sn;U1,,,Un},战略组合S*=(S*,,,S*)是一个纳什均衡,如果对于每一个 i,S*是给定其他参与人S—i*=(S*,,,*****”*S1,Si+1,,S)的情况下第i个参与人的最优战略,即: Ui(Si,s-i)>Ui(Si",s-i)对任意S"€Si,和任意的I都成立。第二节寡头垄断厂商的静态竞争模型、产量决策古诺模型古诺模型是寡头的产量决策模型,对该模型的博弈研究是产业组织理论的重要基础。例:设一市场有1、2两家厂商,他们生产相同的产品。 设厂商I的产量为q1,厂商2的产量为q2,,则市场总产量为: Q=q1+q2设P为市场出清价格(可以将产品全部卖出去的价格),贝UP是市场总产量的函数P=P(Q)=8—Q再假设两厂商的生产都无固定成本,且每增加一单位产量的边际生产成本相等 6=C2=2即他们分别生产q1和q2产量的成本为2q1和2q2。最后,强调这两厂商是同时决定各自的产量的,即在决策之前不知道另一方的产量。在上述问题构成的博弈中博弈方为厂商 1和厂商2。他们的策略空间都是由不同的产量组成,因为产量受生产能力的限制,因此理论上产量是有一个上限的,但如果假设产量是连续可分的,则他们各自都有无限多种可选策该博弈中两博弈方的得益自然是各自的利润,即各自的销售收益减去各自的成本, 根据给定的情况,分别为:u1=q1P(Q)-C1u1=q1[8-(q1+q2)]-2q1u2=q2P(Q)-C2u2-q2[8-(q1+q2)]-2q2两博弈方(厂商)的得益(利润)都取决于双方的策略(产量)。对厂商2的任意产量q2,厂商I有反应函数:1qi二Ri(q2) (6-q2)2这是通过令u1对q1的导数等于0求得的。同样的,厂商2对厂商1的产量q1的反应函数为: 1q2=R2(q1)=:(6-q1)2这两个反应函数都是线性函数,我们可用平面上的两条直线表示它们,如图虽然本博弈中两博弈方都有无限多种可选策略,因而无法用得益矩阵表示该博弈,但纳什均衡的概念同样还是适用的,只要其中q1*和q2*相互是对对方策略的最佳对策,就是一个纳什均衡。并且,如果我们可证实它是该博弈中唯一的纳什均衡,则它同样是博弈的解。前面我们介绍的划线法等都是通过在不同策略之间两两比较找出纳什均衡的,这些方法在有无限多种策略时显然不适用,那么我们该如何去找本博弈的纳什均衡呢?实际上,划线法等方法的原理都是寻找针对其他博弈方策略的最佳对策,即在其他博弈方的一定策略下本方能实现自身最大得益的策略,这其实就是数学中的最大值的概念。因此,当我们研究的博弈有无限多种策略,得益函数为连续函数时,我们只要根据数学中求最大值的方法,求出各博弈方在给定其他博弈方策略时能实现自身最大得益值的策略,并找出它们的交叉点,就一定是我们要找的纳什均衡。因此,在本博弈中,(q1*,q2*)的纳什均衡的充分必要条件是q1*和q2*的最大值问题:「*2max(6qi-qg2-qi)qi* 2max(6q?-q?qi-q?)、、q2因为求最大值的两个式子都是各自变量的二次式,且二次项的系数都小于 0,因此qi*和q2*只要能使它们各自对qi和q2的导数为0,就一定能实现它们的最大值。令:y * *6—q?-2qi=0Q-q;_2q;=0解之,得qi*=q2*=2,并且这是唯一的一组解。因此 (2,2)是本博弈唯一的纳什均衡策略组合,也就意味着它是本博弈的解。两厂商将各生产 2单位产量,双方得益(利润)都为2X(8一4)一2X2=4。市场总产量为2十2=4,价格为8一4=4,两厂商的利润总和为4+4=8。上述是两厂商独立同时作产量决策, 他们根据实现自身最大利益的原则行动而得到的结果。那么这个结果究竟怎么样,两厂商有没有真正实现自身的最大利益,从社会总体的角度来看效率又如何?为了对这些问题作出一个判断 ,我们必须换一个角度来考察这个问题。上面是假设两厂商都是从追求自己一家的利益出发进行决策,虽然他们不能忽视其他博弈方的存在,但却不是关心其他博弈方的利益,不是以总体利益为目标的。如果我们现在以总体利益为目标来考虑市场的最佳产量,结果会有怎样的不同呢 ?首先我们可以根据市场的条件求出实现最大总得益 (总利润)的总产量。设总产量为Q则总得益U=QP(Q)—CQ=Q(8一Q)一2Q=6Q-Q2很容易求得使总得益最大的总产量Q*=3,最大总得益u*=9。将此结果与两厂商独立决策,只追求自身利益时博弈的结果相比,总产量较小,而总利润却较高。因此,从两厂商构成的总体来看,后一种方法的效率更高。换句话说,如果两厂商可以合作,联合起来决定产量,找出使总利益最大的产量后各自生产该产量的一半 1.5,则各自可分享到比双方不合作,只考虑自己利益而独立决策时更高的利益 (4.5>4)。但是,在独立决策,缺乏协调机制的企业之间的这种合作并不很容易 ,即使双方认识到了合作的好处,达成了一定的协议,这种协议也往往缺乏足够的强制力,最终是很难维持上述对双方都真正最有利的产量,原因主要是因为各生产一半实现最大利润的总产量的策略组合 (1.5,1.5)不是纳什均衡,也就是说,在这个策略组合 (产量组合)下,双方都可以通过独自改变(增加)自己的产量而得到更高的利润,他们都有突破限额1.5的冲动,在缺乏有足够强制力的协议等限制手段的情况下,这种冲动注定他们不可能维持限额,最终是大家都增产,直至达到纳什均衡水平(2,2),实现并不是可能实现的最大利润的稳定状态。这实际上就是“囚徒的困境”博弈的一个变种。古诺模型在现实中最好的例子是石油输出国组织的限额和突破。石油输出国组织成员国已知各自为政、自定产量的博弈结果肯定是使油价下跌、利润受损,因此有共同磋商制定产量限额以维持油价的意愿。但一旦规定各国的生产限额,且按照这个限额生产时,每个成员国都会发现,如果其他国家都遵守限额,只有自己超产,则自己将获得更多的利润,并且因为只有一国超产油价不会下跌太多,从而其他各国只是普遍受少量损失,因此各成员国在本位利益的驱使下,都会希望其他国家遵守限额而自己偷偷超产,独享更多的利益。最终的结果是各国普遍突破限额,限产计划破产,油价严重下跌,各国都只能得到不是最满意的纳什均衡的利润。这基本上就是石油输出国组织成员国面临的实际情况。

三、价格决策一一伯特兰德模型(一)产品同质的伯特兰德模型•模型说明假设市场上只有两家企业: 企业1和企业2,双方同时定价,它们生产的产品完全相同(同质),寡头企业的成本函数也完全相同:生产的边际成本等于单位成本 c,且假设不存在固定成本。市场需求函数D(p)是线性函数,相互之间没有任何正式的串谋行为。由于两个寡头垄断企业生产的产品同质,因而定价高者将失去整个市场;如果两个企业定价相同,则它们将平分市场。在上述条件下,两个企业的最优战略将如何选择呢?RNRN=MC在上图中,两个坐标轴分别代表两个企业的策略选择。 企业1和企业2的最优反应函数(曲线)是什么?由于两个企业具有相同的边际成本,所以它们的反应函数曲线的形状相同,并且关于450线对称。当P2<MC时,企业1选择价格P仁MC;当MC<P2<P(垄断价格)时,企业1选择略低于R2的定价R1;当P2>Pm时,企业1选择垄断价格R1=Rm2.伯特兰德悖论及其解释伯特兰德均衡说明,只要市场上有两个或两个以上生产同样产品的企业,则没有一个企业可以控制市场价格,获取垄断利润;超过边际成本的价格不是均衡价格。而在现实市场上,企业间的价格竞争往往没有使均衡价格降低到等于边际成本的水平上,而是高于边际成本。对于大多数产业而言,即使只有两个竞争者,它们也能获得超额利润。这与伯特兰德模型得出的结论是不一致的,被称为“伯特兰德悖论”。对“伯特兰德悖论”的解释,主要有三种理论?动态竞争理论。?产品差别理论。?生产能力约束理论。(二)产品有差别的伯特兰德模型产品有一定差别是指两厂商的产品在品牌、质量、包装等方面有所不同的同类商品。因此伯特兰德模型中厂商的产品之间有很强的替代性,但又不是完全可替代,即价格不同时,价格

较高的不会完全销不出去。这种情况,我们可用当厂商 1和厂商2价格分别为P1和P2时,他们各自的需求函数为:q仁q1(P1,P2)=a1-b1P1+d1P2和q2=q2(P1,P2)=a2-b2P2+d2P1来表示,其中d1,d2>0表示两厂商产品有一定替代性的替代系数。我们同样假设两厂商无固定成本,边际生产成本分别为cl和c2。最后,仍强调两厂商是同时决策的。在该博弈中,两博弈方为厂商 1和厂商2;他们各自的策略空间为 Sl=[0,Pima』和S2=[0,Pamax]其中Pimax和Pzmax是厂商|和厂商2还能卖出产品的最高价格; 两博弈方的得益就是各自的利润,即销售收益减去成本,都是双方价格的函数:u i=ui(Pi,P2)=Piqi-ciqi=(Pi-ci)(ai-biPi+diPa)U 2=U2(Pi,P2)=P2q2-C2q2=(P2-C2)(a2-b2P2+d2Pi)我们用反应函数的概念解该博弈。利用上述得益函数在偏导数为 0时有最大值很容易解得两厂商对对方策略(价格)的反应函数分别为:1R=Ri(B(ai+Dg+dR)iF2=R2(R)= (a2+Pg*d2p)2b2纳什均衡(Pi*,P2*)必是两反应函数的交点,解此方程组,得*Pi*P2di(a2b2C2)2b2(a「biCi)*Pi*P24b|b2-dd 4b|b2-did2d2(ab©)2R(a2b2c2)4b)b2-did2 4bib-did2Pi*,P2*)为博弈唯一的纳什均衡。将 Pi*,P2*代入两得益函数则得到两厂商的均衡得益ai=a2=28,b仁b2=i,d仁d2=0.5,c仁c2=2 ,则可解得Pi*=P2*=20,且ui*=u2*=324。三、产品决策一豪泰林模型产品差异有多种形式。现在考虑一种特殊的差异, 即空间上的差异,这就是经典的豪泰林模型。在豪泰林模型中,产品在物质性能上是相同的,但在空间位置上有差异。因为不同位置上的消费者要支付不同的运输成本,他们关心的是价格与运输成本之和,而不单是价格。假定有一个长度为i的线性城市,消费者均匀地分布在[0,i]区间里,分布密度为i。假定有两个商店,分别位于城市的两端,商店 i在x=0,商店2在x=i,出售物质性能相同的产品。每个商店提供单位产品的成本为 c,消费者购买商品的旅行成本与离商店的距离成比例,单位距离的成本为t。这样,住在x的消费者如果在商店i采购,要花费tx的旅行成本商店2采购,要花费t(i-x)。假定消费者具有单位需求,即或者消费 i个单位或者消费0个单位。消费者从消费中得到的消费剩余为So我们现在考虑两商店之间价格竞争的纳什均衡。假定两个商店同时选择自己的销售价格。为了简单起见,我们假定s相对于购买总成本(价格加旅行费用令Pi为商店i的价格,D(pi,p2)为需求函数,i=i,2。如果住在x的消费者在两个商店之间是无差异的,那么,所有住在 x左边的将都在商店i购买,而住在x右边的将在商店2购买,需求分别为D=x,D=i—xo这里,x满足:pi+tx=p2+t(i-x)解上式得需求函数pp^+tD2(Pl—=^~Di(PDi(Pi,P2)=x利润函数分别为:P2-Pl t2t1Li(Pi,P2)=(P1-C)Di(PnP2) (Pi-C)(P2-Pit)L2(pi,p2r(p2_c)D2(pi,p2)2(P2—C)(pi-p2t)商店i选择自己的pi最大化利润L,给定p两个一阶条件分别是_=p2ct_2p=0PiR=»ct-2p2=0解上述两个一阶条件,得最优解为: pi*=p2*=c+t每个企业的均衡利润为:Li九2=:2我们将消费者的位置差异解释为产品差异,这个差异进一步可解释为消费者购买产品的旅行成本。旅行成本越高,产品的差异就越大,均衡价格从而均衡利润也就越高。原因在于,随着旅行成本的上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断力加强,商店之间的竞争越来越弱,消费者对价格的敏感度下降,从而每个商店的最优价格更接近于垄断价格。另一方面,当旅行成本为零时,不同商店的产品之间具有完全的替代性,没有任何一个商店可以把价格定得高于成本,这就是伯川德均衡结果。在以上的分析中,我们假定两个商店分别位于城市的两个极端。 事实上,均衡结果对于商店的位置是很敏感的。考虑另一个极端的情况,假定两个商店位于同一个位置 x,此时,他们出售的是同质的产品,消费者关心的只是价格,那么,伯川德均衡是唯一的均衡:pi=p2=c,Li=L2=0更为一般地,我们可以讨论商店位于任何位置的情况。假定商店 i位于a>0,商店2位于i—b(这里b>0)。为不失一般性,假定 i—a—b>0(即商店i位于商店2的左边)。女口果旅行成本为二次式,即旅行成本为 td2,这里d是消费者到商店的距离,那么,需求函数分别为:〔-a-b P2-PiDi(Pi,P2)=X=a - ——22t(i-a-b)i-a-b Pi一P2D2(pi,P2)=i-x=b - 2-22t(i—a—b)需求函数的第一项是商店自己的“地盘”(a是住在商店i左边的消费者,b是住在商店-右边的消费者),第二项是位于两商店之间的消费者中靠近自己的一半,第三项代表需求对价格差异的敏感度。

纳什均衡为:纳什均衡为:b_ap2(a,b)二ct(1—a_b)(1 )a^-bpi(a,b)=ct(1-a-b)(1 )3第三节寡头垄断企业的动态博弈模型一、 寡头垄断企业动态竞争及其博弈原理逆向归纳法是用来分析动态博弈过程,求得子博弈精练纳什均衡的有效方法,其具体过程是:给定博弈到达最后一个决策后,该决策结上行动的参与人有一个最优选择,这个最优选择就是该决策结开始的子博弈的纳什均衡;然后,再倒推到倒数第二个决策结,找出倒数第二个决策者的最优选择,这个最优选择与在第一步找出的最后决策者的最优选择构成倒数第二个决策结开始的子博弈的一个纳什均衡。重复同样的过程,直到初始结,每一步得到对应的子博弈的一个纳什均衡,这个纳什均衡一定是该博弈的所有子博弈的纳什均衡。在这个过程中,最后一步得到的整个博弈的纳什均衡也就是这个博弈的子博弈精炼纳什均衡。二、 斯坦克尔伯格产量竞争模型假定产业内只有两家企业,企业 1是领导者,企业2是跟随者,产量是其决策变量,产量的决策有先后顺序,起支配作用的是领导企业的产量决策。市场上的价格决定仍与古诺模型一样,即价格是由领导企业的产量 Q1与追随者企业的产量Q2之和与需求共同决定,价格P=a-Q。领导者首先确定自己的产量,随后跟随者再根据领导者的产量水平确定自己的产量,领导者具有先动优势。由于存在先动优势,领导者企业自然会估计到自己作出的产量决策所产生的对跟随者的影响,以及跟随者的反应函数。这就是说,领导者企业是在估计到跟随者企业的反应函数的基础上来做出有利于自身利益极大化的产量决策的。以上竞争是一个典型的完全信息动态博弈问题,需要采用逆向归纳法求解两企业的产量决策,即先分析跟随企业的反应函数;然后再把这个反应函数纳入到领导企业的决策过程中,得出领导企业的最优产量决策。首先计算企业2对企业1任意产量的最优反应, R2(q1)应满足:max二2(q1,q2)=maxq?[a-q1-q?-c]q2-0 q^_0可得R2(qJ1就可以预测到自己如果选由于企业1也能够像企业2一样解出企业21就可以预测到自己如果选择q1,企业2将根据R2(q1)选择产量。那么,在博弈的第一阶段,企业 1的问题就可表示为:max二dq,R2max二dq,R2(qJ)二a_q_R2(q)_C]aq1c2上式对q1求一阶导数并令其为零,可得企业1上式对q1求一阶导数并令其为零,可得企业1最大利润时的产量:q1二a-c2相对于这一产量,企业 2的最优产量为*a-cR2(qJ=——4以上就是斯坦克尔博格双头垄断博弈的逆向归纳解。在斯坦克尔博格模型中,企业 1完全可以选择古诺均衡产量(a-c)/3,这时企业2的最优反应同样是古诺均衡产量。也就是说在斯坦克尔博格模型中,企业 1完全可以使利润水平达到古诺均衡的水平,却选择了比古诺产量大的产量( a-c)/2。企业1在斯坦克尔博格博弈中的利润一定高于其在古诺博弈中的利润。企业 2的福利肯定下降。三、寡头垄断企业的价格领导模型价格领导模型就是用来说明寡头垄断市场上价格确定的模型,如此确定的价格,不是寡头垄断企业竞相压价的结果,而是某个寡头企业充当价格领导者首先变动价格,其他寡头企业充当价格追随者,按照领导企业宣布的价格制定自己的价格。假定市

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论