博弈论的数学模型_第1页
博弈论的数学模型_第2页
博弈论的数学模型_第3页
博弈论的数学模型_第4页
博弈论的数学模型_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论的数学模型 作者: 竺可桢学院01混合班 王大方 何霈 邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释。本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响。我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性。 (一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1 1 博弈的参与者。2 2 每一个参与者可供选择的战略集。3 3 针对所有参与者可能选择的战略组合,每一个参与者获得的利益在n人博弈中,用Si为参与者

2、i的可以选择战略空间,其中任意一个特定的纯战略为si,其中任意特定的纯战略为si,siSi,n元函数ui(s1,s2,sn), 当n个博弈者的决策为s1,s2,sn时,表示第I各参与者的收益函数。二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。这个局势叫纳什均衡: 在n个参与者标准式博弈,G= S1,S2,Sn;u1,u2,un中,若战略组合s1*,s2*,sn*满足对每一个参与者i,si*是针对 s1*,s2*,si-1*,si+1*sn*的最优反应战略,目标战略组合s1*,s2*,sn*为该博弈的纳什均

3、衡。即:ui s1*,s2*,si-1*,si*,si+1*sn*ui s1*,s2*,si-1*,si,si+1*sn*,对一切siSi均成立。纳什于1950年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡。(包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论。在一般情况中,纳什证明保证了我们的均衡分析有意义。三, 博弈实例:单阶段博弈古诺竞争在古诺竞争中,少数厂商通过改变产量来控制价格,以使他们的收益最大化。我们作如下假设:1 1 厂商生产的商品是相同的,消费者没有对某家厂商的偏好。2 2 市场上价格与供给量的函数为p=a-

4、bQ,且供给增加不会导致过剩,而仅仅使价格降低,即厂商可以将生产的产品全部售出。3 3 厂商都是理性的,即面对既定的情况都做出决策使自己利益最大化。4 4 信息是完全的,每个厂商都知道其他厂商时理性的,且每个厂商知道别人是理性的这一事实为所有参与者的共识。 (二)博弈模型的求解与讨论 为了简单起见,我们从一家企业的情况做起:只有一家企业时,目标收益函数u=Q(a-bQ)针对max u 的解为Q0=a/2b,u0=a2/4b当有两家企业时,设产量分别为Q1,Q2,则 p=a-b(Q1+Q2) u1(Q1,Q2)=p*Q1=Qa-b(Q1+Q2) u2(Q1,Q2)=p*Q2=Qa-b(Q1+Q2

5、)纳什均衡点Q1*,Q2*为方程组 / =0 (1) /=0 (2) 的解。整理,得到 2bQ1+bQ2=a (3) bQ1+2bQ2=a (4)解得 Q1*=Q2*=a/3b,对应的u1=u2=a2/9b纳什均衡点是一个极值点,一旦达到该点时双方都没有率先改变的动机。 下面我们讨论纳什均衡点的孤立性,即在对方初始决策不在纳什均衡时,双方能否通过理性的利益最大化策略使博弈形势变化至纳什均衡点。 (1)式表示厂商1的最优函数,在给定对方产量Q时它根据(1)来使自己收益最大, 由(3)式, 厂商最优函数为Q1=(a-bQ2)/2b同样(2)时表示厂商(2)的最优函数,由(4)式,厂商2的最优函数为

6、Q2=(a-bQ1)/2b 这是两条直线,如图,交点E为纳什均衡点。 AB为厂商1的最优函数,CD为厂商2的最优函数, 当双方的初始选择点为A,即Q1=0,Q2=a/b,A在厂商1最优函数上,故厂商1不会改变,但厂商2针对Q1=0的最有点为C,于是双方的决策点转移到C,在C点厂商1会调整自己的产量时双方决策点到F,然厂商2又会调整策略到CD上,以此类推,最后将到达E点,在第一象限的任何初始选择点,按以上分析双方都能经过一系列调整到达E点。在完全信息的假设下,上面这一系列的调整过程在任何一方决策之前就能被预测到,任何一个厂商都回绝的任何一个异于E点的决策都不是在给定条件下最好的选择,于是双方会不

7、约而同的按E点做出产量决策。但是当Q1=Q2=1/2 * a/2b (5) 时双方才能获得最大收益。Q1=Q2=1/2 * a2/4b (6)这一方面说明纳什均衡点并不是一个最好的决策点,另一方面也说明与独家垄断比起来两家厂商的竞争提高了社会效应,社会总产量从a/2b增加到了2/3 * a/b=2a/3b。当厂商数增加至n家时,模型变为 p=a-b*ni=1Qi (7) ui=p*Qi,i=1,2,n (8) / =0 I=1,2n (9)由归纳法可证明(9)可化为方程组(以矩阵形式表示) = a/b * (1) 由线性代数分析可知,该方程组有唯一非零解Q1*=Q2*=Qn*=a/(n+1)b

8、,ui*=a2/(n+1)2b社会总产量为na/(n+1)b。这说明h厂商垄断竞争也必有纳什均衡点,同样方法可证明纳什均衡点不是孤立的,于是理智的各方均会按均衡点做产量决策。另外n越大,竞争越彻底,社会总产量越高。当n很大时,总产量趋于a/b,此时价格p为0,这时价格p为0,此时这个模型不适用。因为在n较小,(一般小于5)时垄断厂商才有能力通过自己的产量来控制价格。厂商们的整体最好选择是Q1*=Q2*=Qn*=a/2nb, 分别能获得收益,a2/4nb。显然n越大,厂商们理性博弈的结果和他们的最好选择点间的差距越大。 (三)多阶段博弈与共谋以上可以看出,作为博弈者的厂商很有必要共谋限制产量,但

9、最好的选择点是不稳定的,率先违约的一方都能获取额外利润,因此需要一些条件来约束双方的行为。另外共谋只有在长期过程中才有效益,双方需要不断检查是否已经违约,并决定自己是否要违约,每次这样的过程就是上文的单阶段博弈。这里的信息条件为每企业在n阶段可以观察的前n-1阶段博弈结果。规则为一旦对方违约,自己就违约,且永不守约,这为双方所共识。我们新引入一个时间贴现因子v,0v1,用来计算以后阶段收益的现值,如已知下一阶段收益为R,则折合到当阶段相当于收益为vR。一开始双方约定共同生产a/4b,每阶段收益为a2/8b,一直守约,双方的收益为a2(1+v+v2+)/8b=a2/8(1-v)b (10)对先违

10、约的一方,根据对方a2/4b的产量,由(3)和(4),它的最优产量为3a/8b,该阶段收益为a-b(3/8+1/4)a/b*3/8*a/b=9a2/64b (11)此后双方都明白共谋破裂,均按a/3b的均衡产量生产。设一方在N阶段违约,则收益为a2(1+v+v2+vN-1)/8b+9vN/64*a2/b+vN+1*a2/(1-v)ab (12)(12)-(10),得 vN/64-vN+1/72(1-v)*a2/b解得 当v 式 (16) , B就没有动机在第一阶段背离。 如果B在第一阶段不合作,在第二阶段合作,第三阶段不合作,则他的各阶段期望收益为 u1= 5P/36+(1-P)/9 u2=5

11、/48 u3=5P/36+(1-P)/9 总期望收益为P/18+47/144 恒小于(16)式,此时B也没有动机在第一阶段背离。 综上,只要A有20%的可能为投桃报李型的,B在前两阶段就没有背离合作的动机。 对于A,一旦他在第一阶段就背离合作,那么自第二阶段起A为理性的就成为博弈双方的共识,此时他的期望收益为5/36+1/9+1/9=13/36 而A如果始终合作,其均衡收益为1/8+1/8+1/9=13/36 所以在三阶段时A是否要背离合作无所谓,不过这只是由于本问题数据特殊性的巧合。多阶段的扩展 从上面的三个阶段扩展就可以看出,随着阶段数的增多,每个博弈者更多的会考虑长久的收益情况,而非眼前

12、。这意味着之需要一个很小的信誉概率P,就有可能约束对方不发生背叛的行为。 当共有T阶段博弈时,我们可以用归纳法证明理性的双方在从1到T-2阶段选择合作,而在T-1和T阶段按照上文讨论的两回合博弈行动。假设任何t(tT)博弈中上述假设均成立。 如果A在tT-1的任意阶段不合作,则他是理性的便在以后的阶段成为共识,他在t期的收益为5/36,以后均为1/9,总收益为 (t-1)/8 + 5/36 + (T-t)/9 而A的均衡收益为从1到T-2阶段每一阶段均为1/8,T-1的收益为5/36,最后一期为1/9。显然提前违约的收益小于均衡收益。 对于B, 由两阶段博弈可知, B没有在前T-2阶段合作,T

13、-1阶段不合作的动机,B只可能再tT-3的阶段背离合作。 一旦B在t阶段背离合作, 则无论投桃报李的还是理性的A都将在t+1阶段不合作, 于是在前t+1阶段B无法确认A是否为理性,从t+2阶段起双方的博弈等同于一个T-(t+1)阶段的博弈。 由归纳假设,这后一部分博弈中双方会合作到T-2阶段,然后按照上文的两阶段博弈进行。B的总收益为 u= 1/8 * (t-1) + 5/36 + 5/48+T-2-(t+2)+1*1/8 + P/8 +(1-P)*5/48 +5P/36 + (1-P)/9 这小于B从1到T的均衡收益(T-2)/8+ P/8+ 5(1-P)/48 + 5P/48 + (1-P

14、)/9 所以B也没有只背离一次的动机。 更为一般的情况是在前(T-3)次博弈中B有多次的背离与合作,则按以上方法多次使用归纳法,可以发现获得的期望收益更少。其根本原因是率先背约者无法判断对方的真正类型,所以无法保证自己的利益能够最大化,而一旦约定破裂后修复的成本很高,使得背信弃义的额外收益比双方合作来的少。 ( 5/36+5/48)2*1/8 ) 这样的模型就使得共谋更有约束力。 小结与进一步的研究本文主要为静态博弈问题建立了数学模型,并用他分析了一个实例:垄断市场上的古诺竞争和共谋。在静态博弈中,数学上的极大值就是博弈的均衡解。理性决策迫使人们的行为向利益极大值点移动,而信息问题是理性决策最重要的前提条件,可以说不同的信息条件可以推导出不同的理性决策。本文讨论的是最完美的信息假设:完全信息。它不仅指双方彼此了解对方的情况,而且彼此知道对方了解自己情况这一事实,以此类推,等等,最后形成了一个无穷的递归链。最后讨论的投桃报李模型不是完全信息的,但是它也有一套为双方所共知的评判标准来约束双方的决策。总之,本文讨论的模型是双方都知道规则的情况下进行的博弈,这是一个对实际博弈相当理想化的简化。在这样的简化下,如何妥善的处理无穷信息递归链,是个有待进一步研究的问题。而就垄断这个经济问题本身而言,本模型最大的理想化就是价格与供给量成一次函数关系,进一步可将这个函数关系拟合得更符合实际,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论