北大微观经济学课件博弈论_第1页
北大微观经济学课件博弈论_第2页
北大微观经济学课件博弈论_第3页
北大微观经济学课件博弈论_第4页
北大微观经济学课件博弈论_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、北大微观经济学课件博弈论到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响。其实,一个人的行为总是受到他人行为的影响。人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾。?博弈论(game theory)为解决这些问题提供了有力工具。博弈论以人的理性为基本假定,强调策略性一种普遍的行为现象。这种现象的广阔背景是市场中的竞争与合作。20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的相互影响和制约方面取得了重大进展。 大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究。2猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下

2、,远离踏板的食槽端就会落下食物。若一猪去踩踏板,另一猪就会等在槽边抢先吃到食物。若小猪去踩,大猪会在小猪跑到食槽前吃光食物;若大猪去踩,大猪还有机会在小猪吃完之前抢吃到食物的一半。这两头猪会采取什么这两头猪会采取什么策略呢策略呢?答案答案:小猪舒服地等在槽边,大猪要为争取残羹奔忙于踏板和食槽之间。原因:对小猪而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,当然不去踩了。反观大猪,明知小猪不为,那么自己为之总还是要比不为强。3 智猪故事揭示了大、小企业的关系。当企业定位于“大猪”时,应选择“主动获得”之优势策略;当定位于“小猪”时,应选择“等待获得”,这也是优势策略。比如,研究开发、为新产品

3、做广告,这对大企业值得,对小企业是得不偿失的。完全市场中,作为一个理性企业,最可能的情况是小企业把精力花在模仿上,或等待大企业打开市场后出售廉价产品。而大企业应当以主动的态度来开拓市场。 智猪故事还给竞争中的弱者以等待为最佳策略的启发。博弈中,每一方都想方设法攻击对方、保护自己,最终取得胜利;同时,对方也是一个与你一样的理性人,他会这么做吗?这就需要更高明的智慧。 任何理性企业都必然会像智猪那样,总是选择优势策略。 4从前有两个饥饿的人从一位智者那里得到了一根鱼竿和一篓鲜鱼。 得到那篓鲜鱼的人在原地把鱼煮熟吃完,解决了饥饿问题,可很快又感到肚内空空,最终饿死在空鱼篓旁边。 另外一个得到鱼竿的人

4、提着鱼竿朝向遥远的大海走去,当他终于来到海边的时候,也用尽了最后一点力气而死去。不久之后,同样是两个饥饿的人,也从智者那里得到了一根鱼竿和一篓鲜鱼。不同的是: 他们一起去寻找大海。每到饥饿的时候,就从鱼篓中拿出一条鱼吃。 当他们最终来到海边的时候,这两个人就拿着那根鱼竿开始了捕鱼为生的日子!5。比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间 “上有政策,下有对策” ;金融监管与创新犹如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐。当所有当事人都拿定主意作出决策时,博弈的局势便确定下来。是要。:在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何

5、采取行动?6l 基本要素基本要素:局中人(players)、策略(strategies)、收益(payoffs)局中人局中人以策略策略定胜负,以收益最大化收益最大化为目标。l 标准形式标准形式(normal form):G = (Xi, fi)n,其中 Xi 为局中人 i 的策略集合策略集合, fi : S R 为局中人 i 的收益函数收益函数(i = 1,2,n)。 S = X1 X2 Xn 叫做博弈G 的局势集合局势集合。 局势局势:策略 n 元组 (x1, x2, xn) ( xiXi,i = 1,2,n)。l博弈的分类博弈的分类:一般按照博弈的基本要素进行分类。l 按人数分:二人博弈二

6、人博弈、多人博弈多人博弈l 按策略分:有限有限(策略策略)博弈博弈、无限无限(策略策略)博弈博弈l 按收益分:常和常和( (零和零和) )博弈博弈、变和博弈变和博弈l 按性质分:非合作博弈非合作博弈、合作博弈合作博弈l 按次序分:同时移动博弈同时移动博弈、先后先后移动博弈移动博弈(序贯博弈序贯博弈):以以上分类方式的结合上分类方式的结合,比如二人零和有限博弈。7 我们先以矩阵博弈矩阵博弈为重点,建立博弈论的基本分析框架。:二人零和有限博弈二人零和有限博弈,这是最简单的博弈形式。:甲与乙利益冲突,一方的收益就是对方的损失。X =x1, x2, xm;Y =y1, y2, ynS = X Y =(

7、xi, yj): i =1,2,m ; j =1,2,nf : S R;g : S R零和零和:f (xi, yj) + g (xi, yj) = 0 (i =1,2,m ; j = 1,2,n):G = (X, f ; Y, g) = (X,Y, f ) :甲的收益矩阵收益矩阵 f 即可表示矩阵博弈。8局中人的目标局中人的目标:选择合适的策略以使自己的收益(对方的损失)达到最大,也即让对方的收益(自己的损失)达到最小。 假定假定:甲和乙彼此了解对方的收益矩阵,双方都清楚自己的收益就是对方的损失。l 博弈过程博弈过程:每个人都根据对方的行动来确定自己的行动,每个人都不断地在对方选定了策略的情况

8、下来调整自己的策略以使自己的收益达到最大。l 博弈结局博弈结局:当策略调整达到这样的局势 (xh, yk) 使得 xh 是甲在乙选定yk的情况下的收益最大策略,同时yk是乙甲在选定xh的情况下的收益最大策略的时候,双方策略调整宣告结束,博弈得以确定。此时的局势(xh, yk)就是古诺均衡古诺均衡(最优解最优解),即9依据定义,矩阵博弈 f 的古诺均衡古诺均衡正对应于矩阵 f 的鞍点鞍点。n 鞍点定理(最大最小原理最大最小原理) 是矩阵 的鞍点(即局势(xh, yk)是矩阵博弈 f 的古诺均衡)当且仅当当且仅当下述等式成立:u从矩阵各行的最小元中找出最大元,称为最大最小元最大最小元;v从矩阵各列

9、的最大元中找出最小元,称为最小最大元最小最大元;w如果最大最小元最大最小元与与最小最大元最小最大元一致一致,那么该元素就是鞍点,代表矩阵博弈的古诺均衡古诺均衡。 x1y1x2x4x3y3y4y5YXz鞍鞍点点古诺均衡古诺均衡y210 乙乙甲甲作广告作广告不作广告不作广告作广告作广告3030不作广告不作广告2020. 广告竞争:广告竞争:存在古诺均衡存在古诺均衡单位单位:万元万元. 便便士匹配士匹配:没有古诺均衡没有古诺均衡 甲、乙独立决定出示硬币正或反面。若两人出示相同,甲赢乙1元;若出示相反,乙赢甲1元。甲的收益表如下:乙乙甲甲出示正面出示正面出示反面出示反面出示正面出示正面11出示反面出示

10、反面1111 只有当收益矩阵的最大最小元与最小最大元一致时,矩阵博弈才有古诺均衡(最优解)。最大最小元和最小最大元总存在,但二者未必一致,从而矩阵博弈可能没有最优解。例如,便士匹配博弈没有最优解。l 矩阵博弈可能没有最优解的真正原因是什么?矩阵博弈可能没有最优解的真正原因是什么?稳妥策略稳妥策略甲的稳妥策略甲的稳妥策略:甲的收益矩阵的最大最小元;乙的稳妥策略乙的稳妥策略:甲的收益矩阵的最小最大元。问题的答案问题的答案:原因在于稳妥策略可能不稳定稳妥策略可能不稳定。不稳定的稳妥策略不能使博弈中的策略调整过程结束。即使甲和乙都选择稳妥策略,但若稳妥策略不稳定,那么博弈就无法达到古诺均衡。12 为了

11、消除古诺均衡未必存在的困惑,人们提出使用混合策略混合策略,即一种连当事人自己都不知道会采取什么行动的策略,对手就更不得而知了,从而使得局中人的行动变得相当诡异。考虑二人有限博弈二人有限博弈G = (X, f ; Y, g): X = x1, x2, xm:甲的纯策略集合; Y = y1, y2, yn:乙的纯策略集合; S = X Y :博弈 G 的纯局势集合。混合策略混合策略(mixed strategies):以一定的概率采取一种策略。 甲的混合策略集合: 乙的混合策略集合: G 的混合局势集合: 甲的预期收益: 乙的预期收益:混合扩充混合扩充:博弈 叫做 G 的混合扩充混合扩充。13n定

12、理 博弈 G = (X, f ; Y, g) 为常和博弈 当且仅当当且仅当 G 的混合扩充 为常和博弈。当G 是常和博弈时,G 与 具有相同的收入常和。因此,矩阵博弈的混合扩充仍为二人零和博弈。l矩阵博弈矩阵博弈 G 的混合均衡的混合均衡:是指 G 的混合扩充 的古诺均衡。即,G的混合局势( p*,q*)叫做 G 的混合均衡混合均衡(混合最优解混合最优解)是指( p*,q*)满足如下条件:n 定理(混合均衡的存在性混合均衡的存在性) 任何矩阵博弈都有混合均衡任何矩阵博弈都有混合均衡。矩阵博弈 f 的混合均衡正对应于函数 Ef 的鞍点。n 鞍点定理(最小最大原理最小最大原理) ( p*, q*)

13、是矩阵博弈G 的混合均衡(即函数 Ef 的鞍点) 当且仅当当且仅当 下述等式成立: 14便士匹配博弈中,甲的收益矩阵为寻找混合均衡,就是去找出 使得 15l 博弈值博弈值: 混合均衡的存在性及鞍点定理,保证了V(G)是良好定义的,并且当( p*,q*)是混合均衡时,V(G) =Ef (p*,q*)。 博弈值在解释均衡及求解混合均衡方面相当有用。 还可通过V(G) 证明矩阵博弈的混合均衡集的下述特点。 令n定理 对于甲和乙的矩阵博弈G = (X, Y, f )来说,T = T1T2 且混合均衡集 T 是空间 的非空有界闭凸子集,从而甲的混合最优策略集T1是 的非空有界闭凸子集,乙的混合最优策略集

14、T2 是 的非空有界闭凸子集。 16矩阵博弈仅仅是一类简单又典型的二人常和博弈,经济学中遇到的博弈往往都是变和博弈。矩阵博弈理论之所以重要,是因为它为研究变和博弈提供了很好的分析思路和框架。 现在,我们来在矩阵博弈理论的基础上建立一般的二人博弈理论。 l 二人博弈 : 古诺均衡古诺均衡 二人有限博弈:策略集合 X 和Y 为有限集合。 二人无限博弈:策略集合 X 和 Y 为无限(任意)集合。l 二人博弈的重复:博弈不只进行一次,而是要进行多次。17l 古诺均衡古诺均衡应对 yj 的上策上策 xi( j):当乙采取 yj 时,甲采取 xi( j) 是最好的,即 f i( j) j 是 f 的第 j

15、 列的最大元: 。应对 xi 的上策上策 yj(i):当甲采取 xi 时,甲采取 yj(i) 是最好的,即 g i j(i) 是 g 的第 i 行的最大元: 。甲的上上策上上策 xi*:不论乙采取什么策略,xi*都是甲的上策,即 f 的第i*行最大: 。乙的上上策上上策 yj*:不论甲采取什么策略,yj*都是乙的上策,即 g的第j*列最大: 。l 占优解占优解(xi*, yj*): xi*是甲的上上策, yj*是乙的上上策。18l 最大最小原理只适用于矩阵博弈,一般的二人有限博弈的求解只能采取通用方法。把局中人甲和乙的收益矩阵写在同一张表中。圈出甲的收益矩阵各列的最大元。圈出乙的收益矩阵各行的

16、最大元。收益表中同时出现两个圈的位置即为古诺均衡古诺均衡。如果没有一个位置出现两个圈,就说明该博弈的古诺均衡不存在。如果在甲的收益矩阵的某一行上全部带圈,则就出现了甲的上上策;同样,若在乙的收益矩阵的某一列上全部带圈,则就出现了乙的上上策。如果既找到了甲的上上策,又找到了乙的上上策,那么也就找到了博弈的占优解占优解。否则,博弈没有占优解。19 囚徒难题囚徒难题乙乙甲甲合作背叛合作3304背叛4011古诺均衡古诺均衡上上上上策策上上策上上策智猪博弈智猪博弈小猪小猪大猪大猪去踩踏板 不去踩去踩踏板7355不去踩10000上上策上上策均衡均衡次优均衡次优均衡剔除剔除乙乙甲甲y1y2y3y4x1121

17、582623141811x21820151611191517x315101849221714x41712131814171920找出下列博弈的古诺均衡找出下列博弈的古诺均衡古诺均衡古诺均衡(x2, y1)(x4, y4)无上上策无上上策20 ,预期收益都为2/3。 G = (X, f ; Y, g)的混合扩充:G 的混合均衡( p*, q*):n 角谷不动点定理 设 T 是有限维欧氏空间的非空有界闭凸子集,F: T T 是集值映射。若 F 上半连续且对任何xT,F(x)都是非空闭凸集,那么F 必有不动点,即(xT )(xF(x)。n 定理(混合均衡存在性混合均衡存在性) 任何二人有限博弈都有混

18、合均衡。卡夫卡夫茹达茹达话剧足球话剧2100足球0012. :性别差异导致收益差异21n假设G1 X 是拓扑向量空间V1的非空紧凸子集;乙的策略集合Y是 拓扑向量空间V2的非空紧凸子集;故局势集合 S 是拓扑向量空间V1 V2 的非空紧凸子集。n假设G2 甲的收益函数 f (x,y)连续且关于策略变元 x 弱拟凹;乙的收益函数g(x,y)连续且关于策略变元 y 弱拟凹。G = (X, f ; Y, g):X 和Y 为无限集合,S = X Y 。二人有限博弈的混合扩充是二人无限博弈,二人无限博弈的混合扩充依然是二人无限博弈。因此,二人无限博弈是二人博弈的一般情形,无需再讨论其混合扩充。l古诺均衡

19、古诺均衡(x*, y*):XYzf (x*, y*)古诺均衡古诺均衡g (x*, y*)x*y*22n 范格不动点定理 设T是拓扑向量空间的非空紧凸子集,集值映射 F : T T 上半连续且对任何 xT,F(x) 都是非空闭凸集。则 F 有不动点,即(tT)(tF(t)。n 定理(古诺均衡的存在性) 任何满足假设任何满足假设G1和和G2的二人无限博弈都有的二人无限博弈都有古诺均衡古诺均衡。l反应函数反应函数 甲对乙的反应甲对乙的反应:当乙采取策略 y时,甲的应对上策上策 x=(y)为:f (x, y) = max f (x, y): xX 。 (y):甲的反应函数反应函数。乙对甲的反应乙对甲的

20、反应:当甲采取策略 x时,乙的应对上策上策 y=(x)为:g(x, y) = max g(x, y ): y Y 。(x):乙的反应函数反应函数。l 古诺均衡古诺均衡(x*, y*):23 比如,一般情形一般情形:找出反应曲线的交点,如右图所示。特殊情况特殊情况:X 和 Y 都是实数区间,收益函数 f : XR 和 g : Y R可微。于是,反应函数由下述方程确定:YXx1x2x3x4x5x6x7x8y1y2y3y4y5古古诺诺均均衡衡甲的反应曲线甲的反应曲线乙的反应曲线乙的反应曲线24虽然人们对二人博弈的最优解作了深入研究,但让局中人找到最优解却不是一件容易的事情,需要反复实践和锻炼,就好像

21、棋手下棋一样,需要反复不断地下,才能越来越接近最优解。可见,博弈是需要重复进行。但到目前为止,所研究的博弈都是一次性博弈。因此,有必要研究博弈的重复。事实上,当博弈重复进行时,其最优结局可能会与一次性博弈的均衡有所差异。下面以囚徒难题博弈囚徒难题博弈为例,来说明重复博弈的最优解。我们将分两种情况讨论:l 博弈重复进行有限次博弈重复进行有限次l 博弈重复进行无限次博弈重复进行无限次25每个局中人都知道博弈将重复一个固定的次数。 最后一次博弈中局中人的推理最后一次博弈中局中人的推理:这是最后一次行动,每个人都认为此时是在进行一次性博弈,因而古诺均衡的标准逻辑得以应用,结果局中人双方选择“背叛”。倒

22、数第二次博弈倒数第二次博弈:这里似乎每个人都重视合作,可以向对方发出“善意”的合作信号,以便在下次博弈中继续合作。但理性的局中人清楚,最后一次博弈中对方必然背叛。因此他在倒数第二次博弈中选择合作就没有优势,故要选择背叛。倒数第三次博弈倒数第三次博弈:局中人的推理与倒数第二次一样,结果在倒数第三次博弈中,局中人依然选择背叛。 l 结局结局:逆向归纳逆向归纳(backward induction)可知,每次博弈中双方都要“背叛”,有限次重复博弈的最优解依然是古诺均衡。n 古诺均衡是局中人双方的短期利益所在古诺均衡是局中人双方的短期利益所在。26 每个局中人都知道,博弈要无限重复进行下去。每个局中人

23、的策略都是一个函数序列,表明每个人在每个阶段的策略选择都是此阶段之前的博弈历史的函数。这样,局中人的收益是各阶段收益的贴现值之和(向时刻0贴现): 。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。 l只要贴现率r 2,就有RT ti)。l核心最优解核心最优解:是指不存在反对者联盟的收入分配。只有这种收入分配,才能被所有局中人接受。l G 的核心核心(core) C(G):是指由所有核心最优解组成的集合 。l 占优分配占优分配:对于收入分配 r 和 t, r A t (在联盟在联盟 A 中中 r 比比 t 占优占优)是指V(A ) iA ri 且 ri ti 对一切 iA 成立;rt ( r 比比 t 占优占优)是指存在联盟 A 使得r A t。占优关系 A 具有传递性,但占优关系 不具有传递性。 若 r A t 且 A ,则 A I 且 A 不是单人联盟。 对任何收入分配 r= (r1, r2, rn),rC(G) 当且仅当当且仅当 iA ri V(A)对一切非空联盟 A 成立。当 G 为零和本质博弈时,C(G) = 。36 迄今为止,我们讨论的博弈都具有简单的动态结构,即它们是一次性博弈,或者是一次性博弈的重复序列,而且还具有简单的信息结构,即每个局中人

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论