博弈论概述培训_第1页
博弈论概述培训_第2页
博弈论概述培训_第3页
博弈论概述培训_第4页
博弈论概述培训_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论概述培训在决策相互影响的环境中,每个企业都在努力预测其它企业的决策,经理们必须学会战略地思考战略地思考,以做出“能做出”的最好决策在战略决策时,经理们应该学会站在竞争对手的角度去预测或者推测对手的反应而博弈论刚好提供了一个在相互依存的情况下如何进行战略决策的指导工具博弈论帮助管理者注重竞争者、消费者和供应商的反应,并侧重如何通过影响他们的选择来提升长期利益在确实应用博弈论之前,经理们必须了解自己的行业,如行业的进入成本、需求函数、收益结构和成本曲线等主要内容 博弈的概念 博弈论的发展史 博弈问题的刻画与分类 静态博弈与均衡 动态博弈与策略行动博弈的概念 一些个人、队组或其他组织,面对一定

2、的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,然后从中获得各自相应结果的过程 常见的博弈活动如桥牌、下棋、赌博等博弈论的发展史对具有策略依存特点的决策问题的研究可以上溯到18世纪以前,如古诺模型和伯川德模型20世纪20年代,法国数学家Borel用最佳策略的概念研究了下棋等具体的决策问题,试图建立应用数学的一个分支,可惜没有完成博弈论的体系建设,但引起了其他数学家的注意二战期间,博弈的思想方法被用于军事领域和战事活动中,初步显示了威力1944年,数学家John von Neumann和经济学家Oskar Morgenstern合著博弈论和经济

3、行为标志着博弈理论的初步形成近几十年来,博弈论得到大发展。1994年,长期致力于博弈理论和应用研究的Nash, Harsanyi及Selten同时获得诺贝尔经济学奖,表明该学科的重要性;1996年,从信息经济学角度研究博弈论的J. Mirrlees也获得了经济学奖,博弈论已经成为西方经济理论的主流之一 理论上,由于新古典经济学围绕价格制度研究理性人行为时的基本缺陷是不考虑理性人之间的相互影响(如竞争市场和信息对称),博弈论才得以发展博弈问题的刻画与分类博弈问题的刻画 博弈问题通常有三个方面的内容:参与博弈的博弈者博弈者、每个博弈者可能采取的行动(或策行动(或策略)略)、每一种行动(或策略)组合

4、情况下每个博弈者所获得的支付支付坦白不坦白坦白-4,-4-1,-8不坦白-8,-1-2,-2囚犯2的策略囚犯1的策略博弈问题的刻画与分类(续1)博弈问题的分类 合作与非合作博弈 -是否能通过谈判达成有约束的契约形成合作(团体理性) 静态与动态博弈 -同时行动(独立决策)还是先后(或重复)行动 完全信息与不完全信息博弈 -关于对手特征、策略和支付的知识是否完全 静态动态完全信息完全信息静态博弈完全信息动态博弈不完全信息不完全信息静态博弈不完全信息动态博弈博弈的分类行动顺序信息博弈问题的刻画与分类(续2)研究博弈论的目的 通过对博弈者行为的分析,预测博弈的结果(即博弈双方最终选择的行动)预测博弈的

5、结果(即博弈双方最终选择的行动)博弈的表示形式 标准形式(Normal Form Game) 扩展形式(Extensive Form Game)标准形博弈的定义 (1)N个博弈者(player),表示为I = 1, 2, , N (2)第i个博弈者的行动action(或策略strategy)ai 组成自己的行动集(或策略集)Ai=ai1, ai2, , aik ,则a = (a1, a2, , ai, , aN)称为该博弈的行动组合(或策略组合)。简化讨论时用a = (ai, a-i)表示 (3)博弈者i的支付函数(payoff function)为i(a)Normal Form Game A

6、 Normal Form Game consists of:PlayersStrategies or feasible actionsPayoffs博弈问题的刻画与分类(续3)标准形博弈的定义(续) 博弈者:国家1、国家2 每个博弈者的行动:战争、和平; 每个博弈者的行动集:战争,和平 博弈的行动组合:(和平,和平)、(和平、战争)、(战争,和平)、(战争,战争) 每个博弈者的支付: 1(和平,战争) = PeaceWarPeace 2,2-2,3War3,-2-1,-1战争与和平的博弈(或冷战博弈)国家1国家2静态博弈与均衡有关静态博弈中博弈者行为的假定 理性博弈者 -追求支付最大化 完全信

7、息 -对策略、策略组合及相关支付完全了解 独立决策 -无勾结(不管是明的还是暗的)静态博弈(或同步决策) 在寡头市场,当经理们必须在无法知道竞争对手的决策的情况下做出自己的决策时,同步决策博弈发生。同步不必同时问题:如何预测对手的行动?问题:如何预测对手的行动? 静态博弈与均衡(续1)优势行动与优势行动均衡(续) (1)优势行动: 无论其他博弈者采取什么行动,博弈者i采取的行动aik总能获得最大支付,则行动aik称为该博弈者的优势行动(dominant action) (2)优势行动均衡:所有博弈者优势行动组成的均衡(如果存在的话) (3)如何寻找优势行动和优势行动均衡 双方均存在优势行动做广

8、告不做广告做广告 10,515,0不做广告6,810,2广 告 博 弈寡头1寡头2Dominant Strategy Regardless of whether Player 2 chooses A, B, or C, Player 1 is better off choosing “a”! “a” is Player 1s Dominant Strategy!StrategyABCabcPlayer 2Player 112,1111,1214,1311,1010,1112,1210,1510,1313,14静态博弈与均衡(续2)优势行动与优势行动均衡(续) (3)如何寻找优势行动和优势行动均

9、衡(续1) 只有一方存在优势行动按钮(涨价)等待(不涨价)按钮 (涨价)5,14,4等待(不涨价)9,-10,0 Boxed Pigs(智猪博弈或价格博弈)小猪大猪Putting Yourself in your Rivals Shoes What should player 2 do? 2 has no dominant strategy! But 2 should reason that 1 will play “a”. Therefore 2 should choose “C”.StrategyABCabcPlayer 2Player 112,1111,1214,1311,1010,11

10、12,1210,1510,1313,14连续排除劣势策略 两者都没有优势策略,怎么办?StrategyABCabcPlayer 2Player 1100,10090,11050,120110,4080,8045,50120,3050,3540,40连续排除劣势策略(续) 两者都没有优势策略,怎么办?StrategyABCabcPlayer 2Player 190,11050,12050,3540,40Key Insights Look for dominant strategies Put yourself in your rivals shoes 寻找劣势策略并排除之静态博弈与均衡(续3)优

11、势行动与优势行动均衡(续) (3)如何寻找优势行动和优势行动均衡(续2) 双方都不存在优势行动或劣势 -此时该怎么办?soccerballetsoccer2,10,0ballet0,01,2 Battle of the Sexes(性别大战)女男静态博弈与均衡(续4)纳什均衡(Nash Equilibrium) 给定对手策略选择的情况下,博弈者选择的最好行动所组成的均衡就是纳什均衡则若对),(a),(),(N)1,2,.,i(iiiiiiiiiaaaaaaA Market Share Game Two managers want to maximize market share Strateg

12、ies are pricing decisions Simultaneous moves One-shot gameMarket-Share Game EquilibriumStrategyP=$10P=$5P = $1P=$10.5, .5.2, .8.1, .9P=$5.8, .2.5, .5.2, .8P=$1.9, .1.8, .2.5, .5Manager 2Manager 1Nash EquilibriumKey InsightGame theory can be used to analyze situations where “payoffs” are non monetary

13、!We will, without loss of generality, focus on environments where businesses want to maximize profits.Hence, payoffs are measured in monetary units.静态博弈与均衡(续5)纳什均衡(续) 如何预测Nash Equilibrium ?soccerballetsoccer2,10,0ballet0,01,2 Battle of the Sexes女男静态博弈与均衡(续6)纳什均衡(续) 如何预测Nash Equilibrium (续1)?咸早点甜早点咸早

14、点-4,-48,8甜早点8,8-4,-4餐馆博弈餐馆A餐馆B静态博弈与均衡(续7)纳什均衡(续) 如何预测Nash Equilibrium (续2)?进退进-3,-32,0退0,20,0Chicken Game(斗鸡博弈)AB静态博弈与均衡(续8)纳什均衡(续) 如何预测Nash Equilibrium (续3)?默许斗争进入40,50-10,0不进入0,3000,300市场进入阻扰在位者进入者A Coordination Problem: Three Nash Equilibria!StrategyABC10,00,0$10,$102$10,$100,00,030,0$10, $100,0P

15、layer 2Player 1Key Insights Not all games are games of conflict. Communication can help solve coordination problems. Sequential moves can help solve coordination problems.静态博弈与均衡(续9)纳什均衡(续) 不存在纯策略纳什均衡的博弈足球电影足球2,00,3电影0,21,0 闹别扭的情人(性别大战)女男静态博弈与均衡(续10)最大最小策略 有限理性或不完全信息下的均衡进攻退守退守2,12,2进攻-500,13,2 攻防博弈A

16、B最大最小策略是一种保守的策略,而不是利润最大化策略关键就在于B博弈者对A博弈者的理性了解不够关于利润最大化前提下静态博弈的小结在同步决策的博弈中预测对手的行动时,战略思考的本质是站在对方立场上寻找稳定的行动组合预测的具体思路是:优先寻找对方或自己的优势策略,其次排除自己或对方的劣势策略,再其次寻找纳什策略,通过这种方式获得的行动组合具有“战略稳定性”特征纳什均衡之所以稳定,是因为双方都相信彼此都作了最好决策,没有一方可以通过改变行动以改善状况;非纳什行动之所以不被选择的原因是存在作弊动力作弊动力:至少有一个企业可以仅仅改变自己的行动就会更好如果存在多个纳什行动组合,那么,预测没有办法进行(即

17、:虽然知道出现某一个结局后一定是稳定的,但是不知道哪个结局会出现),此时存在协调问题在静态博弈中,囚徒困境反映了寡头市场合作的困难本质囚徒困境反映了寡头市场合作的困难本质动态博弈的扩展形式不扩大小规模扩大大规模扩大不扩大18,1815,209 ,18小规模扩大20,1516,168 ,12大规模扩大19, 912, 80 , 0 同时行动的产能博弈中的纳什均衡厂1厂2动态博弈的扩展形式(序贯行动或先后的决策树)厂2厂1厂1厂1不扩大小规模扩大小规模扩大大规模扩大不扩大小规模扩大小规模扩大大规模扩大不扩大不扩大小规模扩大大规模扩大不扩大小规模扩大大规模扩大大规模扩大18,189 ,1820,15

18、16,16 8 ,1218, 912, 80 ,015,20Case 1:An Advertising Game注意不同决策环境下决策结果的异同及其机理注意不同决策环境下决策结果的异同及其机理Two firms (Kelloggs & General Mills) managers want to maximize profitsStrategies consist of advertising campaignsSimultaneous moves or One-shot interactionFinitely Repeated interactionInfinitely Repea

19、ted interactionEquilibrium to the One-Shot advertising GameStrategyNoneModerateHighNone12,121, 20-1, 15Moderate20, 16, 60, 9High15, -19, 02, 2General MillsKelloggsNash EquilibriumCan collusion work if the game is repeated 2 times?StrategyNoneModerateHighNone12,121, 20-1, 15Moderate20, 16, 60, 9High1

20、5, -19, 02, 2General MillsKelloggs No (by backwards induction).In period 2, the game is a one-shot game, so equilibrium entails High Advertising in the last period.This means period 1 is “really” the last period, since everyone knows what will happen in period 2.Equilibrium entails High Advertising

21、by each firm in both periods.The same holds true if we repeat the game any known, finite number of times.Can collusion work if firms play the game each year, forever? Consider the following “trigger strategy” by each firm: “Dont advertise, provided the rival has not advertised in the past. If the ri

22、val ever advertises, “punish” it by engaging in a high level of advertising forever after.” In effect, each firm agrees to “cooperate” so long as the rival hasnt “cheated” in the past. “Cheating” triggers punishment in all future periods.Suppose General Mills adopts this trigger strategy. Kelloggs p

23、rofits?Cooperate = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + = 12 + 12/iStrategyNoneModerateHighNone12,121, 20-1, 15Moderate20, 16, 60, 9High15, -19, 02, 2General MillsKelloggs Value of a perpetuity of $12 paid at the end of every yearCheat = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 + = 20 + 2/iKelloggs Gain

24、to Cheating Cheat - Cooperate = 20 + 2/i - (12 + 12/i) = 8 - 10/i Suppose i = .05 Cheat - Cooperate = 8 - 10/.05 = 8 - 200 = -192 It doesnt pay to deviate.Collusion is a Nash equilibrium in the infinitely repeated game!Case 2: Bargaining Simultaneous-MoveManagement and a union are negotiating a wage

25、 increase.Strategies are wage offers & wage demandsSuccessful negotiations lead to $600 million in surplus, which must be split among the partiesFailure to reach an agreement results in a loss to the firm of $100 million and a union loss of $3 millionSimultaneous moves, and time permits only one

26、-shot at making a deal.The Bargaining Game in Normal FormStrategyW = $10W = $5W = $1W = $10100, 500-100, -3-100, -3W=$5-100, -3300, 300-100, -3W=$1-100, -3-100, -3500, 100UnionManagementThree Nash Equilibria!StrategyW = $10W = $5W = $1W = $10100, 500-100, -3-100, -3W=$5-100, -3300, 300-100, -3W=$1-1

27、00, -3-100, -3500, 100UnionManagementFairness: The “Natural” Focal Point-焦点解StrategyW = $10W = $5W = $1W = $10100, 500-100, -3-100, -3W=$5-100, -3300, 300-100, -3W=$1-100, -3-100, -3500, 100UnionManagementSingle Offer Bargaining连续行动的博弈 Now suppose the game is sequential in nature, and management get

28、s to make the union a “take-it-or-leave-it” offer. Analysis Tool: Write the game in extensive form Summarize the players Their potential actions Their information at each decision point The sequence of moves and Each players payoffFirm1051UnionUnionUnionAcceptReject100, 500-100, -3AcceptAccept300, 3

29、00-100, -3RejectReject500, 100-100, -3There are 3 Nash quilibrium Outcomes!Firm1051UnionUnionUnionAcceptReject100, 500-100, -3AcceptAccept300, 300-100, -3RejectReject500, 100-100, -3Only 1 Subgame-Perfect Nash Equilibrium Outcome!Re-CapIn take-it-or-leave-it bargaining, there is a first-mover advant

30、age.Management can gain by making a take-it or leave-it offer to the union. But.Management should be careful, however, real world evidence suggests that people sometimes reject offers on the the basis of “principle” instead of cash considerations.Case 3: Pricing to Prevent Entry Two firms: an incumb

31、ent and potential entrant The game in extensive formTwo Nash EquilibriaEntrantOutEnterIncumbentHardSoft-1, 15, 50, 10One Subgame Perfect EquilibriumEntrantOutEnterIncumbentHardSoft-1, 15, 50, 10Insights Establishing a reputation for being unkind to entrants can enhance long-term profits It is costly

32、 to do so in the short-term, so much so that it isnt optimal to do so in a one-shot game.讨论讨论 随着市场范围不断扩张,劳动分工管越来越细,因此,团队合作在企业的生存发展中扮演的角色越来越重要。 如何减少团队小组成员的搭便车行为(Free-riding)并增加合作?动态博弈与策略行动动态博弈与静态博弈的差异-个体理性能够和集体理性一致? 动态博弈不是一次性博弈,是一种先后(或重复)行动的博弈,可以产生静态博弈情况下不可能出现的结果(如合作),也可以采取各种策略以取得竞争的优势定价为4定价为6定价为424,

33、2440,8定价为68,4032,32寡头1的定价策略寡头2的定价策略(1)无限次重复重复博弈中,如果竞争者采取”tit-for-tat” strategy或触发战略,则可能获得合作的结果(2)在有限次重复博弈中,能否产生合作的结果取决于声誉效应和稳定的合作预期(3)现实中,若寡头生产的产品生命周期比较长,产品的生产成本变化不大,竞争的 企业比较少,则容易在竞争者之间形成合作。否则合作很难形成案例:第一次世界大战中的战壕斗争沿着西部战线的安静战场所面临的历史形势是一种(重复的)囚徒困境。任何时候,两个相互对峙的小分队均可以做出的选择都是:射击打死对方,或者谨慎地设计以避免造成损伤。对于参战双方

34、,削弱敌人的力量可以增大自己生存的可能性。因此,从短期看,不管敌人是否回射,最好现在就对他们展开进攻。使战壕中的战斗与大多数其他战斗不同的地方在于:长期上,同样的小分队会在流动的战场上相互对峙。这就将一次性囚徒困境改变为重复的囚徒困境。根据理论预测的结果,伴随着持续的互动,最终得到的稳定结果是基于互惠基础上的双边合作,特别是在双方都奉行同样的战略-谁都不做第一个背叛的人;但是,如果有人背叛,另外一方会积极反应-的情况下。结果如何?随着军队的严密防卫,沿着战线的许多地点都会同时发生一些非侵略性的战斗;上午-点是双方同时供应食物和用于个人事务的时间,这个时候战场上却一片沉寂;有些地方挂出旗子,目的

35、是提醒对方阻击手不要冒犯这些地方。战略是具有煽动性的,在双方相互制止的时间里,如果必要,敌人的士兵会费尽心机向对方表示他们确实会进行报复。例如,德国的阻击兵就曾经通过不断射击村庄的墙,直到打出一个大窟窿,以向英国士兵显示他们的力量。关于重复行动或先后行动条件下动态博弈的小结与同时决策相比,有些决策过程要求一个企业先行决策,然后竞争对手在知道了第一个企业的行动后再做出自己的决策,这样的决策叫做顺序决策或先后行动的决策顺序决策仍然包含战略相互依存:今天经理能够做的最好决策依赖于对手明天的反应。战略思维敏锐的经理必须站在对手的角度,提前预计对手的未来决策,以便自己做出最好的决策是否存在先动优势理所当

36、然地依赖于竞争对手的反应及其效果有些决策是双方在不同的时间面临相同的决策问题(如每个月是否要做广告以及做什么水平的广告),相当于同一个决策问题被不断重复,这样的决策叫做重复行动的决策经理们在动态的环境下作决策的一个合理的思维框架是:站在对手角度,运用逆向站在对手角度,运用逆向归纳法,注意战略稳定性归纳法,注意战略稳定性动态博弈中,合作的结果仍然难以维持,除非惩罚的力度足够大如何促进寡头市场的合作? 在寡头市场做战略决策会导致相互最好的决策:每个企业都在给定它所预计对手要做的决策下,作出对自己最好的决策。这些决策形成纳什均衡。这个时候,由于寡头追逐的是各自利益而不是共同利益,因此,最后出现的结果经常不是利润最大的。虽然企业间往往存在一个所有企业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论