博弈论与竞争策略 中央财经大学 中级微观经济学课件- 宋一淼_第1页
博弈论与竞争策略 中央财经大学 中级微观经济学课件- 宋一淼_第2页
博弈论与竞争策略 中央财经大学 中级微观经济学课件- 宋一淼_第3页
博弈论与竞争策略 中央财经大学 中级微观经济学课件- 宋一淼_第4页
博弈论与竞争策略 中央财经大学 中级微观经济学课件- 宋一淼_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Microeconomics中央财经大学宋一淼ogscs@微观经济学Chapter12GameTheoryandCompetitiveStrategy博弈论和竞争策略博弈论和竞争策略要讨论的问题博弈和决策占优策略均衡纳什均衡一、博弈和决策博弈的含义:研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈(game)的基本构成要素参与者(participant)策略或行动(strategy):参与者在博弈中遵循的行动规则或计划。支付(得益)(payoff):如以汇报或利润等方式表示的产出;拍卖中赢家的支付即其CS一、博弈和决策博弈的分类:非合作博弈与合作博弈合作博弈(cooperativegame)参与者可以谈定能使它们设计联合策略的有约束力的合同例子:买卖双方商议一种商品或服务的价格,或者两厂商的合资企业(如微软和IBM)签订一份能够分配联合投资利润的有约束力的合同。使得双方都获益的合作的结果是有可能的,也就是有约束力的合同是可能的一、博弈和决策非合作博弈(noncooperativegame)谈判和执行有约束力的合同是不可能的例子:假定其它厂商的行为,两个竞争性厂商独自决定价格和广告策略,以获得市场份额。再如,拍卖时每一个投标者在做出自己的最优投标决策时,都必须考虑其他投标者可能的行动。有约束力的合同是不可能的——这也是合作博弈与非合作博弈的基本区别。我们主要关心的是非合作博弈一、博弈和决策不论是非合作博弈还是合作博弈,策略设计都应满足:以理解你的对手的观点为基础,且(假定你的对手是理性的,)推断他或她对你的行动的可能反应。-5,-5-1,-10-2,-2-10,-1例子:囚徒困境

(prisoners’dilemma)

注意以下的支付是负的。他们不能共谋,且即使共谋也难以互相信任。结果无论A还是B都以坦白作为总是最优方案。囚徒A坦白不坦白坦白不坦白囚徒B你选择坦白吗?博弈的分类(续)从行为的时间序列性,博弈论分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。二、占优策略均衡占优策略(dominantstrategy)不论对手选择什么策略,这个策略对自己都是最优的。占优策略均衡(equilibriumindominantstrategies)由所有参与者的占优策略构成的策略组合。例子:广告博弈的支付矩阵厂商A做广告不做广告做广告不做广告厂商B10,515,010,26,8广告博弈的支付矩阵从分析来看,做广告对于厂商A是占优策略。对于厂商B这也是正确的:不管厂商A的决定是什么,厂商B做广告都能得到最好的结果。所以,如果设两厂商都是理性的,则这个博弈的结果是两个厂商都做广告。也就是两个厂商都有占优策略。这样的博弈结果也就是占优策略均衡(equilibriumindominantstrategy)。然而,并不是每个博弈的各个参与者都有一个占优策略。如——10,515,020,26,8厂商A做广告不做广告做广告不做广告厂商B例子:修改后的广告博弈

A没有占优策略,他的最优决策取决于B:

当B做广告,A最好也做;B若不做,A不做是最好选择三、纳什均衡纳什均衡(Nashequilibrium)在给定其他参与者的行动后,每个参与者采取了他能采取的最优行动。由所有参与者的最优行动构成的策略组合,被称为纳什均衡。给定你所做的,我采取我能采取的最优行动;给定我所做的,你采取你能采取的最优行动。纳什均衡(Nashequilibrium)占优策略(dominantstrategy)不管你如何行动,我都采取我能采取的最优行动。不管我如何行动,你都采取你能采取的最优行动。由此可以看出,占优策略均衡是纳什均衡的特例纳什均衡的例子两个早餐麦片公司一个脆麦片生产者的市场一个甜麦片生产者的市场每个厂商仅有推出一种新麦片的资源非合作的纳什均衡(Nashequilibrium)产品选择问题产品选择问题Firm1厂商1Crispy脆Sweet甜Firm2厂商2-5,-510,10-5,-510,10Crispy脆Sweet甜海滩定位问题

竞争者定位在何处(纳什均衡在何处)?若开始对手在A点,那么你可以在他左边即占领3/4的市场,而对手只有1/4的市场。但这不是一种均衡最终,两个销售者都会选择C即海滩中点。海洋0B海滩A200码C类似问题这个决策问题的例子包括:加油站定位总统选举混合策略均衡

Mixedstrategies石头、布、剪子的博弈

孩子B石头布剪子孩石头子布A剪子这里没一个策略组合所对应的收益要素中,两个人的收益之和总是零,即零和博弈。上述博弈找不出每个人都最优的策略组合,所以本博弈无均衡。如果把策略选择过程随机化,从混合策略的意义上来分析,仍能发现nash均衡。混合策略均衡

Mixedstrategies

游戏者BFC游戏者AFC若B在策略F和C之间选择的概率密度各为1/2,则若A选择F,A的效用就是1/2*(-1)+1/2*(1)=0;若A选择C,A的效用仍是1/2*(1)+1/2*(-1)=0可见,B选择F和C的概率各为1/2时,A选择F和C的效用是相同的。这说明A在这种条件下的最大效用为零,并且对F和C无差异。混合策略均衡

Mixedstrategies若A以1/2概率选择F与C,则B在F与C无差异,而且也达到效用极大化,即零。即A与B都以(1/2,1/2)的概率选择F与C,则它们各自都达到了效用极大化。则混合策略定义为:对于游戏者i,其一个混合策略是一个概率密度函数σi:Si->R,使得对于所有的si都有≥0,并且∑σi(Si)=1即游戏者i的混合策略是m个密度函数(若有m个可能的策略选择)。若第i个游戏者只有两个可能的策略选择,则其混合策略就只是p与(1-p)两个概率最大最小化策略

(maxminstratesy)这是一种保守的策略,又是风险比较小的策略。当游戏者想回避风险时,他会采取该策略。游戏者B左右游戏者A上下若B是理性的,他肯定会选右,因为右占优于左的若A相信B是理性的,他必选下,达到A与B都收益极大化的结果(2,1)最大最小化策略

(maxminstratesy)但A这样决策会有风险:若B以损害A为目标,则B知道A会选择下时会故意选择左。尽管B这样做对自己并没有好处,反而比选右少的一个单位利益。但B达到了损害A程度最大的目标。A若估计到这一可能性,则保守为妙——两害相权取其轻,即最大最小化策略。A首先考虑,若选上,min{1,1}=1若选下,min{-1000,2}=-1000A的决策是从两个坏结果中挑一个相对好一些的结果Max{min{1,1},min{-1000,2}}=max{1,-1000}=1故A选上。智猪博弈Pigs’payoffs这是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。在两头猪都有智慧的前提下,最终结果是小猪选择等待,即等待是小猪的占优策略。用报酬矩阵可清晰的刻画出小猪的选择:智猪博弈Pigs’payoffs

小猪将选择“搭便车”策略,因为小猪知道它若踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强。智猪博弈Pigs’payoffs“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的食物数量和踏板与投食口之间的距离。如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的现象吗?改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。

智猪博弈Pigs’payoffs改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。智猪博弈Pigs’payoffs改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。智猪博弈Pigs’payoffs“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但对于社会而言,因小猪未能参与竞争,小猪搭便车时的社会资源配置的并非最佳状态为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本,又消除了“搭便车”现象,能实现有效的激励。斗鸡博弈(ChickenGame)其实是一种误译。美国口语中的Chicken是懦夫的意思,也就是应翻译为懦夫博弈,但错误不严重。斗鸡博弈(ChickenGame)它强调的是如何在博弈中采取妥协的方式获得利益。如果双方都换位思考,他们就可以就补偿进行谈判,最后造成以补偿换退让的协议。博弈中经常有妥协,双方若能换位思考就可以容易达成协议。考虑自己得到多少补偿才愿意退出。只有从自己立场出发考虑问题,不愿意退让,又不想给对方一定的补偿,则僵局就难以打破。序列博弈的案例

——价格领导模型领导型企业不一定先宣布产量决策,而可能先宣布价格决策。但在宣布前,领导者会考虑追随者的反应。因此,博弈的分析仍遵循反向归纳(backwardinduction)的思路,即先分析追随者的反应,然后分析领导者如何选择最优定价问题。序列博弈的案例

——价格领导模型一、追随者的行为与残差需求线假定领导者给出产品价格p,追随者在均衡时必须接受领导者给定的价格。否则,若其喊价低于领导者的报价p,则市场需求会转向追随者,追随者将不再是追随者;若追随者喊价高于p,则将失去全部市场。所以追随者必然接受领导者的定价。追随者的行为必将是选择一个产量水平实现利润最大化,于是追随者的问题是:序列博弈的案例

——价格领导模型这会导致追随者按其MR2=MC2的原则决定产量,这实质上会决定追随者的供给曲线S2(P)一旦追随着在领导着给定的价格p下决定了其供给函数S2(P),那么市场留给领导者的残差需求即为D(P)-S2(P),记为R(p)(residualdemandcurve),即R(p)=D(p)-S2(P)序列博弈的案例

——价格领导模型二、领导者的最优价格选择领导者将根据R(p)出发按照MR1=MC1的原则确定产出q1,最后解出相应价格p,具体步骤:1、按MC2=P的原则确定S2(P);2、按R(p)=D(p)-S2(P)=q1的原则求出领导者面临的残差需求曲线;3、从残差需求线出发,按MR1=MC1的原则确定领导者的均衡产量q1;4、由q1解出领导者的价格水平p。序列博弈的案例

——价格领导模型Case假设市场需求为D(p)=a-bp(这里D(p)是市场需求Qd),追随者的成本为c2(q2)=q22/2,领导者的成本函数为c1(q1)=cq1。求领导者的均衡价格与均衡产量q1。解:先求追随者的供给函数。因追随者在“价格领导”模型中是“价格接受者”,所以其MR与p同一。这样追随者会按MC=p的原则决定其供给函数。序列博弈的案例

——价格领导模型由c2(q2)=q22/2,故MC2=q2=p因此,P=q2,即S2(p),亦即S2(p)=P=q2再求领导者面临的残差需求R(p)=D(P)-S2(p)=a-bp-p=a-(1+b)p由于R(p)=q1,即R(p)是领导者可卖掉的产量,有q1=a-(1+b)p解出p=[a/(1+b)]-[1/(1+b)]q1再次,按MR1=MC1的原则确定q1即序列博弈的案例

——价格领导模型博弈论发展简史博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。对于博弈论的研究,始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯·诺伊曼(vonNeumann,1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(vonNeumannandMorgenstern,1944,1947)首次对其系统化和形式化(Myerson,1991)。随后约翰·福布斯·纳什(JohnForbesNashJr.,1950,1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。博弈论发展简史诺依曼和摩根斯坦(VonNeumann&Morgenstern)《博弈论与经济行为》,1944塔克(Tucker)“囚徒困境”纳什(Nash)博弈均衡,1950、1951纳什和夏皮莱(Nash&Shapley),1953吉尔斯(Gilles),核(Core)理论,1953德布鲁和斯卡夫(Debreu&Scarf),60’s泽尔腾(Selten)完全信息,1965海萨尼(Harsanyi)不完全信息,1967、1968泽尔腾、克鲁帕斯(Kreps)、缪尔格拉姆(Milgrom)、罗伯茨(Roberts)、威尔逊,重复博弈,1982

约翰·冯·诺伊曼(JohnvonNeumann1903.12.28─1957.02.08)他是一位匈牙利─美国数学家。生于匈牙利布达佩斯。奥斯卡·摩根斯坦,德国-美国经济学家。(OskarMorgenstern,1902.01.24-1977.07.26),他很热心于将数学应用于经济学,更广义地说,应用于人类的各种战略问题,以便获得最大利益和尽可能地减少损失。他认为这些原理也同样适用于哪怕简单得象抛掷硬币这样的游戏,因而提出了所谓的对策论。1944年,他同另一名流亡学者诺伊曼合著了《对策论和经济行为》一书。

博弈论大师:约翰·福布斯·纳什(JohnForbesNashJr.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论