博弈论与竞争策略_第1页
博弈论与竞争策略_第2页
博弈论与竞争策略_第3页
博弈论与竞争策略_第4页
博弈论与竞争策略_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论与策略思维夏大慰 上海国家会计学院课堂游戏(一)三个火枪手 甲(30%)乙:80%丙(100%)课堂游戏(二)纸币拍卖 “要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解” 保罗萨缪尔森基本框架同步一次博弈重复博弈:有限重复博弈与无限重复博弈多阶段博弈博弈论导论不对称信息下的博弈博弈论导论现代博弈论简单发展史起源可以追溯到1944年数学家冯诺伊曼与经济学家摩根斯坦合著的博弈论与经济行为博弈论导论博弈论和诺贝尔经济学奖1994:纳什(Nash)、海萨尼(J.Harsanyi)、泽尔腾(R.Selten) 1996莫里斯(James A.Mirrlees)和维克瑞(William

2、 Vickrey)纳什的基本贡献是证明了非合作博弈均衡解及其存在性,建立了作为博弈论基础的“纳什均衡”概念;海萨尼则把不完全信息纳入到博弈论方法体系中;泽尔腾的贡献在于将博弈论由静态向动态的扩展,建立了“子博弈精练纳什均衡”的概念。这两位经济学家的贡献集中于运用博弈论对现实经济问题的解释。2001:阿克洛夫(Akerlof)、斯宾塞(Spence)、斯蒂格利茨(Stiglitz)博弈论导论博弈论和诺贝尔经济学奖这三位作为不对称信息市场理论的奠基人被授予诺贝尔经济学奖,以表彰他们分别在柠檬品市场等不对称信息理论研究领域做出的基础性贡献。这些贡献发展了博弈论的方法体系,拓宽了其经济解释范围。200

3、2:弗农史密斯(Smith)2005:奥曼(Aumann)、谢林(Schelling) 贡献主要在于通过实验室实验来测试根据经济学理论而做出预测的未知或不确定性。是对以博弈论为基础构建的理论模型进行实证证伪工作的一大创举。他们通过博弈理论分析增加了世人对合作与冲突的理解。其理论模型应用在解释社会中不同性质的冲突、贸易纠纷、价格之争以及寻求长期合作的模式等经济学和其他社会科学领域。博弈论导论同步博弈与序列博弈 : 每个参与方不知对方决策情况下作出决策; 参与方先观察对方行动,自己再行动静态博弈与动态博弈 : 参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取什么行动;参与人的行动有先后顺

4、序,且后行动者能够观察到先行动者所选择的行动一次博弈与重复博弈:基本博弈只进行一次;基本博弈重复进行,包括有限重复和无限重复零和博弈与非零和博弈 : 一方的情况只有当另一方情况变得更差时才能变得更好;另外一方情况不必变得更差,一方的情况就能变得更好完全信息博弈与不完全信息博弈 : 完全信息博弈是指参与人对其他参与人的特征、策略和得益函数有准确知识,否则就是不完全信息博弈标准式博弈与扩展式博弈 : 矩阵 树形博弈论导论每一个博弈都是一个你中有我,我中有你的情形,不同的博弈参与者可以选择不同的行动,但由于相互作用,一个博弈参与者的得益不仅取决于自己采取的行动,也取决于其他博弈参与者所采取的行动。博

5、弈论的精髓在于基于系统思维基础上的理性换位思考,即在选择你的行动时还是考虑你的得益,但是你应当用他人的得益去推测他人的行动,从而选择最有利于自己的行动。基本框架同步一次博弈重复博弈:有限重复博弈与无限重复博弈多阶段博弈博弈论导论不对称信息下的博弈 斯特恩巴赫是费城的一个家庭保健医生,她很奇怪为什么辉瑞公司(Pfizer)的五位不同推销员重复上门到她的诊所推销同样的止痛药Betra及Celebrex。她在贮藏室里一个像冰箱大的柜子里已装满了Bextra和Celebrex,她说,“众多的推销员重复同样的产品,没有任何新意,实在是离奇。” 长达十年的招聘狂潮使制药业的推销员人数增加到90000,为原

6、来人数的三倍。制药业人士笃信:只要推销员与医生推销一种药越频繁,医生越有可能多开此药。 据统计,2003年制药业在推销员工上花费为120多亿美元,在药物广告上花费为27.6亿美元。根据联邦政府的报告,美国国内在处方药上的支出激增14%,达到1,610亿美元。专栏制药公司的销售大战(摘自华尔街日报)Betra辉瑞推销员止痛药医生2003年美国制药业推销员工与药物广告花费(单位:亿美元)专栏制药公司的销售大战(摘自华尔街日报)(续) 尽管如此,没有任何一家制药商愿意第一个单方面裁军。葛兰素史克公司(GlaxoSmithKline)的推销员队伍是如此壮大:它只需要七天就可以联系到美国80%以上的医生

7、。“这有必要吗?”葛兰素史克的CEO加涅尔说:“应该说是没有必要,但是如果我的竞争对手能而我做不到,我们就处于劣势。这的确是以最坏可能的方式进行的军备竞赛。” “拥有众多的推销员不是竞争优势的源泉”,默克公司的主席和CEO吉尔马丁补充说。他说制药商通过发现新药来获得优势。然而,默克公司2001年起在美国已增加了1500名推销员,使得总数达到约7000人。 既然谁都知道拥有众多的推销员并不是竞争优势的源泉,那为什么各家制药公司的推销员仍然在不断膨胀呢? 引自周林,商业战略决策:博弈论的应用同步,一次博弈-标准式博弈构成标准式博弈的要素有:参与者:参加博弈并做出决策的个体策略:参与者可能采取的行动

8、得益:参与者采取不同策略带来的利益或损失参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5标准式博弈:均衡分析假设参与者1认为参与者2选择 “A”参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5标准式博弈:均衡分析则参与者1应该选择 “a”参与者1对 “A”的最优反应是 “a”.参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5标准式博弈:均衡分析假设参与者1认为参与者2选择 “B”.参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5

9、标准式博弈:均衡分析则参与者1应该选择 “a”.参与者1对 “B”的最优反应是 “a”.参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5标准式博弈:均衡分析如果参与者1认为参与者2选择 C参与者1对“C”的最优反应是“a”.参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5占优策略不管参与者2是选择A、B还是C, 参与者1都会选择“a”!“a” 是参与者1的占优策略!占优策略(上策) 不管对手做什么,对一个参与者都能获得最高得益的策略参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61

10、,44,5站到对手的立场上,想参与者2会怎么做呢?参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5 参与者2 没有占优策略!但是参与者2应该能够推断出1会选择 “a”因此参与者2会选择 “C”结果“a” 是参与者1对 “C”的最优反应.“C” 是参与者2对 “a”的最优反应.此结果被称为纳什均衡: 在给定其他参与者策略情况下,没有一个参与者能通过单方面改变自己的策略而使自己的得益提高,从而没有人有积极性打破这种均衡参与者 2参与者 1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5关键点:寻找占优策略 检查一下你是否存在占优策略,

11、如果有,就选择占优策略站在对手的位置上思考问题 如果你没有占优策略,那么从你对手角度考虑博弈。如果对手有占优策略,预期他将按占优策略行动纳什均衡 我所做的是:给定你所做的,我所做的是最好的; 你所做的是:给定我所做的,你所做的是最好的同步,一次博弈的应用专栏的博弈分析(制药公司销售大战)策略适中庞大适中10,105,13庞大13,57,7默克辉瑞纳什均衡囚徒困境案情描述 两个犯罪嫌疑人囚徒A与囚徒B因犯非法持有枪械罪和被怀疑可能犯有一级谋杀罪被逮捕,检察官将他们分别关在两间牢房里进行审讯。检察官对囚徒A说,“我们实行的是坦白从宽,抗拒从严的政策;如果你坦白了而他不坦白,那么你将会被无罪释放,他

12、将会因一级谋杀罪被判死刑;如果他坦白了而你不坦白,他将会被无罪释放,而你将会因一级谋杀罪被判死刑;如果你们都坦白,你们都将会被轻判。”当然检察官对B说的话也是完全一样的。但实际上,两个犯罪嫌疑人都清楚,如果两个人都坦白,却会因涉及更多的罪案而都被判无期。而两人都不坦白,只能按非法持有枪械罪被分别判一年。囚徒A与B的博弈矩阵又是怎样的呢?囚徒A与B将面临怎样的选择呢?个体理性与集体理性的冲突囚徒B囚徒A彩电价格大战策略低价高价低价0,03,-1高价-1,31,1伯特兰德寡头垄断(同质产品,价格竞争)海信长虹纳什均衡公共地悲剧英国人哈定:十八世纪以前,苏格兰地区大量草地,由于属公共资源导致过度放牧

13、,致使草地消失,生态破坏公共产品的供给 如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是“不出钱”,结果使所有人的福利都得不到提高。军备竞赛 两国都不搞军备竞赛,都把资源用于民用,两国福利都变好。但由于都怕受威胁而大搞军备竞赛,结果两国福利都变得更糟。经济改革 经济改革要付出成本(包括风险),而改革的成果大家享受,结果是,尽管人人都认为改革好,却很难有人真正去改革,大家只好在都不满意的体制下继续生活下去。位置博弈商业布点、飞机航班、电视节目、政治选举01/41/23/41ABA B智猪博

14、弈 猪圈中有一头大猪一头小猪,猪圈一端有个按钮,每按一下猪圈另一端食槽中会有10个单位猪食进槽,但按一下会耗去相当于2单位猪食的成本。如果大猪先到食槽,大猪吃到9单位食物,小猪只能吃到1单位;如小猪先到,小猪吃4单位而大猪吃6单位;如果同时按并同时到食槽,则大猪吃7单位而小猪吃3单位食物。按等待按5,14,4等待9,-10,0小猪大猪纳什均衡关键点处于强势的参与者为维护自己利益采取某种决策时,为其他弱势参与者提供了搭便车的机会股市中的机构大户与散户新产品研发与中小企业可口可乐、百事可乐与非品牌软饮料产品(Scott)小狗策略大智若愚中的智慧贫困县的教育拨款协调博弈足球芭蕾足球2,10,0芭蕾0

15、,01,2情侣博弈女男策略220伏110伏220伏$100,$1000,0110伏0,0$100,$100企业B企业A此协调博弈有两个纳什均衡产业标准(软盘、CD的大小等) 国家标准(电压、交通法等)关键点不是所有的博弈都涉及到利益冲突. 沟通能够帮助解决协调问题.顺序行动能够帮助解决协调问题.先动优势的作用基本框架同步一次博弈重复博弈:有限重复博弈与无限重复博弈多阶段博弈博弈论导论不对称信息下的博弈重复博弈-广告博弈两个企业 (Kelloggs & General Mills) 的经理想最大化利润策略是广告活动同步博弈一次博弈无限重复博弈有限重复博弈一次广告博弈通用面粉凯洛格策略无广告中等强

16、度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2一次广告博弈的均衡纳什均衡通用面粉凯洛格策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2劣策略:不管其他参与人采取什么策略,都能导致最低收益的策略理性参与人永远不会选择劣策略许多博弈中参与者都没有占优策略,但仍可能通过劣策略的重复剔除进行分析,这种方法称劣策略重复剔除法如果企业每年都进行这种一次博弈,并且永远进行下去,这时参与人可以对对手的“欺骗”行为进行惩罚或报复。在这种情况下,共谋起作用吗?密歇根大学爱克斯罗德教授的计算机模拟

17、他首先邀请全世界的学者递交自认为最优的策略程序,然后将这些策略相互之间交替进行不特定次数的“重复囚徒博弈”,根据最终排名来判定优劣。第一轮14个程序之间的竞赛结果显示,“一报还一报” 的简单策略获得第一。之后,又有63位科学家递交了改进的程序,进行第二轮竞赛,其中包括多个以“一报还一报”策略为基础的改良品种。令人惊异的是,第二轮比赛的优胜者仍然是“一报还一报”。触发策略“如果对手在过去没有做过广告,我就不做;一旦对手作广告,自此以后,我就用高强度的广告活动来惩罚他”事实上,只要对手在过去没有过“欺骗”行为,各个企业都会同意“合作”。因为欺骗行为会引发以后所有时期的惩罚无限重复博弈假设Gener

18、al Mills采用了这种触发策略,Kelloggs的利润是多少呢?合作 = 12 +12/(1+i) + 12/(1+i)2 + 12/(1+i)3 + = 12 + 12/i相当于每年年底得到¥12的永久年金欺骗 = 20 +2/(1+i) + 2/(1+i)2 + 2/(1+i)3 + = 20 + 2/i通用面粉凯洛格策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2Kellogg从欺骗行为中获得的好处:欺骗 - 合作 = 20 + 2/i - (12 + 12/i) = 8 - 10/i假设i = .05欺骗 - 合作

19、= 8 - 10/.05 = 8 - 200 = -192欺骗没有好处.在无限次重复博弈中共谋是纳什均衡!通用面粉凯洛格策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2欺骗行为的收益和成本如果 当前收益 未来成本的现值 欺骗行为是有利的如果 当前收益 未来成本的现值欺骗行为没有好处通用面粉凯洛格策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2关键点当博弈无限重复没有确定的“终结之日”时,共谋作为纳什均衡就能够维持下去这需要:有能力监督对手的行动有惩罚叛徒的能力和名

20、声低利率在未来进行博弈的机会多 共谋在现实世界中的例子垃圾搜集行业水表制造业石油输出国组织黑手党组织说明根据谢尔曼反托拉斯法案第二节,共谋是违法的.后果可能是罚款和坐牢OPEC是国际间组织,美国法律不适用于它如果博弈有限重复进行,共谋起作用吗?有限重复博弈假设广告博弈被重复两次通用面粉凯洛格策略无广告中等强度高强度无广告12,121,20-1,15中等强度20,16,60,9高强度15,-19,02,2纳什均衡用逆向归纳法,结论是:不.在第二阶段,博弈是一次博弈,因此在这最后阶段,均衡是高强度的广告活动.由于每个人都知道第二阶段的结果,因此,第一阶段就变成了最后阶段.两个企业在两个时期的均衡策

21、略都是高强度的广告活动.如果博弈重复已知的有限次数,同样的结果依然成立期末问题的应用当参与方确切地知道一个重复博弈什么时候结束时,期末问题就出现了。由于无法在最后一次对对手违背协议行为进行惩罚,因此参与方就会采取如同一次博弈的策略59岁现象辞职问题虚假广告火车站和旅游点的商贩基本框架同步一次博弈重复博弈:有限重复博弈与无限重复博弈多阶段博弈博弈论导论不对称信息下的博弈多阶段博弈序列博弈 参与者选择策略有时间先后的顺序,通常采用博弈的扩展形式来进行分析例子:进入博弈 两个企业:一个在位企业(B)和一个潜在的进入者(A) 扩展形博弈不进入进入容纳商战(900,1100)(-200,600)(0,

22、3000)AB找出纳什均衡不进入进入容纳商战(900,1100)(-200,600)(0, 3000)AB两个纳什均衡纳什均衡之一是如果A进入市场,B就威胁选择商战,所以A不进入市场另一个纳什均衡是A选择进入,B随之选择容纳不进入进入容纳商战(900,1100)(-200,600)(0, 3000)AB一个子博弈纳什精炼均衡不进入进入容纳商战(900,1100)(-200,600)(0, 3000)AB子博弈精练均衡:A选择进入,B选择容纳是纳什均衡在博弈每个阶段没有一个博弈方可通过改变策略提高其得益威胁与承诺空头威胁:对对手采取的行动是不需要任何成本的,因此这种威胁 是不可置信的承诺:预先花

23、费成本来严格限制自己行为,从而使威胁成为可置信的例子:进入博弈阻止市场进入与剩余生产能力不进入进入容纳商战(900,300)(-200,600)(0,2200)AB在进入发生前在位企业通过不可逆转的投资(800万)来形成一部分剩余生产能力,这部分生产能力在无进入者进入市场时是多余的,但在进入发生时则降低了与进入者进行商战的成本,使在位者的最优选择从容纳改变成商战形成额外的剩余生产能力可以阻止进入,潜在进入者知道他一旦进入,价格战就必然发生,因而构成可置信的威胁形成剩余生产能力的行动在序列博弈中常带有先发制人的意图,因此这种行动被称为事先承诺博弈不进入进入容纳商战(900,300)(-200,6

24、00)(0,2200)AB结论作为博弈方你不应该仅仅是个被动的参与人,满足于接受别人制定的博弈规则,而应该设法改变博弈使其对自己尽量有利可置信的承诺能够促进长期利润,但承诺方也确实因此而对自己的行动施加了严格的限制。这种通过限制自己行动来获取竞争优势的做法被称为策略性行为“一种策略性行为就是某人通过影响其他人对自己行为的预期,来促使其他人选择对自己有利的策略,是某人通过限制自己的行为来限制其对局者的选择”(2005年诺贝尔经济学奖得主托马斯谢林)基本框架同步一次博弈重复博弈:有限重复博弈与无限重复博弈多阶段博弈博弈论导论不对称信息下的博弈不对称信息下的博弈不确定性与不完全信息私人信息与信息不对

25、称课堂游戏:钱盒拍卖柠檬市场(阿克罗夫) 劣品驱逐良品旧车市场价格数量O$1000025000辆50000辆DMDLMDHDLSH高质量车O$ 500050000辆75000辆SLDMDLMDL低质量车价格数量不对称信息的两种类型隐藏特征 交易的一方当事人了解但是另一方不了解的特征隐藏行为 某一关系中,一方当事人采取的不被另一方所察觉的行为逆向选择由于存在隐藏特征,选择过程导致了许多具有不良特征的人或商品集中在一起例子 旧车市场 证券市场道德风险合同一方采取隐藏行为,此行为以牺牲另一方的利益为代价给自己谋得好处例子 委托代理问题 对租赁的汽车的保养可能的解决方案信号传递拥有更多的信息的一方向拥有较少信息一方发出能够观察到的信号,此信号揭示了他的隐藏的特征此信号不能够被其他类型的人轻易模仿例子:教育、明星广告、在位企业的低价格策略、四大会计师事务所信息甄别缺少信息的一方试图根据对方的特征将对方分门别类处理常通过自选择机制进行 缺少信息一方向拥有更多信息一方提出了一系列的备选方案,后者对方案的选择向缺少信息的一方揭示了其各自的隐藏的特征例子:所罗门王断案、飞机与剧场的差别定价、第二价暗标拍卖拍卖种类英式拍

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论