管理研究方法09-博弈论分析方法ppt课件.ppt_第1页
管理研究方法09-博弈论分析方法ppt课件.ppt_第2页
管理研究方法09-博弈论分析方法ppt课件.ppt_第3页
管理研究方法09-博弈论分析方法ppt课件.ppt_第4页
管理研究方法09-博弈论分析方法ppt课件.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

管理学研究方法(9) -博弈论分析方法,姚海鑫 教授、博士生导师 辽宁大学商学院 2013年11月,主要内容,博弈论的广泛应用 博弈论与诺贝尔经济学奖 博弈论的基本概念、基本思想与方法 博弈论方法应用举例 博弈论的主要结论 博弈论视角下的制度 合作博弈与利益分配 博弈论的启示,主要参考文献,1.姚海鑫,经济政策的博弈论分析,经济管理出版社, 2001年。 2.张维迎,博弈论与信息经济学,上海三联书店、上海人民出版社,1996年,2004年。 3.谢识予,经济博弈论,第二版,复旦大学出版社,2004年。 4. 美艾里克.拉斯缪森,博弈与信息,中译本, 王辉等译, 北京大学出版社、三联书店, 2003年版。 5.朱弗登博格、让梯若尔著,博弈论,中译本, 黄涛等译,中国人民大学出版社,2002年。 6.日青木昌彦,企业的合作博弈理论,郑江淮等译,中国人民大学出版社,2005年。,-cont,7. 黄涛编著:博弈论教程理论应用,首都经贸大学出版社,2004年。 8. 日青木昌彦,比较制度分析,周黎安译,上海远东出版社,2001年。 9. 美阿维纳什. k. 迪克西特等著,王尔山译,策略思维 商界、政界及日常生活的策略竞争,中国人民大学出版社,2002年。 10. 美托马斯谢林,冲突的战略,赵华等译,华夏出版社,2007年。 11. 姚海鑫,博弈论:基础理论与应用,复旦大学出版社,计划出版。,外文文献,1. Aumann , R., and S. Hart(1992,1994), Handbook of Game Theory with Economic Applications, Vol. I,II, New York: North-Holland. 2. H. Sott Bierman and Luis Fernandez,(1993), Game Theory with Economic Applications, Addison-Wesley Publishing Company,Inc 3. Herbert Gintis, (2000), Game Theory Evolving: A Problem-Centered Introduction to Modeling Strategic Behavior, Princeton University Press. 4. Eric Rasmusen, (2007) , Games and Information: an introduction to game theory, Oxford: Blackwell Pub. 5. James N. Webb,(2007), Game Theory: Decisions, Interaction and Evolution,. Springer. 6. Gibbons,R.(1992) ,Game Theory for Applied Economists, Princeton University Press 7. /entries/game-theory/#trees,一、引言博弈论的广泛应用,1. 现实生活中的博弈 电影美丽的心灵的主人公 - 约翰纳什 两人分蛋糕的故事 每个人都想尽可能多得,又都希望公平分配。如何精确而又公平地分?,-cont,2. 一切都在博弈之中!(everytings is in game) 企业与企业之间(价格、战略、人才); 委托人与代理人之间(股东vs.经理); 监督者与被监督者之间(上市公司vs.证监会); 国与国之间的经济、贸易(补贴、倾销、WTO); 国与国之间的政治、军事(联盟、军备竞赛); 政党之间(各国的总统、总理大选); 原告与被告之间; 教师与学生; 政府官员与商人之间; 个人与单位、同事之间、 上下级之间; 家庭成员之间(夫妻、家长与孩子)。,-cont,3. 其它例子博弈论的思想源远流长 - 田忌与齐王赛马 - 孙子兵法 - 三国演义:诸葛亮 vs.司马懿 - 犹太法典中的婚姻合同问题(见另页) - 棋类与扑克牌游戏 4. 现实微观领域:价格战、贸易战、委托代理、公司治理、监管/监督、讨价还价、招投标、拍卖 宏观领域: 政府政策的一致性、中央与地方政府、宏观调控、国与国之间的政治及经济合作 法律实践领域:要挟诉讼、庭外和解、民事纠纷,二、博弈论与诺贝尔经济学奖,从1994年诺贝尔经济学奖授予3位博弈论专家开始,迄今为止,共有6届诺贝尔经济学奖与博弈论的研究有关,足以证明博弈论作为一门工具学科在经济学中的地位,并得到了广泛运用。 诺贝尔经济学奖授予: - 1994年:约翰纳什(John Nash)、J. 海萨尼(J. Harsanyi)、R. 泽尔腾(R. Selten),博弈论基础性和开创性研究(一些均衡的概念)。 -1996年:J. 米尔利斯(James Mirrlees)、W.维克里(William Vickrey),信息经济学(不对称信息下的激励理论),博弈论在微观领域的一个应用。,-cont,- 2001年:G. 阿克洛夫(George Akerlof)、M. 斯本思(Michael Spence)、J. 斯蒂格利茨(Joseph Stiglitz),信息经济学的开创性研究(信号传递、信息不对称下的逆向选择与道德风险)。 - 2004年:F. E. 基德兰德(Finn E. Kydland)、E. 普雷斯科特(Edward Prescott),经济周期的根源和经济政策的时间一致性问题。最早把博弈论引入宏观经济学中,提出了(1977)“最优经济政策的时间不一致性(time inconsistency)”。,-cont,- 2005年: 罗伯特奥曼、托马斯谢林 “因通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖。他们的研究成果有助于“解释价格战和贸易战这样的经济冲突以及为何一些社区在运营共同拥有的资源方面更具成效。” 现实生活的世界一直存在着冲突与合作,一些个人、组织和国家能成功地进行合作,而另一些个人、组织和国家经常遭受冲突的困扰。社会科学家长期以来一直在试图弄明白冲突与合作的根本原因。 奥曼最早对无限次重复博弈进行了成熟的正式分析(重复博弈理论是社会科学中长期合作分析的一般框架),并在不同方向上扩展和推广了他的结论,如关于偏离合作的“惩罚威胁”的可信性;他还与他人一起建立了不对称信息的重复博弈理论。 奥曼的研究表明,在许多真实的情形中,长期合作关系要比单次合作更易维持,合作常常是重复博弈的一个均衡解,即使在两个有激烈短期利益冲突的参与者之间,也是如此。重复博弈可以增进我们理解合作的先决条件,即为什么在下列情况下合作较困难:存在许多参与者、他们很少交互作用、交互作用可能中断、时间范围很短或不能清楚观察到其他行动。,-cont,托马斯谢林在冲突的战略一书中发展出的一个重要思想:关于可信承诺(credible commitment)在冲突或谈判过程中的重要作用。 基本思想:在谈判和冲突的场合,如果博弈一方能够以可信的和可观察的方式限制自己的某些选择自由,反而会增强其谈判地位;而赋予一方更多的相机选择权则可能伤害该参与人的利益。 例如:中国在台湾、西藏、钓鱼岛、南海等问题的原则与立场 国家核心利益底线,-cont,谢林着力阐述了在双方处于僵持时,采取一些战略性手段的重要性。这些手段包括:事先承诺、边缘政策和有威慑力的威胁。谢林研究了冷战时期的美苏冲突,他解释了为什么在军备竞赛的条件下反而更能维持和平,而一旦势力出现不平衡反而更有可能出现冲突。 谢林认为,任何一方导致其趋于冲突的“利益”越大,对威慑状态进行冲击的可能性就越大,因此,“危机的过程也就是双方(就各自利益)讨价还价的过程”。怎样消除这样一个薄弱环节呢?谢林提出了“合作观”(idea of cooperation):为了尽最大可能缩小双方利益的差异或冲突程度,必须尽最大努力寻求冲突双方的共同利益(common-interest);而“双方确保摧毁”的威慑状态本身则是诱导双方去寻求共同利益-即避免两败俱伤的源泉。 谢林的另一个重要贡献是提出:使得“双方确保摧毁“的核威慑得以有效的关键,不是“如何使用核武器“,而是“如何使对方相信你将如何使用核武器“而必定造成对方无法接受的损失。,-cont,- 2012年:美国经济学家、哈佛大学教授埃尔文-罗斯(Alvin Roth)及加州大学洛杉矶分校教授劳埃德-沙普利(Lloyd Shapley)因“稳定配置和市场设计实践理论”研究方面做出了出色的贡献,获2012年诺贝尔经济学奖。 一个经济学的中心问题:如何尽可能恰当地匹配不同的市场主体。比如,学生须与学校相匹配,人体器官的捐献者必须同需要器官移植的患者相匹配。怎样才能使匹配尽可能有效地完成?什么样的方法对什么样的团体有益? 劳埃德S沙普利(Lloyd S. Shapley)使用合作博弈的方法来研究和比对不同的匹配方法。沙普利及其同事找到了一个叫做GS算法(Gale-Shapley algorithm)的方法。这种方法能确保匹配是稳定的,这些方法同时也限制了市场主体操纵匹配过程的动机。 在一系列的经验性研究中,罗斯及其同事证明了,理解特定市场机制为何成功的关键是稳定性。罗斯后来成功地通过系统性的实验室实验支持了这个结论。他还帮助重新设计了现存的制度,帮助医生和医院、学生和学校、器官捐赠者和病人之间进行配对。,三、博弈论的基本概念、思想与方法,什么是博弈论?(Game Theory) 博弈论研究人们在行为相互作用、利益相互影响时,人们如何进行决策以及这种决策所产生的结果,即理性的决策者之间冲突与合作的理论(策略与行为互动理论)。 博弈论的基本假设 - 理性的人(决策主体) - 追求自身利益最大化 - 行为相互作用 - 利益相互影响,-cont,3. 博弈论(分析)的特征 - 基本假设的合理性 - 研究对象的普遍性 - 分析方法的独特性 - 内容及应用的广泛性 - 结论的真实性(现实性) - 方法论的实证性,-cont,4. 博弈的基本要素 对弈者(player,N) 行动(action,Ai) 信息(information,I) 策略(strategy,S) 记Si为第i个对弈者的策略空间或策略集,它是欧氏空间Rm的一个子集,而S =S1S2Sn是整个博弈的策略空间或策略集。si Si为第i个对弈者的一个策略,s =(s1,sn)S称为策略组合,它由每个对弈者所选择的一个策略所构成。为方便记忆,把策略组合s = (s1,s2,sn)写成: s = (s,s1,s2,s-1,s+1,sn ) = ( s,s- ) 其中,s- 代表除了对弈者i以外其他所有对弈者的策略组合,即: s- = ( s1,s2,s-1,s+1, sn ), 收益(payoff,P) 结果和均衡(outcome , equilibrium) 结果是指博弈中对弈者的行动所产生的每一可能情形,包括策略组合、行动组合及支付组合等。 均衡是指由所有对弈者的最优策略所组成的策略组合,记为 s* =(s1*,s2*,sn*),其中,s*为第i个对弈者在均衡情况下的最优策略,即第i个对弈者在给定其他对弈者策略选择情况下,针对自己的策略选择,最大化自己的支付。 定义:均衡点(equilibrium point)就是满足下面条件的策略组合s* S:P ( s*,s-* ) P ( s,s-* ) 对所有的i N,s S成立。这里,P ( s*,s-* )的含义是所有的对弈者都选择其最优策略时对弈者i的支付函数, 而P ( s,s-* )的含义是除对弈者i外其它所有对弈者都选择其最优策略时对弈者i的支付函数。,-cont,均衡策略(equilibrium strategies)是指参与者在最大化各自的支付时所采取的策略。 博弈的完整表述: 对博弈的简单描述,只要有对弈者、策略和支付函数这三个主要要素就可以。 5. 博弈的具体表述形式 (见姚海鑫:博弈论:基础理论与应用Ch2) - 扩展形式:(a game in extensive form) 博弈树 - 策略形式:(a game in strategic form),又称标准形式(normal form)博弈矩阵 - 联盟形式: (Game in Coalitional Form) 公式,-cont,6. 策略与均衡(几个重要概念!见Ch2) - 纯策略 -混合策略 -博弈均衡 占优均衡、占劣均衡 纳什均衡、混合策略的NE 子博弈完备NE、贝叶斯均衡 7. 博弈的类型 - 合作博弈与非合作博弈 - 完全信息博弈与不完全信息博弈 - 静态博弈与动态博弈 - 零和博弈与非零和博弈,-cont,博弈论的研究(分析)范式: - 给出必要的研究假设(对弈者、信息、策略、收益等,及其他条件) - 构建博弈模型或博弈矩阵 - 对博弈模型分析求解,得到均衡解 基本方法是构建对弈者(参与者)的效用函数(或利润函数、收益函数、成本函数等),然后最大化(或最小化)目标函数,并给出相应的约束条件,从而得到均衡解。 - 结论讨论及政策含义 注意:如果是研究论文或课题,首先应该给出研究背景、提出研究问题,进行简要的文献综述。,四、博弈论方法应用举例,【例1】囚犯困境(prisoners dilemma)博弈及其经济学意义 两名犯罪嫌疑人A和B,被抓后接受隔离审讯。坦白与否、被判刑情况见如下博弈矩阵:,-cont,结论: 两人从利己的角度考虑(各自的理性),都选择最佳的策略:坦白(即背叛对方、不合作),结果两人均被判3年!个人理性导致了集体的非理性! 囚犯困境模型的经济学含义 - 个体理性与集体理性的不一致(冲突)! - 纳什均衡不一定是帕累托最优! - 实际(交易)中信息及声誉的(极端)重要性! - 在现实中合作具有重要、普遍、积极意义! - 制度(规则)安排的重要性! (博弈论视角下的制度:即是博弈规则,又是博弈结果!在既定的制度安排下激励将被引向何方!),-cont,【例2】 国家之间的贸易战:为什么加入WTO? 结论:自由贸易最有效率,但每个国家都经选择高关税!仍然陷入囚犯困境!(出口补贴也类似) 加入WTO的意义:自由贸易是最有效率, WTO 是一个制度规则,各国都遵守该规则。在WTO框架下,一方面可获得自由贸易的各种好处; 另一方面,若不遵守该规则,将受到单边甚至多边的严厉惩罚!还可以利用WTO机制(争端解决、规则保护)。,-cont,【例3】市场进入博弈:威胁是否有效?(略) 结论:均衡结果是进入者进入、在位者默许! 问题的关键是:削价威胁是否可信!,-cont,【例4】 企业财务造假与(审计)监督: 不完全信息会计监督博弈矩阵,-cont,假设:企业造假的概率为p,监管部门监督的概率为q,监督时发现问题的概率为r,不监督时有人举报的概率为w。 分别构造企业和监督部门的收益函数:1和2 1和2达最大时的一阶条件: 则求得该不完全信息博弈的混合策略的纳什均衡解为: 结论及政策含义(简要解释) 见姚海鑫:会计研究2003.05, pp44-45 或姚海鑫:辽宁大学学报2006.04,pp8993 “我国新会计法实施效果的一个博弈分析”,【例5】寡头厂商的价格战(略),结论:都选低价!(低价,低价)成为一个NE均衡! 问题: -降价对谁有利? 消费者!社会福利增进! -为什么“价格联盟”维持不住?(关键是缺乏对不守承诺有效监督和严厉惩罚,都担心对方降价!),五、博弈论的一些主要结论,1. 一次性博弈 即“囚犯困境”的类似结论: 个人理性导致集体的非理性,一次性博弈可能导致不合作(背叛)的结果! 2. 重复博弈 特征:博弈结构不变、可重复进行 有限次重复博弈:与一次性博弈结论相同! 通过逆向归纳法证明连锁店悖论(Chain Store Paradox)的例子(倒推法),3. 无限次重复博弈,现代经济学中私人信息是一种有价值的资源 - 私人信息包括:有关行动的知识、有关世界状态的知识 - 信念(beliefs): - 推断:通常对对弈者关于其他对弈者的信念做出某种类型的推测或假设。 - 均衡不仅涉及到策略集,还涉及到有关世界状态的信念集(信息)。 - 假设:存在不对称信息。 - 对弈者的全部私人信息(策略集、支付函数、信息集)成为他的类型 (type),是对个人特征的一个完全描述,通过其支付函数来反映。,- cont,无限次重复博弈中的策略 以无限重复的囚犯困境博弈为例 - 触发器策略(trigger strategies) - 针锋相对策略(tit for tat strategies) - 无名氏定理(Folk Theorem) 通俗解释:在无限次重复博弈中,只要当事人有足够的耐心,就可以(通过触发器策略)达成一次或有限次重复博弈中无法达成的效率较高的均衡(帕累托最优),实现潜在的合作利益。囚犯走出了困境!,-cont,关键:在无限重复博弈中,对弈者是否合作,关键是看对“不合作进行惩罚”这一威胁是否可信,要使威胁可信,就必须使合作所得到的收益(好处)严格大于不合作时得到的惩罚。这样,当博弈重复无限次时,对弈者才有进行合作的积极性。 一般地,根据“大棒加罗卜”(威逼+利诱)原理来构建一个最大合作策略是可能的。这种策略要求不仅要惩罚应该合作而不合作的对弈者,而且要惩罚应该惩罚而没惩罚的对弈者。但如果真的实施惩罚,博弈双方可能都受损失。实际上,在均衡路径上,没有人会偏离合作,惩罚实际上不会发生。严厉惩罚的目的是阻止不合作行为的发生,而不是惩罚本身。这一点对制度安排具有重要意义!,-cont, 非合作博弈中的合作问题 信誉模型(KMRW) 直观解释:在重复的囚犯博弈中,尽管每个囚犯在选择合作(不坦白)时冒着被对手出卖的风险(对手坦白时他得到的支付很低),但如果对方是合作型的,而他选择了不合作(坦白),就暴露了自己是非合作型 的,从而失去了获得长期合作收益的可能。如果博弈重复的次数足够多,则未来收益的损失就超过短期被出卖的损失。因此,为了获得长期利益,在博弈的开始,每个对弈者都想树立一个合作的形象或声誉(以使对方认为他是合作的,即使他在本性上并不一定是合作型的)。,-cont,4. 无限重复博弈的基本结论: - 如果博弈重复进行无限次,且每个对弈者都有足够的耐心,人们将进行长期的合作并放弃短期利益。因为长期合作的利益可以克服谋取短期利益的动机,对弈者有为自己的合作意愿建立声誉的积极性,也有惩罚对方的短期不合作行为的积极性。 - 人们为了获得长期利益放弃短期利益,建立一个愿意合作的好信誉(声誉)既是可能的,又是必要的。 - 信誉具有独特的经济作用! 博弈论视角下的好人与坏人: -为什么坏人要装好人?(信号、信誉) -什么是好人或坏人? (价值观、规则的自我遵守、诚信、自我约束) -一个人做点好事并不难,难的是一辈子做好事而不做坏事!做好人难!,六、博弈论视角下的制度,邓小平1980年8月, 他在党和国家领导制度的改革的讲话中就明确指出: “我们过去发生的各种错误,固然与某些领导人的思想、作风有关,但是组织制度、工作制度方面的问题更重要。这些方面的制度好可以使坏人无法任意横行,制度不好可以使好人无法充分做好事,甚至会走向反面。即使像毛泽东同志这样伟大的人物,也受到一些不好的制度的严重影响,以至对党对国家对他个人都造成了很大的不幸。”所以,“领导制度、组织制度问题更带有根本性、全局性、稳定性和长期性。,1. 博弈论视角下的制度(内涵),- 是博弈规则(人们交易及创新的动力,不同的博弈规则下有不同的博弈结果!制度具有重要作用!) - 是博弈均衡结果(新制度的形成,讨价还价或竞争) - 是当事人共有信念的自我维护系统 (正式规则与非正式规则,同样重要!) 正式规则:法律、法规、制度、规章; 非正式规则:订约成俗的规则、默认的潜规则 注意:潜规则对制度强化与软化!(有时候) 风气、文化建设(包括企业文化)的重要性! - 制度的稳定性与有效性: 可自我实施的制度才是一个好制度! - 制度变迁是一个动态的博弈过程 - 制度与博弈是相互作用的(内生性与外生性)!,- cont,2. 制度的作用: 制度具有激励、约束、监督、控制、导向、效率的 作用! 3. 什么样的制度是一个好制度? -构成纳什均衡的制度规则 -能够自我实施的制度 -能够激励相容的制度 - 委托代理问题(逆向选择与道德风险) - 激励设计与制度安排 - 信誉、合作与惩罚 在一个制度安排中,参与者的守信、合作、勤勉、敬业等行为应该真正得到奖励(制度化) !而不合作、偷懒、损人利己等行为必须得到惩罚!(制度化+随机化!),【例】:规则的激励与导向,一个富人A对他(不太孝敬)的儿子说:“别担心钱的问题,我死后会给你一大笔遗产,你会有很多钱”。 另一个富人B对他(不太孝敬)的儿子说:“别担心钱的问题,只要我活着,每年年底我都会给你20万元。但我死后,所有的遗产都捐给慈善机构”。 结果如何?(两个儿子有何不同反应?) - A的儿子会盼望他早点去世!以期早点继承遗产。 - B的儿子会想方设法(尽可能)让他多活些年头,以便从他的长寿中获利! 制度安排不同,激励效果就不同,导向也不一样! 好的制度应该是奖励和保护好人做好事、善事,而惩罚和制约坏人做坏事!,七、合作博弈,合作博弈(cooperative game) 沙伯利值(Shapley Value):是从对弈者的角度出发来分析多人合作博弈的,试图回答:如果每个对弈者的个体功能是已知的,他们各自在一个特定的博弈中的价值是多少?(各自分配多少?) 公式:沙伯利值(Shapley Value)与分配(公式),-cont,【例1】犹太法典中的婚姻合同问题 巴比伦王国的犹太法典( Babylonian Talmud),编辑记载了公元1-5世纪的古代法律及传统。犹太法典中讨论了一个所谓的“婚姻合同问题”(Marriage Contract Problem)。 一名男子(国王或富翁)有三个妻子,其婚姻合同指定:当该男子死后,遗产的分配方式是: -如果留下100单位财产,则主张在三位妻子中平均分配; -如果留下200 单位财产,则主张在三位妻子中按50、75、75的方案进行分配; -如果留

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论