博弈论1:纯策略.ppt_第1页
博弈论1:纯策略.ppt_第2页
博弈论1:纯策略.ppt_第3页
博弈论1:纯策略.ppt_第4页
博弈论1:纯策略.ppt_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与市场竞争策略 1994年诺贝尔经济学奖 约翰纳什John F. Nash b.1928, developed an equilibrium concept for non- cooperative games that later came to be called Nash equilibrium 约翰海萨尼John C. Harsanyi b.1920 showed how games of incomplete information can be analyzed R泽尔腾einhard Selten,b.1930 first to refine the Nash equilibrium concept for analyzing dynamic strategic interaction. for their pioneering analysis of equilibria in the theory of non- cooperative games. Since then game theory has be taken as the Foundation for Understanding Complex Economic Issues 一、博弈论的基本理论框架 1/博弈论的理论意义与特征 古典经济学:根据资源稀缺性配置资源 的科学,价格是资源稀缺性的信号,由 此对经济行为进行成本收益分析,MR MC实现利润最大化 忽视了他人决策对彼此经济利益的影响 制度经济学: 科斯:对人之间的交易过程的成本收益分析 诺斯:对交易过程的制度环境进行分析,包 括制度约束与制度变迁与交易过程的关系 古典经济学及制度经济学的缺点 都是边际成本收益分析理论,但人们选 择的对象不是最小交易成本,而是根据 对方行动方案进行行为选择 孤立地分析行为者边际收益与成本,而 未分析他人行动对此行为者的影响,只 适合于利益无关者的利益分析 于是出现分析利益相关者的策略选择理 论博弈论 由此形成博弈论对经济学的贡献: 肖特:价格只提供社会资源稀缺性的机制, 而经济决策还需要了解人们各种可能经济行 为的信息,及其产生的后果 博弈论研究利益相关者的策略选择的相互影 响的利益函数,研究人的行为及其形成的制 度 从博弈论的角度看世界:整个社会生活是人 们的策略选择及其相互影响的过程,也即博 弈过程。实际生活中的博弈如市场竞争、高 考填报志愿、买卖股票、家庭生活等等一切 人们之间相互影响的过程,无所不包 2/博弈论基本要素 博弈论(Game Theory):各方在游戏规则规定下 的理性行为的理论。三大基本要素: 1.参加者(选择者)。用1,2, 表示; 2.选择对象与范围:策略空间,策略组合:每方可能采 取的策略是被选择对象。被选择对象的总体构成其 策略空间。用S1, S2, S3表示;所有各方都采取了 某种策略后,构成策略组合(strategy profile); 3. 利益函数:第 i个参加者的利益函数ui 为其在一定的 策略组合中得到的利益 收益矩阵(payoff matrix,又称“支付矩阵”):所有策 略组合中各方所得的收益组成的矩阵 参加者、策略空间与利益函数三者构成博弈 信息。以此为标准划分: 1. 完全信息博弈:各参加者对以上三类信息 都了解,据此选择自己的博弈策略; 2. 不完全信息博弈:各参加者在对上述三类 信息不充分了解的的博弈行为 根据参加者博弈行为的先后次序关系分为: 静态博弈:各方同时选择策略,其间无先 后因果关系; 动态博弈:各方根据他人已选策略来确定 自身采取的策略。 博弈基本类型 完全信息静态博弈 游戏各方在完全知道博弈过程的三大要 素的情况下同时选择策略 不完全信息静态博弈(高考填报志愿) 完全信息动态博弈(走象棋、围棋) 游戏各方的完全知识博弈过程的三大要 素的情况下,相继作出策略选择 不完全信息动态博弈(国际市场竞争) 由此交叉形成四种博弈类型: 矩阵的每个位置显示每个参加者的每个 策略组合,此位置即一博弈格局 每个博弈格局上列出每个参加者的利益 函数,于是得到payoff matrix ,例如: 企业2 价格不变 涨价 利益函数与payoff matrix(收益矩阵,又译 为“支付矩阵) 140, 25-20, 30 100, -3010, 10 企业1 价格不变 涨价 二、纯博弈(确定性博弈) 纳什均衡 Nash:一个数学天才,诺贝 尔经济学奖得主,美国大片 Beautiful Mind 主人翁 纳什均衡:在完全信息静态 博弈中各方都实现个利益最 大化的策略组合状态 纯策略:假定每个参加者每 次只选择一个策略进行博弈 混合策略:每个参加者每次 按照各种几率选择不同策略 进行博弈,如监督博弈 二、博弈案例1:占优策略与劣策略 (dominant strategy and dominated strategy) 课本上译为“支配性策略”与“被支配策略” 1/支配性策略(dominant strategy,占优策略) 下的纳什均衡 不论对方采取何种策略时,某一策略均为最优策 略,则此策略为占优策略。 如: 企业2 价格不变 涨价 140, 25-20, 30 100, -3010, 10 企业1 价格不变 涨价 企业1价格不变:10-30,企业2应当选择“价格不变” 企业1涨价: 3025,企业2应当选择“价格不变” 结论:“价格不变”是企业2的占优策略,企业1 在决策时必须以此为前提 双方占优策略下的纳什均衡:囚徒困境 博弈各方都有占优策略,形成纳什均衡,例如: 甲乙两个同案犯(抢劫与过失杀人,各自策略空间为 (坦白、抵赖),其利益函数用表中所填被判年数: 乙 甲 坦白 (不合作) 抵赖 (合作) 坦白(不合作 ) 10, 100, 15 抵赖(合作)15, 02, 2 甲方占优策略:乙坦白,因-10-15,故坦白为利益最大策略 。乙抵赖,因0-2,坦白亦利益最大。故坦白为占优策略 。乙方占优策略也为坦白。二者组合构成纳什均衡态。 对亚当斯密“看不见的手”的挑战 亚当斯密:个人自利的理性会被“看不见的 手”自动纳入增进社会集体福利的轨道 纳什说:不!相互影响的集体中各个部分如 果不合作而只追求自身利益最大化,将使整 个集体陷入到最不利的纳什均衡态。 必须使用某种力量来约束个人的自利行为, 每个人作出适当牺牲,才能实现集体利益最 大化 亚当斯密“看不见的手”实际上是用资源总量 控制对人们行为的经济约束市场约束, 一旦此约束失效,当有其他约束来补充(道 德与权力) 囚徒悖论的实践结果 与亚当斯密“看不见的手”相矛盾,市场经济下 处处充满集体理性与个体理性之冲突: 污染问题:企业面临的“囚徒困境” 公用地悲剧:长江中的鱼虾为何越来越小? 价格战问题(寡头垄断模型):价格卡特尔困 境 超市布点问题:为什么超市会集中在一起?资 源配置不经济 为什么有人见义不勇为? 诚实纳税的企业为什么吃亏?因为大家都不诚 实 克服纳什悖论的基本途径:制度约束 道德约束:使人们在社会舆论与社会公 德压力下按照集体理性的行为(例如朋 友义气等等) 规则约束:使人们行为服从集体理性的 要求,对违背者处罚。如:对不诚实纳 税者受社会信用机制的处罚,建立休渔 期,制止倾销价 二者相结合将起到好结果 如何制定规则来约束 世界上有两种符合集体利益的正义: 实质正义与规则正义。实质正义必须通 过规则正义来实现,否则将被虚置。因 此规则正义最重要。 分蛋糕或分粥故事: 20个人的小集体, 每天吃粥。如果所有人抡吃,导致纳什 悖论:每人早早来等粥,成本极高,对 谁都不利。 怎样制定规则,使分粥最公平? 2/重复性博弈下的策略: 对看不见的手的辩护 以上纳什均衡是一次性博弈,参加者仅 仅从当次利益最大化出发,导致悖论 如果是重复博弈,参加者不仅要考虑眼 前利益,还要考虑其行为所引起的未来 后果,也即对方的反应。 Robert Axelrod用请众多博弈论专家用 计算机进行博弈表明:针锋相对是正确 策略。作用:简单易行;使行为者不敢 先行欺骗;除非其希望合同瓦解;欺骗 行为受到惩罚;诚实行为得到回报。 3/劣策略(dominated strategy)下的纳什均 衡。累次取优方法。智猪博弈 不论对方采取何种策略其利益函数都最小的策 略称劣策略(dominated strategy),因而是必 须淘汰的策略 “累次取优”方法:每一步决策都要剔除自己和 对方的劣策略,从而作出策略选择 这种博弈常常发生在博弈各方不对称的情况下 。例如双方存在“主从关系” 例子:智猪博弈 智猪博弈: 题:大猪与小猪必须先踩猪圈一头之杠杆,才 能放出8斤食物,到猪圈另一头进食。踩杠 需耗食1斤。如小猪踩,则跑到另一头后后 大猪已将8斤吃光;如大猪踩,则小猪已吃3 斤,大猪可吃5斤。问纳什均衡点为何。 小猪 大猪 不劳动 (不合作) 劳动 (合作) 不劳动(不合作 ) 0,08, 1 劳动(合作)(51), 3(5-1), (3-1) 智猪博弈的社会事例: 拖欠工资时,谁积极讨回工资,谁坐享其成 ? 要举办某项大家都得利的集体活动,但要付 出成本。谁会“伸头”承办? 市场竞争中,哪些企业最关心全行业利益? 国际联盟中,哪些国家会积极维护联盟集体 利益? 智猪博弈是此类博弈的典型。 智猪博弈的实际意义 一个联盟如果由对称的成员组成,其最 容易形成“囚徒困境”,个人理性导致集 体非理性,不是一个值得信赖的联盟。 一个联盟的行为要遵循集体理性,应当 由不对称成员组成,其主要成员的个体 理性与联盟集体理性趋向一致,作为“ 家长”负责任。 例:沙特与欧佩克。沙特如果违背集体 协议,整个欧佩克将解体。 讨论: 防止全行业亏损的恶性竞争的根本途径是什 么? 建立“主从型”寡头垄断产业结构(但要防止 完全垄断)。可以防止企业间恶性价格战 股市:全是散户好,还是庄家-散户结构好? 在不允许制造虚假信息的前提下,后者好。 因为大户最关心该企业的真实运行状况。 联合国安理会为什么要设常任理事国?因为 大国与世界整体利益关系最大 中国产业结构最大问题是什么? 小而分散,对全行业、全社会不承担责任。 4/两个纳什均衡的博弈: 斗鸡博弈(chicken Game) 题:两人相对过独木桥。两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论