《不完全信息博弈综述》3400字_第1页
《不完全信息博弈综述》3400字_第2页
《不完全信息博弈综述》3400字_第3页
《不完全信息博弈综述》3400字_第4页
《不完全信息博弈综述》3400字_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

不完全信息博弈综述目录TOC\o"1-2"\h\u9274不完全信息博弈综述 124451不完全信息静态博弈 192471.1贝叶斯纳什均衡 133831.2贝叶斯纳什均衡的例子及应用 277343.4不完全信息动态博弈 31不完全信息静态博弈在上文介绍的纳什均衡、子博弈精炼纳什均衡中都有一个共同的假设:完全信息,也就是参加博弈的每一个人都清楚地知道博弈的规则、博弈的结构、博弈的函数等。换句话说,也就是参与者对博弈的信息没有未知。但实际上博弈论中很多问题都是不完全信息的。在1967年之前是不完全信息的问题是没有办法解决的,数学家或者是经济学家都是束手无策的,直到海萨尼提出新的理论。1.1贝叶斯纳什均衡海萨尼(JohnCharlesHarsanyi,1920年5月29日-2000年8月9日)是出生于\o"匈牙利"匈牙利布达佩斯,后定居于\o"美国"美国。他是一位著名\o"经济学家"经济学家,曾获得1994年\o"诺贝尔奖获得者"诺贝尔经济学奖。曾就读于法国里昂大学,后来在故乡的布达佩斯大学取得本科、博士学位。因其在博弈论以及博弈论在经济学的应用而闻名于世,尤其是他在分析不完全信息静态博弈时,引入相关的贝叶斯理论,进行了高度创新。同时他在对博弈论在其他领域的交叉应用也做出了极大的贡献,例如推动博弈论在政治、哲学的应用。他于1967年在管理科学(Management

Science)发表的论文《Gameswithincompleteinformationplayedby“Bayesian”players,I-III.》使得关于不完全信息的问题变得可以得到处理。他将概率论引入博弈论,同时在分析不完全信息静态博弈时引入一个了假设的参与人:自然。同时对自然有一个附加条件:所有的博弈结果对自然都是没有本质区别的。然后自然首先行动,选择每一个参与者的类型。然后对于任意一个参与者而言,自己的类型已知,其他参与者的类型未知,但知道各种可被选择的类型的分布函数。即分布函数是共同知识。上述的转化被命名为海萨尼转化,这个转化将不完全信息静态博弈转化为完全但不完美静态信息博弈。这里的不完美主要可以解释为:参与者知道了选择的分布函数,但对于自然的选择却一无所知。1.2贝叶斯纳什均衡的例子及应用关于贝叶斯均衡的例子,为了突出不完全信息静态博弈和完全信息静态博弈的区别,本文选择介绍不完全信息下的古诺模型。假设中除了企业生产成本发生变化,其余假设不变。对于生产成本的假设更换为:企业1的成产成本为,并且是企业1、企业2的共同知识。对于企业2的成本,可能有两种情况或,企业2知道自己的成本,但企业1只知道分布,即表2:成本概率表2注:企业1、2同时做决策。可以将企业1、2的利润函数分布表示为:分别关于各自产量求导,寻找导数的零点得:则:对于企业2:则对于企业2的产量,企业1认为的最优情况:为了方便对比不妨赋值,则有:3.4不完全信息动态博弈在上文中,我们总共介绍了完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈。但实际上在生活中面对的情况是不完全信息,同时行动又有先后顺序的,或者在后先动者也是可以观察先行动者,来推断他的喜好。这也是本文想介绍的最后一个博弈论模型:不完全信息动态博弈。对于这个问题许多博弈论学家提出解决方法,本文主要对精炼贝叶斯均衡进行介绍。3.4.1颤抖手均衡颤抖手均衡是由泽尔腾提出的,前文已经对泽尔腾做过介绍,这里就不进行介绍。他是在1975年于著名的论文《AReexaminationofthePerfectnessConceptforEquilibriumPointsinExtensiveGames》提出"颤抖手均衡"(tremblinghandequilibrium)的概念,给出了如何处理动态博弈中有限理性的方法。颤抖手均衡主要的思想是:对于一个保持稳定的纳什均衡是可能会遭受某些极其微小的扰动,这些微小的扰动可能来自于人决策行动时出现的错误。如果出现这种错误的概率趋近0,而且这个过程中的均衡序列收敛,那么均衡序列的极限就是颤抖手均衡。换句话就是在纳什均衡的下,博弈中有一个人手抖了一下,选择的是次优的策略,如果该纳什均衡是颤抖手均衡,则博弈参与者会回到该均衡,而不是偏向另一个纳什均衡。下面我们简要介绍一个关于颤抖手均衡的例子:假设博弈者1、2的支付矩阵如表3:表3易得该博弈具有两个纳什均衡:(U,L)、(D,R)。当博弈处于(U,L)时,如果博弈者2手抖犯错,将策略换为D,则其收益变为0。对于博弈者1来说,收益变为2,这是他是没有更换策略的积极性的,若更换为R,收益没有发生变化,还可能会遭遇博弈者2更换策略,收益变为0。但是对于博弈者2而言,更换策略的动机是易见的,只要更换策略为U,收益就会增加。然后博弈又回到了最初的状态(U,L),这就是颤抖手均衡。但是如果博弈处于(D,R),博弈者1手抖犯错,将策略换为L,对于自身收益造成影响,但是博弈者2的收益变为0,博弈者只有调整策略为U,才可增加收益。均衡变成(U,L),无法回到(D,R),则(D,R)不是一个纳什均衡。3.4.2序贯均衡克雷普斯(David

M.Kreps,1950-)是美国斯坦福大学的著名教授,他是一位经济学家。他出生于美国纽约,曾就读于达特茅斯学院、斯坦福大学等高校。在1989年荣获John

Bates

Clark

Medal,也在2018年被授予John

J.Carty

Award。他以对动态选择模型和非合作博弈论的研究而闻名。威尔逊(Robert

B.Wilson,1937年-),出生于内布拉斯加州,博士就读于哈佛大学,后一直执教于斯坦福大学。在1994年获选为美国国家科学院成员,后在2020年获得诺贝尔经济学奖。威尔逊以其对管理科学和商业经济学的贡献而闻名。他与斯坦福商学院的其他数理经济学家一起,使用非合作博弈理论帮助重新构造了产业组织经济学和组织理论。他对非线性定价的研究影响了大公司的政策,尤其是在能源工业。序贯均衡提出于克瑞普斯和威尔逊共同发表的论文《SequentialEquilibrium》中,在这篇论文中,他们定义了序贯均衡,序贯均衡是一个行为策略—信念的组合。这要求:首先,策略必须是“序贯理性”,换句话说,可以理解为在后续出现的任意一个贝叶斯博弈当作构成一个贝叶斯纳什均衡。其次,信念的一致性,一列完全混合策略生成的信念的极限是这个信念。下面我们简要介绍一个关于序贯均衡的例子:图3图3是博弈者1、2的博弈过程树形图。博弈者1先做出选择,选择有A、B、C,博弈者2再做出选择,选择有D、E,虚线表示博弈者2做出选择时,不知道博弈者1做出了何种选择,也是博弈者1的选择不是共同知识。很容易可得到,博弈者1的最优策略是选择A,得到2的收益,博弈直接结束。但博弈的过程中出现错误,博弈者1未选择A,然后博弈者2就需要开始考虑选择何种策略。博弈者2知道博弈者1在B、C之间做出了选择,但不知道何种选择。如果博弈者1选择B,博弈者2的最优策略为E;如果博弈者1选择C,博弈者2的最优策略为D。如何做出选择就要依靠博弈者2认为博弈者1做出对应选择的概率为多少。如上图,假设博弈者1选择B的概率为,则选择C的概率为可计算得到,博弈者2做出选择对应收益的数学期望如下:根据收益的期望得到,当,博弈者2应选择E;,应选择D。等于时都可以。3.4.3精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡(prefect

Bayesian

equilibrium)的主要成果是由弗登伯格和泰勒尔提出的。让·弗登伯格(Drew

Fudenberg

,1957年—)出生于美国纽约,是美国哈佛大学经济系的著名教授。1981年,他取得了麻省理工学院的经济学博士学位。之后,他在博弈论和动态经济学方面做出了巨大贡献。曾经在加州大学伯克利分校、麻省理工学院、斯坦福大学和法国图卢兹大学任教。他的广泛研究涵盖了博弈论的许多方面,包括均衡理论,博弈学习,进化博弈论以及在其他领域的许多应用。富登堡还是最早将博弈论分析应用到产业组织,讨价还价理论和契约理论中的人之一。让·泰勒尔(Jean

Tirole,1953年—)是法国图卢兹大学的著名产业经济学教授,同时他也是巴黎大学、麻省理工学院的兼职教授,并且曾经在哈佛大学、斯坦福大学担任客座教授。他专注于产业组织、博弈论、银行、金融等各种领域。2014年,他因对市场力量和监管的分析而被授予诺贝尔经济学奖。1978年,在获得巴黎第九大学应用数学博士学位后,对经济学兴趣油生,他来到著名的美国麻省理工学院继续深造,并于1981年获得经济学博士学位。精炼贝叶斯均衡出现在弗登伯格和泰勒尔于1991年年共同撰写的《gametheory》中。在本书中详细介绍了精炼贝叶斯均衡,精炼贝叶斯均衡的关键点是博弈的参与者可通过观察其他参与者的行为来改变自己关于后面的参与者类型的主观概率,并由此决定自己的策略。这个修正的过程就被称之为贝叶斯规则。从数学观点来说,精炼贝叶斯均衡就是一个关于映射的不动点。具体的理解可以理解为每一个博弈的参与者都预先假设其他博弈参与者是均衡策略。换句话说就是:它

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论