信息经济学第三章博弈论_第1页
信息经济学第三章博弈论_第2页
信息经济学第三章博弈论_第3页
信息经济学第三章博弈论_第4页
信息经济学第三章博弈论_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息经济学第三章博弈论第一页,共四十六页,2022年,8月28日博弈:国家之间、企业之间、人与人之间生活中的博弈:——打牌、下棋——宿舍打扫卫生——宿舍买电风扇——家庭装修——挤公共汽车第二页,共四十六页,2022年,8月28日二、产生与发展通常,人们将数学家冯•诺依曼(vonNeumann)于1928年提出的二人零和博弈的极小化极大定理作为博弈论奠基的标志。1944年,数学家冯•诺依曼(vonNeumann)和经济学家摩根斯坦恩(Morgenstern)合作发表了《博弈论和经济行为》一书,被认为是应用博弈论进行经济分析的开始。

第三页,共四十六页,2022年,8月28日50年代合作博弈发展到鼎盛期:纳什和夏普里提出“讨价还价”模型;吉利斯和夏普里提出“核”的概念。50年代非合作博弈开始创立:1950和1951年,纳什发表了两篇关于非合作博弈的重要论文《n人博弈中的均衡点》、《非合作博弈》。1950年,塔克定义了“囚徒困境”(prisoners’dilemma)。

第四页,共四十六页,2022年,8月28日60年代,泽尔腾将纳什均衡的概念引入了动态分析,提出“精炼纳什均衡”概念。1967-1968年,海萨尼将不完全信息引入博弈论的研究。此后,他们两人长期合作,发展了非合作博弈理论。80年代,克瑞普斯和威尔逊于1982年合作发表了关于动态不完全信息博弈的重要文章。第五页,共四十六页,2022年,8月28日1994年诺贝尔经济学奖获得者:

1928年纳什出生于美国,1950年获普林斯顿大学数学博士学位,其博士论文《非合作博弈》首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的所谓纳什均衡概念。1930年

泽尔滕出生于现属于波兰的德国城市,1961年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。1920年海萨尼出生于匈牙利,1947年获布达佩斯大学博士学位,后到美国,1954年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献是将不完全信息引入了博弈论的研究。第六页,共四十六页,2022年,8月28日第二节基本概念一、组成要素:局中人(players):指做决策的个体。每个局中人的目标都是通过选择行动来使自己的效用最大化。信息(information)指局中人在博弈中的知识,特别是有关其他局中人(竞争者或对手)的特征和行动的知识。策略(strategies)是局中人选择行动的规则,它告诉局中人在什么时候选择什么行动。

第七页,共四十六页,2022年,8月28日

支付(payoff):指每个参与人从博弈中获得的效用水平。均衡(equilibrium):指所有局中人的最优战略组合或行动组合。或者,均衡s*=(s1*,…,sn*)指由博弈中的n个局中人每人选取的最佳战略所组成的一个战略组合。第八页,共四十六页,2022年,8月28日二、划分类型1.行动顺序

静态博弈(staticgame):博弈中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了什么具体行动。动态博弈(dynamicgame):指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。2.信息结构完全信息博弈(completeinformation):指局中人完全了解其他局中人的特征、战略空间及支付函数。不完全信息博弈(incompleteinformation):指至少有一个局中人不完全了解其他局中人的收益或收益函数。第九页,共四十六页,2022年,8月28日3.合作博弈与非合作博弈合作博弈(cooperativegame):是以局中人整体的可能联合行动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。非合作博弈(non-cooperativegame):是以单个局中人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。第十页,共四十六页,2022年,8月28日4.零和博弈与非零和博弈按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。零和博弈指在博弈中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。第十一页,共四十六页,2022年,8月28日基于信息结构和行动结构来划分博弈的结果:

博弈的类型及对应的均衡概念

行动顺序静态结构动态结构

信息(战略博弈)(扩展博弈)完全信息静态博弈完全信息动态博弈完全信息结构Nash均衡子博弈精练Nash均衡

Nash(1950,1951)Selten(1965)

不完全信息静态博弈不完全信息动态博弈不完全信息结构贝叶斯Nash均衡精练贝叶斯Nash均衡

Harsanyi(1967-1968)Selten(1975)等第十二页,共四十六页,2022年,8月28日三、支付矩阵表示方法双因素表示法:指在两个局中人的博弈中,每一单元格都有两个数字——分别表示两个局中人的收益。局中人B

左右上2,10,0局中人A

下0,01,2第十三页,共四十六页,2022年,8月28日第三节经典模型

博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的,不是为了享受博弈分析的过程,而在于赢得更好的结局。博弈的思想既然来自现实生活,它就既可以高度抽象化地用数学工具来表述,也可以用日常事例来说明,并运用到生活中去。没有高深的数学知识,我们同样通过博弈论的学习成为生活中的策略高手,学习到最适合的为人处世的方法。第十四页,共四十六页,2022年,8月28日一、囚徒困境——自愿坐牢的嫌疑人两个嫌疑犯作案后被警察抓住,被分别关在不同的房间里受审讯。警察知道两个人有罪,但缺乏足够的证据定罪,除非两个人当中至少有一个人坦白。警察告诉每个人:1、如果两个人都坦白,各判刑5年;2、如果两个人都不承认,每人判刑1年;3、两个人一人坦白一人抵赖,坦白者释放,抵赖者判刑8年;第十五页,共四十六页,2022年,8月28日这样,每个嫌疑犯面临4种可能后果:释放(自己坦白同伙抵赖);判刑1年(两人都抵赖);判刑5年(两人都坦白);判刑8年(自己抵赖同伙坦白)。

囚徒困境的支付矩阵囚犯B

坦白抵赖囚犯A坦白抵赖-5,-50,-8-8,0-1,-1第十六页,共四十六页,2022年,8月28日对A而言:如B坦白,A坦白时的支付为-5,抵赖时的支付为-8,因而坦白好;如B抵赖,A坦白时的支付为0,抵赖时的支付为-1,还是坦白好;这样,坦白是A的唯一最优策略。同样也是B的唯一最优策略。此博弈的纳什均衡是(坦白,坦白)。

分析第十七页,共四十六页,2022年,8月28日应用1:军备竞赛

20多年前,美、苏两国是两个超级大国,他们相互对垒都竞相增加各自的军费预算。假设他们有两种策略选择:扩军或裁军。双方选择的支付如下:苏联扩军裁军扩军-2000,-20008000,-∞

美国裁军-∞

,80000,0

第十八页,共四十六页,2022年,8月28日应用2:公共事业两个企业(u1,u2)被问:是否同意建造一个新的下水管道以使地下水不被污染。假设建造下水管道需要投资120万。如同意各承担50%,下水管道对企业的价值分别是80万。

第十九页,共四十六页,2022年,8月28日应用3:价格战生活中,我们经常会遇到各种各样的家电价格大战:彩电大战、冰箱大战、空调大战等等。这些大战的受益者是消费者。价格大战的结局也是一个“纳什均衡”,而且是厂家谁都没钱赚。问题:价格战的囚徒困境现象可以改变吗?第二十页,共四十六页,2022年,8月28日囚徒困境的结论:1)个体理性与集体理性的不一致性;2)表明制度安排的重要性;3)在现实政治经济中,合作具有积极普遍的意义。第二十一页,共四十六页,2022年,8月28日二、智猪博弈——多劳并不多得

猪圈里有大、小猪各一头,猪圈的一头有一个猪食槽,另一头有一个按钮,控制猪食供应。按一下按钮有10个猪食供应,但谁按谁要付出2个单位成本。(1)若小猪按则大猪先到,大猪吃9个单位,小猪只吃到1个单位。(2)若同时按则同时到,大猪吃7个单位,小猪吃到3个单位。(3)若大猪按则小猪先到,大猪吃6个单位,小猪吃到4个单位。

第二十二页,共四十六页,2022年,8月28日智猪博弈的支付矩阵

小猪

等待

大猪按等待5,14,49,-10,0第二十三页,共四十六页,2022年,8月28日分析

⑴小猪的最优策略是:等待。因为大猪按,小猪同时也按,得到1,而等待则得到4。大猪等待,小猪按,得到-1,而等待则得到0。⑵给定小猪的最优策略是等待,大猪的最优策略只能是按。所以,此博弈的纳什均衡是(按,等待)。智猪博弈表明:能者多劳,但多劳者未必多得。第二十四页,共四十六页,2022年,8月28日对管理者的启示

在“智猪博弈”的模型中,小猪搭便车的现象是由于规则所导致。为使资源最有效配置,如何才能激励小猪和大猪去抢按按钮?其核心问题是每次落下食物数量和按钮与投食口之间的距离。改变方案一:减量方案。投食量仅为原来的一半。结果是小猪和大猪都不去按。谁去按就意味着为对方贡献食物。改变方案二:增量方案。投食量为原来的两倍。结果是小猪和大猪谁想吃谁就去按,反正对方不会一次把食物吃完,都有足够的食物,所以竞争意识不强。第二十五页,共四十六页,2022年,8月28日改变方案三:减量加移位方案。投食量仅为原来的一半,但将投食口移到按钮旁边。结果小猪和大猪都在拼命抢着按按钮。等待者不得食,而多劳者多得。此方案成本不高而收获最大,可以说是最佳方案。第二十六页,共四十六页,2022年,8月28日三、斗鸡博弈——狭路相逢的策略

有两个人举着火棍从独木桥的两端走向中央准备火拼。每个人有两种策略:继续前进或退却。赢得2分,主动退却0分,败-3分。有3种情况发生:(1)两个人都继续前进,则两败俱伤。(2)一方前进,一方后退,前进者赢,退下来丢面子。(3)两人都退,都丢面子。第二十七页,共四十六页,2022年,8月28日斗鸡博弈的支付矩阵

B

退

有两个纳什均衡(进,退)或(退,进)。斗鸡博弈说明:狭路相逢勇者胜。

A进退-3,-32,00,20,0第二十八页,共四十六页,2022年,8月28日把对手变成朋友自20世纪80年代起,苹果和微软就一直处于敌对状态,为争夺个人计算机市场展开激烈的竞争。90年代中期,微软公司占领了约90%的市场份额,而苹果公司举步维艰。而让所有人都大跌眼镜的是,1997年,微软向苹果公司投资1.5亿美元,把它从倒闭的边缘拉了回来。2000年,微软为苹果推出Office2001。自此,微软与苹果真正实现双赢,合作伙伴关系进入了一个新的时代。第二十九页,共四十六页,2022年,8月28日

生活在纷繁复杂的社会中,难免会与人发生对立和冲突。在这些对手中,有的也许的确是蓄意阻挡你的前进道路,有的大多数是由于阴差阳错产生的误会,这时就不能讲究“狭路相逢勇者胜”,而应该调整自己的姿态,避免因为针尖麦芒而两败俱伤,并且要“一笑泯恩仇”,化对手为朋友,找到一条让双方共同前进的道路。第三十页,共四十六页,2022年,8月28日四、市场进入博弈

设想有一个垄断企业已在市场上(称为“在位者”),另一个企业想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以要阻挠进入者进入。在此博弈中,进入者有两种策略:进入或不进入,在位者也有两种策略:默许或阻挠。假定进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本为10。

第三十一页,共四十六页,2022年,8月28日市场进入博弈支付矩阵

在位者默许

阻挠有两个纳什均衡(进入,默许),或(不进入,阻挠)。

进入者

进入不进入40,50

-10,

0

0,300

0,300

第三十二页,共四十六页,2022年,8月28日五、酒吧博弈——混沌系统中的策略

“酒吧问题”是美国人阿瑟1994年在《美国经济评论》发表的一篇文章中提出来的。酒吧问题是:假设一个小镇上总共有100人,每个周末均要去酒吧活动或是待在家。小镇只有一间酒吧,设计接待人数为60人,即只有60人时酒吧服务最好,气氛最融洽。第一次,100人中的大多数去了酒吧,导致酒吧爆满,他们没有享受到应有的乐趣。第二次,人们去之前根据上次经验,人多得受不了,决定不去,结果去的人享受了一次高质量的服务。问题是,小镇上的人应该如何做出去还是不去的选择呢?第三十三页,共四十六页,2022年,8月28日这是一个典型的动态群体博弈问题。前提条件有如下限制:每个参与者面临的信息只是以前去酒吧的人数。因此只能根据以前的历史数据归纳出此次行动的策略,没有其他的信息可以参考,他们之间也没有信息交流。酒吧问题对真实人群的实验数据:周别ii+1i+2i+3i+4i+5i+6i+7…人数4476237745667822…第三十四页,共四十六页,2022年,8月28日对真实人群的实验中,实验对象的预测呈有规律的波浪形态,这种预测是一个非线性的过程。从一个非线性系统的整体来说,其变化往往是不可预测的。对于处身于一个混沌系统中的个体来说,在无法预测的过程中也可以采取恰当的策略,少数者策略是值得重点关注的。第三十五页,共四十六页,2022年,8月28日“少数者”的红衣服美国钢铁大王卡耐基小的时候家里很穷。有一天,他放学回家的时候经过一个工地,看到一个老板模样的人正在指挥盖一幢摩天大楼。卡耐基走上前问:“我长大后怎么才能成为像您这样的人呢?”“第一要勤奋,第二,……,要买一件红衣服穿上!”卡耐基满腹疑惑:“这与成功有关吗?”那人指着前面的工人说:“有啊!你看他们都穿着清一色的蓝色衣服,所以我一个都不认识。”说完,他又指着旁边一个工人说:“你看那个穿红衣服的,就因为他穿得和别人不一样,这才引起了我的注意。我也就认识了他,发现了他的才能,过几天我会安排给他一个职位。”第三十六页,共四十六页,2022年,8月28日六、枪手博弈——先发优势与后发制人

有三个不共戴天的快枪手在街上不期而遇,他们对于彼此之间的实力都了如指掌:枪手甲枪法精准,十发八中;枪手乙枪法不错,十发六中;枪手丙枪法拙劣,十发四中。我们来推断一下,假如三人同时开枪,谁活下来的机会大一些?如果三个人轮流开枪,谁的机会更大?如果三人中首先开枪的是丙,他该怎么选择?第三十七页,共四十六页,2022年,8月28日同时出招的策略每个星期,美国两大杂志《时代》和《新闻周刊》都会暗自较劲,要做出最引人注目的封面故事。双方的行动是同时进行,对对手的情况毫不知晓。假定本周有两个大新闻:一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。他们只会购买感兴趣的新闻为封面的杂志。假如两本杂志用同一条新闻做封面,那么感兴趣的买主平分两组。两个杂志社如何进行决策?第三十八页,共四十六页,2022年,8月28日《时代》:假如《新闻周刊》采用艾滋病新药做封面故事,我采用预算问题,则可得全体读者的30%;我也采用艾滋病新药,则得到全体读者的35%。因此,我采用艾滋病新药做封面故事。假如《新闻周刊》采用预算问题做封面故事,我也采用则得到15%的读者;我采用艾滋病新药做封面故事,则得到70%读者。因此,我采用艾滋病新药做封面故事。因此,我有一个优势策略就是采用艾滋病新药做封面,而无论对手的选择是什么。第三十九页,共四十六页,2022年,8月28日这样的策略考虑,同样对《新闻周刊》有效。选择艾滋病新药是他们共同的优势策略。同时出招的策略就是——无论对方采取何种策略,均应采取自己的最优策略。思考:假设全体读者偏向于选择《时代》。假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的人60%会选《时代》,40%的选《新闻周刊》,则两个杂志社如何决策?第四十页,共四十六页,2022年,8月28日七、猎鹿博弈——走上集体优化之路

在古代的一个村庄有两个猎人,假设主要的猎物只有鹿和兔子。受条件所限,两个人一起去才能猎获1只鹿,并且能使每个人吃上10天;如果一个人去,只能打到4只兔子,可以保证4天不挨饿。要么分别打兔子,每人得4;要么合作,每人得10。合作猎鹿比分别抓兔子更具有帕累托优势。帕累托效率:经济的效率体现于配置社会资源以改善人们的境况,特别要看资源是否已经被充分利用。如果要想再改善任何人都必须损害别人,这时就实现了帕累托效率最优。如果双方按照各人的贡献来分配猎物,会出现什么情况?第四十一页,共四十六页,2022年,8月28日挤兑风潮

假设A和B两个人,都借给朋友C100万元做生意。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论