版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
经济博弈论
主讲人:屠巧平电话-mail:tqp1226@
课程主要内容导论完全信息静态博弈完全且完美信息动态博弈重复博弈完全但不完美信息动态博弈不完全信息静态博弈不完全信息动态博弈
第一章导论什么是博弈论几类经典的博弈模型博弈的分类和博弈的结构
博弈论的产生博弈论(theGameTheory)也就是运筹学中的对策论。对策思想最早产生于我国古代。早在两千多年的春秋时期,孙武在《孙子兵法》中论述的军事思想和治国策略,就蕴育了丰富和深刻的对策论思想。孙武的后代孙膑,为田忌谋划,巧胜齐王,这个著名的“田忌赛马”,就是典型的对策思想的成功运用。
博弈论的产生对策思想明确地应用于经济领域,始于Cournot(1838),Bertrand(1883),Edgeworth(1925)等人关于寡头竞争、产量与价格垄断、产品交易行为的研究。然而,作为一门学科的创立,则是以美国数学家冯.诺依曼(JohnVonNeumann)和经济学家奥斯卡.摩根斯坦(OskarMorgenstern)合著的《博弈论与经济行为》(TheGameTheoryandEconomicBehavior)(1944)一书出版为标志,他们奠定和形成了这门学科的理论与方法论基础。
博弈论的产生博弈论是一门内容广泛且复杂的学科,不仅是经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学等,都涉及到博弈论。实际上,很多人把博弈论看成数学的一个分支,博弈论的一个重要代表人物---纳什(Nash,曾获1994年诺贝尔经济学奖,该年度的诺贝尔经济学奖授与了三位博弈论专家),在1951年的一篇关于非合作博弈的奠基性的文章就是发表在数学杂志上,而非在经济学杂志上。博弈论领域取得的诺贝尔奖1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼。1996年诺贝尔奖授予两位博弈论与信息经济学研究专家莫里斯、维克瑞;2001年诺贝尔奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市场、信号传递和信号甄别等非对称信息理论研究中的开创性贡献。2005年诺贝尔奖授予有以色列和美国双重国籍的罗伯特·奥曼和美国人托马斯·谢林,以表彰他们在博弈论领域作出的贡献。博弈论与主流经济学从现代的观点来看,经济学是研究人的决策行为的学问。理性人是指在面临给定的约束条件下能最大化自己效用的人,不考虑竞争对手的决策。两个基本假定:1、市场参与人的数量足够多,从而市场是竞争性的;2、参与人之间不存在信息不对称问题(完全竞争、完全信息)。然而在现实生活中,这两个假设在许多情况下是不能被满足。博弈论与主流经济学博弈论进入主流经济学,反映了经济学发展的几个趋势:经济学研究对象越来越转向个体,一切从个人效用函数及约束条件开始,解约束条件下个人效用最大化问题,而导出行为及结果;经济学研究对象越来越转向人与人之间关系的研究。特别是人与人之间行为的相互影响和作用,人们之间的利益冲突与一致,竞争与合作的研究;开始注意到理性人的个人理性行为可能导致集体的非理性。博弈论与主流经济学传统经济学研究个人行为时,总是假定在给定价格下决策,人们行为之间的相互作用是通过价格来间接完成的,价格可以使个人理性与集体理性达到一致;在解决问题方法上,不像传统经济学主张政府干预来解决,而是认为解决个人理性与集体理性之间的冲突办法不是否认个人理性,而是设计一种机制,在满足个人理性的前提下达到集体理性。主流经济学越来越重视对信息的研究。
什么是博弈论(GameTheory)博弈论:研究决策主体的行为直接发生相互作用时候的均衡问题。博弈论既是一种决策理论,也是一种经济分析工具,是在具有相互对抗和反应特征的社会经济环境中最有效的决策理论和经济分析工具。博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下、同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。
一个博弈模型必须确定的几个因素博弈的参与者(Players):即博弈的参与者,他们是博奕的决策主体行为。根据自己的利益要求决定自己的,记局中人为i,局中人集合为{1,2,…,I},即共有I个局中人。我们将某个局中人以外的其它局中人称为“i的对手”,记为-i。策略(Strategies):即指每个局中人在对策中可以选择采用的行动方案,但这个方案必须是一个完整的行动,而不是行动的某一步。每个局中人均有可供选择的多种策略。一个博弈模型必须确定的几个因素博弈的次序(Orders)。规定一个博弈必须规定其中的次序,次序不同一般就是不同的博弈。博弈方的得益(Payoffs)。是指一局博奕的得失。或者说是局中人从各种策略组合中获得的效用,它是策略组合的函数。
几类经典的博弈模型---囚徒困境囚徒困境(Prisoner′dilemma):假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑5年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则重判8年,而坦白者有功被减刑,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
囚徒困境博弈囚徒B坦白抵赖囚徒A坦白-8,-80,-10抵赖-10,0-1,-1
囚徒困境博弈的分析在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-10,显然“坦白”为好;同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。两个最优反应形成了一个策略组合(坦白,坦白)。
囚徒困境博弈的分析
(坦白,坦白)表明两人共同的集体选择,但是这个选择是否是理性的?理性选择是指使收益最大化的选择。如果两人都抵赖,各判刑1年,显然比坦白各判刑8年好。所以,纳什均衡(坦白,坦白)并不是一个集体理性选择。但它却是个人理性选择的一个组合。囚徒困境正是反映了一个深刻的问题,这就是个人理性与集体理性的矛盾。囚徒困境博弈的分析一个非集体理性选择,如策略组合(坦白,坦白),用经济学术语说,其中存在“帕累托改进”的机会。所谓帕累托改进就是说,它在不使另一部分人的境况变得更坏的前提下,至少能改进一部分人的境况。如果不存在帕累托改进的情况,便达到“帕累托最优”。这里,如果两人都选择抵赖,两人的境况都有所改进。所以,(坦白,坦白)不是帕累托最优。集体的理性选择应该是大家都抵赖。但是这个帕累托改进办不到。为什么?因为我们已经验证,(坦白,坦白)这个策略组合是稳定的,不会有人主动去打破这种格局的。囚徒困境博弈的分析
那么,两个囚徒事先订好攻守同盟,两人都采取抵赖的策略,不是可以改善两人的境遇吗?但问题是,这个攻守同盟有没有意义?没有。原因在于(抵赖,抵赖)这个策略组合不稳定,没有人有积极性去遵守这个同盟。一般地,假设博弈中的每个局中人事先达成一项协议,规定了各自的行为规则。如果局中人会自觉遵守这个协议,等于说这个协议具有约束力:给定别人遵守协议的情况下,自己的最好选择就是也遵守协议。相反,一个协议不具有约束力,它就不可能自动实施,因为至少有一个局中人会违背这个协议。所以,不具有约束力的协议是没有意义的。以上的分析告诉我们,用经济学的观点来看,只有由满足个人理性选择的策略组合才是稳定的。
囚徒困境博弈的启示囚徒困境对社会是非常理想的结果;从两个决策者的立场上则是很不理想的结果;决策者从各自的最大利益出发的选择行为,结果既没有实现两人总体的最大利益,也没有真正实现个人最大利益;该博弈揭示了个人理性与团体理性之间的矛盾---从个人利益出发往往不能实现团体最大利益;也解释了个体理性本身的内在矛盾---个体出发的行为也不一定能真正实现个体的最大利益,甚至得到相当差的结果。
囚徒困境在经济学上的应用两个寡头企业选择产量的博弈就是一个囚徒困境问题。回想一下古诺均衡的含义:古诺均衡是指存在这样一对产量组合(q1*,q2*),使得:假定企业2的产量为q2*时,q1*是企业1的最优产量;假定企业1的产量为q1*时,q2*是企业2的最优产量。产量组合(q1*,q2*)是稳定的。囚徒困境在经济学上的应用看两个寡头合谋与价格卡特尔的情形,它也存在个人理性与集体理性的冲突。在两个寡头合谋条件下的产量与价格决定,是基于两个寡头利润总和的最大化目标,而不是每个企业自己的利润最大化。因此这种最大化目标下的产量分配符合两家企业的共同利益,却不是使每家企业自己的利润最大化的产量,换言之,并不是每家企业自己的“最优反应”。所以,卡特尔产量分配是不稳定的产量组合。正因为此,卡特尔下一定会有违约冲动,卡特尔具有不稳定性。
囚徒困境在经济学上的应用
在军备竞赛中,人们年复一年的谈判,试图签订一个限制军备的条约。但是这种条约也存在个人理性与集体理性的冲突。签订条约对世界和平有利,但履行条约未必是各国行动的“最优反应”:试想,如果我减少军备开支,而你增加军费支出,我不是受到威胁了吗?所以,这种条约不构成约束力,各国都有违约的冲动。结果是各国都大量增加军费预算,结果军备竞赛就只好继续下去。冷战时期前苏联和美国之间的军备竞赛就是典型一例,两国都在导弹上花了几万亿美元,如果把资源用于民用品生产,两国的社会福利就会变得更好。囚徒困境在经济学上的应用
企业竞争而产生的广告资源浪费也是典型例子。如两家寡头竞争,经理们可选择策略是“多做广告”和“少做广告”,各种策略组合的盈利矩阵如下表:企业2少做广告多做广告企业1少做广告30,3010,40多做广告40,1020,20
智猪博弈智猪博弈(boxedpigs).猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下10个单位的食物,但谁踩就需要付2个单位的成本。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前吃到9个单位的食物,小猪吃1个单位的食物;若是大猪踩动了踏板,则大猪吃6个单位,小猪吃4各单位;若同时踩,大猪吃7个单位,小猪吃3各单位。
智猪博弈小猪踩等大猪踩5,14,4等9,-10,0
现实中类似智猪博弈的例子股份公司中大股东与小股东机构投资者与散户大企业与小企业公共产品的提供性别战
一男一女恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出。男的偏好足球,女的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开。下表给出收益矩阵:
女足球芭蕾男足球2,10,0芭蕾0,01,2类似性别战的例子两家工厂生产的产品可能是互补的,一家为另一家提供零配件,这里有一个标准的选择问题,由于种种原因,很可能在产品标准的选择上,生产成品的厂家与生产零配件的厂家之间有冲突。这就需要相互妥协,但妥协的结果有两种可能,或者是生产零配件的厂家适应生产成品的厂家,或者是生产成品的厂家适应于生产零配件的厂家。性别战在经济学上的应用
一家企业率先推出一种新产品,其它企业跟进也是类似性别战的博弈。把新产品率先推向市场的先动企业的成功可能性要大一些,跟进者面临的困难是消费者对先动企业的品牌有了一定的忠诚度,并在头脑中有了先动企业的形象;而且,如果消费者在学习使用先动企业的新产品时花费了学习时间,往往不愿意再花时间或改动设备去使用另一家企业的类似产品。文字处理和数据库软件就是很好的例子。对一种程序或一种输入方法已很熟练者,一般不愿意更换,除非后者有很多优点。性别战在经济学上的应用两个竞争企业是否推出新产品的得益矩阵。究竟是企业1还是企业2赢利,要看是哪一家企业首先行动。企业2无新产品推出新产品企业1无新产品2,2-5,10推出新产品10,-5-7,-7企业2无新产品推出新产品企业1无新产品2,2-5,10推出新产品10,-5-7,-7
斗鸡博弈
试想有两人狭路相逢,每人有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这人就很丢面子;如果对方也退下来,双方则打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两人都前进,那么则两败俱伤。下表给出收益矩阵:乙进退甲进-3,-32,0退0,20,0
类似斗鸡博弈的例子战争期间抢占地盘警察与游行队伍夫妻之间的矛盾例:市场进入阻挠(entrydeterrance)
设想有一家垄断企业已在市场上(称为“在位者”),另一家新企业虎视眈眈想进入(称为“进入者”)。在位者想保持自己的垄断地位,所以就要阻挠进入者的进入。在这个博弈中,进入者有两种策略可以选择:进入还是不进入;在位者也有两种策略:默许还是斗争。各种策略组合的收益矩阵如下表:
在位者默许斗争进入者进入40,50-10,0不进入0,3000,300猜硬币博弈(MatchingPennies)Rockpaperscissors思考题什么是博弈?博弈论主要研究内容是什么?囚徒困境的内在根源是什么?举出现实中囚徒困境的具体例子。1.3博弈的分类和博弈的结构博弈的参与者合作与非合作:合作博弈和非合作博弈;博弈参与人的数目:两人博弈和多人博弈;博弈的策略:有限博弈和无限博弈;博弈的得益:零和博弈和非零和博弈;博弈的过程:静态博弈和动态博弈;博弈的信息结构:完全信息和不完全信息;完美信息和不完美信息;博弈方的能力和理性:完全理性和有限理性。
合作博弈和非合作博弈合作博弈和非合作博弈的区别主要在于人们的行为相互作用时,当事人能否达成一个具有约束力的协议,如果有就是合作博弈,没有就是非合作博弈。合作博弈强调的是集体理性,强调的是效率、公正、和公平;非合作博弈强调的是个人理性,个人最有决策,其结果可能有效率,也可能无效率。静态博弈和动态博弈静态博弈指在博弈中,参与人同时选择行动,或虽非同时但后行动者并不知道前行动者采取了什么具体行动。如:猜硬币博弈、古诺模型和投标活动。动态博弈指的是参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动的博弈。如棋弈比赛、商业大战、商业谈判、讨价还价。完全信息博弈和不完全信息博弈完全信息指的是每一个参与人对所有其他参与人的特征,如策略集合及得益函数都有准确完备的知识;否则就是不完全信息。如投标、拍卖活动中,由于各博弈方对其他博弈方关于标的估价很难了解,各方无法得知拍得标的物的真正得益。将上述两个角度的划分结合起来,我们就得到四种不同类型的博弈,这就是:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈和不完全信息动态博弈。博弈的分类和均衡行动次序信息静态动态完全信息纳什均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《焊接自动化技术》教学大纲
- 点金术课件教学课件
- 玉溪师范学院《社会体育指导员一级》2022-2023学年第一学期期末试卷
- 防疫和应急演练方案及流程
- goodhabits课件教学课件
- 项目建议书与可研报告编制大纲及二者区别
- 特殊气候条件下施工方案
- 2024年二季度碳交易市场运行与政策盘点-碳价突破百元 碳市场扩容在即
- 2024年薯、豆相关植物加工品项目成效分析报告
- 2019粤教版 高中美术 选择性必修2 中国书画《第五单元 以形写神的人物画》大单元整体教学设计2020课标
- 2024至2030年中国智能应变测试系统数据监测研究报告
- 员工技能竞赛方案
- 江苏省南京市六校联考2024-2025学年高一上学期期中考试语文试题(无答案)
- 2022版义务教育物理课程标准
- 风电场工程强制性条文实施计划
- 芯片基础知识单选题100道及答案解析
- 市政道路交通疏导方案施工方案
- 《船舶电气设备操作与管理(二、三类)》全套教学课件
- 顾客满意度调查分析报告表
- 家校共筑成长桥 期中回望促前行-期中考试总结家长会(课件)
- 医院统计信息报送工作制度
评论
0/150
提交评论