版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五篇不确定性决策第十五章对策论本章的学习要求与内容本章要求掌握对策论的性质、要素和类型,求解完全信息和不完全信息对策均衡的方法。本章分三节,分别介绍对策的特点、完全信息对策、不完全信息对策。1第五篇-第十五章对策论第一节对策的特点一、对策的性质1.对策论是研究理性决策主体间发生冲突时的决策及其均衡问题,即研究理性决策者之间冲突和合作的理论。2.对策论中个人决策同任何经济主体一样,是在给定约束条件下追求效用或收益最大化,但其约束条件不尽相同。传统经济学中经济主体独自决策,既不考虑自己的决策对他人决策的影响,也不考虑他人决策对自己决策的作用,而对策论里的对策,不仅依赖于自己的选择,也依赖于他人的选择,个人最优选择是其他人选择的函数,这就考虑了人们决策的相互影响,更接近于现实世界。2/4/20232第五篇-第十五章对策论3.对策论的应用领域很多,包括政治、经济、军事、体育以及国际关系等多个方面。在经济学中,这种重视理性选择的相互依赖性的思想,不仅构成了现代微观经济学的重要理论,而且为宏观经济分析提供了重要的微观基础。第一节对策的特点2/4/20233第五篇-第十五章对策论二、对策要素(一)局中人1.局中人是指参与对策的直接当事人,他是对策的决策主体和策略的制定者。在不同的对策问题中,局中人的含义是不同的,可能是个人,也可能是团体或集团。2.对策论要求局中人具有理性。(二)策略集合1.策略集合是局中人可能采取的全部策略的集合。2.每个策略集合至少应该有两种不同的策略。
第一节
对策的特点2/4/20234第五篇-第十五章对策论(三)收益函数1.收益函数表征了局中人从对策中获得的收益或效用水平,它是所有局人中策略的函数。2.收益函数通常可以用两种形式表示:一种是用实物或货币收入的绝对数值或相对数值,另一种是用局中人的效用。(四)信息对策的信息是指局中人有关对策的全部知识,包括局中人的特征和行动。(五)均衡均衡是所有局中人最优策略的组合。第一节对策的特点2/4/20235第五篇-第十五章对策论三、对策的类型(一)合作对策与非合作对策1.按照局中人之间能否达成一个有约束力的协议,对策可分为合作对策与非合作对策。2.如果在一个对策过程中,局中人之间的协议、承诺或威胁具有完全的约束力,并能够强制执行,称为合作对策,否则称为非合作对策。
第一节对策的特点2/4/20236第五篇-第十五章对策论(二)静态对策与动态对策1.按照局中人决策时是否存在时间的先后次序,对策可分为静态对策与动态对策。2.如果局中人同时进行决策选择,或者虽非同时但后行动者并不知道先行动者采取什么具体行动,称之为静态对策。当考虑时间因素,对策需要多阶段或重复地进行下去时,就称为动态对策。
第一节对策的特点2/4/20237第五篇-第十五章对策论(三)完全信息对策与不完全信息对策1.按照局中人事先是否拥有其他局中人决策方面的信息,对策可分为完全信息对策与不完全信息对策。2.在完全信息对策中,每一位局中人都拥有所有其他局中人的特征、策略集合及收益函数方面准确的信息;在不完全信息对策中,局中人只能了解上述信息中的一部分。
第一节对策的特点2/4/20238第五篇-第十五章对策论(四)对抗性对策与非对抗性对策在对抗性对策中,局中人的收益或效用完全对立,一方所得必为另一方所失,一方利益的增加必然导致另一方利益的减少,局中人收益之和为零或常数。在非对抗性对策过程中,局中人有各自不同的收益值,其和可以是任意变数。在对抗性对策中,如果局中人各方不管采取何种策略,各自收益之和恒为零,则称之为零和对策;如果各自的收益之和为常数,则称之为常和对策;否则称之为变和对策。第一节对策的特点2/4/20239第五篇-第十五章对策论第二节完全信息对策一、完全信息静态对策标准型对策的基本要素对策的局中人表;每个局中人的所有策略表;每个策略组合所对应的每个局中人的收益表。2/4/202310第五篇-第十五章对策论(一)上策均衡(即占优均衡)1.占优均衡:不管对策中其他局中人的策略是什么,对某一局中人来说,他所采取的策略都是最优策略。2.占优均衡就是所有局中人的占优策略的组合。[例]囚徒困境:该对策占优均衡就是(坦白,坦白)。第二节完全信息对策囚徒困境体现了个人理性和集体理性的矛盾,即个人利己,不一定导致帕累托最优,从而动摇了传统经济学中“经济人”假设,于是以对策论为基石,重构现代经济学理论大厦,已成为一个引人注目的重要研究领域。图5.15.1囚徒困境模型(静态)2/4/202311第五篇-第十五章对策论第二节完全信息对策(二)纳什均衡纳什均衡:当给定其他局中人选择策略的前提下,每个人选择自己的最优策略,把所有局中人选择的最优策略组合起来,就构成纳什均衡。1.纯策略纳什均衡[例]新产品开发[例]性别大战2/4/202312第五篇-第十五章对策论第二节完全信息对策2.混策略纳什均衡混策略即局中人按照某一概率选择纯策略。[例]石头、剪子、布:取胜原则:保守秘密和随机选择。(三)极大化极小均衡2/4/202313第五篇-第十五章对策论第二节完全信息对策二、完全信息动态对策(一)动态对策[例]市场进入阻扰模型若为静态对策,从收益矩阵可见存在两个纳什均衡:(进入,合作)与(不进入,斗争)。若为动态对策,根据逆向递推的思路,可剔除一纳什均衡(不进入,斗争),则动态对策中各局中人理性选择的唯一纳什均衡是(进入,合作)。2/4/202314第五篇-第十五章对策论逆推法:在一般的有限次对策中,逆推法均可用于求解均衡问题,即首先从对策树的末端开始,求解末端的子对策均衡,然后将求出的均衡解取代该子对策。在完全信息动态条件下,如果原对策的所有子对策均达到纳什均衡,则称整个对策均衡为子对策完美纳什均衡。承诺行动是指,局中人使自己的威胁策略变成可以置信的行动。不可置信的威胁,则称空洞威胁。第二节完全信息对策2/4/202315第五篇-第十五章对策论(二)重复对策重复对策是一种特殊的完全信息动态对策,指同样结构的对策重复多次。重复对策可能是有限次的,也可能是无限次的重复对策的均衡结果,往往与一次性对策不同,有限次对策的均衡结果,也与无限次重复对策的均衡结果不同。第二节完全信息对策2/4/202316第五篇-第十五章对策论[例]无限重复囚徒困境囚徒困境重复进行无限次时假定(1)A,B均追求效用最大化,并用
U1,U2,…,Un…分别表示A在各个子对策中获得的收益。(2)A,B收益或效用的贴现系数为
a,且a=1/(1+i),其中i为利率。A在所有子对策中所获收益的贴现值之和可表示为。第二节完全信息对策2/4/202317第五篇-第十五章对策论此时,局中人考虑的是所有未来收益的贴现值之和,而不是一次性的收益。如果A提出彼此抵赖的合作建议,并威胁说:如果你中途变卦,我也将一直坦白,对你惩罚。若施行威胁带来的重复对策贴现值之和,大于不施行威胁的重复对策贴现值之和,威胁变得可以置信。若A与B相互合作,均一直抵赖,可知在每一个子对策中A的收益值为U1=U2=…=Un=…=-1,设a=0.9,贴现值之和为同理,可得局中人B所获收益的贴现值之和为uB=-10。第二节完全信息对策2/4/202318第五篇-第十五章对策论若A与B不能相互合作,一直选择坦白策略,同样可以得到A与B在每一个子对策中所获收益贴现值之和。由于UA>U'A,UB>U'B,说明双方进行合作的承诺是可以置信的。在无限重复的囚犯困境对策中,子对策完美纳什均衡应为(抵赖,抵赖),达到了个人利益与集体利益同时最优,囚犯困境的特征也随之消失。
如果重复的对策是有限次,则采用递推法可以证明,局中人将像一次性对策中那样,将选择(坦白,坦白),继续陷入困境之中。第二节完全信息对策2/4/202319第五篇-第十五章对策论第三节不完全信息对策一、不完全信息静态对策[例]不完全信息市场进入阻扰模型在前述市场进入阻挠模型中增加假定:(1)在位者成本函数有两种类型:高成本与低成本;(2)在位者有完全信息,进入者有不完全信息。图(a)存在两个纳什均衡:(进入,合作)与(不进入,斗争),其中(不进入,斗争)应予剔除。图(b)存在一个纳什均衡:(不进入,斗争)。图5.15.7市场进入阻挠不完全信息静态模型2/4/202320第五篇-第十五章对策论如果进入者知道在位者为高成本,选择进入策略;如果知道在位者为低成本,选择不进入。若高成本概率为P,低成本概率为(1-P)。
选择进入的预期收益为U1=P·40+(1-P)·(-10)=50P-10;选择不进入的预期收益为U2=0·P+0·(1-P)=0。当进入者选择进入所获得的预期收益不小于选择不进入所获得的预期收益时,才会选择进入。即U1≥U2或50P-10≥0,也就是说:当P≥20%时,进入者选择进入策略;当P<20%时,进入者选择不进入策略。第三节不完全信息对策2/4/202321第五篇-第十五章对策论由于有限理性和信息壁垒,不完全信息常常成为局中人所处的现实环境。局中人并不具备其他局中人策略选择方面的完全信息,却具备其概率分布方面的完全信息,这种对策被称为完全但不完美信息对策。贝叶斯均衡表示这样一种策略组合:在给定局中人自己的类型及其他局中人类型概率分布的情况下,每位局中人的预期收益或预期效用都达到最大化。第三节不完全信息对策2/4/202322第五篇-第十五章对策论二、不完全信息动态对策[例]蜈蚣对策运用逆推法可得:局中人A在对策开始时将会直接选择D,结果是A与B各获得仅为1的收益。
第三节不完全信息对策2/4/202323第五篇-第十五章对策论如果B具有完全信息,A具有不完全信息,对策进程见下图:第三节不完全信息对策2/4/202324第五篇-第十五章对策论B属于合作者的概率为P,则他属于短期利益至上者的概率可表示为(1-P),
P∈[0,1]。局中人A首先选择策略R时,预期收益为U1=100·P+0·(1-P)=100P。当A首先选择策略D时,预期收益为U2=1·P+1·(1-P)=1。当U1≥U2或100P≥1时,A首先选择R所获得的预期收益不小于选择D所获得的预期收益,他会先选择R。此对策的一个纳什均衡是:不管B属于哪种类型,在前面的子对策阶段里,A将选择R,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 创新型羊圈施工合同范文
- 塑料制品设备租赁合同范本
- 【初中道法】增强安全意识教学课件-2024-2025学年统编版道德与法治七年级上册
- 初中交通安全教育主题班会
- 2024年图书馆用水水箱采购合同
- 感恩的演讲稿2024
- 高中毕业生代表发言演讲稿
- 建设工程设备贷款协议(34篇)
- 建筑设计的实习报告
- 甜瓜细菌性软腐病
- 《生活中的函数》课件
- 2022-2023学年福建省福州市福清市闽教版五年级上学期期中练习英语试卷(含听力音频)
- 生活区消防自查记录表
- 2024届广东省深圳市宝安区宝安中学物理九上期中质量跟踪监视模拟试题含解析
- 工业设计方法学
- GB/T 43218-2023煤炭测硫仪性能验收导则
- 创新方法大赛理论测试题库(2018、2019、经典题库)
- 湖北省武汉一初慧泉2023-2024+学年上学期9月同步练习Unit1-Unit+3九年级英语试卷
- 《中华商业文化》第五章
- (完整版)华为虚拟化技术方案
- 直播培训合作协议
评论
0/150
提交评论