博弈论讲义5.ppt

上传人：j*** IP属地：河南上传时间：2020-08-05 格式：PPT 页数：35 大小：338.50KB 积分：20 举报 版权申诉

已阅读5页，还剩30页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、第三章完全信息动态搏弈 -子博弈精炼纳什均衡,本章讨论完全动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。,本章分六节,3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5动态博弈分析的问题和扩展讨论,3.1 动态博弈的表示法和特点,3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点,

2、3.1.1 阶段和扩展性表示,阶段：动态博弈中一个博弈方的一次选择行为例子：仿冒和反仿冒博弈,3.1.2 动态博弈的基本特点,策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合，构成一条路径得益对应每条路径，而不是对应每步选择、行为动态博弈的非对称性先后次序决定动态博弈必然是非对称的。先选择、行为的博弈方常常更有利，有“先行优势”。不过也有“后发优势”。,3.2 可信性和纳什均衡的问题,3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法,3.2.1 相机选择和策略中的可信性问题,不同版本的开金矿博弈分钱和打官司的可信性,

3、3.2.2 纳什均衡的问题,第三种开金矿博弈中，（不借-不打，不分）和（借-打，分）都是纳什均衡。但后者不可信，不可能实现或稳定。结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题,3.2.3 逆推归纳法,定义：从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。,乙,不借,

4、借,（1，0）,3.3 子博弈和子博弈完美纳什均衡,3.3.1 子博弈 3.3.2 子博弈完美纳什均衡,3.3.1 子博弈,定义：由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。,3.3.2 子博弈完美纳什均衡,定义：如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺，因此是真正稳定的。逆推归纳法

5、是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,3.4 几个经典动态博弈模型,3.4.1 寡占的斯塔克博格模型 3.4.2 劳资博弈 3.4.3 讨价还价博弈 3.4.4 委托人代理人理论,3.4.1 寡占的斯塔克博格模型,先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择，厂商2后选择，而非同时选择即可。,产量得益厂商1 3单位 4.5 厂商2 1.5单位 2.25,先行优势,3.4.2 劳资博弈,先由工会决定工资率，再由厂商决定雇用多少劳动力,3.4.3 讨价还价博弈,三回合讨价还价,三回合讨价还价博弈结果的讨论,无限回合讨价还价,3.4.4 委托人代理人理论,一、委托人代理人

6、关系经济活动和社会活动中有很多委托人代理人关系，有明显的，也有隐蔽的。工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是。委托人代理人关系的关键特征：不能直接控制，监督不完全，信息不完全，利益的相关性委托人代理人涉及问题：激励机制设计、机制设计理论，委托合同设计问题等,二、确定性的委托人代理人模型,R(S)-w(S), w(S)-S,R(E)-w(E), w(E)-E,R(0),0,R(0),0,代理人的选择激励相容约束： w(E)-E w(S)-S w(E) w(S)+E-S,参与约束：,参与约束,委托人的选择,数值例子,12, 2,0,0,0,0,7，1,

7、E=2, S=1, W(E)=4, w(S)=2,三、选择报酬和连续努力水平的委托人代理人博弈,店主和店员的问题,商店的利润，是均值为0的随机变量店员的负效用，是店员的努力机会成本为1 店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为,参与约束：当店员风险中性时符合其最大利益店主选择下限代入得益公式得：，期望得益为，易求得令得，再代入参与约束得，求数学期望得解得，则店主的最优激励工资计算公式是,3.4.5 工资奖金制度,模型假设： 1.雇员i(i=1,2)的产出函数为，为雇员努力水平，为随机扰动。服从分布密度，均值为0的随机变

8、量。雇员努力的负效用函数为，且。 2.产量高的雇员得到高工资，产量低的得到低工资。 3.两雇员在已知雇主宣布的工资奖金制度下，同时独立选择各自的努力程度。,雇员选择,雇主决定了工资以后，雇员同时决定努力程度：一阶条件这是雇员所选择努力程度必须满足的基本条件。,利用条件概率的贝叶斯法则：,代入得：两雇员情况一样，对努力程度的选择也相同，即：，这样就得到：这就是两雇员之间的静态博弈纳什均衡。若进一步假设，那么,雇主选择,由于雇员之间博弈的均衡是对称均衡，因此双方赢得竞赛的机会都是0.5，假设雇能得到其他工作机会提供的得益是，则保证雇员接受工作的基本条件是：此即“参与约束

9、”。由于在雇员接受工作的前提下，雇主必然尽可能压低工资，因此约束条件可取等号：于是得到：设上述参与约束条件满足，雇主的利润函数为,雇主的期望利润为，因此雇主有如下的最优化问题：上述雇主决策可转化为促使雇员的努力程度满足：一阶条件为：代入两雇员的最优努力水平决定公式得到：,3.6 动态博弈分析的问题和扩展讨论,3.6.1 逆推归纳法的问题 3.6.2 蜈蚣博弈问题,3.6.1 逆推归纳法的问题,逆推归纳法只能分析明确设定的博弈问题，要求博弈的结构，包括次序、规则和得益情况等都非常清楚，并且各个博弈方了解博弈结构，相互知道对方了解博弈结构。这些可能有脱实际的可能逆推归纳法也不能分析比较复杂的动态博弈在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难对博弈方的理性要求太高，不仅要求所有博弈方都有高度的理性，不允许犯任何错误，而且要求所有博弈方相互了解和信任对方的理性，对理性有相同的理解，或进一步有“理性的共同知识”,3.6.2 蜈蚣博弈问题,哈佛大学巴罗教授：两个旅行者从一个以生产细瓷花瓶闻名的地方旅行回来，在提取行李的时候，发现花瓶被摔坏了，就向航空公司索赔。航空公司知道花瓶的价格大概杂八、九十元，但不知道

人人文库> 全部分类> 生活休闲 > 科普知识

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论讲义5.ppt

文档简介

温馨提示

最新文档

评论

博弈论讲义5.ppt

文档简介

温馨提示

最新文档

评论

相关文档