完全信息静态博弈(“博弈”文档)共109张_第1页
完全信息静态博弈(“博弈”文档)共109张_第2页
完全信息静态博弈(“博弈”文档)共109张_第3页
完全信息静态博弈(“博弈”文档)共109张_第4页
完全信息静态博弈(“博弈”文档)共109张_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本章分六节2.1基本分析思路和方法2.2纳什均衡2.3无限策略博弈分析和反应函数2.4混合策略和混合策略纳什均衡2.5纳什均衡的存在性2.6纳什均衡的选择和分析方法扩展2.1基本分析思路和方法2.1.1上策均衡2.1.2严格下策反复消去法2.1.3划线法2.1.4箭头法2.1.1上策均衡上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略

囚徒困境中的“坦白”;双寡头削价中“低价”。上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策(坦白,坦白),必然是该博弈比较稳定的结果上策均衡不是普遍存在的

2.1.2严格下策反复消去法严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略严格下策反复消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中2.1.3划线法——比较策略之间的相对优劣关系1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争上下左中右2.1.4箭头法——在各策略组合处考察博弈方能否单

1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬币2,10,00,01,3夫妻之争独改变策略增加得益2.2纳什均衡2.2.1纳什均衡的定义2.2.2纳什均衡的一致预测性质2.2.3纳什均衡与严格下策反复消去法2.2.1纳什均衡的定义策略空间:博弈方的第个策略:博弈方的得益:博弈:纳什均衡:在博弈中,如果由各个博弈方的各一个策略组成的某个策略组合中,任一博弈方的策略,都是对其余博弈方策略的组合的最佳对策,也即对任意都成立,则称为的一个纳什均衡2.2.2纳什均衡的一致预测性质

一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的最终结果只有纳什均衡才具有一致预测的性质一致预测性是纳什均衡的本质属性一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能2.2.3纳什均衡与严格下策反复消去法上策均衡纳什均衡:在n个博弈方的博弈中,如果严格下策反复消去法排除了除之外的所有策略组合,那么一定是该博弈唯一的纳什均衡命题2.2:在n个博弈方的博弈中中,如果是的一个纳什均衡,那么严格下策反复消去法一定不会将它消去

上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的2.3无限策略分析和反应函数2.3.1古诺的寡头模型2.3.2反应函数2.3.3伯特兰德寡头模型2.3.4公共资源问题2.3.5反应函数的问题和局限性2.3.1古诺的寡头模型寡头产量竞争——以两厂商产量竞争为例222126qqqq--=2.3.1古诺的寡头模型假设策略组合(q1*,q2*)是该博弈的纳什均衡,则(q1*,q2*)须满足解之得唯一解q1*=q2*=2。因此,策略组合(2,2)是本博弈唯一的纳什均衡,也是本博弈结果。4.5,4.55,3.753.75,54,4不突破突破厂商2不突破突破厂商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产两寡头间的囚徒困境博弈2.3.2反应函数古诺模型的反应函数(3,0)(6,0)(0,3)(0,6)理性局限和古诺调整古诺模型的反应函数图示2.3.3伯特兰德寡头模型价格竞争寡头的博弈模型产品有一定差别,消费者对价格不十分敏感智猪博弈猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,另一边有一个投食口,每踩一下踏板,投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会,抢先吃到落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前,吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完之前,跑到食槽,抢到一半残羹。

结果是:小猪肯定会选择“搭便车”策略,而大猪不得不去踩踏板,为一点残羹,不知疲倦地奔波于踏板和食槽之间。

小样,肯定不会去踩,我踩,能吃一半,不踩,铁定饿肚子,唉,没办法只能亲自动脚了!

我去踩,一口都没有,我才不去踩呢!

决定大猪、小猪策略的核心指标:每次落下的食物数量和踏板与投食口之间的距离。

改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。改变方案三:减量并且移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。OPEC(OrganizationofPetroleum

ExportingCountries

)的限额和突破已知每个成员国自定产量,其博弈结果肯定是油价下跌、利润受损,因此有必要共同协商制定限产额度以维持油价。一旦协议达成,每个成员国出于本位利益都会认为,只要别国遵守限额,我方突破限额生产一定会获得更多利润,且对其他博弈方影响不大。如果每个成员国都这么认为,其结果是产量大增,价格下跌,各成员国只能得到不是最好的结果,同盟不攻自破。OPEC的分配方案-智猪博弈智猪博弈的NE是(按,等待)是一个“多劳不多得,少劳不少得”的均衡。OPEC成功之处在于其最大成员国—沙特的愿望。沙特希望所有的成员国都能控制石油产量以维持油价在一个较高水平上。当某些小国“偷偷”增产时,沙特“大度地”减产以保持总产量的稳定(否则大家都走入囚徒困境)。在这里沙特扮演了“大猪”的角色。因为大家都明白,除非沙特限产,否则大家都崩溃;小国依赖于沙特对OPEC的努力而从中渔利。事实上沙特为了自己获得高价利润,理性地愿意忍受维持OPEC的不匀称摊派。2.3.4公共资源问题公共地的悲剧证明:如果一种资源没有排他性的所有权,就会导致资源的过度使用。公海捕鱼小煤窑的过度开发……有n户农民的村庄共同拥有一片草地,每户农民都有在草地上放牧的自由。每年春天,农民要决定自己养多少只羊。gi:第i户农民饲养的数量,i=1,2,…,n.

N户农民饲养的总量V:代表每只羊的平均价值,v是G的函数,v=v(G),

因为每只羊至少要一定数量的草才不至于饿死,有一个最大的可存活量Gmax,:

当G<Gmax时,v(G)>0;当G>=G(x)时,v(G)=0。当草地上羊很少时,增加一只羊不会对其他羊的价值有太大影响,但随着羊的不断增加,每只羊的价值将急剧下降。GGmax

v参与人:农民策略:养羊的数量支付:利润假设一只羊的成本为c,农民i的利润为:最优化的一阶条件为:

上述一阶条件可以解释为:增加一只羊有正负两方面的效应,正的效应是这只羊本身的价值v,负的效应是这只羊使所有之前羊的价值降低。上述n个一阶条件定义了n个反应函数:因为:所以:第i个农民的最优饲养量随其他农民的饲养量增加而递减。n个反应函数的交叉点就是纳什均衡。尽管每户农民在决定自己增加饲养量时考虑了对现有羊价值的影响,但是他考虑的只是对自己羊的影响,不是对所有羊的影响,因此,最优点上的个人边际成本小于社会边际成本,纳什均衡总饲养量大于社会最优饲养量。合作:总体利益最大化例如:假设n=3,v=100-(q1+q2+q3),c=4,则2.3.5反应函数的问题和局限性在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。(a)(b)2.4混合策略和混合策略纳什均衡2.4.1严格竞争博弈和混合策略的引进2.4.2多重均衡博弈和混合策略2.4.3混合策略和严格下策反复消去法2.4.4混合策略反应函数2.4.1严格竞争博弈和混合策略的引进一、猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方盖硬币方正面反面(1)不存在前面定义的纳什均衡策略组合(2)关键是不能让对方猜到自己策略这类博弈很多,最可靠的方法:以相同的概率随机选择正反面。引出混合策略纳什均衡概念二、混合策略、混合策略博弈

和混合策略纳什均衡

混合策略:在博弈中,博弈方的策略空间为,则博弈方以概率分布随机在其个可选策略中选择的“策略”,称为一个“混合策略”,其中对都成立,且

混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看作一个博弈,就是原博弈的“混合策略扩展博弈”)。混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。三、一个例子该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析2,35,23,11,5CDAB博弈方2博弈方1

策略得益博弈方2的混合策略博弈方1的混合策略四、齐威王田忌赛马3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌齐威王得益矩阵混合策略纳什均衡(1/6,1/6,…,1/6)五、小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略0-D-D’守卫得益((睡)SPt小偷偷的概率1激励悖论:V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒0-P-P’小偷得益(偷)VPg守卫睡的概略1激励悖论:2.4.2多重均衡博弈和混合策略一、夫妻之争的混合策略纳什均衡2,10,00,01,3时装足球时装足球丈夫妻子夫妻之争妻子的混合策略丈夫的混合策略夫妻之争博弈的混合策略纳什均衡策略得益二、制式问题1,30,00,02,2ABAB厂商2厂商1制式问题

制式问题混合策略纳什均衡AB得益引进技术,开发产品等问题中,不同厂商各自为政常常导致效率低下三、市场机会博弈-50,-50100,00,1000,0进不进进不进厂商2厂商1市场机会

进不进得益厂商1:2/31/30厂商2:2/31/30结果是小猪大猪都不去踩踏板了。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3蜈蚣博弈问题pp1621寡占的斯塔克博格模型第三章完全且完美信息动态博弈策略得益可利用聚点均衡(天气,抛硬币),但仍不理想。2动态博弈的基本特点逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。如果有一只猪去踩踏板,另一只猪就有机会,抢先吃到落下的食物。投食仅原来的一半分量。[20-w(S),w(S)-S]定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题服从分布密度为,均值为0的随机变量。第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:2.4.3混合策略和严格下策反复消去法3,10,20,23,31,31,1LRUMD博弈方2博弈方1博弈方2采用纯策略L时,博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用纯策略R时,博弈方1采用混合策略(1/2,1/2,0)的得益D策略相对于混合策略(1/2,1/2,0)为严格下策。2.4.4混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方正面反面猜硬币博弈盖硬币方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布夫妻之争博弈2,10,00,01,3时装足球丈夫时装足球妻子夫妻之争rq111/33/4(r,1-r):妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布(0,0)(1,1)(3/4,1/4):妻子(1/3,2/3):丈夫2.5纳什均衡的存在性纳什定理:在一个由n个博弈方的博弈中,如果n是有限的,且都是有限集(对),则该博弈至少存在一个纳什均衡,但可能包含混合策略。教材106页证明。主要根据是布鲁威尔和角谷的不动点定理。纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。2.6纳什均衡的选择和分析方法扩展2.6.1多重纳什均衡博弈的分析2.6.2共谋和防共谋均衡2.6.1多重纳什均衡博弈的分析帕累托上策均衡风险上策均衡聚点均衡相关均衡二、风险上策均衡

考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。9,98,00,87,7LR博弈方2UD博弈方1风险上策均衡(D,R)当一方偏离(U,L)的可能性大于1/8时,(D,R)是比(U,L)更明智的选择设博弈方2选R的概率为p,则1选U的期望得益:9(1-p)选D的期望得益:8(1-p)+7p由9(1-p)<8(1-p)+7p得p>1/8以两厂商总体利益最大:各生产上述一阶条件可以解释为:增加一只羊有正负两方面的效应,正的效应是这只羊本身的价值v,负的效应是这只羊使所有之前羊的价值降低。公共地的悲剧证明:如果一种资源没有排他性的所有权,就会导致资源的过度使用。1*[20-w(S)]+0.上述雇主决策可转化为促使雇员的努力程度满足:根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题寡头产量竞争——以两厂商产量竞争为例即使得益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一的交点。假设策略组合(q1*,q2*)是该博弈的纳什均衡,则(q1*,q2*)须满足对犯错误性质的判断是解决犯错误引出问题的根本基础。设猎人2选抓兔子的概率为p,则1由5(1-p)<3(1-p)+3p6纳什均衡的选择和分析方法扩展二、风险上策均衡5,53,00,33,3鹿兔子猎人2鹿兔子猎人1猎鹿博弈风险上策均衡(兔子,兔子)设猎人2选抓兔子的概率为p,则1选抓鹿的期望得益:5(1-p)选抓兔子的期望得益:3(1-p)+3p由5(1-p)<3(1-p)+3p得p>2/5三、聚点均衡利用博弈设定以外的信息和依据选择的均衡心理、文化、习惯或者其他各种特征都可能是聚点均衡的依据聚点均衡:多重纳什均衡中比较容易被选择的纳什均衡城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典型例子四、相关均衡——设计某种形式的均衡选择机制5,14,40,01,5LR博弈方2UD博弈方1相关均衡例子三个纳什均衡:(U,L)、(D,R)和混合策略均衡[(1/2,1/2),(1/2,1/2)]结果都不理想,不如(D,L)。可利用聚点均衡(天气,抛硬币),但仍不理想。相关装置:1、各1/3概率发出A、B、C信号2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题一、多人博弈中的共谋问题本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B)前者帕累托优于后者。博弈的结果会是什么呢?(U,L,A)有共谋(Coalition)问题:博弈方1和2同时偏离。0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方2博弈方1博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方2博弈方1博弈方3——B2.6.2共谋和防共谋均衡二、防共谋均衡

如果一个博弈的某个策略组合满足下列要求:(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。称为“防共谋均衡”。前面例子中:(D,R,B)是防共谋均衡(U,L,A)不是防共谋均衡存在于多人博弈中,更复杂的“囚徒困境”问题第三章完全且完美信息动态博弈完全且完美动态博弈:所有博弈方都对博弈过程和得益完全了解的动态博弈。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。动态博弈分析的主要概念和方法:子博弈完美均衡和逆推归纳法本章分六节3.1动态博弈的表示法和特点3.2可信性和纳什均衡的问题3.3子博弈和子博弈完美纳什均衡3.4几个经典动态博弈模型3.5有同时选择的动态博弈模型3.6动态博弈分析的问题和扩展讨论3.1动态博弈的表示法和特点3.1.1阶段和扩展性表示3.1.2动态博弈的基本特点3.1.1阶段和扩展性表示阶段:动态博弈中一个博弈方的一次选择行为例子:仿冒和反仿冒博弈ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒3.1.2动态博弈的基本特点策略是在整个博弈中所有选择、行为的计划结果是上述“计划型”策略的策略组合,构成一条路径得益对应每条路径,而不是对应每步选择、行为动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。后选择、行为的博弈方常常更有利,有“后行优势”。3.2可信性和纳什均衡的问题3.2.1相机选择和策略中的可信性问题3.2.2纳什均衡的问题3.2.3逆推归纳法3.2.1相机选择和策略中的可信性问题不同版本的开金矿博弈——分钱和打官司的可信性乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信乙决策的关键:判断甲许诺的可信性3.2.2纳什均衡的问题

第三种开金矿博弈中,(不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。结论:纳什均衡在动态博弈可能缺乏稳定性,也就是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题3.2.3逆推归纳法定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。乙不借借(1,0)甲不分分(0,4)(2,2)3.3子博弈和子博弈完美纳什均衡3.3.1子博弈3.3.2子博弈完美纳什均衡3.3.1子博弈定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)3.3.2子博弈完美纳什均衡定义:如果一个完美信息的动态博弈中,各博弈方策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。3.4几个经典动态博弈模型3.4.1寡占的斯塔克博格模型3.4.2劳资博弈3.4.3讨价还价博弈3.4.4委托人—代理人理论3.4.1寡占的斯塔克博格模型先后选择产量的产量竞争博弈把古诺模型改为厂商1先选择,厂商2后选择,而非同时选择即可。将厂商2的反应函数q2=3-q1/2代入厂商1的得益函数,得得q1*=3,此时q2*222126qqqq--=

产量得益先行优势3.4.2劳资博弈先由工会决定工资率,再由厂商决定雇用多少劳动力RL0WL厂商的反应函数R(L)斜率为WLW0工会的无差异曲线收益3.4.3讨价还价博弈三回合讨价还价112不接受,出S接受不接受,出S2接受出S1消耗系数本博弈的关键点:如果进行到第三个回合,乙必须接受,因此第三个回合甲的方案具有强制力谈判时间越久,对双方都不利,因此越早达成协议越好分析:第三回合第三回合甲具有选择权,理性的甲在第二回合肯定不会接受,并且第三回合自己出价S=10000分析:第二回合分析:第一回合均衡解三回合讨价还价博弈结果的讨论(S=10000)无限回合讨价还价——化归假设该博弈有一个逆推归纳法解,甲和乙的得益分别为S和10000-S,则二、无不确定性的委托人—代理人模型[R(S)-w(S),w(S)-S][R(E)-w(E),w(E)-E][R(0),0][R(0),0]122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束:w(E)-E>w(S)-Sw(E)>w(S)+E-S参与约束:22[R(E)-w(E),w(E)-E]拒绝接受拒绝接受[R(0),0][R(S)-w(S),w(S)-S][R(0),0]接受:w(E)-E>0接受:w(S)-S>0参与约束委托人的选择11不委托委托委托[R(S)-w(S),w(S)-S][R(0),0][R(E)-w(E),w(E)-E]不委托[R(0),0]委托:R(E)-w(E)>R(0)不委托:R(E)-w(E)<R(0)委托:R(S)-w(S)>R(0)不委托:R(S)-w(S)<R(0)数值例子[12,2][0,0][0,0]122偷懒努力拒绝接受不委托委托[7,1]E=2,S=1,W(E)=4,w(S)=2三、有不确定性但可监督的

委托人—代理人博弈10022[0,0][0,0][10-w(S),w(S)-S][20-w(S),w(S)-S][10-w(E),w(E)-E][20-w(E),w(E)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托代理人偷懒:委托:0.1*[20-w(S)]+0.9*[10-w(S)]>0不委托:0.1*[20-w(S)]+0.9*[10-w(S)]<0代理人努力委托:0.9*[20-w(E)]+0.1*[10-w(E)]>0不委托:0.9*[20-w(E)]+0.1*[10-w(E)]<0因为可监督,因此代理人报酬与成果无关,只与努力情况有关。不确定性风险由委托人承担。代理人选择同无不确定性情况。四、有不确定性且不可监督的

委托人—代理人博弈122[0,0][0,0][10-w(S),w(10)-S][20-w(20),w(20)-S][10-w(10),w(10)-E][20-w(20),w(20)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托0只能根据成果付酬,w是成果函数,而非努力程度函数。不确定性对代理人利益、选择有影响。努力:0.9*[w(20)-E]+0.1*[w(10)-E]>0.1*[w(20)-S]+0.9*[w(10-S)]接受:0.9*[w(20)-E]+0.1*[w(10)-E]>0委托:0.9*[20-w(20)]+0.1*[10-w(10)]>0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要根据上述两个条件,以及E、S的值,选择最佳的工资水平w(20)和w(10),或者它们的差额w(20)-w(10)五、选择报酬和连续努力水平的

委托人—代理人博弈R,CC(e)+R(e)委托人希望的代理人努力水平(满足参与约束)产出函数委托人得益:代理人得益:机会成本代理人利益与委托人利益完全一致,代理人行为符合委托人的最大利益店主和店员的问题

pp141商店的利润,是均值为0的随机变量店员的负效用,是店员的努力机会成本为1店主采用的报酬计算公式店员的得益店员期望得益为店主的得益为参与约束:当店员风险中性时,符合其最大利益店主选择下限代入得益公式得:期望得益为,易求得令得,再代入参与约束得,求数学期望得解得,则店主的最优激励工资计算公式是商店100%的营业利润成为店员的提成,店主向店员收取3单位承包费(或租金)3.5.1标准模型博弈中有四个博弈方,分别称为博弈方1、博弈方2、博弈方3和博弈方4第一阶段是博弈方1和博弈方2的选择阶段,他们同时在各自的可选策略(行为)集合和中分别选择和

第二阶段是博弈方3和博弈方4的选择阶段,他们在看到博弈方1和博弈方2的选择和以后,同时在各自的可选策略(行为)集合和中分别选择和博弈方的得益都取决于所有博弈方的策略即博弈方i的得益是各个博弈方所选择策略的多元函数3.5.3国际竞争和最优关税pp146-国家i市场上商品总量Qi,出清价格Pi=a-Qi,i=1,2企业i生产hi供内销,ei供出口Qi=hi+ej,i,j=1,2两企业的边际成本均为c,国家j的关税率为tj

企业i的出口成本为cei+tjei,国内销售成本为chi第一阶段:两国同时制订关税率t1,t2

第二阶段:两企业根据t1,t2同时决定各自内销和出口产量h1,e1和h2,e23.5.3国际竞争和最优关税厂商的得益函数为:第二阶段厂商选择:hi是ti的增函数,ej是ti的减函数,关税具有保护本国企业的作用t1=t2=0时即为古诺模型第一阶段政府选择:先把第二阶段根据厂商选择得到结果代入政府得益,再求最优化:政府的得益函数;由消费者剩余,本国企业利润和国家关税收入构成3.5.4工资奖金制度——雇员间存在竞争

模型假设:1.雇员i(i=1,2)的产出函数为,为雇员努力水平,为随机扰动。服从分布密度为,均值为0的随机变量。雇员努力的负效用函数为,且。2.产量高的雇员得到高工资,产量低的得到低工资。3.两雇员在已知雇主宣布的工资奖金制度下,同时独立选择各自的努力程度。雇员选择雇主决定了工资以后,雇员同时决定努力程度:一阶条件这是雇员所选择努力程度必须满足的基本条件。给定对方选择,选择使自己期望得益最大的努力程度利用条件概率的贝叶斯法则:

代入一阶条件得:两雇员情况一样,对努力程度的选择也相同,即,这样就得到:这就是两雇员之间静态博弈的纳什均衡。若进一步假设,那么σ增大,e*减小雇主选择

由于雇员之间博弈的均衡是对称均衡,因此双方赢得竞赛的机会都是0.5,假设雇员能得到其他工作机会提供的得益是,则保证雇员接受工作的基本条件是:此即“参与约束”。

由于在雇员接受工作的前提下,雇主必然尽可能压低工资,因此约束条件取等号:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论