博弈论练习1答案_第1页
博弈论练习1答案_第2页
博弈论练习1答案_第3页
博弈论练习1答案_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、博弈论练习一答案一、名词解释博弈:一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下, 同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实 施,各自取得相应结果的过程。零和博弈:所有博弈方在每种策略组合下的得益的总和始终为0的博弈。 完全信息静态博弈:纳什均衡:定义 在博弃G = Si,,S ; 9中如果由各个得弃方的 各一个策略组成的某个策略组合(* ,,$;)中,任一诲弃方的策略, 都是对其余博弃方策略的纪合(s,叶$二,)的最佳对策,也 即 ,S; 1 ,( , 5二I ,,S;,,S二1 Sy 5云,5;)对 任意七e 5都成立,则称(sj ,,Q为G的一个

2、“的什H(Nash Equilibrium) 混合策略:定义 在博G= Si,,$.* ,,“中,博弈才i的策略空间为 St = s, 1s共,则博弃方i以概率分布pi 3诅随机在其k 个可逸策略中选择的“策略”,称为一个“混合策略,其中0 W A, W1对 j = 1 ,,为都成立,且pn + p* = 1。纳什定理:无限次重复博弈民间定理:设G是一个完全佶息的铮态将弃。用 (1,e”)记G的融什均衡的得益,用(11,,xj表示G的任意可 实现得益。如果刀%对任意博弃方都成立,而3足够接近1,那么无 限次重复博奔G(8. S)中一定存在一个子博奔完美的纳什均衡,各博弃 方的平均得益能是Si,

3、,x) 动态博弈除了各博奔方同时决策的静态博弈以外,也有大量现实决策活动构 成的博弈中,各博弈方的选择和行动不仅有先后次序,而且后选择、后行 动的博弈方在自己选择、行动之前,可以看到其他博弈方的选择、行动,甚 至还包括自己的选择和行动。这种博弈无论在哪种意义上都无法看作问 时决策的静态博弈,我们把这种博弈称为“动态博弃”(Dynamic Games)子博弈:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的, 有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一 部分,称为原动态博弈的一个“子博弈”。子博弈完美纳什均衡:如果在一个完美信息动态博弈中,各博弈方的策略构成

4、的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡, 那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。逆推归纳法:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回 前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为逆推 归纳法。二、填空题1、零和博弈、常和博弈和变和博弈2、静态博弈、动态博弈和重复博弈3、一直预测性4、上策均衡、严格下策反复消去法、划线法和箭头法5、可信性问题三、判断题lx 2x 3x 4寸 四、单选题IB 2D 3C 4D 5D 五、计算分析题1丈夫时装足球妻子2,10, 00, 01, 3时装足球(1)该博弈的纯策略纳什均衡

5、为(时装,时装)和(足球,足球)(4分)(2)设混合策略纳什均衡中妻子采取时装、足球的概率分别为pl、p2,(丈夫 采取时装、足球的概率分别为ql、q2,)则对丈夫来讲,其2个纯策略的得益相 同,可得:pl=3p2, 乂pl+p2 =1,可得pl=3/4, p2=l/4,同理可得,ql=l/3, q2=2/3(4分)(3)妻子的得益= 2/3,丈夫的得益= 3/4,相比纯策略纳什均衡得益均减小。(2分)(1)该博弈为零和博弈,各博弈方严格竞争,由划线法可知该博弈无纯策略 纳什均衡。(4分)(2)设混合策略纳什均衡中博弈方1采取石头、剪刀、布的概率分别为pl、p2、P3,博弈方2采取石头、剪刀、

6、布的概率分别为ql、q2、q3,则对博弈方2来 讲,其3个纯策略的得益相同,可得:p2-p3=p3-pl=pl-p2, Xpl+p2+p3=l,可得pl=p2=p3 = l/3,同理q1=q2=q3 = 1/3 (4分)(3)博弈方1的得益=博弈方2的得益= l/3(0+l-l)=0o (2分)(1)乙(借,打)、甲(分)和乙(不借,不打)、甲(不分)为该博弈的 纳什均衡(4分)(2)该博弈的子博弈完美纳什均衡为乙(不借,不打)、甲(不分)(4分)(3)纳什均衡包含子博弈完美纳什均衡,子博弈完美纳什均衡相较于纳什均衡 在每一个子博弈中都是纳什均衡,排除了不可信威胁。(2分)4厂商1 的得益ul

7、=(6-ql-q2)ql,厂商2的得益u2= (6-ql-q2) q2,己知ql, max u2,可得q2=(6-ql)/2,将其代入ul, max ul,可得ql = 3, 乂可求得 q2 = l. 5o7, 1该动态博弈的子博弈完美均衡为:第一阶段厂商1的产量为3,第二阶段厂商2 的产量为1.5。(10分)12, 2对代理人:激励相容约束条件:w(E)-Ew(S)-S参与约束条件: w(E)-E0, w(S)-S0对委托人:委托条件:R(E)-w(E)R(O), R(S)-w(S)R(O)R(E)-w(E)=12, w(E)-E=2, R(S)-w(S) =7, w(S)-S=l, R(0

8、)=0,见上图,由 逆推归纳法,可知,该博弈的子博弈完美纳什均衡为委托人选择委托,代理人 选择接受并努力工作,委托人和代理人的得益分别为(12, 2) o (5分)六、简答题1对一个一般的博弈,只要得益是策略的多元连续函数,我们都可以求每个博 一方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应 函数的交点就是纳什均衡,这种利用反应函数求博弈的纳什均衡的方法称为反 应函数法。在许多博弈中,博弈方的策略是有限且非连续时,其得益函数不是连续可导函 数,无法求得反应函数,从而不能通过解方程组的方法求得纳什均衡。即使得 益函数可以求导,也可能各博弈方的得益函数比较复杂,因此各自的反应函数 也比较复杂,并不总能保证各博弈方的反应函数有交点,特别不能保证有唯一 的交点。2如果有限策略博弃的一个纳什均衡Ji.,缶)满足对每个博介ZH

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论