2022年2022年博弈论知识点总结_第1页
2022年2022年博弈论知识点总结_第2页
2022年2022年博弈论知识点总结_第3页
2022年2022年博弈论知识点总结_第4页
2022年2022年博弈论知识点总结_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选学习资料 - - - 欢迎下载学习必备精品学问点博弈论学问总结博弈论概述 :1.博弈论概念:博弈论:就为讨论决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题;博弈论讨论的假设:1. 决策主体为理性的,最大化自己的收益;2. 完全理性为共同学问3. 每个参加人被假定为可以对所处环境以及其他参加者的行为形成正确的信念与预期2.和博弈有关的变量:博弈参加人:博弈中挑选行动以最大化自己受益的决策主体;行动:参加人的决策挑选战略:参加人的行动规章, 即大事与决策主体行动之间的映射,也为参加人行动的规章;信息:参加人在博弈中的学问,特殊为其他决策主体的战略.收益.类型(不完全信息)等的信息

2、;完全信息:每个参加人对其他参加人的支付函数有精确的明白;完善信息:在博弈过程的任何时点每个参加人都能观看并记忆之前各局中人所挑选的行动,否就为不完善信息;不完全信息:参加人没有完全把握其他参加人的特点.战略空间及支付函数等信息,即存在着有关其他参加人的不确定性因素;支付:决策主体在博弈中的收益;在博弈中支付为全部决策主题所挑选的行动的函数;从经济学的角度讲, 博弈为决策主体之间的相互作用,因此和传统个人决策存在着区分:3.博弈论与传统决策的区分:1. 传统微观经济学的个人决策就为在给定市场价格.消费者收入条件下,最大化自己效用,讨论工具为无差异曲线;可表示为:maxup、i,其中p 为市场价

3、格,i 为消费者可支配收入;2. 其他消费者对个人的综合影响表示为一个参数市场价格,所以在市场价格既定下,消费者效用只依靠于自己的收入和偏好,不用考虑其他消费者的影响;但为在博弈论理个人效用函数仍依靠于其他决策者的挑选和效用函数;4.博弈的表示形式:战略式博弈和扩展式博弈战略式博弈 :为博弈问题的一种规范性描述,有时亦称标准式博弈;战略式博弈为一种假设每个参加人仅挑选一次行动或战略, 并且参加人同时进行挑选的决策模型, 因此, 从本质上来讲战略式博弈为一种静态模型, 一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题;精品学习资料精选学习资料 - - - 欢迎下载1.参加人集合 1 、 2

4、、.、n :精品学习资料精选学习资料 - - - 欢迎下载2.每位参加人非空的战略集sin3.每位参加人定义在战略组合s i i 1 s1 、.、s i 、.、s n 上的效用函数uis1、s2、sn.精品学习资料精选学习资料 - - - 欢迎下载扩展式博弈 :为博弈问题的一种规范性描述;与战略式博弈侧重博弈结果的描述相比,扩展式博弈更留意对参加人在博弈过程中遇到决策问题时序列结构的分析;包含要素:1 . 参加人集合 1 、 2、.、n 精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点2 . 参加人的行动次序,即每个参加人在何时行动;3 . 序列结构:每个参加人行动时面临的决策

5、问题,包括参加人行动时可供挑选的行动方案.所明白的信息;4 . 参加人的支付函数;比较 :1.战略式博弈从本质上来讲为一种静态模型;2.扩展式博弈从本质上来讲为一种动态模型;5.博弈论分类:按决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议可分为:1.合作博弈(强调团体理性.团体最优决策.效率)2.非合作博弈(强调个人理性,个人最优决策)按参加人行动先后次序可分为:1. 静态博弈:博弈中参加人同时行动,或者虽然不为同时行动,但为在行动前不知道其他参加人所挑选的行动;2. 动态博弈:参加人的行动有先后次序,后行动者获得先行动者的行动信息;按参加人对信息的把握程度可分为:1. 完全信息

6、:每个参加人对其他全部参加人的特点.战略空间及支付函数有精确的明白,博弈开头时不存在不确定性因素;2. 不完全信息:参加人没有完全把握其他参加人的特点.战略空间及支付函数等信息,即存在着有关其他参加人的不确定性因素;按决策主体对信息的把握程度和行动的先后次序,博弈可以分为: 完全信息静态博弈.完全信息动态博弈.不完全信息静态博弈.不完全信息动态博弈;静态动态精品学习资料精选学习资料 - - - 欢迎下载完全信息完全信息静态博弈均衡:纳什均衡不完全信息不完全信息静态博弈 均衡:贝叶斯纳什均衡完全信息动态博弈均衡:子博弈精炼纳什均衡不完全信息动态博弈均衡:精炼贝叶斯纳什均衡精品学习资料精选学习资料

7、 - - - 欢迎下载6.依据所学这四种博弈的特点对这四种博弈做一个对比分析:每个参加人对其纳什均纯 战略纳占优战略纳箭头法hotelling 价格竞多重性和存他全部参加人的衡什均衡什均衡划线法争在性特点.战略空间及pne( dse)库诺特价格竞争支付函数有精确重复剔除的不断剔除劣一般一个博弈中的明白, 博弈开头占 有 均 衡战略(弱劣存在参加者有多时不存在不确定 性因素, 参加人同ifde战略的剔除次序会影响个行动时可以先考虑能否剔除弱时行动或者不为均衡结果战略简化博弈同时行动但为后混 合战略聚点均衡支付最大化社会福利博弈行动者不知道行纳 什均衡法小偷保卫博弈类型信息和行动特点均衡均衡类型特

8、殊均衡求解方法学过的例子性质完全信息静态博弈精品学习资料精选学习资料 - - - 欢迎下载动者的行动信息;战略和行动相同;mne支付等值法精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点精品学习资料精选学习资料 - - - 欢迎下载完全信息动态博弈在 博弈 开头之前子博弈子 博弈 精有限次重复与纳什均衡连 锁 店 悖 论 1 . 均 衡 结果 为 原博 弈 的精品学习资料精选学习资料 - - - 欢迎下载参 与人之间的信精炼纳炼 纳什均博弈均衡的唯独性有息 不存在不确定什均衡衡关性,但为参加人行动存在先后次序;在 完全 信息动态博弈中, 为了表示参 与人 之间的信无限次重复博

9、弈 均 衡(无名氏定理)与贴现因子有关囚徒困境(冷酷战略)无限期轮番讨价仍价模型nash 均衡;2. 同 时 在每 一 个子 博 弈上 构 成精品学习资料精选学习资料 - - - 欢迎下载息把握关系, 引入一般博弈逆向归纳法斯坦科尔伯格寡nash 均衡精品学习资料精选学习资料 - - - 欢迎下载了信息及的概念;求解头竞争雇主与公会之间的竞争不完全在 博弈 开头之前贝叶斯贝 叶斯纳混 合 战略对原混合战性别战1.均衡存在信息静参 与人 之间的信纳什均什均衡(不完全信略加入少许性态博弈息存在不确定性,衡息情形下纯不确定性因2.不确定性但 为参 与人同时战略均衡的素,求极限;表达为类型行 动或 者

10、不为同极限)的不确定性时 行动 但为后行动 者不 知道行动者的行动信息;一般贝叶斯均衡harsanyi 转换机制设计不 确定 为参加人的 了性 的不确定性不完全在博弈开头前参精炼贝信 号传递分别均衡依据所得信信号传递博弈不完全信息信息动与人之间的信息叶斯纳博弈息修正判定不完全信息重复动态博弈子态博弈存在不确定性, 同时参加人行动存什均衡混同均衡概率,依据收益最大化博弈与声誉milgrom-roberts博弈精炼纳什均衡与海在先后次序; 不完全信息动态博弈准分别均衡决策垄断限价模型萨尼不完全信息静态博过程不仅为参加弈贝叶斯均人挑选行动的过衡的结合;程,而且为参加人不断修正信念的过程;二.四种博弈

11、类型详细分述1.完全信息静态博弈1.1 完全信息静态博弈特点:每个参加人对其他全部参加人的特点.战略空间及支付函数有精确的明白,博弈开头时不存在不确定性因素,参加人同时行动或者不为同时行动但为后行动者不知道行动者的行动信息;战略和行动相同;1.2 完全信静态博弈相关概念:以新产品开发博弈举例说明:精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点参加人 :参加人1 和 2;参加人的集合卡表示为:=1、2, n.表示全部参加人的集合,在新产品开发博弈中为: =1、2行动 :开发.不开发;ai 表示参加人行动的集合;新产品开发博弈中参加人的行动集合为a1=a2=a、b、其中 a为开发

12、, b 为不开发;a=a1、a2an 表示参加人的行动组合;新产品开发博弈中为:a=( a、a)、a、b、b、a、b、b战略 :参加人的行动规章;在博弈中的战略可以定义为从观测集到行动集的映射关系,即:si:xi ai;用si=si表示参加人全部战略的集合;在 n 人博弈中,用s=s1、s2、s3、sn 表示n 个参加人的战略组合,它表示博弈中每个参加人实行战略si 的一种博弈情形;在完全信息静态博弈中,由于不存在决策时序上的差异,全部参加人在同一决策时点即博弈开头的那一时刻决策,因此,全部参加人面临的决策情形都只有一种,所以, 参加人的战略集与行动集相同;支付 :为指参加人在博弈中的所得;一

13、般情形下也为用效用函数来表示参加人在博弈中的所得; 因此, 参加人的支付就可表示为一种特定博弈情形下参加人得到的确定效用水平或期望效用水平; 支付一般用ui1、2、n 表示参加人i 的支付 效用水平 ,支付组合 u=u1、u2、un表示参加人在特定博弈情形下所得到的支付,其中为参加人i 的支付;因此,参加人 i=i=1、2、n的支付就可表示为:ui=uisi 、s-i.信息 :为参加人所具有的有关博弈的全部学问,如有关其它参加人行动或战略的学问.有关参加人支付的学问等等;在“新产品开发博弈”中,假如两个企业都知道市场需求,那么这样的博弈情形就为我们前面所提到的完全信息假设;假如两个企业中至少有

14、一个不知道市场需求,那么这样的博弈情形就为我们前面所提到的不完全信息假设;1.3 纯战略纳什均衡纯战略 :参加人在给定信息下只挑选一种特定(或确定性)的战略混合战略: 混合战略说明了一个参加人对其他参加人所实行的行动的不确定性,它描述了参加人在给定信息下以某种概率分布随机地挑选不同的行动或战略;纯战略纳什均衡中包括:占有均衡.重复剔除劣战略均衡.一般纯战略纳什均衡等;1.占优均衡占优战略: 参加人的最优战略si * 与其他参加人的挑选s-i 无关;无论其他参加人挑选什么战略,参加人的最优战略总为唯独的,这样的最优战略称之为“占优战略”;在 n 人博弈中,假如对于全部的其他参加人的挑选s-i,s

15、i * 都为参加人i 的最优挑选u s* 、 su s 、 s精品学习资料精选学习资料 - - - 欢迎下载就称 si *为参加人的占优战略;iiiiii精品学习资料精选学习资料 - - - 欢迎下载在 n 人博弈中, 假如对全部参加人都存在占优战略si * ,就占优战略组合si*=(s1 * si2*、 sn *)称为占优战略均衡;假如全部参加人都有占优战略存在,那么占优战略均衡就为唯独的全部理性参加人可以猜测到的博弈结果;2.重复剔除劣战略假如在一个博弈中,参加人不存在占优战略,但为参加人i 存在两个战略,其中一精品学习资料精选学习资料 - - - 欢迎下载ui si、 s i ui si

16、、 s i 精品学习资料精选学习资料 - - - 欢迎下载个战略叫另一个战略的所得效用要大,就理性的参加人肯定不会挑选战略;精品学习资料精选学习资料 - - - 欢迎下载严格劣战略 :ui siu si、 s i 、 s i u i siu i si、 s i 、 s i 精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点弱劣战略 :如重复剔除过程始终可连续到只剩下唯独的战略组合,就该战略组合即为重复剔除的占优均衡,此时该博弈为重复剔除战略可解;要点:再重复剔除过程中,假如每次剔除的为严格劣战略,均衡结果与剔除次序无关;假如剔除的为弱劣战略,均衡结果可能与剔除次序有关;3.一般

17、nash 均衡nash 均衡为完全信息静态博弈的解的概念,在完全信息静态博弈中,构成 nash 均衡的战略为不行剔除的,即不存在任何一个战略严格优于nash 均衡战略;求解纳什均衡的方法划线法.箭头法;划线法 :1.考察参加人1 的最优战略2.用上述方法找出参加人2 的最优战略3.找出最优战略组合箭头法:1. 对于每个战略组合,检查为否有参加人会偏离这个战略组合2. 直至找出没有参加人会偏离的战略组合纯战略均衡反映函数:各博弈方挑选的纯策略对其他博弈方纯策略的反应;1.4 混合战略纳什均衡混合战略:1k精品学习资料精选学习资料 - - - 欢迎下载在博弈g; s1 、.、 sn ;u1、.、

18、un中,对任一参加人i ,设 si=s i、s i、 就参加人精品学习资料精选学习资料 - - - 欢迎下载ii的一个混合战略为定义在战略集si上的一个概率分布 i= i 1、 i k、 其中 jjj(j=1、k )表示参加人i 挑选战略表示参加人i 挑选战略si的概率的概率,即 ij满意 0 i 1,其中概率之和为1;支付:混合战略的支付为各种概率下收益的加权平均;混合战略纳什均衡:精品学习资料精选学习资料 - - - 欢迎下载在博弈 g; s1、.、sn ; u1 、.、 un 中, 混合战略组合 i= 1* 、 n* 为一个 nash精品学习资料精选学习资料 - - - 欢迎下载均衡;当

19、且仅当i、有v * 、* v 、* ;精品学习资料精选学习资料 - - - 欢迎下载iiiiiiii混合战略 nash 均衡的求解:1. 支付最大化法;2. 支付等值法;混合战略均衡反映函数:在混合策略的范畴内,博弈方的决策为挑选概率分布,因此,反应函数就为一方对另一方挑选的概率分布的反应;聚点均衡:在现实生活中, 参加人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点”均衡;这些信息可能与社会文化习惯.参加人过去博弈的历史有关;不同均衡概念之间的关系:占优均衡 <重复剔除劣战略均衡<纯战略纳什均衡<混合战略纳什均衡1.5 纳什均衡的多重性与存在性存在性:每个有限战略式博弈

20、(参加人与相应的战略集均为有限)必存在纳什均衡,这个均衡可能为纯战略纳什均衡,也可能为混合战略纳什均衡;多重性: 一个博弈可能有多个均衡,博弈论并没有一个一般的理论证明,哪一个纳什均衡结果肯定能显现;精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点2.完全信息动态博弈2.1 完全信息动态博弈特点:在博弈开头之前参加人之间的信息不存在不确定性,但为参加人行动存在先后次序;在完全信息动态博弈中,为了表示参加人之间的信息把握关系,引入了信息及的概念;2.2 完全信息动态博弈有关概念:信息集 :信息集i i 为参加人i 决策结的一个集合,它满意以下两个条件:1 . i i 中的每个决策

21、结都为参加人i 的决策结;2.当博弈到达i i 时,参加人i知道自己处在该信息集中的某个决策结,但不知道为哪一个;在博弈树中,属于同一信息集的决策结一般用虚线连接起来;结 :包括决策结和终点结两类;决策结为参加人实行行动的点时点,终点结为博弈行动路径的终点;一个信息集可能只包含一个决策结,也可能包含多个决策结;假如只包含一个决策结的信息集就为但单结信息集;假如博弈中全部信息集都为单结的就成为完善信息博弈;子博弈 :为原博弈的一部分,它始于原博弈中一个单结信息集中的决策结x,并由决策结 x 及其后续结共同组成;1. 子博弈可以作为一个独立的博弈进行分析,并且与原博弈具有相同的信息结构;2. 原博

22、弈可以作为自身的一个子博弈;2.3 不完全信息静态博弈均衡子博弈精炼nash 均衡:解决 nash 均衡多重性问题的一种主要方法就为精炼的方法,即在nash 均衡的基础上,通过定义更加合理的博弈解并剔除不合理的均衡;子博弈精炼纳什均衡的引入就为将那些包含不行置信威逼战略的纳什均衡从均衡中剔1sn除,从而给出动态博弈结果的一个合理猜测;即子博弈精炼纳什均衡要求均衡战略的行为规章在每个信息集上都为最优的;精品学习资料精选学习资料 - - - 欢迎下载扩展式博弈的战略组合足以下条件: 1.为原博弈的nash 均衡s*s* 、.、* ,为一个子博弈精炼nash 均衡,当且仅当满精品学习资料精选学习资料

23、 - - - 欢迎下载2.在每一个子博弈上构成nash 均衡一个战略组合为子博弈精炼nash 均衡当且仅当它对全部的子博弈 包括原博弈 构成 nash 均衡,同时也意味着原博弈的nash 均衡并不肯定为子博弈精炼nash 均衡,除非它仍对全部子博弈构成nash 均衡;2.4 不完全信息静态博弈均衡求解逆推归纳法逆推归纳法为最常用的求解子博弈精炼nash 均衡的方法,其步骤为:其中 xi 代表博弈中由最底层到博弈起点的次序,以 x3 为最底层,就有:1. 找出博弈的全部子博弈;2. 依据博弈进程的“反方向”逐一求解各个子博弈,即最先求解最底层的子博弈,再求解上一层的子博弈,.,直至原博弈;由于逆

24、推归纳法对各个子博弈逐一进行求解,因此,逆推归纳法所得到的解在各子博弈上构成 nash 均衡 、 即意味着逆推归纳法所得的解为子博弈精炼纳什均衡2.5 完全信息动态博弈中承诺行动的均衡结果分析:承诺行动: 就为在博弈开头之前参加人实行某种转变自己支付或战略空间的行动,该行动使原本不行信的威逼变得可信;但为参加人的承诺行动为有成本的,否就这种承诺就不行信;精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点例子 :要挟诉讼要挟诉讼就为指那种原告几乎不行能胜诉而其惟一的目的为期望通过私了而得到一笔赔偿的诉讼; 该博弈的结果为原告挑选不指控,博弈终止; 博弈的结果好像与人们观测到的 现实

25、并不相符,由于现实中人们经常看到各种“要挟”发生;在上述模型中,“要挟”之所以没有胜利,关键在于原告将会起诉的威逼并不行信;要为威逼变得可信,就必需实行承诺行动(沉没成本) ;这样参加人的威逼就会变得可信,从而使其他博弈参加人转变策略;2.6 重复博弈议题:1.将来可信的威逼或承诺如何影响到当前的行动2.在一次博弈中无法实现的均衡,在重复博弈中能否实现有限次重复博弈:对于给定的阶段博弈g,令 g t 表示 g重复进行 t 次的有限重复博弈,并且在下一次博弈开头前,全部以前博弈的进程都可被观测到;有限次重复博弈均衡结论:假如阶段博弈g有唯独的nash 均衡,就对任意有限的t,重复博弈g t 有唯

26、独的子博弈精炼解,即g的 nash 均衡结果在每一个阶段重复进行;而且在有限次重复博弈中,假如在单阶段博弈中均衡解不只有一个,就对将来行动所作的可信威逼或承诺可以影响到当前的行动;无限次重复博弈:给定一阶段博弈g,令g 、 表示相应的无限重复博弈,其中 g将无限次的重复进行,且参加人的贴现率为;对每个 t ,之前 t -1 次阶段博弈的结果 在 t 阶段开头进行前都可以被观测到,每个参加人在g 、 中的收益都为该参加人 在无限次的阶段博弈中所得收益的现值;无限次重复博弈的解无名氏定理:令 g为一个 n 人阶段博弈,令(e1、e2、en )为 g的一个 nash 均衡下的收益,且用 x1、x2、

27、xn 表示 g的其它任何可行收益,表示可行收益的集合;如存在xiei 、对i 、 xix就存在贴现率,使无限重复博弈g、 存在一个子博弈精炼nash 均衡,其平均收益可达到 x1、x2、xn ;无名氏定理的说明:在无限次重复博弈中,假如参加人具有足够的耐心(只要满意肯定的条件),那么任何满意个人理性的可行收益向量都可以通过一个特定的子博弈精炼nash 均衡得到;影响重复博弈结果的因素:影响重复博弈结果的为重复的次数和信息的完备性;2.7 子博弈精炼nash 均衡与 nash 均衡的区分:由于子博弈精炼nash 均衡在任一决策结上都能给出最优决策,这也使得子博弈精炼纳什均衡不仅在均衡路径 即均衡

28、战略组合所对应的路径 上给出参加人的最优挑选,而且在非均衡路径 即除均衡路径以外的其它路径 上也能给出参加人的最优挑选;即子博弈精炼nash 均衡不会含有参加人在博弈进程中不合理的.不行置信的行动;3. 不完全信息静态博弈3 1不完全信息静态博弈特点:在博弈开头之前参加人之间的信息存在不确定性,但为参加人同时行动或者不为同时行动但为后行动者不知道行动者的行动信息;在不完全信息静态博弈中,在博弈开头前存在关于博弈人信息的不确定性,这个不确定像通常为博弈参加人的类型;精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点在市场进入博弈中不完全信息表现为:在位者的成本类型(高成本.低成本)

29、在斗鸡博弈中不完全信息表现为:参加人的性格类型(强硬,脆弱)3.2 海萨尼转换由于在不完全信息静态博弈中,参加人的类型存在不确定性,所以当一个参加人并不知道在与谁博弈时, 博弈的规章为无法定义的,海萨尼提出了海萨尼转换解决这种不确定的问 题;解决方法 :海萨尼指出, 引入虚拟参加人自然,由自然先打算参加人的不同类型,将不完全信息博弈转换为不完善信息博弈;海萨尼通过引入“虚拟”参加人,将博弈的起始点提前, 从而将原博弈中参加人的事前不确定性转变为博弈开头后的不确定性;这种通过引入“虚拟”参加人来处理不完全信息博弈问题的方法称为harsanyi转换;海萨尼转换留意要点:1.海萨尼转换规定:参加人关

30、于“自然”挑选的推断为共同学问;2.“自然”的挑选;在一般的不完全信息博弈问题中,harsanyi转换规定“自然”挑选的为参加人的类型type;除了依据参加人的支付来划分参加人的类型以外,仍可以依据参加人的行动空间,甚至依据参加人把握信息的多少 或程度 来划分参加人的类型;3.参加人关于“自然”挑选的推断为基于自己类型判定的条件概率;3.3 不完全信息静态博弈均衡贝叶斯纳什均衡贝叶斯博弈的定义:贝叶斯博弈包含以下五个要素:1. 参加人集合b=1、2 ,、n2. 参加人的类型集合t1、t23. 参加人关于其他参加人类型的推断p1t -1 |t 1 ,、pnt-1 n|t n4. 参加人类型相依的

31、行动集at 1、at n5. 参加人类型相依的支付函数贝叶斯博弈的战略 :在贝叶斯博弈 g= ;ti ;( pi );( a( t i );( ui ( a( t ); t i ) 中,参加人 i 的一个战略为从参加人的类型集 ti 到其行动集的一个函数 s i t i ;它包含了当自然给予 i 的类型为 t i 时, i 将从可行的行动集 ai t i 中挑选的行动;贝叶斯博弈的时间次序:1.“自然”挑选参加人的类型组合t=t1、t n2.参加人同时挑选行动,每个参加人i 从行动集ai t i 中挑选行动ai t i 3.参加人i 得到支付贝叶斯纳什均衡:在贝叶斯博弈中,对于一个理性的参加人

32、i ,当他只知道自己的类型t i 而不知道其他参加人的类型时,给定其他参加人的战略s -i,他将挑选使自己期望效*用 支付 最大化的行动a it i ,其中精品学习资料精选学习资料 - - - 欢迎下载a i ti argmaxvi a i 、 si ; ti 精品学习资料精选学习资料 - - - 欢迎下载贝叶斯博弈纳什均衡的存在性:aiait i 精品学习资料精选学习资料 - - - 欢迎下载一个有限的贝叶斯博弈肯定存在贝叶斯nash 均衡;3.4 贝叶斯博弈与混合战略均衡(关于混合战略纳什均衡的一个说明)第一,混合策略均衡不为现实生活的一个合理描述,人们并不为依据概率分布来挑选自己行动;海

33、萨尼证明,在完全信息情形下的混合策略均衡可以说明为不完全信息情形下纯策略均衡的极限;混合策略的本质:精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点混合策略的本质不在于参加人随机的挑选行动,而在于他不能确定其他参加人将挑选什么纯策略,这种不确定性可能来自于参加人不知道其他参加人的类型;海萨尼的基本思想:只要在原先的博弈中加入少许不完全信息因素,使得参加人的支付函数中的收益不再为确定的,而为和一个有范畴的不确定参数有关,从而通过将混合战略均衡求解转换为贝叶斯均衡的极限解,但为得到的纯战略贝叶斯均衡就与完全信息下的混合战略均衡相像;结论 :完全信息博弈的混合战略nash均衡可以说明

34、为与之亲密相关.存在一点点非完全信息的纯战略贝叶斯nash均衡;同时海萨尼给出了描述混合策略和纯策略之间关系的一个正式的定理:混合策略均衡的纯化定理;3.5 贝叶斯均衡eg: 机制设计问题机制设计问题实际上就为探讨设计者如何向参加人供应鼓励,以促使参加人向设计者透露其把握的信息(说真话),从而确定对设计者有利的结果的问题;这一机制对 应于一个博弈形式,设计者需要设计出一个博弈形式,让参加人在这个博弈形式下进行博弈从而实现他的目标;博弈形式不同, 实现目标的程度也不一样,设计者必需挑选对他来说为最有利的博弈形式,即最有利的机制;机制设计的基本模型:机制设计为典型的3 阶段不完全信息博弈,期阶段如

35、下:阶段 1:机制设计者 托付人 设计一种“机制”,或者“契约”,或者“鼓励方案”; 阶段2:代理人挑选接受或拒绝该机制,拒绝的代理人得到某个外生的“保留效用”;阶段 3:接受机制的代理人挑选自己的行动 或者战略 ,实现一个博弈结果;机制设计模型中的有关概念:参加约束:由于代理人在其次阶段总可以挑选不接受该机制从而获得一个保留效用,因此,代理人接受这个机制获得的效用必需不小于拒绝这个机制时获得的效用;鼓励相容约束: 这意味着, 对于代理人而言,代理人真实报告自己的类型时获得的效用必需不小于谎报自己类型时获得的效用;可行机制:满意参加约束的机制被称为可行机制;可实施机制:满意鼓励相容约束的机制称

36、为可实施机制可行的可实施机制:假如一个机制既满意参加约束,又满意鼓励相容约束;机制设计的目的:机制设计的目的就为要设计出可行的可实施机制,从而在该机制中找出最优规章以追求最大化收益;4.不完全信息动态博弈4.1 不完全信息动态博弈特点:在博弈开头之前参加人之间的信息存在不确定性,同时参加人行动存在先后次序;不完全信息动态博弈过程不仅为参加人挑选行动的过程,而且为参加人不断修正信念的过程;4.2 不完全信息动态博弈的有关概念类型 : 为指参加者的类型;在不完全信息动态博弈中自然第一挑选参加人的类型;动态博弈:行动有先有后;所以后行动者可以观看到先行动者的行动信息,从而可以修正自己对于参加人的类型

37、的信息的判定;类型相依:参加者的行动传递着有关自己的类型的信息,对方可通过参加人的行动来推断自己的最优行动;先行动者猜测到自己的行动被后行动者利用,就会设法传递对自己最有利的信息;精品学习资料精选学习资料 - - - 欢迎下载学习必备精品学问点4.3 不完全信息动态博弈的纳什均衡精炼贝叶斯均衡对应于不完全信息动态博弈的纳什均衡称为精炼贝叶斯均衡;精练贝叶斯均衡为泽尔腾不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合;1.不完全信息动态博弈均衡求解的基本思路:不完全信息动态博弈将子博弈精炼nash 均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,但为有提前条件

38、:1.对每个参加人i ,在其信息集上给出关于自己位于该信息集中哪一个决策结的信念 或推断 ;2.对参加人i 的每个信息集,在给定参加人i 在该信息集上的信念 或推断 情形下,参加人的战略为对其他参加人战略的一个最优反应;与静态博弈不同的为:在观测到先行动者第一阶段挑选后,后行动者可以修正对先行动者类型的先验概率,由于先行动者的行动可能包含其类型的信息,即行动就为类型的反映,不同的行动反映不同的类型信息;参加人最初对于对手类型信息概率的判定成为先验概率,对于依据行动反映出得信息修正后的概率成为后验概率;先验概率 prior probability:修正之前的判定; 后验概率 posterior

39、probability:修正之后的判定先验概率和后验概率的转化为依据贝叶斯法就运算:在不完全信息动态博弈博弈均衡解的求解过程中,假如不行置信的威逼,均衡就为不合理的, 所以要对均衡结果精炼,剔除那些不行置信的威逼;从而引入子博弈精练纳什均衡的概念,但为,在不完全信息动态博弈中,只有一个子博弈,不能将上述方法直 接用于求不完全信息动态博弈的均衡解;合理的均衡应当为满意:给定每一个参加人有关其他参加人类型的后验信念,参加人的战略组合在每一个后续博弈上构成贝叶斯均衡,我们将通过这种方式得到的纳什均衡称为精 炼贝叶斯纳什均衡;精炼贝叶斯均衡为贝叶斯均衡.子博弈精炼纳什均衡和贝叶斯推断的结合,精炼贝叶斯均衡要求:1.在每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论