博弈论知识点总结材料

上传人：j*** IP属地：天津上传时间：2022-02-06 格式：DOC 页数：17 大小：148.50KB 积分：20 举报 版权申诉

已阅读5页，还剩12页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、博弈论知识总结博弈论概述：1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以与这种决策的均衡问题。博弈论研究的假设：1、决策主体是理性的，最大化自己的收益。2、完全理性是共同知识3、每个参与人被假定为可以对所处环境以与其他参与者的行为形成正确的信念与预期2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规如此，即事件与决策主体行动之间的映射，也是参与人行动的规如此。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型不完全信息等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解

2、；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否如此为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间与支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别：3、博弈论与传统决策的区别：1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,l)，其中P为市场价格，I为消费者可支配收入。2、其他消费者对个人的综

3、合影响表示为一个参数一一市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规 X性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进展选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。1参与人集合： 1 , 2,., n 2、每位参与人非空的战略集SinS i( 序列结构：每个参与人行动时面临的决策问题，包括

4、参与人行动时可供选择的行动方案、所了解的信息；参与人的支付函数。比拟： 1、战略式博弈从本质上来讲是一种静态模型。2、扩展式博弈从本质上来讲是一种动态模型。1，S i，S n )3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,sn).扩展式博弈：是博弈问题的一种规 X性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素：1、1,2,., n参与人集合2、参与人的行动顺序，即每个参与人在何时行动；5、博弈论分类：按决策主体的行为相互作用时，当事人能否达成一个具有约束力的协议可分为：1、合作博弈强调团体理性、团体最优

5、决策、效率2、非合作博弈强调个人理性，个人最优决策按参与人行动先后顺序可分为：1、静态博弈：博弈中参与人同时行动，或者虽然不是同时行动，但是在行动前不知道其他参与人所选择的行动。2、动态博弈：参与人的行动有先后顺序，后行动者获得先行动者的行动信息。按参与人对信息的掌握程度可分为：1、完全信息：每个参与人对其他所有参与人的特征、战略空间与支付函数有准确的了解，博弈开始时不存在不确定性因素。2、不完全信息：参与人没有完全掌握其他参与人的特征、战略空间与支付函数等信息，即存在着有关其他参与人的不确定性因素。按决策主体对信息的掌握程度和行动的先后顺序，博弈可以分为：完全信息静态博弈、完全信息动态博弈

6、、不完全信息静态博弈、不完全信息动态博弈。静态动态完全信息完全信息静态博弈完全信息动态博弈均衡：纳什均衡均衡：子博弈精炼纳什均衡不完全信息不完全信息静态博弈不完全信息动态博弈均衡：贝叶斯纳什均衡均衡：精炼贝叶斯纳什均衡6、根据所学这四种博弈的特点对这四种博弈做一个比照分析:类型信息和行动特点均衡均衡类型特别均衡求解方法学过的例子性质完全信息静态每个参与人对其他所有参与人的特征、战略空间与纳什均衡纯战略纳什均衡占优战略纳什均衡箭头法划线法Hotelli ng 价格竞争多重性和存在性博弈支付函数有准确的了解，博弈开始时卄不、存在不、确定(PNE)DSE库诺特价格竞争时J不存在不确性因素，参

7、与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动一样。重复剔除的占有均衡(IFDE)不断剔除劣战略弱劣战略的剔除顺序会影响均衡结果一般一个博弈中存在参与者有多个行动时可以先考虑能否剔除弱战略简化博弈混合战略纳什均衡(MNE)聚点均衡支付最大化法支付等值法社会福利博弈小偷-守卫博弈完全信息动态博弈在博弈开始之前参与人之间的信息不存在不确定性，但是参与人行动存在先后顺序。在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，引入了信息与的概念。子博弈精炼纳什均衡子博弈精炼纳什均衡有限次重复博弈均衡与纳什均衡的唯一性有关

8、连锁店悖论1、均衡结果是原博弈的Nash 均衡；2、同时在每一个子博弈上构成Nash 均衡无限次重复博弈均衡无名氏定理与贴现因子，亠、/有关囚徒困境冷酷战略无限期轮流讨价还价模型一般博弈逆向归纳法求解斯坦科尔伯格寡头竞争雇主与公会之间的竞争不完全信息静态博弈在博弈开始之前参与人之间的信息存在不确定性，但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。不确定是参与人的了性的不确定贝叶斯纳什均衡贝叶斯纳什均衡混合战略不完全信息情况下纯战略均衡的极限对原混合战略参加少许不确定性因素，求极限。性别战1、均衡存在性2、不

9、确定性表现为类型的不确定性一般贝叶斯均衡Harsa nyi转换机制设计性不完全信息动态博弈在博弈开始前参与人之间的信息存在不确定性，同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。精炼贝叶斯纳什均衡信号传递博弈别离均衡根据所得信息修正判断概率，根据收益最大化决策信号传递博弈不完全信息重复博弈与声誉Milgrom-Roberts垄断限价模型不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。混同均衡准别离均衡二、四种博弈类型具体分述1完全信息静态博弈:每

10、个参与人对其他所有参与人的特征、战略空间与支付函数有准确的了解，博弈开始时不存在不确定性因素，参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。战略和行动一样。1.2 完全信静态博弈相关概念：以新产品开发博弈举例说明：参与人：参与人1和2。参与人的集合卡表示为：r =1,2 ,n.表示所有参与人的集合，在新产品开发博弈中为：r =1,2行动：开发、不开发。Ai表示参与人行动的集合。新产品开发博弈中参与人的行动集合为A仁A2=a,b,其中a为开发，b为不开发。a=a1,a2an表示参与人的行动组合。新产品开发博弈中为： A= a,a,(a,b),(b,a),(b,b)战略：参与

11、人的行动规如此。在博弈中的战略可以定义为从观测集到行动集的映射关系，即: Si:Xi Ai。用Si=si表示参与人所有战略的集合。在n人博弈中，用S=(si,S2,s3,s n)表示n个参与人的战略组合，它表示博弈中每个参与人采取战略si的一种博弈情形。在完全信息静态博弈中，由于不存在决策时序上的差异，所有参与人在同一决策时点即博弈开始的那一时刻决策，因此，所有参与人面临的决策情形都只有一种，所以，参与人的战略集与行动集一样。支付：是指参与人在博弈中的所得。一般情况下也是用效用函数来表示参与人在博弈中的所得。因此，参与人的支付就可表示为一种特定博弈情形下参与人得到确实定效用水平或期望效用水平

12、。支付一般用ui(1,2,n)表示参与人i的支付(效用水平)，支付组合u=(u1,u2,un)表示参与人在特定博弈情形下所得到的支付，其中为参与人i的支付。因此,参与人i=(i=1,2,n)的支付就可表示为：ui=ui(s i,s -i).信息：是参与人所具有的有关博弈的所有知识，如有关其它参与人行动或战略的知识、有关参与人支付的知识等等。在“新产品开发博弈中，如果两个企业都知道市场需求，那么这样的博弈情形就是我们前面所提到的完全信息假设；如果两个企业中至少有一个不知道市场需求，那么这样的博弈情形就是我们前面所提到的不完全信息假设。1.3 纯战略纳什均衡纯战略：参与人在给定信息下只选择一种特

13、定或确定性的战略混合战略：混合战略解释了一个参与人对其他参与人所采取的行动的不确定性，它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略。纯战略纳什均衡中包括：占有均衡、重复剔除劣战略均衡、一般纯战略纳什均衡等。1、占优均衡占优战略：参与人的最优战略si*与其他参与人的选择 s -i无关。无论其他参与人选择什么战略，参与人的最优战略总是唯一的，这样的最优战略称之为“占优战略。在n人博弈中，如果对于所有的其他参与人的选择s-i , si*都是参与人i的最优选择ui (s*,s i) ui(Si,sJ如此称si*为参与人的占优战略。在n人博弈中，如果对所有参与人都存在占优战略si*

14、，如此占优战略组合si*= s1*si2*，,sn*称为占优战略均衡。如果所有参与人都有占优战略存在，那么占优战略均衡就是唯一的所有理性参与人可以预测到的博弈结果。2、重复剔除劣战略i存在两个战略，其中一如果在一个博弈中，参与人不存在占优战略，但是参与人u/s ,s i) uds ,s J个战略叫另一个战略的所得效用要大，如此理性的参与人绝对不会选择战略。Ui (si , s i) Ui(Si ,s i)严格劣战略：u(si , s i) u i ( si , s i )弱劣战略：假如重复剔除过程一直可持续到只剩下唯一的战略组合，如此该战略组合即为重复剔除的占优均衡，此时该博弈是重复剔除战略

15、可解。要点：再重复剔除过程中，如果每次剔除的是严格劣战略，均衡结果与剔除顺序无关；如果剔除的是弱劣战略，均衡结果可能与剔除顺序有关。3、一般Nash均衡Nash均衡是完全信息静态博弈的解的概念，在完全信息静态博弈中，构成Nash均衡的战略是不可剔除的，即不存在任何一个战略严格优于Nash均衡战略。求解纳什均衡的方法划线法、箭头法。划线法：1、考察参与人1的最优战略2、用上述方法找出参与人2的最优战略3、找出最优战略组合箭头法：1、对于每个战略组合，检查是否有参与人会偏离这个战略组合2、直至找出没有参与人会偏离的战略组合纯战略均衡反映函数：各博弈方选择的纯策略对其他博弈方纯策略的反响。1.4

16、混合战略纳什均衡混合战略：在博弈中,g对任一参与人n；u,设s=s i1,sd,如此参与人i的一个混合战略为定义在战略集Si上的一个概率分布3 i= S i1,S ik,其中3 iJj=1,k丨表示参与人i选择战略表示参与人i选择战略S的概率的概率，即S iJ满足OWS ij w 1,其中概率之和为 1。支付：混合战略的支付为各种概率下收益的加权平均。混合战略纳什均衡：在博弈 G ；,.,Sn；U1,.,Un中，混合战略组合S i= S 1*,S n*为一个 Nash* * *均衡。当且仅当 i , ii,有Vi( i , i) v( i, i)。混合战略Nash均衡的求解：1. 支付最

17、大化法；2. 支付等值法；混合战略均衡反映函数：在混合策略的X畴内，博弈方的决策是选择概率分布，因此，反响函数就是一方对另一方选择的概率分布的反响。聚点均衡：在现实生活中，参与人可能使用某些被博弈模型抽象掉的信息来达到一个“聚点均衡。这些信息可能与社会文化习惯、参与人过去博弈的历史有关。不同均衡概念之间的关系：占优均衡重复剔除劣战略均衡纯战略纳什均衡混合战略纳什均衡1.5 纳什均衡的多重性与存在性存在性：每个有限战略式博弈参与人与相应的战略集均为有限必存在纳什均衡，这个均衡可能是纯战略纳什均衡，也可能是混合战略纳什均衡。多重性：一个博弈可能有多个均衡，博弈论并没有一个一般的理论证明，哪

18、一个纳什均衡结果一定能出现。2、完全信息动态博弈2.1 完全信息动态博弈特点：在博弈开始之前参与人之间的信息不存在不确定性，但是参与人行动存在先后顺序。在完全信息动态博弈中，为了表示参与人之间的信息掌握关系，弓I入了信息与的概念。2.2 完全信息动态博弈有关概念：信息集：信息集li是参与人i决策结的一个集合，它满足以下两个条件：1、I i中的每个决策结都是参与人 i的决策结；2、当博弈到达li时，参与人i知道自己处在该信息集中的某个决策结，但不知道是哪一个。在博弈树中，属于同一信息集的决策结一般用虚线连接起来。结：包括决策结和终点结两类。决策结是参与人采取行动的点时点，终点结是博弈行动路

19、径的终点。一个信息集可能只包含一个决策结，也可能包含多个决策结。如果只包含一个决策结的信息集就是但单结信息集。如果博弈中所有信息集都是单结的如此成为完美信息博弈。子博弈：是原博弈的一局部，它始于原博弈中一个单结信息集中的决策结x，并由决策结x与其后续结共同组成。1、子博弈可以作为一个独立的博弈进展分析，并且与原博弈具有一样的信息结构；2、原博弈可以作为自身的一个子博弈；2.3 不完全信息静态博弈均衡一一子博弈精炼Nash均衡：解决Nash均衡多重性问题的一种主要方法就是精炼的方法，即在Nash均衡的根底上，通过定义更加合理的博弈解并剔除不合理的均衡。子博弈精炼纳什均衡的引入就是将那些包含不可

20、置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈结果的一个合理预测。即子博弈精炼纳什均衡要求均衡战略的行为规如此在每个信息集上都是最优的。扩展式博弈的战略组合s*(si*,., S；)，是一个子博弈精炼Nash均衡，当且仅当满足以下条件：1、是原博弈的 Nash均衡2、在每一个子博弈上构成 Nash均衡一个战略组合是子博弈精炼Nash均衡当且仅当它对所有的子博弈（包括原博弈）构成Nash均衡，同时也意味着原博弈的Nash均衡并不一定是子博弈精炼Nash均衡，除非它还对所有子博弈构成 Nash均衡。2.4 不完全信息静态博弈均衡求解一一逆推归纳法逆推归纳法是最常用的求解子博弈精炼Nash均

21、衡的方法，其步骤为：其中r （Xi）代表博弈中由最底层到博弈起点的顺序，以r（X3）为最底层，如此有：1找出博弈的所有子博弈；2、按照博弈进程的“反方向逐一求解各个子博弈，即最先求解最底层的子博弈，再求解上一层的子博弈，，直至原博弈。由于逆推归纳法对各个子博弈逐一进展求解，因此，逆推归纳法所得到的解在各子博弈上构成Nash均衡，即意味着逆推归纳法所得的解为子博弈精炼纳什均衡2.5 完全信息动态博弈中承诺行动的均衡结果分析：承诺行动：就是在博弈开始之前参与人采取某种改变自己支付或战略空间的行动，该行动使原本不可信的威胁变得可信。但是参与人的承诺行动是有本钱的，否如此这种承诺就不可信。例子：要

22、挟诉讼要挟诉讼就是指那种原告几乎不可能胜诉而其惟一的目的是希望通过私了而得到一笔赔偿的诉讼。该博弈的结果为原告选择不指控，博弈完毕。博弈的结果似乎与人们观测到的现实并不相符，因为现实中人们常常看到各种“要挟发生。在上述模型中，“要挟之所以没有成功，关键在于原告将会起诉的威胁并不可信。要是威胁变得可信，就必须采取承诺行动沉没本钱。这样参与人的威胁就会变得可信，从而使其他博弈参与人改变策略。2.6 重复博弈议题：1、将来可信的威胁或承诺如何影响到当前的行动2、在一次博弈中无法实现的均衡，在重复博弈中能否实现有限次重复博弈：对于给定的阶段博弈 G令QT）表示G重复进展T次的有限重复博弈，并且在下

23、一次博弈开始前，所有以前博弈的进程都可被观测到。有限次重复博弈均衡结论如果阶段博弈 G有唯一的Nash均衡，如此对任意有限的T,重复博弈 GT)有唯一的子博弈精炼解，即 G的Nash均衡结果在每一个阶段重复进展。而且在有限次重复博弈中，如果在单阶段博弈中均衡解不只有一个，如此对将来行动所作的可信威胁或承诺可以影响到当前的行动。无限次重复博弈：给定一阶段博弈 G,令G( a, S )表示相应的无限重复博弈，其中G将无限次的重复进展，且参与人的贴现率为。对每个t，之前t-1次阶段博弈的结果在t阶段开始进展前都可以被观测到，每个参与人在 G( a, )中的收益都是该参与人在无限次的阶段博弈中所得收益

24、的现值。无限次重复博弈的解一一无名氏定理：令G为一个n人阶段博弈，令e1,e2,en为G的一个Nash均衡下的收益，且用(x1,x2,xn)表示G的其它任何可行收益，表示可行收益的集合。假如存在x e,对 i,x x如此存在贴现率使无限重复博弈G(a, )存在一个子博弈精炼 Nash均衡，其平均收益可达到(x1,x2,xn)。无名氏定理的解释：在无限次重复博弈中，如果参与人具有足够的耐心只要满足一定的条件，那么任何满足个人理性的可行收益向量都可以通过一个特定的子博弈精炼Nash均衡得到。影响重复博弈结果的因素：影响重复博弈结果的是重复的次数和信息的完备性。2.7 子博弈精炼 Nash均衡与Na

25、sh均衡的区别：由于子博弈精炼Nash均衡在任一决策结上都能给出最优决策，这也使得子博弈精炼纳什均衡不仅在均衡路径(即均衡战略组合所对应的路径)上给出参与人的最优选择，而且在非均衡路径(即除均衡路径以外的其它路径)上也能给出参与人的最优选择。即子博弈精炼Nash均衡不会含有参与人在博弈进程中不合理的、不可置信的行动。3、不完全信息静态博弈3. 1不完全信息静态博弈特点：在博弈开始之前参与人之间的信息存在不确定性，但是参与人同时行动或者不是同时行动但是后行动者不知道行动者的行动信息。在不完全信息静态博弈中，在博弈开始前存在关于博弈人信息的不确定性，这个不确定像通常是博弈参与人的类型。在市场进

26、入博弈中不完全信息表现为：在位者的本钱类型高本钱、低本钱在斗鸡博弈中不完全信息表现为：参与人的性格类型强硬，软弱3.2海萨尼转换由于在不完全信息静态博弈中，参与人的类型存在不确定性，所以当一个参与人并不知道在与谁博弈时，博弈的规如此是无法定义的，海萨尼提出了海萨尼转换解决这种不确定的问题。解决方法：海萨尼指出，引入虚拟参与人一一自然，由自然先决定参与人的不同类型，将不完全信息博弈转换为不完美信息博弈。海萨尼通过引入“虚拟参与人，将博弈的起始点提前，从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。这种通过引入“虚拟参与人来处理不完全信息博弈问题的方法称为Harsa nyi转换。

27、海萨尼转换注意要点：1、海萨尼转换规定：参与人关于“自然选择的推断为共同知识。2、 “自然的选择。在一般的不完全信息博弈问题中，Harsanyi转换规定“自然选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外，还可以根据参与人的行动空间，甚至根据参与人掌握信息的多少(或程度)来划分参与人的类型。3、参与人关于“自然选择的推断是基于自己类型判断的条件概率。3.3 不完全信息静态博弈均衡一一贝叶斯纳什均衡贝叶斯博弈的定义：贝叶斯博弈包含以下五个要素：1、参与人集合Br =1,2，,n2、参与人的类型集合 T1,厂3、参与人关于其他参与人类型的推断P1(t -1 |t 1)

28、，,Pn(t -1n|t n)4、参与人类型相依的行动集 A(t 1),A(t n)5、参与人类型相依的支付函数贝叶斯博弈的战略：在贝叶斯博弈 G= r ;(Ti);R； A ti； ui a t丨；t中，参与人i的一个战略是从参与人的类型集 T到其行动集的一个函数 si(t i);它包含了当自然赋予i的类型为ti时，i将从可行的行动集 A(t i)中选择的行动。贝叶斯博弈的时间顺序：1、 “自然选择参与人的类型组合t=(t 1,t n)2、参与人同时选择行动，每个参与人 i从行动集A(t i)中选择行动ai(t i)3、参与人i得到支付贝叶斯纳什均衡：在贝叶斯博弈中，对于一个理性的参与人

29、i，当他只知道自己的类型ti而不知道其他参与人的类型时，给定其他参与人的战略s-，他将选择使自己期望效用(支付)最大化的行动ai*(t i)，其中ai (ti) arg 玄口彳%)/： ,s i；ti)贝叶斯博弈纳什均衡的存在性：一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。3.4 贝叶斯博弈与混合战略均衡关于混合战略纳什均衡的一个解释首先，混合策略均衡不是现实生活的一个合理描述，人们并不是根据概率分布来选择自己行动；海萨尼证明，在完全信息情况下的混合策略均衡可以解释为不完全信息情况下纯策略均衡的极限。混合策略的本质:混合策略的本质不在于参与人随机的选择行动，而在于他不能确定其他参与人将

30、选择什么纯策略，这种不确定性可能来自于参与人不知道其他参与人的类型。海萨尼的根本思想:只要在原来的博弈中参加少许不完全信息因素，使得参与人的支付函数中的收益不再是确定的，而是和一个有 X围的不确定参数有关，从而通过将混合战略均衡求解转换为贝叶斯均衡的极限解，但是得到的纯战略贝叶斯均衡就与完全信息下的混合战略均衡相似。结论：完全信息博弈的混合战略 Nash均衡可以解释为与之密切相关、存在一点点非完全信息的纯战略贝叶斯 Nash均衡。同时海萨尼给出了描述混合策略和纯策略之间关系的一个正式的定理：混合策略均衡的纯化定理。3.5 贝叶斯均衡Eg：机制设计问题机制设计问题实际上就是探讨设计者如

31、何向参与人提供激励，以促使参与人向设计者透露其掌握的信息说真话，从而确定对设计者有利的结果的问题。这一机制对应于一个博弈形式，设计者需要设计出一个博弈形式，让参与人在这个博弈形式下进展博弈从而实现他的目标。博弈形式不同，实现目标的程度也不一样，设计者必须选择对他来说是最有利的博弈形式，即最有利的机制。机制设计的根本模型：机制设计是典型的 3阶段不完全信息博弈，期阶段如下：阶段1:机制设计者（委托人）设计一种“机制，或者“契约，或者“激励方案；阶段2 :代理人选择承受或拒绝该机制，拒绝的代理人得到某个外生的“保存效用；阶段3:承受机制的代理人选择自己的行动（或者战略），实现一个博弈结

32、果。机制设计模型中的有关概念：参与约束：由于代理人在第二阶段总可以选择不承受该机制从而获得一个保存效用，因此，代理人承受这个机制获得的效用必须不小于拒绝这个机制时获得的效用。激励相容约束：这意味着，对于代理人而言，代理人真实报告自己的类型时获得的效用必须不小于谎报自己类型时获得的效用。可行机制：满足参与约束的机制被称为可行机制。可实施机制：满足激励相容约束的机制称为可实施机制可行的可实施机制：如果一个机制既满足参与约束，又满足激励相容约束。机制设计的目的：机制设计的目的就是要设计出可行的可实施机制，从而在该机制中找出最优规如此以追求最大化收益。4、不完全信息动态博弈4.1 不完全信息动态

33、博弈特点：在博弈开始之前参与人之间的信息存在不确定性，同时参与人行动存在先后顺序。不完全信息动态博弈过程不仅是参与人选择行动的过程，而且是参与人不断修正信念的过程。4.2不完全信息动态博弈的有关概念类型：是指参与者的类型。在不完全信息动态博弈中自然首先选择参与人的类型。动态博弈：行动有先有后。所以后行动者可以观察到先行动者的行动信息，从而可以修正自己对于参与人的类型的信息的判断。类型相依：参与者的行动传递着有关自己的类型的信息，对方可通过参与人的行动来推断自己的最优行动。先行动者预测到自己的行动被后行动者利用，就会设法传递对自己最有利的信息。4.3 不完全信息动态博弈的纳什均衡一一精炼贝叶斯

34、均衡对应于不完全信息动态博弈的纳什均衡称为精炼贝叶斯均衡；精练贝叶斯均衡是泽尔腾不完全信息动态博弈子博弈精炼纳什均衡与海萨尼不完全信息静态博弈贝叶斯均衡的结合。1、不完全信息动态博弈均衡求解的根本思路：不完全信息动态博弈将子博弈精炼Nash均衡中“均衡精炼的思想应用到不完全信息扩展式博弈中，但是有提前条件：1、对每个参与人i，在其信息集上给出关于自己位于该信息集中哪一个决策结的信念 (或推断)。2、对参与人i的每个信息集，在给定参与人i在该信息集上的信念(或推断)情况下，参与人的战略是对其他参与人战略的一个最优反响。与静态博弈不同的是：在观测到先行动者第一阶段选择后，后行动者可以修正

35、对先行动者类型的先验概率，因为先行动者的行动可能包含其类型的信息，即行动就是类型的反映，不同的行动反映不同的类型信息。参与人最初对于对手类型信息概率的判断成为先验概率，对于根据行动反映出得信息修正后的概率成为后验概率。先验概率(prior probability):修正之前的判断；后验概率(posterior probability):修正之后的判断先验概率和后验概率的转化是根据贝叶斯法如此计算：在不完全信息动态博弈博弈均衡解的求解过程中，如果不可置信的威胁，均衡就是不合理的，所以要对均衡结果精炼，剔除那些不可置信的威胁。从而引入子博弈精练纳什均衡的概念，但是，在不完全信息动态博弈中，只有一个子博弈，不能将上述方法直接用于求不完全信息动态博弈的均衡解。合理的均衡应该是满足：给定每一个参与人有关其他参与人类型的后验信念，参与人的战略组合在每一个后续博弈上构成贝叶斯均衡，我们将通过这种方式得到的纳什均衡称为精炼贝叶斯纳什均衡。精炼贝叶斯均衡是贝叶斯均衡、子博弈精炼纳什均衡和贝叶斯推断的结合，精炼贝叶斯均衡要求：1、在

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论知识点总结材料

文档简介

温馨提示

最新文档

评论

博弈论知识点总结材料

文档简介

温馨提示

最新文档

评论

相关文档