完美贝叶斯均衡

上传人：儿*** IP属地：广东上传时间：2023-01-16 格式：PPT 页数：97 大小：515KB 积分：30 举报 版权申诉

已阅读5页，还剩92页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

Lecture12：

perfectBayesianequilibrium1编辑课件0.引言1.完美贝叶斯均衡的要求2.完美贝叶斯均衡的初步解释2.1两方两阶段不完全信息动态博弈2.2三方三阶段不完全信息动态博弈2编辑课件0.引言3编辑课件完全且完美信息的二手车交易模型11122好不好卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)完全且完美信息的二手车交易模型4编辑课件完全但不完美信息的二手车交易模型1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)完全但不完美信息的二手车交易模型5编辑课件由于完全但不完美信息动态博弈中存在“多节点信息集”，因此子博弈概念的理解和逆推归纳法的应用都需要作一些修正。不完美信息动态博弈的扩展形必然包含多节点信息集，至少部分阶段不构成子博弈。6编辑课件均衡策略组合对任何种类博弈的分析都是关键，对不完美信息动态博弈也不例外。对一个动态博弈来讲，“可信性”始终是均衡的一个中心问题，理想的均衡必须能够排除任何不可信的威胁或承诺。7编辑课件核心均衡概念完全信息静态博弈：纳什均衡完全且完美信息动态博弈：子博弈完美纳什均衡完全但不完美信息动态博弈：完美贝叶斯均衡8编辑课件完美贝叶斯均衡（perfectBayesianequilibrium）9编辑课件贝叶斯（Bayes）公式：设｛A1，…，An｝为必然事件的一个分割，P(Ai)>0，i=1，…，n。又设P(B)>0，则注意（贝叶斯公式是专门用来计算后验概率的）：

(1)条件概率P(Ai|B)，…，P(An|B)称为A1，…，An的后验概率，因为它们是在知道事件B发生之后，事件A1，…，An发生的概率。

(2)对应地，P(A1)，…，P(An)称为A1，…，An的先验概率。

(3)由于B的发生提供了新的信息，因而产生了从先验概率到后验概率的变化。10编辑课件完全但不完美信息的二手车交易模型“逆推归纳法”的分析结果(设p(g)≠0，1)：（1）若卖方（博弈方1）在车况“差”时选择“卖”的概率p(s|b)<p(g)/[1－p(g)]，那么买方（博弈方2）对卖方（博弈方1）决定卖车时车况“好”的“判断”p(g|s)>1/2，此时博弈方2在第三阶段总是选择“买”，博弈方1在第二阶段总是选择“卖”；博弈方1是主动选择和理性行为的，因此概率分布p(s|g)和p(s|b)取决于博弈方1的理性策略。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)11编辑课件

（2）若卖方（博弈方1）在车况“差”时选择“卖”的概率p(s|b)>p(g)/[1－p(g)]，那么买方（博弈方2）对卖方（博弈方1）决定卖车时车况“好”的“判断”p(g|s)<1/2，此时博弈方2在第三阶段总是选择“不买”，博弈方1在第二阶段总是选择“不卖”。

博弈方1是主动选择和理性行为的，因此概率分布p(s|g)和p(s|b)取决于博弈方1的理性策略。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)12编辑课件1.完美贝叶斯均衡的要求13编辑课件完美贝叶斯均衡的要求要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。

(a)对于多节点信息集，“判断”就是博弈达到该信息集中各个节点可能性的概率分布；

(b)对于单节点信息集，则可理解为“判断”博弈达到该节点的概率为1。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)14编辑课件要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。

(a)在各个信息集，给定轮到选择博弈方的判断和其他博弈方的“后续策略”，该博弈方的行为及以后阶段的“后续策略”，必须使自己的得益或期望得益最大。

(b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中，针对所有可能情况如何行为的完整计划。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)15编辑课件要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)16编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。17编辑课件当某策略组合及相应的判断满足这样四个要求时，称为一个“完美贝叶斯均衡”。18编辑课件当某策略组合及相应的判断满足这样四个要求时，称为一个“完美贝叶斯均衡”。为什么称这种均衡为完美贝叶斯均衡？19编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。20编辑课件当某策略组合及相应的判断满足这样四个要求时，称为一个“完美贝叶斯均衡”。为什么称这种均衡为完美贝叶斯均衡？21编辑课件为什么称这种均衡为完美贝叶斯均衡？首先，因为它的第二个要求“序列理性”，与子博弈完美纳什均衡中的子博弈完美性要求相似；22编辑课件23要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。

(a)即，在各个信息集，给定轮到选择博弈方的判断和其他博弈方的“后续策略”，该博弈方的行为及以后阶段的“后续策略”，必须使自己的得益或期望得益最大。

(b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中，针对所有可能情况如何行为的完整计划。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)23编辑课件为什么称这种均衡为完美贝叶斯均衡？首先，因为它的第二个要求“序列理性”，与子博弈完美纳什均衡中的子博弈完美性要求相似；其次，因为要求3和要求4规定“判断”的形成必须符合贝叶斯法则。24编辑课件要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。1112好差卖不卖不卖卖买不买买不买(0，0)(2，1)(0，0)(1，-1)(-1，0)(0，0)25编辑课件完全且完美信息动态博弈：子博弈完美纳什均衡完全但不完美信息动态博弈：完美贝叶斯均衡26编辑课件27编辑课件子博弈完美纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例。28编辑课件子博弈完美纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例。即，在完全且完美信息动态博弈中，完美贝叶斯均衡就是子博弈完美纳什均衡。29编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。30编辑课件子博弈完美纳什均衡是完美贝叶斯均衡在完全且完美信息动态博弈中的特例。序列理性在子博弈中就是子博弈完美性，再在整个博弈中就是纳什均衡，而在完全且完美信息动态博弈中，所有轮到选择博弈方的信息集都是单节点的，他们对博弈到达该节点的“判断”都是概率等于1，这些判断当然都是满足贝叶斯法则和以其他博弈方的后续策略为基础的。31编辑课件更进一步，完美贝叶斯均衡在静态博弈中就是纳什均衡。32编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。3333编辑课件2.完美贝叶斯均衡的初步解释2.1两方两阶段不完全信息动态博弈2.2三方三阶段不完全信息动态博弈34编辑课件对四个条件的分析“要求1”是解决完全但不完美信息动态博弈的基本前提。在多节点信息集处轮到选择的博弈方，至少必须对其中每个节点达到的可能性大小有一个基本判断，否则其决策就会失去根据，从而也不可能存在策略的稳定性，更谈不上均衡。35编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。36编辑课件对四个条件的分析“要求2”的序列理性相当于子博弈完美纳什均衡中的子博弈完美性要求，实际上在子博弈中（不完美信息动态博弈中也可能存在子博弈）就是子博弈完美性，而在多节点信息集开始的不构成子博弈的部分中，序列理性通过要求各博弈方遵守最大利益原则而排除博弈方策略中不可信的威胁或承诺。37编辑课件对四个条件的分析当然，序列理性首先要求策略组合在给定的各方判断下是纳什均衡。38编辑课件对四个条件的分析序列理性要求对保证完美贝叶斯均衡的真正稳定性是很重要的。39编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。40编辑课件2.1两方两阶段不完全信息动态博弈41编辑课件12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)42编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。43编辑课件完美贝叶斯均衡的初步解释“要求1”的必要性博弈方2在多节点信息集处对两个节点，也就是两条路径的“判断”是决策的必要基础，从而也是均衡策略的基础。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)44编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。45编辑课件“要求2”的必要性如果没有“要求2”，只要求满足纳什均衡和子博弈完美性，则博弈方2有一个可为自己争取到最大利益3，但包含不可信承诺的均衡策略。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)46编辑课件“要求2”的必要性即，博弈方2威胁在轮到自己选择时将唯一地只选D。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)47编辑课件“要求2”的必要性即，博弈方2威胁在轮到自己选择时将唯一地只选D。如果博弈方2采取这个策略，博弈方1的最佳对策就是第一阶段选择R从而使博弈结束，双方得益是（1，3）。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)48编辑课件“要求2”的必要性策略组合：博弈方2威胁在轮到自己选择时将唯一地只选D；博弈方1在第一阶段选择R。上述策略组合显然是一个纳什均衡，由于本博弈没有子博弈，因此子博弈完美性要求自动满足，它也是一个子博弈完美纳什均衡。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)49编辑课件“要求2”的必要性但是，博弈方2在博弈方1不选择R的情况下只选D的策略，在博弈方1选L的概率很大时明显是一个不可信的威胁，因为这时博弈方2选择D的期望得益比选U的要小得多，选D不符合最大利益原则。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)50编辑课件“要求2”的必要性因此，“要求2”对于保证不完美信息动态博弈的均衡策略中没有不可信的威胁或承诺具有关键作用。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)51编辑课件“要求2”的必要性“要求2”保证各个博弈方在单节点信息集和多节点信息集处都会按照最大利益原则选择。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)52编辑课件“要求2”的必要性因此当博弈方2在博弈方1第一阶段没有选R的情况下，“判断”博弈方1选L的概率p大于选M的概率1-p时，博弈方2必须选择U而非D。这时，博弈方1在第一阶段的选择就应该是L而非M，也非R。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)53编辑课件“要求2”的必要性博弈方1第一阶段选L，博弈方2在博弈方1第一阶段未选R的情况下选择U，加上博弈方2对博弈方1选L、M的概率判断p和1-p（p≥1-p），构成一个满足序列理性要求的策略组合。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)54编辑课件要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。

(b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中，针对所有可能情况如何行为的完整计划。55编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。56编辑课件“要求3”和“要求4”有“均衡路径”和“非均衡路径”一对概念。在完全且完美信息动态博弈中，所谓在均衡路径上的信息集是指如果博弈按照均衡策略进行，则该信息集一定会达到，不在均衡路径上的信息集则肯定不会达到。57编辑课件“要求3”和“要求4”有“均衡路径”和“非均衡路径”一对概念。在不完美信息博弈中，由于至少对一个博弈方阶段来说，博弈实际达到何处是无法看到的，因此即使按均衡策略进行博弈，某些信息集是否一定达到也不确定。58编辑课件“要求3”和“要求4”有“均衡路径”和“非均衡路径”一对概念。所以，在不完美信息博弈中所谓“在均衡路径上”的信息集意味着如果博弈按照均衡策略进行，则该信息集会以正的概率达到，而“不在均衡路径上”的信息集就意味着博弈按均衡策略进行时绝不可能达到，或者达到的概率为0。59编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)60编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。首先，因为该博弈中只有博弈方2有一个两节点信息集，因此要求3实际上针对的就是博弈方2在其两节点信息集处的“判断”。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)61编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。其次，本博弈两博弈方的选择都是主动选择，因此不需要额外信息帮助“判断”。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)62编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。第三，在本博弈中博弈方2的“判断”是直接针对博弈方1的上期选择的，因此不存在条件概率问题，贝叶斯法则自动满足。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)63编辑课件“要求3”的必要性假设：均衡策略是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。第四，“要求3”要求博弈方2对博弈方1的上期选择的“判断”，符合各博弈方的均衡策略，在这里就是符合博弈方1第一阶段的选择和博弈方2自己本阶段的选择。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)64编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。由于博弈方1的均衡策略在第一阶段选择的是L，因此只有博弈方2的“判断”是“博弈方1选择L的概率p＝1”才与博弈方1的策略相符合，而且这种判断也与博弈方2自己在本阶段的选择U相符合，因此该判断正是博弈方2决策和双方策略均衡的稳定基础。65编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。如果博弈方2“判断”p=0.75，则首先与博弈方1的选择不完全符合，而且这种判断对博弈方2选U的信心有不良影响，从而均衡就有不稳定性。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)66编辑课件“要求3”的必要性假设：均衡策略组合是“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”。如果博弈方2“判断”p=0.25，则与所设均衡策略组合“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”是完全矛盾的，因为该判断下博弈方2的最佳选择不是U而是D，而博弈方1也不会选择L而选择R，因此“判断”与策略之间的矛盾会完全破坏策略的均衡，这时候上述策略组合根本不可能是真正的均衡。67编辑课件“要求3”的必要性在不完美信息博弈中，“判断”和均衡策略之间的相互依存关系，只有两者是一致的、协调的，才可能是真正的均衡。68编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。69编辑课件“要求4”的必要性首先，对于均衡策略组合“博弈方1在第一阶段选择L，博弈方2在第二阶段选择U”来说，因为博弈方2的多节点信息集在均衡路径上，不存在不在均衡路径上的需要“判断”的信息集，因此要求4自动满足。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)70编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。在该均衡策略下，博弈方2的两节点信息集就是不在均衡路径上的信息集。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)71编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。“要求4”要求博弈方2此时在两节点信息集的判断，也要满足贝叶斯法则和双方的均衡策略。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)72编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。同于“要求3”，贝叶斯法则自动满足，因此我们只需要讨论博弈方2的“判断”与双方在此处可能有的均衡策略的一致性。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)73编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。我们只需要讨论博弈方2的“判断”与双方在此处可能有的均衡策略的一致性。如果万一博弈方1在第一阶段偏离了上述均衡策略R，博弈方2“判断”博弈方1选择L的概率p＝1是不符合要求4的，因为这与博弈方2自己的均衡策略D不符合。因此博弈方2此时的判断只能是博弈方1选择M的概率1-p=1，这样博弈方2的“判断”就与自己的策路相一致了。74编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。我们只需要讨论博弈方2的“判断”与双方在此处可能有的均衡策略的一致性。但是，博弈方2“判断”1-p=1，意味着博弈方1肯定选择了M。这显然是有问题的，因为对于博弈方1来说，M既是相对于R的下策，也是相对于L的下策，即使他不愿选R，也只会选L而不选M。75编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。我们只需要讨论博弈方二的“判断”与双方在此处可能有的均衡策略的一致性。因此，博弈方2的“判断”1-p=1虽然可以与自己的策略D相符合，但却无法与博弈方1在此处可能有的均衡策略相符合，这意味着该“判断”也不满足要求4。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)76编辑课件“要求4”的必要性假设纳什均衡策略组合：“博弈方1第一阶段选择R，博弈方2第二阶段选择D”。事实上，在上述得益结构下，该博弈不可能存在与均衡策略组合“博弈方1第一阶段选择R，博弈方2第二阶段选择D”相符合的不在均衡路径上的博弈方“判断”，这实际上就意味着该策略组合不可能是该博弈具有真正稳定性的完美贝叶斯均衡。12RM(1－p)L(p)UDUD(1，3)(2，1)(0，0)(0，0)(0，1)77编辑课件完美贝叶斯均衡要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。78编辑课件2.2三方三阶段不完全信息动态博弈79编辑课件三方三阶段不完全信息动态博弈第一阶段博弈方1有F和B两种选择，他的选择博弈方2和博弈方3都能看到。第二阶段博弈方2有L和R两种选择，跟在后面的博弈方3却看不见他的选择。博弈方3在第三阶段有U和D两种选择，他的信息集为一两节点信息集。

(1)这反映了博弈方3的信息不完美性。

(2)假设博弈方3“判断”博弈方2选择L和R的概率分别为p和1－p。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)80编辑课件三方三阶段不完全信息动态博弈（利用逆推归纳法的思路分析）首先，考虑博弈方3的选择，则他

(1)选择U的期望得益为p·1＋(1－p)·2＝2－p；

(2)选择D的期望得益为p·3＋(1－p)·1＝1+2p。

(3)因此，当p<1/3时他选择U，当p>1/3时他选择D，当p=1/3时选U，D或者混合策略都可以。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)81编辑课件其次，考虑博弈方2的选择，则

(1)博弈方2的选择必然是策略L；

(2)因为L是博弈方2的严格上策；

(3)博弈方2无需考虑博弈方3在第三阶段的选择。此时，再回头看博弈方3的“判断”：

(1)判断“p>1/3”是符合博弈方2的策略的；

(2)更精确地讲，完全符合博弈方2均衡策略的博弈方3的“判断”是p=1。

(3)因此，博弈方3肯定选择D。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)82编辑课件最后，考虑博弈方1的选择，则

(1)博弈方1知道从博弈方2的选择开始的子博弈的均衡策略组合必然为（L，D）；

(2)那么，博弈方1选择F可以获得3单位得益，选择B可以获得2单位得益；

(3)因此，博弈方1的均衡策略是F。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)83编辑课件三方三阶段不完全信息动态博弈利用逆推归纳法的分析结果总结：博弈存在一个均衡策略组合（F，L，D），以及与之相应的博弈方3的“判断”p＝1。？该均衡策略组合是否符合完美贝叶斯均衡的要求123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)84编辑课件完美贝叶斯均衡的要求要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。

(a)对于多节点信息集，“判断”就是博弈达到该信息集中各个节点可能性的概率分布；

(b)对于单节点信息集，则“判断”就是博弈达到该节点的概率为1。博弈存在一个均衡策略组合（F，L，D），以及与之相应的博弈方3的“判断”p＝1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)85编辑课件要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。

(a)即在各个信息集，给定轮到选择博弈方的判断和其他博弈方的“后续策略”，该博弈方的行为及以后阶段的“后续策略”，必须使自己的得益或期望得益最大。

(b)此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中，针对所有可能情况如何行为的完整计划。博弈存在一个均衡策略组合（F，L，D），以及与之相应的博弈方3的“判断”p＝1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)86编辑课件要求3：在均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方的均衡策略决定。博弈存在一个均衡策略组合（F，L，D），以及与之相应的博弈方3的“判断”p＝1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)87编辑课件要求4：在不处于均衡路径上的信息集处，“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定。博弈存在一个均衡策略组合（F，L，D），以及与之相应的博弈方3的“判断”p＝1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)88编辑课件？“要求4”的必要性考查策略组合（B，L，U），及相关的博弈方3“判断”p＝0。首先，该策略组合是一个纳什均衡：

(1)因为，没有博弈方可以通过单独改变自己的策略而改善得益；

(2)事实上，当博弈方1选择B之后，其他两博弈方根本没有选择的机会，而对博弈方1来说，当其他两方的策略是（L，U）时，当然是选择B合算。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)89编辑课件其次，该策略组合满足要求1。要求1：在每个信息集，轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”（Belief）。

(a)对于多节点信息集，“判断”就是博弈达到该信息集中各个节点可能性的概率分布；

(b)对于单节点信息集，则“判断”就是博弈达到该节点的概率为1。123FBRLUDUD(2,0,0)(1,2,1)(3,3,3)(0,1,2)(0,1,1)90编辑课件然后，在博弈方3对博弈方2的“判断”是p＝0时，（B，L，U）是序列理性的，因此满足要求2。要求2：给定各博弈方的“判断”，他们的策略必须是“序列理性”的。

(a)即在各个信息集，给定轮到选择博弈方的判断和其他博弈方的“后续策略”，该博弈方的行为及以后阶段的“后续策略”，必须使自己的得益或期

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

完美贝叶斯均衡

文档简介

温馨提示

最新文档

评论

完美贝叶斯均衡

文档简介

温馨提示

最新文档

评论

相关文档