讲义不完全信息静态博弈_第1页
讲义不完全信息静态博弈_第2页
讲义不完全信息静态博弈_第3页
讲义不完全信息静态博弈_第4页
讲义不完全信息静态博弈_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5讲:不完全信息静态博弈主讲人:张成科博士广东工业大学经济与贸易学院zhangck@管理博弈论

(Management

GameTheory)一不完全信息静态博弈和贝叶斯纳什均衡不完全信息博弈海萨尼转换不完全信息静态博弈的战略式表述和贝叶斯纳什均衡二贝叶斯纳什均衡应用举例三贝叶斯纳什均衡与混合战略均衡四机制设计理论与显示原理第四章不完全信息静态博弈

------贝叶斯纳什均衡不完全信息博弈我们不可能料事如神,也无法掌握所有变因,更无力预测未来,不确定性不可避免。这里主要探讨如何在不确定性的情况下做出理性、一致的决策,换句话说,首先必须承认自己虽然没有办法做到无所不知,但也不至于一无所知,而应该或尽可能有效运用自己所知的一切为自己谋利。不完全信息博弈“空城计”街亭失守,司马懿引大军蜂拥而来,当时孔明身边只有一班文官,军士一半已经运粮草去了,只有2500军士在城中。众官听得这个消息,尽皆失色。孔明登城望之,果然尘土冲天,魏兵分两路杀来。孔明令众将旌旗尽皆藏匿,打开城门,每一门用20军士,扮作百姓,洒扫街道。而孔明羽扇纶巾,引二小童携琴一张,于城上敌楼前凭栏而望,焚香操琴。不完全信息博弈司马懿自马上远远望之,见诸葛亮神态自若,顿时心生疑忌,犹豫再三,难下决断。又接到远山中可能有埋伏的情报,于是叫后军做前军,前军做后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故做此态,父何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险,今大开城门,必有埋伏,我兵若进,必中计也。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险,疑有伏兵,所以退去。吾非行险,盖因不得已而用之,弃城而去,必为之所擒。”不完全信息博弈-信息的重要性被擒,?不被擒,?被擒,?不被擒,?司马懿诸葛亮弃城守城进攻撤退司马懿:兵多将广,但不知道自己和对方在不同行动策略下的支付;诸葛亮:处于劣势,但知道博弈的结构,比对方掌握更多的信息。计策:使用各种手段迷惑司马懿,为的是不让对方知道其策略的结果(支付)。迫使其认为,撤退比进攻好,降低其进攻的预期收益。如用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率,使司马懿认为进攻的期望收益小于撤退的期望收益。

司马懿关于自己策略的支付的信息是不完全的。不完全信息博弈

在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的期望效用或支付最大。如让你在50%的概率获得100元与10%的概率获得200元两者之间选择的话,前者的期望所得是50元,后者是20元,故选前者。不完全信息博弈在生活中我们也会碰到这样的问题,比如一个乞丐向你乞讨,你愿意帮助别人,但不知道他是真的乞丐还是骗子,该如何决定呢?如果你喜欢与人为善,你可能愿意冒一点上当的危险,这不等于你愚蠢,而是你认为,帮助一个困境中的人比回绝一个骗子更重要。不完全信息博弈完全信息与不完全信息:每一个参与人对所有其他参与人的(对手)的特征、战略空间及支付函数有准确的知识,否则为不完全信息。类似上述情况称为不完全信息博弈,即在不完全信息博弈中,至少有一个参与人不知道其他参与人的支付函数。第四章不完全信息静态博弈

-贝叶斯纳什均衡一不完全信息静态博弈和贝叶斯纳什均衡不完全信息博弈海萨尼转换不完全信息静态博弈的战略式表述和贝叶斯纳什均衡二贝叶斯纳什均衡应用举例三贝叶斯纳什均衡与混合战略均衡海萨尼转换-3,-3-3,-31,01,00,10,00,10,0默许斗争默许斗争进入不进入在位者市场进入博弈:不完全信息进入者高成本情况低成本情况

进入者似乎在与两个在位者博弈,一个是高成本的在位者,一个是低成本的在位者;如果在位者有T种不同的成本函数进入者就相当于与T个不同的在位者博弈。

1976年以前,博弈论专家认为这样的不完全信息是没法分析的。海萨尼转换海萨尼在1967-1968年提出了一个处理不完全信息的方法-引入一个虚拟的参与人“自然”,自然首先行动,选择决定参与人的特征(如成本函数),参与人知道自己的特征,其他参与人不知道。这样不完全信息博弈就转换为完全但不完美信息博弈,可以利用标准的分析技术进行分析,这就是“海萨尼转换”。N高低[P][1-P]不进入进入不进入进入BB合作斗争合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)海萨尼转换类型:一个参与人拥有的所有的个人信息(即所有不是共同知识的信息)称为他的类型。根据这个定义,甚至允许参与人不知道其他参与人是否知道自己的类型。例如:市场进入博弈:在位者不知道进入者是否知道自己是高成本还是低成本,只知道进入者有p’的概率知道自己的成本函数,(1-p’)的概率不知道自己的成本函数。这种情况下,进入者也有两种类型:知道(在位者的成本)或不知道(在位者的成本)。例如:在谈判中,甲方知道自己是强硬派或妥协派,乙方知道自己是否知道甲方是强硬派或妥协派,但甲方不知道乙方是否知道自己是强硬派还是妥协派,则甲方有两种类型:强硬派或妥协派,乙方有两种类型:知道或不知道。不完全信息意味着,至少有一个参与人有多个类型。真正的“信息不对称”一个古董商发现一个人用珍贵的茶碟做猫食碗,于是假装对这只猫很感兴趣,要丛主人手里买下,主人不卖,为此古董商出了大价钱。成交之后,古董商装做不在意地说:这个碟子它已经用惯了,就一块送给我吧。猫主人不干了:你知道用这个碟子,我已经卖了多少只猫了?关于完全信息与不完全信息的关系如果参与人i的类型只包含一个元素,即每个参与人只有一种类型,则该博弈退化为完全信息静态博弈,即完全信息静态博弈是不完全信息静态博弈的特例。Bayes法则:在日常生活中,当面临不确定时,在任何一个时点上,我们对某件事情发生的可能性有一个判断(先验概率),然后,会根据新的信息来修正这个判断(后验概率),Bayes法则就是这样的方法。设参与人的类型是独立分布的,参与人i有K个可能的类型;有H个可能的行动,θk和ak分别表示特定的类型和行动,则P(θk)≥0,∑P(θk)=1,i选择ak的概率为:P{aK}=P(a1|θ1)P(θ1)+···+P(aK|θK)P(θK)=Bayes公式:Bayes法则要求P(aK)>0,否则后验概率无意义。如果P(aK)=0,我们允许P(θK|aK)在区间[0,1]区间取任何值,只要所取的值与均衡策略相容。在动态博弈中,P(aK)=0对应的则为非均衡路径上的信息集。海萨尼转换设θi表示参与人i的一个特定的类型,根据海萨尼公理:假定参与人类型的分布函数P(θ1,…,θn)是所有参与人的共同知识,所有参与人知道P(θ1,…,θn),所有参与人知道所有参与人知道P(θ1,…,θn),如此等等。这意味着在进入市场的博弈中,如果进入者有一种类型,在位者有两种类型,那么p是共同知识,即进入者知道在位者是高成本的概率是p,进入者知道在位者知道进入者知道在位者是高成本的概率是p,如此等等,即在博弈开始时,所有参与人有关自然行动的信念(belief)是相同的。第四章不完全信息静态博弈

-贝叶斯纳什均衡一不完全信息静态博弈和贝叶斯纳什均衡不完全信息博弈海萨尼转换不完全信息静态博弈的战略式表述和贝叶斯纳什均衡二贝叶斯纳什均衡应用举例三贝叶斯纳什均衡与混合战略均衡四机制设计理论与显示原理不完全信息静态博弈

-贝叶斯纳什均衡在不完全信息静态博弈中,所有参与人同时行动,其战略空间等于行动空间,但是参与人i的行动空间可能依赖于其类型,也就是行动空间是类型依存的。类似的,其支付函数也是类型依存的。如企业能选择什么产量依赖于它的成本函数,一个人能干什么依赖于它的能力等。贝叶斯纳什均衡是完全信息静态博弈纳什均衡概念在不完全信息静态博弈上的扩展,不完全信息静态博弈又叫做静态贝叶斯博弈。不完全信息静态博弈

-贝叶斯纳什均衡静态贝叶斯博弈的时间顺序为:1、自然选择类型向量,参与人i能观测到自己的类型,但参与人j只知道除i之外所有参与人类型,但不知道参与人i的类型。2、n个参与人同时行动;3、参与人i得到类型依存支付函数。给定参与人i只知道自己的类型而不知道其他参与人的类型,参与人i将选择使自己的效应最大化的期望效用。贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略的情况下,最大化自己的期望效用。静态贝叶斯博弈定义n人静态贝叶斯博弈的战略式表述包括:参与人的类型空间Θ1,…,Θn,条件概率p1,…,pn,类型依存战略空间A1(θ1),…,An(θn)和类型依存支付函数u1(a1,…,an;θ1),…,un(a1,…,an;θn)。参与人i知道自己的类型θi∈Θi,条件概率pi=pi(θ-i︱θi)描述给定自己属于θi的情况下,参与人i有关其他参与人类型θ-i∈Θ-i的不确定性。可以用G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}代表这个博弈。静态贝叶斯博弈的时间顺序为:1、自然选择类型向量θ=(θ1,…,θn),参与人i观测到θi,但参与人j(≠i)只知道pj(θ-j︱θj),观测不到θi;2、n个参与人同时选择行动a=(a1,…,an),其中ai(θi)∈Ai(θi);3、参与人i得到类型依存支付函数ui(a1,…,an;θi)。

静态贝叶斯博弈定义给定参与人i只知道自己的类型θi而不知道其他参与人的类型θ-i

,参与人i将选择行动ai(θi)最大化自己的期望效用。参与人i的期望效用函数定义为

vi=∑pi(θ-i︱θi)ui(ai(θi),a-i(θ-i);θi,θ-i)战略:在n人静态贝叶斯博弈G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}中,参与人i的战略是一个类型依存函数ai(θi),其中对Θi中的每一个类型θi,ai(θi)包含了自然赋予i的可能类型为ai(θi)时,i将从自己的战略空间Ai(θi)中中选择战略ai(θi)。静态贝叶斯博弈定义贝叶斯纳什均衡:n人不完全信息静态博弈G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}的纯战略均衡是一个类型依存战略组合{ai*(θi)}ni=1

,其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略a-i*(θ-i)的情况下,最大化自己的期望效用函数vi

。与纯战略纳什均衡不同的是,在贝叶斯均衡中参与人i只知道具有类型θj的参与人j将选择aj(θj)但并不知道θj。因此,即使纯战略选择也必须取支付函数的期望值。

二贝叶斯纳什均衡应用举例三贝叶斯纳什均衡与混合战略均衡第四章不完全信息静态博弈(续)N高低[P][1-P]不进入进入不进入进入BB合作斗争合作斗争(0,300)(40,50)(-10,0)(30,80)(-10,100)进入者在位者在位者(0,400)市场进入博弈在市场进入的例子里,均衡战略是:高成本的在位者选择默许,低成本的在位者选择斗争。只有当高成本的概率p=1/5时,进入者才选择进入,否则不进入。不完全信息静态博弈

-贝叶斯纳什均衡假定参与人i的类型依存活动空间和参与人i的效用函数是共同知识,其他参与人不知道参与人i的类型,但知道其战略空间和支付函数是如何依赖于他的类型的。给定参与人i只知道自己的类型而不知道其他参与人的类型,参与人i将选择使自己的效应最大化的期望效用。贝叶斯纳什均衡:n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合,其中每个参与人i在给定自己的类型θi和其他参与人类型依存战略的情况下,最大化自己的期望效用。在市场进入的例子里,高成本的在位者选择默许,低成本的在位者选择斗争,只有当如果p>=1/5时,进入者才选择进入。不完全信息库诺特模型企业1企业2参与人:企业1、企业2;行动顺序:同时行动不完全信息:企业1单位成本c1是共同知识,企业2的成本可能是c2l或c2h,企业1只知道c2=c2l的可能性是1/2,这是共同知识。不完全信息库诺特模型qi

:第i个企业的产量Ci:代表第i个企业的成本假定逆需求函数为:第i个企业的利润函数为:企业1企业2假定a=2,c1=1,c2l=3/4,c2h=5/4。给定企业2知道企业1的成本,企业2将选择q2最大化利润函数:t=a-c=a-3/4=5/4或t=a-5/4=3/4依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为:企业1企业2不完全信息库诺特模型不完全信息库诺特模型也就是说,企业2的最优产量不仅依赖于企业的产量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最优产量,q2h为t=3/4时企业2的最优产量。那么,

q2l=1/2*(5/4-q1);q2h=1/2*(3/4-q1)

企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h,因此企业1将选择q1最大化下列利润函数:不完全信息库诺特模型最优化一阶条件得企业1的反应函数为:是企业1关于企业2产量的期望值均衡意味着两个反应函数同时成立,解两个反应函数得贝叶斯均衡为:

拍卖理论简介拍卖或招标有两个基本功能,一是揭示信息,二是减少代理成本。拍卖是博弈论重要的分支。著名拍卖理论专家维克利(Vickrey),由于在拍卖及在拍卖基础上衍生的机制设计理论的一些原创新工作,获得了1996年的诺贝尔经济学奖。一级密封价格拍卖(招标)当一件物品对买者的价值买者比卖者更清楚时,卖者一般不愿意首先提出价格,而常常采用拍卖的方式以获得可能的最高价格。这种情况在古董和名画的交易中特别普遍。一级密封价格拍卖是许多拍卖方式中的一种。在这种拍卖中,投标人同时将自己的出价写下来装入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是赢者,按他的出价支付价格,拿走被拍卖的物品。这里,每个投标人的战略是根据自己对该物品的评价和对其他投标人评价的判断来选择自己的出价,赢者的支付是他对物品的评价减去他的出价,其他投标人的支付为零。首先考虑两个投标人的情况,i=1,2。令bi≥0是投标人i的出价,vi为拍卖物品对投标人i的价值。假定vi只有i知道(因而vi是投标人i的类型),但两个投标人都知道vi独立地取自定义在区间[0,1]上的均匀分布函数。投标人i的支付如下:这里,我们假定如果两个投标人出价相同,拍卖品在两人之间随机的分配。一级密封价格拍卖(招标)假定投标人i的出价bi(vi)是其价值vi的严格递增可微函数。显然,bi>1≥vi不可能是最优的,因为没有人愿意付出比物品价值本身更高的价格。由于博弈的对称性,我们可只需考虑对称的均衡出价战略:b=b*(v)。给定v

和b,投标人i的期望支付为:这里Prob(·)代表bj<b的概率,其中bj是投标人j的出价战略。因为出价战略是严格递增的,Prob(bj<b

)=Prob(

bj≤b

)。期望支付的第一项(v-b)是给定赢的情况下投标人i的净所得,第二项Prob(·)是赢的概率。一级密封价格拍卖(招标)根据对称性,bj=b*(vj),所以这里,φ(b)是b*的逆函数(即当投标人选择b时他的价值是φ(b))。因此,投标人i面临的问题是:最优化的一阶条件是:一级密封价格拍卖(招标)如果b*(·)是投标人i的最优策略,φ(b)=v。因此,上述微分方程可以写成:解得:就是说,这个博弈的贝叶斯均衡是。每个投标人的出价是其实际价值的一半:。在均衡情况下,被拍卖品归评价最高的投标人所有,这从资源配置的角度讲是有效率的,但卖者只得到买者价值的一半。一级密封价格拍卖(招标)可以证明,投标人出价与实际价值之间的差距随投标人数的增加而递减。假定有n个投标人,每个投标人的价值vi具有独立的、相同的定义在[0,1]区间上的均匀分布,如果评价为v的投标人i出价b,他的期望支付函数为:最优化的一阶条件为:

或一级密封价格拍卖(招标)一级密封价格拍卖(招标)因为在均衡情况下φ(b)=v,一阶条件可以写成:

解上述微分方程得:显然,b*(v)随着n的增加而增加。特别地,当n→∞时,b*→

v

。就是说,投标人越多,卖方能得到的价格就越高;当投标人趋于无穷时,卖方几乎可以得到买方价值的全部。所以,让更多的投标人加入竞标是卖方的利益所在。在公共管理中,政府的采购和公共工程招投标中通常规定要进行公开招标,并在参加竞标的公司数目上有下限规定,其缘故正是如此,因为更多的竞争者参加投标会压低工程报价,从而使政府开支得到一定程度的节省。二贝叶斯纳什均衡应用举例三贝叶斯纳什均衡与混合战略均衡第四章不完全信息静态博弈(续)4.3

贝叶斯博弈与混合战略均衡例抓钱(grabthedolla)博弈:

每个参与人有两个可能的行动:投资(“抓”)或不投资,在完全相信博弈中两人的得益如下:

抓不抓抓-1,-11,0

不抓0,10,0该博弈有唯一的混合策略Nash均衡σ1=σ2=(1/2,1/2)。现在我们稍微扰动一下得益矩阵,即对部分得益赋予一个小的“随机干扰”:

投资不投资

投资-1,-11+θ1,0

不投资0,1+θ20,0

其中θi在[-ε,ε]上均匀地分布。12这是一个不完全信息的Bayes博弈,如果把“抓钱”看作投资,不论公司属于什么类型,它们依然各有两个策略:投资或不投资。信念密度为:如果当θ1超过某临界值x时,公司1投资,否则就不投资;同样,如果θ2超过某临界值y时,公司2投资,否则就不投资。X、y∈[-ε,ε]。公司1投资时的期望利润为:时公司1投资。类似地,只有当时公司2投资。将上面两式联立,解得:x=y=0。于是我们得到对称的纯策略Bayes均衡解为:公司i当θi≥0时投资,当θi<0时不投资。从以上分析可知,每家公司均以1/2的概率投资,1/2的概率不投资。当ε→0时,不完全信息静态博弈趋于完全信息静态博弈,而完全信息静态博弈的混合策略Nash均衡{(1/2,1/2),(1/2,1/2)}可以看作这一系列Bayes博弈均衡的极限。例2性别战博弈该博弈有两个纯策策Nash均衡和一个混合策略Nash均衡,分别为:(戏,戏)、(足球,足球)和{(2/3,1/3),(1/3,2/3)}。戏足球戏2,10,0足球0,01,2女男Ⅰ例2性别战博弈明显地,t1应有一个临界值c1,超过c1女方就会选择“戏”,同样t2也有一个临界值c2,超过c2时男方就会选择“足球”。对该博弈稍作扰动,变为下述博弈:t1为女方的私人信息,t2为男方的私人信息。设类型t1、t2为来自[0,x]上均匀分布的独立随机变量。在该博弈中,行动空间A1=A2={戏,足球},类型空间T1=T2=[0,x],信念密度为p1(t1)=p2(t2)=1/x戏足球戏2+t1,10,0足球0.01,2+t2男女Ⅱ现在来寻求Bayes博弈的纯策略均衡,在这个均衡中,女以(x-c1)/x的概率看戏;男以(x-c2)/x的概率看足球。对给定的x,要求出c1、c2的确定值,使上述策略构成纯策略Baye

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论