博弈论与信息经济学-1博弈论基础_第1页
博弈论与信息经济学-1博弈论基础_第2页
博弈论与信息经济学-1博弈论基础_第3页
博弈论与信息经济学-1博弈论基础_第4页
博弈论与信息经济学-1博弈论基础_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论与信息经济学

1博弈论基础2009年03月02日主要内容何谓博弈?非合作博弈论的基本概念博弈的战略式与扩展式表述

信息集与信息结构何谓博弈?从孩提时代,我们就玩游戏,如捉迷藏、大富豪、象棋和网球等。但是,经济学家在谈到博弈时,指的是社会和经济相互作用。这些博弈与儿童们玩的游戏的共同之处在于它们都是一种局势,决策者必须考虑其他人的行动。决策者间的相互依存是博弈的实质。何谓博弈?在博弈论中,博弈应理解为明智的、理性的个人或群体间冲突与合作的情形。对于这些明智的、理性的个人或群体来说,他们的目标通常远比单纯地击败对手复杂得多。在经济生活中,通常,参与者可以以某些方式相互对抗;在另一些方面,他们也可通力合作达到某一同样的结果。比方说,当几家公司都对制定高价表现出一致的兴趣时,他们就能在各自占有的市场份额中获得富有竞争力的利润。何谓博弈?博弈作为概念的名词,是对若干个决策主体在战略相互依存情形中相互作用的局势所进行的正式表述。作为表示动作的动词,是指若干个决策主体在战略相互依存情形下进行相互作用。博弈意味着各决策主体的福利不仅取决于其自身的行动,也取决于其他决策主体的行动,而且,各决策主体采取的最佳行动依赖于其预期的其他参与者的行动,——即战略相互作用。何谓博弈?非合作博弈论研究的是,在各主体的最佳选择依赖于对其对手的选择的预测的情形中主体的行为。尽管“博弈”一词的普通用法是象棋和扑克等室内游戏,在我们所要研究的典型的博弈类别中,参与人的目标更为复杂,不只是击败其他人,他们既有利益竞争,也有共同利益。合作与非合作博弈参与人之间能否合作(串谋、联盟)取决于承诺的强度。如果参与人可以达成约束性的承诺或协议,就是合作博弈;如果不能,就是非合作博弈。博弈的基本要素:博弈结构博弈描述了为界定博弈我们必须知道的战略相互作用局势的6种基本要素,称为博弈结构。(i)局中人/参与人:有谁参与博弈?博弈规则:(ii)行动次序-谁什么时间行动?(iii)行动集合-他们可以采取什么行动?(iv)信息-他们在行动时知道些什么?(v)行动结果:对于局中人的各种可能的行动组合,产生的实际结果是什么?(vi)支付或收益:局中人对各种可能的结果的偏好(即效用函数)是什么?硬币配对(猜谜)博弈局中人:两个参与人-儿童A和B;博弈规则:每个参与人同时亮出一枚硬币,正面或者背面向上,双方事先不知道对方的选择是什么;行动结果:如果硬币配对(都是正面或背面向上),局中人A付给局中人B一块钱;否则,局中人B付给局中人A一块钱;各局中人对各种可能结果的偏好是什么?支付/收益

效用

偏好一般地,我们用效用函数表示局中人的偏好,效用函数为各种可能的博弈结果赋予效用水平。通常,我们把参与人的效用函数说成支付函数,而把效用水平说成支付。

我们假定效用函数取期望效用的形式,在我们考虑博弈结果随机的情形时,可以用参与人的期望效用评价随机结果。金钱

支付对于硬币配对博弈,我们假设各参与人的支付等于其获得或失去的钱数。使一个参与人的支付最大化的行动取决于这个参与人预期其对手会采取的行动。零和博弈上面这个例子涉及的是纯粹(严格)冲突的情形:一个参与人之所得,即另一参与人之所失,这样的博弈称为零和博弈。但战略相互作用的博弈论不限于纯粹冲突或者甚至部分冲突的情形。零和与非零和博弈经济学中的博弈,通常,如果一个参与人有所得,另一个参与人不一定有所失。由于经济学主要关心交易产生的收益,因此,毫不奇怪,双赢的结果是可能的,即使各参与人都只追求其自身支付的最大化。但是,在某些博弈中,参与人的支付之和总是零。零和与非零和博弈零和博弈是不论参与人选择何种战略,所有参与人的支付之和为零的博弈。所有参与人的支付之和不为零的博弈称为非零和博弈或变和博弈。如果博弈是零和博弈,不论结果如何,参与人的效用加起来为零。通常,即使支付加起来不为零,只要是某个常量,建模者也称之为零和博弈。约会博弈参与人:两个参与人张三和李四;博弈规则:两个参与人是分开的,无法联系;他们相约在济南会面,一起吃午饭,但忘了约定地点;每个人都要单独决定到哪里去(都只能有一种选择)。行动结果:如果他们碰到一起,吃午饭时各自都有伴;否则,就只有独自用餐。支付:他们都认为有另一方作伴的货币价值为100元(如果碰到一起,他们的支付都是100元;如果没有碰到一起,支付都是0)。约会博弈张三李四地点A地点B地点A地点C0,0100,1000,00,0战略协调在这个例子中,两个参与人的利益是完全一致的,他们面临的只是一个协调问题。然而,各参与人的支付依赖于另一个参与人去哪里。而且,更为重要的是,各参与人的最佳行动取决于他认为另一个参与人会去哪里。所以,即使是协调这样的事情,也会具有战略特征。博弈论11要素参与人、行动、行动顺序、信息、行动结果、支付、战略、信念、均衡/解概念、均衡和均衡结果,称为博弈论11要素。行动、行动顺序、信息3个要素称为博弈规则或博弈顺序;博弈规则要把行动和信息按行动顺序表示出来。参与人、行动、行动顺序、信息、行动结果、支付6个要素称为博弈结构。博弈论11要素信念和战略是参与人的主观判断与选择。均衡/解概念是博弈论研究的结果。博弈分析的目的是根据博弈结构(以及战略与信念)和均衡/解概念,预测均衡和均衡结果。均衡和均衡结果是博弈分析的结果。博弈论局中人的相互关系博弈论研究者博弈论学习者博弈参与人博弈结构+战略+信念均衡+均衡结果均衡/解概念博弈分析博弈分析者-建模者博弈论局外人研究学习了解现实生活囚徒博弈的要素分析参与人:囚徒A和囚徒B,分别称为行参与人和列参与人;行动:两人都有两种选择——坦白或抵赖;行动次序:两人同时选择——静态博弈;信息:参与人相互不知道各自的选择;行动结果:释放、判8年、判10年、判1年;支付:见支付双矩阵;囚徒博弈的要素分析信念:双方都相信对方会选择坦白;战略:静态博弈,双方简单地选择不同的行动;均衡概念:占优均衡、重复剔除占优均衡、纳什均衡;均衡:参与人都选择坦白;均衡结果:各获得-8的支付。1.参与人(player,局中人)参与人指的是博弈中的决策主体,其目的是通过选择行动(或战略)以最大化自己的效用水平,因此符合理性经济人假设。参与人可能是自然人,也可能是团体,如企业、国家,甚至若干个国家组成的集团(如OPEC、欧盟、北约等)。每个参与人必须有可供选择的行动和一个很好定义的偏好函数。一个主体是否是参与人依赖于分析的目的。被动主体如顾客不是参与人,而是环境参数,他们对价格变化作出可预测的反应,并不想改变任何人的行为。

“自然”(Nature):虚拟参与人(pseudo-player)虚拟参与人以纯机械的随机方式采取行动。自然是一种虚拟参与人,在博弈的特定时间上以特定概率采取随机行动,是外生的随机变量的概率分布的决定机制,参与人决策的后果依赖于自然的选择。在不完全信息博弈中,自然选择参与人的类型。与一般参与人不同的是,“自然”作为虚拟参与人没有自己的偏好、支付和目标函数(即所有结果对它都是无差异的)。我们一般用i=1,...,n代表参与人,N代表“自然”。自然行动的建模如果参与人知道自然的行动,我们就说自然在参与人行动之前行动。假定有两个参与人A和B,A先行动,B后行动。如果两人都知道自然的行动,我们说自然在两人之前行动;如果只有B知道,我们说自然在A之后B之前行动;如果两人在决策时都不知道自然的行动,我们说自然在博弈结束时行动。支付:(新店,老店)干洗店市场进入博弈的扩展式:新店和老店都不知道自然的选择-市场需求的大小()()()()()()()()自然新店新店老店老店老店老店N干洗店市场进入博弈的扩展式:新店知道但老店不知道自然的选择-市场需求的大小正常,.7衰退,.3进入不进入进入不进入高价低价高价低价高价低价高价低价(100,100)(-100,-50)(0,300)(0,50)(40,40)(-160,-110)(0,240)(0,-10)2.行动(actionormove)行动是参与人在博弈的某个时点可以作出的选择,称为决策变量。一般地,我们用ai表示第i个参与人的一个特定行动,Ai={ai}={a1i,a2i,a3i,......}表示可供参与人i选择的所有行动的集合(actionset),称为其行动空间(actionspace)。参与人的行动可能是离散的,也可能是连续的;可能是有限的,也可能是无限的。行动组合在n人博弈中,n个参与人各选择一种行动组成的序列a=(a1,...,ai,...,an)称为行动组合(actionprofile),其中的第i个元素ai是第i个参与人选择的行动。第i个参与人的最佳行动取决于所有其他参与人的行动。3.行动顺序(orderofplay)行动顺序或称博弈次序,对于博弈的结果是非常重要的。同样的参与人,同样的行动集合,如果行动的顺序不同,每个参与人的最优选择就不同,博弈的结果就不同。事实上,不同的行动顺序意味着不同的博弈。在动态博弈中,后行动者可以通过观察先行动者的行动来获得信息。在博弈论中,一般假定参与人的行动空间和行动顺序是所有参与人的共同知识。4.信息(information)信息是参与人对有关变量的值的知识,特别是有关自然的选择和其他参与人的特征、偏好、行动选择、战略空间及支付函数等的知识。信息集(informationset)是博弈论中描述参与人信息特征的一个基本概念,我们可以将其理解为参与人在特定时刻对有关变量的值的知识。一个参与人在特定时刻无法准确知道的变量的全体属于一个信息集。信息集信息集中的元素是参与人认为可能的不同的值,信息集中元素越多,信息越模糊不清;这意味着参与人无法排除这些值;如果只有一个元素,说明他准确地知道某变量的值。

参与人的信息集不仅包括各变量不同的值,而且包括关于过去采取了何种行动的知识,因此,在博弈过程中,参与人的信息集是变化的。5.行动结果对于参与人的各种可能的行动组合,博弈的实际结果是什么,也可称为博弈结果。6.支付(payoff)参与人i的支付

i(s1,...,sn)表示:(1)自然和所有参与人选择其战略从而博弈完成后参与人i获得的确定效用;或者(2)作为他自己和其他参与人选择的战略的函数而获得的期望效用。支付是博弈参与人真正关心的东西。我们假定每一个参与人的偏好都可以由一个v-N-M期望效用函数来代表,他的目标是选择自己的战略以最大化其期望(平均)效用函数。v-N-M是vonNeumannandMorgenstern的缩写。

支付在博弈论中,“支付”不是支出或付出,而是真实反映了参与人的动机(偏好)的冯.诺伊曼-摩根斯坦效用。如果参与人面对不确定性,对于其不确定的未来支付,参与人将最大化其效用的期望值,我们说这样的参与人具有冯.诺伊曼-摩根斯坦效用函数,用这个名称是为了强调冯.诺伊曼和摩根斯坦对这种行为的严格合理性的阐述。所以,冯.诺伊曼-摩根斯坦效用就是期望效用。期望效用或期望支付是支付或效用的概率分布的加权值之和。支付及支付组合令

i为第i个参与人的支付(效用水平),博弈的一个基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择,就是说,

i是所有参与人的战略选择的函数:

i=

i(s1,...,si,...,sn)

=(

1,...,

i,...,

n)称为n个参与人的支付组合(payoffprofile)。如果要模拟现实中的特定情形,琢磨(反复思索;捉摸=猜测,预料)出支付常常是建模中最难的部分。7.战略(strategy)战略是参与人制定的依据每一时刻所拥有的信息即在给定信息集的情况下选择行动的计划或规则,它规定参与人在什么时候什么情况下选择什么行动;战略必须是完备的,即必须针对每一种可能的情况规定选择行动的准则,如“人不犯我,我不犯人;人若犯我,我必犯人”。Theenemyadvances,weretreat;Theenemycamps,weharass;Theenemytired,weattack;Theenemyretreats,wepursue.战略空间和战略组合一般地,我们用si表示第i个参与人在给定其信息集的情况下的一个特定战略,Si={si}=={s1i,s2i,s3i,......}代表第i个参与人的所有可选择的战略的集合或空间(strategysetorspace)。如果博弈中n个参与人每人选择一个战略,组成的n维战略向量s=(s1,...,si,...,sn)称为一个战略组合或局势(strategyprofile),其中si是第i个参与人选择的战略。所有其他参与人的战略组合在讨论均衡概念时,我们需要“所有其他参与人的战略”的简便记法,为了把一个特定的参与人的战略与其他参与人的战略相区别,我们将用s-i=(s1,...,si-1,si+1,...,sn)表示除i之外的所有参与人的战略组成的向量。使用这个记法,例如,s−Smith,是除了参与人Smith外各参与人的战略组合。信息与战略因为信息集包含了一个参与人有关其他参与人之前行动的知识,战略告诉该参与人如何对其他参与人的行动作出反应,因而战略是参与人的相机行动方案(contingentactionplan)。一个参与人希望选择的行动常常取决于自然和其他参与人过去的行动,只有在非常少的情况下,我们可以无条件地预测参与人的行动,但是,我们常常可以预测参与人如何对外界作出反应。信息与战略作为参与人选择行动的规则,战略依赖于参与人获得的信息。在静态博弈中,战略和行动是相同的。这是因为,在静态博弈中,所有参与人同时行动,没有任何人能获得他人行动的信息,从而,战略选择就变成简单的行动选择。

战略的完备性作为一种行动规则,战略必须是完备的,参与人的战略是一套完整的指令,规定每一种可以想象的情形下选择什么行动,即使参与人并不预期会达到这种情形。严格地说,即使参与人的战略规定他在1989年自杀,也应当说明,如果他1990年仍然活着的话,应当采取何种行动。在讨论“子博弈精炼”均衡时,这种仔细是非常重要的。战略的完备性事实上,一种特定的情况是否真的会发生,往往依赖于参与人的战略。这一点对于动态博弈的均衡是非常重要的,战略选择往往就是为了避免某种情形的发生。如,选择战争是为了避免战争。即使我们根本就不想打仗,或预期不会发生战争,战略也要指明一旦发生战争应当如何行动。战略与行动战略是选择行动的规则,而不是行动本身,战略要说明什么时候采取什么行动。战略只是思维的,是不可观察的;行动是物质的,是可观察的。田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。8.信念信念即对某种事件的主观概率分布。所谓“主观概率”,就是参与人把头脑中通常是不清晰的认识利用起来,得到所需要的概率分布。当博弈涉及外生的不确定性事件时,我们假定“自然”以某种概率选择某个特定事件。海萨尼公理:一般假定,所有参与人对自然的选择具有相同的先验概率。根据观察到的事件和贝叶斯法则,先验信念/概率可以修正为后验信念/概率。先验信念与后验信念在决策过程中,确定各种随机事件的概率是重要的一步。所谓先验概率,是相对于进一步利用更多的信息所得的概率而言,先验概率建立在经验基础之上,绝不是完全离开经验的唯心的东西。如果在有了先验概率之后,又获得了新的有用信息,把新的信息利用起来,对原来的概率进行修正,只要新的信息是有价值的,无疑,修正后的概率将会更加符合实际情况。修正后的概率称为后验概率,实质上,它是以新的信息为条件的条件概率。——黔驴技穷、打草惊蛇、声东击西。9.均衡(equilibrium)博弈的均衡是所有参与人选择的最优战略的组合,一般记为:s*=(s1*,...,si*,...,sn*)其中,si*是第i个参与人在均衡情况下的最优战略,它是i的所有可能的战略中使

i或期望(E)

i最大化的战略,称为均衡战略。一般来说,由于

i是所有参与人的战略组合的函数,i的最优战略通常依赖于其他参与人的战略选择。

均衡战略与预测为了预测博弈的结果,建模者要考虑可能的战略组合,因为正是不同参与人的战略相互作用决定什么会发生。预测会发生什么,就是选择一个或多个战略组合,作为为了最大化其支付而行动的参与人的最为理性的行为。均衡是各参与人为了最大化其个人支付而选择的战略的组合,不同于各参与人任意选择一项战略可以得到的许多可能的战略组合。10.均衡结果

(equilibrium

outcome)博弈的均衡结果是博弈分析的结论,是博弈分析者感兴趣的所有内容。给定均衡,建模者就可以看出所有参与人的均衡战略组合会产生什么行动组合、支付组合等。均衡和均衡结果(equilibriumoutcome)是两个非常容易混淆的概念,当人们说均衡时他们常常是指均衡结果。尽管在许多情况下,二者的区别并不很重要,但理解二者的区别对理解博弈论的一些理论是重要的。

均衡与均衡结果博弈的均衡结果是博弈结束后,建模者从行动、支付和其他任何变量的值中选择出来的一些有趣的元素。任何特定模型的均衡结果的界定取决于建模者认为什么变量是有意思的。均衡是均衡战略的组合,通常,不同战略组合可导致相同的均衡结果。一个博弈可能有多个均衡存在。缺乏唯一性是博弈论的一个主要问题。此均衡非彼均衡均衡在博弈论中的用法与经济学的其他领域不同。比如说,在一般均衡理论里,均衡指的是由个人最优化行为导致的一组价格与产量,而在博弈论里,这样一组价格和产量只是均衡结果而不是均衡本身。就此而言,均衡是指所有主体的最佳买卖规则(战略)的组合,均衡价格和产量是这种战略组合产生的结果。11.均衡概念或解概念为了找到均衡,建模者必须界定均衡概念,规定“最优战略”的含义。均衡概念或解概念F:{S1,...,Sn;

1,...,

n}

S*={s1*,s2*,...},是根据可能的战略组合和支付函数定义均衡的规则。

表示映射规则。均衡/解概念是博弈分析者判断博弈的均衡和均衡结果的规/准则,即如何对博弈进行求解的逻辑准则。在博弈论里,有各种各样的均衡概念或解概念,下面定义的占优原则是所有均衡概念的共同特征。最佳反应与解概念参与人i对战略组合s−i的最佳反应或最佳应对或最优战略是为其产生最大支付的战略s*i,即

i(s*i

,s−i)

i(s’i,s−i),

s’i

s*i,并且至少对一个s’i严格不等号成立,称为占优原则。[如果

s-i,上式成立,s*i称为占优战略(dominantstrategy)。]如果没有其他战略同等地好,即上式取严格不等号,最优反应就是强/严格最优,否则,就是弱最优。一个战略是劣的(dominatedstrategy),如果至少存在另一个优于它的战略。]均衡意味着,对所有的i=1,2,...,n,上式同时成立。约会博弈张三李四地点A地点B地点A地点C0,0100,1000,00,0行参与人R列参与人C占优战略围魏救赵公元前354年,魏国大将庞涓率兵攻打赵国都城邯郸,次年,赵国向齐国求援,齐王派大将田忌和军师孙膑前去救赵。田忌想率兵直奔赵国的都城,与魏军决一死战。但是,孙膑建议攻打魏国都城大梁。田忌采纳了孙膑的意见,率兵直抵魏国的都城。消息传出,庞涓退兵,星夜赶回魏国。结果在桂陵一带遭到齐军伏击,大败而归。博弈论基本准则

和基本见解一个参与人要假设对手将理性地即以对其最有利的方式行动,据此制定自己的战略。我们说参与人是理性的,就是说他绝不会选择劣战略。博弈论的一个重要告诫是非合作均衡对参与人来说可能是无效率的,即其总收益可能不是最大的,甚至可能是最小的。解概念与唯一性只有少数均衡概念得到人们的广泛认可,可以用来找到均衡。第一个重要的均衡概念是以占优思想为基础的——占优战略与占优战略均衡。人们认可的解概念并不能保证唯一性,而缺乏唯一性是博弈论的一个主要问题。有时候,博弈根本没有均衡。没有均衡意味着,博弈分析者没有很好的理由认为一个战略组合比另一个战略组合更有可能出现,或者某个参与人对于某种行动想选择一个无限的值。博弈的战略式与扩展式表述如何用战略式和扩展式表示同时行动博弈和序贯行动博弈?序贯行动与信息-静态角度如果说战略思维的一半是预测其他参与人会做什么,另一半就是弄清他知道什么。同时行动:虽然一个参与人先行动,但另一个参与人不知道他采取了什么行动,所以,参与人没有机会通过相互观察了解各自的私人信息。序贯行动与信息-动态角度如果参与人按顺序行动,信息就变得非常重要。事实上,同时行动博弈与序贯行动博弈的重要区别是,在序贯博弈中,第二个参与人在作出自己的决策前,可以获得关于第一参与人如何行动的信息。战略式与结果矩阵序贯行动博弈在表述方面需要比单次行动博弈更加仔细。在同时行动博弈中,战略与行动相同,战略就是简单地选择行动,而结果也比较简单,双矩阵表完成了两项任务:把战略组合与支付,行动组合与行动结果联系起来。这两种映射称为战略式矩阵和行动结果矩阵,在更为复杂的博弈中,它们是相互不同的。博弈的战略式表述在战略式表述中,所有参与人同时选择各自的战略,所有参与人选择的战略一起决定每个参与人的支付。战略式表述首先给出博弈结构:1.博弈的参与人集合:

i∈Г,Г={1,2,...,n};2.每个参与人的战略空间:Si,i=1,2,...,n;3.每个参与人的支付函数:

i(s1,...,si,...,sn),i=1,2,...,n。我们将用G={S1,...,Sn;

1,...,

n}代表战略式表述博弈结构。其次,战略式表述给出战略式矩阵和行动结果矩阵。双寡头产量博弈的战略式表述在双寡头产量博弈里,企业是参与人,产量是战略空间,利润是支付;这个博弈的战略式表述为:G={q1≥0,q2≥0;π1(q1,q2),π2(q1,q2)}这里qi和πi分别是第i个企业的产量和利润。有限博弈

一个博弈被称为有限博弈(finitegame),如果第一,参与人的个数是有限的,第二,每个参与人可选择的战略是有限的。两人有限博弈的战略式表述可以用双矩阵表来直观地给出。

协调博弈张三李四大小大小-1,-12,2-1,-1

1,1战略式矩阵说明各种可能的战略组合产生什么支付;结果矩阵说明各种可能的行动组合会产生什么结果。n人博弈的战略式表述下面的定义用

n表示参与人的数量,用

k表示结果向量中变量的个数,用

p表示战略组合的数量,用q表示行动组合的数量。战略式矩阵(或标准式)包括:1所有可能的战略组合s1,s2,...,sp.2支付函数,把

si

映射到

n维支付向量

i=(

i1,i2,…,in),i=1,2,...,p.行动结果矩阵包括:1所有可能的行动组合

a1,a2,...,aq.2行动结果函数,把

ai

映射到k维行动结果向量

zi,i=1,2,...,q.跟随领导者博弈在前面的协调博弈的基础上,在跟随领导者博弈中,张三先行动,承诺选择大或小,无论李四选择大或小。这个博弈说明,增加一点复杂性,战略式表述就会模糊不清,用处不大。这个新博弈的行动结果矩阵与协调博弈相同,但其战略式矩阵是不同的,因为李四的战略不再是单个行动,他的战略集合有四个元素。跟随领导者博弈-行动结果矩阵张三李四大小大小-1,-12,2-1,-1

1,1{(如果张三选择大,选择大;如果张三选择小,选择大),(如果张三选择大,选择大;如果张三选择小,选择小),(如果张三选择大,选择小;如果张三选择小,选择大),(如果张三选择大,选择小;如果张三选择小,选择小)}简记为:{(大|大,大|小),(大|大,小|小),(小|大,大|小),(小|大,小|小)}李四的战略集合:跟随领导者博弈-战略式矩阵张三大小李四大|大,大|小大|大,小|小小|大,大|小小|大,小|小2,22,2-1,-1-1,-1-1,-11,1-1,-1

1,1如果都有三种行动选择{大,小,无},李四的战略有几个?博弈顺序标准式很少用于稍微复杂一点的博弈的建模,建立序贯博弈的模型有一种更为简便的方法:博弈顺序,就跟随领导者博弈而言,博弈顺序是:1张三选择大或小;2李四选择大或小。标准式强化了列出所有可能的战略并比较其支付的思想;但是,博弈顺序则给出一种描述博弈的较好方法。扩展式与博弈树-定义另外两种描述博弈的方法是扩展式和博弈树。我们首先定义它们的组成要素。结点X是博弈中某参与人或自然采取行动的一点,或者博弈结束;结点X的后续结是如果X达到了,而后博弈中会出现的结点;结点X的前列结是在X达到前必须到达的结点;扩展式与博弈树-定义起始结是没有前列结的结点;终结点是没有后续结的结点;分枝是在特定结点上参与人行动集合中的一个行动;路径是从起始结到终结点的一系列结点和分枝。这些概念用来定义扩展式和博弈树。扩展式博弈的扩展式表述包括:1由结点和分枝组成的结构,从单个起始结到终结点,没有任何闭环;2哪个结点属于哪个参与人的标示;3自然在其结点用以选择不同分枝的概率;4各参与人结点划分的信息集;5各参与人在每个终结点的支付。博弈树博弈树与扩展式相同,只是第(5)项换成5’

各终结点的结果。博弈树一词与扩展式相比不太精确。如果结果定义为支付组合,每个参与人一个支付,那么扩展式与博弈树是相同的。张三李四1李四2大小大小大小(2,2)(-1,-1)(-1,-1)(1,1)跟随领导者博弈的扩展式动态博弈:张三先行动,李四后行动,李四能够观察到张三的选择。支付:(张三,李四)张三李四1李四2大小大小大小(1,1)(-1,-1)(-1,-1)(2,2)协调博弈的扩展式静态博弈:各参与人在两种行动中作一次决策,他们同时行动。图中表示出,张三先行动,但李四不知道他是如何行动的。虚线表示,张三行动后,李四的知识没有变化。李四只知道博弈到达了由虚线连接的两个结点中的某个结点,但不知道究竟到达了哪个结点。支付:(张三,李四)年代时间与博弈时间我们谈到参与人在博弈中同时行动时,一个重要方面是,在他们行动之前,参与人都无法了解到对方选择了什么。对于静态博弈,只有在影响到博弈的参与人何时掌握信息时,年代时间才是重要的。在动态博弈中,年代时间的确是重要的,因为要考虑到未来的支付。重要的经济博弈很少在年代时间上完全同时,但是,有许多重要的博弈,在该词延伸的含义上,参与人“同时”行动。因此,从战略角度来看,他们同时行动。田忌赛马比赛规则:马按奔跑的速度分为上中下三等,等次不同装饰不同,各家的马依等次比赛,三赛二胜。比赛前田忌按照孙膑的主意,第一场,用上等马鞍将下等马装饰起来,冒充上等马,与齐威王的上等马比赛;第二场,用上等马与齐威王的中等马比赛;第三场,田忌的中等马和齐威王的下等马比赛。结果二比一,田忌赢了齐威王。在双方条件相当时,对策得当可以战胜对方;在双方条件相差很远时,对策得当也可将损失减低到最低程度。博弈信息论-信息集与信息结构信息集:如何用扩展式或博弈树表示一个参与人在博弈的每一时点上拥有信息?完美与不完美信息完全与不完全信息对称与非对称信息确定与不确定信息按信息结构的博弈分类信息集博弈的信息结构与其行动顺序一样,在战略式表述中更加模糊。为了使信息更加准确,我们需要技术定义来描述谁在什么时间知道什么。信息集是知识的基本单位,是参与人认为博弈到达了的结点集合。在博弈的任何特定时点上参与人i的信息集

i是博弈树上不同结点的集合,他知道这些结点可能是实际的结点,但不能通过直接观察进行区分。信息集根据这样的定义,参与人

i的信息集是属于参与人i但在不同路径上的结点的集合。这反映了参与人

i知道轮到谁行动,但不知道博弈到达了博弈树的准确位置。在下图这个博弈中,S在1984年在结点

S1

行动,J在1985年或1986年在结点

J1,J2,J3和

J4

行动。in1985or1986.S知道他自己的行动,但J只知道S是否选择了行动,博弈到达

J1,J2,或者“其他”结点。支付:S,J上策中策下策中下策信息集的表示在图形中表示信息集的一种方法是用虚线把在同一个信息集中的结点圈起来或连起来。为了避免图形太乱,通常只把在一个结点行动的参与人信息集用虚线连起来或圈起来。上图中的虚线表示,对J来说,J3

J4

在同一个信息集中,尽管对S来说它们在不同的信息集中。对信息集的要求一个结点不能属于一个参与人的两个不同的信息集。如果J的一个信息集中的结点是他行动的结点,那么,在这个信息集的各个结点上,J的行动集合必须是相同的,因为他知道他自己的行动集合(但是,根据他是从J3

还是

J4向前行动,在后面的博弈中,他的行动可能是不同的)。我们还要求,对于一个参与人来说,产生不同支付的终结点在不同的信息集中。信息集的性质根据以上要求,博弈的信息结构中不包括参与人通过合理推断而获得的但未观察到的任何信息。信息集也表示出未观察到的自然行动的效应。在前面的图中,如果初始行动是由N而不是S做出的,J的信息集以相同的方式来刻画。信息划分参与人

i的信息划分是其信息集的集合,使得1.一个信息集中的所有结点的前列结在一个信息集中;2.每一条路径由信息划分的一个信息集中的一个结点表示。信息划分的性质信息划分表示参与人知道在博弈的某个阶段他能够区分的不同位置,从而把所有可能的结点的集合分为子集,称为信息集。信息划分指的是博弈的一个阶段,不是年代时间。参与人:S,J上策中策下策中下策信息划分S的信息划分是({J1},{J2},{J3},{J4})。J的信息划分是

({J1},{J2},{J3,J4})。有两种方式可以看出J的信息比S的差。首先,J的一个信息集

{J3,J4}比S的信息集含有更多的元素,因而,其次,他的信息划分({J1},{J2},{J3,J4})含有较少的元素。信息类别含义完美信息确定信息对称信息完全信息每一个信息集都是单结的参与人行动后自然不再行动参与人行动时或在终点结,没有参与人拥有与其他参与人不同的信息自然不首先行动,或其初始行动被所有参与人观察到信息类别与含义我们用四种不同的方式对博弈的信息结构进行分类,所以,一个特定的博弈可能具有完美、确定、对称和完全信息。完美与不完美信息完美信息(perfectinformation)是指每一个参与人对其他参与人(包括虚拟参与人“自然”的)选择有准确了解的情况,即每一个信息集只包含一个值;在完美信息博弈中,每一信息集都是单结的;否则,是不完美信息博弈。完美信息博弈满足最强的信息要求,在这样的博弈中,各参与人总是准确地知道他在博弈树中的位置。没有同时行动,而且所有参与人都观察到自然的行动。任何不完全或非对称信息博弈都是不完美信息博弈。确定性与不确定性博弈确定性博弈是任何参与人行动后没有自然行动的博弈;否则,就是不确定性博弈。在不确定性博弈中,自然的行动可能或不可能立即向参与人显示出来。

如果没有同时行动,确定性博弈可以是完美信息博弈。在这个定义中,唯一奇巧的是确定性博弈允许自然的初始行动。在不完全信息博弈中,自然首先行动,选择参与人的类型。大多数建模者不认为这种情形是不确定的。对称与非对称信息在对称信息博弈中,参与人在其选择行动的结点或终点结的信息集至少包含与每一其他参与人的信息集中相同的元素;否则,是非对称信息博弈。在非对称信息博弈中,参与人的信息集在与其行为有关的方面是不同的,或者在博弈结束时是不同的。这样的博弈具有不完美信息,因为参与人间不同的信息集不可能是单结的。

非对称信息的实质是某参与人拥有有用的私人信息:其信息划分不同于并且不比另一参与人的信息划分差。委托-代理模型如果信息集在博弈结束时是不同的,博弈具有非对称信息。即使在终点结之后没有参与人采取行动,传统上,我们也认为这样的博弈在信息方面是不同的。在委托-代理模型中,委托人先行动,然后是代理人行动,最后是自然行动。代理人知道到其行动,但委托人不知道,即使他可能会推断出代理人的行动。

要不是由于信息在终点结仍然是不同的,这会是一个对称信息博弈。对称信息对称信息博弈可以有自然行动或同时行动,但没有参与人具有信息优势。信息可能会不同的一点是不行动的参与人具有超级信息,因为,比如说,如果两个参与人同时行动,他知道他自己过去的行动。

根据定义,这样的信息对知道的参与人并无帮助,因为不影响其行动(因而,虽不完美但对称)。完全与不完全信息完全信息(completeinformation)是指自然不首先行动或自然的初始行动被所有参与人准确观察到或知其概率分布的情况,即没有事前的不确定性。在不完全信息博弈中,自然首先行动,并且至少一个参与人没有观察到;否则,是完全信息博弈。两类博弈具有完全但不完美信息:同时行动博弈,以及在后面的博弈中,自然有行动,但没有立即向所有参与人显示出来。不完全与不完美信息完美信息必为完全信息,不完全信息意味着不完美信息(自然的选择不可观察),因为某个参与人的信息集含有多于一个的结点。但逆定理不成立,完全信息不一定是完美信息,而不完美信息也不必然是不完全信息。不完全与非对称信息许多不完全信息博弈是非对称信息博弈,但这两个概念并不等同。

如果没有自然的初始行动,但S采取了J未观察到的行动,在后面的博弈中S又行动,这样的博弈具有不对称但完全信息。委托-代理模型就是这样的例子,代理人知道他工作多努力,但委托人不知道,甚至在终点结也不知道。不完全但对称信息博弈也可能有不完全但对称信息:自然首先行动,但参与人都没有观察到。Harris&Holmstrom(1982):自然赋予工人不同的能力,但是工人们年轻时,他们自己和雇主都不知道他们的能力。

随着时间的流逝,工人的能力成为共同知识,如果工人们是风险回避的,雇主是风险中性的,他们的模型证明,均衡工资将是不变的或不断上升的。信息分类:扑克牌例子在扑克游戏中,参与人打赌谁的牌最好,排序方法是预先确定的。在下赌注之前,下面的行为规则如何分类?1.所有的牌都朝上;2.所有的牌都朝下,在下赌注前,参与人自己也不能看自己的牌;3.所有的牌都朝下,参与人可以看自己的牌;信息分类:扑克牌例子4.所有的牌都朝上,但然后各参与人把自己的牌拿起来,并悄悄地扔掉一张;5.所有的牌都朝上,参与人下赌注,然后各参与人收到一张向上的牌;6.所有的牌都朝下,但然后各参与人把自己的牌拿起来,自己不看牌,把牌放在自己的额前,所有其他参与人都能看到牌(印度扑克)。信息分类:扑克牌例子(1)完美,确定

(2)不完全,对称,确定

(3)不完全,非对称,确定

(4)完全,非对称,确定

(5)完美,不确定(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论