第五章-合作博弈课件_第1页
第五章-合作博弈课件_第2页
第五章-合作博弈课件_第3页
第五章-合作博弈课件_第4页
第五章-合作博弈课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

博弈论任课教师:南京航空航天大学经管学院李帮义

教授博弈论任课教师:1博弈论与信息经济学——第五章合作博弈博弈论与信息经济学——第五章合作博弈2导论先回忆一下囚徒困境的例子:

在囚徒困境中,还有另外一个策略组合<抵抗,抵抗>,该组合为参与人带来的支付是<-1,-1>。由<-8,-8>到<-1,-1>,每个参与人的支付都增加了,即得到一个帕累托改进。坦白抵抗坦白-8,-80,-10抵抗-10,0-1,-1导论先回忆一下囚徒困境的例子:坦白抵抗坦白-8,-80,-13导论<抵抗,抵抗>构不成一个均衡是基于参与人的个人理性。在参与人选择抵抗的情况下,每个参与人都有动机偏离这个组合,通过投机行为谋取超额收益1。如果两个参与人在博弈之前,签署了一个协议:两个人都承诺选择抵抗,为保证承诺的实现,参与人双方向第三方支付价值大于1的保证金;如果谁违背了这个协议,则放弃保证金。有了这样一个协议,<抵抗,抵抗>就称为一个均衡,每个人的收益都得到改善。上述分析表明,通过一个有约束力的协议,原来不能实现的合作方案现在可以实现。这就是合作博弈与非合作博弈的区别。二者的主要区别在于人们的行为相互作用时,当事人是否达成一个具有约束力的协议。如果有,就是合作博弈;反之,则是非合作博弈。因此,博弈可以划分为合作博弈与非合作博弈。导论<抵抗,抵抗>构不成一个均衡是基于参与人的个人4合作博弈的概念及其表示

合作博弈,非合作博弈的对称,一种博弈类型。参与者能够联合达成一个具有约束力且可强制执行的协议的博弈类型。合作博弈强调的是集体理性,强调效率、公正、公平。合作博弈最重要的两个概念是联盟和分配。每个参与者从联盟中分配的收益正好是各种联盟形式的最大总收益,每个参与者从联盟中分配到的收益不小于单独经营所得收益。合作博弈的基本形式是联盟博弈,它隐含的假设是存在一个在参与者之间可以自由流动的交换媒介(如货币),每个参与者的效用与它是线性相关的。这些博弈被称为“单边支付”博弈,或可转移效用(TransferableUtility,TU)博弈。合作博弈的概念及其表示合作博弈,非合5合作博弈的概念及其表示合作博弈的结果必须是一个帕累托改进,博弈双方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受损害。合作博弈研究人们达成合作时如何分配合作得到的收益,即收益分配问题。合作博弈采取的是一种合作的方式,合作之所以能够增进双方的利益,就是因为合作博弈能够产生一种合作剩余。至于合作剩余在博弈各方之间如何分配,取决于博弈各方的力量对比和制度设计。因此,合作剩余的分配既是合作的结果,又是达成合作的条件。合作博弈的核心问题是参与人如何结盟以及如何重新分配结盟的支付。下面首先分析结盟的概念。与结盟相关联的就是特征函数。合作博弈的概念及其表示合作博弈的结果必6合作博弈的概念及其表示定义8.1.1在人博弈中,参与人集用表示,的任意子集称为一个联盟(coalition)。

空集和全集也可以看成是一个联盟,当然单点集也是一个联盟。定义8.1.2给定一个人博弈,是一个联盟,是指和的两人博弈中的最大效用,称为联盟的特征函数(characteristicfunction)。

规定。根据定义,表示参与人与全体其他人博弈时的最大效用值,表示为。用表示参与人集为,特征函数为的合作博弈,其中是定义在上的实值映射。在很多情况下,一个联盟能获得的支付依赖于其他参与人所采取的行动。有时被解释为联盟独立于联盟的行动可保证的最大支付。合作博弈的概念及其表示定义8.1.1在人博弈中,7合作博弈的概念及其表示合作对策的分类主要是根据特征函数的性质。下面根据特征函数的性质介绍几类特殊的合作对策。如果仅与的个数有关,则称作对称博弈。如果,则称作常和博弈。如果,则称作简单博弈。例如,在投票博弈中,每个参与人的权重,

如果,则称作凸博弈。合作博弈的概念及其表示合作对策的分类主要是根据特征函8合作博弈的概念及其表示例8.1设有一个3人合作对策,每个参与人各有两个纯策略。当三人不合作时,其支付见下表。假设采用最稳妥策略,即最坏情况下选择最好,求合作博弈的支付函数合作博弈的概念及其表示例8.1设有一个3人合作对策,每个参9合作博弈的概念及其表示解:用表示一个联盟,表示联盟中参与人的个数。当=0,自然,有。当=1,有3个,以为例。当,则。的策略集合,策略组合。与进行如下矩阵对策:合作博弈的概念及其表示解:用表示一个联盟,10合作博弈的概念及其表示上述矩阵对策没有纯策略,的混合策略是,的混合策略是。的均衡值是。故。同理,可以求出。当=2,有3个,以为例。当,则。的策略集合,策略组合。与进行如下矩阵对策:合作博弈的概念及其表示上述矩阵对策没有纯策略,11合作博弈的概念及其表示上述矩阵对策有纯策略,的均衡值是。故。同理,可以求出。当=3,有1个,,最大的联盟。的策略空间。有。至此特征函数的值已全部求出。合作博弈的概念及其表示上述矩阵对策有纯策略,的均衡值12合作博弈的概念及其表示之所以称为特征函数,是因为这个合作博弈的性质基本由决定。由此可见对合作博弈的重要性。定理设是参与人集合上的特征函数,则有如下的超可加性:对于联盟和,如果,则证明以最稳妥策略为例给出证明。用表示联盟的策略空间。合作博弈的概念及其表示之所以称为特征函数,是因13合作博弈的概念及其表示

上式说明,特征函数只有满足超加性,才有形成新联盟的必要性。否则,如果一个合作博弈的特征函数不满足超可加性,那么,其成员没有动机形成联盟,已经形成的联盟将面临解散的威胁。定理3的逆命题也是正确的,即:是一个集合,是定义在上的一个非负实值函数。满足:,如果则存在一个上的合作博弈,使成为该合作博弈的特征函数。合作博弈的概念及其表示上式说明,特征函数14合作博弈的概念及其表示对于合作博弈,特征函数满足超加性,自然有:根据上述不等式,特征函数分成两种类型:

类型1,满足。即大连盟的效用是每个参与人的效用之和。这说明通过联盟并没有创造新的合作剩余,联盟没有价值,这种联盟也不可能维持。这种对策称为非实质性对策,没有研究价值,不是本章研究的范畴。对于非实质性对策,有,如果。合作博弈的概念及其表示对于合作博弈15合作博弈的概念及其表示类型2,满足。即大连盟的效用大于每个参与人的效用之和。这说明通过联盟创造了新的合作剩余,联盟有意义,这种联盟能否维持,取决于如何分配合作剩余,使每个参与人的支付都有改善。这种对策称为实质性对策,是本章研究的范畴。合作博弈的概念及其表示类型2,满足16分配所谓分配就是博弈的一个维向量集合,之所以是维向量,是由于每个参与人都要得到相应的分配。维的分配向量称为博弈的“解”。定义8.1.3对于合作博弈,对每个参与人,给予一个实值参数,形成维向量且其满足:

则称是联盟的一个分配方案。分配所谓分配就是博弈的一个维向量集合,之所17分配分配的定义中,是基于个人理性,合作中的收益不能小于非合作中的收益,反映了参与人的参与约束。如果,那么,参与人是不可能参加联盟的。是基于集体理性,每个参与人的分配之和不能超过集体剩余。另外若没有全部被分配,显然不是一个帕类托最优的分配方案,不会参与人所接受。分配分配的定义中,18分配在例8.1分配中,分配显然不是一个,而是无限个,无限个分配形成一个分配集合。对于实质博弈,其分配总是有无限个。例如,对于实质博弈,由于存在无限个正向量,满足。显然如下的都是分配,其中。用表示一个博弈的所有分配方案组成的集合。分配在例8.1分配中,分配显然不是一个,而是无限个,19分配定义8.1.4设的两个分配和,是一个联盟。如果分配方案和满足(i),;(ii)。则称分配方案在上优超于,或称分配方案在上劣于,记为。如果分配方案在上优超于,则联盟会拒绝分配方案,方案得不到切实执行。因为从到,中的每个参与人的收益都得到改善,创造的剩余又足以满足他们在中的分配。分配定义8.1.4设的两个分配和20分配在优超关系中,联盟的特征:1.单人联盟不可能有优超关系。2.全联盟上也不可能有优超关系。因此,如果在上有优超关系,则。3.优超关系是集合上的序关系,这种序关系一般情况下不具有传递性和反身性。4.对于相同的联盟,优超关系具有传递性,即,,则有。5.对于不同的联盟,优超关系不具有传递性。分配在优超关系中,联盟的特征:21核心尽管可行分配集合中有无限个分配,但实际上,有许多分配是不会被执行的,或者不可能被参与人所接受的。很显然,联盟的每一个成员都不偏好于劣分配方案,因此,真实可行的分配方案应该剔除劣分配方案。定义8.3.1在一个人合作博弈中,全体优分配方案形成的集合称为博弈的核心(core),记为。显然有。核心尽管可行分配集合中有22核心说明:1.核心是中的一个闭凸集。2.若,则将中的向量作为分配,既满足个人理性,又满足集体理性。3.用核心作为博弈的解,其最大缺陷是可能是空集。核心说明:23核心定理8.3.1

分配方案在核心中的充要条件是:(i),,(ii)。证明如果,满足(i)、(ii),则不可能被优超,即。反证法,设存在,使。根据优超的定义,有:则有,矛盾。如果,不满足(ii),则一定被优超,即。核心定理8.3.1分配方案24核心对于,存在联盟,有,则定义,定义,使得在中平均分配,在中平均分配,从而得到一个新的分配如下:显然如此定义得向量是个分配,且有。核心对于,存在联盟,有25核心例8.2假想的联合国安全理事会投票,超过两票算通过。该博弈的特征函数为而对所有其他的,。应用定理8.3.1,有,对各个联盟有由,,,推得,,,而用,,又得到和,所以,核心是核心例8.2假想的联合国安全理事会投票,超过两票算通过。26核心例8.3设3人合作博弈的特征函数如下:,,,,求其核心。解由核心定义,若,则它必满足

解此不等式组,得核心例8.3设3人合作博弈的特征函数如下:27核心例8.4考虑如下的合作博弈,,特征函数如下:,;。解线形不等式组:。该不等式组无解,即。上面三个例子说明了求解核心的方法。核心例8.4考虑如下的合作博弈,28核心在合作博弈中,用核心代替分配具有明显得优点,即的稳定性。对于中的每一个分配,每个联盟都没有反对意见,都没有更好的分配,每个分配都可以得到执行。当然,用代替也有致命的缺陷,即可能是空集,而。定理8.3.2对于人的联盟博弈,核心非空的充分必要条件是线性规划有解。

,核心在合作博弈中,用核心代替分配具有明显得优点,即29核心定理的直观意义很明显,线性规划(L)若有解,则最优解一定属于;若,则中的每个向量都是可行解,自然线性规划(L)有最优解解。对于原线性规划(P),写出它的对偶规划(DP):

,核心定理的直观意义很明显,线性规划(L)若有解,则最优30核心定理对策有的充分必要条件是:对于满足的向量,有。定义设是个0-1简单对策,若存在一个参与人,满足,则称作一个否决人。定理

简单对策中,充分必要条件是中存在一个否决人。核心定理对策有31核心证明设是中一个否决人,定义,1处于第的位置。根据定理8.3.2,

是一个分配,且。用反证法。设,且不存在否决人,即。,则。故有,从而。也即,矛盾。核心证明设是中一个否决人,定义32核仁为评估对满意性,定义如下的被称作超出一个指标:

的大小反映了对满意性。越大,对越不满意,因为中所有参与人的分配之和远没有达到其所创造的合作剩余;越小,对越满意,当为负值时,中所有参与人不但分配了其所创造的合作剩余,还分配了其他联盟所创造的价值。

核仁为评估对满意性,定义如下的被称作超出一33核仁对于同一个,共有个,可以表示为。故可以计算出个。联盟对的满意性取决于中的最大的,故可以对个由大到小排列,得到一个的向量:其中。联盟对的满意性取决于的大小,越小,联盟对越满意。核仁对于同一个,共有个,可以表34核仁对于两个不同的分配,分别计算出。如果是小的,则联盟对的满意性大于联盟对的满意性,自然优于。当然这种向量大小的比较不同于数字的比较,是采用字典序的比较方法。字典序的比较方法的比较方法如下:对于向量和,存在一个下标,使得,,则称字典序小于,用符号表示。有了上述的定义,就可以给出核仁的定义了。核仁对于两个不同的分配,分别计35核仁定义

对于合作博弈,核仁是一些分配的集合,即,使得任取一个,都是字典序最小的,即。定理5.4对于合作博弈,其核仁,且只包含一个元素。定理5.5对于合作博弈,如果核心,则有。证明用反证法。设存在一个分配。根据核心的性质,由可知:必存在一个联盟,满足,由此可知。设。是所有中最大的,故有。核仁定义对于合作博弈,核36核仁由可知,存在分配。根据分配的性质,任取一个,有,由此可知满足。,,;,,。这与矛盾。定理得证。核仁由可知,存在分配37核仁例8.5考虑如下的合作博弈,,特征函数如下:;;。求该博弈的核仁。解先求出该博弈的核心,再求核仁。根据核心的条件,充分必要条件:解此不等式组,得到。核仁例8.5考虑如下的合作博弈,38核仁,故有。下面开始求。对于核心,开始求,。,有=4-4=0;,有=0-=;,有=0-=;,有=5-=;,有=7-=;,有=6-=0;,有=10-10=0;当,。上式在达到,故有=。该结果验证了,。核仁,故有39Shapley值分配是合作博弈最重要的概念,但遗憾的是在一个博弈中,分配有无限个,且许多根本就得不到执行。利用优超的概念,对分配进行了分类,形成了核心的概念,但遗憾的是,许多博弈中核心可能是空集。为此,引入了超出这一指标,寻求最大超出最小化的分配,即核仁。核仁这一解的优势体现在核仁总存在,且是唯一的,这一解的缺陷就是计算太复杂,因为共有个。本节引入了一个很直观的解的概念,即Shapley值。参与人按照Shapley值进行分配。Shapley值分配是合作博弈最重要的概念,但遗憾的40Shapley值定理

对每个博弈,存在唯一的Shapley值,其中(8.5.1)下面对这一计算公式给出非数学化的解释:1,,就是按照参与人的平均贡献来安排的分配设计。2,在一个博弈中,每个人的所得应该与其贡献成正比。对于联盟,其合作剩余。如加入,则新联盟的合作剩余是。因此的贡献是。Shapley值定理对每个博弈,存在唯一41Shapley值3,在博弈中,不包含的有个,对每个都有一个贡献值,因此,Shapley值的计算公式中有项。4,即使对于一个固定的,与中参与人的排列顺序无关,与中参与人的顺序无关。因此的系数中存在。为什么系数中有?主要是为了计算的平均值。Shapley值3,在博弈中,不包含42Shapley值5,对于也可以作出这样解释:加入,其贡献是。加入的概率是多少?如果个局中人以次参加博弈,当加入该博弈时,其前面已有一些参与人,加入后,后继的参与人集合。和中参与人的顺序与无关。加入的概率是,的数学期望(或者平均值)就是Shapley值。6,Shapley值不一定是个分配,即理性约束可能不满足。Shapley值5,对于43Shapley值例1假设联合国安理会进行投票,部分国家可以形成联盟。该博弈的特征函数为:而对所有其他,。为了求,对所有包含参与人1的联盟按Shapley值求和。与有差异的联盟只有、、、、、和,对于其他的,=0。所以有

类似地,。于是,,。这样,参与人1、2比参与人3、4、5重要得多。Shapley值例1假设联合国安理会进行投票,部分国家可以44Shapley值定理若博弈满足超加性,即,,则Shapley向量,即Shapley值是分配。证明满足超加性,则。Shapley值定理若博弈满足超加性,即45合作博弈在经济管理中的应用12成本分担主要包括:供应链协调合作博弈在经济管理中的应用12成本分担主要包括:供应链协调46供应链协调供应链是围绕核心企业,通过对信息流、物流、资金流的控制,从采购原材料开始,制成中间产品以及最终产品,最后由销售网络把产品送到消费者手中的将供应商、制造商、分销商、零售商、直到最终用户连成一个整体的功能网链结构模式。最简单的供应链包括一个供应商(Supplier)和一个分销商(Retailer),供应商确定批发价格,分销商决定订货量。批发价格契约回购价格契约供应链协调供应链是围绕核心企业,通过对信息流、物流、资金流的47批发价格契约

供应商的参数与决策变量::供应商的制造成本;供应商的缺货损失费;供应商对分销商的批发价格。分销商的参数与决策变量::分销商的分销成本;分销商的缺货损失费;剩余产品的价值;分销商的固定零售价格;分销商的决策订货量。市场参数::市场随机需求;:的分布函数;:的密度函数;:的数学期望。令+,+。如果订货量为,则期望销售量为:

有。批发价格契约供应商的参数与决策变量:48批发价格契约则期望剩余存货为:。则期望缺货量为:。因此,分销商的收益函数为:

供应商的收益函数为:

则供应链的整体利润为:

批发价格契约则期望剩余存货为:49批发价格契约整个供应链作为一个整体,进行最优化的集成决策,最优订货量满足的一阶条件。由此,从供应链整体最优化的角度,得到最优订货量满足:订货量是分销商的决策变量,分销商的决策是使最大化。利用关于的一阶条件,得到分销商的最优决策:批发价格契约整个供应链作为一个整体,进行最优化的集成决策,最50批发价格契约是从供应链整体角度的最优订货量,符合整体理性;是分销商从个体角度的最优订货量,符合个体理性.如果,则整体利益与个体利益就是协调的。能够等于吗?显然有,供应商的批发价格不可能低于其生产成本,因此,不可能等于,即批发价格不能协调整个供应链。批发价格契约是从供应链整体角度的最优订货51回购价格契约回购价格契约是指供应商为鼓励分销商订货,对分销商剩余的产品以回购价格

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论