“田忌赛马”类博弈的最优策略风险的探讨_第1页
“田忌赛马”类博弈的最优策略风险的探讨_第2页
“田忌赛马”类博弈的最优策略风险的探讨_第3页
“田忌赛马”类博弈的最优策略风险的探讨_第4页
“田忌赛马”类博弈的最优策略风险的探讨_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、“田忌赛马”类博弈的最优策略风险的探讨尹向飞陈柳钦(湖南商学院信息系,湖南长沙,410205)(天津社会科学院,天津,300191) 内容提要:木文将风险引入n重赛马博弈,建立基于支付的风险模型,证明n重赛马博弈支付风险双重 最优混合策略的存在性,并进行了实证分析。关键词:几重赛马博弈;风险;有界闭凸集;支付风险双重最优混合策略l中图分类号f12文献标识码a文章编号、研究背景“田忌赛马”是很经典的以弱胜多的例子,在现实生活中存在许多诸如此类的例子,文1对该类博弈 进行了详细的描述与研究。在文1中首先给出匝赛马博弈、一轮斤重赛马博弈、对换等定义以及相关 的定理,下面对相关定义与结论予以回顾。定义

2、1 博弈中有两个局中人,简称局中人1、局中人2。局中人1有匹“马”,所有的“马”所构 成的集合为/? =。1,。2,d“,其中。2 >>%, a >。2表示"马”跑得比“马”快,则 称说为局中人1的初始禀赋集;局中人2有斤匹“马”,所有的“马”所构成的集合为码 其中勺$仇,则称力2为局中人2的初始禀赋集;其中q和bj(i,j = l,2町两两不同。共比赛斤 局,在每局比赛中,局中人1和局中人2从各自的初始禀赋集中挑选出一匹马参与比赛,每匹马仅参加一 局比赛。在第r局比赛中,设局中人1和局中人2从各自的初始禀赋集中挑选出马分别为 气和乙,如果气竝,则仏血,如)t,否则

3、,仏(气血)=7其中f (叫如)表示局中人1 在第k局比赛中所获得的支付;v2tk (%血)=%(%血),其中匕*(%,如)表示局中人2在第r局比赛 中所获得的支付。局中人1的总支付为«=£兀(血),局中人2的总支付为=£%&(%,如), k=*=1显然有v2=-vp则称该暉弈为重赛马博弈,简记为(/?丿2,«,岭)。很显然,完全信息下n重赛马博弈(人厶,«,岭)对应一个有限策略式零和i専弈g =©“),其中 s =(皱叫 几)为1,2,斤的一个排列,«, = v ,/= 1,2,s?二(bj、,bj2bjjkd,人

4、)为1,2,的一个排列。设=(匕j为局中人1的支付矩阵(后同), 其中匕表示局屮人1采取策略®.,、局中人2采取策略时局中人1的支付,则u每行的和都相等,每 列的和也相等,毎行的和等于每列的和,而居中人2的支付矩阵为-。在文1屮同样给出n重混合赛马策略的定义,任何一个n重混合赛马策略对应相应有限策略式零和博 弈的一个混合策略,因此,我们可以在有限策略式零和博弈的框架下来研究重混合赛马策略的相关问题。当然在很多重赛马博弈中,最优策略往往不止一个,那么在存在多个最优策略的情况下,我们能否 优中选优?针对这一问题,文1没冇给出相应的研究,木文将风险这一概念引入n垂赛马博弈,对授优策 略优屮

5、选优进行研究。二、几个定理设s:,s;分别为对应"重赛马博弈(休码,匕)的有限策略式零和博弈g = (sd 局中人1、2的混合策略集(或策略集),其中s;,s;定义如下:s; =« xeen' >0,z = 1,2,=1(1)1=1s; = y g en- y > 0, j = 1,2,. n!, j = 1 j=lxes;9yes;分别称为局中人1、2的混合策略,(“)称为一个混合局势,在该混合局势中,局中人1的支 付期望为ey) = xi j如果重赛马博弈存在最优纯策略(九匕),也可以把它看作局屮人1、2分别以概率1选择策略切、策略 *的一个混合策略

6、。因此,在此卅重赛马博弈中,设局中人1、2的授优混合策略集分别为:str; =<xe s;max vstutx > ve,弓str;十 w s;min vst uy < ve2j>并fl. str;. s/彳至少存在一个最优混合策略,即sir;丰札str; #(),设sof中的fl标函数授大值为厂 根 据対策论的相关理论可以得岀s加中的目标函数最小值也为v*,其中v*为常数,则我们可以证明如下两个 定理。定理1证明:str* 十 w s;max vstutx > ve为有界闭凸集。显然s:为一个有界闭集,而s”;为s;的子集,因此s":为一个有界集合。

7、str; h 0, v兀、兀 g str, 0 < /3 < 1则兀> 0,£兀=1, ?2) > 0,£兀=1,為+(1 _ 0)十2)> 0 /=1i=lf (00 + (1 -处)产0亍(兀),+ (1 - 0)£ (兀)产1,故朋+ (1 - 0)兀w s; /=1 /=! /=!又t/7x> vel9utx2) >讨弓,t/t(0兀+(1 0)兀)丫讨弓max v如果0(0兀+(1-0)兀)>讥则不是线性规划问题utx>vex目标函数的最人值,矛盾,因此0兀+(1-0)兀ws/彳,s":为凸

8、集。设q = r'1',现在证明 簸为开集。vx*gx,以下分两种情况讨论。第一种情况,f4s;,由于s;为闭集,因此£为开集,故存在0,使3(f0)u£,由于 s; u str,所以 b(t,5) u s":。第二种情况,x* g s;,由于x* g str;且fws;,因此2 v. .(/),. >v*其中(丿=1,2"!)不全成/=1立,或者£匕(兀)>对丿 = 1,2川全成立。后一种情况是不可能的,否则,我们可以得出 /=1max vq不是线性规划问题 皿农“弓的最大值,矛盾。那么至少存在一个r,使得

9、3;f (兀)成立, stc*匸1 ,xe 5,设d为t到超平面(兀)=八的最短距离,显然d>0,取§ = -,则b(t,5)中任意一点满足 /=i2”!所以 b(t0)usnf。i=综合笫一、二种情况可以得出str;为闭集。综合知s":为冇界闭凸集。*min v定理2 str2 = yes; '为冇界闭凸集。r - st uy < ve2证明方法同定理1。三、模型的建立与求解假设1:局中人1、2是理性的,即局中人1、2只从各白的最优混合策略集中选取混合策略,同时知 道对方是理性的以及对方的最优混合策略集。我们知道,在n重赛马博弈中,局中人1、2直接进行

10、博弈时,最终选择的还是纯策略,混合局势(兀,刃 只不过定义在各占纯策略集合上的一个概率,就是以不同的概率來选择纯策略,因此局屮人1、2每进行 次博弈,得到的支付往往并不等于支付的期望值,局中人1、2各自得到的支付是一个随机变量,该随 机变最取相应值的概率在接由混合局势(兀,刃决定,即山概率分布兀和y确定,而只不过是满足(3)中 所示集合中某一混合策略的支付的期望值。既然局中人1、2各自得到的支付为一个随机变虽,我们就可 以定义该随机变量的方差。在金融研究小,我们常常用方差作为风险的度量,而n重赛马傅弈中局中人的 支付的方差由混合局势(兀,刃确定,因此可以用支付的方差来度量混合局势(兀y)的风险

11、。由于局中人1、 2得到的支付互为相反数,因此只要考虑其中一个就可以。定义2对于某一 n重赛马博弈,其对应的有限策略式博弈为g = (sj,“j,该有限策略式博弈局中 人1的支付矩阵为t/=(v,7), s用与s加分别为该n重赛马博弈局中人1、2的最优策略集,则当局中人 1、2从s":与s";选择策略构成混合局势(兀刃时,局中人1的支付的方差称为混合局势(兀,刃的风险, 记为 cr2(x9y) o显然有(y2(x,y) = xt by - (xtuy)2 = xtby - v* (5)其中,b = (* ),为局中人1的支付的方差,乂是局中人2的支付的方差,因此<r2

12、(x,y)为/?a!xn!局中人1、2共同面临的风险。针对b = (0),我们可以得出如下定理:定理3 b = (* )矩阵的各行之和相等,各列之和相等,各行的和与各列的和相等。 /n!xn!证明:只要证明b的任意一行之和等于笫一行之和,即£匕,其中, 戶 1j=1 '6 1 =%),纠 > a2, / = l,2 -n! o设局中人1采取策略几=(a.,),局中人2采取52 . = (/?.,巧2巧j ,则局中人1的支付为 匕厂其对应的一轮/7重赛马博弈为0j =(仏血),包,巧2 ),(,如)。则対0j做一系列的对换可得 到=(%切),仏02)s°”j),

13、0,j与01j的对应关系是一一对应的,则0“的支付和0j的支付相同(见文性质3.2),为v. y o设一轮n重赛马膊弈0ij,对应局屮人1的策略几=(°卫2色),局 中人2采取策略52厂(如叽),其支付为vl.,所以匕j=«j,吃由于船与是一 一对应关系,对于每一个不同的j(j = l,2-n!),都存在唯一的尸(广=1,2加)与之对应,即b矩阵的 第i行的每一元索v:,第一行都存在唯一的一个元索v:与之对应且相等,因此匕:与:是一一对应关 系 £ kj = £ 成立°j=1;=1,各列的和也为各行的“ 1=1 j=同理可以证明各列的和相等。所

14、以各行的和为 /=1 /=!和等于各列的和。假设2:除了每个局小人都是风险厌恶者以及假设1以外,每个局小人不知道其他任何信息。由于局中人1、2都在各自的最优混合策略集中选取策略,因此各自支付的期望值一定,那么两人都 应该选择使得混合局势(兀,刃的风险尽可能小的混合策略。但是由于假设2的存在,使混合局势(兀刃的 风险达到授小几乎不可能(除非s/彳或s/厂都只含一个元素)。因此,当局中人1采取混合策略兀时,他 只能期望获得(在最不利的情况下)的风险为:max cr2 (兀,y) = xtby - (xtuy)2 = xt by - v* (6)yws";因此,局屮人1应该选择混合策略x,

15、使得(6)取最小值,即局屮人1可保证其所血临的风险不高于 min maxcr2(x,y) = xtby-(xtuy)2 = jby-v1(7)xw 旳 yg.str2同理局中人2应该选择混合策略y,使得局中人2可保证其所面临的风险不高于min max cr2(x, y) = xtby - (xtuy)2 = xtby - v* (8)yestr2 xgstr(7)式和(8)式是有意义的,理由如下:记s/ = (x,y)卜ws”:,yws";,由于sof、sfr;为有界闭凸集,所以sf为有界闭凸集,<r2(x,y)为 sr的连续函数,因此,对于固定的兀,<r2(x,y)为有

16、界闭凸集str;_k的连续函数,max<r2(x,y)存在,而 yestr2且maycr'o,)也是冇界闭凸集s":上的连续函数,因此miqma/(兀,y)存在最优解。同理, yestr2xesir yestrmin maxcr2(x, y)也存在最优解。由于并不要求miqmay/gyrminmaycr'gy),并且 ystr2 xestryxestr yestr2xws切min max cr2(x, y)与miq max cr2(x, y)的求解为两个相互独立的过程,因此最优解总存在。为了将考虑风 xestf yestrystr2险的最优混合策略和未考虑风险的

17、最优混合策略区分开来,我们作出如下定义:定义3使(7)达到最优局中人1的最优混合策略称为局小人1的风险最小的最优混合策略,对应的 局中人2的相应混合策略称为局中人1的风险最小的最优混合策略的对偶策略。使(8)达到授优局中人2 的最优混合策略称为局屮人2的风险最小的最优混合策略,对应的局屮人1的相应混合策略称为局屮人2 的风险最小的最优混合策略的对偶策略。设 o-2 (/,>'*) = min max cr2(x,y), k+ j* str.x estr ,则 x* 为局屮人 1 的风险最小的最优混 、/ xestr yesth合策略,)为局中人1的风险最小的最优混合策略f的对偶策

18、略;设o'2y*) = min max cr2(x, y),')曰雋 xestr其中)厂e strx* e str;,则)广为局屮人2的风险最小的最优混合策略,t为局屮人2的风险最小的最 优混合策略)广的对偶策略。(f,)并不一定和(x*,/*)相同。定义4由于局屮人1选择f,使得(7)达到最优,局中人2选择)严,使得(8)达到最优,贝ij (/,/*) 称为n重赛马博弈的风险最小的最优混合策略。如果存在局中人1的风险最小的最优混合策略f的对偶策 略和局中人2的风险最小的最优混合策略:t的对偶策略八使得(/,) = (八:t),则称(门门为 n重赛马博弈的支付风险双重最优混合策

19、略。模型(7)、(8)的求解十分简单,实际上只耍依次求解两个线性规划问题即可,当然第一个线性规划 问题为带参数的线性规划问题。定理4在n重赛马烛弈(/心,%)中,g为其对应的策略式零和博弈,则局中人1、局中人2分别 以相同的概率在各h的策略集小选取各个策略,那么该策略是n重混合赛马博弈支付风险双重最优混合策 略。( 证明:设/ =/=,由文1的定理2(/,/)为该n重混合赛马博弈基于支付的最nl n n)乂_>v/:!优策略,下面來证明其为支付风险双重最优混合策略。要证明(八)为支付风险双重最优混合策略,只要证明(7)中的min max a2(x, y) = a2(/, y*)和 xes

20、tr yesir(8)中的 miq max a2(x,y) = cr2(*,y*)即可。j5/b xest9首先证明口讪口山苓/幺勿二十。*,;/),即要证明 mmmacr2(x,y)scr2(f,y*)与 xestr ysiryxestr ysir2min max a2 (x, y) > a2(xy*)同时成立。xestrx yestr2设b矩阵的第一行的和为sumv,则山定理3知b矩阵的每一行以及每一列的和为sumv,所以当局中 人2选择策略)时,对于局中人1选择的任意策略x,有= x1 by* -v* = x1 (sumv,sumv,-sumvf -v* = surnv -v* =

21、 cr(x*,y*)7'n所以 max(r2(x,y) > cr2(x,y*) = a(x , y*)/?£min max a2(x, y) > cr2(xy*)。ystr2xestr ystr2当局中人1选择策略f吋,对于局屮人2选择的任意策略y,有cr"(x y) = (x ) by-v = sumv, sumv, - - - sumv) y-v = sumv - v = cr(xy )jv川所以 miq max a2 (x, y) < a2 (x 才)xstrx yws迥因此,mirjmacr2(x,y) = er"/,;/)成立,

22、同理有 mirjmaycr'g:)=cr2(f,y*)成立。因此 xestr ystr2yestr2 xws昭(/,/)为支付风险双重最优混合策略。四、实证分析在田忌赛马中,田忌的支付如表1,设其支付矩阵为j7。齐王的 田策略 的策略上 'i' 下下 上1'屮 下 上上 下 中屮 上 下下 中 上上中下-3-11-1-1-1下上中1-3-1-1-1-1中下上-11-3-1-1-1上下中-1-1-1-31-1中上下-1-1-1-1-31下中上-1-1-11-1-3u =卜3-i1-1-11-3111-1-11-3-1-1-1-1-1-1_31-1-1-1-1-1-

23、31-1-1-11-1-3n11119丿(911111911111911b =111911111911111合策略集为sb; =« (/ap,/a 1 - /?, 1 - /?, 1 - p) 0 < p <- »,齐王的最优混合策略集为str =uqyqyqa-q,-qa-q)<q<-> (具体计算过程见文),v*=l,然后计算混合局势(西卫2)的风险为:设田忌采取的策略为x, = (,#2”6 ),齐王釆取的策略为x2 =(914彳6 )'那么田忌的最优混cf2(xpx2) = xbx -(v*)2 = bx2 -1(la)将兀i

24、e str,x2 wstr;代入(la)得224y (x, ,x2) = 3(4p - -)(4-(lb)然后从川忌的角度出发,來对(7)进行求解。首先固定卩,对max cr2(x,y)即(6)进行求解。x2str2i2 4当, (6)的最优解为(7 = 0, (1方)化为a2(xl,x2) = -2(4p ) + -(lc),然后对(lc)63314在0, 1求最小值,显然(lc)的最优解为p=-f目标两数值为工;63当丄"s丄,(6)的授优解为q = -f (lb)化为cr2(x1,x2) = 2(4p-) + -(id),然后对(id)6333314在1/6,1/3求授小值,显

25、然(id)的授优解为p=-f冃标函数值为上;6341风险为上;当p=-时,不管g取何值,目标函数36a丄丄丄丄丄、*<1 1 1 1 1 1au,6,6,6,6,6>,人2 <6,6,6,6,6,6>,(兀;,£)为田忌赛马风险因此,/;=-为田忌的风险最小的最优混合策略,641值为一,【天1此,p= , q任意为(7)的最优解。3 6同理,q =丄为齐王的风险最小的最优混合策略,64 1值为上,因此,q = -, p任意为(8)的最优解。36因此 p = £, q = £ ,令 x:=41风险为上;当q =-时,不管p取何值,目标函数36最小的最优混合策略,也为支付风险双重最优混合策略。从上述例了来看,仅从支付最大的角度考虑,最优混合策略很多,但从兼顾支付以及风险的角度考虑, 最优混合策略唯一,并且实证结论和实际十分符合。五、结论与展望木文将风险引入n重赛马博弈,并证明在料重赛马博弈中支付风险最优策略的存在性。将风险引入” 重赛马博弈,对/?重赛马博弈乃至有限策略式博弈的理论研究具有十

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论