版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、对策论(Theory of Games)第1、2讲对策论也称博弈论,是运筹学的一个重要分支。1928年冯诺意曼(J.von Neumann )等人由于经济问题的启发,研究了一类具有某种特性的博弈问题,这是对策论的最早期的工作。在我国古代的战国时期,“齐王与田忌赛马”就是一个非常典型的对策论的例子。对策论所研究的主要对象是带有斗争性质(或至少含有斗争成分)的现象。由于对策论研究的对象与政治、军事、工业、农业、交通、运输等领域有密切关系,处理问题的方法又有着明显 的特色,所以越来越受到人们的注意。日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为,例如下棋、打牌、体育比赛等,还如战争活动中的
2、双方, 都力图选取对自己最为有利的策略,千方百计去战胜对手,在政治方面,国际间的谈判,各种政治力量之间的斗争。各国际集团之间的斗争等无一不具有斗争的性质。 经济生活中,各国之间、 各公司之间的各种经济谈判,企业为争夺市场而进行的竞争等,举不胜举。具有竞争或对抗性质的行为,称为对策行为。在这类行为中,参加斗争或竞争的各方各自具有不同的目标和利益, 为了达到各自的目标和利益各方必须考虑对手的各种可能的行动 方案,并力图选取对自己最为有利或最为合理的方案,对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。在我国古代,“齐王赛马”就是一个典型的
3、对策论研究的例子。战国时期,齐王有一天提出要与大将田忌赛马。双方约定:从各自的上中下三个等级的马中选一匹参赛。每匹马均只能参赛一次; 每次比赛双方各出一匹马, 负者要付给胜者千金。 已经知道,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级, 则田忌的马可取胜。 当时,田忌手下的一个谋士给田忌出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。 比赛结果,田忌,二胜一负,可得千金,由此看来,两人各采取什么样的出马次序,对胜负 是至关重要的。还如日常生活中,儿童或喝酒中不会猜拳的用 “石头一剪子一布” 游戏也是带有
4、竞争性 质的现象,大家都知道游戏的规定:第一,每人每局比赛中,只能在石头、剪子、布三种出 法中选一种;第二,在一局比赛中,石头对剪子认为石头赢,剪子对布认为剪子赢,布对石 头认为布方赢,如果双方都是同一种,则认为没有输赢。这样一局比赛中,各方是赢是输, 不仅与自己所采取的发法 (亦称策略)有关,而且与对方所采取的出法有关,下面介绍对策论中的矩阵对策。§ 1对策问题的三个基本要求以下称具有对策行为的模型为对策模型或对策。对策模型的种类可以千差万别,但本质上都必须包括如下三个基本要素:(1)局中人在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者称为局中人, 通常用I表示局
5、中人的集合,如果有 n个局中人,则I=1 ,2n, 一般要求一个对策中 至少要有二个局中人,如在“齐王赛马”例子中,局中人是齐王与田忌。当然,对策中关于局中人的概念是具有广义性的,局中人除了可以理解为个人外,还可以理解为某一集体。需要补充的一点是,在对策中总是假定每一个局中人都是理智的,聪明的决策者或竞争者。即对任一局中人来讲, 不存在利用其它局中人决策的失误,来扩大自身利益的可能性或相反。(2)策略集一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略,参加对策的每局中人,i CI都有自己的策略集 Si, 一般,每一局中人的策略集中至少应包括两个 策略。在“齐王赛马”例子中,
6、如用(上、中、下)表示以上马、中马、下马依次参赛次序,这是一个完整的行动方案, 即为一个策略。可见,局中人齐王与田忌各自都有六个策略: (上、 中、下)、(上、下、中)、(中、上、下)、(中、下、上)、(下、中、上)、(下、上、中)。(3)赢得函数(支付函数)在一局对策中,当局势给定以后,就用一个数来表示得失(或输赢),显然,这种“得失”或“输赢”是局势的函数,称为支付函数。例如,S是i个局中人的一个策略,则 n个局中人的策略组S ,S2 -Sn)是一个局势,全体局势的集合S可用各局人策略集的笛卡尔积表示,即S S1 X S2X X Sn当局势出现后,对策结果也就确定了,即对任一局势S S,局
7、中人I可能得到一个赢得H (s)。显然H(s)是局势S的函数,称为第I个局中人的赢得函数(支付函数)齐王赛马中,局中人集体 I=1.2齐王的策略集用 Si a 1,a 2,口 3, 口 4, a 5, a 6田忌的策略集用S2 3 i,3 2,3 3, 3 4,3 5,3 6表示这样齐王的任一策略a i和田忌的任一策略3 j,就决定了一个局势 Sj,如果a 1=(上、 中、下)、3 1 =(上、中、下)则在局势Sii下齐王的赢得值为 Hi (Si) =3。田忌的赢得值为H2 (Sii) =-3 如此等等一般当这三个基本因素确定后,一个对策模型也就给定了,对策论的模型很多,如矩阵对策、连续对策、
8、微分对策、阵地对策、随机对策等。又称矩阵对策。矩阵对策在众多对策模型中占有重要地位的是二人有限零和对策对策,是到目前为止在理论研究和求解方法方面比较完善的一类对策,而且这类对策的研究思想和理论结果又是研究其它类型对策模型的基础,由于学时的限制,我们只能主要介绍矩阵对策 的基本理论和方法。§ 2矩阵对策我们来看几个矩阵对策的例子。例i“我们称"石头一剪子一布”游戏是一个对策问题,设参加游戏的是甲、乙两人,他们的策略集合都是石头、剪子、布,也就是说他们在每一局比赛中都只能采取各自策略集合中的一个策略,如果我们再规定,赢得的一方得一分,输的那方得-1分。显然,这个问题是两人有限零
9、和对策,即矩阵对策。我们可以列出甲、乙两人在一局比赛中的各种局势下的赢输分数。因为这是零和对策,故只需知道甲、乙任何一方在各种局势下的分数,就能够知道对分的情况了。石头01-1男子-101布1-10乙两人在各种局势下的得分情况如下表所示如把表中数字用矩阵形式表示,则有0 1 -1 A -1 011 -10我们称A为甲的应得矩阵.例2、(齐王赛马)战国时期,齐王要与大将田忌赛马,双方约定:从自己的上、中、下三个等级的马中各选出一匹进行比赛。每次比赛输者要付给赢者千金。就同等级的马而言,齐王的马都比田忌的强,他们俩人的策略集合都是,(上、中、下)、(上、下、中)、(中、上、下)、(中、下、上)、(
10、下、上、中)、(下、中、上)并且 可以知道,在每一局比赛结束时,齐王和田忌任何一方赢得的千金数恰是对方输丢的千金数。 可见这是两人有限零的对策。即矩阵对策。齐王得千金数、尸忌策略31(上、 中、下)32(上、 下、中)33(中、 上、下)34(中、 下、上)35(下、中、上)36(下、上、中)卜表列出齐王在各种局势下赢得千金的数值,(表中-1表齐王输一千金)a 1 (上、中、下)31111-1(X 2 (上、下、中)1311-11a 3 (中、上、下)1-13111a 4 (中、下、上)-111311a 5 (下、中、上)11-1131(X 6 (下、上、中)111-113(矩阵)3 广 1
11、11 -11 3 1 1 -1 1A= 1 -1 3 1 1 1-11131111-1131111-113称作齐王的赢得矩阵般情必设两个局中人分别记为)l、II ,局中人I有m个策略a 1, a 2,a m;局中人II有n个策他3 1, 3 2, 邛口。用&表示局中人I的策略集合,&表示局中人II的策略 集合,即S2 3 1, 3 2,3 n为了与后面的概念区分开来,称ai为I的纯策略,3 j为II的纯策略,对于纯策略构成布局势(a i , 3 j)称为纯局势。局中人I的赢得矩阵记为a a11 a12. aj .ama21a22 a2j a2nai1 ai2- aij a in
12、 am1 am2 amj a mnj)下局中人I得分,也表示在同一局势下,局中人A中的木素a ij表示在纯局势(a i,II得分为-a ij o我们把矩阵对策记为G I , n; s1, s2; A或 G s1, s2; A矩阵对策模型给定后,各局中人面临的问题是:如何选择对自己最为有利的纯策略,以谋取最大的赢得(或最少损失),这就是所谓矩阵对策的最优纯策略。第3、4讲(一)矩阵对策的最优纯策略。我们用一个例子来说明最优纯策略的概念。例 3、设有一矩阵对策G s1,s2;A,其中 &“1,a2,a3,”4,S2 3 1, 32, 3 3-6 1 <83 2 4A 9 -1 -10
13、-3 0 61234从A可看出,姆中人I的最大赢得是9,要想得到这个赢得,他就得选择纯策略a3。由于,假定局中人II也是理智的,他考虑到了局中人I打算出a 3的心理于是侵准备以3 3对付之。使局中人不但得不到9,反而失掉10,局中人I当然也会猜到局中人II的这一心理,故想出a 4来对付,使局中人II得不到10而失掉6,所以,如果双方都不想冒险, 都不存在侥幸心理,而是考虑到对方必然会设法使自己的所得最少这一点,就应该从各自可能出现的最不利的情形中选择一种最为有利的情形作为决策的依据,这就是所谓“理智行 为”,也是对策双方实际上都能接受的一种隐妥方法。例3中,局中人I分析出纯策略a 1, a 2
14、, a 3, a 4可能带来的最少赢得(矩阵 A中每 行的最小元素)分别为:-8 ,,-10 , -3max -8 , 2, -10 , -3=2在这些最少赢得(最不利的情形)中最好的结果(最有利的情形)是赢得为2。因此,局中人I只要以a 2参加对策,无论局中人II取什么样的纯策略, 都能保证局中人I的收入 不会少于2,而出其它纯策略,其收入都有可能小于 2,甚至输给对方。因此,对局中人 II 来说,各纯策略3 1, 3 2, 3 3可能带来的对其最不利的结果(矩阵 A中每列中最大元素)分别为:9,,6min 9 , 2, 6=2在这些最不利的结果中,最好的结果(输得最少)也是2,即局中人II
15、只要选择纯策略3 2(无论局中人I采取什么纯策略,都能保持自己的支付不会多于2,而采取其它任何策略,都有可能使自己的所失多于2。上面的分析表明,局中人I、II的“理智行为”分别是,选择纯策略a 2和3 2,这时局中人I的赢得值和局中人II的所失值的绝对值相等(都是2),局中人I是按最大最小原则。局中人 II是按最小最大原则选择各自的纯策略,这对双方来 说都是一种最为稳妥白行为,因此,a2, 3 2分别为局中人I、II的最优纯策略。于是我们引出矩阵对策解的概念:定义1设G s 1, S2; A为矩阵对策,其中S1 “1, “2,ahS2 3 1, 32, 3 n。 A=aij mx n 若等式i
16、 j ji成立,记Vga*r ,则称V为对策G的值,上式称为成立的纯局势(“/,3 j*)为G在纯策略下的解(或平衡局势)。ai*, 3 j*分别称为局中人I、II的最优纯策略。由定义1可知,在矩阵对策中两个局中人都采取最优纯策略(如果最优纯策略存在)才是理智的行动。例3中,对策解为(a 2, 32),对策值为Vg=2。例4,求解矩阵对策 G S1, S2; A,其中-7厂 1 -813 2 4A= 16 -1 -3-3 05313 23 3min a ija 1-71-8-8a 23242a 316-1-3-34 4-305-3max aij1625解:根据矩阵A有于是maXmin aj)
17、min(max aj) 2i j j i由定义1Vg=2, G的解为(a 2, 3 2), a 2, 3 2分别是局中人|和|的最优纯策略。从例4可以看出,矩阵 A的元素a22既是所在行的最小元素,又是所在列的最大元素, 即ai2 a22a2 ji=1,2,3,4; j=1,2,3将这一事实推广到一般矩阵对策,可得如下定理:定理1 矩阵对策 G S1、S2; A在纯策略意义下有解的充要条件是:存在纯局势(a,*),使得对一切i=1,2,m,j=1,2,n均有证(略)为了便于对更为广泛的对策情况进行分析,现引进关于二元函数鞍点的概念:定义2 设f (x, y)为一个定义在xC A及yC B上的实
18、值函数,如果存在 x* C A, y* C B,使得对一切,xC A和y C B,有f (x,y* ) < f (x*,y* ) < f (x*,y)则称(x*,y* )为函数S的一个鞍点注1.由定义2及定理1可知,矩阵对策 G在纯策略意义下有解,且 VG=a*r的充要条件 是:a*是矩阵A的一个鞍点。在对策论中,矩阵A的鞍点也称为对策的鞍点。定理1中或aij* ai*l*ai*j的直观解释是:如果ai*j*既是矩阵 A (aij )m n中的第i行的最小值。又是 A中第j列的最大值,则 ai*j*是对策的值,且(a i* , 3 j* )就是对策的解,其对策意义是:一个平衡局势(
19、 a i* , 3 j*) 应具有这样的性质,当局中人I选取了纯策略a i*后,局中人n为了使其所失最小,只有选择纯策略3 j* ,否则就可能丢的更多;反之,当局中人n选取了纯策略3 j*后,局中人I为了得到最大的赢得也只能选取纯策略ai*。否则就会赢得更少,双方的竞争在局势(ai*,储*)下达到了一个平衡状态。a 1, a 2, a 3, a 4 , S2 = 3 1, 3 2, 3例5,设有矩阵对策 G=s 1, S2; A,其中S1=3 , 3 4,赢得矩阵为2 -1解:直接在A提供的赢得表上计算,有2 -1-1max于是max(mina)=min(maxa ii )=a i*j* =5
20、I j j i 其中i *=1, 3 故(a 1, 3 2),*=2, 43 4) , ( a 3, 3 2) , ( a 3,3 4)四个局势都是对策的解,且 VG =5由此例可知,一般矩阵对策的解可以是不唯一的, 面两条性质:当解不唯一时,解之间的关系具有性质13 j2 )和(a性质23 j2 )和(a无差别性,即若(ai2 , 3 j2 )也是解。可交换性,即若(ai2 , 3 j1 )也是解。i2 , 3 j2)是对策G的两个解,则(ai2 , 3 j2)是对策G的两个解,则(ai1,i1,证明留给读者,这两条性质表明,矩阵对策的值是唯一的下面举一个实际应用的例子例6.某单位采购员在秋
21、天要决定冬季取暖用煤的贮量问题,已知在正常的冬季气温条件要耗煤15吨,在较暖与较冷的气温条件要消耗10吨和20吨,假定冬季时的煤价随天气寒冷程度而有所变化,在较暖、正常、较冷的气候条件下每吨煤价分别为10元、15元和20元,又设秋季时煤价为每吨10元,在没有关于当年冬季准确的气象预报的条件下,秋季贮煤多少吨,能使单位的支出最少?解:这一贮量问题,可以看成是一个对策问题,把采购员当作局中人,他有三个策略,在秋天时买10吨、15吨与20吨,分别论为a 1、a 2、a 3。把大自然看作局中人II (可以当作理智的局中人来处理),大自然(冬季气温)有三种策略,出现较暖的、正常的、与较冷的各季,分别记为
22、31、3 2、3 3。现在把该单位冬季取暖用煤实际费用(即秋季时的购煤费用与冬季不够时再补购的费用总和,作为局中人I的赢得,赢得矩阵如下1(较暖)2(正常)3(较冷)min1( 10 顿)-100-175-300 -300a 2(15顿)-150-150-250 -250a 3(20max顿)-200-100-200-150故对策解为(a-200 -200-2003, 3 3),即秋季贮煤策G在纯策略中都有解呢?上面所举的例20吨合理,现在,我们会问,是否对于每一个决3、4、5、6都是有解的,但也有在纯策略中没有解的对策,如例 可以算出。1的“石头一剪子一布”对策,就没有解,因为从甲的赢得矩阵
23、A中,我们3 3 min-1-1-1-1-1maxmax (minai j j所以“石头-ij )= -1 min(maxaij )=1 i剪子一布”游戏的对策问题中,在纯策略中无解。再如例2的,齐王赛马的对策。可以算出P 1P 2P 3P 4a 13 1111 -1-1a 21 311-11-13 31 -13111-14 4 -1 11311-15 511 -1131-16 6111 -113-1max3 33333max(min a ij )= -1min (max aij )=33 6 min故知在齐王赛马的对策中,双方都没有最优纯策略。那么在纯策略意义下,没有解的对策问题,局中人又应
24、如何选取策略参加对策呢?下讲 我们来解决这一问题。第5、6讲(二)矩阵对策的混合策略由上节(讲)讨论可知,对矩阵对策G=S1, S2; A来说,局中人I有把握的至少赢得是V1 =max(min a ij)局中人II有把握的至多损失是V2 =min( max a ij)一般,局中人I赢得不会多于局中人II的所失值,即总有 VlWV2,当Vl=V2时,矩阵对 策G存在纯策略意义下的解,且 Vg=V-V2。然而,一般情况不总是如此,实际中出现的复杂 情况是VKV2,这样根据定义1,对策不存在纯策略意义下的解,例 1、2都是VKV2,这又会 出现什么情况呢?下面来看一个例子。例7 给定一个矩阵对策 G
25、=s 1, S2; A 其中 Si= ”, a 2S2 = A, 3 23 6A = 5 4一一* 一V 1 =max(min a。)=4 i=2V _*V 2 =min(max a。)=5 j=1V 2 = a2i =5>4= a22 = V1选择纯策略时,应分别选取a于是,当双方各根据最不利情形中选最有利结果的原则,2和31此时局中人I将赢得5,比预期赢得V1=4还多,原因就在于局中人II选择了 3 1,使他的对手多得了原来不该得的赢得,故3 1对局中人II来说并不是最优的,因而也会考虑32,局中人I亦会采取相应的办法,改出a 1以使赢得为6,而局中人II又可能仍取策略3 1 来对付
26、局中人I的策略a 1,这样,局中人I出“1或a 2的可能性及局中人II出3 1或3 2的 可能性都不能排除,对两个局中人来说,不存在一个双方均可接受的平衡局势,或者说当V1<V2时,矩阵对策 G不存在纯策略意义下的解,在这种情况下,一个比较自然且合乎实际 的想法是:既然各局中人没有最优纯策略可出,是否可以给出一个选取不同策略的概率分布,如在例7中,局中人I可以制定如下一种策略:分别以概率1/4和3/4选取纯策略a 1和a 2,这种策略是局中人I的策略集 a 1, a 2上的一个概率分布,称之为混合策略,同样,局中 人II也可制定这样一种混合策略:分别以概率1/2,1/2 选取纯策略3 1
27、, 3 2,下面给出矩阵对策混合策略的严格定义:定义3设有矩阵对策G S 1 , S2; A,其中S1= a 1, a 2,a n , S2 = 3 1, 3 2, 3n, A (a。)m n,则我们把纯策略集合对应的概率问量 mX(X1,X2,,xm) T x i >0 i=1,2, ,m;&与 Y(y1,y 2, yn) T y j >0 j=1,2,n;i 1Yj分别称作局中人I、II的混合策略。(x,y )称一个混合店如。一个混合策略 X(x1, x2xm) T可设想成两个当局人多次重复进行对策G时,局中人I分别采取纯策略a 1, a 2- a m的频率。纯策略也可
28、以看成是混合策略的特殊情况。例如局中人取纯策略a i,则对应于局中人I的混合策略为(0,0,1,0o)T所以有时把混合策略简称为策略 ,(只进行一次对策,混合 对策x= (x»2,xm) 可设想成局中人I对各纯策略的偏爱程度)。如果局中人I选取的策略为X (X1,X2, ,Xm)T局中人II选取的策略为 Y (丫,丫2 , ,Yn)T由于两个局中人分别选取纯策略a,3 j的事这件可以看成是相互独立的(随机事件)所以局势(a i, 3 j)出现的概率是xiyj,从而局中人I赢彳导au的概率是x, g,于是数学 期望。 m nE (X,Y)aKyj就是局中人I/屈导值m记 S X (Xi
29、,X2, ,Xm)T,Xi0,i1,2, ,m;Xi1*i 1E E (x,y ) |X e Si , YC S2 *则称 G = Si , S2; E为G的混合扩充设两个局中人仍象前面一样地进行有理智的对策,当局中人 I采取混合策略 X时。他 只能希望获得(最不利的情形)。min E (x,y)因此局中人应选取 xCS*,使上式取极大值(最不利当中的最有利情形),即局中人I可 保证取赢利的期望值不少于V1 = max ( min E (x,y)y e S2 x e si同理,局中人n可保证自己所失期望值至多是V2 = min (maxE(x,y)y C S2 x C si注意到上二式vi、V
30、2表达式是有意义的,且是 Si*、$2*上的连续函数,仍然有 Vi< V2事 实上设 max(minE (x,y)= E (x,y )x C si yC S2min max E (x,y)= E (x ,y)y C S2 x C si于是Y=E(X,Y*) WE (X*, Y*) WE (X* , Y) =V2定义4,设G=s i*, si*; E是矩阵对策 G=si, S2; A的混合扩充。如果max(min E(X,Y)= min(max E(X,Y) L *-*x e si y e s2 y e S2 x e s1记其值为VG,则称VG为对策G*的值,使上式成立的混合局势,(乂,V
31、)为G在混合决策意义下的解,X、Y分别称为局中人I和n的最优混合决策。 . . . . . . .现约定:以下对G s i, S2; A及其混合扩充 G si , S2 ; E 一般不加区别。通常用G si, S2; A表示,当G在纯策略意义下,解不存在时,自动认为讨论的是在混合策略 意义下的解。相应局中人I的赢得函数为E (X,Y),和定理i类似,可以给出矢I阵对策 G在混合策略意义下解存在的鞍点型充要条件。 、 .一 . . * *定理2矩阵对策G s i, S2; A在混合策略意义下,有解的充要条件是,存在X e Si ,Ves;使(乂,Y)的函数E (X,Y)的一个鞍点,即对一切 XC
32、 Si*, YC &*有E= (X.Y ) & E (X*.Y*) & E (X,Y*)解例7考虑矩阵对策 G si, S2; A36fS1 = a 1, a 25A= 5 4S2 = 3 1, 3 2解,*J 7已讨忌口 G在纯策略意义下,解不存在于是设 X (xi,X2),为局中人I的混合策略Y (yi,y2),为局中人n的混合策略 *则S1(x 1,x2) x 1,x 2> 0 x 1+x2=1(概率和为 1) 一*S2 =(y 1 ,y 2) y 1,y 2> 0 y 1 y2=1局中人I的赢得期望是:由此式可知当 x1 1/4 , x2 1-1/4
33、=3/4 时,E(X,Y) 9/2,就是说,当局中人I以概率1/4选取纯策略1,以概率3/4选取纯策略 2时他的赢得至少是9/2 ,同样局中人n只有取X 1/2 , 丫2 =1-1/2=1/2,才能保证他的输出不会多于9/2。一*T*T取 X(1/4,3/4)Y (1/2,1/2)则 E(X ,Y ) 9/2E(X ,Y) E(X,Y ) 9/2即有 E(X,Y ) E(X ,Y ) E(X,Y)TT故 X (1/4,3/4) 和 Y (1/2,1/2) 分别为局中人I和n的最优策略,对策值(局中人I的赢得期望值)VG 9/2一般矩阵对策在纯策略意义下的解,往往是不存在的,但是可以证明,般矩阵
34、在混合策 略意义下的解,却总是存在的,这一系列定理我们略表不讲了,但在一个构造性的证明中, 引出了矩阵对策的基本方法一线性规划方法。这是给出一个矩阵对策优超纯策略的定义:定义5设有矩阵对策G S1, S2; A其中 S1= a 1, a 2,a ® S2 = 3 1, 3 2,,3 nA (aj)mn如果对一切j=1,2,n都有即矩阵A的第i 0行元均不少于第k 0行的对应元,则称局中人I的纯策略aio优超于同样,若对一切i=1,2,m,都有即矩阵A的第I0列元均不少于第jo列的对应元,则称局中人II的纯策略3 J优超于3 l0 定理10,设G S1, S2; A为矩阵对策其中S1
35、a 1, a 2, ,a mS2 3 1, 32,"', 3 nA (a0)mn如果纯策略a 1被其余纯策略a 2, a 3,a m中之所优超,由 G可 得到一个新的纯阵对策G :其中 GS1 ,S2 ; ASa2, "3,,m mA =( a ij ) (m 1) nAja。i=2,m ,j=1,2, n于是有(1) VgVg(2) G中局中人II的最优策略就是其在 G中的最优策略:.* 、 TT(3)若(x2,x3,.,xm)是G中局中人I的最优策略,则X (0,x1 ,x2,.,xm)是其在G中的最优策略。例9,设赢得矩阵为2(2 0 3 05 0 2 5 9
36、A= 7 3 9 5 94 6 8 7 5.56 0 8 8 3求解这个矩阵对策。解:由于第4行优于第1行、第3行优于第2行,故可划在第1行和第2行,得到新的赢得矩阵。7 /959、Ai46875.56 0883由于Ai第1列优超于第3歹U,第2列优超于第4列1/3 X (第1歹U) +2/3 X (第2歹U)优超于第5歹U,因此去掉第 3、4、5歹U,得到7 3A24 68 0这时第1行又优超于第3行,故从4中划在第3行,得到9 3A 4 6对于A3 ,易知无鞍点存在,应用定理 4,求解不等式组7x3+4x4 > v7y1+3yzW v3x3+6x4 > v4y1+6y2W v(
37、I) x3+x4=1(iiy1+y2=1x3,x 4> 0y1,y > 0首先考虑满足7x3+4x4=v7y1+3y2=v3x3+6x4=v4y1+6y2=vx3+x4=1y1+y2=1的非负解,求得解为*X31/3*X42/3于是原矩阵对策的一个解就是:第7、8讲(三)矩阵对策的解法(1)2 X2对策的公式法所谓2X2对策是指局中人I的赢得矩阵为2X2阶的,即如果A有鞍点,则很快可求出各局中人的最优纯策略;如果A没有鞍点,则可以证明各局中人最优混合策略中的Xi , yj均大于零。于是由定理6可知,为求最优混合策略可求下列方程组:aiixi+a2iX2=v(I) aiixi+a22
38、X2=vXi+X2=iaiixi+a12y2=v(II) a2iyi+a22y2=vyi+y2=i当矩阵A不存在鞍点时,可以证明上面等式组(I) (II ) 一定有严格非负解 * tX (Xi,X2)* tY(Yi ,丫2 ),其中a22-a 2i* Xi (aii+a22)-(a i2+a2i)aii-a i2(aii+a22)-(a i2+a2i)a22-a i2(aii+a22)-(a i2+2i)aii-a 2i(aii+a22)-(a i2+a2i)a11a22-a 12a2i(aii+a22)-(a i2+a2i)例10求解矩阵对策,G=si, S2; A,其中1 3A 4 2解
39、易万A没有谕点,由上通解公式,计算得到最优解为对策值为5八2(2) 2 x n或mK2对策的图解法。(3)线性方程组法据定理,求解矩阵对策解(x*,y*)的问题,在价于求解下面两个方程组的问题:(假设取优策%中的Xj , yi均不为零)n aijXi =v j=1,2,nni 1aij yi =v i=1,2,mjM试算过程是无固定规则可循的,所以实际应用中具有一定的局限性。例12求解矩阵对策一一“齐王赛马”解已知齐王赛马的赢得矩阵为3 iiii-11 311-111 -13111-11131111-11311 11-113易知,A没有鞍点,即对齐王和田忌来说都不存在最优纯策略。设齐王和田忌的最优混合策略为,*、TX=(X1 ,X2,X3 ,X4 ,X5 ,X6 )T*=(y;,y2*,y3*,y;,y5* ,y6*)T从矩阵A的元素来看,每个局中个选取每个纯策略的可能性都是存在的,故可事先假定Xi*>0,yj*>
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度户籍制度改革下户口落户手续代理合同
- 2025年度硅藻泥装饰工程验收及售后保障服务合同
- 二零二四年建筑工地工程车租赁合同书2篇
- 2025版物流公司员工劳动合同范本3篇
- 2025年度城市LED广告屏制作及维护服务合同范本
- 2025年度国际贸易风险管理合同与执行策略
- 2025年地铁广告位投放代理合同
- 2025版电子产品售后回租服务合同范本(升级版)3篇
- 二零二四年度影视项目临时演员培训与聘用合同4篇
- 2025年度5G通信技术合资合同协议书
- 2025开工大吉蛇年大吉开门红模板
- 锅炉、压力容器制造质量手册含程序文件-符合TSG07-2019《许可规则》
- 逻辑思维训练500题(带答案)
- 2025年日历表(A4版含农历可编辑)
- 人工智能大模型
- 极简统计学(中文版)
- 2024年资格考试-对外汉语教师资格证笔试参考题库含答案
- 2024年4月自考02382管理信息系统答案及评分参考
- (苏版)初三化学上册:第2单元课题1空气
- 2023年12月广东珠海市轨道交通局公开招聘工作人员1人笔试近6年高频考题难、易错点荟萃答案带详解附后
- 腹腔镜肾上腺肿瘤切除术查房护理课件
评论
0/150
提交评论