版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023/2/41第8章对策论8.1对策论的初步认识8.2矩阵对策的基本理论8.3矩阵对策的解法特别提示:
学好本章内容,要求必须具备概率论的必要知识,同时要预习线性规划和对偶规划的有关知识。
2023/2/428.1.1
对策现象和对策论第8章对策论§8.1对策论的初步认识2023/2/43为了便于对不同的对策问题进行研究,对策论将对策问题根据不同方式进行了分类。分类方式主要包括:(1)根据局中人的个数,分为二人对策和多人对策,多人对策中局中人多于二人。(2)根据各局人中的赢得函数的代数和是否为零,可分为零和对策和非零和对策。(3)根据局中人之间是否允许合作,可分为合作对策和非合作对策。(4)根据局中人策略集合中的策略个数,可分为有限对策和无限(或连续)对策。(5)根据策略的选择是否与时间有关,可分为静态对策和动态对策。(6)根据对策模型的数学特征,可分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策
等。在众多的对策模型中,有重要地位的是二人有限零和对策,又称矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策论分支。尽管矩阵对策基本上是一类最简单的对策论模型,但其研究的思想和方法具有十分重要的代表性,体现了对策论的一般思想和方法,而且它的研究结果也是研究其它对策模型的基础,因此,基于这些认识,本章将主要介绍矩阵对策的基本内容。2023/2/448.1.2对策问题的三要素
为了对对策问题进行数学上的分析,必须建立对策问题的数学模型,称为对策模型。不论对策模型在形式上有何不同,一般都必须包括以下三个基本要素:一、局中人在一个对策中,有权决定自己行动方案的对策参加者称为局中人。在二人对策中,有两个局中人,通常用局中人Ⅰ和局中人Ⅱ表示;在多人对策中,则有多个局中人,通常用Ⅰ表示局中人的集合。在对策现象中,局中人并不一定都是具体的人,它可以理解为个人,也可以理解为一个集体,如球队、军队、企业等,还可以是非人的客观状态,如天气状况、经济形势等。另外,在对策中利益完全一致的参加者只能看成是一个局中人。如桥牌赛中的南北方和东西方尽管各有两人,共四人参加竞赛,但只能算两个局中人。对策论中对局中人的一个重要假设是:每个局中人都是“理智的”,即对于每一个局中人来说,都不存在侥幸心理,不存在利用其它局中人的决策失误来扩大自身利益的行为或预期。2023/2/45二、策略集合一个对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一个局中人i(i∈I)的策略集合记为
iS,一般地,每一局中人的策略集合中至少应包括两个策略。如在“齐王赛马”中,如果用(上、中、下)表示以上马、中马、下马依次参赛,那么它就是一个完整的行动方案,即为一个策略。可见,齐王和田忌各自都有六个策略(3!个):(上、中、下)、(上、下、中),(中、上、下)、(中、下、上)、(下、上、中)、(下、中、上)、三、赢得函数(支付函数)
一个对策中,每位局中人所出策略形成的一对策略称作一个局势。对于二人对策一个局势可用Sij表示,即局中人I出第i个策略、局中人II出第j个策略形成的局势。在多人对策中假定有n个局中人,每个局中人都从自己的策略集合中选出一个策略,则全部的局势数。比如田忌赛马问题中,就总共有6×6=36个局势。当一个局势出现后,必然会有一个竞争结局,把这种竞争结局用数量来表示,就称作赢得函数或支付函数,用)()(sHi表示。一个局势实际就是一次较量,而赢得也就是较量一次的结果。2023/2/46如在”齐王赛马”中,齐王和田忌的策略集合分别为),...,,(6211aaaS=和),...,,(6212bbbS=.这样,齐王的任一策略
ia和田忌的任一策略
jb就构成了一个局势ijS。如两人分别采用策略
1a和
1b,则齐王的赢得为)(111SH=3,田忌的赢得为3)(111-=SH。在二人有限零和对策中,每一局势的赢得函数可以用矩阵来表示,把赢得函数用矩阵来表示,就称作赢得矩阵(或支付矩阵)。一般地,当对策问题中的局中人,策略集合和赢得函数这三个要素确定后,一个对策模型也就确定了。2023/2/478.1.3对策问题举例
一、招揽乘客问题有两家客运公司A和B,同时服务于甲、乙两地之间,每年在这个区间流动的乘客数为一常数,因此,其中一家乘客增多,就意味着另一家乘客减少。在这种情况两家都力图采取措施以招揽更多的乘客。假定每个公司可采取的措施有以下三种:(1)优质服务,即什么都不做仅通过优质服务赢得乘客;(2)口头宣传,即在行车其间对乘客进行各种口头宣传;(3)打广告,即运用各种广告媒体做广告宣传。于是总共可以有9种局势,在每一种局势下A公司的赢得函数可以表列如下:B公司A公司优质服务口头宣传打广告优质服务口头宣传打广告0200700-2000250-600-200100
问两公司各应采取何种措施,才能招揽到更多乘客?2023/2/48二、差旅问题某人要由甲地去乙地出差,汽车公司规定,到乙的单程车票是35元,来回车票是50元。根据经验,甲地常有车去乙地办事,因此出差人极有可能搭便车回来而不必乘汽车公司的车。于是,出差人面临的情况是:或者买单程车票,或者买来回车票。买单程车票若有便车可搭,只需要35元车费;但如果无便车可搭则需要再另花35元买一张回程票,总共要花费70元钱。买来回车票,不论是否有便车可搭,都得花去50元钱。那么到底是买单程车票好呢还是买来回车票好?这一问题的赢得矩阵可以表述如下:
1b
2b))(()()(5070503521来回单程无便车有便车úûùêëéaa在这里局中人Ⅰ是客观情况,局中人Ⅱ是乘客即出差人,赢得矩阵表示汽车公司的赢得函数。当然也可以把乘客作为局中人I来考虑。这时的赢得函数需要用负数来表示。客观情况2023/2/49三、曹操的去路问题三国时赤壁大战之后,曹操率领残兵败将企图逃往南郡,途中来到了一个三岔路口,前面有两条道,
一条是小路即华容道,窄险难行;另一条是大路,便于行军,但比小路要多走50里路。两条路都可能有诸葛亮的伏兵。在这紧急关头,曹操盘算着对策;诸葛亮的伏兵到底会在哪条路上?曹军到底走哪条路较妥?若走小路,如果遇到伏兵,曹军将全军覆没;如果没有伏兵,曹军虽能顺利到达南郡,但因山路险窄,兵马辎重损失较大。若走大路,因大路不便于伏兵,且便于冲杀突过,所以,既使遇到伏兵也不至于全军覆没,若大路没有伏兵,曹军能顺利地到达南郡,重整旗鼓,再次决战。那么,曹操究竟应取何种策略,是走小路还是走大路才能保证自己损失最小呢?对这一对策问题,可以采取打分的方法将诸葛一方的“得失”用适当的数字表示出来。根据分析,诸葛一方的赢得矩阵(分数)可以用下表表示:
(曹操一方)
1b
2b
(诸葛一方))()()()(80809010021大路小路大路小路úûùêëé--aa2023/2/410四、齐王赛马问题
根据已知条件,在同等数的马中,田忌的马不如齐王的马,但如果田忌的马比齐王的马高一等数,则田忌可获胜。于是可得到齐王的赢得矩阵为:田忌齐王上中下
上下中
中上下
中下上
下中上
下上中上中下上下中中上下中下上下中上下上中31111-11311-111-13111-11131111-1131111-113如果将齐王与田忌的马分别进行比赛,则可以形成9个局势,其结果如下表:2023/2/411田忌齐王上
中
下上中下111-111-1-11该表可用以解释前一表的结果。请同学们试写出“石头、剪刀、布”两碰吃游戏的赢得矩阵。“石头、剪刀、布”两碰吃游戏的赢得矩阵:
石头剪刀布石头剪刀布ClicktoshowAnswer2023/2/4128.2.1矩阵对策的纯策略
矩阵对策,也就是二人有限零和对策,即对策中有两个人,每个人
的策略都是有限的,其中一人所得为另一人所失,得失之和为零。它的
一般定义是);,(21ASSG=,其中,1S和2S是每一局中人的策略集合,
A是局中人Ⅰ的赢得矩阵,并有:
),...,,,(3211maaaaS=
),...,,,(3212nbbbbS=
úúúúûùêêêêëé=mnmmnnaaaabbaaaA.....................212222111211
1S和2S中的每一个元素都称作一个纯策略,纯策略ia和jb选定
后,就形成了一个纯局势),(jiba,这样的纯局势共有m×n个。
§8.2矩阵对策的基本理论2023/2/413。
例8.1设有一矩阵对策);,(21ASSG=,其中:
úúúúûùêêêêëé-----=6104801213936A
试分析每一局中人各方应采取何种策略最为有利?
这里需要注意的是,在矩阵对策中,“零和”的含义是指赢得和支付
之和为零,或者说是赢得矩阵和支付矩阵之和为零,同一矩阵中所有元素
之和表示一局中人在所有可能的局势中的赢得之和或支付之和,不一定为0。
解:由A容易看出,局中人Ⅰ的最大赢得是9,如果他想赢得这个数,他就要选纯策略3a。由于局中人Ⅱ也是假定的理智竞争者,他考虑到局中
人Ⅰ会出3a的心理,便准备以3b对付之,使对方不但得不到9反而失掉10。
局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,故转而出4a来对付,使局中
人Ⅱ得不到10反而失掉6;如此,相互追逐不休。所以,如果双方都不想
冒险,都不存在侥幸心理,就应该考虑到对方必然会设法使自己所得最多而
2023/2/414使对手所得最少这一点,从而从自己可能出现的最不利的情形中选择一个
最有利的情形作为决策的依据,这就是所谓的“理智行为”,也是对策双方
实际上可以接受并采取的一种稳妥的策略。
这类似于进行一项非确定型决策。每一位决策人(即局中人)都面临
有若干种自然状态,究竟会出现哪一种状态决策人并不知道(每一位局中
人都不可能知道对方的策略),在这种情况下,决策人经常可能会采取的一
个策略就是,从最不利的状态出发选择最好的方案,换句话说也就是“从最
坏处着想,向最好处努力”。
局中人Ⅱ局中人Ⅰ所以,有均衡点a22=22023/2/415以上分析表明,局中人Ⅰ和Ⅱ的“理智行为”是分别选纯策略2a和2b,这时局中人Ⅰ的赢得值和局中人Ⅱ的所失值绝对值相等,局中人Ⅰ得到了预期的最少赢得2,而局中人Ⅱ也不会给他的对手带来比2更多的所得,两人相互竞争的结果使对策出现了一个平衡局势即(2a,2b),这个局势是双方均可以接受且对于双方来说都是一个最稳妥的结果。因此
2a和2b就分别称作局中人Ⅰ和局中人Ⅱ的最优纯策略。对于一般的矩阵对策,有如下定义:定义8.1对于矩阵对策);,(21ASSG=,若GijijijjiVaa==maxminminmax则称GV为对策的值,称使该式成立的纯局势),(**jiba为G在纯策略意义下的解(或平衡局势),称*ia和*jb分别为局中人Ⅰ和Ⅱ的最优纯策略。2023/2/416
从例8.1中还可以看出,实际上GV也就是平衡局势(2a,2b)的对应元素22a,它既是所在行的最小元素,又是所在列的最大元素,即有:jiaaa2222££
(i=1,2,3,4;j=1,2,3)在这里,22a就称作例8.1中矩阵对策G的一个鞍点。将这一事实推广到一般的矩阵对策,可得如下定理:定理8.1矩阵对策);,(21ASSG=在纯策略意义下有解的充要条件是:存在纯局势),(**jiba,使得对于任意的i和j,有:jijiijaaa****££也就是存在一个鞍点元素。(证明从略)
顾名思义,鞍点正象一个马鞍的中心,马鞍的中心依我们观察的方向不同,是槽又是脊,如图8.1所示。课堂练习:§试找出8.1.3中的4个例子即“招揽乘客问题”、“差旅问题”、“曹操的去路”和“齐王赛马问题”的鞍点。82023/2/417
我们还可以看一个生活中实实在在的案例。谈话对策(沉默是金)反应好反应不好谈不谈
反应好反应不好谈不谈无鞍点2023/2/418对对策值的一种形象理解
——咆哮的狼狗
一只可怜的小兔子被关在花园里,花园的形状如右图所示,南面是个矩形,北面是半圆形。在篱笆外面有一条街道,一只凶恶的大猎狗紧贴篱笆沿着大街东奔西跑,一面狂吠着,一面竭力想接近小白兔,试图吞噬它。而可怜的兔子呢,当然想竭力躲避这个可怖的威胁设法尽一切可能使它和恶狗之间的距离离得越远越好。
现在请大家看图,兔子原来处于图中C的位置,也就是半圆部分的圆心。恶狗现在窜到1的位置,兔子马上逃到1’,因为很明显,在整个花园中,离1最远的位置就是1’;恶狗当然不甘心,它马上奔到2,因为这时候,2是离开1’最近的地方(恶狗只能沿着大街奔跑,不能跳过篱笆),于是兔子又逃到2’,恶狗再追到3;兔子又逃往3’,…。·这样一直追下去,最后兔子逃到了极限位置R,而恶狗追到D,这时候,双方都感到了满足。因为兔子如果再动一动的话,距离反而会减小,而恶狗呢,它如果再走动的话,和兔子的距离反而会增大,而这都是与它们的主观愿望相抵触的,于是,它们之间达到了“平衡”。距离DR,就是达一局对策的“值”。2023/2/4198.2.2矩阵对策的混合策略根据前面的讨论,我们已经知道,在一个矩阵对策);,(21ASSG=中,按照“从最不利的状态出发选择最好的策略”的原则(该原则也叫“最大最小”原则),局中人Ⅰ能保证的充其量最少赢得的不低于:ijjiaVminmax1=而局中人Ⅱ能保证的充其量最大损失不超过:ijijaVmaxmin2=一般地说,局中人Ⅰ的赢得不会多于Ⅱ的损失,21VV£。当21VV=时,矩阵对策在纯策略条件下有解,且21VVVG==这时的对策称作为有鞍点的矩阵对策。21VV<,根据定义8.1,对策问题不存在纯策略意义下的解。这时的矩阵对策均为无鞍点矩阵对策。故总有2023/2/420例8.2
求矩阵对策);,(21ASSG=的解,其中úûùêëé=4563A解:因为ijjiaVminmax1==4
ijijaVmaxmin2==5
21V,显然,在这里不存在鞍点元素。V<所以,当双方都根据“从最不利的状态出发选择最好的策略”的原则选择纯策略时,两人应分别选择2a和1b策略。但是当局中人Ⅰ选2a时,他的实际赢得,由于局中人Ⅱ选的是1b将赢得5,比其预期的最多盈得1V=4要多。所以,1b实际不是局中人Ⅱ的最优策略。同时,当局中人Ⅰ出2a时,局中人Ⅱ的正确选择应是2b。但当局中人Ⅱ选2b时,局中人Ⅰ又会选1a。这样,局中人Ⅰ出1a和2a的可能性及局中人Ⅱ出
1b和
2b的可能性都不能排除。换言之也就是说,对两个局中人来说,根本不存在一个使双方都可以接受的平衡局势,即不存在纯策略意义下的解。在这样的情况下,一个比较切合实际合乎逻辑的想法必然是:既然局2023/2/421中人都没有最优纯策略可出,是否可以给出一个不同策略的概率分布。比如,在例8.2中局中人Ⅰ可制定这样一种策略,即分别以概率)43,41(选取纯策略),(21aa,这种策略就称作为一个混合策略。同样,局中人Ⅱ也可以制定这样一个混合策略,即分别以概率)21,21(选取纯策略),(21bb。显然,混合策略并不具有唯一性。下面给出矩阵对策混合策略及其在混合策略意义下解的定义。定义8.2设有矩阵对策);,(21ASSG=,其中nmijaA=)(,记
)1;,...,2,1,10(1==££Î=å=miiimpmipEpP)1;,...,2,1,10(1==££Î=å=njjjnqnjqEqQ其中,mE和nE分别表示m维和n维的欧氏空间,并规定p为m维的行2023/2/422向量,q为n维的列向量;则称P和Q分别为局中人Ⅰ和局中人Ⅱ的混合策略集合,称(p,q)为一个混合局势。同时,将局中人Ⅰ的期望赢得或赢得函数记为:pAqqpaqpEjminjiij==åå==11),(仍以例8.2为例,按照给定的混合策略,2921214563)43,41(),(=úúûùêêëéúûùêëé=qpE
期望赢得的概念是容易理解的。因为在混合策略条件下,每次双方会选择哪一个纯策略完全是一个随机事件,而任何一个纯局势的出现,都是两个相应的纯策略共同出现的结果,根据概率论知识,交事件的概率就等于相应事件概率之积(两个事件相互独立);同时,在混合策略条件下,对策值也完全是一个随机变量,而根据数学期望的定义,随机变量的期望就等于每一随机变量与其相应概率之积的代数和。
由于矩阵对策的混合策略并不唯一,因此如何找到最优混合策略是一个重要问题。2023/2/423定义8.3设p,q分别为局中人Ⅰ和局中人Ⅱ的任一混合策略,若存在局中人Ⅰ的某个混合策略*p和局中人Ⅱ的某个混合策略*q,使下式成立则称GV为对策的值,*p和*q分别称作局中人Ⅰ和Ⅱ的最优混合策略,(*p,*q)称作该混合对策的解。这一定义是容易理解的。因为这里对策的原则仍然是“从最不利的状态出发选择最好的策略”,这样对于局中人Ⅰ来说,对他最不利的状态就是,局中人Ⅱ总是力图使他自己的损失最小化,
也就是说,而对于局中人Ⅱ来说,他所面临的最不利的状态就是,局中人Ⅰ总是力图使他自己的赢得或对手的损失最大化,也就是说,),(max),(*qpEqpEPpÎ=2023/2/424所以,定义8.3中的等式实际也等价于下面的等式:GPpQqQqPpVqpEqpE==ÎÎÎÎ),(maxmin),(minmax定理8.2
矩阵对策G在混合策略意义下有解的充要条件是:存在混合策略*p∈P,*q∈Q,使得对于任意的p∈P和q∈Q:),(),(),(****qpEqpEqpE££这一条件与定义8.3中的等式是完全等价的。它说明,如果局中人Ⅱ采用自己的最优策略,而Ⅰ不采用最优策略,Ⅰ的赢得将会减少(小于双方都采用最优策略时的所得);如果局中人Ⅰ采用自己的最优策略,而Ⅱ不采用最优策略,Ⅱ的损失将会更大(大于双方都采用最优策略时的损失)。由于定理8.2的条件与定义8.3中的等式等价,因此显然有:****),(qApqpEVG==或者:2023/2/4258.2.3矩阵对策的基本性质和特点为了说明矩阵对策的基本性质,我们先来讨论对策中一方出混合策略另一方出纯策略的情况。如用)(,qaEi表示局中人Ⅰ取纯策略
ia而局中人Ⅱ取混合策略q时的期望赢得,用),(jbpE表示局中人Ⅱ取纯策略jb而局中人Ⅰ取混合策略p时的期望赢得,于是根据期望赢得的公式,应有:å=jjijiqaqaE),(iiijjpabpEå=),(这是因为,纯策略实际上是混合策略的一个特殊情形。如对于局中人Ⅰ,纯策略ka就等价于混合策略),...,,(21mpppp=,其中îíì¹==时(即pk为1,其余的为0)当时当kikipi012023/2/426于是,混合策略的期望赢得E(p,q)可表示为:iiiiijjijjijiijpqaEpqaqpaqpE),()(),(ååååå===或者jjjjjiiijqbpEqpaqpE),()(),(ååå==据此,即可给出与定理8.2等价的另一个定理即定理8.3。定理8.3设QqPpÎÎ**,,则),(**qp为对策G的解的充要条件是:对于任意的i和j(i=1,2,…,m;j=1,2,…,n),有),(),(),(****jibpEqpEqaE££也就是:
21VVVG££有了定理8.3
,我们就可以很容易提出定理8.4
。定理8.4:设QqPpÎÎ**,,则),(**qp为对策G的解的充要条件是:存在数V,使得*p和分别为不等式组(定理8.3和定理8.4给出了无鞍点矩阵对策的两个基本性质。)2023/2/427(Ⅰ)
=³==³ååmippnjVpaiiiiiij,...,2,101,...,2,1和不等式组(Ⅱ)
ïïîïïíì=³==£åånjqqmiVqajjjjjij,...,2,101,...,2,1的解,且使GVV=定理8.4的提出,就把对策问题与线性规划紧密地联系起来了。这是不难理解的,因为根据21VVVG££,要想得到对策的最优解),(**qp,实际就是要找到如下两个线性规划问题的最优可行解:首先,对局中人II来说,就是要在p给定的条件下,使得:2023/2/428(P)
ïïîïïíì=³==³ååmippnjVpatsViiiiiij,...,2,101,...2,1..min对于局中人I,就是要在q给定的条件下,使得:(D)
³==£åå01,...,2,1..maxjjjjjijqqmiWqatsW容易证明,问题(P)和(D)是互为对偶的线性规划问题,且有:jjmaVEp1min,)0,...,0,0,1(=Î=inTaWEqi1max,)0,...,0,0,1(=Î=j=1,2,…,n2023/2/429分别为(P)和(D)的一个可行解。根据线性规划的对偶原理知道,则问题,(P)和(D)一定存在最优解*p和*q定理8.6
设(**,qp)是矩阵对策G的解,GV是对策的值,则有:(1)若*ip>0,GjjijVqa=å*(2)若*jq>0,则*iiijpaå=GV(3)若*jjijqaå<GV,则0*=ip(4)若GiiijVpa>å*,则0*=jq则,且最优值相等.从而有:定理8.5(矩阵对策基本定理)任一矩阵对策,一定存在混合策略意义下的解.2023/2/430证:
由于1*Vqajjij=å,故必有:
0*³-åjjGaijqV两端同乘1*=åiip,有`:åiip*(0)***=-=-åååjiijijGijijGqpaVqaV所以,当*,,0jjijG*iqaVpå=>必有时当0*,*=<åiGjjijpVqa必有于是(1)和(3)得证。同理可证(2)和(4)。定理8.7
设有两个矩阵对策);,(1211ASSG=和),,(2212ASSG=,其中)(1ijaA=,)(2kaAij+=,k为任意常数,则有:2023/2/431(1)kVVGG+=12(2)
T()()21GTG=(式中T(G)表示矩阵对策G的解集).定理8.8设有两个矩阵对策)(,2,11ASSG=)和其中0>l为一任意常数,则:(1)12GGVVl=(2)T()()12GTG=2023/2/4328.3.1公式法
当矩阵对策中的两个局中人分别只有两个纯策略时,局中人Ⅰ的赢
得矩阵可记为:
úûùêëé=dcbaA
如果A中不存在鞍点,则不难证明,各局中人的最优混合策略中的
*ip和*jq均大于零。于是根据定理8.6和定理8.4可知,最优混合策略可
由下列等式组求出:
ïîïíì=+=+=+1212121ppVdpbpVcpap
ïîïíì=+=+=+1212121qqVdqcqVbqaq
应用行列式解法解这两个三元一次线性方程组,即可得到相应的非
负解为:
8.3矩阵对策的解法2023/2/433ebapecdp-=-=*2*1ecaqebdq-=-=*2*1ebcadV-=其中:
e=(a+d)-(b+c)
课堂练习:利用公式法解第一节中提出的曹操的去路问题
Tqp)3518,3517()3519,3516(**==3.2716350800»==V计算结果表明,双方均应稍稍偏重于“大路伏兵”和“走大路”方案。V3.2»说明,总的情况对诸葛亮一方有利,这是符合当时的实际情
况的。但是实际上,诸葛亮采取了“伏兵小路”的策略,
冤家路窄,曹操
也走了小路。这在混合策略意义下是完全可以理解的。
解例8.2,有:因其赢得矩阵中没有鞍点,故只能取混合策略,运用公式法求解得到:2023/2/434实际应用中,公式法可变通为:
将列相减后换位作为局中人I的混合策略中的混合比;将行相减后换位作为局中人II的混合策略中的混合比。
相减时的差值只考虑绝对值不考虑正负号,同时注意约简。如,在曹操的去路问题中:对诸葛一方:100-(-90)=190;|-80-80|=160
所以,诸葛一方二策略的混合比应为:16:19
对曹操一方:100-(-80)=180;-90-80=170
所以,曹操一方二策略的混合比应为:17:18
而对策的值则可以用局中人I的混合比对某一列或用局中人II的混合比对某一行进行加权平均取得。如在上例中:2023/2/435
也还可以这样考虑。由于不存在最优的纯策略,因此每一个局中人合乎逻辑的考虑便是,我的最优混合策略的选择,应该使得对手不能从任何纯策略中获得额外利益,即使得对手只能从不同的纯策略中获得相等的利益。以无鞍点的谈话对策为例。
结果表明:谈话人应以较小的概率(1/6)选择“谈”,而以较大的概率(5/6)选择“不谈”,即仍然是“沉默是金”。而对于管理当局来说,则是以较小的概率(5/12)选择“反应好”,而以较大的概率(7/12)选择“反应不好”,结论也仍然是“人总是把赞美留给自己”。【解】设p1=p,p2=1-p,则有:
5p-2(1-p)=-5p
解之p1=p=1/6,p2=5/6
同理,设q1=q,q2=1-q,则有:
5q-5(1-q)=-2q
解之q1=q=5/12,p2=7/122023/2/4368.3.2既约矩阵及其行列式解法所谓的既约矩阵,即不存在优超现象的矩阵。优超现象是指这样一种现象,即在一个给定的矩阵中,存在某一行或某一列与另一行或另一列相比要优(大于等于或小于等于)的现象。在存在优超现象的情况下,如果甲策略优超于乙策略,则甲策略就称作优势策略,乙策略就称作劣势策略。如在下面的矩阵A中:
显然,第4行优超于第1行,第3行优超于第1行和第2行,故可划去第1和第2行,得到:
在A1中,第1列优超于第3列,第2列优超于第4列和第5列,因此划去第3、4、5列,得到:2023/2/437
显然,第1行仍优超于第3行,划去第3行得:解之,得到:
有鞍点的矩阵对策一般都存在着明显的优超现象。请同学们试着检查“招揽乘客问题”、“差旅问题”和例8.1是否存在优超现象。
划去劣势策略的过程通常也称作非既约矩阵的约简2023/2/438
对于一个既约方阵通常通常可采用行列式解法求解,以3×3的矩阵对策为例。
如有对策
G=(s1,s2;A),其中:
先求局中人I的混合策略。可先用第1列减第2列,第2列减第3列(也可以用第3列减第2列,第2列减第1列。想一想,为什么),得到:其次,求策略a1的混合比频数。可先划去第1行,计算余下的方阵的行列式的值:1×10-2×2=6;再依次划去第二行、第三行求a2、a3的混合比频数分别为:6和48(行列式的值不计符号),即各个策略的混合比为:1:1:8。A既无鞍点,也不存在优超现象,属既约矩阵故可用行列式解法求解。2023/2/439
再求局中人II的混合策略。用第1行减第2行,第2行减第3行(当然,也可以用第3行减第2行,第2行减第1行。想一想,为什么),得到:
应用类似的方法,可得到三种策略的混合比为:19:7:4。课堂练习:请同学们试着用行列式解法求出“石头剪刀布”游戏的解。(Clicktoshowanswer)p=(1/3,1/3,1/3)q
=(1/3,1/3,1/3)2023/2/4408.3.3图解法
图解法运用于赢得矩阵为2×n或m×2阶的矩阵对策,它不仅提供了
一个简单直观的解法,而且通过它可以使我们从几何上理解对策论的思想。
我们先以2×3阶的赢得矩阵为例进行讨论。
)()(232221131211
2×3aaaaaaaAij==对于一个既约的矩阵A,应用图解法,可按如下步骤进行:(一)取直角坐标系画线。假定局中人Ⅰ取混合策略(p,1-p),局中人Ⅱ取
纯策略1b,2b和3b,于是根据公式å=iiijjpabpE),(,有:
设2×3阶的赢得矩阵为:2023/2/4本课件的所有权属于熊义杰41不难看出,21a,22a和23a分别为1b,2b和3b在纵轴E上的截距,
而)(2111aa-,)(2212aa-和)-(2313aa则分别为三条直线的斜率。同时,
由于p∈[0,1],所以在坐标系(P,E)中p=1处可再加一条垂线以反映斜率。
例8.3
求解矩阵对策G=(S1,S2;A),其中:2571132=A
解:用图解法可描图如图8.2
图8.2pEoV2023/2/442(二)
找出直线1b,2b和3b在区间[0,1]上的最小交点,并将连成的折线
以下部分涂上阴影。(想一想:为什么?)
(三)
找出折线上所有交点中纵坐标值最大者,如例8.3中V。解形成该交
点的二直线所组成的方程组,即可得到*p和E即GV之值。
对例8.3即方程组:
îíì+=-=pEpE9225得îíì==1149113Ep
所以局中人Ⅰ的最优策略是)118,113(*=p
(四)
应用定理8.5求解局中人Ⅱ的最优混合策略。
由图8.2不难看出,局中人Ⅱ的最优混合对策只能由2b和3b组成。事
实上,由于GVbpE=>=×+×=1149116211871132),(1*,根据定理8.5(4),
必有0*1=q。又因0118,0113*2*1>=>=pp,根据定理8.5(1)必有:
2023/2/443
ïïïîïïïíì=+=+=+11149251149113323232qqqqqq
解得(代入法):
ççççèæ=1121190*q
下面讨论赢得矩阵为3×2阶时的图解法。其应用步骤与2×3阶的赢
得矩阵完全相同,只是具体做法不同罢了。先假定赢得矩阵为:
çççèæ==×32312221121123)(aaaaaaaAij
2023/2/4本课件的所有权属于熊义杰44第一步,取直角坐标系画线。假定局中人Ⅱ取混合策略(q,1-q),局中
人Ⅰ随机地取纯策略1a,2a和3a,于是根据公式jjijiqaqaEå=),(,有:
这时,显然12a,22a和32a分别是直线1a,2a和3a在纵轴E上的截
矩,而)(1211aa-,)(2221aa-和)(3231aa-分别为三条直线的斜率。
例8.4
求解矩阵对策);,(21ASSG=,其中çççèæ=1114660A
显然,A是既约矩阵。2023/2/445解:用图解法可描图如图8.3
E
q
第二步,找出直线1a,2a和3a在区间[0,1]上的最大交点,并将连成
的折线以上部分涂上阴影。(想一想:为什么?)
第三步,找出折线上所有交点中纵坐标值最小者,在例8.4中是V点,
解形成该交点的二直线所组成的方程组,即可得到*q和E即GV的值。
对例8.4解方程组:
qEqE2466+=-=
得:ïîïíì==21441Eq
图8.3V2023/2/446所以局中人Ⅱ的最优混合策略是øöççèæ=4341*q第四步,求局中人Ⅰ的最优混合策略。
由于GVqaE=<=×+×==2142134314111),(*3
所以根据定理8.5(3),
必有;同时由于041*1>=q,
043*2>=q根据定理8.5(2)
有:
ïïïîïïïíì=+=+=+129462960212121pppppp
解得)0,43,41(*=p
2023/2/447课堂练习:试用图解法解矩阵对策:G=(S1,S2;A),其中:(Clicktoshowanswer)局中人II:局中人I:纯策略a22023/2/4488.3.4
方程组解法
由定理8.4知道,求矩阵对策的解),(**qp的问题,等价于求解其中
的两个不等式组;又由定理8.5知道,如果最优策略中的*ip和*jq均不为
零,则这两个不等式组就可以转化为如下的两个方程组:
===ååiiiiijpnjVpa1,...,2,1
ïîïíì===ååjjjjijqmiVqa1,...,2,1
如果这两个方程有非负解*p和*q,则求解结束,如不存非负解,则
需要视具体情况将其中的某些等式改为不等式,进行试算,直到求得满意
的解。这种方法应用的前提是事先假定了*ip和*jq均不为零,因此当最优
策略的某些分量实际为零时,该方法失效。
对于一些特殊的矩阵对策问题,可以用方程组方法求解。2023/2/449例8.5求解矩阵对策“齐王赛马”
解:已知齐王的赢得矩阵A中没有鞍点,对齐王和田忌来说都不存
在最优纯策略。另从矩阵中各行和各列的元素看,各种策略的赢得和支付
差别不大,因此每个局中人选用其策略集中任一策略的可能性都是有的,
故可事先假定),...,2,1(0*6ipi=>和),...,2,1(0*6jqj=>,于是,求解
方程组
(Ⅰ)ïïïïîïïïïíì=+++++=+++++-=++++-=-++++=+-+++=+++-+=++-++1ppppppVppppppVppppppVppppppVppppppVppppppVpppppp654321654321654321654321654321654321654321333333
和方程组
2023/2/450(Ⅱ)ïïïïîïïïïíì=+++++=++-++=+++-+=+++++-=++++-=+-+++=-++++1333333654321654321654321654321654321654321654321qqqqqqVqqqqqqVqqqqqqVqqqqqqVqqqqqqVqqqqqqVqqqqqq
可先将两个方程组中前6式相加,得到:
VqqqqqqVpppppp6)(66)(6654321654321=+++++=+++++
因括号中的和均为1,故可求得V=1
将V=1代入前6式,再由前6式分别减掉第7式,可得
532641,pppppp====
2023/2/451令第一式左端等于第二式左端,可得:
4321,pppp==。于是由第7式,得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 淮阴师范学院《解析几何》2021-2022学年第一学期期末试卷
- 淮阴师范学院《政治哲学》2023-2024学年第一学期期末试卷
- 淮阴师范学院《西方音乐史专题研究》2022-2023学年第一学期期末试卷
- 课件怎样播放教学课件
- 淮阴师范学院《普通生态学》2023-2024学年第一学期期末试卷
- 淮阴工学院《研究方法与论文写作》2022-2023学年第一学期期末试卷
- DB4420T+54-2024《企业商业秘密保护管理规范》
- DB2310-T 151-2024珍珠梅播种育苗技术规程
- 2020年科普知识竞赛题库及答案(完整版)
- 公共设施管理的城市景观规划考核试卷
- 船用柴油机的发展与分类课件
- 初中生物试验小组活动记录
- 子宫正常解剖及超声图像课件
- 基础工程施工月进度计划表
- 《学前教育专业导论》课程教学大纲
- 华侨城战略分析课件
- 电梯维修维保方案
- 造口及相关护理-PPT课件
- 大班社会《环保小卫士》课件
- 小学语文中国古典名著解读课件:西游记
- 报废机动车拆解有限公司应急预案
评论
0/150
提交评论