对策论运筹学讲义_第1页
对策论运筹学讲义_第2页
对策论运筹学讲义_第3页
对策论运筹学讲义_第4页
对策论运筹学讲义_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对策论运筹学讲义第一页,共六十五页,2022年,8月28日对策论或博弈论(GameTheory)是研究具有对抗和竞争性行为问题的数学理论与方法。是运筹学的重要分支学科经济学领域一般称博弈论,是经济学领域近几十年发展起来一门新兴学科对策论从理论上作严格的讨论却起始于二十世纪:1912年,德国数学家E.Zermelo证明了国际象棋的3种着法必定存在一种;1921年,法国数学家E.Borel引入了“最优策略”等概念;1928年,美籍匈牙利人J.VonNeumann证明了对策论的基本定理----最大值最小值定理;1944年,VonNeumann和O.Morgenstern合写了《对策论与经济行为》一书,建立起对策论的基本理论,奠定了对策论研究的基础。第二页,共六十五页,2022年,8月28日对策问题举例例1猜单和猜双的博弈。两个人同时出一个指头或两个指头,如果两人出的指头相同,则局中人1从局中人2处赢得五元;如果出的不一样,局中人1就要支付给局中人2五元。两个对手都可以采取两个策略:出一个手指和出两个手指,下表是局中人1的赢得矩阵(二指莫拉问题)策略局中人2出1指出2指局中人1出1指5-5出2指-55局中人1从局中人2该如何选择策略,已获得利益?第三页,共六十五页,2022年,8月28日例2囚徒困境。两个嫌疑犯作案后被警察抓住,分别被关在不同的屋子里审讯。警察告诉他们:如果两人都坦白,各判刑8年;如果两人都抵赖,由于证据不充分,两人将各判刑2年;如果其中一人坦白,,另一人抵赖,则坦白者立即释放,抵赖者判刑10年。在这个例子中两人嫌疑犯都有两种策略:坦白或抵赖。可以用一个矩阵表示两个嫌疑犯的策略的损益策略囚徒2坦白抵赖囚徒1坦白(-8,-8)(0,-10)抵赖(-10,0)(-2,-2)囚徒该如何选择策略?囚徒困境反映了个人理性和集体理性的矛盾。对于双方,(抵赖,抵赖)的结果是最好的,但因为每个囚徒都是理性人,他们追求自身效应的最大化,结果就变成了(坦白,坦白)。个人理性导致了集体不理性第四页,共六十五页,2022年,8月28日例3田忌与齐王赛马

战国时期,齐威王与大将田忌赛马,双方约定:从各自的上、中、下三个等级的马中各选一匹马出场比赛,负者要付给胜者一千金。已知田忌的马要比齐王同一等级的马差一些,但比齐王等级较低的马却要强一些。因此,如用同等级的马对抗,田忌必连输三场,失三千金无疑。田忌的谋士孙膑给田忌出了个主意:每局比赛前先了解齐王参赛马的等级,再采用下等马对齐王上等马、中等马对齐王下等马、上等马对齐王中等马的策略。比赛结果,田忌二胜一负,反而赢得一千金。由此可见,双方各采取什么样的出马次序对胜负至关重要。第五页,共六十五页,2022年,8月28日“齐王赛马”齐王在各局势中的益损值表(单位:千金)齐王和田忌可以任意选择三匹马出场的顺序第六页,共六十五页,2022年,8月28日§1

对策论的基本概念对策模型的三个基本要素:1.局中人(Players):参与对抗的各方;2.策略集(Strategices):局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集3.一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值。

赢得函数(payofffunction):定义在局势上,取值为相应益损值的函数4.

纳什均衡:纳什均衡指所有局中人最优策略组成的一种局势,既在给定其他局中人策略的情况下,没有任何局中人有积极性去选择其他策略第七页,共六十五页,2022年,8月28日对策的分类对策按对策方式合作对策非合作对策完全理性有限理性两人对策零和对策非零和对策多人对策结盟对策不结盟对策按对策人数静态对策完全信息静态对策不完全信息静态对策动态对策完全信息动态对策不完全信息动态对策按对策状态第八页,共六十五页,2022年,8月28日二人有限零和对策(又称矩阵对策):局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零。通常将矩阵对策记为:G={S1,S2,A}局中人甲的策略集:局中人乙的策略集:甲的赢得矩阵:

矩阵对策aij为局中人甲在局势下的赢得第九页,共六十五页,2022年,8月28日其中:齐王的策略集:S1={1,2,3,4,5,6},田忌的策略集:S2={1,2,3,4,5,6}。下面矩阵称齐王的赢得矩阵:

3111-1113111-1A=1-13111-111311111-13111-1113“齐王赛马”是一个矩阵策略。第十页,共六十五页,2022年,8月28日§2

矩阵对策的最优纯策略例4

甲、乙两队进行球赛,双方各可排出三种不同的阵容。设甲队为局中人Ⅰ,乙队为局中人Ⅱ,每一种阵容为一个策略,有S1={α1,α2,α3},S2

={β1,β2,β3}。根据以往两队比赛的记录,甲队得分情况的赢得矩阵为问:这次比赛中,双方应如何对阵?第十一页,共六十五页,2022年,8月28日在如此反复对策的过程中,各局中人如果不想冒险,就应该考虑从自身可能出现的最坏情况下着眼,去选择一种尽可能好的结果,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据。这就是所谓“理智行为”。称为最小最大准则,按照这个各方均避免冒险的观念,就形成如下的推演过程。解

从A中可以看出,Ⅰ最多可得6分。于是,Ⅰ为得6分而选α2

。但是Ⅱ推测Ⅰ会有此心理,从而选β3来对付,使得Ⅰ非但得不到6分,反而要失去3分。当然Ⅰ也会料到Ⅱ会有此心理,从而改选α3

,以使Ⅱ欲得3分而反失4分。第十二页,共六十五页,2022年,8月28日矩阵A中每行的最小元素分别为1,-3,-5。

在这些最少赢得中最好的结果是1,故局中人Ⅰ会采取策略1,无论对手采取何策略,局中人Ⅰ至少得1分。对于局中人Ⅱ,{1,2,3}可能带来的最少赢得,即A中每列的最大元素,分别为6,1,4。局中人Ⅱ会采取2策略,确保局中人Ⅰ不会超过1分。1和2分别称为局中人Ⅰ、Ⅱ的最优策略。由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略。§2

矩阵对策的最优纯策略Min1-3-56Max14123123第十三页,共六十五页,2022年,8月28日定义1设有矩阵对策G={S1,S2;A},其中,

A=[aij]m×n

,若有则局势

(αi*

,βj*)

称为G在纯策略意义下的解,也称为G的鞍点;αi*

、βj*分别称为局中人Ⅰ和Ⅱ的最优纯策略;v称为G的值,也称对策值。

对于例4,G的解(鞍点)为(α1,β2),α1

、β2分别为Ⅰ、Ⅱ的最优策略。对策值v=1>0,反映优势在Ⅰ方(对Ⅰ有利);若v<0,则优势在Ⅱ方(对Ⅱ有利)

;当v=0时,称为公平对策。第十四页,共六十五页,2022年,8月28日矩阵对策有解的条件现在,讨论矩阵对策在纯策略意义下有解的充分必要条件。定理1

设G={S1,S2

;A},其中,,A=[a

ij]m×n

,G在纯策略意义下有解的充要条件是:存在纯局势(αi*

,βj*)

,使得对一切i(i=1,…,m)和j(j=1,…,n)有证先证充分性设对任意i和j,均有又因为i*行最小元,j*列中最大元i*行最小元1

行最小元第十五页,共六十五页,2022年,8月28日另一方面(P209引理),对于任意i和j有

综合(1)和(2)式,有所以,G在纯策略意义下有解i行中最小元j列中最大元

所以有从每列最大元中取最小元第十六页,共六十五页,2022年,8月28日证明必要性设G在纯策略意义下有解,即成立因在i=i*

时达到最大,即

在j=j*

时达到最小,即同样定理1说明了G在纯策略意义下有解的充分必要条件是:A中存在这样一个元素,既是所在行的最小元素,也是所在列的最大元素。换言之,有纯策略解与存在鞍点等价,这正是VonNeumann当年所证明的。这个著名结论所体现的基本理性思想,就是:“做最坏的打算,寻求最好的结果”。第十七页,共六十五页,2022年,8月28日例5已知矩阵对策G,其中:问:G是否存在鞍点?解因不符合鞍点条件,故G的鞍点不存在。但是否每个矩阵对策一定存在鞍点呢?回答是否定的。现在考察下例。例6

求解矩阵对策,其中:解容易得到由此可见,G的解可以不唯一,但G的值必是唯一的。第十八页,共六十五页,2022年,8月28日定义2

设有矩阵对策G={S1,S2;A},其中:

A=[aij]m×n

,概率向量当矩阵对策G在纯策略意义下无解时,由于不存在鞍点,即不存在平衡局势,各局中人的决策总有一定的风险。因此,无理由只取某个策略而舍弃其余策略,也就是局中人应考虑,按照预先确定的一组概率来选取其所有可能采用的策略。§3矩阵对策的混合策略分别称X,Y为局中人Ⅰ和Ⅱ的“混合策略”。向量组

(X,Y)

称为混合局势。数学期望称为局中人Ⅰ的赢得。(4)第十九页,共六十五页,2022年,8月28日X、Y的全体分别构成Ⅰ、Ⅱ的混合策略集,记作称

为G的混合扩充。纯策略对策是混合策略对策的特例,此时,概率向量为单位向量。一个混合策略可理解为:如果进行多次对策G的话,局中人Ⅰ分别选取纯策略α1,α2,…,αm采的频率。如果只进行一次对策,则反映局中人Ⅰ对各种纯策略的偏好程度。第二十页,共六十五页,2022年,8月28日例7掷硬币投注的对策两个局中人之间开展有裁判的掷硬币游戏,无论出现正面还是反面,裁判将结果告诉局中人甲,局中人甲看完结果后,有两种选择:(1)放弃投注并支付给局中人乙5美元。如果局中人甲放弃,游戏就结束了。但如果局中人甲投注(beton),游戏继续,这时局中人乙也有两种选择:(1)放弃投注并支付5美元给局中人甲;(2)跟着下注。如果局中人乙选择下注,裁判将投币结果展示给乙看,如果是正面,局中人乙支付10美元给局中人甲;如果是反面,则局中人甲支付给局中人乙10美元。(1)试写出对策中各局中人的策略集(2)建立局中人甲的赢得矩阵(3)判断对策是否存在鞍点(4)求解此矩阵对策第二十一页,共六十五页,2022年,8月28日解(1)分析对策双方可能采取的策略情况,投币的情况有两种可能,甲根据看到情况做出反映,乙根据甲的的选择做出反映。对于局中人甲,可能的策略有4个,每个都是他对裁判给他看的硬币出现正、反面两种结果后分别做出的反映:(1)局中人甲在任何情况下放弃投注;(2)局中人甲在任何情况下均投注;(3)硬币出现正面时投注,出现反面时放弃投注;(4)硬币出现反面时投注,出现正面时放弃投注,分别将四种策略记为:α1,α2,α3,α4。局中人乙有两个策略:(1)放弃投注和(2)跟着下注,分别记为β1,β2(2)当局中人甲选择α1时,他的赢得均为-5。

当甲选择α2时,如果乙选择β1,由于出现正面和反面的概率均为1/2,则甲赢得:1/2×5+1/2×5=

5;▲甲选α2而乙选择β2,这时出现正面,甲赢得10,如果反面,则甲赢得-10,出现正面和反面的概率均为1/2,所以甲的赢得为:1/2×10+1/2×(-10)=0第二十二页,共六十五页,2022年,8月28日(2)当甲选择α3时,如果乙选择β1

。甲出现反面时放弃投注,收益为-5,甲出现正面时投注,甲获得5,出现正反面的概率均为1/2,故甲赢得为

1/2×5+1/2×(-5)=0

▲当甲选择α3时,如果乙选择β2,甲放弃时,赢得-5;甲投注时,硬币正面,甲赢得10,甲赢得为:

1/2×10+1/2×(-5)=2.5

当甲选择α4时,如果乙选择β1,甲放弃时,赢得-5;

甲投注时,赢得5,出现正反面的概率均为1/2,故甲赢得为1/2×(-5)+1/2×5=0

▲甲选择α4时,如果乙选择β2,甲放弃时,赢得-5;甲投注时,赢得-10,出现正面和反面的概率均为1/2,所以甲1/2××(-5)+1/2×(-10)=-7.5第二十三页,共六十五页,2022年,8月28日局中人甲局中人乙β1,β2α1-5-5α250α302.5α40-7.5甲的赢得矩阵为Min-500-7.5Max52.5(3)不存在鞍点(4)后面介绍求解第二十四页,共六十五页,2022年,8月28日定义3

设是矩阵对策G={S1,S2;A}的混合扩充,如果则称vG为对策G*的值,使上式成立的(X*,Y*)为G在混合意义下的解(纳什均衡),称X*和Y*分别为局中人Ⅰ和Ⅱ的最优混合策略。当局中人Ⅰ取混合策略X,局中人Ⅱ将选用混合策略,使得故Ⅰ应选取X*,使赢得至少为同理当Ⅱ取混合策略Y,局中人将选用混合策略,使得故Ⅱ应选取Y*,使支付至多为(5)第二十五页,共六十五页,2022年,8月28日定理2

矩阵对策G={S1,S2;A}在混合策略意义下有解的充分必要条件为:存在混合局势(X*,Y*),使得对一切X∈S1*

和Y∈S2*,有E(X,Y*)≤E(X*,Y*)≤E(X*,Y)

(X*,Y*)

即为对策G解,且vG=E(X*,Y*)。定理2的证明与定理1相似,只需把aij

换成E(X,Y)例8考虑例5的矩阵对策G={S1,S2;A}在混合意义下的解解,设和分别为局中人Ⅰ和Ⅱ的混合策略则(6)第二十六页,共六十五页,2022年,8月28日

矩阵对策的基本定理先给出两个记号:当局中人Ⅰ取纯策略αi

时的赢得值为

(矩阵A第i行乘以Y)

当局中人Ⅱ取纯策略βj

时的赢得值为

(X乘以矩阵A第j列)

取时,E(X*,Y*)=E(X,Y*)=E(X*,Y)=。E(X,Y*)≤E(X*,Y*)≤E(X*,Y)。根据定理2

和分别局中人Ⅰ和Ⅱ的最优策略,对策值vG=E(X*,Y*)=ij第二十七页,共六十五页,2022年,8月28日则有定理3

设X*∈S1*,Y*∈S2*,则(X*,Y*)是对策G在混合意义下解的充要条件是:对任意i=1,…,m和j=1,…,n,有

E(i,Y*)≤E(X*,Y*)≤E(X*,j)

证明设(X*,Y*)是对策G的解,则由定理2,(6)式成立,由于纯策略是混合策略的特例,故(8)式成立。反之,设(8)式成立,由(7)(8)(6)式成立,由定理2,(X*,Y*)是对策G的解第二十八页,共六十五页,2022年,8月28日定理4

设X*∈S1*,Y*∈S2*,则(X*,Y*)是对策G在混合意义解的充要条件是:存在数v,使得X*和Y*分别是不等式组Ⅱ取任意纯策略βj

时的赢得值E(X,j)Ⅰ取任意纯策略αi

时的赢得值E(i,Y)第二十九页,共六十五页,2022年,8月28日定理4证明略其实必要性显然,取v=E(X*,Y*)即可充分性考虑可推出E(i,Y*)≤E(X*,Y*)≤E(X*,j)

第三十页,共六十五页,2022年,8月28日定理5

任对一矩阵对策G={S1,S2;A},一定存在混合策略意义下的解。证明可见胡运权《运筹学教程》P396在证明过程中,构造两个对偶的线性规划,两个线性规划的最优解为(X*,w*)和(Y*,v*),且满足w*=v*,则可推出(X*,Y*)为对策G的解,

w*=v*=E(X*,Y*)为对策的值第三十一页,共六十五页,2022年,8月28日定理6

设(X*,Y*)是矩阵对策G的解,v

=vG,则记T(G)为矩阵对策G的解集定理7设有两个矩阵对策G1={S1,S2;A1},G2={S1,S2;A2},其中A1=(aij),A2=(aij+L),L为一常数。则

(1)(2)T(G1)=T(G2)Ⅱ取纯策略βj

时的赢得值E(X*,j)Ⅰ取纯策略αi

时的赢得值E(i,Y*

)第三十二页,共六十五页,2022年,8月28日定理8设有两个矩阵对策G1={S1,S2;A},G2={S1,S2;αA},其中α>0,为任一常数。则

(1)(2)T(G1)=T(G2)定理9设G={S1,S2;A}为一矩阵对策,且A=-AT为斜对称矩阵,称这样的对策为对称对策,则

(1)vG=0(2)T1(G)=T2(G)其中T1(G)和T2(G)分别为局中人Ⅰ和Ⅱ的最优策略集定理7和8可以用来简化矩阵中的元素数字,使得以后的求解更为方便。第三十三页,共六十五页,2022年,8月28日矩阵对策的解法

1优超原则法

设有矩阵对策G={S1,S2;A},其中:

A=[aij]m×n

,如果对一切j=1,…,n,都有即矩阵的第行元素均不小于行的元素,则称局中人Ⅰ的纯策略优超于纯策略;同样,若对于一切i=1,…,m,有,即矩阵的第列均不大于列的元素,则称局中人Ⅱ的纯策略优超于纯策略第三十四页,共六十五页,2022年,8月28日当局中人Ⅰ的纯策略优超于纯策略时,局中人Ⅰ采用策略超过采用策略;当称局中人Ⅱ的纯策略优超于纯策时,局中人Ⅱ采用纯策略超过采用纯策略。在求解矩阵对策时,如果出现上述优超情况,可将矩阵A的第行删除;当Ⅱ的纯策略优超于纯策时,可以将矩阵A第列删除。优超原则可以缩小了A的规模,使计算简化。一般情况下,优超原理只是一种降阶技术,但如精简之后,A中的剩余元素仅有一个,则意味着已求得了对策的鞍点。第三十五页,共六十五页,2022年,8月28日

例9

求解矩阵对策,其中:解查视各列,发现可划去第1列,得查视各行,发现可划去第3行,得查视各行列,知已无法继续优超,故原矩阵A被简化为2×2规模。第三十六页,共六十五页,2022年,8月28日二、2×2公式解法设矩阵对策中的A为若无鞍点,则X*与Y*中各分量必不为零(否则,假定,则,局中人Ⅰ选择纯策略α1,局中人Ⅱ选择中最小元素对应的策略,即对策存在有鞍点)。由定理6的(3)、(4),得第三十七页,共六十五页,2022年,8月28日二、2×2公式解法求解后,得:(11)第三十八页,共六十五页,2022年,8月28日用2×2求解例5已知矩阵对策G,其中:解G是不存在鞍点用2×2求解例9第三十九页,共六十五页,2022年,8月28日求解例7已知矩阵对策G,其中:解利用优超原理得用公式计算得:矩阵对策的解:X*=(0,1/3,2/3,0)T,Y*=(1/3,2/3)T

vG=5/3第四十页,共六十五页,2022年,8月28日三、2×n和m×2图解法

当对策双方中的某一方策略个数为2,而另一方策略个数大于2时,可以采用图解法来方便地求解这类对策问题。下面通过例子来介绍这种直观的几何方法。用一个例子来看解法例10求解矩阵对策,其中:解显然,G无鞍点且无优超关系。设局中人Ⅰ的混合策略为X=(x1,x2)T=(x,1-x)T,则按“理智行为”,Ⅰ期望的赢得为1.考虑2×n阶矩阵第四十一页,共六十五页,2022年,8月28日在Oxv平面直角坐标系中,x∈[0,1]

画直线段(图10-1):L1

:v

=-8x+9L2

:v=7xL3

:v=15x-2图10-1xvO2468101Cx*DEFL1L2L3第四十二页,共六十五页,2022年,8月28日于是,v=f(x)

的图形就是折线CDEF。因为E点是折线的最高点,所以v=f(x*)。注意到E点是L1与L2的交点,求解得x*=3/5,vG=21/5,Ⅰ的最优混合策略为X*=(3/5,2/5)T。图10-1xvO2468101Cx*DEFL1L2L3设局中人Ⅱ的最优混合策略为Y*=(y1*,y2*,y3*)T,则由定理6知第四十三页,共六十五页,2022年,8月28日图10-1xvO2468101Cx*DEFL1L2L3根据定理6得y3*=0。也可根据E点只与L1、L2有关且此处L3高于E点,即只与β1,β2有关且β3不必考虑,所以,y3*=0,代入上式,可解得

y1*

=7/15,y2*=8/15。于是,Ⅱ的最优混合策略为

Y*=(7/15,8/15,0)T。矩阵对策的解

X*=(3/5,2/5)T,Y*=(7/15,8/15,0)TvG=21/5注意:第四十四页,共六十五页,2022年,8月28日例11求解矩阵对策,其中:解显然,G无鞍点使用优超原理,α1优超α4,删去第4行,将A简化为设局中人Ⅱ的混合策略为Y=(y1,y2)T=(y,1-y)T,则按“理智行为”,Ⅱ期望的赢得为2.考虑m×2阶矩阵第四十五页,共六十五页,2022年,8月28日在Oxv平面直角坐标系中,y∈[0,1]

画直线段(图10-2):L1

:v

=6y-5L2

:v=-8y+4L3

:v=-5y+3图10-2yvO24-61Fy*DECL1L2L3-4-2v=g(y)

的图形就是折线CDEF。因为E点是折线的最低点,所以

v=g(y*)。注意到E点是L1与L3的交点,求解第四十六页,共六十五页,2022年,8月28日图10-2yvO24-61Fy*DECL1L2L3-4-2求解得y*=8/11,v=-7/11,Ⅱ的最优混合策略为Y*=(8/11,3/11)T。设局中人Ⅰ的最优混合策略为:X*=(x1*,x2*,x3*,0)T,y1*>0,y2*>0则由定理6知第四十七页,共六十五页,2022年,8月28日图10-2yvO24-61Fy*DECL1L2L3-4-2矩阵对策的解:

X*=(5/11,0,6/11,0)T

,Y*=(8/11,3/11)T。v

G=-7/11根据定理6得x2*=0。也可根据由于E点只与L1、L3相关,且此处L2低于E点,即只与α1、α3相关且α2不必考虑,所以x2*=0,代入上式,可解得x1*=5/11,x3*=6/11。于是,Ⅰ的最优混合策略为X*=(5/11,0,6/11,0)T。第四十八页,共六十五页,2022年,8月28日

四、线性规划解法(最通用、应用最广的方法)对于前述各种方法全都失效的一般形式的矩阵对策,线性规划解法是最通用的方法,可以求解任一矩阵对策。由定理5知,求解矩阵对策可等价地转化为求解互为对偶的线性规划(P)和(D),故在问题(P)中,令。则问题(P)的约束条件变为:问题(P)等价与线性规划问题()(12)

乘以A第j列第四十九页,共六十五页,2022年,8月28日

四、线性规划解法(最通用、应用最广的方法)同理在问题(D)中,令可知问题(D)等价于线性规划问题()(13)

问题()和()是互为对偶的线性规划,可用单纯形或对偶单纯形法求解,再由变换(12)和(13),即可得到原问题的解和对策值A第i行列乘以第五十页,共六十五页,2022年,8月28日例12

求解矩阵对策,其中:解易知,G无鞍点且无法优超。求解问题可化成线性规划问题迭代后,得规划最优解:

=(1/14,11/196,5/49)T,对偶规划最优解

=(5/49,11/196,1/14)T,最优值z*=45/196,vG

=1/z*=196/45,X*=v=(20/45,11/45,14/45)TY*=v=(14/45,11/45,20/45)T第五十一页,共六十五页,2022年,8月28日例:求解“齐王赛马”问题。已知齐王的赢得矩阵A求得故不存在纯策略问题下的解,可求其混合策略。A中有负元素,可以取k=2,在A的每个元素上加2得到A’如下:§4矩阵对策的混合策略第五十二页,共六十五页,2022年,8月28日

建立对G′={S1,S2,A′}中求甲方最佳策略的线性规划如下:

Minx1+x2+x3+x4+x5+x6s.t.5x1+3x2+3x3+x4+3x5+3x6≥13x1+5x2+x3+3x4+3x5+3x6≥13x1+3x2+5x3+3x4+3x5+x6≥13x1+3x2+3x3+5x4+x5+3x6≥1x1+3x2+3x3+3x4+5x5+3x6≥13x1+x2+3x3+3x4+3x5+5x6≥1

xi≥0,i=1,2,…,6

可解得解为:x1=x4=x5=0,x2=x3=x6=0.111,v′=3,x1′=x4′=x5′=0,x2′=v′x2=x3′=x6′=1/3,即X′*=(0,1/3,1/3,0,0,1/3)T,所以甲的最优策略为作出策略2、3、6的概率都为0.333,而作出1、4、5

的概率为0,此时V′G=V′-2=1。第五十三页,共六十五页,2022年,8月28日

同样可以建立对策G′={S1,S2,A′}中求乙方最佳策略的线性规划如下:

Miny1+y2+y3+y4+y5+y6

约束条件:

5y1+3y2+3y3+3y4+y5+3y6≤13y1+5y2+3y3+3y4+3y5+y6≤13y1+y2+5y3+3y4+3y5+3y6≤1y1+3y2+3y3+5y4+3y5+3y6≤13y1+3y2+3y3+y4+5y5+3y6≤13y1+3y2+y3+3y4+3y5+5y6≤1yi≥0,i=1,2,…,6

可解得解为:

y1=y4=y5=0.111,y2=y3=y6=0,v′=3,y1′=y4′=y5′=1/3,

y2′=y3′=y6′=0,即Y′*=(1/3,0,0,1/3,1/3,0)T。所以田忌的最优混合策略为作出策略1、4、5的概率都为1/3,而作出2,3,6的概率为0,此时VG=VG′-k=1。§4矩阵对策的混合策略第五十四页,共六十五页,2022年,8月28日

齐王赛马问题的对策最优解可简记为X*=(0,1/3,1/3,0,0,1/3)T,Y*=(1/3,0,0,1/3,1/3,0)T,对策值VG=1。例两个局中人进行对策,规则是两人互相独立的各自从1、2、3这三个数字中任意选写一个数字。如果两人所写的数字之和为偶数,则局中人乙支付给局中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,则局中人甲付给局中人乙以数量为此和数的报酬。试求出其最优策略。解:首先计算局中人甲的赢得矩阵如下表:4-56-34-52-341(出1)2(出2)3(出3)3(出3)2(出2)1(出1)甲的赢得甲的策略乙的策略第五十五页,共六十五页,2022年,8月28日即甲的赢得矩阵为A:

可知无纯策略意义的解,下面求其在混合策略下的解。A的各元素都加上6,得到建立线性规划模型如下:

Minx1+x2+x3Maxy1+y2+y31+3x2+10x3≥18y1+3y2+10y3≤13x1+10x2+x3≥13y1+10y2+y3≤110x1+x2+12x3≥110y1+y2+12y3≤1x1,x2,x3≥0y1,y2,y3≥0

§4矩阵对策的混合策略第五十六页,共六十五页,2022年,8月28日得到x1′=0.25,x2′=0.50,x3′=0.25;y1′=0.25,y2′=0.50,y3′=0.25。即此对策的解为X*=(0.25,0.50,0.25)T,Y*=(0.25,0.50,0.25)T。VG=VG′-k=0。§4矩阵对策的混合策略第五十七页,共六十五页,2022年,8月28日例4

甲乙两个企业生产同一种电子产品,甲企业可以采取的策略措施有:(1)降低产品价格;(2)提高产品质量;(3)推出新产品。乙企业考虑采取的策略措施有(1)增加广告费用;(2)增设维修网点,加强售后服务;(3)改进产品性能。由于甲乙两个企业财力有限,都只能采取一个措施。假定这两个企业所占有的市场总份额一定,由于各自采取的措施不同,通过预测今后两个企业的市场占有份额变动情况如下表,试求出这两个企业各自的最优策略。3-58-6510108-121(措施1)2(措施2)3(措施3)3(措施3)2(措施2)1(措施1)§4矩阵对策的混合策略甲的赢得甲的策略乙的策略第五十八页,共六十五页,2022年,8月28日解:易知此对策无纯策略意义下的解。把A的每一个元素加上12,得到A′建立线性规划模型如下:

Minx1+x2+x3Maxy1+y2+y31+20x2≥122y1+6y2+15y3≤16x1+17x2+22x3≥120y1+17y2+7y3≤115x1+7x2+20x3≥122y2+20y3≤1x1,x2,x3≥0y1,y2,y3≥0得到:x1=0.027,x2=0.020,x3=0.023;y1=0.0225,y2=0.0225,y3=0.025。V=14.29。x1′=0.3858,x2′=0.2858,x3′=0.3286;y1′=0.3215,y2′=0.3215,y3′=0.3572。即此对策的解为X*=(0.3858,0.2858,0.3286)T,Y*=(0.3215,0.3215,0.3572)T。VG=VG′-k=2.29。§4矩阵对策的混合策略第五十九页,共六十五页,2022年,8月28日

§5其他类型的对策论简介

在对策论中可以根据不同方式对对策问题进行分类,通常分类的方式有(1)根据局中人的个数,分为二人对策和多人对策;(2)根据各局中人的赢得函数的代数和是否为零,可分为零和对策和非零和对策;(3)根据局中人是否合作,又可分为合作对策和非合作对策;(4)根据局中人的策略集中个数,又分为有限对策和无限对策(或连续对策);(5)也可根据局中人掌握信息的情况及决策选择是否和时间有关可分为完全信息静态对策、完全信息动态对策、非完全信息静态对策及非完全信息动态对策;也可以根据对策模型的数字特征又分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策。本节只对对策论中非合作对策的完全信息对策、多人非合作对策、非零和对策作一个简单的叙述性介绍。第六十页,共六十五页,2022年,8月28日

§5其他类型的对策论简介一、完全信息静态对策该对策是指掌握了参与人的特征、战略空间、支付函数等知识和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论