版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8对策论教学目的与要求通过对本章的学习,使学生对博弈论的产生、发展和研究现状有较全面的了解,对博弈论在现代物流管理中的运用有较全面的认识,掌握博弈论的概念、特点、分类和基本要素,掌握博弈论最基本的矩阵对策模型的建立,掌握矩阵对策的纯策略和混合策略的运用,掌握矩阵对策中图解法和线性规划解法,能够运用博弈论的方法对物流管理问题进行分析、建模并求解。对策论也称游戏理论、竞赛论、博弈论,源自英文“GameTheory”。现广为学术界接受的是博弈论这一名称。作为现代数学的一个新分支和运筹学中的一个重要学科,它主要研究的是决策者在决策主体各方面相互作用的情况下如何进行决策及有关这种决策的均衡问题,其强调的是决策主体各方策略的相互依存性及其最优组合。简单地说就是对方如何行动,而我们又将如何应对。由于它提供了一种研究人类理性行为的通用方法,运用这些方法可以更为清晰完整地分析各种社会经济力量冲突与合作的形势,因此,博弈论在经济学、社会学、心理学、政治学等各类社会科学中得到了广泛运用,对进化生物学和计算机科学等自然科学也产生了重要影响。8对策论教学目的与要求通过对本章的学习,使学生对18对策论8.1对策问题的提出8.2对策论模型8.3矩阵对策的解法◎知识归纳◎习题与思考题8对策论8.1对策问题的提出28.1对策问题的提出8.1.1对策论概述作为一门现代学科,博弈论建立的时间并不长,然而博弈的思想源远流长,博弈现象无处不有。小到棋牌之类的游戏,中到经济生活中的各种交易,大到国家之间的征伐斗争,无不涉及人与人之间的斗智。博弈论的产生正是来自于人类对这种斗智现象的观察与思考。现代博弈论起源于19世纪末20世纪初,二战后发展成为一门完整而丰富的理论学科。学术界一般将其发展历程分为以下几个阶段:(1)萌芽阶段从19世纪末到20世纪30年代可以说是博弈论的萌芽期,表现为学者们对社会经济理论和现实的一些思考,研究者以数学家为主。(2)产生阶段20世纪四五十年代可说是博弈论的体系建立时期。1944年诺依曼和摩根斯坦的巨著《博弈论和经济行为》的出版,标志着博弈论作为一门学科的建立,也被视为数理经济学学科建立的里程碑。巨著出版前后的若干年中,合作博弈理论的研究得到了迅速的发展,提出了各种概念,并在20世纪50年代达到了研究的高峰。不久,库克于1950年定义了“囚徒的困境”,纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章,这两位学者的研究工作,特别是纳什的研究工作奠定了非合作博弈论的基础,所提出的纳什均衡概念,在非合作博弈论中起着核心作用。8.1对策问题的提出8.1.1对策论概述作3(3)发展阶段20世纪60至80年代是博弈论体系的发展壮大时期。一方面,研究的领域从军事战略战术问题推广应用到经济领域;另一方面,研究的内容也不断发展出新。合作博弈理论继续得到充实和丰富,而非合作博弈理论更是发展迅速,成为博弈论研究和应用的主流。(4)成熟阶段20世纪80年代至今是博弈论的完善和应用期。此间博弈论本身发展成为了一个相对完善、内容丰富的理论体系,羽翼已丰的非合作博弈理论在理论研究和实践应用中都占据了主导地位。更重要的是,博弈理论在各种经济学科中都得到了深入的应用,在政治学、生物学、计算机科学、道德哲学、社会学等领域内也产生了重要影响。1994年,纳什、泽尔腾、海萨尼三人因博弈论及其在经济应用方面的突出贡献而荣获诺贝尔经济学奖,1996年诺贝尔经济学奖再度授予了在博弈论研究方面作出突出贡献的维克里和莫里斯。由此,吸引了更多的学者投入到博弈论的研究当中,使得博弈论成为世界范围内的研究热点,博弈论也逐步趋于完善和成熟。2001年,研究博弈论的学者再一次获得诺贝尔经济学奖。美国教授乔治·阿克尔洛夫、迈克尔·斯彭斯和约瑟夫·斯蒂格利茨在20世纪70年代奠定了对充满不对称信息市场进行分析的理论基础,正是由于他们在“对充满不对称信息市场进行分析”领域所做出的重要贡献,而分享了2001年诺贝尔经济学奖。
(3)发展阶段48.1.2对策论在现代物流管理中的运用在现代物流管理实践中,决策者们为了谋求自身的不断发展,保持自身的竞争优势,必须不断地审时度势、不停地进行选择和作出决定,以保证最大限度地降低物流成本、提高物流效率及服务水平。他们的选择和决定会影响到竞争对手的决策结果,同样竞争对手的选择和决定也直接影响着他们的决策结果。也就是说,决策者在决策时必须要考虑到对手的策略,因此,博弈论的思想已完全融入到现代物流管理的每一个环节中。博弈论在现代物流管理中的运用主要有物流项目投资、物流市场竞争对策、物流服务价格策略、物流中心选址、物流运输规划、物流仓储优化等内容。以下仅就本书涉及到的有关博弈论中矩阵对策的例子作简要介绍。(1)物流市场竞争博弈【例8.1】两个竞争对手A公司和B公司,都计划在某一个城市增加产品的销售点,地点可选择安排在城市中心或城市郊区。如果两个对手都决定在城市中心建立销售点,那么每年A公司产品的利润要比B公司产品的利润多10000元;如果两个公司都决定在城市郊区建立销售点,那么A公司产品的利润要比B公司产品的利润要少20000元;如果A公司安排在城市郊区,而B公司安排在城市中心,那么A公司的利润要比B公司的利润多40000元;如果A公司安排在城市中心,而B公司安排在城市郊区,那么A公司的利润要比B公司少30000元。试问各公司安排销售点的最好位置是哪里?在选择自己销售点位置时,不得不考虑对手销售点的选择,因为它对我们的销售会产生很大的影响。最好位置的含义是使双方都能发挥最大的能力,而不是使总销售额达到最高,当然,所谓“最好”在这里也是相对的。此外对位置的选择可以有不同的解释,这就是博弈了。8.1.2对策论在现代物流管理中的运用在现5(2)物流仓储优化策略【例8.2】一仓储供应中心为其下游的一家生产企业供应某种原料。生产企业根据产品订单情况对原料的需求进行分析,分别有淡季、旺季和正常三种情况,在正常情况下需要原料15吨,在淡季和旺季情况下分别需要原料10吨和20吨;而原料的价格与原料市场的需求有关,在淡季、正常、旺季三种情况下,每吨原料的价格分别为100元、150元和200元,已知此时每吨原料的价格为100元。问在生产企业对原料的需求没有确定预知的条件下,此时应采购多少吨原料才能使仓储供应中心的总成本最少(不计存储费用)?这个问题可看成一个博弈问题。即仓储供应中心针对可能出现的三种不同的原料需求状况,运用三种储量策略来进行应对,通过对各种情况下成本费用的计算,找出最佳的策略来。在现代物流管理中,这种不同策略的相互应对非常普遍,如投资与外包等。(3)物流运输对策分析【例8.3】甲、乙两个货物运输公司在同一地区从事运输。两个公司都想通过改革经营管理以获取更多运输市场的份额。甲公司考虑的策略措施有:①降低运输价格;②提高运输质量;③推出新的运输方式。乙公司考虑的策略措施有:①增加广告费用;②增设服务网;③改进原有设备。假定市场份额一定,由于各自采取的策略措施不同,相应的两个公司的市场占有份额将会发生变化。如经预测,当甲公司采用①策略,乙公司采用①策略时,甲公司市场份额会有10%的增长,相应还会有其他各种策略对应的预测值。那么甲、乙两公司的选择是什么呢?和上面的例题一样,我们通过竞争对策分析,就可以确定两个公司各自的最优策略了。由此可见,博弈就是竞争过程中,参与竞争者理性地选择自身策略的过程。那么有效地预测对手的策略,全面地分析策略的得失,是博弈取胜的关键。返回(2)物流仓储优化策略返回68.2对策论模型博弈论分析的是人们进行决策时策略选择的相互影响,现实中存在着极其多样的这种形势。为了进行规范分析,有必要从中抽象出最基本的组成要素构成最简单的模型,利用数学工具进行求解,分析结论的现实意义,然后再逐步加入更复杂的因素,使模型更能描述现实。这样最简单的对策模型,一般都有以下三个基本要素。8.2.1对策模型的基本要素(1)局中人在一个对策行为中,有权决定自己行动方案的对策参加者被称为局中人。局中人除了理解为个人外还可以理解为集体,如球队、交战国、企业公司等,也可以把大自然理解为局中人(因为人类经常处于和大自然斗争的状态中);另外,还假定局中人都是聪明的,有理智的和利己的。同时,为使所研究的问题更加清晰,把那些利益完全一致的参加者们看做一个局中人,因为他们利害一致,必使他们齐心合力,相互配合行动如一个人。例如,桥牌游戏中,东西双方利益一致,南北两方得失相当,所以虽有四人参加,只能算有两个局中人。一个对策中一般要求至少有两个局中人。每个局中人用i表示,局中人的集合用字母I表示,则I={1,2,…,n}。我们称只有两个局中人的对策现象为“两人对策”,如象棋、桥牌等,显然上述齐王赛马中局中人也是两人,即I={1,2}。而多于两个局中人的对策称为“多人对策”。另外根据局中人之间是否允许进行合作,还可有“结盟对策”和“不结盟对策”,或称为“合作博弈”和“非合作博弈”。8.2对策论模型博弈论分析的是人们进行决策时7(2)策略在一局对策中,可供局中人选择的一个实际可行的自始至终通盘筹划的完整行动方案称为这个局中人的一个“策略”。参加对策的局中人i(i∈I)的所有可供选择的策略的全体所构成的集合叫做局中人i的“策略集”,简记作Si。(3)赢得函数一局对策结束之后,对每个局中人来说,不外乎是胜利或失败,名次的前后,以及其他物质的收入或支出等,这些可以统称为“得失”或“益损”。在齐王与田忌赛马的例子中,最后田忌赢得一千金,而齐王损失一千金,即为这局对策(结局时)双方的“得失”。实际上,每个局中人在一局对策结束时的得失,与局中人所选定的策略有关。例如,上述赛马的例子中,当齐王出策略“上、中、下”,田忌出策略“下、上、中”时,田忌得千金;而如果与田忌都出策略“上、中、下”时,田忌就得付出三千金了。因此,在一局对策中,当局势给定以后,对策的结果也就确定了。一局对策结束时,每个局中人的“得失”是全体局中人所决定的一组策略即“局势”的函数,我们称之为“赢得函数”。在最终局势ω下,局中人i∈I的赢得函数记作:H(i,ω)。在一局对策中,如果在任一“局势”中,全体局中人的“得失”相加总和为零,就称该对策为“零和对策”,否则,就称为“非零和对策”。上述齐王与田忌赛马的例子中,不论比赛双方的策略如何,比赛的结果,一方的所得必为另一方的所失,因此该对策就是一个零和对策。一般来说,当上述三个基本要素确定以后,一个对策模型就确定了。(2)策略88.2.2对策的分类对策的种类很多,可以依据不同的原则进行分类。如前所述,根据参与博弈的局中人的数量可分为二人对策和多人对策;根据局中人之间是否允许进行合作(一般是多人博弈中),可分为合作博弈和非合作博弈;根据局中人策略集中策略的有限或无限,可分为有限对策和无限对策;根据各局中人赢得函数值的和是否为零,可分为零和对策和非零和对策,非零和又可分为常和对策与变和对策;此外,根据对策与时间的关系可将净对策分为静态对策和动态对策;根据大家是否都清楚各种对局情况下每个局中人的得益,可分为完全信息对策和不完全信息对策;根据对策的数学模型的类型可分为矩阵对策、连续对策、微分对策、阵地对策、随机对策等。目前世界比较流行的一种分类方式是把静态与动态、完全信息与不完全信息这四种基本的对策组合起来形成四类博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。完全信息是指博弈中的决策者对于博弈整体结构有着充分的了解,唯一需要考虑的就是策略选择问题;不完全信息则是指博弈中的决策者对博弈结构中某些部分的了解不充分;静态博弈是指博弈中每个决策者的策略选择仅进行一次,在选择时不知道其他人的策略选择;动态博弈则引入了决策的先后次序,局中人在进行选择时可以得到关于行动历史的一些信息。这四类博弈一个比一个精彩,也一个比一个难。主要对策模型的分类见图8.1。8.2.2对策的分类对策的种类很多,可以依9图8.1对策模型分类图8.1对策模型分类10在众多的对策模型中,完全信息静态模型中的有限二人零和对策占有重要地位。这类对策也叫矩阵对策,它是到目前为止在理论研究和求解方法方面都比较完善的一类对策,而且这类对策的研究思想和理论结果又是研究其他对策模型的基础。这里我们仅讨论矩阵对策模型。在众多的对策模型中,完全信息静态模型中的有限二118.2.3矩阵对策的基本模型矩阵对策是指对策中只有两个局中人,每个局中人各有有限个可供选择的策略。在每个对局中,两个局中人独立的选择一个策略(互相都不知道对方所选的策略),而两人的收益总和(“得失”相加)为零。这种对策中,两个局中人的利益是完全相反的,即一个局中人的赢得值恰好是另一个人所损失的值。局中人双方的利益是冲突的,因此不存在合作的可能,所以矩阵对策又称为有限对抗对策。这种对策比较简单,在理论上也比较成熟,而且这些理论奠定了研究“对策现象”的基本思路,所以矩阵对策是对策论的基础。下面继续讨论齐王赛马的例子:以α1(上、中、下)表示齐王以“先用上等马、再用中等马、最后用下等马”次序参加比赛。也就是说它是齐王的一个策略。于是齐王共有6个策略(3的全排列P3=3!=3×2×1=6),即:α1(上、中、下)α2(上、下、中)α3(中、上、下)α4(中、下、上)α5(下、中、上)α6(下、上、中)同理,对田忌来讲也有6个策略,分别是:β1(上、中、下)β2(上、下、中)β3(中、上、下)β4(中、下、上)β5(下、中、上)β6(下、上、中)8.2.3矩阵对策的基本模型矩阵对策是指对策12当齐王选取策略α1(上、中、下),田忌选取策略β1(上、中、下)进行比赛,就形成了一个局势(α1,β1)。这时由于在同级的马中,田忌的马不如齐王的马,所以齐王在这一局势下每个等级的马都胜过田忌的马,齐王可以得到三千金。同样,在局势(α1,β2)下齐王可以得到一千金,而在局势(α1,β6)下田忌可以得到一千金。齐王在不同局势下的不同得失可用矩阵表示为矩阵中的元素1和3是表示齐王得到的千金数,同时也是田忌应付的千金数;-1是齐王应付的千金数,同时也是田忌所得到的千金数。对于矩阵对策来说,局中人的赢得矩阵给定之后,两个局中人就便于各自考虑选取最合适的策略,以谋取最大的收益。一般的,用Ⅰ、Ⅱ表示两个局中人,局中人Ⅰ有m个策略,即α1,α2…,αm;局中人Ⅱ有n个策略,即β1,β2,…,βn。则局中人Ⅰ、Ⅱ的策略集分别为当齐王选取策略α1(上、中、下),田忌选取策13S1={α1,α2,…,αm}S2={β1,β2,…,βn}当Ⅰ选取策略αi,Ⅱ选取策略βj,就形成一个局势(αi,βj),这时局中人Ⅰ的收益为αij,局中人Ⅱ的收益为-αij(共有m×n个局势)。矩阵A=(αij)称为局中人Ⅰ的赢得矩阵,即当局中人Ⅰ、Ⅱ和策略集S1、S2及局中人的赢得矩阵A确定后,一个矩阵对策就给定了。通常我们将矩阵对策记作:G={Ⅰ,Ⅱ;S1,S2;A}返回S1={α1,α2,…,αm}148.3矩阵对策的解法矩阵对策求解的方法很多,有图解法、拉格朗日乘数法、方程组法和线性规划法等。本节给出最常用的求解矩阵对策的方法:图解法和线性规划法。在介绍这两种解法前我们首先讲解一下关于矩阵对策的纯策略和混合策略。8.3.1矩阵对策的纯策略当矩阵对策给定后,两局中人所面临的问题是该问题是否存在对自己最为有利的纯策略,如果存在,局中人该如何选取对自己最为有利的纯策略,以及求得在该策略下自己的最大的赢得值(或是最少的损失值)是多少。下面通过分析具体的矩阵对策的例子来回答上述问题。【例8.4】设有一矩阵对策,局中人Ⅰ的赢得矩阵为8.3矩阵对策的解法矩阵对策求解的方法很多15试研究双方策略。解由A可以看出,局中人Ⅰ的最大收益值是9,要想达到这个目的,他就得选策略α3。然而局中人Ⅱ也在考虑,因为局中人Ⅰ有出α3的心理状态,要想使自己有较大的赢得,就想选β3作为对策。这样不仅使局中人Ⅰ得不到9,反而会失去10(即得-10)。同样,局中人Ⅰ也会想Ⅱ有出β3的可能,于是Ⅰ想出α4来对付Ⅱ,使他不但得不到10反而输掉6……这样一来,双方都必然要考虑风险,考虑对方会设法使自己收入最小;因此,都应当从最坏处着想,去尽量争取最好的结果。这就是所谓的保守准则,保证最小收益,即maxmin准则。对局中人Ⅰ来说,若他选择策略α1,他的收益可能就是-8(当Ⅱ选择策略β3),这是他选择α1时能保证得到的最小收益。同样,他选择α2、α3、α4时,能保证得到的最小收益分别是2、-10、-3,即对应行的最小元素;因此,当他选择策略α2时,他可以保证收益至少为2,而当他选择其他策略时,他的收益可能少于2。在这个意义下(也即maxmin准则),我们说α2是Ⅰ的最优策略。同样,局中人Ⅱ选择策略β1、β2、β3时,他的损失分别为9、2、6,即对应列的最大元素。因此,他的最优策略(按minmax准则)是β2,可保证损失不超过2。试研究双方策略。16结果,局中人Ⅰ按maxmin准则选取策略α2,局中人Ⅱ按minmax准则选取β2,双方都得到了他们预想的收益,这是一种最稳妥的行为。我们把(α2,β2)称为对策G的最优局势。求最优策略的过程用数学式子描述如下:对局中人Ⅰ来讲,就先在矩阵A每一行元素中取最小值,即第一行:min{-6,1,-8}=-8第二行:min{3,2,4}=2第三行:min{9,-1,-10}=-10第四行:min{-3,0,6}=-3再从这些最小值中取最大值,即max{-8,2,-10,-3}=2因此,由上面矩阵A可知,局中人Ⅰ的最优策略为α2。对局中人Ⅱ来讲,先在矩阵A每一列元素中取最大值,即第一列:max{-6,3,9,-3}=9第二列:max{1,2,-1,0}=2第三列:max{-8,4,-10,6}=6再从这些最大值中取最小值,即min{9,2,6}=2因此,由上面可知,对局中人Ⅱ来讲最优策略为β2。2是对策G的值,对策值用VG表示,即VG=2
结果,局中人Ⅰ按maxmin准则选取策略17一般的,设局中人Ⅰ、Ⅱ都采用保守准则保证最小收益,即maxmin准则。那么对局中人Ⅰ来说,他应对自己每一种可以选择的策略求出其最小的收益,再选择最小收益中收益最大的那个策略。对赢得矩阵A=(aij)来说,就是先在每一行中求最小值,再在这些最小值中选出最大值。即
对局中人Ⅱ来说,A是他的损失矩阵,他的收益是-αij,所以他对A使用保守准则时,应当先在每一列中求出最大值,再在这些最大值中选择最小的那个,即
通过上面的讨论可以看到:在对策中,局中人Ⅰ、Ⅱ都采用保守准则,最后出现了一个平衡局势(αi*,βj*),这个局势双方均可接受,且对双方来说都是一个最稳妥的结果。我们把这个平衡局势(αi*,βj*)称为鞍点。鞍点的定义:设对策G的赢得矩阵为A=(αij),若,且等于矩阵元素αi*j*;那么,(αi*,βj*)称为对策G的一个鞍点,αi*称为局中人Ⅰ的最优纯策略,βj*称为局中人Ⅱ的最优纯策略,VG=αi*j*称为对策G的值。=一般的,设局中人Ⅰ、Ⅱ都采用保守准则保证最小188.3.2矩阵对策的混合策略由上面的讨论可知,在一个矩阵对策A=(αij)中,局中人Ⅰ能保证最小可得为局中人Ⅱ能保证的最大所失为一般而言,局中人Ⅰ的收益不会多于局中人Ⅱ的所失,所以总有v1≤v2即有8.3.2矩阵对策的混合策略由上面的讨论可知19若等号成立,即v1=v2时,矩阵对策在纯策略意义下有解,且VG=v1=v2。然而,实际中出现的更多情况是等号不成立,即为若等号成立,即v1=v2时,矩阵对策在纯策208.3.3矩阵对策图示法现在讨论矩阵对策的图解法,这种方法不仅为赢得矩阵为2×n和m×2阶的对策问题提供了一个直观的解法而且通过这种方法的讨论可以使我们在几何上理解对策论的思想。下面利用例子来说明如何求出最优策略。【例8.8】设有对策矩阵,其中矩阵中的元素表示局中人Ⅰ的得分,即试求出每个局中人的最优策略,并问其对策值是多少?解我们知道,在上面对策中,局中人Ⅰ有2种策略,局中人Ⅱ有3种策略。假定p是局中人Ⅰ选取第一行的概率,那么1-p是他选取第二行的概率。下面依据p来计算局中人Ⅰ的期望收益值。如果局中人选择第一列,那么局中人Ⅰ的期望收益值等于4p-(1-p),即E1=5p-1(图8.2中直线①)类似的,若局中人选择第二列和第三列,则局中人Ⅰ的期望收益值分别为E1=4-5p(图8.2中直线②)E1=2-2p(图8.2中直线③)8.3.3矩阵对策图示法现在讨论矩阵对策的21另外,我们以E1为y轴,p为x轴,作出直线①、直线②和直线③。以局中人Ⅱ的角度来看,他希望局中人Ⅰ得分尽可能少,因为这样能使自己得分尽可能多。因此,局中人Ⅱ将选择这样的策略(直线)使其高度最低。由于每条直线的高度表示局中人Ⅰ的得分多少。换言之,局中人Ⅱ的最优策略即是图8.2中粗黑的折线A1AA2A3。图8.2例8.8最优策略选择示意图另外,我们以E1为y轴,p为x轴,作出直线①22局中人Ⅰ认识到这一点,就将选择p的值,使自己能获得更多的分数。这样p的值出现在直线①和直线③的交点A处,交点坐标为p=3/7,E1=8/7于是局中人Ⅰ的最优策略是以37的概率选择第一行和以47的概率选择第二行。在这种情况下,这个对策的值是E1=8/7。为求出局中人Ⅱ的最优策略,要注意局中人Ⅰ的最优策略是根据对策矩阵的第一列和第三列所计算出的得分数而得到的,在例8.8的矩阵中删去第二列所构成的矩阵为现在,由式(82)可求出局中人Ⅱ的最优策略为q1=2/7,q2=0,q3=5/7于是局中人Ⅱ的最优策略是以27的概率选择第一列,以5/7的概率选择第三列,而始终不选择第二列(即被删除的列)。局中人Ⅰ认识到这一点,就将选择p的值,使自己238.3.4矩阵对策线性规划法前面讨论了图解法,解决了赢得矩阵为2×n和m×2阶对策问题的求解。对于一般的矩阵对策问题,可以用线性规划法来进行求解,因为这种方法可以求解任何矩阵对策。若一个矩阵对策中,局中人Ⅰ的赢得矩阵为A,则他的最优混合策略x=(x1,x2,…,xm)是线性规划问题的解;而局中人Ⅱ的最优策略y=(y1,y2,…ym)是问题8.3.4矩阵对策线性规划法前面讨论了图解法24的解,容易验证问题(P)和问题(D)是互为对偶的线性规划问题。这样求解矩阵对策可等价地转化为对偶的线性规划问题(P)和(D)。在问题(P)中,令x′I=xi/v1,i=1,2,…,m(不妨设v1>0)(8.3)则问题(P)的约束条件变为的解,容易验证问题(P)和问题(D)是互为对偶25故问题(P)等价于问题(P′)同理,令
y′j=yj/v2,j=1,2,…,m(不妨设v2>0)(8.4)可知问题(D)等价于问题(D′)故问题(P)等价于问题(P′)同理,令26显然问题(P′)和(D′)是互为对偶的线性规划,可利用单纯形法和对偶单纯形法求解。求解后再通过式(8.3)和式(8.4)进行变换,即可求得矩阵对策的解和对策值。返回显然问题(P′)和(D′)是互为对偶的线性规划27知识归纳1.对策论主要研究的是决策者在决策主体各方相互作用情况下如何进行决策及有关这种决策的均衡问题,它所强调的是竞争。2.对策模型包括局中人、策略和赢得函数三个要素。它是我们研究对策问题的基础。3.矩阵对策指对策中包含两个局中人,各自的策略集均由有限个策略组成,且一方所得恰为对方所失。其模型(赢得矩阵)为一般记为G={Ⅰ,Ⅱ;S1,S2;A}。知识归纳1.对策论主要研究的是决策者在决策主体各方相284.矩阵对策的纯策略是指其满足,此时矩阵有鞍点。5.矩阵对策的混合策略是指当(一般为<),此时矩阵无鞍点,双方都无最优策略,只能采用混合策略。6.矩阵对策的解法。(1)如果赢得矩阵有鞍点则通过maxmin准则求解。(2)如果赢得矩阵无鞍点先通过优势准则进行简化。对于2×2赢得矩阵直接用下面公式求解。
对于2×n或m×2赢得矩阵直接用图解法进行求解。对于一般赢得矩阵采用线性规划法进行求解。返回4.矩阵对策的纯策略是指其满足29习题与思考题
8.1已知A、B两人进行对抗,A的赢得矩阵如下,求双方的最优策略和对策值。习题与思考题8.1已知A、B两人进行对抗,A308.2用图解法求下列对策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 污水处理工程师设计污水处理方案
- 2024年智慧社区建设项目五金水电材料采购合同范本3篇
- 混泥土课程设计摘要
- 2024年度LED灯具环保节能保修与回收利用合同3篇
- 烟气氨法脱硫课程设计
- 手术室出科个人小结范文(7篇)
- 护士核酸采样工作总结(9篇)
- 承诺不离开一个人的保证书(6篇)
- 浮头式换热器课程设计
- 民族服饰表演课程设计
- 四川省南充市2023-2024学年高一上学期期末考试化学试题 含解析
- 2024北京东城初二(上)期末语文试卷及答案
- 高等学校学生公寓服务指南-地方标准编制说明
- 《临床颅内压增高》课件
- 2024老师聘用合同范本
- 2025高考数学复习必刷题:概率与统计的综合应用
- 狐假虎威第二课时说课稿
- 合同法-006-国开机考复习资料
- 山东师范大学形势与政策期末复习题
- 2024全国国家版图知识竞赛题库(含答案)
- DB52T 1767-2023 酱香型白酒基酒质量评价技术规范
评论
0/150
提交评论