版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
引例囚徒困境:甲、乙两个人一起携枪准备作案,被警察发现抓了起来。如果两个人都不坦白,警察会以非法携带枪支罪而将二人各判1年;如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;如果两人都招供,则两人都会因罪名各判10年。这两个囚犯该怎么办?斗鸡博弈:两只斗鸡遇到一起,每只斗鸡都有两个行动选择:一是退下来,一是进攻。如果一方退下来,而对方没有退下来,对方获得胜利,这只公鸡则很丢面子;如果对方也退下来,则双方打个平手;如果自己没退下来,而对方退下来,自己则胜利,对方则失败;如果两只公鸡都前进,那么则两败俱伤。这两只公鸡该怎么办?
引例在社会生活中,经常碰到各种各样具有竞争或利益相对抗的活动,如下棋、打扑克、为争夺市场开展的广告战、军事斗争中双方兵力的对垒等,竞争的各方总是希望击败对手,取得尽可能好的结果。竞争各方都想用自己最好的战术去取胜,这就是对策现象。对策现象实际上是一类特殊的决策,在不确定型的决策分析中,决策者的对手是“大自然”,它对决策者的各种策略不产生反应,更没有报复行为。但在对策现象中,代替“大自然”的是有理智的人,因而任何一方做出决定时都必须充分考虑其他对手可能作出的反应。我国历史上齐王和田忌赛马的故事,生动的说明研究对策问题的意义。
产生与发展1944年,冯诺依曼与曼彻斯特发表了题为《对策论和经济行为》。50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时,非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作对策的文章,图克于1950年定义了“囚徒困境”问题。60年代,泽尔腾(1965)引入动态分析,提出“精练纳什均衡”概念。海萨尼(1967-1968)则把不完全信息引入对策论的研究。
对策的基本要素局中人:在一个对策行为中,有权决定自己行动方案的对策参加者。它可是一个人,也可以是一个集团局中人必须是有决策权的主体,而不是参谋或从属人员局中人可以有两方,也可以有多方当存在多方的情况下,局中人之间可以有结盟和不结盟之分
对策的基本要素策略:在一局对策中,把局中人的一个可行方案称为它的一个策略,把局中人的策略全体叫做策略集。这个方案必须是一个独立的完整的行动,而不能是若干相关行动中的某一步;一个局中人可以拥有多个策略;一个局中人所拥有的策略的总和构成该局中人的策略集。
对策的基本要素局势:当每个局中人从自己的策略集中选择了一个策略组成的策略组就称为一个局势。支付(赢得):局势出现后,对策的结果也就确定了,对任一局势,任一局中人都有一个支付值。显然,支付是局势的函数,该函数称为支付函数或赢得函数。当各局中人得失的总和为零时,称这类对策为零和对策,否则称为非零和对策。零和对策中存在两个局中人,其中一个局中人的支出或损失恰好等于另一局中人的收入或赢得。二人零和对策双方的得失用矩阵形式表示,通常称为支付矩阵,二人零和对策也被习惯地称为矩阵对策。
对策问题举例市场购买力竞争问题销售竞争问题费用分摊问题拍卖问题
矩阵对策数学模型矩阵对策就是二人有限零和对策,指的是参加对策的局中人只有两方,每个局中人都只有有限个策略可供选择。在任一局势下,两个局中人的赢得之和总是零,即一方局中人的收入总等于另一方的支付,这表明双方的利益是激烈对抗的。用甲、乙表示局中人双方。假设局中人甲有m个策略(纯策略),分别以α1,α2,……αm表示,局中人乙有n个策略(纯策略),分别以表β1,β2,……βn示,则局中人甲乙的策略集分别为:S甲={α1,α2,……,αm}S乙={β1,β2,……,βn}
矩阵对策数学模型当局中人甲选定策略αm和局中人乙选定策略βn后,就形成了一个纯局势(αi,βj)。对任一纯局势(αi,βj),记局中人甲的赢得值为aij,并称为局中人甲的赢得矩阵(或为局中人乙的支付矩阵)。当局中人甲、乙和策略集S甲、
S乙及局中人的赢得矩阵A确定后,一个矩阵对策也就给定了。通常将一个矩阵对策记成:G={甲,乙;S甲,
S乙;A}或G={S甲,
S乙;A}úúúúûùêêêêëé=mnmmnnaaaaaaaaaALMLMMLL212222111211
矩阵对策数学模型齐王赛马中齐王的赢得如下表田忌策略齐王策略[β1](上,中,下)[β2](上,下,中)[β3](中,上,下)[β4](中,下,上)[β5](下,中,上)[β6](下,上,中)α1(上,中,下)31111-1α2(上,下,中)1311-11α3(中,上,下)1-13111α4(中,下,上)-111311α5(下,中,上)11-1131α6(下,上,中)111-113úúúúúúúúûùêêêêêêêêëé------=311111131111113111111311111131111113A矩阵对策的解与对策值设有一矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,α3,α4},S乙={β1,β2,β3}úúúúûùêêêêëé-----=6031019423816A矩阵对策的解与对策值1.求对策问题的解是建立在以下假设基础上每个局中人对双方拥有的全部策略及当各自采取某一策略时的相互得失有充分了解;对策的双方是理智的,他们参与对策的目的是力图扩大自己的收益,因而总是采取对自己有利的策略;双方在相互保密的情况下选择自己的策略,并不允许存在任何协议。
矩阵对策的解与对策值2.对策问题中,任何一方对对方在下次行动中准备采取的策略可以说是一无所知,双方处于完全对抗的环境中,因而各自都采取保守的态度,从最坏处着眼,并力争较好的结局。3.对策问题的解:对策双方遵循的对局中人A是最大最小准则,对局中人B则是最小最大准则,相应于这种准则下的对策双方各自采取的策略,称为对策问题的解。4.对策值:双方采取上述策略,连续重复进行对策,其输赢的平均值称为相应对策问题的对策值,通常用v表示。最大最小和最小最大准则局中人A策略有:a1,a2,…,am,局中人B策略有:b1,b2,…,bn。当A采取策略ai(i=1,2,…,m),而B采取策略bj(j=1,2,…,n)时,A的赢得(或B的损失)值为cij。b1b2…bna1c11c12…c1na2c21c22…c2n……………amcm1cm2…cmn最大最小和最小最大准则1.最大最小准则:当A依据最大最小准则选择策略时,他总考虑不管选哪一个策略都将得到最坏结局,即选择策略ai时,得到的收入为再从以上各个最坏结局中找出一个最好的}{ijjcMinajiijjiVccMinMax==11}}{{2.最小最大准则:当B依据最小最大准则选择策略时,他总考虑不管选哪一个策略都将得到最坏结局,即选择策略bj时,付出的支出为}{ijicMax再从以上各个最坏结局中找出一个最好的bjiijijVccMaxMin==22}}{{baVVV££具有鞍点的对策鞍点:在矩阵对策中,若有ci1j2=ci2j2=ci’j’时,则ci’j’的值既是在同行中最小又是同列中的最大的,就像一个马鞍的骑坐点所处的位置,故称为鞍点。具有鞍点的对策:如果对策问题具有鞍点,称相应对策为具有鞍点的对策。定义1:设G={S甲,S乙;A}为矩阵对策,其中S甲={α1,α2,…,αm},S乙={β1,β2,…,βn},A=(aij)m×n。若等式**maxminminmaxjiijijijjiaaa==成立,记VG=ai*j*。则称VG为对策G的值,称使上式成立的纯局势(αi*,βj*)为G在纯策略下的解(或平衡局势),αi*和βj*分别称为局中人甲乙的最优纯策略。
矩阵对策数学模型例6-1:求解矩阵对策G={S甲,S乙;A},其中úúúúûùêêêêëé-----=5033116423817A-3-32-85216ijiamax50-3α4-3-116α3423α2-81-7α1β3β2β1ijjamin
矩阵对策数学模型定理1:矩阵对策G={S甲,S乙;A}在纯策略意义下有解的充分必要条件是存在纯局势(αi*,βj*),使得对一切i=1,2,…,m,j=1,2,…,n均有jijiijaaa****££定义2:设f(x,y)为一个定义在x∈A及y∈B上的实值函数,如果存在x*∈A,y*
∈B,使得对一切x∈A及y∈B有:),(),(),(****yxfyxfyxf££则称
(x*,y*)为函数的一个鞍点。
矩阵对策的混合策略úûùêëé=4563A12**1451,5maxmin22,4minmaxvavjaviavijijijijji=>========这时双方若仍使用纯策略,就会出现不稳定状态.出现双方都不能连续不变地使用某种纯策略,都必须考虑如何随机使用自己的策略,使对方捉摸不到自己使用何种策略。这就是使用混合策略的对策。
矩阵对策的混合策略定义3:矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,…,αm},S乙={β1,β2,…,βn},A=(aij)m×n。å===³Î=miiimxmixExS1*甲}1,,,2,1,0{Lå===³Î=njjjnynjyEyS}1,,,2,1,0{*乙L则S1*和S2*分别称为局中人甲和乙的混合策略集;x∈S甲*和y∈S乙*分别称为局中人甲和乙的混合策略;对x∈S甲*,y∈S乙*,称(x,y)为一个混合局势,局中人甲的赢得函数记成åå==ijjiijTyxaAyxyxE),(这样得到的新的对策记为G*={S甲*,S2*,E},称G*为对策G的混合扩充。
矩阵对策的混合策略当局中人甲采取混合策略x时,他只能希望获得(最不利的情形)因此居中人甲应选取x∈S1*,使得上式取极大值(最不利当中的最有利情形),即局中人甲可保证自己的赢得期望值不少于同样局中人乙可保证自己的赢得期望值不多于),(*2yxEMinSyÎ),(*2*11yxEMinMaxvSySxÎÎ=),(*1*22yxEMaxMinvSxSyÎÎ=),(),(**2*1yxEMinyxEMinMaxySySx=ÎÎ),(),(**1*2yxEMaxyxEMaxMinxSxSy=ÎÎ2****),(),(),(vyxEMaxyxEyxEMinvxy=££=
矩阵对策的混合策略定义4:设G*={S甲*,S乙*;A}是矩阵对策G={S甲,S乙;A}的混合扩充,若定理2:矩阵对策G={S甲,S乙;A}在混合策略意义下有解的充分必要条件是存在x*
∈S甲*和y*
∈S乙*,使(x*,y*)为函数E(x,y)的一个鞍点,即:记其值为VG。则VG称为对策G*的值,称使上式成立的混合局势(x*,y*)为G在混合策略意义下的解,x*和y*分别称为局中人甲和乙的最优混合策略。),(),(*1*2*2*1yxEMaxMinyxEMinMaxSxSySySxÎÎÎÎ=),(),(),(****yxEyxEyxE££2×2对策的公式法2×2对策是指局中人甲的赢得矩阵为2×2阶的,即:úûùêëé=22211211aaaaA最优混合策略可通过下列方程求得:ïîïíì=+=+=+ïîïíì=+=+=+1)2(1)1(2122212121211121222112221111yyvyayavyayaxxvxaxavxaxa上述方程组一定有严格非负解:)()()()()()()()()()(2112221121122211211222112111*2211222111222*1211222111211*2211222112122*1aaaaaaaaVaaaaaayaaaaaayaaaaaaxaaaaaaxG+-+-=+-+-=+-+-=+-+-=+-+-=2×n或m×2对策的图解法úûùêëé=4563Aúûùêëé=2571132Aúúúûùêêêëé=2116672A
m×n对策的解法定义5:设有矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,…,αm},S乙={β1,β2,…,βn},A=(aij)m×n。如果对于一切j=1,2,…,n,都有aij≥akj,即矩阵A的第i行元素均不小于第k行的对应元素,则称局中人甲的纯策略αi优超于αk;同样对于一切i=1,2,…,m,都有aij≤
ail,即矩阵A的第j列元素均不大于第l列的对应元素,则称局中人乙的纯策略βj优超于βl定理5:设有矩阵对策G={S甲,S乙;A},其中S甲={α1,α2,…,αm},S乙={β1,β2,…,βn},A=(aij)m×n。如果纯策略α1被其余纯策略α2,…,αm中之一优超,由可得到一个新的矩阵对策G’={S甲’,S乙;A’}则有:(1)VG=VG’(2)G’中局中人乙的最优策略就是其在中的最优策略(3)若(x2*,…xm*)T是G’中局中人甲的最优策略,则x*=(0,x2*,…xm*)便是其在G中的最优策略
m×n对策的解法例3:设赢得矩阵为A,求解这个矩阵对策úúúúúûùêêêêêëé=388065.57864959379520503023A
m×n对策的解法定理4:设x*∈S*甲,y*∈S*乙,则(x*,y*)为矩阵对策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年农庄农业资源综合利用承包合同3篇
- 2024年度农村土地流转与合作社联合经营合同范本3篇
- 2024年度水库养殖用电水供应合同3篇
- 2024版出租车司机劳动保障及薪资待遇合同3篇
- 2024版个人汽车使用权抵押担保合同2篇
- 2024年度化妆品铺货销售与品牌推广合同3篇
- 水管安装合同范例
- 房屋违约赔偿合同范例
- 2024平房买卖合同附带房产证办理与过户服务费协议3篇
- 2024年派遣员工劳动合同范本
- 安徽省2023-2024学年七年级上学期期末数学试题(原卷版)
- 2024年人教版八年级生物(上册)期末试卷及答案(各版本)
- 农作物病虫害防治的社会经济效益分析考核试卷
- 2023年全国职业院校技能大赛-商务数据分析赛项规程
- 第五单元 大单元教学设计-【大单元教学】2024-2025学年七年级语文上册同步备课系列(统编版2024)
- 《林火生态与管理》实验报告
- 【课件】纪念与象征-空间中的实体艺术+课件-高中美术人美版(2019)美术鉴赏
- JB∕T 11864-2014 长期堵转力矩电动机式电缆卷筒
- SL352水工混凝土试验规程
- 2024年云南中考历史试卷试题答案解析及备考指导课件(深度解读)
- “十四五”期间推进智慧水利建设实施方案
评论
0/150
提交评论