版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、对对 策策 论论 姚远姚远 工商管理学院工商管理学院 引例引例 对策论的基本概念对策论的基本概念 矩阵对策矩阵对策 四大类博弈四大类博弈 案例案例课程安排课程安排0102囚徒困境囚徒困境 两个嫌疑犯(两个嫌疑犯(和和)作案后被警察抓住,)作案后被警察抓住,隔离审讯;警方的政策是隔离审讯;警方的政策是“坦白从宽,抗拒从坦白从宽,抗拒从严严”,如果两人都坦白则各判年;如果一人,如果两人都坦白则各判年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的坦白另一人不坦白,坦白的放出去,不坦白的判判10年;如果都不坦白则因证据不足各判年。年;如果都不坦白则因证据不足各判年。03囚徒困境囚徒困境 A、B的得
2、失的得失B的策略的策略坦白坦白不坦白不坦白A的的策略策略坦白坦白-8, -80, -10不坦白不坦白-10, 0-1, -104智猪博弈智猪博弈 猪圈中有一头大猪和一头小猪,在猪圈的一端设猪圈中有一头大猪和一头小猪,在猪圈的一端设有一个按钮,每按一下,位于猪圈另一端的食槽中就有一个按钮,每按一下,位于猪圈另一端的食槽中就会有会有1010单位的猪食进槽,但每按一下按钮会耗去相当单位的猪食进槽,但每按一下按钮会耗去相当于于2 2单位猪食的成本。如果大猪先到食槽,则大猪吃到单位猪食的成本。如果大猪先到食槽,则大猪吃到9 9单位食物,小猪仅能吃到单位食物,小猪仅能吃到1 1单位食物;如果两猪同时单位食
3、物;如果两猪同时到食槽,则大猪吃到食槽,则大猪吃7 7单位,小猪吃单位,小猪吃3 3单位食物;如果小单位食物;如果小猪先到,大猪吃猪先到,大猪吃6 6单位而小猪吃单位而小猪吃4 4单位食物。单位食物。05智猪博弈智猪博弈 大小猪的得失大小猪的得失小猪策略小猪策略按按等待等待大猪大猪策略策略按按5, 14, 4 等待等待9, -10, 0田忌赛马田忌赛马06齐王的得失齐王的得失田忌策略田忌策略上中下上中下上下中上下中中上下中上下中下上中下上下中上下中上下上中下上中齐齐王王策策略略上中下上中下3 31 11 11 11 1-1-1上下中上下中1 13 31 11 1-1-11 1中上下中上下1 1
4、-1-13 31 11 11 1中下上中下上-1-11 11 13 31 11 1下中上下中上1 11 1-1-11 13 31 1下上中下上中1 11 11 1-1-11 13 307性别战性别战 男、女的得失男、女的得失女策略女策略足球足球韩剧韩剧男男策略策略足球足球2, 10, 0 韩剧韩剧0, 01, 208斗鸡博弈斗鸡博弈 A、B的得失的得失B策略策略进进退退A策略策略进进-3, -32, 0 退退0, 20, 009纳什均衡纳什均衡 纳什均衡纳什均衡(Nash Equilibrium):纳什均纳什均衡是局中人策略选择上构成的一种衡是局中人策略选择上构成的一种“僵局僵局”,给定其他局
5、中人的选择不变,任何一个局中给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其战略选人的选择是最好的,他也不会改变其战略选择。择。10对策对策(博弈博弈)论的基本概念论的基本概念一、对策现象和对策论一、对策现象和对策论 现实生活中的竞争或斗争现象称为对策现象,研现实生活中的竞争或斗争现象称为对策现象,研究这种竞争或斗争现象的数学理论和方法,称为对策究这种竞争或斗争现象的数学理论和方法,称为对策论(论(game theory),也称博弈论。例子:),也称博弈论。例子: 1 1、田忌赛马(二人零和对策)、田忌赛马(二人零和对策) 2 2、囚徒困境(非合作博弈)、囚徒困境(非合作
6、博弈) 3 3、智猪博弈、智猪博弈11二、对策(博弈)的三要素二、对策(博弈)的三要素 1、局中人(、局中人(player) 每一局对策中都有这样的参加者:他们为了得到好的结局,必每一局对策中都有这样的参加者:他们为了得到好的结局,必须制定对付对手的行动方案,这种有决策权的参加者就称为局中须制定对付对手的行动方案,这种有决策权的参加者就称为局中人,而与得失无关的旁观者及无决策权的其他人不能称为局中人。人,而与得失无关的旁观者及无决策权的其他人不能称为局中人。只有两个局中人的博弈现象称为只有两个局中人的博弈现象称为“两人博弈两人博弈”,而多于两个局中人而多于两个局中人的博弈称为的博弈称为“多人博
7、弈多人博弈”。 2、策略(、策略(strategy) 一局博弈中,每个局中人都有选择实际可行的完整的行动方案,一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终筹划全局的行动方案,称为这一个局中人的一个可行的自始至终筹划全局的行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人的策略都是有限个局中人的一个策略。如果在一个博弈中局中人的策略都是有限个,则称为个,则称为“有限博弈有限博弈”,否则称为,否则称为“无限博弈无限博弈”。 对策对策(博弈
8、博弈)论的基本概念论的基本概念12 3 3、得失函数(赢得函数、得失函数(赢得函数payoff functionpayoff function) 一局博弈结局时的结果称为得失。每个局中人在一局一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的束时每个局中人的“得失得失”是全体局中人所取定的一组策略是全体局中人所取定的一组策略的函数,通常称为得失(的函数,通常称为得失(pay
9、offpayoff)函数。)函数。 若对任一局势,全体局中人的若对任一局势,全体局中人的“得得”或或“失失”之和总之和总是等于是等于“0 0”,则称这种对策(博弈)为零和对策(零和博,则称这种对策(博弈)为零和对策(零和博弈),否则称为非零和对策(非零和博弈)。弈),否则称为非零和对策(非零和博弈)。对策对策(博弈博弈)论的基本概念论的基本概念13三、对策(博弈)分类与举例三、对策(博弈)分类与举例 1、根据局中人的个数,分为二人博弈和多人博弈。、根据局中人的个数,分为二人博弈和多人博弈。 2、根据各局中人的得失函数的代数和是否为零,分为零和博弈与、根据各局中人的得失函数的代数和是否为零,分为
10、零和博弈与非零和博弈。非零和博弈。 3、根据局中人间是否允许合作,分为合作博弈和非合作博弈。、根据局中人间是否允许合作,分为合作博弈和非合作博弈。 4、根据局中人的策略集中策略个数,分为有限博弈和无限博弈。、根据局中人的策略集中策略个数,分为有限博弈和无限博弈。 5、根据对策的选择是否与时间相关,分为静态博弈和动态博弈。、根据对策的选择是否与时间相关,分为静态博弈和动态博弈。 6、根据对策模型的数学特征,可分为矩阵对策、连续对策、阵地、根据对策模型的数学特征,可分为矩阵对策、连续对策、阵地对策、凸对策、随机对策等。对策、凸对策、随机对策等。 在众多模型中,最常见的为二人有限零和对策(在众多模型
11、中,最常见的为二人有限零和对策(finite two-person zero sum game),又称为矩阵对策。又称为矩阵对策。对策对策(博弈博弈)论的基本概念论的基本概念14矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈)对策的局中人有两个,每个局中人都有有限个策略可供对策的局中人有两个,每个局中人都有有限个策略可供选择,且在任意局势中,两个局中人所得之和总是等于零。选择,且在任意局势中,两个局中人所得之和总是等于零。显然,在这种对策中,一个局中人所得是另一个局中人所显然,在这种对策中,一个局中人所得是另一个局中人所失,两者的利益是根本冲突的。失,两者的利益是根本冲突的。
12、设参加对策的两个局中人为设参加对策的两个局中人为A、B,各自具有策略,各自具有策略 当当A出策略出策略i,B出策略出策略j时,时,A的得失为的得失为aij,矩阵对策常矩阵对策常给出局中人给出局中人A的得失矩阵。的得失矩阵。 ),.,1(),.,1(njSmiSjBiA15矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈) 以以SA表示局中人表示局中人A的策略集合,的策略集合,SB表示局中人表示局中人B的策略的策略集合,集合,P表示各个局势下表示各个局势下A的得失矩阵:的得失矩阵:mnmnnBmAaaaaPSS.,.,.,111111,PSSGBA16矩阵对策矩阵对策二人有限零和对
13、策(博弈)二人有限零和对策(博弈)矩阵对策的纯策略矩阵对策的纯策略 二人有限零和对策即为矩阵对策。首先假设两个局中人都是理智的,二人有限零和对策即为矩阵对策。首先假设两个局中人都是理智的,即每个局中人在选择策略时,都力图使自己的赢得最大,使对方的损失即每个局中人在选择策略时,都力图使自己的赢得最大,使对方的损失最大,据此,局中人在选择策略时谁也不能存在侥幸心理。最大,据此,局中人在选择策略时谁也不能存在侥幸心理。 分析:分析:6031019423816,3214321PASSBA的得失矩阵为:17矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈)理智行为:对策双方从各自可能出现的
14、最不利的情形中选择理智行为:对策双方从各自可能出现的最不利的情形中选择一个最有利的情形作为决策的依据。一个最有利的情形作为决策的依据。6031019423816,3214321PASSBA的得失矩阵为:18矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈)定义:定义:设设 为一矩阵对策,其中为一矩阵对策,其中 ,21PSSG mnmnnmaaaaPSS.,.,.,11111211若若成立成立ijijijjiaamaxminminmax 记其值为记其值为VG,则称,则称VG为对策的值,称使上式成立的纯局势为对策的值,称使上式成立的纯局势 为为G在纯策略意义下的解(平衡局势),在纯策
15、略意义下的解(平衡局势), 分别为分别为局中人局中人1 1、2 2的最优纯策略。的最优纯策略。 也称鞍点(也称鞍点(saddle point)。)。),(*ji*,ji),(*ji19找出下列矩阵对策的最优纯策略:找出下列矩阵对策的最优纯策略:矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈)42322334514641325647787629436544425202623021302412矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈)是否所有的矩阵对策都具有鞍点?是否所有的矩阵对策都具有鞍点? 这个例子就没有纯策略意义上的鞍点,这时局中人不存在最优这个例子就没
16、有纯策略意义上的鞍点,这时局中人不存在最优纯策略,或者说对策没有纯策略解。纯策略,或者说对策没有纯策略解。ijijijjiijijijjiaaaaPSSPSSGmaxminminmax4maxmin;2minmax4235,22212211212021在这类对策中,如果一方出某一策略的情报为对方所在这类对策中,如果一方出某一策略的情报为对方所知,后者就会选取适当的策略而稳操胜券,因而局中人双知,后者就会选取适当的策略而稳操胜券,因而局中人双方都必须向对方保密,而随机地选取自己的策略,这就是方都必须向对方保密,而随机地选取自己的策略,这就是说,局中人双方都须确定以多大的概率来选取自己的各个说,局
17、中人双方都须确定以多大的概率来选取自己的各个纯策略,即寻找混合策略。纯策略,即寻找混合策略。4235,21221121PSSPSSG矩阵对策矩阵对策二人有限零和对策(博弈)二人有限零和对策(博弈)22 例例1 A和和B双方交战,双方交战,A方派出两架轰炸机方派出两架轰炸机A1和和A2去轰去轰炸炸B方阵地,方阵地,A1在前,在前,A2在后,其中一架带炸弹,另一在后,其中一架带炸弹,另一架掩护。架掩护。B方派一架歼击机在途中拦截,如果歼击机攻方派一架歼击机在途中拦截,如果歼击机攻击击A1,则将受到,则将受到A1和和A2的还击;如果歼击机攻击的还击;如果歼击机攻击A2,则,则只受到只受到A2的还击。
18、两架轰炸机的火炮装置一样,每架轰的还击。两架轰炸机的火炮装置一样,每架轰炸机击毁歼击机的概率为炸机击毁歼击机的概率为 p10.4,歼击机在未被击中的,歼击机在未被击中的条件下击毁轰炸机的概率为条件下击毁轰炸机的概率为p20.9。决策决策:(1)对)对A方来说,哪一架轰炸机带炸弹?方来说,哪一架轰炸机带炸弹?(2)对)对B方而言,歼击机攻击哪一架轰炸机?方而言,歼击机攻击哪一架轰炸机?案例分析案例分析23分析分析:交战双方:交战双方A和和B各为一局中人。各为一局中人。A方有两个策略:方有两个策略: 1 :A1带炸弹;带炸弹; 2 :A2带炸弹。带炸弹。B方有两个策略:方有两个策略: 1:歼击机攻
19、击:歼击机攻击A1; 2 :歼击机攻击:歼击机攻击A2。案例分析案例分析B的策略的策略 1(攻击(攻击A1) 2 (攻击(攻击A2)A的赢得的赢得A的策略的策略1(A1带弹)带弹)a11a122 (A2带弹)带弹)a21a2212111a12a221a22a24 a11 :A1带弹,歼击机攻击带弹,歼击机攻击A1。A1未被击中的概率等未被击中的概率等于歼击机被击中的概率与歼击机虽未被击中但却未能击于歼击机被击中的概率与歼击机虽未被击中但却未能击中中A1的概率之和。的概率之和。 (1)一架轰炸机未击中歼击机的概率:)一架轰炸机未击中歼击机的概率:1-p1 (2)两架轰炸机均未击中歼击机的概率:)
20、两架轰炸机均未击中歼击机的概率:(1-p1)2 从而从而案例分析案例分析25 a12:A1带弹,歼击机攻击带弹,歼击机攻击A2。这时。这时A1肯定不会被击肯定不会被击中,从而中,从而 a12=1.0。 a21:A2带弹,歼击机攻击带弹,歼击机攻击A1。这时带弹机。这时带弹机A2肯定不肯定不会被击中,故会被击中,故 a21=1.0。 a22:A2带弹,歼击机攻击带弹,歼击机攻击A2。A2未被击中的概率等未被击中的概率等于以下两个概率之和:于以下两个概率之和: (1)歼击机被击中的概率:因歼击机攻击)歼击机被击中的概率:因歼击机攻击A2时仅遭时仅遭A2的还击,故这个概率等于的还击,故这个概率等于p
21、1 ; (2)歼击机虽未被击中,但它也未能击中)歼击机虽未被击中,但它也未能击中A2的概率的概率等于等于 (1-p1)(1-p2) 。案例分析案例分析26 如此就建立了这个问题的矩阵对策的数学模型,如此就建立了这个问题的矩阵对策的数学模型,其中局中人分别为交战双方其中局中人分别为交战双方A和和B,居中人,居中人A的赢得矩的赢得矩阵为阵为这个对策没有纯策略意义下的鞍点,因而不存在这个对策没有纯策略意义下的鞍点,因而不存在纯策略解。局中人纯策略解。局中人A和和B的最优混合策略如下:的最优混合策略如下:案例分析案例分析27 例例2 在一场敌对的军事行动中,甲方拥有三种进在一场敌对的军事行动中,甲方拥
22、有三种进攻性武器攻性武器A1 A2 A3,可分别用于摧毁乙方工事;而乙方,可分别用于摧毁乙方工事;而乙方有三种防御性武器有三种防御性武器B1 B2B3 来对付甲方。据平时演习得来对付甲方。据平时演习得到的数据,各种武器间对抗时,相互取胜的可能如下:到的数据,各种武器间对抗时,相互取胜的可能如下: A1对对B1 2:1 A1对对B2 3:1 A1对对B3 1:2 A2对对B1 3:7 A2对对B2 3:2 A2对对B3 1:3 A3对对B1 3:1 A3对对B2 1:4 A3对对B3 2:1试确定甲、乙双方使用各种武器的最优策略,回试确定甲、乙双方使用各种武器的最优策略,回答总的结果对甲、乙哪方
23、有利?答总的结果对甲、乙哪方有利?案例分析案例分析28 甲方的赢得矩阵为:甲方的赢得矩阵为: 乙方的赢得矩阵为:乙方的赢得矩阵为:案例分析案例分析3/25/14/34/15/310/33/14/33/2 用甲方矩阵减去乙方赢得矩阵对应元素,得零和对策时用甲方矩阵减去乙方赢得矩阵对应元素,得零和对策时甲方的赢得矩阵为:甲方的赢得矩阵为:3/15/44/14/35/210/73/24/13/13/15/32/12/15/15/23/12/13/129案例分析案例分析 甲方、乙方的混合策略分别为:甲方、乙方的混合策略分别为:3/15/32/12/15/15/23/12/13/1019. 0)622.
24、 0 ,378. 0 , 0(*);472. 0 , 0 ,528. 0(*vYX30 例例3 任放一张红牌或黑牌,让任放一张红牌或黑牌,让A看,不让看,不让B知道。知道。如果为红牌,如果为红牌,A可以掷一枚硬币或让可以掷一枚硬币或让B猜。掷硬币出现猜。掷硬币出现正反面的概率各为正反面的概率各为1/2,如出现正面,如出现正面,A赢得赢得p元,出现元,出现反面,反面,A输输q元;若让元;若让B猜,猜,B猜红,猜红,A输输r元,猜黑,元,猜黑,A赢赢s元。如为黑牌,元。如为黑牌,A只能让只能让B猜,如猜红,猜,如猜红,A赢赢t元,元,如猜黑,如猜黑,A输输u元。试列出对元。试列出对A的赢得矩阵。的
25、赢得矩阵。 A的纯策略有两个:掷硬币,让的纯策略有两个:掷硬币,让B猜;猜;B的纯策略也的纯策略也有两个:猜红,猜黑。有两个:猜红,猜黑。案例分析案例分析31 列出各个事件出现的概率和采取不同策略时的得失:列出各个事件出现的概率和采取不同策略时的得失:案例分析案例分析 红牌(红牌(1/2) 黑牌(黑牌(1/2) 掷正面(掷正面(1/2) 掷反面(掷反面(1/2) 猜红猜红 猜黑猜黑 猜红猜红 猜黑猜黑 猜红猜红 猜黑猜黑掷硬币掷硬币 p p -q -q t -u让让B猜猜 -r s -r s t -u)(21)(21)2(41)2(41usrtuqptqp 猜红猜红 猜黑猜黑掷硬币掷硬币让让B
26、 B猜猜32n 完全信息静态博弈纳什均衡完全信息静态博弈纳什均衡n 完全信息动态博弈精炼纳什均衡完全信息动态博弈精炼纳什均衡n 非完全信息静态博弈贝叶斯均衡非完全信息静态博弈贝叶斯均衡n 非完全信息动态博弈精炼贝叶斯纳什均衡非完全信息动态博弈精炼贝叶斯纳什均衡博弈类型博弈类型33n 田忌赛马田忌赛马n 囚徒困境囚徒困境n 智猪博弈智猪博弈 完全信息静态博弈完全信息静态博弈34n 市场进入阻挠博弈市场进入阻挠博弈n 开金矿博弈开金矿博弈n 恋爱博弈恋爱博弈 完全信息动态博弈完全信息动态博弈35 例:设想有一家寡占企业(在位者)在市场上享有丰厚例:设想有一家寡占企业(在位者)在市场上享有丰厚的利润
27、,另一家企业(进入者)企图进入分享;为了进入该的利润,另一家企业(进入者)企图进入分享;为了进入该行业,进入者必须付出行业,进入者必须付出4000万元的(沉没)成本建一个工厂。万元的(沉没)成本建一个工厂。在位者当然希望进入者别进入。如果进入者不进入,在位者在位者当然希望进入者别进入。如果进入者不进入,在位者能继续定高价,享受垄断利润能继续定高价,享受垄断利润10000万元。如果进入者进入,万元。如果进入者进入,在位者可以在位者可以“容忍容忍”,维持高价,希望进入者也这样做,此,维持高价,希望进入者也这样做,此时在位者只能赚到时在位者只能赚到5000万元,因为必须与进入者分享市场。万元,因为必
28、须与进入者分享市场。进入者将赚到进入者将赚到1000万元的净利润:万元的净利润:5000万元减去万元减去4000万元万元的建厂成本。不过在位者也可以增加自己的生产能力,生产的建厂成本。不过在位者也可以增加自己的生产能力,生产更多,并把价格压低。显然,增加生产能力代价很大,而降更多,并把价格压低。显然,增加生产能力代价很大,而降低价格也意味着减少收益。这种商战导致双方的低利润:在低价格也意味着减少收益。这种商战导致双方的低利润:在位者的利润下降到位者的利润下降到3000万元,进入者将有万元,进入者将有1000万元的净损失:万元的净损失:来自于销售的来自于销售的3000万元减掉建厂成本万元减掉建厂成本4000万元。万元。 完全信息动态博弈完全信息动态博弈36 完全信息动态博弈完全信息动态博弈 进入者、在位者的得失进入者、在位者的得失在位者在位者容忍容忍阻挠阻挠进入者进入者进入进入1000,5000-1000,3000不进入不进入0,100000,10000不进入进入容忍阻挠(0,10000)(1000,5000)(-1000,3000) 完全信息动态博弈完全信息动态博弈3738 如果在位者能作出一种一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论