16.电子教案教学课件_第1页
16.电子教案教学课件_第2页
16.电子教案教学课件_第3页
16.电子教案教学课件_第4页
16.电子教案教学课件_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 1第五篇-第十六章 对策论1第五篇第五篇 不确定性决策不确定性决策第十六章第十六章 对策论对策论l本章的学习要求与内容本章的学习要求与内容l 本章要求掌握对策论的性质、要素和类型,本章要求掌握对策论的性质、要素和类型,求解完全信息和不完全信息对策均衡的方法,求解完全信息和不完全信息对策均衡的方法,并了解进化对策论并了解进化对策论l 本章分四节,分别介绍对策特点、完全信息本章分四节,分别介绍对策特点、完全信息对策、不完全信息对策和进化对策对策、不完全信息对策和进化对策第五篇-第十六章 对策论2/332022-7-6第一节第一节 对策特点对策特点一、对策性质一、对策性质1. 对策论是研究理性决

2、策主体间发生冲突时的决对策论是研究理性决策主体间发生冲突时的决策及其均衡问题,即研究理性决策者之间冲突和策及其均衡问题,即研究理性决策者之间冲突和合作的理论合作的理论2. 对策论中个人决策同经济学中一样,都是在给对策论中个人决策同经济学中一样,都是在给定约束条件下追求效用或收益最大化,但其约束定约束条件下追求效用或收益最大化,但其约束条件不尽相同条件不尽相同 传统经济学中经济主体独自决策,既不考虑自传统经济学中经济主体独自决策,既不考虑自己的决策对他人决策的影响,也不考虑他人决策己的决策对他人决策的影响,也不考虑他人决策对自己决策的作用。而对策论里的对策,不仅依对自己决策的作用。而对策论里的对

3、策,不仅依赖于自己的选择,也依赖于他人的选择,个人最赖于自己的选择,也依赖于他人的选择,个人最优选择是其他人选择的函数,这就考虑了人们决优选择是其他人选择的函数,这就考虑了人们决策的相互影响,更接近于现实世界策的相互影响,更接近于现实世界第五篇-第十六章 对策论3/332022-7-63. 对策论的应用领域很多,包括政治、经济、对策论的应用领域很多,包括政治、经济、军事、体育以及国际关系等多个方面。在经军事、体育以及国际关系等多个方面。在经济学中,这种重视理性选择的相互依赖性的济学中,这种重视理性选择的相互依赖性的思想,不仅构成了现代微观经济学的重要理思想,不仅构成了现代微观经济学的重要理论,

4、而且为宏观经济分析提供了重要的微观论,而且为宏观经济分析提供了重要的微观基础基础 第一节第一节 对策特点对策特点第五篇-第十六章 对策论4/332022-7-6二、对策要素二、对策要素(一一) 局中人局中人1. 局中人是指参与对策的直接当事人,他是对策局中人是指参与对策的直接当事人,他是对策的决策主体和策略的制定者。在不同的对策问的决策主体和策略的制定者。在不同的对策问题中,局中人的含义是不同的,可能是个人,题中,局中人的含义是不同的,可能是个人,也可能是团体或集团也可能是团体或集团2. 对策论要求局中人具有理性对策论要求局中人具有理性(二二) 策略集合策略集合1. 策略集合是局中人可能采取的

5、全部策略的集合策略集合是局中人可能采取的全部策略的集合2. 每个策略集合至少应该有两种不同的策略每个策略集合至少应该有两种不同的策略 第一节第一节 对策特点对策特点第五篇-第十六章 对策论5/332022-7-6(三三) 收益函数收益函数1. 收益函数表明了局中人从对策中获得的收益收益函数表明了局中人从对策中获得的收益或效用水平,它是所有局中人策略的函数或效用水平,它是所有局中人策略的函数2. 收益函数通常可以用两种形式表示:一种是收益函数通常可以用两种形式表示:一种是实物或货币收入的绝对数值或相对数值,另一实物或货币收入的绝对数值或相对数值,另一种是用局中人的效用种是用局中人的效用(四四)

6、信息信息1. 对策的信息是指局中人有关对策的全部知识,对策的信息是指局中人有关对策的全部知识,包括局中人的特征和行动包括局中人的特征和行动2. 信息集是局中人在对策进行到某一点时,对信息集是局中人在对策进行到某一点时,对于不同变量取值的全部知识之和于不同变量取值的全部知识之和 第一节第一节 对策特点对策特点第五篇-第十六章 对策论6/332022-7-6(五五) 结果结果 结果指的是局中人在对策完成之后,结果指的是局中人在对策完成之后,其感兴趣的所有要素的集合,如均衡策略组其感兴趣的所有要素的集合,如均衡策略组合、均衡收益组合等合、均衡收益组合等(六六) 均衡均衡 均衡是所有局中人最优策略的组

7、合均衡是所有局中人最优策略的组合第一节第一节 对策特点对策特点第五篇-第十六章 对策论7/332022-7-6三、不同类型的对策三、不同类型的对策(一一) 合作对策与非合作对策合作对策与非合作对策1. 按照局中人之间能否达成一个有约束力的按照局中人之间能否达成一个有约束力的协议,对策可分为合作对策与非合作对策协议,对策可分为合作对策与非合作对策2. 如果在一个对策过程中,局中人之间的协如果在一个对策过程中,局中人之间的协议、承诺或威胁具有完全的约束力,并能够议、承诺或威胁具有完全的约束力,并能够强制执行,称为合作对策,否则称为非合作强制执行,称为合作对策,否则称为非合作对策对策 第一节第一节

8、对策特点对策特点第五篇-第十六章 对策论8/332022-7-6(二二) 静态对策与动态对策静态对策与动态对策1.按照局中人决策时是否存在时间的先后次序,按照局中人决策时是否存在时间的先后次序,对策可分为静态对策与动态对策对策可分为静态对策与动态对策2.如果局中人同时进行决策选择,或者虽非同如果局中人同时进行决策选择,或者虽非同时但后行动者并不知道先行动者采取什么具时但后行动者并不知道先行动者采取什么具体行动,称之为静态对策。当考虑时间因素,体行动,称之为静态对策。当考虑时间因素,对策需要多阶段或重复地进行下去时,就称对策需要多阶段或重复地进行下去时,就称为动态对策为动态对策 第一节第一节 对

9、策特点对策特点第五篇-第十六章 对策论9/332022-7-6(三三) 完全信息对策与不完全信息对策完全信息对策与不完全信息对策1. 按照局中人事先是否拥有其他局中人决策按照局中人事先是否拥有其他局中人决策方面的信息,对策可分为完全信息对策与不方面的信息,对策可分为完全信息对策与不完全信息对策完全信息对策2. 在完全信息对策中,每一位局中人都拥有在完全信息对策中,每一位局中人都拥有所有其他局中人的特征、策略集合及收益函所有其他局中人的特征、策略集合及收益函数方面的准确信息;在不完全信息对策中,数方面的准确信息;在不完全信息对策中,局中人只能了解上述信息中的一部分局中人只能了解上述信息中的一部分

10、 第一节第一节 对策特点对策特点第五篇-第十六章 对策论10/332022-7-6(四四) 对抗性对策与非对抗性对策对抗性对策与非对抗性对策l在对抗性对策中,局中人的收益或效用完全对在对抗性对策中,局中人的收益或效用完全对立,一方所得必为另一方所失,一方利益的增立,一方所得必为另一方所失,一方利益的增加必然导致另一方利益的减少,局中人收益之加必然导致另一方利益的减少,局中人收益之和为零或常数。在非对抗性对策过程中,局中和为零或常数。在非对抗性对策过程中,局中人有各自不同的收益值,其和不等于零或常数人有各自不同的收益值,其和不等于零或常数l在对抗性对策中,如果局中人各方不管采取何在对抗性对策中,

11、如果局中人各方不管采取何种策略,各自收益之和恒为零,则称之为零和种策略,各自收益之和恒为零,则称之为零和对策;如果各自的收益之和为常数,则称之为对策;如果各自的收益之和为常数,则称之为常和对策。否则称之为变和对策常和对策。否则称之为变和对策第一节第一节 对策特点对策特点第五篇-第十六章 对策论11/332022-7-6l在非对抗性对策过程中,局中人有各自不同在非对抗性对策过程中,局中人有各自不同的收益值,局中人之间的收益或效用既冲突的收益值,局中人之间的收益或效用既冲突又一致,具备达成某种均衡的可能。经济活又一致,具备达成某种均衡的可能。经济活动中的很多对策问题都属于非对抗性对策,动中的很多对

12、策问题都属于非对抗性对策,而非对抗性对策也就构成了经济对策论研究而非对抗性对策也就构成了经济对策论研究的重点的重点 第一节第一节 对策特点对策特点第五篇-第十六章 对策论12/332022-7-6第二节第二节 完全信息对策完全信息对策一、完全信息静态对策一、完全信息静态对策(一一) 对策的标准形式对策的标准形式标准型对策的基本要素包括:标准型对策的基本要素包括:1. 对策的局中人名单对策的局中人名单(list of players) 2. 每个局中人的所有策略单每个局中人的所有策略单(list of strategies) 3. 每个策略组合所对应每个局中人的收益单每个策略组合所对应每个局中人

13、的收益单(list of payoff) 第五篇-第十六章 对策论13/332022-7-6(二二) 占优均衡占优均衡1. 占优策略指的是占优策略指的是:不管对策中其他局中人的策略不管对策中其他局中人的策略是什么是什么,对某一局中人来说对某一局中人来说,都是最优策略都是最优策略2. 占优均衡就是所有局中人的占优策略组合起来,占优均衡就是所有局中人的占优策略组合起来,就构成占优均衡就构成占优均衡例例 囚徒困境囚徒困境这个对策的占优均衡就是这个对策的占优均衡就是(坦白,坦白坦白,坦白) 第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论14/332022-7-6(三三) 纳什均衡纳什均

14、衡1. 纳什均衡是指:当给定其他人选择策略的前提纳什均衡是指:当给定其他人选择策略的前提下,每个人选择自己的最优策略,把所有局中下,每个人选择自己的最优策略,把所有局中人选择的最优策略组合起来,就构成纳什均衡人选择的最优策略组合起来,就构成纳什均衡2. 在在“囚徒困境囚徒困境”中,策略组合中,策略组合(坦白,坦白坦白,坦白) 既既是占优均衡,又是纳什均衡是占优均衡,又是纳什均衡例例1 猜硬币模型猜硬币模型 两个局中人都不存在占优两个局中人都不存在占优策略,也不存在占优均衡,策略,也不存在占优均衡,却存在纳什策略和纳什均衡却存在纳什策略和纳什均衡 第二节第二节 完全信息对策完全信息对策第五篇-第

15、十六章 对策论15/332022-7-6第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论16/332022-7-6二、完全信息动态对策二、完全信息动态对策(一一) 动态对策动态对策例例市场进入阻扰模型市场进入阻扰模型l若为静态对策,从收益矩阵可若为静态对策,从收益矩阵可见存在两个纳什均衡:见存在两个纳什均衡:(进入,进入,合作合作) 与与(不进入,斗争不进入,斗争) l若为动态对策,根据逆向递推若为动态对策,根据逆向递推的思路,可剔除一个纳什均衡的思路,可剔除一个纳什均衡(不进入,斗争不进入,斗争) ,则动态对策,则动态对策中各局中人理性选择的唯一纳中各局中人理性选择的唯一纳什均

16、衡是什均衡是(进入,合作进入,合作) 第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论17/332022-7-6l逆推法逆推法(backward induction) :在一般的有限:在一般的有限次对策中,逆推法均可用于求解均衡问题,即次对策中,逆推法均可用于求解均衡问题,即首先从对策树的末端开始,求解末端的子对策首先从对策树的末端开始,求解末端的子对策均衡,然后将求出的均衡解取代该子对策均衡,然后将求出的均衡解取代该子对策l在完全信息动态条件下,如果原对策的所有子在完全信息动态条件下,如果原对策的所有子对策均达到纳什均衡,则称整个对策均衡为子对策均达到纳什均衡,则称整个对策均衡

17、为子对策完美纳什均衡对策完美纳什均衡l承诺行动是指当事人使自己的威胁策略变成可承诺行动是指当事人使自己的威胁策略变成可以置信的行动。不可置信的威胁,则称空洞威以置信的行动。不可置信的威胁,则称空洞威胁胁第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论18/332022-7-6(二二) 重复对策重复对策l重复对策是一种特殊的完全信息动态对策,指重复对策是一种特殊的完全信息动态对策,指同样结构的对策重复多次同样结构的对策重复多次l重复对策可能是有限次的,也可能是无限次的重复对策可能是有限次的,也可能是无限次的l重复对策的均衡结果,往往与一次性对策不同,重复对策的均衡结果,往往与一次性

18、对策不同,有限次对策的均衡结果,也与无限次重复对策有限次对策的均衡结果,也与无限次重复对策的均衡结果不同的均衡结果不同第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论19/332022-7-6例例 无限重复囚徒困境无限重复囚徒困境l囚徒困境中重复进行无限次时假定囚徒困境中重复进行无限次时假定uA,B均追求效用最大化,并用均追求效用最大化,并用 U1,U2,Un, 分别表示分别表示A在各在各 个子对策中获得的收益个子对策中获得的收益uA,B收益或效用的贴现系数为收益或效用的贴现系数为 a,且,且a=1/(1+i) ,其中,其中i为利率为利率lA在所有子对策在所有子对策中所获收益的贴

19、现值之和可中所获收益的贴现值之和可表示为表示为1A) 1(nnUnaU第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论20/332022-7-6l此时,局中人考虑的是所有未来收益的贴现值之和,此时,局中人考虑的是所有未来收益的贴现值之和,而不是一次性的收益。如果而不是一次性的收益。如果A提出彼此抵赖的合作建议,提出彼此抵赖的合作建议,并威胁说:如果你中途变卦,我也将一直坦白,对你并威胁说:如果你中途变卦,我也将一直坦白,对你惩罚。若施行威胁带来的重复对策贴现值之和,大于惩罚。若施行威胁带来的重复对策贴现值之和,大于不施行威胁的重复对策贴现值之和,威胁变得可以置不施行威胁的重复对策

20、贴现值之和,威胁变得可以置信信l若若A与与B相互合作,均一直抵赖,可知在每一个子对策相互合作,均一直抵赖,可知在每一个子对策中中A的收益值为的收益值为U1=U2=Un=-1,设,设a=0.9贴现值贴现值之和为之和为l同理,可得局中人同理,可得局中人B所获收益所获收益 的贴现值之和为的贴现值之和为uB=-10 10) 1(9 . 01) 1(AnnU第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论21/332022-7-6l若若A与与B不能相互合作,一直选择坦白策略,同不能相互合作,一直选择坦白策略,同样可以得到样可以得到A与与B在每一个子对策中所获收益贴在每一个子对策中所获收益贴

21、现值之和现值之和l由于由于UAUA,UBUB。这说明双方进行合作。这说明双方进行合作的承诺是可以置信的。在无限重复的囚犯困境对的承诺是可以置信的。在无限重复的囚犯困境对策中,子对策完美纳什均衡应为策中,子对策完美纳什均衡应为(抵赖,抵赖抵赖,抵赖) ,达到了个人利益与集体利益同时最优,囚犯困境达到了个人利益与集体利益同时最优,囚犯困境的特征也随之消失的特征也随之消失 l如果重复的对策是有限次,则采用逆推法可以证如果重复的对策是有限次,则采用逆推法可以证明,局中人将像一次性对策中那样,将选择明,局中人将像一次性对策中那样,将选择(坦坦白,坦白白,坦白),继续陷入困境之中,继续陷入困境之中A=-5

22、0,-50UU B 第二节第二节 完全信息对策完全信息对策第五篇-第十六章 对策论22/332022-7-6第三节第三节 不完全信息对策不完全信息对策一、不完全信息静态对策一、不完全信息静态对策 例例 不完全信息市场进入不完全信息市场进入阻扰模型阻扰模型l在前述市场进入阻挠模型在前述市场进入阻挠模型中增加假定:中增加假定:(1)在位者成本函数有两种类型:在位者成本函数有两种类型: 高成本与低成本;高成本与低成本;(2)在位者有完全信息,进入者有不完全信息在位者有完全信息,进入者有不完全信息图图(a)存在两个纳什均衡:存在两个纳什均衡:(进入,合作进入,合作)与与(不进入,不进入,斗争斗争),其

23、中,其中(不进入,斗争不进入,斗争)应予剔除。图应予剔除。图(b)存在存在一个纳什均衡:一个纳什均衡:(不进入,斗争不进入,斗争)第五篇-第十六章 对策论23/332022-7-6l如果进入者知道在位者为高成本,选择进入策略;如果如果进入者知道在位者为高成本,选择进入策略;如果知道在位者为低成本,选择不进入知道在位者为低成本,选择不进入 若高成本概率为若高成本概率为P,低成本概率为,低成本概率为(1-P) 选择进入的预期收益为选择进入的预期收益为U1P40(1P) (10) 50P10 选择不进入的预期收益为选择不进入的预期收益为U20P0(1P) 0 当进入者选择进入所获得的预期收益不小于选

24、择不进入当进入者选择进入所获得的预期收益不小于选择不进入所获得的预期收益时,才会选择进入。即所获得的预期收益时,才会选择进入。即U1U2或或50P100 当当P20%时,进入者选择进入策略时,进入者选择进入策略 当当P20%时,进入者选择不进入策略时,进入者选择不进入策略 第三节第三节 不完全信息对策不完全信息对策第五篇-第十六章 对策论24/332022-7-6l由于有限理性和信息壁垒,不完全信息常常由于有限理性和信息壁垒,不完全信息常常成为局中人所处的现实环境成为局中人所处的现实环境 局中人并不具备其他局中人策略选择方面的局中人并不具备其他局中人策略选择方面的完全信息,却具备其概率分布方面

25、的完全信完全信息,却具备其概率分布方面的完全信息,这种对策被称为完全但不完美信息对策息,这种对策被称为完全但不完美信息对策 贝叶斯均衡表示这样一种策略组合:在给定贝叶斯均衡表示这样一种策略组合:在给定局中人自己的类型及其他局中人类型概率分局中人自己的类型及其他局中人类型概率分布的情况下,每位局中人的预期收益或预期布的情况下,每位局中人的预期收益或预期效用都达到最大化效用都达到最大化第三节第三节 不完全信息对策不完全信息对策第五篇-第十六章 对策论25/332022-7-6二、不完全信息动态对策二、不完全信息动态对策例例 蜈蚣对策蜈蚣对策l运用逆推法可得:局中人运用逆推法可得:局中人A在对策开始

26、时将会直接选择在对策开始时将会直接选择D,结果是,结果是A与与B各获得仅为各获得仅为1的收益的收益 第三节第三节 不完全信息对策不完全信息对策第五篇-第十六章 对策论26/332022-7-6l如果如果B具有完全信息,具有完全信息,A具有不完全信息,具有不完全信息,对策进程见下图对策进程见下图第三节第三节 不完全信息对策不完全信息对策不完全信息不完全信息动态蜈蚣对策动态蜈蚣对策第五篇-第十六章 对策论27/332022-7-6lB属于合作者的概率为属于合作者的概率为P,则他属于短期利益至上者的,则他属于短期利益至上者的概率可表示为概率可表示为(1-P) , P 0,1 局 中 人局 中 人 A

27、 首 先 选 择 策 略首 先 选 择 策 略 R 时 , 预 期 收 益 为时 , 预 期 收 益 为U1=100P+0(1-P) =100P 当当A首先选择策略首先选择策略D时,预期收益为时,预期收益为U2=1P+1(1-P) =1 当当U1U2或或100P1时,时,A首先选择首先选择R所获得的预期收所获得的预期收益不小于选择益不小于选择D所获得的预期收益,他会先选择所获得的预期收益,他会先选择R 此对策的一个纳什均衡是:不管此对策的一个纳什均衡是:不管B属于哪种类型,在属于哪种类型,在前面的子对策阶段里,前面的子对策阶段里,A将选择将选择R,B将选择将选择r, (R,r)也是唯一可置信的

28、纳什均衡。在不完全信息动态对策也是唯一可置信的纳什均衡。在不完全信息动态对策问题中,这种均衡被称为完美贝叶斯均衡问题中,这种均衡被称为完美贝叶斯均衡 第三节第三节 不完全信息对策不完全信息对策第五篇-第十六章 对策论28/332022-7-6第四节第四节 进化对策进化对策一、进化对策论与经典对策论一、进化对策论与经典对策论1. 源于冯源于冯诺依曼、摩根斯坦,经纳什发展起来诺依曼、摩根斯坦,经纳什发展起来的经典对策论,要求局中人具有完全理性,这的经典对策论,要求局中人具有完全理性,这在现实中是很难得到满足的在现实中是很难得到满足的2. 进化对策论针对有限理性经济个体所组成的大进化对策论针对有限理性经济个体所组成的大群体,在多次对策背景下的进化力量,研究策群体,在多次对策背景下的进化力量,研究策略行为的稳键性,可以解释有限理性、程序理略行为的稳键性,可以解释有限理性、程序理性乃至无意识的本能行为,是一种全新的经济性乃至无意识的本能行为,是一种全新的经济预测研究方法预测研究方法 第五篇-第十六章 对策论29/332022-7-6二、进化对策的基本理论二、进化对策的基本理论(一一) 进化稳定策略进化稳定策略 进化稳定策略进化稳定策略(evolutionaily stable strategy,ESS) 代表一个种群

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论