




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1第十章第十章 博弈论初步博弈论初步 博弈论和策略行为 同时博弈:纯策略均衡 同时博弈:混合策略均衡 序贯博弈2博弈论和策略行为博弈论和策略行为博弈论博弈论(对策论对策论): 研究在策略性环境中如何进行策略性决策、采取策略性行动的科学研究前提:研究前提: 策略性环境每个人的决策和行动都会影响到其他人的这样一种作用关系研究内容:策略性对策和策略性行动研究内容:策略性对策和策略性行动策略性对策当事人根据其他有关者的可能反应来作出决策策略性行动当事人考虑其他有关者的可能反应而采取行动博弈论的三个基本要素博弈论的三个基本要素参与人(局中人)博弈中的决策个体,至少应有二人参与人的策略参与人选择什么情况下
2、采取什么行动的规则,通常至少应有两种策略可供选择参与人的支付博弈的所有参与人可采用的每种策略的组合决定的博弈完成时每个参与人能够能够获得或可期望可期望获得的效用。博弈的基本类型博弈的基本类型二人博弈与多人博弈零和博弈与非零和博弈有限博弈与无限博弈同时博弈与序贯博弈3第二节第二节 同时博弈:纯策略均衡同时博弈:纯策略均衡 同时博弈与序贯博弈 条件策略与条件策略组合 纳什均衡 双方同时博弈的一般理论(略)4同时博弈与序贯博弈同时博弈与序贯博弈 同时博弈与序贯博弈同时博弈与序贯博弈 同时博弈同时博弈参与人的决策没有先后差异的博弈,就是说,没有人参与人的决策没有先后差异的博弈,就是说,没有人是在知道别
3、人的决策之后才作决策的是在知道别人的决策之后才作决策的 序贯博弈序贯博弈参与人的决策有先后顺序的博弈,后决策的人可以根参与人的决策有先后顺序的博弈,后决策的人可以根据别人已作的决策作出对应的决策。据别人已作的决策作出对应的决策。 支付矩阵:支付矩阵:表明两个参与人同时决策的策略组合和各自支付的矩阵表明两个参与人同时决策的策略组合和各自支付的矩阵例题:甲、乙两家寡头在是否遵守卡特尔协议方面(卡特尔:独立厂商共同建立的合例题:甲、乙两家寡头在是否遵守卡特尔协议方面(卡特尔:独立厂商共同建立的合作控制市场的价格同盟),都可选择合作或不合作的策略。如果双方合作,则甲、乙作控制市场的价格同盟),都可选择
4、合作或不合作的策略。如果双方合作,则甲、乙分别得到的支付是分别得到的支付是5,6;双方都不合作,则分别得到;双方都不合作,则分别得到2,3;如果甲合作而乙不合作,;如果甲合作而乙不合作,则甲得则甲得1,乙得,乙得5;如果甲不合作而乙合作,则甲得;如果甲不合作而乙合作,则甲得7,乙得,乙得1。寡头甲寡头甲寡头乙寡头乙合合作作不合不合作作合作合作不合作不合作5,61,57,12,3 支付矩阵的结构支付矩阵的结构 最左方、最上方分别表示两个参与人最左方、最上方分别表示两个参与人 左起第二列、上起第二行分别列出各自的可能策略左起第二列、上起第二行分别列出各自的可能策略 它们右下方的各单元格分别表示双方
5、的各种策略组合它们右下方的各单元格分别表示双方的各种策略组合 上述各单元格内数字表示各策略组合下各参与人得到的上述各单元格内数字表示各策略组合下各参与人得到的支付,其中前一数字对应左方,后一数字对应上方支付,其中前一数字对应左方,后一数字对应上方 也可把该矩阵拆成两个也可把该矩阵拆成两个“子矩阵子矩阵”,如蓝、红色分别所,如蓝、红色分别所示示5条件策略与条件策略组合条件策略与条件策略组合 条件策略条件策略:参与人在假定其他参与人选择某一策略的条件下筛选出来参与人在假定其他参与人选择某一策略的条件下筛选出来的对自己而言最优的策略,称为的对自己而言最优的策略,称为“条件优势策略条件优势策略”或或“
6、相对优势策略相对优势策略”,简称,简称“条件策略条件策略”。 对例题中的甲而言,假定乙合作,那么甲合作只能得到对例题中的甲而言,假定乙合作,那么甲合作只能得到5,不合作却能,不合作却能得到得到7,因此不合作是乙合作条件下甲的条件策略;假定乙不合作,那么,因此不合作是乙合作条件下甲的条件策略;假定乙不合作,那么甲的条件策略也是不合作,该策略的支付为甲的条件策略也是不合作,该策略的支付为2,比合作策略的支付多,比合作策略的支付多1。 对乙而言,如果假定甲合作,那么乙合作的支付为对乙而言,如果假定甲合作,那么乙合作的支付为6,比不合作的支付,比不合作的支付多多1,因此合作是甲合作条件下乙的条件策略;
7、假定甲不合作,那么乙的,因此合作是甲合作条件下乙的条件策略;假定甲不合作,那么乙的条件策略是也不合作,乙若合作支付只有条件策略是也不合作,乙若合作支付只有1,不合作则可得到,不合作则可得到3。 条件策略组合:条件策略组合:参与人以其他参与人选择某一策略为条件的条件策略与参与人以其他参与人选择某一策略为条件的条件策略与作为它的条件的对方策略之间的组合,称为作为它的条件的对方策略之间的组合,称为“条件优势策略组合条件优势策略组合”或或“相相对优势策略组合对优势策略组合”,简称,简称“条件策略组合条件策略组合”。 甲有两个条件策略组合:甲有两个条件策略组合: 不合作,不合作,合作合作;不合作,;不合
8、作,不合作不合作 乙的两个条件策略组合则是:乙的两个条件策略组合则是: 合作,合作,合作合作;不合作,;不合作,不合作不合作6纳什均衡纳什均衡 纳什均衡概念:纳什均衡概念:所有参与人之间的这样一种策略组合,他们中任何人都所有参与人之间的这样一种策略组合,他们中任何人都不会单独改变策略,因为单独改变策略对自己没有好处。参与人之间的不会单独改变策略,因为单独改变策略对自己没有好处。参与人之间的博弈由此得到最终结果。博弈由此得到最终结果。 在支付矩阵中寻找纳什均衡:条件策略下划线法在支付矩阵中寻找纳什均衡:条件策略下划线法分别在两个参与人各条件策略的己方支付值下划一横线,再找出双方支付分别在两个参与
9、人各条件策略的己方支付值下划一横线,再找出双方支付值下都有横线的单元格,它就表示纳什均衡实现时的支付情况,它对应的值下都有横线的单元格,它就表示纳什均衡实现时的支付情况,它对应的策略组合就是所寻找的均衡策略组合。策略组合就是所寻找的均衡策略组合。划线法可采用以下五个步骤:划线法可采用以下五个步骤:把支付矩阵分解为两个参与人各自的子支付矩阵把支付矩阵分解为两个参与人各自的子支付矩阵为左方参与人找出子支付矩阵中各列的最大值并划线为左方参与人找出子支付矩阵中各列的最大值并划线为上方参与人找出子支付矩阵中各行的最大值并划线为上方参与人找出子支付矩阵中各行的最大值并划线把划线后的两个子矩阵合并为共同的支
10、付矩阵把划线后的两个子矩阵合并为共同的支付矩阵由共同支付矩阵中两个数字下都划线的单元格,可找到均衡策略组合由共同支付矩阵中两个数字下都划线的单元格,可找到均衡策略组合 关于纳什均衡关于纳什均衡“存在性、唯一性、最优性存在性、唯一性、最优性”的说明的说明同时博弈中,纳什均衡可能存在,也可能同时博弈中,纳什均衡可能存在,也可能不存在不存在如果纳什均衡存在,它可能是唯一的,也可能如果纳什均衡存在,它可能是唯一的,也可能不是不是。如果纳什均衡存在,它可能是最优的,也可能如果纳什均衡存在,它可能是最优的,也可能不是不是。最优,但非均衡的组合最优,但非均衡的组合纳什均衡组合,但非最优纳什均衡组合,但非最优
11、7第三节第三节 同时博弈:混合策略均衡同时博弈:混合策略均衡 不存在纯策略均衡时的混合策略均衡 存在纯策略均衡时的混合策略均衡 混合策略博弈的一般理论(略)8不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡1纯策略与混合策略纯策略与混合策略 纯策略:纯策略:右表中策略组合的纳什均衡不存在,但每个参与人在右表中策略组合的纳什均衡不存在,但每个参与人在给定对方策略的条件下选择的策略都是确定的,换句话说,他在己给定对方策略的条件下选择的策略都是确定的,换句话说,他在己方的策略选择中都处于非此即彼的状态。前面分析的其他支付矩阵中如果存在纳什方的策略选择中都处于非此即彼的状态。前面分析的
12、其他支付矩阵中如果存在纳什均衡,那么在均衡的策略组合中双方各自的策略也是确定的、鱼与熊掌不可兼得的。均衡,那么在均衡的策略组合中双方各自的策略也是确定的、鱼与熊掌不可兼得的。这种在给定对方策略条件下只能选一种确定策略的组合叫这种在给定对方策略条件下只能选一种确定策略的组合叫“纯策略组合纯策略组合”。 混合策略:混合策略:“剪刀、石头、帕子剪刀、石头、帕子”游戏(划拳也类似)每次仍属同时博弈,如果游戏(划拳也类似)每次仍属同时博弈,如果对方前几次总是出石头,这一次己方的条件策略似乎该以帕子战胜石头。但对方并对方前几次总是出石头,这一次己方的条件策略似乎该以帕子战胜石头。但对方并没患手指蜷挛症、只
13、会出石头。他估计对手很可能出帕子,他就可能不再出石头而没患手指蜷挛症、只会出石头。他估计对手很可能出帕子,他就可能不再出石头而变为出剪刀。己方估计他可能改变策略,己方就不一定出帕子,而可能学对方出石变为出剪刀。己方估计他可能改变策略,己方就不一定出帕子,而可能学对方出石头,对方不变则战平,对方变剪刀则己方胜。双方都不能确定对方下次的策略,只头,对方不变则战平,对方变剪刀则己方胜。双方都不能确定对方下次的策略,只能估计对方选择每种策略的概率;己方下次的策略也不是确定的,而有多种可能,能估计对方选择每种策略的概率;己方下次的策略也不是确定的,而有多种可能,各种策略的选择按一定概率分布。这种选择不同
14、策略间分布概率的做法叫各种策略的选择按一定概率分布。这种选择不同策略间分布概率的做法叫“混合策混合策略略”.“纯策略纯策略”可看作各策略被选中的概率非可看作各策略被选中的概率非1即即0,作为,作为“混合策略混合策略”的一种特例。的一种特例。 在支付矩阵中反映混合策略,可在左方第在支付矩阵中反映混合策略,可在左方第1、2列和上列和上方第方第1、2行之间分别插入一列、行,用数字分别注明各策行之间分别插入一列、行,用数字分别注明各策略被选择的概率略被选择的概率(p1,p2)、(q1,q2)等。等。(p1,p2)、 (q1,q2)等在这里被称为等在这里被称为“概率向量概率向量”。乙乙甲甲9不存在纯策略
15、均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡2 混合策略组合混合策略组合:采取混合策略的各参与人的混合策略的组合,称为采取混合策略的各参与人的混合策略的组合,称为“混合策略组合混合策略组合”,可用各参与人混合策略概率向量的组合表示。例如,甲,可用各参与人混合策略概率向量的组合表示。例如,甲与乙的混合策略概率向量分别为(与乙的混合策略概率向量分别为(p1,p2)、()、(q1,q2),那么他们的混),那么他们的混合策略组合就可表示为概率向量组合(合策略组合就可表示为概率向量组合( (p1,p2),(),(q1,q2) )。)。 期望支付:期望支付:在混合策略博弈中,每个混合策略组合有各自
16、的支付组合,在混合策略博弈中,每个混合策略组合有各自的支付组合,但每个参与人得到的支付是他的各种纯策略应获的支付的加权平均数,称但每个参与人得到的支付是他的各种纯策略应获的支付的加权平均数,称为期望支付。加权用的权数,为与各单元格对应的双方每个策略组合中各为期望支付。加权用的权数,为与各单元格对应的双方每个策略组合中各种纯策略被采用的概率之积,也就是该策略组合被采用的概率。种纯策略被采用的概率之积,也就是该策略组合被采用的概率。 假定下表中参与人甲、乙的混合策略概率向量分别为(假定下表中参与人甲、乙的混合策略概率向量分别为(0.6 , 0.4)与)与(0.3 , 0.7),他们将有混合策略组合
17、(),他们将有混合策略组合( ( 0.6 , 0.4 ), ( 0.3 , 0.7 ) ) 参考右下角调整后的支付矩阵参考右下角调整后的支付矩阵 .6.4.3.7 那么,甲的期望支付为:那么,甲的期望支付为:E甲甲= p1q14 + p1q29 + p2q17 + p2q22 (式式甲甲) = 0.60.34 + 0.60.79+ 0.40.37+ 0.40.72 = 5.90 。E乙乙= p1q16 + p1q21 + p2q13 + p2q28 = 3.20 (式式乙乙) 由于由于p1,p2和和q1,q2的取值有无限多的可能,的取值有无限多的可能,混合策略组合及其支付也就有无限多的可能。混
18、合策略组合及其支付也就有无限多的可能。10不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡3 条件混合策略:条件混合策略:参与人在假定其他参与人按某一概率选择某一策略参与人在假定其他参与人按某一概率选择某一策略的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合的条件下设计的对自己而言具有相对优势的(即期望支付最大的)混合策略,称为策略,称为“条件混合策略条件混合策略”。 假定(假定(p1,p2)、()、(q1,q2)的取值从)的取值从0到到1有无限多可能,把有无限多可能,把p2=1-p1和和q2=1-q1代入甲与乙各自的期望支付表达式代入甲与乙各自的期望支付表达式
19、,经整理可得:,经整理可得: E甲甲= p1(710q1)+5q1+2(式(式1);); E乙乙= 5q1(2p11)7p1+8(式(式2) 每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时,每个参与人需要确定,在另一参与人为其混合策略选择某个概率值时,己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。己方混合策略的概率向量应怎样取值,才能使自己的期望支付最大。 对式对式1的讨论:的讨论:当当710q10时,时, E甲甲随随p1同向变动,为使同向变动,为使E甲甲最大,最大, p1应取其可达的最大值应取其可达的最大值1 ;当当710q10时,时, E甲甲随随p1反向变动,为
20、使反向变动,为使E甲甲最大,最大, p1应取其可达的最小值应取其可达的最小值0 ;当当710q1=0时,时, E甲甲与与p1无关,无关, p1可在可在0与与1之间(含之间(含0和和1)任意取值而)任意取值而E甲甲不变。不变。于是,参与人甲的条件混合策略可表达为:于是,参与人甲的条件混合策略可表达为: 1 q10.7 0,1 q1 = 0.7 0 q10.7 用同样方法讨论式用同样方法讨论式2,可得到乙的条件混合策略,可得到乙的条件混合策略: 0 p10.5 0,1 p1 = 0.5 1 p1 0.5P1=q1=11不存在纯策略均衡时的混合策略均衡不存在纯策略均衡时的混合策略均衡4 0 p10.
21、5 0,1 p1 = 0.5 1 p1 0.5p1=q1= 1 q10.7 0,1 q1 = 0.7 0 q10.7 混合策略的纳什均衡:混合策略的纳什均衡:当博弈双方中任何一方选择某种混合策略当博弈双方中任何一方选择某种混合策略时,另一方选择的混合策略都能使另一方的期望支付达到最大的博弈均衡时,另一方选择的混合策略都能使另一方的期望支付达到最大的博弈均衡状态。因此任何一方都不会偏离自己选择的混合策略,因为偏离不能给自状态。因此任何一方都不会偏离自己选择的混合策略,因为偏离不能给自己带来任何好处。己带来任何好处。 混合策略纳什均衡图混合策略纳什均衡图 根据前面分析出的甲乙两位参与人各自的条件混
22、合策略(见本页下方),根据前面分析出的甲乙两位参与人各自的条件混合策略(见本页下方),可以在以甲、乙各自的概率可以在以甲、乙各自的概率p1、q1为两轴的平面坐标系中绘出甲、乙各自的为两轴的平面坐标系中绘出甲、乙各自的混合策略曲线。混合策略曲线。 甲的混合策略曲线(以蓝色表示)和乙的混合策略曲线(以红色表示)相甲的混合策略曲线(以蓝色表示)和乙的混合策略曲线(以红色表示)相交于交于e点,点, e点的混合策略组合就实现混合策略博弈的纳什均衡。点的混合策略组合就实现混合策略博弈的纳什均衡。 e点的坐标是点的坐标是p1=0.5,q1=0.7,则纳什均衡,则纳什均衡时时p2=0.5,q2=0.3 。 本
23、题中混合策略的纳什均衡还可表示为:本题中混合策略的纳什均衡还可表示为:(p1 , p2),(q1 ,q2) )= (0.5 , 0.5),(0.7 , 0.3) )。 本题中,只有唯一的这个纳什均衡点。本题中,只有唯一的这个纳什均衡点。q1p1O10.70.51e12存在纯策略均衡时的混合策略均衡存在纯策略均衡时的混合策略均衡 在混合策略博弈中求纳什均衡解的方法,也适用于纯策略纳什均衡的分析。在混合策略博弈中求纳什均衡解的方法,也适用于纯策略纳什均衡的分析。 以本章开始时分析过的两个寡头是否遵守卡特尔协议与对方合作的纯策略博以本章开始时分析过的两个寡头是否遵守卡特尔协议与对方合作的纯策略博弈为
24、例,假定甲与乙选择合作策略的概率分别为弈为例,假定甲与乙选择合作策略的概率分别为p1与与q1,选择不合作的概率分别为,选择不合作的概率分别为p2(=1p1)与)与 q2(=1q1 ) ,形成下面的支付矩阵。把,形成下面的支付矩阵。把p2=1p1与与q2=1q1代入代入甲与乙各自的期望支付表达式,经整理可得:甲与乙各自的期望支付表达式,经整理可得: E甲甲= p1(1+q1)+5q1+2 (式(式1); E乙乙= q1(3p12)+ 2p1+3 (式(式2) 由式由式1可知可知E甲甲随随p1而反向变动,为了使而反向变动,为了使E甲甲最大化,最大化, p1应尽可能小,因此甲的条应尽可能小,因此甲的
25、条件混合策略是件混合策略是 p1 =0 0 q1 1。这实际上是个纯策略。这实际上是个纯策略。 由式由式2得到乙的条件混合策略:得到乙的条件混合策略: 0 p12/3 0,1 p1 = 2/3 1 p12/3 纳什均衡点就在原点,与纯策略博弈的均衡相同,双方都选择不合作的策略。纳什均衡点就在原点,与纯策略博弈的均衡相同,双方都选择不合作的策略。 q1p11o2/31q1 =因此,纯策略博弈是混合策略博弈的特例因此,纯策略博弈是混合策略博弈的特例纯策略博弈均衡是混合策略博弈均衡的特例纯策略博弈均衡是混合策略博弈均衡的特例13序贯博弈和博弈树序贯博弈和博弈树 序贯博弈的参与人决策有先后之分,后决策
26、者可以根据先决策者的策略作出决策。例如,序贯博弈的参与人决策有先后之分,后决策者可以根据先决策者的策略作出决策。例如,某市场原来被垄断者独家控制,有潜在的竞争者可能进入该市场。竞争者先决策:是否进入;某市场原来被垄断者独家控制,有潜在的竞争者可能进入该市场。竞争者先决策:是否进入;垄断者后决策:是否抵抗。左下方的支付矩阵表示他们的各个策略组合及其支付组合。垄断者后决策:是否抵抗。左下方的支付矩阵表示他们的各个策略组合及其支付组合。 也可用博弈树进一步表示参与者的决策顺序。博弈树有一个起点(先决策者的决策点,也可用博弈树进一步表示参与者的决策顺序。博弈树有一个起点(先决策者的决策点,注明何人决策
27、)、不止一个中间点(后决策者的决策点,注明何人决策)与若干终点(策略组注明何人决策)、不止一个中间点(后决策者的决策点,注明何人决策)与若干终点(策略组合的结果点,注明支付组合),按时间和逻辑顺序排列,并以字母或数字排序。起点与中间点合的结果点,注明支付组合),按时间和逻辑顺序排列,并以字母或数字排序。起点与中间点之间、中间点与终点之间,以线段连接(策略线,注明发出该线段的决策者的策略)。之间、中间点与终点之间,以线段连接(策略线,注明发出该线段的决策者的策略)。竞争者竞争者垄断垄断者者垄断垄断者者进进不进不进容忍容忍容容忍忍抵抗抵抗抵抗抵抗(1,4)(-2,2)(0,5)(0,3)abcde
28、fg竞争者竞争者垄断者模型的博弈树垄断者模型的博弈树 右下方图中的决策顺序表示为由左右下方图中的决策顺序表示为由左向右,象左面生根而向右发出枝条的向右,象左面生根而向右发出枝条的“树树”,故称,故称“博弈树博弈树”。它也可由下向。它也可由下向上上“生长生长”,或向左、向下,或向左、向下“生长生长”。 有的终点的支付状况会引起下一轮博有的终点的支付状况会引起下一轮博弈,它就成为新起点(实际是新的弈,它就成为新起点(实际是新的“中间中间决策点决策点”),长出新的博弈树),长出新的博弈树 “枝条枝条”。14序贯博弈的纳什均衡序贯博弈的纳什均衡 在有的序贯博弈中可能实现纳什均衡。以左下方的支付矩阵为例
29、,就有唯一在有的序贯博弈中可能实现纳什均衡。以左下方的支付矩阵为例,就有唯一的纳什均衡策略组合:进入,容忍。每个参与人都不愿意单独改变自己的策略,的纳什均衡策略组合:进入,容忍。每个参与人都不愿意单独改变自己的策略,因为变更至少无益于己。设想竞争者改选均衡组合所在列的其他组合,或垄断者因为变更至少无益于己。设想竞争者改选均衡组合所在列的其他组合,或垄断者改选均衡组合所在行的其他组合,都将看到变卦者的损失。双方的其他策略组合改选均衡组合所在行的其他组合,都将看到变卦者的损失。双方的其他策略组合都不是纳什均衡。至少有一个参与者如果单独改变策略就能增加己方的支付。都不是纳什均衡。至少有一个参与者如果
30、单独改变策略就能增加己方的支付。 序贯博弈也许有不止一个纳什均衡的策略组合。以左下方支付矩阵表示的情序贯博弈也许有不止一个纳什均衡的策略组合。以左下方支付矩阵表示的情侣博弈模型为例,恋爱中的男女如何度周末?可以在看足球赛与欣赏芭蕾舞这两侣博弈模型为例,恋爱中的男女如何度周末?可以在看足球赛与欣赏芭蕾舞这两个策略中选择。男方先决策,他可能约情侣看球赛;女方后决策,如果愿意看球个策略中选择。男方先决策,他可能约情侣看球赛;女方后决策,如果愿意看球赛,策略组合就是(足球,足球)赛,策略组合就是(足球,足球) ;如果不愿,自己去看芭蕾,策略组合就成为;如果不愿,自己去看芭蕾,策略组合就成为(足球,芭蕾
31、)。男方也可能投女方所好,建议一起看芭蕾,女方乐意,就有策(足球,芭蕾)。男方也可能投女方所好,建议一起看芭蕾,女方乐意,就有策略组合(芭蕾,芭蕾);理论上还有(芭蕾,足球)策略组合的可能。每个策略略组合(芭蕾,芭蕾);理论上还有(芭蕾,足球)策略组合的可能。每个策略组合给恋爱中双方带来不同感受,形成矩阵中的不同支付组合。俩人同度周末,组合给恋爱中双方带来不同感受,形成矩阵中的不同支付组合。俩人同度周末,看什么都行,谁拆台谁自己都会受损,就有两种纳什均衡,也叫多重纳什均衡。看什么都行,谁拆台谁自己都会受损,就有两种纳什均衡,也叫多重纳什均衡。15纳什均衡的精炼:逆向归纳法纳什均衡的精炼:逆向归
32、纳法1在多重纳什均衡中,有的纳什均衡未必合理。例如情侣博弈中男方先决在多重纳什均衡中,有的纳什均衡未必合理。例如情侣博弈中男方先决策却出现策却出现“芭蕾,芭蕾芭蕾,芭蕾”策略组合的纳什均衡,就可能使人质疑男方决策略组合的纳什均衡,就可能使人质疑男方决策的理性问题。策的理性问题。可以采用逆向归纳法对纳什均衡实行精炼处理,排除不合理的纳什均衡。可以采用逆向归纳法对纳什均衡实行精炼处理,排除不合理的纳什均衡。做法是,从博弈最后阶段的每个决策点出发,确定决策者选择的策略,做法是,从博弈最后阶段的每个决策点出发,确定决策者选择的策略,剔除他放弃的策略,使博弈模型得到简化;再对上一阶段的策略作类似剔除他放弃的策略,使博弈模型得到简化;再对上一阶段的策略作类似处理,直到博弈模型最简,这个最简博弈就是原模型的解。处理,直到博弈模型最简,这个最简博弈就是原模型的解。以情侣博弈为例,最后阶段决策以女方为决策者。她在两个决策点各可以情侣博弈为例,最后阶段决策以女方为决策者。她在两个决策点各可从两种策略中选一种。根据她可获的支付情况之间的比较,可从每个决从两种策略中选一种。根据她可获的支付情况之间的比较,可从每个决策点删除一种对她相对不利的策略,于策点删除一种对她相对不利的策略,于 是情侣模型被初步简化。是情侣模型被
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网上如何签租赁合同协议
- 项目工程补充协议书模板
- 给工地提供劳务合同范本
- 电梯文明施工责任协议书
- 网店代运营协议合同范本
- 矿山金属冶炼转让协议书
- 球鞋合同解约协议书范本
- 法律合同保密协议书范本
- 自愿提前解除合同协议书
- 环保低压泵租赁合同范本
- 2025中国成人ICU镇痛和镇静治疗指南解读
- 曲靖市罗平县人民医院招聘考试真题2024
- 战术搜索教学课件
- 公园水面安全管理办法
- 2025年福建厦门港务控股集团有限公司招聘考试笔试试题(含答案)
- 2025年长三角湖州产业招聘笔试备考题库(带答案详解)
- 2025包头辅警考试真题
- 2025至2030中国高端英语培训行业市场发展分析及发展趋势与投资机会报告
- 地质灾害治理工程施工安全管理制度
- 2025年茶艺师职业技能鉴定考试试卷(含答案)
- 中央党校师资管理制度
评论
0/150
提交评论