版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、主要(zhyo)内容简介第一章 概述-人生(rnshng)处处皆博弈第一篇 非合作博弈理论第二章 完全信息静态信息博弈-纳什均衡第三章 完全信息动态搏弈-子博弈精炼纳什均衡第四章 不完全信息静态博弈-贝叶斯纳什均衡第五章 不完全信息动态博弈-精练贝叶斯纳什均衡第1页/共71页第一页,共72页。n第二篇 信息经济学n 第六章 委托- -代理理论(I I)n 第七章 委托- -代理理论(IIII)n 第八章 逆向选择(xunz)(xunz)与信号传递n 主要(zhyo)内容简介第2页/共71页第二页,共72页。第三章 完全信息动态搏弈 -子博弈(b y)精炼纳什均衡n 一 博弈扩展式表述n 二 子
2、博弈精练(jnglin)纳什均衡n 三 应用举例第3页/共71页第三页,共72页。博弈的战略博弈的战略(zhnl)表述表述案例- 房地产开发项目-假设有A、B两家开发商市场需求:可能(knng)大,也可能(knng)小投入:1亿v假定市场上有两栋楼出售:v需求大时,每栋售价1.4亿,v需求小时,售价7千万(qinwn);v如果市场上只有一栋楼v需求大时,可卖1.8亿v需求小时,可卖1.1亿第4页/共71页第四页,共72页。博弈战略博弈战略(zhnl)表述表述40004000,4000400080008000,0 00 0,800080000 0,0 0不开发(kif)开发商A开发(kif)不开
3、发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的战略式表述第5页/共71页第五页,共72页。一一 博弈博弈(b y)扩展式表述扩展式表述 博弈的扩展式表述包括三个要素: 参与人集合(jh) 每个参与人的战略集合(jh) 由战略组合决定的每个参与人的支付进入(jnr)者进入不进入(0,300)在位者市场进入阻挠博弈树不可置信威胁合作(40,50)斗争(-10,0)第6页/共71页第六页,共72页。A开发(kif)不开发(kif)NN大小1
4、/21/2大小1/21/2BBBB开发(kif)不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结,终点结枝结,初始结 信息集第7页/共71页第七页,共72页。一一 博弈博弈(b y)扩展式表述扩展式表述博弈的基本构造结: 包括决策结和终点结两类;决策结是参与人行动的始点,终点结是决策人行动的终点.结满足传递性和非对称性x之前的所有结的集合,称为x的前列集P(x),x之后(zhhu)的
5、所有结的集合称为x的后续集T(x)。枝: 枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:1 每个决策结都是同一个参与人的决策结;2 该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.第8页/共71页第八页,共72页。A开发(kif)不开发(kif)NN大小1/21/2大小1/21/2BBBB开发(kif)不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B在决策时不确切地知道自然的选择; B的
6、决策结由4个变为2个房地产开发博弈第9页/共71页第九页,共72页。A开发(kif)不开发(kif)NN大小1/21/2大小1/21/2BBBB开发(kif)不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的选择;但不知道A的选择(或A、B同时决策) 房地产开发博弈第10页/共71页第十页,共72页。一一 博弈博弈(b y)扩展式表述扩展式表述 只包含一个决策结的信息集称为单结信息集,如果博弈(b y)树的所有信息都是单结的,该博弈(b y)称为完美信息博弈(b y)。 自然总是假定是单结的,因为自然在参与人决
7、策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。 不同的博弈(b y)树可以代表相同的博弈(b y),但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。第11页/共71页第十一页,共72页。二 占优战略(zhnl)均衡 案例(n l)1-囚徒困境-8,-80,-10-10,0-1,-1囚徒(qit)A囚徒 B坦白抵赖坦白抵赖第12页/共71页第十二页,共72页。AB坦白(tnbi)抵赖(dli)BBAA坦白(tnbi)抵赖坦白抵赖(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0,-10)(-10
8、,0)(-1,-1)囚徒困境博弈的扩展式表述囚徒困境博弈的扩展式表述第13页/共71页第十三页,共72页。智猪博弈(b y)的扩展式表述?5,14,49,-10,0等待(dngdi)小猪大猪按等待(dngdi)按案例2-智猪博弈第14页/共71页第十四页,共72页。第三章 完全信息(xnx)动态搏弈 -子博弈精炼纳什均衡n 一 博弈扩展式表述n 二 子博弈精练纳什均衡n 扩展式表述博弈的纳什均衡n 子博弈精练纳什均衡n 用逆向归纳法求子搏弈精练纳什均衡n 承诺行动与子搏弈精练纳什均衡n 逆向归纳法与子搏弈精练纳什均衡的存在问题n 三 应用(yngyng)举例第15页/共71页第十五页,共72页
9、。博弈博弈(b y)(b y)的划分的划分博弈的划分:从参与人行动的先后顺序:静态博弈和动态博弈静态博弈:参与人同时选择行动或非同时行动但后行动者并不知道前行动者采取了什么具体(jt)行动;动态博弈:参与人行动有先后顺序,且后行动者能够观察先行动者选择的行动。第16页/共71页第十六页,共72页。博弈博弈(b y)(b y)的划分的划分v参与人对其他参与人(对手)的特征、战略(zhnl)空间及支付函数的知识:完全信息博弈和不完全信息博弈。v完全信息:每一个参与人对所有其他参与人的(对手)的特征、战略(zhnl)空间及支付函数有准确的 知识,否则为不完全信息。第17页/共71页第十七页,共72页
10、。 博弈(b y)的划分: 行动顺序信息静态动态完全信息完全信息静态博弈纳什均衡纳什(1950,1951)完全信息动态博弈子博弈精练纳什均衡泽尔腾(1965)不完全信息不完全信息静态博弈贝叶斯纳什均衡海萨尼(1967-1968)不完全信息动态博弈精练贝叶斯纳什均衡泽尔腾(1965)Kreps 和Wilson(1982)Fudenberg 和Tirole(1991)第18页/共71页第十八页,共72页。完全信息静态博弈(b y)的特点?占优均衡(jnhng)DSE重复剔除(tch)占优均衡IEDE纯战略纳什均衡PNE混合战略纳什均衡MNE第19页/共71页第十九页,共72页。完全信息动态完全信息
11、动态(dngti)博弈博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 考虑下列问题: 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理? 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有(suyu)其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于前行动者的选择,前行动者在选择时不可能不考虑自己的行动对后行动者的影响。 子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。第20页/共71页第二十页,共72页。一 、博弈(b y)的基本概念及战略表述40004000,4000400080008000,0
12、 00 0,800080000 0,0 0不开发(kif)开发商A开发(kif)不开发开发-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况博弈的战略式表述第21页/共71页第二十一页,共72页。扩展扩展(kuzhn)式式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx纳什均衡纳什均衡(jnhng)(jnhng)与均衡与均衡(jnhng)(jnhng)结果:结果:存在三个纯战略纳什均衡存在三个纯战略纳什均衡(jnh
13、ng)(jnhng): ( (不开发,(开发,开发),不开发,(开发,开发),(开发,(不开发,开发),(开发(开发,(不开发,开发),(开发, ,(不开发,不开发)(不开发,不开发)两个均衡两个均衡(jnhng)(jnhng)结果:结果: (开发,不开发)(开发,不开发) (不开发,开发)(不开发,开发)注意:均衡注意:均衡(jnhng)(jnhng)不同于均衡不同于均衡(jnhng)(jnhng)结果结果到底哪一个均衡结果(ji gu)将最终出现?第22页/共71页第二十二页,共72页。完全信息动态博弈完全信息动态博弈(b y)-子博弈子博弈(b y)精练纳什均衡精练纳什均衡泽尔腾(泽尔腾
14、(1965) 泽尔腾引入子博弈精练(jnglin)纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练(jnglin)纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。第23页/共71页第二十三页,共72页。承诺行动与子博弈(b y)精练纳什均衡n承诺行动与子博弈精练纳什均衡n有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.n这些改变博弈结果而采取的措施称为承诺行动.n完全承
15、诺:承诺可以使某项行动完全没有可能(破釜沉舟(p f chn zhu).n不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.第24页/共71页第二十四页,共72页。承诺行动与子博弈(b y)精练纳什均衡A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发(kif)博弈 如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积(min j)的写字楼,则将支付违约金3.5,这个合同就是承诺行动.(1,-3.5)第25页/共71页第二十五页,共72页。完全完全(wnqun)信息动态博弈信息动态博弈-子博弈精练纳什均衡子博弈精
16、练纳什均衡泽尔腾(泽尔腾(1965) 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时“我军无退路(tul),必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路(tul),操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头反击,袁军大败。第26页/共71页第二十六页,共72页。第三章 完全信息动态搏弈 -子博弈(b y)精炼纳什均衡n 一 博弈扩展式表述n 二 子博弈精练纳什均衡n 扩展式表述博弈的纳什均衡n 子博弈精练纳什均衡n 用逆向归纳法求子搏弈精练纳什均衡n 承诺行动与子搏弈精练纳什均衡n 逆向归纳法与子
17、搏弈精练纳什均衡的存在(cnzi)问题n 三 应用举例第27页/共71页第二十七页,共72页。战略战略(zhnl)的表述的表述战略:参与人在给定信息集的情况下选择行动的规则,它规定战略:参与人在给定信息集的情况下选择行动的规则,它规定(gudng)(gudng)参与参与人在什么情况下选择什么行动,是参与人的人在什么情况下选择什么行动,是参与人的“相机行动方案相机行动方案”。 个人选择的战略表示第)称为一个战略组合,(维向量战略,个参与人每人选择一个如果战略集合个参与人所有可选择的代表第个参与人的特定战略表示第issssssnnisSisiniiii21在静态博弈中,战略(zhnl)和行动是相同
18、的。作为一种行动规则,战略(zhnl)必须是完备的。第28页/共71页第二十八页,共72页。扩展式表述扩展式表述(bio sh)博弈的纳什均衡博弈的纳什均衡足球(zqi)男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球(zqi),芭蕾选择足球(zqi);还是选择芭蕾。女的策略:(足球(zqi),芭蕾),(芭蕾,足球(zqi))(芭蕾,芭蕾),(足球(zqi),足球(zqi))1、追随策略:他选择什么,我就选择什么2、对抗策略:他选择什么,我就偏不选什么3、芭蕾策略:不管他选什么,我都选芭蕾;4、足球(zqi)策略:不管他选什么,我都选足球(zqi)。策略
19、即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。o什么是动态博弈?第29页/共71页第二十九页,共72页。扩展扩展(kuzhn)式表述博弈的纳什均衡式表述博弈的纳什均衡 若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择(xunz)的行动,战略空间为:(开发,不开发); B有两个信息集,四个可选择(xunz)的行动,B有四个纯战略: 开发策略:不论A开发不开发,我开发; 追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 不开发策略不论
20、A开发不开发我不开发, 简写为: (开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),括号内的第一个元素对应A选择(xunz)“开发”时B的选择(xunz),第二个元素对应A选择(xunz)“不开发”时B的选择(xunz)。A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx什么是参与什么是参与(cny)人人的战略?的战略?第30页/共71页第三十页,共72页。扩展扩展(kuzhn)式式-3, -3-3, -31, 01, 00, 10, 00, 10, 0开发(kif),开发(kif)开发(kif),不开发(kif)不开发, 开发不开发,不
21、开发开发不开发开发商开发商B B开发商开发商A A战略式战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx开发,(开发,不开发)纳什均衡与均衡结果:纳什均衡与均衡结果:存在三个纯战略纳什均衡:存在三个纯战略纳什均衡: ( (不开发,(开发,开发),不开发,(开发,开发),(开发,(不开发,开发),(开发(开发,(不开发,开发),(开发, ,(不开发,不开发)(不开发,不开发)两个均衡结果:两个均衡结果: (开发,不开发)(开发,不开发) (不开发,开发)(不开发,开发)注意:均衡不同于均衡结果注意:均衡不同于均衡结果第31页/共71页第三十一页,共72页
22、。扩展扩展(kuzhn)式式-3, -3-3, -31, 01, 00, 10, 00, 10, 0开发(kif),开发(kif)开发(kif),不开发(kif)不开发, 开发不开发,不开发开发不开发开发商开发商B B开发商开发商A A战略式战略式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx开发,(开发,不开发)路径路径在扩展式博弈中,所有在扩展式博弈中,所有n n个参与人个参与人的一个纯战略组合决定了博弈树上的的一个纯战略组合决定了博弈树上的一个路径。一个路径。(开发,(开发, 不开发,开发不开发,开发 )决定了)决定了博弈的路径为博弈的路径为A A开
23、发开发B B不开发不开发-(1 1,0 0)(不开发,(不开发, 开发,开发开发,开发 )决定了)决定了路径:?路径:?第32页/共71页第三十二页,共72页。第三章 完全(wnqun)信息动态搏弈 -子博弈精炼纳什均衡n 一 博弈扩展式表述n 二 子博弈精练纳什均衡n 扩展式表述博弈的纳什均衡n 子博弈精练纳什均衡n 用逆向归纳法求子搏弈精练纳什均衡n 承诺(chngnu)行动与子搏弈精练纳什均衡n 逆向归纳法与子搏弈精练纳什均衡的存在问题n 三 应用举例第33页/共71页第三十三页,共72页。子博弈精炼子博弈精炼(jnglin)(jnglin)纳什均衡纳什均衡 泽尔腾引入子博弈精练纳什均衡
24、的概念的目的是将那些(nxi)不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。第34页/共71页第三十四页,共72页。子博弈精炼纳什均衡子博弈精炼纳什均衡- -不可置信不可置信(zhxn)(zhxn)威胁威胁 美国普林斯顿大学古尔教授在1997年的经济学透视里发表文章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟
25、弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。各个想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。 的确(dqu),如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。第35页/共71页第三十五页,共72页。扩展扩展(kuzhn)式式A开发不开发BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发xx纳什均衡与均衡结果:纳什均衡与均衡结果:存在三个纯战略存在三个纯战略(zhnl)(zhnl)纳什纳什均衡
26、:均衡: ( (不开发,(开发,开不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,开发),(开发发),(开发, ,(不开发,不开(不开发,不开发)发)两个均衡结果:两个均衡结果: (开发,不开发)(开发,不开发) (不开发,开发)(不开发,开发)注意:均衡不同于均衡结果注意:均衡不同于均衡结果到底哪一个均衡(jnhng)结果将最终出现?第36页/共71页第三十六页,共72页。子博弈精练子博弈精练(jnglin)纳什均衡纳什均衡A开发(kif)不开发(kif)BB开发不开发开发(-3,-3)(1,0)(0,1)(0,0)不开发( (不开发,(开发,开发),(开发,(不开发,开
27、发),(开发不开发,(开发,开发),(开发,(不开发,开发),(开发, ,(不开发,不开发)(不开发,不开发) 如果A选择开发,B的最优选择是不开发,如果A选择不开发,B的最优选择是开发,A预测到自己的选择对B的影响,因此开发是A的最优选择。子博弈精练纳什均衡结果是:A选择开发,B选择不开发。xx 对于对于( (不开发,(开发,开发),不开发,(开发,开发),这个组合之所以构成纳什均衡,是因为这个组合之所以构成纳什均衡,是因为B B威胁不论威胁不论A A开发还是不开发,他都将选择开发还是不开发,他都将选择开发,开发,A A相信了相信了B B的威胁,不开发是最优选的威胁,不开发是最优选择,但是择
28、,但是A A为什么要相信为什么要相信B B的威胁呢?的威胁呢? 毕竟,如果毕竟,如果A A真开发,真开发,B B选择开发得选择开发得-3-3,不开发得不开发得0 0,所以,所以B B的最优选择是不开发。的最优选择是不开发。如果如果A A知道知道B B是理性的,是理性的,A A将选择开发,将选择开发,逼迫逼迫B B选择不开发。自己得选择不开发。自己得1 1,B B得得0 0,即,即纳什均衡纳什均衡( (不开发,(开发,开发)不开发,(开发,开发)是不可置信的。因为它依赖于是不可置信的。因为它依赖于B B的一个的一个不可置信的威胁。不可置信的威胁。 同样:同样: (不开发,不开发)也是一个不可(不
29、开发,不开发)也是一个不可置信威胁,纳什均衡(开发置信威胁,纳什均衡(开发, ,(不开发,不开发)(不开发,不开发)是不合理的。是不合理的。第37页/共71页第三十七页,共72页。子博弈子博弈(b y)精练纳什均衡精练纳什均衡 泽尔腾引入子博弈精练纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个(y )合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个(y )信息集上是最优的。 什么是子博弈,什么是子博弈精练纳什均衡? 有没有更好的方法找到子博弈精练纳什均衡?第38页/共71页第三十八页,共72页。完全完全(wnqun)信息动态博
30、弈信息动态博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析: (1)子博弈必须从一个单结信息(xnx)点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息(xnx)集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结(见下页)。 (2)子博弈的信息(xnx)集和支付向量都直接继承自原博弈,即当x和x在原博弈中属于同一信息(xnx)集时,他们在子博弈中才属于同一信息(xnx)集。 习惯上,任何博弈的本身称为自身的一个子博弈。第39页/共71页第三十
31、九页,共72页。完全信息动态博弈完全信息动态博弈-子博弈精练子博弈精练(jnglin)纳什均衡纳什均衡泽尔腾(泽尔腾(1965)不开发(kif)A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx不开发(kif)开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II房地产开发博弈A坦白抵赖BB坦白抵赖坦白(-8,-8)(0,-10)(-10,0) (-1,-1)找出房地产开发博弈的子博弈找出房地产开发博弈的子博弈( (不开发,(开发,开发),(开发,(不开发,开发),(开发不开发,(开发,开发),(开发,(不开发,开发),(开发, ,(不开发
32、,不开发)(不开发,不开发)第40页/共71页第四十页,共72页。A开发(kif)不开发(kif)XX大小1/21/2大小1/21/2BBBB开发(kif)不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) 参与人X的信息集不能开始一个子博弈,否则的话,参与人B的信息将被切割。第41页/共71页第四十一页,共72页。完全信息完全信息(xnx)动态博弈动态博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 子博弈精练纳什均衡(jnhng): 扩展式博弈的战略组合是一个子博弈精练纳什均衡(jnhng),如果:
33、(1)它是原博弈的纳什均衡(jnhng); (2)它在每一个子博弈上给出纳什均衡(jnhng)。第42页/共71页第四十二页,共72页。A开发(kif)不开发(kif)BB开发(kif)不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发博弈开发不开发(1,0)(-3,-3)x开发(0,1)(0,0)x子博弈I子博弈II(不开发,(开发,开发),(开发,(不开发,开发),(开发,(不开发,不开发)在c上构成均衡,在b上不构成; 在b和c上都构成 在c上构成均衡,在b上不构成完全信息动态博弈-子博弈精练纳什均衡泽尔腾(1965)不开发 判断下列均衡结果哪个构成子博弈精练纳什均衡?
34、不开发bc第43页/共71页第四十三页,共72页。完全信息动态完全信息动态(dngti)博弈博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 如果一个(y )博弈有几个子博弈,一个(y )特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。 纳什均衡只要求均衡战略在均衡路径的决策结上是最优的; 而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。第44页/共71页第四十四页,共72页。完全完全(wnqun)信息动态博弈信息动态博
35、弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。 因此,只有(zhyu)当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。第45页/共71页第四十五页,共72页。第三章 完全信息(xnx)动态搏弈 -子博弈精炼纳什均衡n 一 博弈扩展式表述n 二 子博弈精练纳什均衡n 扩展式表述博弈的纳什均衡n 子
36、博弈精练纳什均衡n 用逆向归纳法求子搏弈精练纳什均衡n 承诺行动与子搏弈精练纳什均衡n 逆向归纳法与子搏弈精练纳什均衡的存在(cnzi)问题n 三 应用举例第46页/共71页第四十六页,共72页。用逆向用逆向(n xin)归纳法求归纳法求-子博弈精练纳什均衡子博弈精练纳什均衡1UDL(3,1)(0,0)22,2R 给定(i dn)博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡 倒数第二个决策结,找倒数第二个的最优选择,这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。 如此重复(chngf)直到初始结。每一步都得到对应于子博弈
37、的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡第47页/共71页第四十七页,共72页。完全信息完全信息(xnx)动态博弈动态博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 用逆向归纳法求子博弈精练(jnglin)纳什均衡 对于有限完美信息博弈,逆向归纳法求解子博弈精练(jnglin)纳什均衡是一个最简便的方法。A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发(kif)博弈第48页/共71页第四十八页,共72页。完全信息动态博弈完全信息动态博弈-子博弈精练子博弈精练(
38、jnglin)纳什均衡纳什均衡泽尔腾(泽尔腾(1965)1UDL(1,1)22,0RU(3,0)(0,2)2D 子博弈精练(jnglin)纳什均衡(U,U),L). U和L分别是参与人1和参与人2在非均衡路径上的选择。 逆向归纳法求解子博弈精练(jnglin)纳什均衡的过程,实质上是重复剔除劣战略的过程:从最后一个决策结依次剔除每个子博弈的劣战略,最后生存下来的战略构成精练(jnglin)纳什均衡。第49页/共71页第四十九页,共72页。完全完全(wnqun)信息动态博弈信息动态博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 用逆向归纳法求解的子博弈精练纳什均衡也要求“所
39、有的参与人是理性的”是共同知识。 如果(rgu)博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。第50页/共71页第五十页,共72页。完全信息动态完全信息动态(dngti)博弈博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965)进入(jnr)者进入(jnr)不进入(0,300)在位者市场进入阻挠博弈树不可置信威胁支付函数行动合作(40,50)斗争(-10,0)第51页/共71页第五十一页,共72页。完全完全(wnqun)信息动态博弈信息动态博弈-子博弈精练纳什均衡子博弈精练纳什均衡泽尔腾(泽尔腾(1965) 练习练习:-:-作业作业6 6 参与人参与人1 1(
40、丈夫)和参与人(丈夫)和参与人2 2(妻子)必须独立决定出门时是否带(妻子)必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性军委伞。他们知道下雨和不下雨的可能性军委50%50%,支付函数为:如果,支付函数为:如果只有一人带伞,下雨时带伞者的效用为只有一人带伞,下雨时带伞者的效用为-2.5-2.5,不带伞者的效用为,不带伞者的效用为- -3 3不下雨时带伞的效用为不下雨时带伞的效用为-1,-1,不带的效用为不带的效用为0;0;如两人都不带伞如两人都不带伞, ,下雨下雨时每人的效用为时每人的效用为-5,-5,不下雨时每人的效用为不下雨时每人的效用为1;1;给出下列四种情况下给出下列四种情况
41、下的扩展的扩展(kuzhn)(kuzhn)式及战略式表述式及战略式表述: : (1)(1)两人出门前都不知道是否会下雨两人出门前都不知道是否会下雨; ;并且两人同时决定是否带伞并且两人同时决定是否带伞( (即每一方在决策时都不知道对方的决策即每一方在决策时都不知道对方的决策);); (2)(2)两人在出门前都不知道是否会下雨两人在出门前都不知道是否会下雨, ,但丈夫先决策,妻子观察但丈夫先决策,妻子观察到丈夫是否带伞后才决定自己是否带伞到丈夫是否带伞后才决定自己是否带伞; ; (3)(3)丈夫出门前知道是否会下雨丈夫出门前知道是否会下雨, ,但妻子不知道,但丈夫先决策,但妻子不知道,但丈夫先决
42、策,妻子后决策妻子后决策; ; (4),(4),同同(3),(3),但妻子先决策,丈夫后决策但妻子先决策,丈夫后决策. .第52页/共71页第五十二页,共72页。第三章 完全信息(xnx)动态搏弈 -子博弈精炼纳什均衡n 一 博弈(b y)扩展式表述n 二 子博弈(b y)精练纳什均衡n 扩展式表述博弈(b y)的纳什均衡n 子博弈(b y)精练纳什均衡n 用逆向归纳法求子搏弈精练纳什均衡n 承诺行动与子搏弈精练纳什均衡n 逆向归纳法与子搏弈精练纳什均衡的存在问题n 三 应用举例第53页/共71页第五十三页,共72页。承诺行动与子博弈承诺行动与子博弈(b y)(b y)精练纳什均衡精练纳什均衡
43、 承诺行动与子博弈精练纳什均衡 有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数(hnsh),原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变. 这些改变博弈结果而采取的措施称为承诺行动. 完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟). 不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.第54页/共71页第五十四页,共72页。承诺(chngnu)行动与子博弈精练纳什均衡 曹操与袁绍的仓亭之战,曹操召集将领来献破袁之策,程昱献了十面埋伏之计,他让曹操退军河上,诱袁前来追击,到那时
44、“我军无退路,必将死战,可退袁矣”。 曹操采纳此计,令许褚诱袁军军至河上,曹军无退路,操大呼曰:“前无去路,诸军何不死战!”,众军奋力回头(hu tu)反击,袁军大败。第55页/共71页第五十五页,共72页。承诺行动与子博弈承诺行动与子博弈(b y)(b y)精练纳什均衡精练纳什均衡A开发不开发BB开发不开发开发(1,0)(0,1)(0,0)(-3,-3)xx房地产开发(kif)博弈 如果在A决策之前,B与某客户签定了一个合同(h tong),规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同(h tong)就是承诺行动.(1,-3.5)第56页/共71页第五十六页,共
45、72页。承诺行动承诺行动(xngdng)(xngdng)与子博弈精练纳什均衡与子博弈精练纳什均衡 经常有这样的情况,非理性-通常是自动的而不是策略性的-是一个优势。 在电影怪爱博士中的末日机器就是一个例子。前苏联认为不可能在一场理性的军备竞赛中超过更富有的美国,所以(suy),他制造了一颗炸弹,如果任何人引爆了这颗炸弹,它将自动炸毁整个世界。着部电影描述了这样一个细节,你必须告诉对方你有这么一个末日机器。 据说前美国总统尼克松曾告诉他的副手哈德蔓,他对这个策略更复杂的看法:我称为疯子理论,我要让北越相信我已经到了无论付出多少都要结束战争的地步,我们只要他听到这样的传闻:“看在上帝的份上,尼克松
46、已经被共产党搞疯了,当他生气的时候,我们没法制止他,他的手已经按在核按纽上了。”胡志明两天之后会到巴黎求和的。第57页/共71页第五十七页,共72页。第三章 完全(wnqun)信息动态搏弈 -子博弈精炼纳什均衡n 一 博弈扩展式表述n 二 扩展式表述博弈的纳什均衡n 三 子博弈精练纳什均衡n 子博弈精练纳什均衡n 用逆向归纳法求子搏弈精练纳什均衡n 承诺行动(xngdng)与子搏弈精练纳什均衡n 逆向归纳法与子搏弈精练纳什均衡的存在问题n 四 重复博弈和无名氏定理n 五 应用举例第58页/共71页第五十八页,共72页。逆向归纳法与子搏弈精练纳什均衡逆向归纳法与子搏弈精练纳什均衡(jnhng)(
47、jnhng)的存在的存在问题问题1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此(ync),在有多个参与人或每个参与人有多次行动机会的情况下,逆向归纳法的结果可能并非如此。多个多个(du )参与人的情况参与人的情况(2,2)如果n很小,逆向归纳法的结果第59页/共71页第五十九页,共72页。逆向归纳法与子搏弈精练逆向归纳法与子搏弈精练(jnglin)(jnglin)纳什均衡的纳什均衡的存在问题存在问题 如果(rgu)n很大,结果又如何呢?1D(1,1)A2D(1/2,1/2)AiD(1/i
48、,1/i)AnD(1/n,1/n)A多个参与多个参与(cny)人的情况人的情况(2,2)如果n很大 对于参与人1,获得2单位支付前提是所有n-1个参与人都选A,否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p1,所有n-1个参与人选择A的概率是pn-1,如果n很大,这个值就很小; 另外,即使参与人1确信所有n-1个参与人都选A,他也可能怀疑是否第2个参与人相信所有n-2个参与人都选A。 这个链越长,共同知识的要求就越难满足。第60页/共71页第六十页,共72页。逆向归纳法与子搏弈精练纳什均衡的存在逆向归纳法与子搏弈精练纳什均衡的存在(cnzi)(cnzi)问题问题1
49、D(1,0)A2D(0,2)A2D(N,0)A(0,N+1)逆向归纳法的结果(ji gu):一开始,就结束!A1D(0,N-1)A1D(3,0)A2D(0,4)A每个参与每个参与(cny)人有多个行动机会的蜈蚣博弈人有多个行动机会的蜈蚣博弈 A、B进行游戏决策,如果A在第一轮决策,得1,B得0,否则进入第二轮,B决策得2,A得0第61页/共71页第六十一页,共72页。逆向归纳法与子搏弈精练逆向归纳法与子搏弈精练(jnglin)(jnglin)纳什均衡的纳什均衡的存在问题存在问题1D(1,1)A2D(0,3)A1D(98,98)A2D(98,101)A另一种蜈蚣另一种蜈蚣(w n)博弈博弈(10
50、0,100)逆向(n xin)归纳法的结果:一开始,就结束!2D(97,100)A1D(99,99)A 有两个参与人A、B,若第一次A决策结束,A、B都得n,若B决策结束,A得n-1,B得n+2,下一轮从A、A都是n+1开始,共100次,每个参与人有100个决策结。1D(2,2)A2D(1,4)A第62页/共71页第六十二页,共72页。逆向归纳法与子搏弈精练逆向归纳法与子搏弈精练(jnglin)(jnglin)纳什均衡纳什均衡的存在问题的存在问题 逆向归纳法理论没有为当某些未预料到的事情出现(chxin)时参与人如何形成他们的预期提供解释,这使得逆向归纳法的解释受到怀疑。弗德伯格等人将偏离行为
51、解释为是由于有关“支付函数”信息的不确定性造成的,即实际的支付函数不同于原来认为的支付函数,从而参与人在观测到未曾预料到的行为时应该修正有关支付函数的信息。他们认为,任何一个有关博弈行为的理论应该是“完备的”,即理论应该对任何可能的行为赋予正的概率,从而当某件事情出现(chxin)时,参与人对随后的博弈行为的条件预测总是很好定义的。 泽尔藤将偏离行为解释为参与人在博弈过程中犯的错误,或者说均衡的“颤抖”,即在扩展式博弈隐含了参与人犯错误的可能,如果参与人在每个信息集上犯错误的概率是独立的(因而参与人不会犯系统性的错误),那么,不论过于的行为与逆向归纳法的预测如何不同,参与人应该继续使用逆向归纳
52、法预测从现在开始子博弈的行为。第63页/共71页第六十三页,共72页。第三章 完全信息动态搏弈 -子博弈(b y)精炼纳什均衡n一 博弈扩展式表述n二 扩展式表述博弈的纳什均衡n三 子博弈精练纳什均衡n子博弈精练纳什均衡n用逆向(n xin)归纳法求子搏弈精练纳什均衡n承诺行动与子搏弈精练纳什均衡n逆向(n xin)归纳法与子搏弈精练纳什均衡的存在问题n四 重复博弈和无名氏定理n五 应用举例第64页/共71页第六十四页,共72页。重复博弈重复博弈(b y)(b y)和无名氏定理和无名氏定理 一次动态博弈也称为“序贯博弈”。 重复博弈:指同样结构的博弈重复多次,其中的每次博弈称为“阶段博弈”。如囚徒困境。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版股权转让合同股权交割与对价支付3篇
- 2025店铺转让合同协议书范文
- 商标使用授权合同2025年
- 2025版智能门窗安装与维护服务合同标准范本3篇
- 合同补充协议书范文集合2025年
- 2025年度家禽疫病防控与养殖技术支持合同3篇
- 2025年度农业机械租赁担保合同范本3篇
- 2025年度绿色能源家庭光伏系统销售与安装合同3篇
- 担保人担保合同2025年
- 2025年度新能源汽车项目聘用合同书3篇
- 扫描电子显微镜(SEM)-介绍-原理-结构-应用
- 老旧小区改造室外消火栓工程施工方案和技术措施
- 《地质灾害监测技术规范》
- 2024-2030年中国云母制品制造市场发展状况及投资前景规划研究报告
- 2025年上半年内蒙古鄂尔多斯伊金霍洛监狱招聘17名(第三批)易考易错模拟试题(共500题)试卷后附参考答案
- 24秋国家开放大学《农产品质量管理》形考任务1-2+形考实习1-3参考答案
- 80、沈阳桃仙机场二平滑工程冬期施工方案
- GB/T 29468-2024洁净室及相关受控环境围护结构夹芯板
- 2024年度房屋装修工程合同
- 深圳大学《射频识别原理与应用》2023-2024学年第一学期期末试卷
- 爱劳动课件教学课件
评论
0/150
提交评论