博弈论全套上课课件ch3 完全信息动态博弈

上传人：9*** IP属地：湖北上传时间：2023-02-06 格式：PPT 页数：64 大小：1.22MB 积分：30 举报 版权申诉

已阅读5页，还剩59页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章完全信息动态博弈2主要内容一、博弈扩展式表述二、逆向归纳法与子博弈精炼纳什均衡三、应用举例

3引例-房地产开发项目假设有A、B两家开发商市场需求：可能大，也可能小投入：1亿假定市场上有两栋楼出售：需求大时，每栋售价1.4亿，需求小时，售价7千万；如果市场上只有一栋楼需求大时，可卖1.8亿需求小时，可卖1.1亿4博弈战略式表述4000，40008000，00，80000，0不开发开发商A开发不开发开发-3000，-30001000，00，10000，0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求大的情况5一、博弈扩展式表述1、博弈的扩展式表述包括的要素:参与人集合参与人行动次序参与人的行动空间参与人的信息集（参与人在作选择时都知道些什么信息）参与人的支付函数（作为其所采取行动的函数的参与人收益）外生事件的概率分布6A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人(A,B,N)行动支付图3.1房地产开发博弈结,决策结结,终点枝结,初始结

信息集7一、博弈扩展式表述结:包括决策结和终点结两类;决策结是参与人行动的时点,终点结是博弈行动路径的终点.结满足传递性和非对称性枝:枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择.信息集:每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结:1每个决策结都是同一个参与人的决策结;2该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结.8A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在决策时不确切地知道自然的选择;B的决策结由4个变为2个图3.2房地产开发博弈9A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)

图3.3房地产开发博弈102、完美信息博弈只包含一个决策结的信息集称为单结信息集，如果博弈树的所有信息集都是单结的，该博弈称为完美信息博弈。完全且完美信息动态博弈的特点行动是顺序发生的；下一步行动选择之前，所有以前的行动都可被观察到；每一可能的行动组合下参与人的收益都是共同知识。11注意自然总是假定是单结的，因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。不同的博弈树可以代表相同的博弈，但是有一个基本规则：一个参与人在决策之前知道的事情，必须出现在该参与人决策结之前。12N大小AA开发不开发1/2开发不开发1/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)图3.4房地产开发博弈13思考：图3.5与图3.3是同一个博弈吗？N大小AA开发不开发1/2开发不开发1/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)图3.5房地产开发博弈14思考：图3.6与图3.3是同一个博弈吗？N大小BB开发不开发1/2开发不开发1/2AAAA开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(0,8)(0,0)(-3，-3)(1,0)(0,1)(0,0)图3.6房地产开发博弈15到底哪些扩展式是等价的，仍是一个有待分析的课题。AC1BLRLR2图3.716抵赖A坦白抵赖BB坦白抵赖坦白(-8,-8)(0，-10)(-10,0)(-1,-1)BAA坦白抵赖坦白抵赖坦白抵赖(-8,-8)(0，-10)(-10,0)(-1,-1)图3.7囚徒困境博弈的扩展式表述ab囚徒困境博弈的扩展式表述175，14，49，-10，0等待小猪大猪按等待按智猪博弈的扩展式表述？183、完美记忆博弈gameofperfectrecall所有参与人都不会忘记曾经知道过的任何信息，清楚他们前面所选择的行动。194、扩展式博弈的策略式表述扩展式的解释：参与人i保持“等待”的状态，直到知道了hi信息集以后，才决定如何采取行动；在策略式表述中，参与人可以预先制定一个完全的相机行动计划。204、扩展式博弈的策略式表述UD(L,L)1UD22LRL(2,1)(0，0)(-1,1)(3,2)R2,12,10,00,0-1,13,2-1,13,2(L,R)(R,L)(R,R)图3.8扩展式到策略式的转换21二、逆向归纳法与

子博弈精炼纳什均衡一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后行动者的影响。子博弈精炼纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。221、子博弈由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。232、逆向归纳法从动态博弈的最后一个阶段博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法，称为“逆向归纳法”。1UDL（3，1)(0,0)22，2R图3.924逆向归纳法这是一个完美信息下的有限期博弈，它的逆向归纳的解为：（D，L）还有其他的纳什均衡吗？（U，R）但是均衡（U，R）是“不可置信”的。253、子博弈精炼纳什均衡图3.101UDA（3，1)(2,-2)2RLB1CDCD(-2,2)(-2,2)(2,-2)(2,2)226子博弈精炼纳什均衡如果一个完美信息的动态博弈中，各博弈方的策略构成的一个策略组合，满足在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈精炼纳什均衡”。将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果。27子博弈精炼纳什均衡完全非完美信息两阶段博弈：1、参与者1和2同时从各自的可行集A1和A2中选择行动a1和a2，2、参与者3和4观察到第一阶段的结果，（a1，a2），然后同时从各自的可行集A3和A4中选择行动a3和a4。3、收益为Ui（a1，a2，a3，a4），i=1，2，3，4。28子博弈精炼纳什均衡用逆向归纳思路求解。从博弈的最后阶段逆向推导（求解一个子博弈：给定第一阶段的结果，参与者3和4在第二阶段同时行动；参与者3和4也可以是参与者1和2，或者不存在2或4）假设对第一阶段博弈每一个可能结果（a1，a2），其后第二阶段博弈有唯一的纳什均衡，表示为（a3*（a1，a2），a4*（a1，a2））29子博弈精炼纳什均衡如果参与人1和2预测到参与人3和4在第二阶段的行动将由（a3*（a1，a2），a4*（a1，a2））给出，则参与人1和2在第一阶段的问题可以用以下的同时行动博弈表示：1、参与人1和2同时从各自的可行集A1和A2中选择行动a1和a2；2、收益情况为Ui（a1，a2，a3*（a1，a2），a4*（a1，a2）），i=1，2；假设（a1*，a2*）为以上同时行动博弈唯一的纳什均衡，我们称（a1*，a2*，a3*（a1*，a2*），a4*（a1*，a2*））为这一两阶段博弈的子博弈精炼解。30子博弈精炼纳什均衡把博弈树上所有的“适当子博弈”用它的一个纳什均衡收益来代替，然后在其简化的博弈树上进行逆向归纳。什么是“适当子博弈”？子博弈必须从单结信息集开始；子博弈的信息集和支付向量都直接继承自原博弈。没有对任何信息集形成分割。314、承诺行动与子博弈精练纳什均衡有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数，原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变.这些改变博弈结果而采取的措施称为承诺行动.完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟).不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.32承诺行动与子博弈精练纳什均衡

曹操与袁绍的仓亭之战，曹操召集将领来献破袁之策，程昱献了十面埋伏之计，他让曹操退军河上，诱袁前来追击，到那时“我军无退路，必将死战，可退袁矣”。曹操采纳此计，令许褚诱袁军军至河上，曹军无退路，操大呼曰：“前无去路，诸军何不死战！”，众军奋力回头反击，袁军大败。33承诺行动与子博弈精练纳什均衡

如果在A决策之前,B与某客户签定了一个合同,规定B若不在特定时期内开发若干面积的写字楼,则将支付违约金3.5,这个合同就是承诺行动.A开发不开发BB开发不开发开发（0，1)(0,0)(-3,-3)xx’房地产开发博弈(1,-3.5)345、对逆向归纳法与子博弈精炼均衡的批评逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。当参与人非常多时，共同知识的要求往往难以满足。35三、应用1、斯坦克尔伯格Stackelberg寡头竞争模型企业1企业2参与人：企业1、企业2；行动顺序：企业1先选择产量q1，企业2观测到q1，然后选择自己的产量q2。支付：利润，利润是两个企业产量的函数36模型假定一个有两个企业的行业，它可由每个企业i（生产qi单位）的成本函数概括，而成本函数由下式给出：

TCi(qi)=ciqi，i=1，2，其中，c2，c1≥0，市场需求函数为

p(Q)=a-bQ，a，b＞0，a＞ci，其中

Q=q1+q2

支付函数即利润函数

π(q1，q2)=p(q1+q2)qi-TC(qi)

企业选择qi∈Ai≡[0，∞），i=1，237回顾古诺模型反应函数q1●的情形381、斯坦克尔伯格寡头竞争模型第2期的子博弈企业2反应函数第1期博弈企业1

求导，令其等于零，得到391、斯坦克尔伯格寡头竞争模型领导者产量跟随者产量整个行业401、斯坦克尔伯格寡头竞争模型序贯行动数量博弈比静态古诺市场结构产生较高的行业总产量水平与较低的市场价格。计算利润水平，得到41评论斯坦克尔伯格的均衡总产量大于古诺均衡总产量，企业1的斯坦克尔伯格的均衡产量大于古诺均衡产量，企业2的斯坦克尔伯格的均衡产量小于古诺均衡产量。企业1在斯坦克尔伯格博弈中的利润大于在古诺博弈中的利润，企业2的利润却有所下降，这就是所谓的“先动优势”。42评论拥有信息优势可能使参与人处于劣势。企业1先行动的承诺价值：企业1之所以获得斯坦克尔伯格利润而不是古诺利润，是因为它的产品一旦生产出来就变成了一种沉没成本，无法改变，从而使企业2不得不承认它的威胁是可置信的。而假如企业1只是宣布了它将生产，企业2是不会相信她的威胁的。43评论古诺均衡解，q1=(a-c)/3b,q2=(a-c)/3b也是这个问题的纳什均衡，但不是子博弈精炼纳什均衡，因为不在所有的子博弈上构成纳什均衡。44完全竞争00完全垄断1古诺模型2斯坦克尔博格模型1领导者1跟随者1领导者n-1跟随者各类市场结构的均衡点比较452、劳资博弈

列昂惕夫模型（Leontief,1946）工会和企业的博弈。假设：工会垄断了劳动力的供给，工会决定工资，企业决定就业人数；工会首先选择工资w；企业观测到w后选择雇佣工人数量，即就业水平L工会的效用函数Ｕ(w,L)，w为工资水平，L为就业人数。Ｕ(w,L)是w和L的增函数。46劳资博弈企业目标：利润最大化47劳资博弈从第二阶段开始，给定w，企业最大化利润由于边际收益递减，企业对劳动的需求L*(w)是工资的减函数48第一阶段，工会预期企业选择就业水平的规则（策略），则面临的问题含义：工会方的边际替代率等于企业劳动需求曲线的斜率。工会将选择自己的无差异曲线与企业劳动需求曲线相切点的工资。子博弈精炼纳什均衡的结果是（w*，L*（w*））49劳资博弈（w*，L*（w*））是低效率的。在该点，企业的等利润曲线与工会的无差异曲线是相交而非相切。有效率的解满足：即企业的等利润曲线的斜率等于工会无差异曲线的斜率。50劳资博弈纳什讨价还价模型51劳资博弈RL0WL厂商的反应函数R(L)斜率为WLW0工会的无差异曲线523、讨价还价博弈游戏规则：第一轮由第一个参与人（小鹃）提出条件，第二个参与人小明可以接受，从而游戏结束，也可以不接受，则游戏进入第二轮；小明提出条件，小鹃可以接受，从而结束游戏，也可以不接受，从而进入第三轮；蛋糕融化呈线性，游戏结束，蛋糕融化……第一种情况：假设博弈只有一步，小鹃提出分配方案，如果小明同意，两个人按照约定分蛋糕，如果小明不同意，两人什么也得不到。结果会怎样？533、讨价还价博弈第二种情况：桌上放了一个冰淇淋蛋糕，但两轮谈判过后，蛋糕将完全融化。博弈结果如何？第三种情况：桌上的冰淇淋蛋糕在三轮谈判后将完全融化，结果又如何？第四种情况：桌上的冰淇淋蛋糕在四轮谈判后将完全融化，或者在五轮谈判、六轮……,100轮谈判后将完全融化，结果又如何？54轮流出价的讨价还价模型Rubinstein轮流出价模型问题描述：两个参与人分割一块蛋糕，参与人1先出分配方案，参与人2选择接受或拒绝；如果拒绝，参与人2提出分配方案，参与人1选择是否接受；依次类推，直到某个参与人的方案被接受。而蛋糕随着时间的推移会慢慢减小（如会融化的冰淇淋）55轮流出价的讨价还价模型x表示参与人1的份额，（1-x）表示参与人2的份额和分别是参与人1出价时参与人和参与人2的份额，和分别是参与人2出价时参与人1和参与人2的份额。假定参与人1和参与人2的贴现因子分别为和

56轮流出价的讨价还价模型博弈在时期t结束,t是参与人i的出价阶段参与人1的支付的贴现值

:参与人2的支付的贴现值

:T＝2时，逆向归纳法t=2,参与人2出价,参与人1不再有出价的机会，即使，参与人1也会接受。参与人2

得到退回到第一步，则参与人1出价

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论全套上课课件ch3 完全信息动态博弈

文档简介

温馨提示

最新文档

评论

相关文档