博弈论经典课件

上传人：g*** IP属地：贵州上传时间：2022-10-11 格式：PPT 页数：24 大小：1.16MB 积分：25 举报 版权申诉

已阅读5页，还剩19页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、1第三章完全信息动态博弈一、博弈的扩展式表示1、博弈扩展式描述包括的六要素1）参与人集合；2）参与人的行动次序：谁在什么时候行动；3）参与人的行动空间：在每次行动时，参与人有哪些选择；4）参与人的信息集：每次行动时，参与人知道些什么；5）参与人的支付函数：行动结束后，每个参与人得到些什么；6）外生事件（即自然的选择）的概率分布。1第三章完全信息动态博弈一、博弈的扩展式表示1、博弈22、博弈树（博弈扩展式）1）结：包括决策结（采取行动的时间）与终点结。2）枝：决策结到它直接后接点的连线，它代表参与人的行动、路径。3）信息集：决策结的子集，要满足：信息集中每个结应属于同一参与人；参与人知道

2、博弈进入某信息集，但不知自己处在信息集中的哪一个结（多结点信息集时）；参与人在同一个信息集上的每一个结上的行动空间是相同的；信息集中每个结应是同一时点的决策结。例房地产开发博弈：开发商A首先行动，选择开发或不开发； A决策后，自然选择市场需求大小；开发商B在观测到A的决策和市场需求后，决定开发或不开发。22、博弈树（博弈扩展式）1）结：包括决策结（采取行动的时间33、静态博弈的扩展式表示例1 囚徒困境例2 四人同时决策，每人有两种选择（L，U），请画出博弈树。练习用博弈树表示下述博弈。第一步：局中人1掷一枚硬币，结果可能是正面H或反面T；第二步：局中人2不知第一步硬币的结果，再掷一

3、次硬币；第三步：局中人1知第一、二步硬币的结果，又掷一次硬币；第四步：局中人2不知第三步的结果，但知一、二两步的结果，最后掷一次硬币，博弈结束（按每步结果，局中人2给1一笔报酬）。33、静态博弈的扩展式表示例1 囚徒困境例2 四人同4二、扩展型博弈转化为策略型博弈例1 房地产开发博弈A开发不开发BB开发不开发开发不开发（-3，-3）（1，0）（0，1）（0，0）4二、扩展型博弈转化为策略型博弈例1 房地产开发博弈A开发5例2 考虑以下动态博弈。第一步：局中人1从1，2中选择一数x。第二步：局中人2知道x的值，从1，2中选择y。第三步：局中人1不知y，也忘了x，从1，2中选择z，博弈结束。对选定

4、的x，y，z，局中人2给局中人1的费用为U1（x,y,z）U1(1，1，1)=-2； U1(1，1，2)=-1； U1(1，2，1)=3；U1(1，2，2)=-4； U1(2，1，1)=5； U1(2，1，2)=-2；U1(2，2，1)=2； U1(2，2，2)=6。5例2 考虑以下动态博弈。6例3 带有机会选择的动态博弈。第一步：用一个随机装置，从1，2中等可能地选择数x。第二步：局中人1知道x值，从1，2中选择y。第三步：局中人2不知x，但知y，从1，2中选择z，博弈结束。对选定的x，y，z，局中人2给局中人1的费用为U1（x,y,z）U1(1，1，1)=-2； U1(1，1，2)=-1；

5、 U1(1，2，1)=3；U1(1，2，2)=-4； U1(2，1，1)=5； U1(2，1，2)=-2；U1(2，2，1)=2； U1(2，2，2)=6。6例3 带有机会选择的动态博弈。7练习考虑以下动态博弈。第一步：局中人1从1，2中选择一数x。第二步：局中人2知道x的值，从1，2中选择y。第三步：局中人1知道y的值，从1，2中选择z，博弈结束。对选定的x，y，z，局中人2给局中人1的费用为U1（x,y,z）U1(1，1，1)=-2； U1(1，1，2)=-1； U1(1，2，1)=3；U1(1，2，2)=-4； U1(2，1，1)=5； U1(2，1，2)=-2；U1(2，2，1)=2

6、； U1(2，2，2)=6。 7练习考虑以下动态博弈。8三、子博弈精炼纳什均衡子博弈定义：一个扩展式博弈的子博弈G由一个决策结x和所有该决策结的后续结T（x）（包括终点结）组成，它满足如下条件：1） x是一个单结信息集，即h(x)=x；2）对于所有的，若，则。子博弈精炼纳什均衡定义：称扩展式博弈G的策略组合为子博弈精炼NE，若：1）它是原博弈的NE；2）它在每一个子博弈上给出NE。8三、子博弈精炼纳什均衡子博弈定义：一个扩展式博弈的子博弈G9定理：有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈精炼纳什均衡。子博弈精炼纳什均衡的解法：逆向递推法。例 121LRL1R1L2R2（2，

7、0）（1，1）（3，0）（0，2）9定理：有限、完美信息的扩展型博弈必存在纯策略意义下的子博弈10例海盗分金：五个海盗要分配抢来的100枚金币，方式是，第一个人提出一种分配方案，如果同意这种方案的人达到半数，那么提议通过，否则提议的人就被扔进大海，由剩下的人再进行同样的过程。假设五个人提议的次序已定，金币不能分割，而且海盗的本性让他们觉得，如果对自己的收益没有影响，则很乐意看到别人被扔进大海，这时理性结局应是如何？10例海盗分金：五个海盗要分配抢来的100枚金币，方式11例斯坦克尔伯格（Stackelberg）寡头竞争模型例讨价还价博弈例有点数为1，2，3的三张牌，先由A任抽一张，看

8、后反放于桌上，并喊大（H）或小（L）。然后由B从剩下牌中任抽一张，看过后，B有两种选择：弃权，付给A一元；翻A的牌，当A喊H时，点数小者付给对方3元，当A喊L时，点数大者付给对方2元。要求：1）说明A、B各有多少纯策略？2）据理性原则淘汰具有劣势的策略。3）求双方的最优策略及各自的支付值。11例斯坦克尔伯格（Stackelberg）寡头竞争12例银行挤提问题（具有同时选择的动态博弈）设有两投资者，每人存入银行一笔存款D，银行将存款投资于一长期项目。若在项目到期前，存款人提前支取，银行被迫变现，共可收回2r，此处Dr。若银行等长期项目到期支取，可回收2R，RD。设有两个提款日期，t=1，

9、项目到期前，两投资者都提款，则每人可得r。若只有一个在t=1提款，他可得D，另一人得2r-D。若两人都未在t=1提款，在t=2，两人都提款，则每人得R；若只有一个人在t=2提款，他得2R-D，另一人得D；若t=2时，两人都不提款，银行向每个投资者返还R。12例银行挤提问题（具有同时选择的动态博弈）THANK YOUSUCCESS2022/10/1113可编辑THANK YOUSUCCESS2022/10/1014例国际竞争与最优关税（具有同时选择的动态博弈）考虑两个相似的国家，分别用i=1，2表示。每个同家各有一个企业，分别称为企业1、企业2。企业生产既可内销又可出口的同质产品。两个国家中

10、的消费者在各自国家的市场上购买本国产品或外国产品。引入以下记号：1 表示国家i市场上的商品供给量，。这里表示i国的内销量，表示j国的出口量。2 ，i=1，2表示市场的出清价格。3企业的边际成本为常数c，且无固定成本，则企业i的总成本为：，为j国进口关税，j=1，2。博弈的顺序为：t=1时，政府同时选择关税税率和；t=2时，两国企业观察到关税税率后，同时选择出口产量和提供国内消费量与。企业i的收益（支付）为其利润额，政府i的的收益则为本国总的福利，包括消费者剩余，本国企业利润，国家关税收入三部分。14例国际竞争与最优关税（具有同时选择的动态博弈）与。15例宏观经济政策的动态一致

11、性考虑一个货币政策模型：博弈的参与人是政府与公众。公众选择预期通胀率，政府在给定预期通胀率的情况下选择实际通胀率。政府不仅关心通胀问题，还关心实际产出y，其效用函数为：产出y与通胀间的关系可用如下菲力普斯曲线描述：15例宏观经济政策的动态一致性产出y与通胀 16例工资奖金制度模型基本假设：1）一个雇主有两个雇员，雇员i（i=1，2）的产出为，雇员努力的负效用为，。扰动项从分布密度为、均值为0的概率分布中独立抽取。2）因产出能观察而努力水平无法观察，所以据产量支付报酬。雇主宣布产量高的雇员将得到较高工资，产量低的工资为。3）雇员在已知工资（奖金）制度的情况下，同时独立选择各自的

12、工作努力程度，。16例工资奖金制度。扰动项从分布密度为 17四、重复博弈1、基本概念1）重复博弈指同样结构的博弈重复多次，其中的每次博弈称为阶段博弈。有限次重复博弈写为G（T），无限次重复博弈写为。2）重复博弈的平均得益若一常数作为重复博弈（有限或无限次重复）各阶段的得益，能产生与得益序列相同的现值，则称为的平均得益。17四、重复博弈1、基本概念1）重复博弈指同样结构的博弈重复183）对随机结束的重复博弈，设停止重复的概率为p，重复下去的概率为（1-p），则所以，随机停止重复博弈可当作无限次重复博弈进行分析。其中183）对随机结束的重复博弈，设停止重复的概率为p，重复下去192、

13、有限次重复博弈1）无纯策略NE的两人零和博弈的有限次重复博弈唯一的子博弈完美NE就是所有博弈方始终采用原博弈的混合策略纳什均衡策略。此结论可推广至非零和（常和）或多个博弈方，但博弈方的利益严格对立，无纯策略NE的其他严格竞争博弈中。2）唯一纯策略纳什均衡博弈的有限次重复博弈G（T）有唯一子博弈精炼均衡，即各博弈方每个阶段都采用G的NE策略（平均得益为原博弈G中的得益）。3）多个纯策略NE博弈的有限次重复博弈例1 三价博弈HMLH5，50，60，2M6，03，30，2L2，02，01，1192、有限次重复博弈1）无纯策略NE的两人零和博弈的有限次20例2 LMRU0，03，46，0M4，30，0

14、0，0D0，60，05，5例3 ABA3，31，4B4，10，020例2 LMRU0，03，46，0M4，30，00，0214）有限次重复博弈的民间定理设原博弈的一次性博弈有均衡得益数组优于W，则在该博弈的多次重复中，所有不小于个体理性得益的可实现得益，都至少有一个子博弈精炼NE的极限的平均得益来实现。定理中的相关概念：用Wi记局中人i在一次性博弈中最差的均衡得益，W表示各局中人的Wi构成的得益数组。个体理性得益（保留得益）：不管其它局中人的行为如何，一局中人在某个博弈中只要自己采取某种特定的策略，保证能获得的得益。可实现得益：博弈中所有纯策略组合得益的加权平均（权数非负总和为1）数组。214）有限次重复博弈的民间定理设原博弈的一次性博弈有均衡得223、无限次重复博弈1）两人零和博弈的无限次重复博弈：每次重复采用原博弈的混合策略NE。此结论可推广至非零和（常和）或多个博弈方的其他严格竞争模型的无限次重复博弈。2）唯一纯策略NE的无限次重复博弈例囚徒困境式博弈HLH4，40，5L5，01，1223、无限

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论经典课件

文档简介

温馨提示

最新文档

评论

博弈论经典课件

文档简介

温馨提示

最新文档

评论

相关文档