版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二讲(1)完全信息静态博弈
所谓完全信息静态博弈即各博弈方同时决策,且所有博弈方对博弈中的各种情况下的得益都完全了解的博弈问题纳什均衡无限策略博弈的解和反应函数混合策略纳什均衡的存在性2.1纳什均衡博弈的解和纳什均衡严格下策反复消去法与纳什均衡2.1.1博弈的解和纳什均衡定义在博弈中,如果策略组合中任一博弈方i的策略都是对其余博弈方的策略组合的最佳对策,也即对任意都成立,则称为G的一个纳什均衡。2.1.1博弈的解和纳什均衡划线法
囚徒2
不坦白坦白囚不坦白徒
1坦白箭头法囚徒2
不坦白坦白囚不坦白徒
1坦白
-1,-1
-8,0
0,-8
-5,-5-1,-1
-8,00,-8
-5,-52.1.2严格下策反复消去法与纳什均衡严格下策:对于某一策略,若则称为的严格下策。命题2.1在n个博弈方的博弈中,如果严格下策反复消去法排除了以外的所有策略组合,则一定是G的唯一的纳什均衡。命题2.2在n个博弈方的博弈中,如果是G的一个纳什均衡,则严格下策反复消去法一定不会将它消去。2.1纳什均衡纳什均衡点是一种局部均衡点,可以有很多个,也可以不存在。来源于策略组合的策略可能有n!个(离散),也可能无穷多个(连续),那么求解将会十分烦琐。得益对于任一策略(s1,…,sn),其总得益为各博弈方得益之和那么对于具有多个纳什均衡点的博弈,则对应的应有最优纳什均衡的概念,而对应于最优纳什均衡的点为全局最优点。此处最优的含义为稳定性而不是得益之和最大。如何均衡稳定与收益?2.2无限策略的解和反应函数古诺的寡头模型反应函数伯特兰德的寡头模型公共资源问题2.2.1古诺的寡头模型
博弈方1利润:博弈方2利润:在本博弈中,的纳什均衡的充分必要条件是和的最大值问题:社会收益最大化:假设总产量为Q,总收益为U=QP(Q)-CQ
=Q(8-Q)-2Q=6Q-Q2
其最大值为Q*=3,U=9
该结果与纳什均衡有较大的差异,这就是纳什均衡是源于各厂商追求自身利益最大化的结果。2023/2/594.5,4.55,3.753.75,54,4不突破突破厂商2不突破突破厂商1以自身最大利益为目标:各生产2单位产量,各自得益为4以两厂商总体利益最大:各生产1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈2.2.2反应函数
反应函数-每个博弈方针对其他博弈方所有策略的最佳反应构成的函数。而各个博弈方反应函数的交点(如果有的话)就是纳什均衡。2.2.2反应函数-古诺模型在古诺模型中厂商1和厂商2的反应函数分别为q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)
从左图可以看出,当一方的选择为0时,另一方的最佳反应为3,这正是我们前面所说过的实现总体最大利益的产量,因为一家产量为零,意味着另一家垄断市场。当一方的产量达到6时,另一方则被迫选择0,因为实际上坚持生产已无利可图。2.2.3伯特兰德的寡头模型在该模型中厂商选择价格而不是产量厂商1的价格与需求函数:P1,厂商2的价格与需求函数:
P2,其中,d1,d2>0为两厂商产品的替代系数。假设两厂商无固定成本,边际成本分别为c1和c2。收益:纳什均衡:2023/2/513公共地悲剧英国人哈定:十八世纪以前,苏格兰地区大量草地,由于属公共资源导致过度放牧,致使草地消失,生态破坏2.2.4公共资源问题2023/2/514公共产品的供给
如果大家都出钱兴办公用事业,所有人的福利都会增加。问题是,如果我出钱你不出钱,我得不偿失,而如果你出钱我不出钱,我就可以占你的便宜。所以每个人的最优选择都是“不出钱”,结果使所有人的福利都得不到提高。军备竞赛
两国都不搞军备竞赛,都把资源用于民用,两国福利都变好。但由于都怕受威胁而大搞军备竞赛,结果两国福利都变得更糟。经济改革经济改革要付出成本(包括风险),而改革的成果大家享受,结果是,尽管人人都认为改革好,却很难有人真正去改革,大家只好在都不满意的体制下继续生活下去。2.2.4公共资源问题2.2.4公共资源问题公共资源(1)没有哪个个人、企业或其他经济组织拥有;(2)大家都可以自由利用这两个特征的自然资源或人类生产的供大众免费使用的设施或财货。例设某村庄有n个农户,一公共草地,可养羊数为qi(i=1,…,n)为n个农户各自的策略空间,当各户养羊数为q1,…,qn时,总数为Q=q1+…+qn,每只羊的产出为羊的总数Q的减函数V=V(Q)=V(q1+…+qn),假设每只羊的成本为c,则农户i养qi只羊的得益为:ui=qiV(Q)-qic2.2.4公共资源问题-实例
设n=3,V=100-Q=100-(q1+q2+q3),c=4
三农户的得益函数和反应函数:
u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3
u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3
u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2
纳什均衡:q1*=q2*=q3*=24,
u1*=u2*=u3*=576
最大总体收益:u*=2304Q*=48
由此说明,纳什均衡的解常常是低效率的,而在现实生活中却经常出现。如果采取最佳策略(集体理性),那么个体的贪婪性将会来破坏这一平衡。2.3混合策略概念应用2.3.1概念的提出在前面的例子,如猜硬币,齐威王田忌赛马,夫妻之争等博弈问题不存在纳什均衡策略组合,然而这类问题十分常见。例1小偷与守卫的博弈守卫睡不睡小偷偷不偷V,-D-P,00,S0,02023/2/519小偷和守卫的博弈V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对首位的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概略0-D-D’守卫得益((睡)SPt小偷偷的概率12.3.1概念的提出2023/2/520V,-D-P,00,S0,0睡不睡偷不偷守卫小偷加重对小偷的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会是的守卫更多的偷懒0-P-P’小偷得益(偷)VPg守卫睡的概略1小偷和守卫的博弈猜硬币博弈
猜硬币方正面反面盖硬正面币方反面该博弈与上一个例子相似,即取胜的关键都是不能让另一方猜到自己的策略而同时自己又要尽可能猜出对方的策略。若p>1/2,则猜硬币方全猜正面,他的期望得益为p×1+(1-p)×(-1)=2p-1>0,即平均来说,猜硬币方赢多输少。
-1,11,-11,-1-1,1例2猜硬币
1.若被对手事先知道出现哪一面,肯定输
2.若正面出现的概率为p,负面为1-p,且p>0.5,则猜正面的话赢的几率就比较大。2.3.1概念的提出2023/2/522
混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方正面反面猜硬币博弈盖硬币方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布2023/2/523
混合策略反应函数猜硬币博弈-1,11,-11,-1-1,1正面反面猜硬币方正面反面猜硬币博弈盖硬币方rq111/21/2(r,1-r):盖硬币方选择正反面的混合策略概率分布(q,1-q):猜硬币方选择正反面的混合策略概率分布2.3.1概念的提出特点:1.自己的选择不能让对手预先知道2.若重复多次,则不让对手发现其中的规律。除非有意输(一种行贿的手段),注意行贿只是一个手段,有意无意间让对手了解自己的策略或规律。2.3.1概念的提出定义:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空间为Si={si1,…,sik},则博弈方i以概率分布pi=(pi1,…,pik)随机选择其k个可选策略称为一个“混合策略”,其中0≤pik≤1对k=1,…,k都成立且pi1+…+pik=1。相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略我们称为“纯策略”混合策略的原则:自己的策略选择不能被另一方预知或猜到。即在决策时利用随机性。选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性的倾向某一策略而占上风。2.3.2应用博弈方1选A、B的概率:pA,pB;博弈方2选C、D的概率:pC,pD。原则应用:博弈方1选A和B的概率pA和pB一定要使博弈方2选C的期望得益和选D的期望得益相等。即pA×
3
+pB×1=pA×
2
+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1应选的混合策略。同理可得博弈方2的混合策略为pC=0.8,pD=0.2。纳什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6
单独一次博弈的结果可能是四种状态的任何一种,然而多次独立重复博弈得到如上的结果是可能的。
2,35,23,11,5
2CDA1B2.3.2应用混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样可应用于存在多个纯策略纳什均衡的博弈问题。例夫妻之争该博弈与上一个博弈的不同之处在于每一方所希望对方知道自己的策略选择以达到有利于自己的结果。现实中,这类问题多通过协商解决以免两败俱伤。在此我们假设夫妻双方不可协商,互不通消息。令pw(时),pw(足)分别表示妻子选择时装表演和足球的概率;
ph(时),
ph(足)为丈夫选择时装表演和足球的概率。同样的分析方法可得pw(时)=0.75,pw(足)=0.25;ph(时)=1/3,ph(足)=2/3.双方的期望得益分别为uwe=0.67,uhe=0.75。
丈夫时装足球妻时装子足球2,10,00,01,32023/2/5282.3.2应用混合策略的方法不仅可以解决不存在纯策略纳什均衡的博弈问题,同样可应用于存在多个纯策略纳什均衡的博弈问题。例夫妻之争该博弈与上一个博弈的不同之处在于每一方所希望对方知道自己的策略选择以达到有利于自己的结果。现实中,这类问题多通过协商解决以免两败俱伤。在此我们假设夫妻双方不可协商,互不通消息。令pw(时),pw(足)分别表示妻子选择时装表演和足球的概率;
ph(时),
ph(足)为丈夫选择时装表演和足球的概率。同样的分析方法可得pw(时)=0.75,pw(足)=0.25;ph(时)=1/3,ph(足)=2/3.双方的期望得益分别为uwe=0.67,uhe=0.75。
丈夫
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 生物质能源购销协议
- 网络安全技术建设
- 我对煤矿安全负责
- 快速响应笔译服务
- 挖掘机订购合同文本
- 地域特色产品购销合同
- 新车购销合同简单版
- 热力管道施工招标时间表
- 混凝土路面劳务分包合同模板
- 消防工程劳务分包招标
- 《地质灾害监测技术规范》
- 2024-2030年中国云母制品制造市场发展状况及投资前景规划研究报告
- 2025年上半年内蒙古鄂尔多斯伊金霍洛监狱招聘17名(第三批)易考易错模拟试题(共500题)试卷后附参考答案
- QC080000培训讲义课件
- 24秋国家开放大学《农产品质量管理》形考任务1-2+形考实习1-3参考答案
- 科技兴国未来有我主题班会教学设计
- 房子管护合同范例
- 光伏施工安全措施
- 2024-2025华为ICT大赛(网络赛道)高频备考试题库500题(含详解)
- 汽车智能制造技术课件
- 江苏省扬州市邗江中学2025届物理高一第一学期期末学业质量监测试题含解析
评论
0/150
提交评论