优势策略的含义.ppt_第1页
优势策略的含义.ppt_第2页
优势策略的含义.ppt_第3页
优势策略的含义.ppt_第4页
优势策略的含义.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

世界上最爱我的那个人发飙了 妻 进 退 进 夫 退 -3,-32,0 0,20,0 夫妻吵架斗鸡博弈 特征 1.双方了解各种情况下的得益:完全信 息 进胜利 退丢面子 2.同时决策:静态博弈 亲爱的,你先 吵,你吵完了 我再吵? 博弈论 第二章 同时决策博弈 静态博弈 第一节 二人同时博弈 一、复习:要素 (一)参与人(局中人,博弈方) i=1,2,n (二)策略(行动) 1.策略集:集合 Si=si,某人的所有策略 2.策略组合:向量 s=(s1,si,sn),所有人的某一策略 第一节 二人同时博弈 一、复习:要素 (三)支付(得益) 1.某人支付:取决于所有人的策略 ui=(S1,Si,Sn) 2.支付组合:所有人的支付 u=(u1,ui,un) 案例:深更半夜去作案 深更半夜去作案 心惊又胆颤 没有星星和月亮 什么也看不见 顺了一些电脑主机 正在一边笑眯眯 不幸被警察看见了 被请进公安局 第一节 二人同时博弈 二、矩阵:经典模型 1.囚徒困境 嫌疑人乙 坦白 抵赖 坦白 嫌疑人甲 抵赖 -3,-30,-5 -5,0-1,-1 第一节 二人同时博弈 二、矩阵:经典模型 2.智猪博弈 小猪 要食 等待 要食 大猪 等待 5,14,4 9,-10,0 第一节 二人同时博弈 三、矩阵型(正规型、策略型)博弈 的数学描述 哪个策略为最优?诸多策 略中的优势策略 第二章 同时决策博弈 第二节 优势策略与优势策略均 衡 第二节 优势策略与优势策略均衡 一、优势策略:占优策略 (一)定义 无论其他参与人选择什么策略,某参 与人的某策略产生的支付高于(至少 不低于)自己的其他策略产生的支付 此策略为优势策略 第二节 优势策略与优势策略均衡 一、优势策略:占优策略 (二)分类 1.严格优势策略 2.弱优势策略:ui(si*,s-i)至少不低于 ui(si,s-i) 第二节 优势策略与优势策略均衡 一、优势策略:占优策略(上策策略 ) (三)对应的概念:严格劣势策略 第二节 优势策略与优势策略均衡 二、寻找优势策略:定义法 (一)案例:超市中的可乐价格大战 PESPI 低价 高价 低价 COCO 高价 3,36,1 1,65,5 第二节 优势策略与优势策略均衡 二、寻找优势策略:定义法 (二)分析:第一步,给定COCO的 策略(研究范围:行) 1.给定COCO选择低价,PEPSI比较得 益3与1(考察对象:第一行) PEPSI选择:低价 2.给定COCO选择高价,PEPSI比较得 益6与5(考察对象:第二行) PEPSI选择:低价 第二节 优势策略与优势策略均衡 二、寻找优势策略:定义法 (三)分析:第二步,给定PEPSI的 策略(研究范围:列) 1.给定PEPSI选择低价,COCO比较得 益3与1(考察对象:第一列) COCO选择:低价 2.给定PEPSI选择高价,COCO比较得 益6与5(考察对象:第二列) COCO选择:低价 第二节 优势策略与优势策略均衡 二、寻找优势策略:定义法 (四)结论 严格优势策略组合(低价,低价) 囚徒困境:对个人而言最优的策略( 低价),对集体而言非最优。个人理 性与集体理性冲突 原因:只关心己方利益,双输 第二节 优势策略与优势策略均衡 三、优势策略均衡(占优均衡) (一)表述:优势策略组合 一个博弈中,某策略组合的所有策略 都是各参与人各自的上策 (低价,低价) 特征:博弈中的稳定结果 占优均衡 (dominant-strategy equilibrium) 占优战略均衡的出现只要求所有人都 是理性的,但不要求每个参与人知道 其他参与人是否理性。 囚徒困境博弈有占优均衡,所以其结 果很容易预测。 第二节 优势策略与优势策略均衡 三、优势策略均衡(占优均衡) (二)寻找优势策略均衡 艺术家公明要求看装修商的设计方案 装修商 给看 不给看 要求看 公明 不要求看 800,6000,0 0,10000,1000 第二节 优势策略与优势策略均衡 三、优势策略均衡 (二)寻找优势策略均衡 1.给定公明的策略选择(研究行) (1)给定公明“要求看”(第一行) 装修商比较600与0,选择“给看” (2)给定公明“不要求看”(第二行) 装修商赚取1000,“不要求看”为公明的 劣势策略 第二节 优势策略与优势策略均衡 三、优势策略均衡 (二)寻找优势策略均衡 2.给定装修商的策略选择(研究列) (1)给定装修商“给看”(第一列) 公明比较800与0,选择“要求看” (2)给定装修商“不给看”(第二列) 公明得0,生意泡汤,装修商选择“给看” 第二节 优势策略与优势策略均衡 三、优势策略均衡 (二)寻找优势策略均衡 3.均衡:(要求看,给看) 800,6000,0 0,10000,1000 个人理性与集体理性的冲突 “囚徒困境”表明个人理性与集体理性的冲 突。 这样的例子很多:寡头竞争,军备竞赛, 团队生产中的劳动供给,公共产品的供给 ,等等; 许多的制度就是为解决“囚徒困境”而存在 的; 公共产品(public goods) 提供 不提供 提供 不提供 4,4-1,5 5,-10,0 无论对方如何选择,每个人的最优选择:不提供。 所以,我们可以预测,结果将是(不提供,不提供) 公共产品与税收制度 比较私人产品与公共产品的不同:使 用上排他性; 私人产品是志愿购买的,但公共产品 可能需要强制购买; 税收制度就是保证公共产品的生产, 解决公共产品生产上的“囚徒困境” “智猪博弈”(boxed pigs) 有些博弈没有占优均衡,但通过剔除“坏” 战略,我们可以预测博弈的结果。如“智猪 博弈” 这个博弈中,大猪的最优选择依赖于小猪的选择,但 小猪的最优选择与大猪的选择无关。如果大猪知道小 猪的理性的,大猪将选择“按”。均衡是“大猪按,小猪 等待”。 “劣”战略:无论对方选择什么,如果自己选择A得到 的总是收益小于选择B得到的收益,A就是相对于B的 劣战略。 继续小试牛刀:智猪博弈 小猪 要食 等待 要食 大猪 等待 5,14,4 9,-10,0 重复剔除占优均衡 “重复剔除严格劣战略”(iterated elimination of strictly dominated strategy)的思路:首先找出博 弈参与人的劣战略(dominated strategy)(假定存 在的话),把这个劣战略剔除后,剩下的是一个不 包含已剔除劣战略的新的博弈;然后在剔除这个新 的博弈中的劣战略;继续这个过程,直到没有劣战 略存在。如果剩下的战略组合是唯一的,这个唯一 的战略组合就是“重复剔除占优均衡”(iterated dominance equilibrium)。 如果这样的解存在,我们说该博弈是“重复剔除占优 可解的”(iterated dominance solvable). 重复剔除与理性共识 重复剔除不仅要求每个人是理性的,而且要求每个 人知道其他人是理性的,每个人知道每个人知道每 个人是理性的,如此等等,即理性是“共同知识”( 共识) 重复剔除与理性共识 重复剔除不仅要求每个人是理性的,而且要求每个 人知道其他人是理性的,每个人知道每个人知道每 个人是理性的,如此等等,即理性是“共同知识”( 共识) C1 C2C3 R1 R2 R3 10,41, 598,4 9, 9 0, 399,8 11,98 0,100100,98 为了加深对重复剔除过程的理解,让我们再考虑一个例为了加深对重复剔除过程的理解,让我们再考虑一个例 子:子: 2, 00, 10, 3 0, 11 , 21, 0 LRM U D 参与人B 参与人A 0, 10, 3 1 , 21, 0 LM U D 参与人B 参与人A 1 , 21, 0 LM U 参与人B 参与人A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论