版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、纯策略纳什均衡纯策略纳什均衡 (Pure Strategy Nash Equilibrium)编辑什么就是纯策略纳什均衡纯策略纳什均衡 就是指在一个 纯策略 组合中 ,如 果给定其她得策略不变 ,该节点不会单方面改变自己 得策略 ,否则不会使节点访问代价变小。编辑 存在纯策略纳什均衡得有限次重复博弈 1如果重复博弈 中有惟一纯策略纳什均衡 ,那么我 们怎么找出它得纯策略纳什均衡呢 ?首先瞧下面 囚徒 得困境 得博弈得例子 :我们现在考虑该博弈重复两次得重复博弈 ,这可 以理解成给囚徒两次坦白机会 ,最后得得益就是两个 阶段博弈中各自得益之与 .在两次博弈过程中 ,双方知 道第一次博弈得结果再进
2、行二次博弈 .用逆推归纳法 来分析 ,先分析第二阶段 ,也就就是第二次重复时两 博 弈方得选择 .很明显 ,这个第二阶段仍然就是两囚徒之 间得一个囚徒得困境博弈 ,此时前一阶段得结果已成 为既成事实 ,此后又不再有任何得后续阶段 ,因此实现 自身当前得最大利益就是两博弈方在该阶段决策中得 惟一原则.因此我们不难得出结论 ,不管前一次得博弈得到 得结果如何 ,第二阶段得惟一结果就就是原博弈惟一 得纳什均衡 (坦白,坦白),双方得益 (-5,-5).现在再回到第一阶段 ,即第一次博弈 .理性得博弈 方在第一阶段就对后一阶段得结局非常清楚 ,知道第 二阶段得结果必然就是 (坦白 ,坦白 ),因此不管
3、第一阶 段得博弈结果就是什么 ,双方在整个重复博弈中得最 终得益 ,都将就是第一阶段得基础上各加 -5. 因此从第 一阶段得选择来瞧 ,这个重复博弈 与图 l 中得益矩阵 表 示得一次性博弈实际上就是完全等价得 .于就是我们可以得出惟一纯策略均衡得 有限次重 复博弈 得结果就就是重复原博弈惟一得纯策略纳什均 衡,这就就是这种重复博弈惟一得 子博弈完美纳什均 衡路径.如果重复博弈中有多个纯策略纳什均衡 ,设某一 市场有两个生产同样 质量 产品得厂商 ,她们对产品得 定价同有高 (H) 、中(M) 、低(L)三种可能 .设高价时市场 总利润为 10 个单位 ,中价时市场总利润为 6 个单位 , 低
4、价时市场总利润为 2 个单位 .再假设两厂商同时决 定价格 ,价格不等时低价格者独享利润 ,价格相等时双 方平分利润 .这时候两厂商对价格得选择就构成了一 个静态博弈 问题.我们瞧一个三价博弈得重复博弈得 例子:显然,这个得益矩阵 有两个纯策略纳什均衡 (M,M) 与(L,L),我们也可以瞧出实际上两博弈方最大得得益 就是策略组合 (H,H), 但就是它并不就是纳什均衡 .现在 考虑重复两次该博弈 ,我们采用一种 触发策略 (Trigger Strategy ):博弈双方首先试图合作 ,一旦发觉对方不合 作也用不合作相报复得策略 .使得在第一阶段采用 (H,H) 成为子博弈完美纳什均衡 ,其双
5、方得策略就是这 样得:博弈方 1:第一次选 H;如果第一次结果为 (H,H), 则 第二次选 M, 如果第一次结果为任何其她策略组合 ,则 第二次选择 L.博弈方 2:同博弈方 1.在上述双方策略组合下 ,两 次重复博弈得路径一定为第一阶段 (H,H), 第二阶段 (M,M), 这就是一个子博弈完美纳什均衡路径 .因为第 二阶段就是一个原博弈得纳什均衡 ,因此不可能有哪 一方愿意单独偏离 ;其次,第一阶段得 (H,H) 虽然不就是 原来得博弈纳什均衡 ,但就是如果一方单独偏离 ,采用 M 能增加 1 单位得益 ,这样得后果却就是第二阶段至少 要损失 2 单位得得益 ,因为双方采用得就是 触发策
6、略 , 即有报复机制得策略 ,因此合理得选择就是坚持 H.这 就说明了上述策略组合就是这个两次重复博弈得 子博 弈完美纳什均衡 .从上述得例子我们可以瞧出 ,有多个纯策略纳什 均衡得博弈重复两次得子博弈完美纳什均衡路径就是 第一阶段采用 (H,H), 第二阶段采用原博弈得纳什均衡 (M,M).如果这个重复博弈重复三次 ,或者更多次 ,结论也 就是相似得 ,仍然用 触发策略 ,它得子博弈完美纳什均 衡路径为除了最后一次以外 ,每次都采用 (H,H), 最后一 次采用原博弈得纳什均衡 (M,M).编辑存在纯策略纳什均衡得无限次重复博弈 1与有限次重复博弈一样 ,无限次重复博弈 也就是 基本博弈得简
7、单重复 ,但就是无限次重复博弈没有最 后一次重复 ,因此无限次重复博弈与有限次有一些不 同.任何博弈中博弈方策略选择得依据都就是得益得 大小 ,这在重复博弈中仍然就是成立得 .但就是重复博 弈又与一次性博弈有所不同 ,因为在重复博弈中 ,每一 阶段都就是一个博弈 ,并且各博弈方都有得益 ,因此对 于重复博弈 ,我们要计算得就就是博弈结束时得一个 总得得益 .由于前一次博弈与后一次博弈之间会有损 失 ,因此我们采用一种方法 ,就就是将后一阶段得得益 折算成当前阶段得益得 (现在值 )得贴现系数 .有了贴 现系数 ,那么在无限次重复博弈中 ,某博弈方各阶段 得益为 1,2,、 ,则该博弈方总得益得
8、现在值为 :对于存在惟一纯策略纳什均衡博弈得无限次重复 博弈 ,我们从下面得例子来瞧 :其中博弈方 1 与博弈方 2 分别表示两个厂商 ,H 与 L 分别表示高价与低价 .显然 ,该博弈得一次性博弈有 惟一得纯策略纳什均衡 (L,L), 但就是这个纳什均衡并 不就是最佳策略组合 ,因为策略组合 (H,H) 得得益 (4,4) 比(1,1)要高得多 .但就是由于 (H,H)不就是该博弈得纳 什均衡 ,所以在一次性博弈中不会被采用 .根据上面得 分析,此博弈在有限次重复博弈并不能实现潜在得合 作利益 ,两博弈方在每次重复中都不会采用 效率较高 得(H,H). 为了实现效率较高得合作利益 (H,H)
9、,假设两 博弈方都采用 触发策略 ,也即报复性策略 :第一阶段采 用 H,在第 t 阶段,如果前 t-l 阶段得结果都就是 (H,H), 则继续采用 L.假设博弈方 1 已经采用了这种策略 ,现在 我们来确定博弈方 2 在第一阶段得最优选择 .如果博 弈方 2 采用 L,那么在第一阶段能得到 5,但这样会引起 博弈方 1 一直采用 L 得报复 ,自己也只能一直采用 L, 得益将永远为 1,总得益得现在值为如果博弈方 2 采用 H,则在第一阶段她将得 4,下一 阶段又面临同样得选择 .若记 V 为博弈方 2 在该重复博 弈中每阶段都采用最佳选择得总得益现在值 ,那么从 第二阶段开始得无限次重复博弈因为与从第一阶段开始得只差一 阶段 ,因而在无限次重复时可瞧作相同得 其总得益得现在值折算成第一阶段得得益为 ,因此当 第一阶段得最佳选择就是 H 时,整个无限次重复博弈 总得益得现在值为或者因此,当 解得时,博弈方 2 会采用 H 策略,否则会 采用 L 策略
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 头发用刷产业规划专项研究报告
- 冰茶匙市场发展预测和趋势分析
- 头发用漂白剂产业规划专项研究报告
- 学习布莱尔盲文用积木市场需求与消费特点分析
- 人教版英语八年级下册 Unit 1 单元复习
- 半导体收音机产业深度调研及未来发展现状趋势
- 截石钳产业深度调研及未来发展现状趋势
- 儿童自行车用轮胎市场需求与消费特点分析
- 高一数学说课稿10篇
- 城市电力与通信管道施工方案
- 电动机的维护与保养毕业论文
- 部编版二年级上册道德与法治第二单元 我们的班级 达标测试卷及答案28
- 模拟真实天平(flash模拟型课件)
- 山东生态功能区划(文字)
- DFMEA模板(完整版)
- 施工企业物资核销综述
- 发电机组达标投产自查报告
- 2021年贵州高考理综试题含答案
- 《财务管理学》知识点归纳(精华)
- 管道缩写代号.xlsx
- 英格索兰空压机服务协议
评论
0/150
提交评论