




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、纯策略纳什均衡 纯策略纳什均衡(Pure Strategy Nash Equilibrium)编辑什么就是纯策略纳什均衡纯策略纳什均衡就是指在一个纯策略组合中,如 果给定其她得策略不变,该节点不会单方面改变自己 得策略,否则不会使节点访问代价变小。编辑存在纯策略纳什均衡得有限次重复博弈1如果重复博弈中有惟一纯策略纳什均衡,那么我 们怎么找出它得纯策略纳什均衡呢?首先瞧下面囚徒 得困境得博弈得例子:我们现在考虑该博弈重复两次得重复博弈,这可 以理解成给囚徒两次坦白机会,最后得得益就是两个 阶段博弈中各自得益之与.在两次博弈过程中,双方知 道第一次博弈得结果再进行二次博弈用逆推归纳法 来分析,先分
2、析第二阶段,也就就是第二次重复时两博弈方 得选择.很明显,这个第二阶段仍然就是两囚徒之间得一个囚徒得困境博弈,此时前一阶段得结果已成为既成事实,此后又不再有任何得后续阶段,因此实现自身当前得最大利益就是两博弈方在该阶段决策中得惟一原则.因此我们不难得出结论,不管前一次得博弈得到得结果如何,第二阶段得惟一结果就就是原博弈惟一得 纳什均衡(坦白,坦白),双方得益(-5,-5).现在再回到第一阶段,即第一次博弈.理性得博弈方在第一阶段就对后一阶段得结局非常清楚,知道第二阶段得结果必然就是(坦白,坦白 ),因此不管第一阶段得博弈结果就是什么,双方在整个重复博弈中得最终得益,都将就是第一阶段得基础上各加
3、-5.因此从第一阶段得选择来瞧,这个 重复博弈 与图 l 中 得益矩阵 表示得一次性博弈实际上就是完全等价得.于就是我们可以得出惟一纯策略均衡得有限次重复博弈 得结果就就是重复原博弈惟一得纯策略纳什均衡 , 这就就是这种重复博弈惟一得子博弈完美纳什均衡 路径 .如果重复博弈中有多个纯策略纳什均衡,设某一市场有两个生产同样质量 产品得厂商,她们对产品得定价同有高(H)、中(M)、低(L)三种可能.设高价时市场总利润为10 个单位,中价时市场总利润为6 个单位 ,低价时市场总利润为2 个单位.再假设两厂商同时决定价格,价格不等时低价格者独享利润,价格相等时双方平分利润.这时候两厂商对价格得选择就构
4、成了一个 静态博弈 问题. 我们瞧一个三价博弈得重复博弈得例子 :显然 ,这个 得益矩阵 有两个纯策略纳什均衡(M,M)与 (L,L), 我们也可以瞧出实际上两博弈方最大得得益就是 策略组合(H,H), 但就是它并不就是纳什均衡.现在考虑重复两次该博弈,我们采用一种触发策略(TriggerStrategy ):博弈双方首先试图合作,一旦发觉对方不合作也用不合作相报复得策略.使得在第一阶段采用(H,H)成为子博弈完美纳什均衡,其双方得策略就是这样得 :博弈方1:第一次选H;如果第一次结果为(H,H),则 第二次选M,如果第一次结果为任何其她策略组合,则 第二次选择L.博弈方 2:同博弈方1.在上
5、述双方策略组合下,两次重复博弈得路径一定为第一阶段(H,H), 第二阶段(M,M), 这就是一个子博弈完美纳什均衡路径.因为第二阶段就是一个原博弈得纳什均衡,因此不可能有哪一方愿意单独偏离;其次,第一阶段得(H,H)虽然不就是 原来得博弈纳什均衡,但就是如果一方单独偏离,采用M 能增加 1 单位得益, 这样得后果却就是第二阶段至少要损失 2 单位得得益,因为双方采用得就是触发策略,即有报复机制得策略,因此合理得选择就是坚持 H.这 就说明了上述策略组合就是这个两次重复博弈得子博弈完美纳什均衡.从上述得例子我们可以瞧出,有多个纯策略纳什均衡得博弈重复两次得子博弈完美纳什均衡路径就是第一阶段采用(
6、H,H), 第二阶段采用原博弈得纳什均衡(M,M).如果这个重复博弈重复三次,或者更多次,结论也就是相似得,仍然用触发策略 ,它得子博弈完美纳什均衡路径为除了最后一次以外,每次都采用(H,H), 最后一次采用原博弈得纳什均衡(M,M).编辑存在纯策略纳什均衡得无限次重复博弈1与有限次重复博弈一样,无限次重复博弈也就是 基本博弈得简单重复,但就是无限次重复博弈没有最 后一次重复,因此无限次重复博弈与有限次有一些不 同.任何博弈中博弈方策略选择得依据都就是得益得 大小,这在重复博弈中仍然就是成立得.但就是重复博 弈又与一次性博弈有所不同,因为在重复博弈中,每一 阶段都就是一个博弈,并且各博弈方都有
7、得益,因此对 于重复博弈,我们要计算得就就是博弈结束时得一个 总得得益.由于前一次博弈与后一次博弈之间会有损 失,因此我们采用一种方法,就就是将后一阶段得得益 折算成当前阶段得益得(现在值)得贴现系数*有了贴 现系数目那么在无限次重复博弈中,某博弈方各阶段 得益为可茂,、,则该博弈方总得益得现在值为:对于存在惟一纯策略纳什均衡博弈得无限次重复 博弈,我们从下面得例子来瞧:其中博弈方1 与博弈方2 分别表示两个厂商,H 与L 分别表示高价与低价. 显然, 该博弈得一次性博弈有惟一得纯策略纳什均衡(L,L), 但就是这个纳什均衡并不就是最佳策略组合,因为策略组合(H,H)得得益(4,4) 比(1,
8、1)要高得多.但就是由于(H,H)不就是该博弈得纳 什均衡,所以在一次性博弈中不会被采用.根据上面得分析 ,此博弈在有限次重复博弈并不能实现潜在得合作利益,两博弈方在每次重复中都不会采用效率 较高得 (H,H). 为了实现效率较高得合作利益(H,H), 假设两博弈方都采用触发策略,也即报复性策略:第一阶段采用H,在第t阶段,如果前t-l阶段得结果都就是(H,H),则继续采用L. 假设博弈方1 已经采用了这种策略,现在我们来确定博弈方2 在第一阶段得最优选择.如果博弈方2采用L,那么在第一阶段能得到5,但这样会引起博弈方 1 一直采用L 得报复,自己也只能一直采用L,得益将永远为1,总得益得现在值为如果博弈方2采用H,则在第一阶段她将得4,下一 阶段又面临同样得选择.若记V为博弈方2在该重复博 弈中每阶段都采用最佳选择得总得益现在值,那么从第二阶段开始得无限次重复博弈因为与从第一阶段开始得只差一阶段 ,因而在无限次重复时可瞧作相同得其总得益得现在值折算成第一阶段得得益为,因此当第一阶段得最佳选择就是H 时 ,整个无限次重复博弈总得益得现在值为或者因此,当解得时,博弈方2 会采用 H 策略,否则会采用 L
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年新教材高中政治第二课第一框新民主主义革命的胜利教案部编版第一册
- 2025年度雕塑艺术项目融资合作协议
- Unit 6 Jobs Lesson 3(教学设计)-2024-2025学年人教新起点版英语四年级上册
- 2025年度知识产权保护承包合同范本
- 《习作:变形记》教学设计-2024-2025学年统编版语文六年级上册
- 医疗器械类安全风险分析报告
- 2025年度房地产项目全程策划服务合同
- 2025年电子商务厂房租赁合同范本
- 2025年度企业孵化器企业孵化项目评估合同3篇
- 2025年中国丙烯酸内墙乳胶漆行业市场调查研究及投资潜力预测报告
- 常用桥牌词语(中英文对照)
- 小升初、小学生满分优秀作文汇编100篇
- 次声波在临床医学及麻醉中的作用 次声波在临床麻醉中的作用
- 加盟招商方案PPT模板
- 中石油HSE培训试题集(共33页)
- 2022年云南省中考数学试题及答案解析
- TS16949五大工具:SPC
- 五年级下册-综合实践教案
- 贵州出版社小学五年级下册综合实践活动教案全册
- [方案]隐框玻璃幕墙施工方案
- 设备安装检验批表格
评论
0/150
提交评论