博弈论-混合策略与随机行动_第1页
博弈论-混合策略与随机行动_第2页
博弈论-混合策略与随机行动_第3页
博弈论-混合策略与随机行动_第4页
博弈论-混合策略与随机行动_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、混合策略与随机行动赛场点球射门攻方的策略是:攻左边,或攻右边守方的策略是:守左边,或守右边(以守方的方向为准)守左边右边攻左边58,4295,5右边93,770,30混合策略提出 得益:进球得分的百分比。根据1995-2000年间意大利、西班牙和英国最高联盟的数据 就一次游戏而言,猜测对方的策略,保密自己的策略。在多次反复游戏中,避免任何的倾向性和规律性。严格竞争博弈 零和博弈实验办法是将行动随机化。 混合策略: 参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动。 例如:乒乓球员以60的概率选择正手发球,40的概率选择反手发球。 什么是纯策略?混合策略如果你是踢球人,这两个纯策

2、略中你更喜欢哪一种?(70)你能不能做得更好? 混合策略(1)以50:50(抛硬币)的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:*58%+ * 93%= 75.5%如果守门员选择右边,你混合策略成功的概率:*95%+ * 70%= 82.5%50:50是你最佳混合策略吗? 混合策略(2)以40:60(在你的口袋里放一本书,如果页眉最后一位数是1到4选左,0到5则选右)的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:0.4*58%+ 0.6* 93%= 79%如果守门员选择右边,你混合策略成功的概率:0.4*95%+ 0.6* 70%= 80%你的

3、连续更优的混合策略比例就是如何使自己在守门员选择左边时和选择右边的成功概率差距缩小。58701275.5% 82.5%7.379% 80%1xy0 混合策略不管守门员选择他的左边还是右边,你的最佳混合比例都会使你得到相等的成功率 混合策略(3)以x:1x的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:x*58%+ (1x)* 93%如果守门员选择右边,你混合策略成功的概率:x*95%+ (1x) * 70%两者相等,求得选x0.383不管守门员选择他的左边还是右边,你的最佳混合比例都会使你得到相等的成功率 混合策略(4)以0.383:0.617的比例随机地选择左边或右边。

4、如果守门员选择左边,你混合策略成功的概率:0.383*58%+ 0.617* 93%79.6如果守门员选择右边,你混合策略成功的概率:0.383*95%+ 0.617 * 70% 79.6那么守门员的策略怎样?混合策略纳什均衡? 混合策略守门员的最佳策略是使踢球者选择左边和选择右边的成功率相等的策略。守门员应当分别以41.7和58.3的比例选择自己的左边和右边,使踢球者成功的概率为79.6%.法则 混合策略在纯冲突博弈(零和博弈)中,如果让你的对手事先看清楚你的真实选择对你不利,那么你可以通过随机选择自己备选的纯策略而获益。你的混合比例应该是这样的:对手采取任何特定的备选纯策略,都不可能利用你

5、的选择,即,当你以混合策略对付他的混合策略中任一纯策略时,你得到的平均赢利都相等。实验抛硬币 怎样随机行动?抛硬币翻出正面之后再抛一次,这时出正面的可能性与抛出反面的可能性相等。无规律的随机行动(点名4/18=22%,不点名78)。例如:一个秘密的、足够复杂以致让人难以破解的规则。举例:秘密报案(reporting a crime)n个人目睹一桩罪行,每个人都希望报警,但是都倾向于其他人打电话。特别的,假定能从报警中得到v单位的收益,而打电话的人需要付出c单位的成本,vc0。分析这个问题的纯战略NE和混合战略NE。混合策略案例分析:参与人:n个每个参与人的战略集:打电话,不打电话效用:没有任何

6、人打,所有人0支付; 打,v-c; 不打,但其他人至少有一个人打,v混合策略案例纯战略NE当只有两个参与人的时候(公共产品提供的斗鸡博弈)两个NEn个人的时候: 假设有m个人提供,m1 or m=1 n个NE混合策略案例混合策略案例混合战略NE 随着人数n的增加,p减小,即人越多,每个人选择报案的概率就会越小,如果n1,则p1社会心理学与博弈分析混合策略案例 小孩玩的游戏“石头,剪子,布”,也是一种博弈。但是,这个博弈有一种有趣的特征,即给定一方的任何选择,另一方都有制胜对方的战略,所以,给定一方任何一个战略,对方都有制胜这个战略的战略,因而这个战略不是最优的。任何“纯战略”都不是最优的,纯战

7、略是“石头,剪子,布”中的任何一个。 但是,我们知道,玩这个游戏是总是以对方不易猜出的随机方式出招。事实上,可以通过数学证明,当双方都以每个战略按1/3的概率出招时,达成一种双方都不愿改变这种概率分布的局面。这被称为“混合战略纳什均衡”,而这种以随机方式选择纯战略的博弈被称为“混合战略博弈”。 实验显示:“陷入无意识但仍可预测的模式”例如:官僚作风连续出“布” 雪崩连续出石头 排除策略省略一个随机:秘密的,足够复杂以至难以让人破解的规则 例子1 田忌赛马新编 春秋战国时期,齐威王常与旗下大将田忌赛马。规则是:每次赛三局,每一局齐威王与田忌各出一匹马比赛奔跑速度。每一局中的胜者赢败方一千斤铜。田

8、忌有上、中、下三匹马,而齐威王也有上、中、下三匹马。每次比赛,第一局田忌出上马,齐威王也出上马;第二局田忌出中马,齐威王也出中马;第三局,田忌出下马,齐威王也出下马。齐威王的上马比田忌的上马好,齐威王的中马也比田忌的中马好,齐威王的下马还是比田忌的下马好。于是,每次比赛的结果都是田忌连输三局。 田忌的谋士孙膑了解了田忌的困境后,就打听到这样一个消息:尽管齐威王的上、中、下三匹马都要比田忌的对应上、中、下三匹马好,但碰巧的是田忌的上马可胜齐威王的中马,田忌的中马可胜齐威王的下马。于是,孙膑为田忌献计:下一次比赛中第一局时田忌出下马对齐威王的上马输一局,第二局田忌出上马对齐威王的中马,第三局田忌出

9、中马对齐威王的下马,这样可连赢两局,最后净胜一千斤铜。田忌依计而行,果真赢回一千斤铜。 这个故事曾经被很多人当作博弈论的例子来演绎,但实际上这个故事与博弈论无关。博弈论会假定所有局中人都是理性的,不能假定一些局中人聪明而另一些局中人却是傻子。当田忌出下马时,齐威王最好的选择是出下马而不是上马。孙膑的计谋中假定齐威王是傻子,当田忌出下、上、中马时,他仍然按上、中、下马出,当然要输了。事实上,当田忌出下马时,齐威王应出下马,但齐威王出下马时,田忌不应出下马而是出中马,但此时齐威王又应出中马而不是下马了,。这样,博弈不会有纯战略的均衡。 两人只能玩混合战略博弈,齐威王分别以1/6随机的概率选择出上、

10、中、下马的任一排列,田忌也如此。由于齐威王存在绝对优势,他平均看来仍然会赢田忌一千斤铜。 例子2 如果曹操与诸葛亮一样聪明:三国演义中的华容道博弈 在三国演义中,曹操在赤壁大战中一败涂地,率残兵败将向许都方向逃窜。诸葛亮命关羽率兵在途中阻截曹军。当时,第一批拦截大军是赵云率领的,第二批拦截大军是张飞带队的,第三批才是关羽率部伏击。由于曹军兵多将广,前二批伏击军不能逮住曹操,只是抢劫一些军械马匹之类。 待曹军冲过赵云、张飞两道关后,进入关羽的伏击地带。但是,当时关羽与曹操相遇的地方有两条道,一条是华容道,除此外还有另一条道。诸葛亮令关羽伏兵于华容道,并且要求关羽在华容道上点燃树枝冒出烟雾引曹操到

11、来。当时关羽不解,问诸葛亮,“如果在伏兵之处点火,岂不令曹兵看见而改走另一条道逃脱?”诸荀亮叫关羽不要再问,只如此照办即可。 当曹操冲破赵云、张飞的阻截后,来到华容道前,看见华容道上静悄悄的,但有烟火萦绕。曹操大笑道:“孔明以为我会上他的当,故意叫人在华容道上点火让我走另一条道,而他却伏兵于这条道上好逮住我呢!我偏不上他的当!”于是,曹操令大军径直上华容道上而去,结果与关羽大军撞个正着。 曹操为何进了孔明的圈套呢?这里的道理是这样的:孔明知道曹操是聪明人,而聪明人见华容道上有烟火会认为华容道上有伏兵,于是会避开华容道而走另一条路。如果孔明令关羽在另一条路等着,曹操就被逮住了。但是,曹操不仅聪明

12、,而且还聪明过人,他也知道孔明的如此盘算来诱他上钩,他偏不上当,知道点火的华容道上无人,孔明的队伍在另一条道上呢!于是他选择走华容道。 但是,依三国演义作者罗贯中的逻辑,孔明总是比曹操计高一筹,按博弈论的术语来说,就是孔明的理性程度要比曹操高上一阶。孔明也知道曹操知道孔明的打算,于是令关羽正好在点火的华容道上等着曹操。三国演义中的这个故事很可能是作者编造的,因为在三国志中并无这一情节。这里,罗贯中假设了曹操在智力上比孔明差一些,才有华容道上被关羽抓住,要不是关羽旧情难忘,曹操就死无葬身之地了。 但是,如果我们不假定曹操比孔明要笨一些,而是相反假定曹操与孔明一样聪明,则曹操又知道孔明知道曹操知道

13、孔明的打算,曹操就会知道关羽在华容道上等着他呢?此时曹操就避开华容道走另一条路。但是,这还没有完,因为若孔明知道曹操知道孔明知道。显然,最终的结果是曹操与孔明玩混合战略博弈,曹操随机地以1/2的概率选择走华容道和另一条路,孔明也以1/2的概率令关羽守华容道或另一条路。 于是,三国演义中的这一情节就应作如下改写: 诸葛亮抛出一枚硬币,决定关羽是守华容道呢还是另一条道,而曹操也掷出一枚硬币,决定是走华容道呢还是走另一条路。平均看来,曹操有1/2的概率逃脱,而关羽也只有1/2的概率抓住曹操。如果说关羽在华容道上抓住了曹操,则纯属偶然、并非孔明比曹操计高一筹所致!剪刀-石头-布爬楼梯游戏策略,石头、剪

14、子、布布获胜,向上爬5个台阶剪刀获胜,向上爬2个台阶石头获胜,向上爬1个台阶平局,再来一遍第一个爬上楼梯的是获胜者商业与其他对抗中的混合策略商界、政界和战争非零和博弈商业与其他对抗中的混合策略例如:折扣券博弈问题商业与其他对抗中的混合策略例1:折扣券博弈问题目的?1、都不发行2、都发行3、一个发行,另一个不发行如何占得先机?商业与其他对抗中的混合策略如何占得先机?避免他人占得先机,唯一的途径就是保持出人意料的元素。这一元素源于随机化策略的应用但是:独立随机选择有“出错”的危险。进行合作!商业与其他对抗中的混合策略可口可乐和百事可乐52个星期,分别发放26周优惠券没有出现两家同时的情况计算:如果

15、两家独立以50概率随机选择任何一周发放优惠券,那么他们各自发放26周而不会出现同时发放的概率是1/10005(10亿的10亿次方)延伸:联合营销麦当劳与可口可乐,肯德基与百事可乐从美国相携走向全球,许多大的跨国企业均与知名连锁酒店、供应商保持全球的合作体系,令人慨叹中国的许多企业尽管躯体庞大,但在经营的思想和理念上与它们相去甚远。 辜鸿铭曾用西文出版过一本书,书名为中国人的精神,其中将中国人的民族性格归结为三大特征:“deep, bright, simple”,译成中文是“深沉、聪明、淳朴”。 延伸:联合营销深沉就是含而不露,静水流深,但这种性格与联盟的阳光与规则的透明背道而驰。聪明更多是为人

16、为事的创造力与洞察,但似乎缺少更大气的哲学和价值观思考,这样也不利于建立通用的制度规则,大家思考的更多是彼此之间的利益而非联盟共事致力追求的长远目标这也是战国时期秦国以连横成功打破六国合纵政策的原因所在。 例2:飞机折扣票博弈航空公司告诉你折扣,不告诉你剩余的空位你随机选择时点进行订票V,-D-P,00,S0,0睡不睡偷不偷守卫小偷混合战略:守卫以n概率选择睡觉,以1m的概率选择不睡小偷以m概率选择偷,以1n概率选择不偷例4 监督博弈加重对守卫的处罚:短期中的效果是使守卫真正尽职在长期中并不能使守卫更尽职,但会降低盗窃发生的概率0- D- D守卫得益(睡)S小偷偷的概率1激励悖论Sm加重对小偷

17、的处罚:短期内能抑制盗窃发生率长期并不能降低盗窃发生率,但会使得守卫更多的偷懒0- P- P小偷得益(偷)V守卫睡的概率1n激励悖论 例5 为什么一般人总是小错不断,大错不犯;偷税漏税的一般是中小企业,大企业会老老实实地交税? 税务部门不会对所有企业的交税情况每一次都去检查,因为这样做的成本太高,得不偿失。所以,税务部门总是随机地对企业的交税情况进行检查。 企业也是随机地在交税与偷漏税之间进行选择。税收部门与企业间进行的是混合战略博弈。因为如果企业总是交税,税务部门就最好不检查;但给定不检查,企业就会偷漏税。所以,两者只有在随机地检查与不检查,企业随机地在偷漏税与交税之间选择,才会达成均衡。

18、对于大企业,因一旦偷税就数目巨大,所以,税务部门在随机检查时放在大企业上的可能性就大一些;而给定税务部门检查大企业的可能性较大,大企业偷漏税的行为就较少,否则就容易被逮个正着。所以,偷漏税较多的就是一些中小企业,大企业纳税的积极性较高。同样,大人物或有钱人纳税的积极性应较高,至于我国在过去一段时期有钱人反而不交税的现象主要源于制度不健全或已有的制度得不到贯彻所致。同样的道理,在犯罪或对错误的监督惩罚博弈中,也是混合博弈,人们可能总是大错不犯小错不断。9、静夜四无邻,荒居旧业贫。9月-229月-22Sunday, September 18, 202210、雨中黄叶树,灯下白头人。21:12:57

19、21:12:5721:129/18/2022 9:12:57 PM11、以我独沈久,愧君相见频。9月-2221:12:5721:12Sep-2218-Sep-2212、故人江海别,几度隔山川。21:12:5721:12:5721:12Sunday, September 18, 202213、乍见翻疑梦,相悲各问年。9月-229月-2221:12:5721:12:57September 18, 202214、他乡生白发,旧国见青山。18 九月 20229:12:57 下午21:12:579月-2215、比不了得就不比,得不到的就不要。九月 229:12 下午9月-2221:12September

20、 18, 202216、行动出成果,工作出财富。2022/9/18 21:12:5721:12:5718 September 202217、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。9:12:57 下午9:12 下午21:12:579月-229、没有失败,只有暂时停止成功!。9月-229月-22Sunday, September 18, 202210、很多事情努力了未必有结果,但是不努力却什么改变也没有。21:12:5721:12:5721:129/18/2022 9:12:57 PM11、成功就是日复一日那一点点小小努力的积累。9月-2221:12:5721:12Se

21、p-2218-Sep-2212、世间成事,不求其绝对圆满,留一份不足,可得无限完美。21:12:5721:12:5721:12Sunday, September 18, 202213、不知香积寺,数里入云峰。9月-229月-2221:12:5721:12:57September 18, 202214、意志坚强的人能把世界放在手中像泥块一样任意揉捏。18 九月 20229:12:57 下午21:12:579月-2215、楚塞三湘接,荆门九派通。九月 229:12 下午9月-2221:12September 18, 202216、少年十五二十时,步行夺得胡马骑。2022/9/18 21:12:5721:12:5718 September 202217、空山新雨后,天气晚来秋。9:12:57 下午9:12 下午21:12:579月-229、杨柳散

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论