博弈论-混合策略与随机行动_第1页
博弈论-混合策略与随机行动_第2页
博弈论-混合策略与随机行动_第3页
博弈论-混合策略与随机行动_第4页
博弈论-混合策略与随机行动_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

混合策略与随机行动赛场点球射门攻方的策略是:攻左边,或攻右边守方的策略是:守左边,或守右边(以守方的方向为准)守左边右边攻左边58,4295,5右边93,770,30混合策略提出得益:进球得分的百分比。根据1995-2000年间意大利、西班牙和英国最高联盟的数据就一次游戏而言,猜测对方的策略,保密自己的策略。在多次反复游戏中,避免任何的倾向性和规律性。严格竞争博弈零和博弈实验办法是将行动随机化。混合策略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动。例如:乒乓球员以60%的概率选择正手发球,40%的概率选择反手发球。

什么是纯策略?混合策略如果你是踢球人,这两个纯策略中你更喜欢哪一种?(70%)你能不能做得更好?

混合策略(1)以50:50(抛硬币)的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:½*58%+½*93%=

75.5%如果守门员选择右边,你混合策略成功的概率:½*95%+½*70%=

82.5%50:50是你最佳混合策略吗?

混合策略(2)以40:60(在你的口袋里放一本书,如果页眉最后一位数是1到4选左,0到5则选右)的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:0.4*58%+0.6*93%=

79%如果守门员选择右边,你混合策略成功的概率:0.4*95%+0.6*70%=

80%你的连续更优的混合策略比例就是如何使自己在守门员选择左边时和选择右边的成功概率差距缩小。58%--70%--12%75.5%--82.5%--7.3%79%--80%--1%x--y--0

混合策略不管守门员选择他的左边还是右边,你的最佳混合比例都会使你得到相等的成功率

混合策略(3)以x:1-x的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:x*58%+(1-x)*93%如果守门员选择右边,你混合策略成功的概率:x*95%+(1-x)

*70%两者相等,求得选x=0.383不管守门员选择他的左边还是右边,你的最佳混合比例都会使你得到相等的成功率

混合策略(4)以0.383:0.617的比例随机地选择左边或右边。如果守门员选择左边,你混合策略成功的概率:0.383*58%+0.617*93%=79.6%如果守门员选择右边,你混合策略成功的概率:0.383*95%+0.617

*70%=79.6%那么守门员员的策略怎怎样?混合策略纳纳什均衡?混合策略守门员的最最佳策略是是使踢球者者选择左边边和选择右右边的成功功率相等的的策略。。守门员应应当分别别以41.7%%和58.3%%的比例例选择自自己的左左边和右边,,使踢球球者成功功的概率率为79.6%.法则混合策略略在纯冲突突博弈((零和博博弈)中中,如果果让你的的对手事事先看清清楚你的真真实选择择对你不不利,那那么你可可以通过过随机选选择自己己备选的纯纯策略而而获益。。你的混混合比例例应该是是这样的的:对手手采取任何何特定的的备选纯纯策略,,都不可可能利用用你的选选择,即,当你你以混合合策略对对付他的的混合策策略中任任一纯策策略时,,你得到的的平均赢赢利都相相等。实验抛硬硬币怎样随机机行动??抛硬币翻翻出正面面之后再再抛一次次,这时时出正面面的可能能性与抛抛出反面的的可能性性相等。。无规律的的随机行行动(点点名4/18=22%,不点点名78%)。。例如:一一个秘密密的、足足够复杂杂以致让让人难以以破解的的规则。。举例:秘秘密报案(reportingacrime)n个人目目睹一桩桩罪行,,每个人人都希望望报警,,但是都都倾向于于其他人人打电话话。特别别的,假假定能从从报警中中得到v单位的的收益,,而打电电话的人人需要付付出c单单位的成成本,v>c>0。分分析这个个问题的的纯战略略NE和和混合战战略NE。混合策略略—案例例分析:参与人::n个每个参与与人的战战略集::{打电电话,不不打电话话}效用:没没有任何何人打,,所有人人0支付付;打,v-c;不打,但但其他人人至少有有一个人人打,v混合策略略—案例例纯战略NE当只有两两个参与与人的时时候(公公共产品品提供的的斗鸡博博弈)———两个个NEn个人的的时候::假设有m个人提提供,m>1orm=1n个NE混合策略略—案例例混合策略略—案例例混合战略略NE随着人数数n的增增加,p减小,,即人越越多,每每个人选选择报案案的概率率就会越越小,如如果n==1,则则p=1社会心理理学与博博弈分析析混合策略略—案例例小孩玩的的游戏““石头,,剪子,,布”,,也是一一种博弈弈。但是是,这个个博弈有有一种有有趣的特特征,即即给定一一方的任任何选择择,另一一方都有有制胜对对方的战战略,所所以,给给定一方方任何一一个战略略,对方方都有制制胜这个个战略的的战略,,因而这这个战略略不是最最优的。。任何““纯战略略”都不不是最优优的,纯纯战略是是“石头头,剪子子,布””中的任任何一个个。但是,我我们知道道,玩这这个游戏戏是总是是以对方方不易猜猜出的随随机方式式出招。。事实上上,可以以通过数数学证明明,当双双方都以以每个战战略按1/3的的概率出出招时,,达成一一种双方方都不愿愿改变这这种概率率分布的的局面。。这被称称为“混合战略略纳什均均衡”,而这这种以随随机方式式选择纯纯战略的的博弈被被称为““混合战战略博弈弈”。实验显示示:“陷入无无意识但但仍可预预测的模模式”例如:官官僚作风风--连连续出““布”雪崩----连续续出石头头排除策略略--省省略一个个随机:秘秘密的,,足够复复杂以至至难以让让人破解解的规则则例子1田田忌忌赛马新新编春秋战国国时期,,齐威王王常与旗旗下大将将田忌赛赛马。规规则是::每次赛赛三局,,每一局局齐威王王与田忌忌各出一一匹马比比赛奔跑跑速度。。每一局局中的胜胜者赢败败方一千千斤铜。。田忌有有上、中中、下三三匹马,,而齐威威王也有有上、中中、下三三匹马。。每次比比赛,第第一局田田忌出上上马,齐齐威王也也出上马马;第二二局田忌忌出中马马,齐威威王也出出中马;;第三局局,田忌忌出下马马,齐威威王也出出下马。。齐威王王的上马马比田忌忌的上马马好,齐齐威王的的中马也也比田忌忌的中马马好,齐齐威王的的下马还还是比田田忌的下下马好。。于是,,每次比比赛的结结果都是是田忌连连输三局局。田忌的谋谋士孙膑膑了解了了田忌的的困境后后,就打打听到这这样一个个消息::尽管齐齐威王的的上、中中、下三三匹马都都要比田田忌的对对应上、、中、下下三匹马马好,但但碰巧的的是田忌忌的上马马可胜齐齐威王的的中马,,田忌的的中马可可胜齐威威王的下下马。于于是,孙孙膑为田田忌献计计:下一一次比赛赛中第一一局时田田忌出下下马对齐齐威王的的上马输输一局,,第二局局田忌出出上马对对齐威王王的中马马,第三三局田忌忌出中马马对齐威威王的下下马,这这样可连连赢两局局,最后后净胜一一千斤铜铜。田忌忌依计而而行,果果真赢回回一千斤斤铜。这个故事事曾经被被很多人人当作博博弈论的的例子来来演绎,,但实际际上这个个故事与与博弈论论无关。。博弈论论会假定定所有局局中人都都是理性性的,不能假定一些些局中人聪明明而另一些局局中人却是傻傻子。当田忌出下马马时,齐威王王最好的选择择是出下马而而不是上马。。孙膑的计谋谋中假定齐威威王是傻子,,当田忌出下下、上、中马马时,他仍然然按上、中、、下马出,当当然要输了。。事实上,当当田忌出下马马时,齐威王王应出下马,,但齐威王出出下马时,田田忌不应出下下马而是出中中马,但此时时齐威王又应应出中马而不不是下马了,,……。这样样,博弈不会会有纯战略的的均衡。两人只能玩混混合战略博弈弈,齐威王分分别以1/6随机的概率率选择出上、、中、下马的的任一排列,,田忌也如此此。由于齐威威王存在绝对对优势,他平平均看来仍然然会赢田忌一一千斤铜。例子2如果果曹操与诸葛葛亮一样聪明明:三国演义义中的华容道道博弈在《三国演义义》中,曹操操在赤壁大战战中一败涂地地,率残兵败败将向许都方方向逃窜。诸诸葛亮命关羽羽率兵在途中中阻截曹军。。当时,第一一批拦截大军军是赵云率领领的,第二批批拦截大军是是张飞带队的的,第三批才才是关羽率部部伏击。由于于曹军兵多将将广,前二批批伏击军不能能逮住曹操,,只是抢劫一一些军械马匹匹之类。待曹军冲过赵赵云、张飞两两道关后,进进入关羽的伏伏击地带。但但是,当时关关羽与曹操相相遇的地方有有两条道,一一条是华容道道,除此外还还有另一条道道。诸葛亮令令关羽伏兵于于华容道,并并且要求关羽羽在华容道上上点燃树枝冒冒出烟雾引曹曹操到来。当当时关羽不解解,问诸葛亮亮,“如果在在伏兵之处点点火,岂不令令曹兵看见而而改走另一条条道逃脱?””诸荀亮叫关关羽不要再问问,只如此照照办即可。当曹操冲破赵赵云、张飞的的阻截后,来来到华容道前前,看见华容容道上静悄悄悄的,但有烟烟火萦绕。曹曹操大笑道::“孔明以为为我会上他的的当,故意叫叫人在华容道道上点火让我我走另一条道道,而他却伏伏兵于这条道道上好逮住我我呢!我偏不不上他的当!!”于是,曹曹操令大军径径直上华容道道上而去,结结果与关羽大大军撞个正着着。曹操为何进了了孔明的圈套套呢?这里的的道理是这样样的:孔明知知道曹操是聪聪明人,而聪聪明人见华容容道上有烟火火会认为华容容道上有伏兵兵,于是会避避开华容道而而走另一条路路。如果孔明明令关羽在另另一条路等着着,曹操就被被逮住了。但但是,曹操不仅聪明明,而且还聪聪明过人,他也知道孔孔明的如此盘盘算来诱他上上钩,他偏不不上当,知道道点火的华容容道上无人,,孔明的队伍伍在另一条道道上呢!于是是他选择走华华容道。但是,依《三三国演义》作作者罗贯中的的逻辑,孔明总是比曹曹操计高一筹筹,按博弈论的的术语来说,,就是孔明的的理性程度要要比曹操高上上一阶。孔明明也知道曹操操知道孔明的的打算,于是是令关羽正好好在点火的华华容道上等着着曹操。《三三国演义》中中的这个故事事很可能是作作者编造的,,因为在《三三国志》中并并无这一情节节。这里,罗罗贯中假设了了曹操在智力力上比孔明差差一些,才有有华容道上被被关羽抓住,,要不是关羽羽旧情难忘,,曹操就死无无葬身之地了了。但是,如果我我们不假定曹曹操比孔明要要笨一些,而而是相反假定曹操与孔孔明一样聪明明,则曹操又知道道孔明知道曹曹操知道孔明明的打算,曹曹操就会知道道关羽在华容容道上等着他他呢?此时曹曹操就避开华华容道走另一一条路。但是是,这还没有有完,因为若若孔明知道曹曹操知道孔明明知道……。。显然,最终终的结果是曹曹操与孔明玩玩混合战略博博弈,曹操随随机地以1/2的概率选选择走华容道道和另一条路路,孔明也以以1/2的概概率令关羽守守华容道或另另一条路。于是,《三国国演义》中的的这一情节就就应作如下改改写:诸葛亮抛出一一枚硬币,决决定关羽是守守华容道呢还还是另一条道道……,而曹曹操也掷出一一枚硬币,决决定是走华容容道呢还是走走另一条路。。平均看来,,曹操有1/2的概率逃逃脱,而关羽羽也只有1/2的概率抓抓住曹操。如如果说关羽在在华容道上抓抓住了曹操,,则纯属偶然然、并非孔明明比曹操计高高一筹所致!!剪刀-石头-布爬楼梯游游戏策略,石头、、剪子、布布获胜,向上上爬5个台阶阶剪刀获胜,向向上爬2个台台阶石头获胜,向向上爬1个台台阶平局,再来一一遍第一个爬上楼楼梯的是获胜胜者商业与其他对对抗中的混合合策略商界、政界和和战争非零和博弈商业与其他对对抗中的混合合策略例如:折扣券券博弈问题商业与其他对对抗中的混合合策略例1:折扣券券博弈问题目的?1、都不发行行2、都发行3、一个发行行,另一个不不发行如何占得先机机?商业与其他对对抗中的混合合策略如何占得先机机?避免他人占得得先机,唯一一的途径就是是保持出人意料的元素素。--这一元素素源于随机化化策略的应用用但是:独立随随机选择有““出错”的危危险。进行合作!商业与其他对对抗中的混合合策略可口可乐和百百事可乐52个星期,,分别发放26周优惠券券没有出现两家家同时的情况况计算:如果两两家独立以50%概率随随机选择任何何一周发放优优惠券,那么么他们各自发发放26周而而不会出现同同时发放的概概率是1/10005(10亿的10亿次方)延伸:联合营营销麦当劳与可口可乐,肯德基与百事可乐从美国相携走走向全球,许许多大的跨国国企业均与知知名连锁酒店店、供应商保保持全球的合合作体系,令人慨叹中国国的许多企业业尽管躯体庞庞大,但在经经营的思想和和理念上与它它们相去甚远远。辜鸿铭曾用西西文出版过一一本书,书名名为《中国人人的精神》,,其中将中国国人的民族性性格归结为三三大特征:““deep,bright,simple”,译成中中文是“深沉沉、聪明、淳淳朴”。延伸:联合营营销深沉就是含而而不露,静水水流深,但这这种性格与联联盟的阳光与与规则的透明明背道而驰。。聪明更多是是为人为事的的创造力与洞洞察,但似乎乎缺少更大气气的哲学和价价值观思考,,这样也不利利于建立通用用的制度规则则,大家思考考的更多是彼彼此之间的利利益而非联盟盟共事致力追追求的长远目目标—这也是是战国时期秦秦国以连横成成功打破六国国合纵政策的的原因所在。。例2:飞机折折扣票博弈航空公司告诉诉你折扣,不不告诉你剩余余的空位你随机选择时时点进行订票票V,-D-P,00,S0,0睡不睡偷不偷守卫小偷混合战略:守卫以n概率率选择睡觉,,以1-m的的概率选择不不睡小偷以m概率率选择偷,以以1-n概率率选择不偷例4监督督博弈加重对守卫卫的处罚::短期中的的效果是使使守卫真正正尽职在长期中并并不能使守守卫更尽职职,但会降降低盗窃发发生的概率率0-D-D’守卫得益((睡睡)S小偷偷的概率1激励悖论Sm加重对小偷偷的处罚::短期内能能抑制盗窃窃发生率长期并不能能降低盗窃窃发生率,,但会使得得守卫更多多的偷懒0-P-P’小偷得益(偷)V守卫睡的概率1n激励悖论例5为什什么一般人人总是小错错不断,大大错不犯;;偷税漏税税的一般是是中小企业业,大企业业会老老实实实地交税税?税务部门不不会对所有有企业的交交税情况每每一次都去去检查,因因为这样做做的成本太太高,得不不偿失。所所以,税务务部门总是是随机地对企业的交交税情况进进行检查。。企业也是随机地在交税与偷偷漏税之间间进行选择择。税收部部门与企业业间进行的的是混合战战略博弈。。因为如果果企业总是是交税,税税务部门就就最好不检检查;但给给定不检查查,企业就就会偷漏税税。所以,,两者只有有在随机地地检查与不不检查,企企业随机地地在偷漏税税与交税之之间选择,,才会达成成均衡。对于大企业业,因一旦旦偷税就数数目巨大,,所以,税税务部门在在随机检查查时放在大大企业上的的可能性就大大一些;而给给定税务部部门检查大大企业的可可能性较大大,大企业业偷漏税的的行为就较较少,否则则就容易被被逮个正着着。所以,,偷漏税较较多的就是是一些中小小企业,大大企业纳税税的积极性性较高。同同样,大人人物或有钱钱人纳税的的积极性应应较高,至至于我国在在过去一段段时期有钱钱人反而不不交税的现现象主要源源于制度不不健全或已已有的制度度得不到贯贯彻所致。。同样的道道理,在犯犯罪或对错错误的监督督惩罚博弈弈中,也是是混合博弈弈,人们可可能总是大大错不犯小小错不断。。9、静静夜夜四四无无邻邻,,荒荒居居旧旧业业贫贫。。。。1月月-231月月-23Sunday,January1,202310、雨中黄叶树树,灯下白头头人。。13:13:3113:13:3113:131/1/20231:13:31PM11、以我独独沈久,,愧君相相见频。。。1月-2313:13:3113:13Jan-2301-Jan-2312、故人江海海别,几度度隔山川。。。13:13:3113:13:3113:13Sunday,January1,202313、乍见翻疑梦梦,相悲各问问年。。1月-231月-2313:13:3113:13:31January1,202314、他乡生生白发,,旧国见见青山。。。01一一月20231:13:31下午午13:13:311月-2315、比不了了得就不不比,得得不到的的就不要要。。。。一月231:13下午午1月-2313:13January1,202316、行动出成果果,工作出财财富。。2023/1/113:13:3213:13:3201January202317、做前,能能够环视四四周;做时时,你只能能或者最好好沿着以脚脚为起点的的射线向前前。。1:13:32下下午1:13下下午13:13:321月-239、没有失败,,只有暂时停停止成功!。。1月-231月-23Sunday,January1,202310、很多事事情努力力了未必必有结果果,但是是不努力力却什么么改变也也没有。。。13:13:3213:13:3213:131/1/20231:13:32PM11、成功就是日日复一日那一一点点小小努努力的积累。。。1月-2313:13:3213:13Jan-2301-Jan-2312、世世间间成成事事,,不不求求其其绝绝对对圆圆满满,,留留一一份份不不足足,,可可得得无无限限完完美美。。。。13:13:3213:13:3213:13Sunday,January1,202313、不知香积积寺,数里里入云峰。。。1月-231月-2313:13:3213:13:32January1,202314、意志志坚强强的人人能把把世界界放在在手中中像泥泥块一一样任任意揉揉捏。。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论