版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1第十章博弈论初步2(一)博弈论简介博弈论(GameTheory)又称对策论或游戏论,是一门研究在互动关系的游戏中,参与者选择策略的科学。博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。。一、
博弈论和策略行为博弈论引例——“囚徒困境”
警察抓住了两个合伙犯罪的罪犯,但却缺乏足够的证据指证他们的罪行。如果其中至少一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将这两名罪犯分别关押并给他们同样的选择机会:如果他们两人都拒不认罪,则因缺乏证据,他们会被以较轻的妨碍公务罪各判2年徒刑;如果他们两人中有一人坦白认罪,则坦白者从轻处理,立即释放,而另一人则将重判10年徒刑;如果两人同时认罪,则他们将各判4年徒刑。囚徒2
坦白不坦白坦白-4,-40,-10囚徒1
不坦白-10,0-2,-24案例:田忌赛马
《史记》:有一天,齐王要田忌与他赛马,规定每个人从自己的上、中、下三等马中各选出一匹参加比赛;并约定,各方每有一匹马获胜可获黄金千两,每有一匹马落败就要输掉黄金千两。
当时,齐王每一等次的马都比田忌的马跑得快,如果田忌用自己的上等马与齐王的上等马比,用自己的中等马与齐王的中等马比,用自己的下等马与齐王的下等马比,则田忌要输三次,因而要输黄金(铜)三千两。但是比赛结果出人意料,田忌不但没有输,反而赢了一千两黄金。这是怎么回事呢?5
原来:在赛马之前,田忌的谋士孙膑给他出主意,让田忌用自己的下等马与齐王的上等马比,用自己的上等马与齐王的中等马比,用自己的中等马与齐王的下等马比。田忌的下等马当然会输,但是上等马和中等马都赢了。因而田忌不仅没有输掉黄金三千两,还赢了黄金(铜)一千两。
在有双方参加的竞赛或竞争中,策略很重要。如果策略适当,就可能在注定要失败的情况下取得胜利。
研究这种竞赛策略的数学分支,叫作博弈论,也叫对策论;它是运筹学的一部分。
6案例:小乞丐的故事
有一个小乞丐,对于路人的施舍,他只接受1美元,而不要10美元。许多人都想见识一下这个小傻瓜,拿10美元和1美元给小乞丐,小乞丐总是选择1美元。好奇的实验者络绎不绝,小乞丐则财源滚滚。
有人问小乞丐:为什么这么傻,只要1美元,不要10美元?
小乞丐回答说:如果我选择了10美元,还会有这么多人来做实验吗?最后,让我们做一个游戏,来测试一下你的博弈思维能力。要过年了,公司要发年终奖,作为老板,你论功行赏。你给每位员工一个信封,并告诉他们:每个信封里面都有一张扑克牌,如果里面装着1,就可以去领1000元奖金,是2则可以领2000元,依此类推,是K就可以领13000元,“小王”可以领15000元,“大王”则是20000元7同时,你还告诉他们:拆开信封后,里面的扑克牌只能自己看,不能告诉别人。如果对自己的扑克牌(年终奖数额)不满意,大家可以相互自由交换,但交换前还是不能让对方知道自己的扑克牌是什么。问题是:会有多少人能成功与别人交换扑克牌,改变自己的年终奖数额?8答案是:一个都不会成功。让我们同样用“向前展望,倒后推理”的办法来分析一下这个博弈:对于拿到“大王”的人来说(估计你会把这张牌给功劳最大的副总经理),他有交换和不交换两种选择,但他知道没什么牌比“大王”更大,和谁交换都不合算,因此,不交换是“大王”的占优策略。拿到“小王”的人知道,除了“大王”,他和谁交换都不合算,而“大王”又不可能和其他人交换,因此,“小王”的占优策略也是不交换。9对于拿到K的人来说,除了“大王”和“小王”,和其他任何人交换都不合算,而可想而知,“大王”和“小王”肯定不会出来交换,因此,“K”的占优策略也是不交换。……依此类推,连拿到2的人也明白,即使拿3的人也肯定不会出来交换,因此,“2”的占优策略也是不交换。最后,敢出来与别人交换年终奖的肯定是那些拿“1”的人。既然大家的年终奖都是最少的1000元,还交换它干什么?这种原理,博弈论称之为“逆向选择”。10从游戏到博弈博弈就是策略对抗,或策略有关键作用的游戏博弈Game,博弈论GameTheory,Game即游戏、竞技游戏和经济等决策,具有竞争较量的共同特征:规则、结果、策略选择,策略和利益相互依存,策略的关键作用游戏——下棋、猜大小、石头剪刀布经济——寡头产量决策、市场阻入、投标拍卖(新娘拍卖)、股票市场政治——两党政治、多党政治、政党联盟军事——美国和伊拉克、印巴危机、以色列和巴勒斯坦、台海两岸(反分裂)娱乐——选美其他——婚姻市场12博弈论的发展改变了传统经济学的结构:1)传统经济学着重研究市场机制或价格制度,分析完全竞争市场中的最优决策,不考虑决策者之间的相互影响。但是,现实经济运行中市场是不完全竞争的,行为主体之间的决策是相互影响的2)完全竞争市场是以完全信息为条件的,而现实经济运行中也难以保证信息完全。在信息不对称条件下,考虑行为主体相互影响的非价格制度可以用博弈论分析。博弈论与最优化理论是不同的决策理论。最优化理论——单人决策理论;博弈论——多人决策理论。13(二)博弈的基本要素
一个所谓博弈(Game/游戏)至少需要三个要素:(1)参与者。就是在博弈中进行决策的个体;博弈分析假定参与者都是理性的。(2)参与人的策略,指的是一项规则,根据该规则,参与人在博弈的每一时点上选择如何行动;(3)支付(或结果):有可评价优劣的博弈结果(效用)。博弈论用数字表示这类结果,并称之为支付(Payoff).02二月2023制作者:张昌廷(河北经贸大学)14博弈的简单分类根据参与人的数量,可以分为二人博弈和多人博弈;根据参与人的支付情况,可分为零和博弈和非零和博弈;根据参与人拥有的策略的数量多少,可分为有限博弈和无限博弈;根据参与人在实施策略上是否有时间的先后,可分为同时博弈和序贯博弈。博弈树:序贯博弈例:抛币游戏。甲乙两小孩抛硬币,甲先抛,乙后抛。若硬币同面,甲赢乙一个硬币,如硬币异面,甲输乙一个硬币。甲正反乙乙正正反反(1,-1)(1,-1)(-1,1)(-1,1)图10—7竞争者—垄断者博弈02二月2023制作者:张昌廷(河北经贸大学)1617
支付矩阵(PayoffMatrix,又称收益矩阵等)描述一个博弈结构。下面的支付矩阵中,两个参与者甲和乙各自可以选择两种策略;数字表示双方在不同策略选择组合下得到的支付,较大数字代表较大利益。
寡头间的价格竞争
乙厂商策略合作不合作甲厂商策略合作5,61,5不合作7,12,3甲厂商的条件策略和条件策略组合02二月2023制作者:张昌廷(河北经贸大学)181.博弈均衡的概念
当两个厂商的条件策略组合恰好相同,从而,两个厂商都不再有单独改变策略的倾向时,整个博弈就达到了均衡,即博弈均衡。博弈均衡是博弈各方最终选取的策略组合,是博弈的最终结果,是博弈的解。纳什均衡02二月2023制作者:张昌廷(河北经贸大学)192.对纳什均衡的理解一是“单独改变策略”是指任何一个参与人在所有其他人都不改变策略的情况下改变自己的策略。其他人也同时改变策略的情况不在考虑之列。二是“不会得到好处”是指任何一个参与人在单独改变策略之后自己的支付不会增加,这包括两种情况:或者支付减少,或者支付不变。02二月2023制作者:张昌廷(河北经贸大学)201.基本方法先用下划线法分别表示甲厂商和乙厂商的条件策略,最后确定博弈的均衡(就是找到在两个数字之下都划线的单元格即可,与这些单元格相对应的策略组合就是所要求的均衡策略组合)。五、寻找纳什均衡的方法——条件策略下划线法02二月2023制作者:张昌廷(河北经贸大学)212.条件策略下划线方法的五步法第一,把整个的支付矩阵分解为甲厂商的支付矩阵和乙厂商的支付矩阵五、寻找纳什均衡的方法——条件策略下划线法02二月2023制作者:张昌廷(河北经贸大学)22第十章
博弈论初步
第二节
同时博弈:纯策略均衡2.条件策略下划线方法的五步法第二,在甲厂商的支付矩阵中,找出每一列的最大者(每列的最大者可能不只一个),并在其下划线五、寻找纳什均衡的方法——条件策略下划线法02二月2023制作者:张昌廷(河北经贸大学)23第十章
博弈论初步
第二节
同时博弈:纯策略均衡2.条件策略下划线方法的五步法第三,在乙厂商的支付矩阵中,找出每一行的最大者(每行的最大者也可能不只一个),并在其下划线五、寻找纳什均衡的方法——条件策略下划线法02二月2023制作者:张昌廷(河北经贸大学)24第十章
博弈论初步
第二节
同时博弈:纯策略均衡2.条件策略下划线方法的五步法第四,将已经划好线的甲厂商的支付矩阵和乙厂商的支付矩阵再合并起来,得到整个的有下划线的支付矩阵五、寻找纳什均衡的方法——条件策略下划线法02二月2023制作者:张昌廷(河北经贸大学)25第十章
博弈论初步
第二节
同时博弈:纯策略均衡2.条件策略下划线方法的五步法第五,在带有下划线的整个的支付矩阵中,找到两个数字之下均划有线的支付组合,则由该支付组合代表的策略组合就是均衡的策略组合五、寻找纳什均衡的方法——条件策略下划线法02二月2023制作者:张昌廷(河北经贸大学)263.总结在一个单元格中,如果两个数字之下均划有线,则两个参与人都没有单独改变策略的动机,因为这两个数字分别是列最大值和行最大值;如果两个数字之下均没有线,则两个参与人都有单独改变策略的动机,因为这两个数字分别不是列最大值和行最大值;如果两个数字中一个下面有线一个下面没线,则有线的数字所代表的参与人没有单独改变策略的动机,没线的数字所代表的参与人有单独改变策略的动机。五、寻找纳什均衡的方法——条件策略下划线法27纳什均衡的特点(1)纳什均衡的存在性:在同时博弈中,(纯策略)纳什均衡可能存在,也可能不存在案例1:没有纳什均衡的同时博弈B厂商策略左右A厂商策略上4,69,1下7,32,828(2)纳什均衡的唯一性:如果纳什均衡存在,那么,均衡可能是一个,也可能是多个案例1:智猪博弈小猪策略:等待智猪博弈猪圈里有两头猪,一头大猪,一头小猪,采用自动喂养,猪圈一头有一个猪食槽,按钮在另一头,控制猪食,按一下会有10个猪食进槽,但按的成本为2,若大猪先到,可吃9个食,小猪吃1个;若同时到,大7小3;若小猪先到,大6小4。纳什均衡:大猪按,小猪等待,小猪搭便车智猪博弈的其他含义。
“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗?试试看。30改变方案:减量方案;增量方案。减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
3132(3)纳什均衡的最优性:如果纳什均衡存在,那么,可能是最优的,也可能不是寡头价格联盟的不稳定性:每个成员都有强烈的降价获利冲动33
寡头厂商之间降价竞争导致两败俱伤;
寡头厂商共谋比竞争更为有利,因而具有共谋(Collude)的动机。市场上的共谋现象十分普遍。当寡头厂商共谋时,它们像一个垄断厂商一样行动:通过减产和提价来增加利润,并对利润加以瓜分,共同享有高价格带来的高利润。
共谋具有不稳定性:个别厂商不守规则可以得到巨大利益,利益驱动使寡头遵守规则很困难。34
囚徒困境反映了一个深刻的问题,从个体角度出发所选择的占优策略,从整体来看,却是最差的结局,即个人理性和集体理性的冲突根据“看不见的手”原理,在市场机制的作用,理性的个体在追求自己利益的过程中,会同时增进整体利益,即个人理性与集体理性是一致的。西方经济学家引入“重复博弈”的概念,以走出“囚徒困境”例:看芭蕾舞还是球赛?周末,壮壮喜欢去看球赛,而他的女朋友丽丽喜欢看芭蕾舞,具体支付如下图,哪个是最优策略?36芭蕾足球男1,2-1,-10,02,1芭蕾足球女芭蕾足球女二、序贯博弈:情侣博弈(1)男方先选博弈均衡:足球37芭蕾足球女2,1-1,-10,012芭蕾足球男芭蕾足球男情侣博弈(2)女方先选博弈均衡:芭蕾38支付矩阵分析:情侣博弈女足球芭蕾教材第314页女足球芭蕾男足球2,10,0芭蕾-1,-11,2策略:先下手为强纳税检查假定税务机关的检查成本10,纳税人应税额为20,如果查到逃税,罚款为两倍。结果不确定:纳税机关和纳税人均没有上策还取决于纳税机关的检查概率,比如税收机关的检查概率是20%,纳税人会选择逃税(-60*20%>-20),税收机关会检查;如果概率是50%,纳税人会选择纳税(-60*50%<-20),税收机关选择不检查。40一、混合策略:当纯策略被赋予概率向量时,就转化为混合策略。
例如:上策、下策分别被赋予0.6、0.4的概率,即博弈参与者以60%的概率选择上策,以40%的概率选择下策。教材第299页B厂商策略q1=0.3q2=0.7左右A厂商策略p1=0.6上4,69,1p2=0.4下7,32,8§7-3同时博弈:混合策略均衡41二、混合策略组合如果:A、B厂商的混合策略分别是(0.6,0.4)和(0.3,0.7),那么:它们的组合可以记做(0.6,0.4),(0.3,0.7)即:混合策略组合B厂商策略q1=0.3q2=0.7左右A厂商策略p1=0.6上4,69,1p2=0.4下7,32,842
在混合策略博弈中,对于每一个混合策略组合,也存在一个支付组合,其中,每一项也都是相应参与人在该混合策略组合条件下所得到的支付。由于每个参与人都是以一定的概率来选择其纯策略,故相应的支付也就成了“期望支付”,即支付的期望值。
三、期望支付43四种策略组合发生的概率分别是:
B厂商策略q1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 职业核心素养心得体会
- 2024年电控多瓶采水器项目资金申请报告代可行性研究报告
- 四肢动脉手术护理制动
- 卧床病人的家庭护理
- 外科预检分诊课件
- 市场营销培训课件
- 《QC知识培训》课件
- 2022年内蒙古省公务员录用考试《行测》真题及答案解析
- 2022年公务员多省联考《申论》真题(重庆二卷)及答案解析
- 2024届河南平顶山舞钢一高高三下学期期中考试数学试题(理解析)试题
- 2023年中国人民银行直属事业单位招聘考试真题
- 2024年湖南土建中级职称-建筑工程《法律法规及技术标准》考试题库(含答案)
- 国开(浙江)2024年《个人理财》形考作业1-4答案
- 个人简历模板(5套完整版)
- 拒绝校园欺凌教育主题课件
- 文艺复兴经典名著选读智慧树知到期末考试答案章节答案2024年北京大学
- 《风电场项目经济评价规范》(NB-T 31085-2016)
- 《中医药健康知识讲座》课件
- 劳务派遣劳务外包服务方案(技术方案)
- 煤气发生炉拆除方案
- 《扣件式钢管脚手架安全技术规范》JGJ130-2023
评论
0/150
提交评论