版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
微观经济学主讲人韩松第十章博弈论初步知识结构知识结构博弈论静态博弈不完全信息动态博弈完全信息基本要素逆向归纳法博弈树支付矩阵纯策略均衡混合策略均衡条件策略下划线法纳什均衡囚徒困境第一节策略和行为一、博弈的定义企业行为相互影响,每个人进行的决策和采取的行动都会对其他人产生影响,根据其他人的可能反应来决定自己的决策和行动。在策略性环境中,所进行的策略性决策和采取的策略性行动就是所谓的博弈
(Game),进行博弈研究就是博弈论(GameTheory)。1944年冯·诺依曼和摩根斯顿共著《博弈论与经济行为》,将博弈论用于经济领域。第一节策略和行为一博弈的定义1769年,匈牙利的工程师坎比林为奥地利皇后做出一台会“下”棋的机器。阿伦·图灵的纸上机器。贝尔实验室克劳迪·申朗提出的A策略和B策略。1951年,“计算机之父”——冯·诺依曼领导的研
究小组设计出ENIAC一号。[资料]下棋的机器[资料]下棋的机器李世石与谷歌AlphaGo进行最后一轮较量,最终人机大战的总比分定格在1:
4。[视频]围棋人机大战[视频]围棋人机大战第一节策略和行为二、要素和类型参与者:进行决策的个体至少有两个,有时可引入一个虚拟参与人如“自然”;策略:在一项规则下一组可选择行动集合;支付:各自的报酬,即所得到的支付,都是所有策略共同作用的结果——支付组合。从多角度进行博弈分类,如两人博弈和多人博弈、零和博弈和非零和博弈、有限博弈和无限博弈、同时博弈和动态博弈。第一节策略和行为二要素和类型合作博弈与非合作博弈:能否达成有约束力协议;重复博弈与非重复博弈:具有连续性的特点;零和博弈与非零和博弈:你的所失正是我的所得。完全且完美信息博弈完全但不完美信息博弈不完全信息博弈海萨尼转换(含自然)[资料]博弈的类型[资料]博弈的类型类型区别内容完全信息针对策略集和支付集完美信息针对记忆(过程),信息结点是唯一的第二节纯策略均衡一、寡头和支付矩阵假定在某个寡头市场上有甲、乙两个厂商。列出一个只有两方厂商参加并且同时进行决策的简单博弈。用一个以二元数组为元素的矩阵
(亦称博弈矩阵或支付矩阵)进行描述和分析。第二节纯策略均衡一寡头和支付矩阵甲厂商合作不合作乙厂商合作不合作51235617第二节纯策略均衡二、条件策略和组合把甲厂商在乙厂商选择合作条件下最优策略(不合作)叫做甲厂商的条件优势策略,因此与这一条件策略相联系的策略组合就叫条件优势策略组合。条件策略包括参与人的条件策略及组合。第二节纯策略均衡二条件策略和组合甲厂商合作不合作乙厂商合作不合作51235617一位日本的收藏家无法决定让谁来拍卖画作,于是要求佳士得与苏富比老板猜拳定胜负。佳士得老板向员工们讨教猜拳策略,最后,在一名主管11岁女儿建议下,决定出招……[思考]猜拳出什么招?[思考]猜拳出什么招第二节纯策略均衡三、纳什均衡当厂商的条件策略组合恰好相同,从而都不再有单独改变策略的倾向时,整个博弈就达到均衡是博弈的解,称为纳什均衡。纳什均衡是参与者在该策略组合上,任何单独改变策略都不会得到好处;当所有其他人都不改变时,没有人会改变自己的策略。假定支付不变时,由于存在着成本和风险,参与者也不愿意单独地改变策略。第二节纯策略均衡三纳什均衡天才与疯子仅有一线之隔,疯子变常人的欣慰等同对天才沦为平庸的惋惜。[视频]纳什的命运[视频]纳什的命运[案例]华容道的纳什均衡孔明曰:“亮夜观乾象,操贼未合身亡。留这人情,教云长做了,亦是美事。”玄德曰:“先生神算,世所罕及![案例]华容道的纳什均衡孔明小道大路曹操小道大路逃脱空等拿下被捉拿下被捉逃脱空等小猪按键等待大猪按键等待9-1001544[案例]孙刘的智猪博弈孔明笑曰:“亮借一帆风,直至江东,凭三寸不烂之舌,说南北两军互相吞并。若南军胜,共诛曹操以取荆州之地;若北军胜,则我乘势以取江南可也。”荆州是赤壁之战最重要的战果之一,却被出力很少的刘备摘去了。[案例]孙刘的智猪博弈第二节纯策略均衡四、下划线法条件均衡策略,用下划线分别来表示甲厂商和乙厂商的条件策略。在甲厂商的支付矩阵中,找出每一列的最大数字;在乙厂商的支付矩阵中,找出每一行的最大数字。都有下划线的组合。第二节纯策略均衡四下划线法甲厂商合作不合作乙厂商合作不合作51235617————第二节纯策略均衡五、纳什均衡的特性在同时博弈中,纯策略的纳什均衡有可能存在也可能不存在。在纳什均衡存在的条件下,它可能是惟一的也可能不惟一。如果纳什均衡存在,它可能是最优的也可能不是最优的。第二节纯策略均衡五纳什均衡的特性甲厂商合作不合作乙厂商合作不合作41235614————第二节纯策略均衡六、囚徒困境无论其他参与者采取什么策略,某一参与者惟一的最优策略就是他的占优策略,任何一方都不想偏离各自认为的最优策略。囚徒困境(Prisoners’
Dilemma)反映个人理性和团体理性的冲突,从个人理性角度出发选择占优策略结局,从整体来看却是最差的。根据“看不见的手”的原理,理性人在追求自己利益中,会同时增进整体福利。第二节纯策略均衡六囚徒困境[案例]空城计的占优策略诸葛亮对司马懿的思想轨迹是相当了解;诸葛亮的行径司马懿也能做出理性判断。[案例]空城计的占优策略曹家使用杀掉司马捉拿放走2010-151-103-158诸葛守城弃城司马进攻撤退平手逃脱××被捉拿下拿下被捉双方都存在着偷换策略的诱惑,不稳定状态。即使两个囚徒事先订立攻守同盟(死不坦白),最终也将会背叛同盟。每个囚徒希望对方选择抵赖而自己坦白从而获释;当他们都这么想并这么做的时候,就形成都坦白的左上角结局。甲方坦白不坦白乙方坦白不坦白-200-1-1-8-80-20————[案例]囚徒困境[案例]囚徒困境第三节混合策略均衡一、混合策略组合将纯策略赋予不同的概率向量,是参与人的某种混合策略。形成期望支付,求得条件混合策略。第三节混合策略均衡一混合策略组合甲厂商上下乙厂商左右19284637q1
q2p1p2————在每一个参与人都只有有限多个纯策略的博弈中,至少存在一个混合策略纳什均衡。第三节混合策略均衡二、混合策略均衡第三节混合策略均衡二混合策略均衡op1q111乙厂商0.50.7甲厂商·e·······▲▲1/21/2▲▲▲▲1×1/2▲▲1×1/2[思考]快餐店会扎堆么?[思考]快餐店会扎堆么第四节动态博弈一、竞争者-垄断者威胁策略一定具有可信性,才能起到作用。第四节动态博弈一竞争者-垄断者垄断者容忍抵抗竞争者进入退出023021-24垄断者容忍抵抗竞争者进入退出053041-22“中国人不怕原子弹,死一半也没什么,照样接着搞社会主义。”强权政治、单边主义和恐怖活动都增加着文明毁灭的危险——局部核战争已是不可忽视的现实威胁。“难道上个世纪的梦魇又回来了吗???”[案例]核武环峙中国[案例]核武环峙中国第四节动态博弈二、博弈树博弈树模型又称为扩展型博弈模型,用博弈树来描述的序贯博弈又叫做扩展型博弈。第四节动态博弈二博弈树竞争者垄断者abc垄断者进入退出容忍抵抗容忍抵抗defg(1,4)(-2,2)(0,5)(0,3)起点中间点终点·······蒙特卡洛树搜索,借助价值网络与策略网络,最初通过模仿人类玩家,尝试匹配职业棋手。一旦达到一定的熟练程度,它开始和自己对弈,强化学习,它在用技巧,根本没有用力气。[资料]AlphaGo的AI[资料]AlphaGo的AI第四节动态博弈三、逆向归纳法在所有的纳什均衡中,找到最有可能实现的策略组合,这就是对纳什均衡的精练。逆向归纳法的两个步骤:第一,从最后阶段每一个决策点开始,确定参与人此时所选择策略,并把其他策略删除;第二,对简化博弈重复删除程序,直到最后的最简博弈。实际上,逆向归纳策略总是属于纳什均衡,尽管纳什均衡并不一定是逆向归纳策略。第四节动态博弈三逆向归纳法[案例]恋爱的蜈蚣博弈[1﹐1][0﹐3][2﹐2][8﹐11][9﹐9][7﹐10][1﹐4]+1+1+1+11+1+1+[10﹐10]芳芳芳芳芳呆呆呆呆呆[案例]恋爱的蜈蚣博弈第四节动态博弈四、顺序与优势动态博弈的行动存在着先后顺序,一些具有先动优势(First-moverAdvantage),另一些具有后动优势(Second-moverAdvantage)。在不完全信息下顺序更重要:产量竞争可能有先动优势,价格竞争可能有后动优势,但有的博弈如抓阄没有先动和后动优势。优势是指自己某个策略相比较其他策略有优势,而不是相比对手策略一定有优势。第四节动态博弈四顺序与优势
支付次序ABCDE[案例]海盗分金币[案例]海盗分金币97
012
0第四轮第三轮第二轮
第一轮
×
×
×
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025大学食堂承包合同范本
- 工业生产车间钢结构楼梯施工协议
- 企业国际化发展战
- 住宅小区批荡施工合同
- 餐饮业授权经营的管理办法
- 投标联合体合规协议
- 会计审计合同管理规则
- 零售连锁公司广告牌安装施工合同
- 医疗技术合作保险
- 2024年特种用途树木研发与销售合同范本3篇
- 浙江大学医学院附属儿童医院招聘人员真题
- 2024年江苏省苏州市中考数学试卷含答案
- 软件测试汇报
- 吉林省长春市第一〇八学校2024-2025学年七年级上学期期中历史试题
- 2024年世界职业院校技能大赛高职组“市政管线(道)数字化施工组”赛项考试题库
- 初中《孙中山诞辰纪念日》主题班会
- 5.5 跨学科实践:制作望远镜教学设计八年级物理上册(人教版2024)
- 屠呦呦课件教学课件
- 阿斯伯格综合症自测题汇博教育员工自测题含答案
- 护理肝癌的疑难病例讨论
- 天津市2023-2024学年七年级上学期语文期末试卷(含答案)
评论
0/150
提交评论