




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论:一个普遍的分析工具2012.11申明本课件仅用于本课程教师(以下简称“课程教师”)对软件与微电子学院选修《微观经济学》课程的同学(以下简称“选课同学”)教授微观经济学课程时进行课堂演示,并不完全涵盖课程教师在课堂上讲述的内容,也不完全代表课程教师的学术见解本课件中可能包含一定错误的内容,课程教师有权对本课件的内容随时进行修正,故选课同学未来不能引用本课件的任何内容作为证明自己正确的证据本课件虽由课程教师制作,但课程教师不保留对本课件的版权;课程教师允许选课同学以任何方式复制本课件,然而,请选课同学注意的是,课程教师亦不对本课件的任何内容负责,谬误之处,敬请自行辨别,切勿以课件内容作为质疑课程教师学术水平的佐证内容概览Topic1.决策理论基础Topic2.博弈论基本模型Topic3.策略型博弈的均衡Topic4.展开型博弈的序贯均衡Topic5.策略型博弈的精炼Topic1决策理论基础博弈博弈:涉及两个或更多参与者的一个社会局势每一个参与者,被称为局中人,研究博弈,需要假设局中人是理性的和智能的理性的:如果一个局中人追求其目标时能够做到前后一致,即为理性的基于决策理论建立起来的博弈论,通常假设局中人追求个人期望效用最大化(独立性公理此事需要成立,引致效用则不存在)智能的局中人能够在自有的信息下全局性的分析整个博弈过程,并以此为基础进行推断理性与智能性是否满足显然,作为假设,局中人同时具有理性和智能性的假设令人怀疑,在什么情况下局中人会不理性或不具有智能性呢?独立性公理、引致偏好对局势缺乏整体认识……一个对理性与智能性的解释是:如果一个人不具备理性和智能性,则其在博弈过程中将多次吃亏,最终会导致其要么学会博弈中的规则,要么被博弈淘汰如果一个人坚持不采用类似的理论,当更多人认识到整个全局后,则那些不稳定的理论会自动解体,但博弈的理论则会成为最终的均衡状态请想想现实中的案例期望效用理论在博弈论的基本假设中,所有的局中人都是理性的,由此,对于局中人而言,期望效用理论的假设与各种结论都是成立的在关于不确定性的内容中所提及的期望效用理论,都可应用通过如下定理,可以生成有限集Ω上的贝叶斯条件概率系:(贝叶斯公式只适用于先验概率不为零的情况)概率模型与状态变量模型概率模型中彩票是彩金的概率分布,适用于描述具有客观概率的事件,如投掷骰子,概率模型通常可以表示为:状态模型中彩票是从可能状态集到彩金集的函数,适用于描述那些不具有明显概率的事件,状态模型通常可以表示为:其中Ω为状态集合,其中的一个元素为真实状态,X为可能的彩金集合,那么,对于一个真实状态t,以及彩票f,有这代表着在t状态下,由彩票f获得彩金x的概率主观概率我们之前的研究都认为存在某些客观的概率,但事实上,就个人的认识而言,大多数情况我们并不知道这些客观的概率,即使我们在谈论概率时,我们通常谈论的也是我们所“认为”的概率(比如我认为可能有15%的同学考试会不及格)选择实际上是局中人基于其对概率的判断做出的,这意味着局中人对其所面对的不确定性的主观评估要更重要即使局中人面对的状态是不可识别的,也不能与客观概率相联系,但如果局中人:对其可能的各种结果具有某种效用,对状态的概率有估计,并且根据期望效用做决策,那么,局中人的行为仍然可以通过主观概率使期望效用理论得到推广博弈论与主观概率主观概率在博弈论中有非常广泛的应用,因为在博弈论中,一个局中人面临的状态通常情况下包括其他人将要做出的决策结果。因此,为了要估计局中人自己在某种状态上的概率,局中人就要考虑到其他局中人决策过程的全部信息同样,其他局中人也会做类似的事情。因此一个局中人关于其他局中人将如何行动的信念部分的取决于其他人关于这个局中人将怎么做的信念确定其他人行为的主观概率可能要求决策者了解一些由自己决策过程所产生的预期结果,其中有一部分恰好又是自己的主观概率,显然,这是一个逻辑上循环,而博弈论的研究就是如何在这种情况下,帮助局中人进行决策占优一阶随机占优判断一个彩票比另一个彩票好的最直接标准就是好的彩票期望效用高二阶随机占优如果彩票期望收益相同,则风险小的彩票更好一个例子问题是,随机占优足够支持博弈论的研究吗?请看下例:局中人应该做哪个决策?(位于什么状态是未知的)强劣从上例可以看出当所处状态未知的情况下,最优的决策要依赖所处的状态。或者说所处状态的概率,显然如果状态1的概率大于0.6,α要优于β和γ,如果状态1的概率小于0.6则选择γ更好,但不管怎样,β都是不好的强劣的:一个对任何信念集都不可能是最优的决策,就是强劣的决策换言之,强劣也意味着对于选择集X上的任意一个概率分布(即一个随机策略),都有:弱劣的请考虑如下的例子(弱劣策略的选择问题):Topic2博弈论的基本模型展开型博弈考虑这样一个博弈(简单摊牌)如何表示局中人1与2向一个罐子里各放1块钱然后局中人1从一副52张牌中抽一张牌,局中人1看过牌后决定加注还是摊牌如果摊牌,局中人1将牌给局中人2看,如果是红牌则局中人1拿走罐子里的钱,如果是黑牌,局中人2拿走罐子里的钱,游戏结束如果加注,局中人1将再向罐子里放1块钱如果局中人1加注,局中人2决定对抗还是放弃如果放弃,局中人1取走罐子里的钱,游戏结束如果对抗,局中人2也再投入1块钱,然后局中人1亮牌,如果是红牌则局中人1拿走罐子里的钱,如果是黑牌,局中人2拿走罐子里的钱,游戏结束展开型博弈:这个展开型博弈是否准确的描述了上述博弈?展开型博弈根:最左端的结点终结点:右侧没有枝的结点枝:连接两个结点的线段局路径:实际的事件序列所表示的路径支付:一个局路径下局中人获得的支付展开型博弈记为0的机会结点:下一枝将按照某种概率达到机会概率行动标号局中人标号信息标号决策结点总结完美记忆与完全信息只要决策者一行动,他就会记忆起在此博弈中他先前知道的全部信息,包括他自己的所有行动完美信息:博弈中没有两个点拥有同样的信息状态策略:为博弈中每个可能的信息状态都确定了一个行动的某种规则不完美信息:局中人1在1.3做决策时忘记了自己在1.1所做的决定。(不完美信息意味着行为上等价不导致支付上等价)策略型一个策略型博弈可以表示为:策略型博弈相当于是一种去掉时间后,静态的展开型博弈如果将展开型博弈表示成一个和它等价的策略型博弈,那么,通过分析策略型博弈,就可以分析展开型博弈问题是如何将展开型博弈用策略型博弈表示局中人集合局中人纯策略集合局中人支付集合简单摊牌的例子策略组合C1={Rr(得红牌加注,得黑牌也加注),Rf,Fr,Ff}C2={M(若1加注则对抗),P}支付:u1(Rr,M)=0.5×2+0.5×(-2)=0=u2(Rr,M)正规表示假设存在一个展开型博弈Γe,其策略型表示可以用如下方法构造令策略型博弈Γ局中人集合N={1,2,…n}令N中任意一个局中人i,令Γ中局中人i的策略集与展开型博弈Γe中局中人i的策略集相同对于展开型博弈中任意一个结点x,定义P(x|c)为策略型博弈上从根出发的一条局路径通过结点x的概率,并且这条局路径上任何一个决策点上,包含在该路径中的下一个选择都是有该结点处相关的局中人在c中的策略所决定的;而在这条局路径上的任一机会结点,包含在该路径中的下一个选择是由Γe中所给出的概率分布决定的。在任一终结点x,令wi(x)为局中人i在博弈Γe的终结点的效用支付,这样构造的策略型博弈Γ被称为展开型博弈Γe的正规表示正规表示意味着:冯·诺依曼与摩根斯坦证明过正规表示应该是在任何博弈的分析中我们研究的一切。这意味,如果我们知道了博弈的结构,则我们在开始博弈开始前,我们就已经能对博弈进行分析并给出对策。如果局中人都是智能的,则每个局中人决策都将确定其最终采取的策略即使在存在通信等机制存在的情况下,只要这些机制能够被充分预计到,那么,整个博弈也能够用正规表示来分析实际上,正规表示几乎能够把所有的博弈都变换成一个可以投射在其上的沙盘,从而使分析的简化博弈的等价从正规表示出发,会产生一个问题:两个博弈在什么情况下是等价的?完全等价:很显然,等价的博弈肯定要求有同一个局中人集合与同一个策略集,否则肯定不等价那么,能够变化的实际上就只能是支付发生变化,我们知道,对于一个效用函数,其线性变化后的效用函数与其是等价的因此,两个博弈完全等价意味着两个博弈有同样的局中人集、同样的策略集,且效用函数在决策理论的意义上看是等价的最佳反应等价完全等价意味着两个博弈实际上毫无差别(实际上就是一个博弈),在研究中,如果两个博弈中局中人的最优反应是一致的,也有意义(我们可以用一个博弈去无差异的替代另一个,而不引起局中人选择的变化,考虑征税对福利的损失问题)最佳反应等价意味着:令:
,,则:则:支付等价与简约的正规表示对于一个策略型博弈,如果局中人i的任意两个策略满足则d和e两个策略是支付等价的显然,对于一个正规表示来说,任何局中人都会忽视两个支付等价的策略,所以,将支付等价的策略合并起来后形成的简化正规表示被叫做纯简约的正规表示(PurelyReducedNormalRepresentation)随机多余与完全简约的正规表示在某种意义上说,由于随机多余的策略相当于是可以被其他策略的混合策略所代替,所以,在分析中去掉随机多余的策略也不会影响到分析的结果(相当于是采取此策略的概率几乎为零)去除随机多余的策略的纯简约正规表示被称为完全简约的正规表示作业与讨论6.B.3,6.B.4,6.B.5,6.B.76.C.1,6.C.2,6.C.9,6.C.15,6.C.16博弈论的课程下次课讲完博弈的基本模型后再布置劣策略的剔除劣策略一个策略对某个局中人而言如果是强劣的,那么,不论其他局中人的信念是什么,这个局中人都不会采取这样的策略,这样对其他智能的局中人来说,这样一个策略是肯定不会出现的,因此,剔除掉强劣的策略对博弈分析的结构不会有影响重复剔除强劣策略的方法显然,第二个人的z策略相对于x、y的某些混合策略而言是强劣的,那么,显然第二个人不会选z如果第二个人不选z,对第一个人来说b策略就是强劣的,所以第一个人不会选b这样,第二个人不选y,最后的均衡是[a,x]弱劣的弱劣的如果是完全取等号,则意味着出现随机多余的策略随机多余与强劣策略都可以剔除,弱劣策略也可以吗?提出弱劣策略对局中人1而言,y1策略与z1策略都是相对于x1策略与另一个策略的混合策略是强劣的,所以,局中人1只会选x1,而此时,局中人2选择何种策略都一样但如果先剔除y1策略,则x2是弱劣的;如果先剔除z1策略,则y2是弱劣的。因此,如果采取剔除若劣策略的方法,可以发现,根据剔除强劣策略顺序的不同,会导致局中人2的选择不同弱劣策略剔除可能使剩余的策略中弱劣策略发生变化,所以这个方法可做参考但不能总是得到正确的结论多代理人表示(代理人正规)由Selten提出的一种从展开型博弈到策略型博弈的映射。多代理人表示的方法是:假定处于不同信息状态的人都可以用一个与原来局中人偏好相同的代理人来表示,那么,展开型博弈就可以可以化解成若干代理人的博弈结果多代理人表示正规表示:多代理人表示:共同知识共同知识:如果每个局中人都知道某个事实,每个局中人都知道每个局中人都知道这个事实……这样的事实就是局中人的共同知识。私人信息,是任意一个局中人所拥有的非共同知识的信息共同知识是博弈的基础,从一个共同知识推出的结论与从只知道每个人已经知道每个人已经知道的一个事实推出的结果可以非常不同例子:共同知识的作用不完全信息不完全信息博弈:局中人在开始计划他们行动的初始节点上,有些局中人就拥有了不为其他局中人所了解的信息考虑不完全信息是不是不完美信息?简单摊牌博弈是不是一个不完全信息博弈?一个局中人在初始时点上拥有的私人信息被称为该局中人的类型在不完全信息博弈中,一个展开型博弈并不能直接转化成一个策略型博弈(因为之前对策略型博弈的假设中并没有考虑到私人信息的存在)因此,在研究不完全信息博弈时,需要对策略型博弈进行推广,这种被推广的策略型博弈被称为贝叶斯型博弈贝叶斯博弈的形式贝叶斯博弈的形式简单摊牌博弈的变形信念一致贝叶斯博弈的等价Topic3策略型博弈的均衡纳什均衡纳什均衡的定义纳什均衡与可理性化策略组合和重复非劣策略组合简单摊牌博弈博弈均衡的无效性例子:囚徒困境这个例子表明个体的最优可能导致总体的最劣,纳什均衡未必总是有效的,这个时候,通过其他方式改变均衡的位置,就很有意义多重均衡的例子:性别博弈多重均衡的消除:焦点效应为什么要消除多重均衡:多重均衡削弱了均衡的意义(与唯一的均衡相比,缺乏指导性),而且含义比较模糊所以,针对多重均衡的精炼是一个重要的工作焦点效应:在一个具有多重均衡的博弈中,如果发生一个导致局中人的注意力向某个均衡集中的事件,就会出现这个均衡出现焦点均衡:是一个明显区别于其他均衡的均衡在一个博弈中如果存在焦点均衡,最终成为现实的,往往就是焦点均衡纳什均衡的计算纳什均衡计算的一个关键概念是支撑(support):以性别之战为例:焦点均衡出现的原因-性别之战的例子某种潜在暗示的结果文化的影响,比如在一个认为妻子当家的家庭氛围中,丈夫会认为妻子应该会选择去购物,所以,丈夫也要去购物,而妻子也认为丈夫应该了解这一点,所以,最终就会去购物可能有某种特别的暗示可能是某种即成结果,比如如果局中人已经在购物中心,那么即使局中人去足球场的成本可以忽略,仍然很有可能到购物的均衡上焦点均衡出现的原因-性别之战的例子局中人具有某种通讯局中人1可以发出“我们明天去足球场”或“明天去商场”的通讯,此时,博弈的均衡就会达到看足球或去商场的均衡这样,博弈中局中人1的行为变为,局中人2的行为变为,这样,性别之战博弈变为:经典求法纳什均衡的一个经典求法是:列出各种可能的支撑A如果不存在均衡满足上述条件,则该支撑下不存在均衡纳什均衡存在性定理意味着,总有一个支撑下存在均衡一个例子首先,考虑是否存在纯策略的均衡,对局中人1而言,如果出T,则局中人2的最优反应是M,而此时,局中人1对M策略的最优反应是B;同样,如果局中人选B,那么局中人2会选择L,而局中人1此时的应对应该是T。这意味着局中人1不存在纯策略;同样的,对于局中人2,若选L则T则M,若M则B则L,若R则B则L,所以局中人2也不存在纯策略。这样,就有{T,B}×{L,M,R}、{T,B}×{M,R}、{T,B}×{L,M}、{T,B}×{
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 银行团队绩效总结
- 学习方法发言稿
- 发言稿例会200字
- 心理咨询与精神分析
- 门诊急诊护理伦理课件
- 课题申报书路径图
- 数学跨学科教学的教材选用策略
- 传统戏剧保护中的学术研究与理论发展分析
- 买土地定金合同范本
- 2025年锰粉系列合作协议书
- GA/T 701-2024安全防范指纹识别应用出入口控制指纹识别模块通用规范
- 2025年阜新高等专科学校单招职业倾向性测试题库附答案
- 2025年包头轻工职业技术学院单招职业适应性测试题库及答案一套
- 部编人教版小学4四年级《道德与法治》下册全册教案
- 《 大学生军事理论教程》全套教学课件
- 中考数学计算题练习100道(2024年中考真题)
- ISO14001:2015中文版(20211205141421)
- 汽车总装车间板链输送线的应用研究
- 工作日志模板
- 工程变更联系单、联系单及要求
- 北京大学2018年第1批总第5批博雅博士后项目候选人名
评论
0/150
提交评论