版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
博弈论与信息经济学第一页,共一百一十页,2022年,8月28日关于博弈论的某些光环博弈论很时髦,也有点神秘,谁懂博弈论,或在文章中使用博弈方法,似乎很有面子Why?因为它以数学为基础,似乎不容易学懂它有广泛的用途,但很直接有效的运用似乎也不多见发展很快第二页,共一百一十页,2022年,8月28日这些光环的一点猜测性说明它曾经很落寞,少数人自己玩得很高兴它1994获得诺贝尔奖了,好莱坞居然还拿纳什的故事拍电影它来自数学,对数学不太有感觉的人会觉得它很枯燥,而数学意识强的人却觉得它很好玩还不够成熟,因为它“重在建设”我国的博弈论运用还很落后,几乎看不到高水平的运用第三页,共一百一十页,2022年,8月28日博弈论之“数学”的特征只是数学思维、数学符号,有些符号怪模怪样,甚至不会读,但很少有什么艰深的数学这里的符号比较麻烦,因为它和代数中的纯粹抽象而无意义的符号不同,在脑子里要时刻记得它们的实际意义但要熟悉这种简捷、抽象的思维方式,记住这些符号的代表意义所以,一个比较有效的学习方法是重复第四页,共一百一十页,2022年,8月28日博弈论的开拓之功“开拓”一般具备什么特征?从学理看:新方法,新模式,新领域……从功效看:新办法,新答案……博弈论兼有之新方法:不同主体之间数量比较和概率思想的结合新模式:经验层次的一些“高妙手段”具有逻辑刚性,并非巧合,如“囚徒困境”新领域:突破了传统经济学的苛刻假设,而且把触角不客气地伸到政治、管理、系统论等领域第五页,共一百一十页,2022年,8月28日博弈论在研究对象之特点上的根本不同通常的学问或理论体系都以“系统内”为研究对象,如果研究多个主体之间的关系,也须纳入一个框架之中。每个学科都有自己的“整体观”显然,这里有明显的传统科学理性的风味。博弈论根本不同,它直接研究几个在逻辑层次上并列的主体之间的关系。看似简单的方法,其实开创了一个思路。它之所以不被广泛应用的一个猜测是:人们目前还不熟悉、不适应这种多维的思维方式。第六页,共一百一十页,2022年,8月28日博弈论在思维方式上的特点习见的思维方式:还原论:整体可无穷拆分为不同级别的个体目的论:事物的发展有其目标其他事物不变博弈论思维方式——历史理性多元化、相对化、历史化事物并不存在一种内在的、永恒的、抽象的“本质”,而只有一种在特定历史框架中的建构。对传统经济学的启发:将研究对象转向个体,放弃一些没有微观基础的假设,如消费函数及其投资函数,而在给出个人的支付函数及战略空间的条件下,研究每个人都选择其最优战略以最大化个人支付函数时将发生什么。第七页,共一百一十页,2022年,8月28日博弈论的学习特点很多人对博弈论有所期待,似乎它有很强的功效。的确,犹如数学,力量很强,无处不在,作用非常广泛而深刻,但学习的时候很枯燥因其与数学密切相关,关于博弈论素养的提高要靠自己的学习、揣摩和领悟——习薫悟化注重数学的严谨,注意基本功得鱼忘筌,得意忘形第八页,共一百一十页,2022年,8月28日本课程的阅读文献张维迎《博弈论与信息经济学》为主要教材通俗读物:王则柯《博弈论平话》、白波《博弈游戏》、潘天群《博弈生存》参考书籍:谢识予《经济博弈论》、姚国庆《博弈论》(南开),拉斯缪森《博弈与信息》(北大与三联)、弗登博格《博弈论》(人民大学),《信息经济学》(湖北)期刊文章:非常多,关于博弈论基本问题的文章自1995陆续发表。但我国直接研究博弈论理论的文章不多,应用博弈论方法的文章非常多,但水平低第九页,共一百一十页,2022年,8月28日0.导论:博弈论与经济学0.1博弈论与主流经济学的发展传统经济学的局限以及博弈论对经济学的重要影响0.2基本内容的概述非合作博弈的非技术性概述第十页,共一百一十页,2022年,8月28日0.1博弈论与主流经济学的发展传统经济学的假设及其局限性二基本假设:完全竞争,完美信息局限性:交易主体的数量其实很有限;信息是不对称的一般均衡理论是整个经济学的理论基石和道义基础,市场机制是完美的,帕累托最优成立,平等与效率可以兼顾。然而在以下情况不成立:非完全竞争:垄断越来越普遍外部性:市场不可能把所有的成本收益都计算在内公共产品:市场无非解决“搭便车”问题逆向选择问题:柠檬市场道德风险问题:为什么市场的交易费用比较高?百年来,经济学的主要发展围绕以上五方面,如垄断竞争理论、产业组织理论、企业理论、信息经济学、新制度经济学、不确定下的决策(投资理论),宏观经济学第十一页,共一百一十页,2022年,8月28日0.1博弈论与主流经济学的发展传统微观经济学与博弈论的比较传统微观经济学的个人决策是在给定一个价格参数和收入的条件下最大化自己的效用,个人的效用与其他人无涉,所有其他人的行为都被总结在“价格”参数之中博弈论中,个人效用不仅依赖于自己的选择,还以来于他人的选择,研究在存在外部经济条件下的个人选择问题事实上,行为主体的数量通常不多,相互之间存在明显影响经济学对博弈论寄予厚望,认为用博弈论可以重写经济学原理博弈论改写经济学,从放宽新古典的完全竞争和完全信息两个条件展开第十二页,共一百一十页,2022年,8月28日0.1博弈论与主流经济学的发展国外经济学教科书改写,加入大量博弈论内容博弈论进入主流经济学,反映了:经济学的研究对象越来越转向个体放弃了有些没有微观基础的假设经济学的研究对象越来越转向人与人之间行为的相互影响和作用经济学越来越重视对信息的研究传统微观经济学的工具是数学(微积分、线性代数、统计学),而博弈论是一种新的数学。以前只有陆军,现在有了空军,其差异不可以道里计第十三页,共一百一十页,2022年,8月28日0.1博弈论与主流经济学的发展博弈论研究的是:当成果无法由个体完全掌握,而结局须视群体共同决策而定时,个人为了取胜,应该采取什么策略博弈论成为通用方法论,经济学、政治学、管理、军事、外交、国际关系、公共选择、犯罪学“深蓝”和“更深的蓝”使用动态博弈理论编写程序,后来战胜了无敌的卡斯帕罗夫第十四页,共一百一十页,2022年,8月28日0.2博弈论要点著名案例——囚徒困境prisoner'sdilemma个人理性最终导致集体理性的缺失第十五页,共一百一十页,2022年,8月28日0.2博弈论要点博弈:决策主体在互相对抗中,对抗双方(或多方)互相依存的一系列策略和行动的过程集合参与人的利益有冲突博弈是一个过程集合(参与人、策略、行动、信息等)。把博弈视为集合是思维从具体到抽象的重要一步博弈的一个本质特征是策略的相互依存性博弈论:专门研究博弈如何出现均衡的规律的学问第十六页,共一百一十页,2022年,8月28日0.2博弈论要点博弈论的基本概念包括:参与人、行动、信息、战略、支付函数、结果、均衡其中,参与人、行动、结果合称博弈规则博弈有不同的种类:从行动顺序角度:静态博弈。参与人同时选择行动动态博弈。参与人的行动有先后顺序从拥有信息角度:完全信息博弈。每个参与人对所有其他参与人的特征、战略空间、支付函数有准确的知识不完全信息博弈。第十七页,共一百一十页,2022年,8月28日0.2博弈论要点将二角度结合,博弈有四种:完全信息静态博弈完全信息动态博弈不完全信息静态博弈不完全信息动态博弈第十八页,共一百一十页,2022年,8月28日博弈论模型G={P,A,S,I,U}
一个博弈需要有五方面内容组成:参与人、行动、信息、结果P:为局中人,能够独立决策,独立承担责任的个人或组织,以最终实现自身利益最大化为目标。A:各局中人的所有可能的策略或行动的集合。分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等。
S:博弈的进程或次序。分为静态博弈和动态博弈。第十九页,共一百一十页,2022年,8月28日I:博弈信息,能够影响最后博弈结局的所有局中人的情报。信息在博弈中占重要地位,博弈的赢得很大程度上依赖于信息的准确度与多寡。如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。U:为局中人获得利益,也是博弈各方追求的最终目标。分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。第二十页,共一百一十页,2022年,8月28日0.2.1完全信息静态博弈:纳什均衡设有两个人一起玩游戏,每个人都有不同的策略,谁都希望自己出“高招”使自己获胜(即寻求效用的最大化),但获胜并不完全依赖于自己的行为能力,还依赖于对手怎么做。有时,双方会形成这样一种状态:我的最好策略所依赖的条件就是你的最好策略。换言之:如果你那样做,我这样最好,而你“那样”做恰恰又是你的最佳策略。通俗地讲:如果别人不动,我也不能动第二十一页,共一百一十页,2022年,8月28日0.2.1完全信息静态博弈:纳什均衡假设n个人参与博弈,给定其他人战略的条件下,每个人选择自己的最优战略。纳什均衡指的是“由所有参与人的最优战略组成的一个组合”几个人制订了一个协议,这几个人是否能自愿遵守?他们会自觉遵守,这个协议就构成一个纳什均衡。如果一个协议不构成纳什均衡,它就不可能自动实施,需要外力胁迫,这就无所谓“协议”第二十二页,共一百一十页,2022年,8月28日NashEquilibriumANashequilibrium,namedafterJohnNash,isasetofstrategies,oneforeachplayer,suchthatnoplayerhasincentive动机tounilaterally单方面changeheraction.Playersareinequilibriumifachangeinstrategiesbyanyoneofthemwouldleadthatplayertoearn获得lessthanifsheremained保持withhercurrentstrategy.Forgamesinwhichplayersrandomize(mixedstrategies),theexpectedoraveragepayoffmustbeatleastaslargeasthatobtainable能得到的byanyotherstrategy.纳什均衡,一个策略集合,其中每个参与人没有动机去但方面地改变自己的行为。任何一个人改变策略都会获得更少,这就是纳什均衡。对于随机化的参与人,期望或平均支付至少与其他任何策略一样大第二十三页,共一百一十页,2022年,8月28日0.2.1完全信息静态博弈:纳什均衡纳什均衡的重要性:任何“合理”结果都要满足的条件——当某一局中人发现他单方面改变战略可以获取更多时,他会毫不犹豫地改变自己的战略,博弈自然就没有达到均衡一种制度安排要发生效力,必须是纳什均衡,否则,这种制度安排就没有效力第二十四页,共一百一十页,2022年,8月28日0.2.1完全信息静态博弈:纳什均衡囚徒困境的几个事例:价格大战两个寡头企业选择产量公共产品的供给军备竞赛做广告围观时踮脚尖应试教育污染。1968年,格雷特·哈丁成功地将“囚徒的困境”与资源耗竭结合起来,揭示了生态环境问题与囚徒困境的相似之处。贸易自由与壁垒,地方保护主义第二十五页,共一百一十页,2022年,8月28日0.2.1完全信息静态博弈:纳什均衡个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。从“纳什均衡”引出“看不见的手”的一个悖论:从利己目的出发,结果损人不利己。“纳什均衡”提出的悖论动摇了经济学的基石。从“纳什均衡”还可以悟出:合作是有利的“利己策略”,但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是“己所不欲勿施于人”。第二十六页,共一百一十页,2022年,8月28日占优战略均衡:不论其他人采取什么策略,A之某策略的payoff总是最高,即为“占优战略”(dominant-strategy)。如果一个博弈的某个策略组合中的所有策略都是各方的上策,那么这个策略组合将是所有人都愿意选择的,必然是比较稳定的结果,这是“占优战略均衡”(dominant-strategyequilibrium)。反映了所有人的绝对偏好,因此十分稳定。但这种情况较少见。划线法:横向,如果“列”选中一个策略,在我的最佳策略下划线;纵向,如果“行”选中一个策略,在我的最佳策略下划线。某个策略组合中的两个支付之下都有横线,此即较为可能的解。如果这种解只有一组,此即上策均衡。(参见谢识予p.61)0.2.1完全信息静态博弈:纳什均衡
基本分析思路和方法第二十七页,共一百一十页,2022年,8月28日例2:圈猪博弈(boxedpigs)0.2.1完全信息静态博弈:纳什均衡小猪按等待大猪按等待5,-14,49,-10,0第二十八页,共一百一十页,2022年,8月28日例3:性别战(battleofsexes)女足球芭蕾男足球芭蕾2,10,00,01,20.2.1完全信息静态博弈:纳什均衡先动优势所形成的“解”形成的机会第二十九页,共一百一十页,2022年,8月28日例4:斗鸡博弈(chickengame)(胆小鬼博弈)0.2.1完全信息静态博弈:纳什均衡B进退A进退-3,-32,00,20,0第三十页,共一百一十页,2022年,8月28日例5:进入阻挠(entrydeterrance)0.2.1完全信息静态博弈:纳什均衡在位者默许斗争进入者进入不进入40,50-10,00,3000,300第三十一页,共一百一十页,2022年,8月28日可能存在多个纳什均衡,如果某种情况不可能出现(如,不可信的威胁),则可剔除之。精炼,缩小了“解”的个数如果是动态博弈,从每一个行动选择开始到博弈结束又构成一个博弈,即“子博弈”精炼纳什均衡:当只当参与人的战略在每一个子博弈中都构成纳什均衡承诺行动:当事人使自己的威胁变得可信的行动0.2.2完全信息动态博弈:
子博弈精炼纳什均衡第三十二页,共一百一十页,2022年,8月28日很多时候,参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平,即,只拥有不完全信息。每个人知己于必然,知人于或然引入一个虚拟的参与人:自然。它选择了参与人的特征类型。海萨尼转换。完全但不完美信息博弈。因为使博弈分析成为可能,故称“完全”,但所知不确,故“不完美”给定自己的类型和别人的类型的概率分布的情况下,每个参与人的期望效用达到最大。0.2.3不完全信息静态博弈:
贝叶斯-纳什均衡第三十三页,共一百一十页,2022年,8月28日贝叶斯统计简介经典统计学需要两种信息:总体和样本贝叶斯统计加入了“先验信息”,来源于经验和历史资料。其统计分布为“先验分布”BayesT.R.1702~1761。有贝叶斯公式贝叶斯学派的基本观点:任一未知量都可看作随机变量,可用一个概率分布去描述它,这个分布称为“先验分布”。任意未知量都有不确定性,因此非常适合用概率来表达第三十四页,共一百一十页,2022年,8月28日后行动者可以通过观察而增加对先行者的了解,再修正其主观判断,并由此选择自己的行动。先行者知道自己的行为会被他人利用,就会设法传递有利信息。博弈过程是不仅是参与人选择行动的过程,还是不断学习的过程。精炼贝叶斯均衡要求:给定其他参与人类型的信念,参与人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯-纳什均衡,而且在所有可能的情况下,参与人要根据观察结果来修正对其他参与人的信念,据此选择自己的最优化行为。0.2.3不完全信息动态博弈:
精炼贝叶斯均衡第三十五页,共一百一十页,2022年,8月28日1.1博弈论的基本概念及战略式表述1.2纳什均衡1.3纳什均衡应用举例1.4混合战略纳什均衡1.5纳什均衡的存在性与多重性1完全信息静态博弈第三十六页,共一百一十页,2022年,8月28日1.1博弈论的基本概念及战略式表述1.1.1基本概念参与人
i=1,2,···,nN表示自然行动。ai表示第i个参与人的一个特定行动
Ai={ai}表示可供i个选择的所有行动的集合
n人博弈中,n个参与人行动的有序集a称为“行动组合”信息完美信息:某个信息集只有1个值完全信息:自然不首先行动或其初始行动为所有参与人知道共同知识第三十七页,共一百一十页,2022年,8月28日1.1博弈论的基本概念及战略式表述1.1.1基本概念战略s:参与人在给定信息集时的行动规则静态博弈中,战略等同于行动战略必须是完备的支付u。u=ui(s1,···,si,···sn)结果均衡s*=(s1*,···,si*,···sn*)均衡:一种所有动作的影响都互相抵消,整个系统处于平稳的、均势的、不变的状态第三十八页,共一百一十页,2022年,8月28日ui(si*,s-i)≥ui(si',s-i)si'≠si*是数理逻辑符号,全称量词,读作“对于全部”或“对于每一个”Universalquantifier,read"forall"or"forevery"第三十九页,共一百一十页,2022年,8月28日1.1博弈论的基本概念及战略式表述1.1.2博弈的战略式表述G博弈的参与人集合每个人的战略空间每个人的支付函数如果:参与人个数有限,每个参与人的战略有限,则为“有限博弈”两人有限博弈的战略式表述可以用矩阵表示第四十页,共一百一十页,2022年,8月28日纳什均衡是完全信息静态博弈的一般概念,也是所有其他类型博弈的基本要求1.2.1占优战略均衡占优战略均衡的定义p.59如果所有参与人都有占优战略存在,则占优战略均衡是可以预测到的惟一的均衡1.2纳什均衡第四十一页,共一百一十页,2022年,8月28日占优战略均衡是非常合理的预测,但经常不存在,这才是博弈论真正的用武之地1.2.2重复剔除的占优战略均衡智猪博弈中,没有占优战略均衡首先找出某个参与人的劣战略,剔除之,再找,再剔除,直到最后的一个劣战略、占优战略的定义p.62弱占优战略的定义p.63重复剔除的占优均衡的定义p.631.2纳什均衡第四十二页,共一百一十页,2022年,8月28日1.2.3纳什均衡很多博弈无法使用重复剔除的方法找到均衡解定义p.69没有任何一个战略严格优于纳什均衡战略(严格优,大于,不包括等于)强纳什均衡p.711.2纳什均衡第四十三页,共一百一十页,2022年,8月28日1.3.1古诺寡头竞争模型两个寡头企业,市场总产量为Q=q1+q2。市场出清价格P是市场总产量的函数P=P(Q)=8-Q。假设生产无固定成本,且每增加一单位产量的边际成本c相等=2,则其成本分别为2q1、2q2,他们同时选择产量利润:u1=q1(Q)-c1q1=q1[8-(q1+q2)]-2q1=6q1-q1q2-q12u2=q2(Q)-c2q2=q2[8-(q1+q2)]-2q2=6q2-q1q2-q22可以寻找纳什均衡:只要两方的一个策略组合(q1*,q2*)相互是对方的最佳对策,就构成一个纳什均衡,如果再可以证明它是惟一的,则可以预言博弈的解可直接根据定义来寻找1.3纳什均衡应用举例第四十四页,共一百一十页,2022年,8月28日(q1*,q2*)必须是最大值解得均衡产量为q1*=q2*=2策略组合(2,2)是惟一的纳什均衡市场最终产量为2+2=4,价格为8-4=4双方各自利润2×(8-4)-2×2=4如果只有一家厂商,总得益U=P(Q)-cQ=Q(8-Q)-2Q=6Q-Q2。其最大产量为6-2Q=0,即Q=3,而得益为9。高于各自产量为2时的总得益8。第四十五页,共一百一十页,2022年,8月28日1.3.2Hotelling价格竞争模型1.3.3公共地的悲剧1.3.4公共物品的私人自愿供给基础设施建设:中央政府与地方政府之间的博弈1.3纳什均衡应用举例第四十六页,共一百一十页,2022年,8月28日1.4混合战略纳什均衡有些博弈不存在(纯策略的)纳什均衡社会福利博弈之例:不存在纳什均衡猜谜游戏之例:不存在纳什均衡B正面反面A正面反面-1,11,-11,-1-1,1流浪汉找工作游荡政府救济不救济3,2-1,3-1,10,0第四十七页,共一百一十页,2022年,8月28日设流浪汉找工作的概率为p,则游荡为1-p政府的支付:当政府救济,政府得到3p-(1-p)=4p-1当政府不救济,政府得到-p+0=-p流浪汉应比较两种策略:4p-1>-p,p>0.2或者4p-1<-p,p<0.2设政府救济的概率为q,则不救济为1-q流浪汉的支付:找工作2q+1-q=q+1游荡3q+0=3q如果政府打算鼓励他找工作,须q+1>3q,q<0.5第四十八页,共一百一十页,2022年,8月28日1.4混合战略纳什均衡纯战略:参与人在每一个给定信息的情况下只选择一个特定的行动混合战略:参与人在每一个给定信息的情况下以某种概率分布随机地选择不同的行动纯战略可视为混合战略的特例以混合策略为对象,重新定义效用函数,即期望效用函数p101再定义纳什均衡p102~103“流浪汉”的纳什均衡:政府以0.5救济,流浪汉以0.2找工作第四十九页,共一百一十页,2022年,8月28日1.4混合战略纳什均衡一个参与人使用混合策略的好处是给对方造成不确定性,浑水摸鱼海萨尼对混合战略的解释:混合战略等价于不完全信息下的纯战略均衡如税收检查,检查则不偷税,不检查则偷税。但税务局检查有成本,企业在知道税务局可能检查的情况下,偷税有风险。此时,可以根据某些参数寻找一个混合策略的纳什均衡几乎所有优先博弈都有优先奇数个纳什均衡。如果一个博弈有两个纯战略纳什均衡,那么,一定存在第三个混合战略纳什均衡第五十页,共一百一十页,2022年,8月28日1.5纳什均衡的存在性和多重性的讨论纳什均衡的存在性p113图X本来是一组自变量,每一个自变量都有一些取值,必然存在一点,使每个人的选择所形成的结果等于自己在这一点上所期望的结果。在这一个点上,所有人的选择重合为一个相同的点。需要理解两点:多个自变量的取值至少在一个点上是重合的;这个点上每个人都没有偏离自己的规律(符合自己在此种选择下的意愿)如果有人不选择这一点的取值,则有可能不形成这个点——每个自变量都符合自己的规律第五十一页,共一百一十页,2022年,8月28日1.5纳什均衡的存在性和多重性的讨论纳什均衡的多重性最令人无奈的是可能存在多个纳什均衡,仍然存在不稳定性——你预测出现这个纳什均衡,因而有相应选择,我却以为会出现另一个,乃有我的选择,此时的组合可能并不构成纳什均衡当一个博弈有多个纳什均衡时,博弈论并没有一个一般的理论注明纳什均衡结果一定会出现。可以利用外在的信息达到纳什均衡,如性别战Cheaptalk也可能促成纳什均衡重复博弈也有可能促成纳什均衡但以上情况并不保证必然出现纳什均衡第五十二页,共一百一十页,2022年,8月28日2完全信息动态博弈不能同时选择和行动的博弈是动态博弈DynamicGames,后行动者可以先观察别人的行动,自己再选择本章讨论完全信息下的动态博弈第五十三页,共一百一十页,2022年,8月28日2.1博弈的扩展式表述扩展式表述所“扩展”的主要是参与人的战略空间战略式表述简单地给出参与人有些什么战略可以选择,而扩展式表述要给出每个战略的动态描述:谁在什么时候行动,每次行动时有些什么具体行动方案可供选择,以及知道些什么此时的战略:如果你这样,我将怎样第五十四页,共一百一十页,2022年,8月28日2.1博弈的扩展式表述要素:参与人集合参与人的行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件(即“自然”的选择)的概率分布第五十五页,共一百一十页,2022年,8月28日2.1博弈的扩展式表述博弈树的基本元素:结、枝、信息集需要注意的概念:前列集、后续集;初始结、决策结、终点结;直接前列结、直接后续结。以及相应的符号信息集:某个参与人都知道些什么信息集是用来标注某个人知道些什么信息的,不同的标注表示这个人知道不同的信息p142第五十六页,共一百一十页,2022年,8月28日2.1博弈的扩展式表述如果博弈树的所有信息集都是单结的,则称为“完美信息博弈”,没有任何两个决策结是用虚线连起来的自然信息集总是假设为单结的博弈树上是否出现连接不同决策结的虚线取决于如何划决策结的顺序p145一个参与人在决策之前所适当的事情必须出现在该参与人的决策结之前有了信息集的概念,扩展式表述也可用来表述静态博弈第五十七页,共一百一十页,2022年,8月28日2.2扩展式表述博弈的纳什均衡需求大,开发者利润8千万,不开发者利润0。需求大,两者都开发利润各为4千万。需求小,开发者利润1千万,不开发者利润0。需求小,两者都开发利润各为-3千万两者都不开发利润各为0。博弈树:房地产开发博弈IA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
N1N2
B1B2B3B4第五十八页,共一百一十页,2022年,8月28日博弈树:不允许的情形第五十九页,共一百一十页,2022年,8月28日结(nodes):枝(branches):信息集(informationsets):博弈树的结构包括决策结和终点结。决策结是参与人采取行动的时点;终点结是博弈行动路径的终点。枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。一个信息集是决策结集合的一个子集(信息集是由决策结构成的集合),该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一个参与人的决策结(2)该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。第六十页,共一百一十页,2022年,8月28日信息集:房地产博弈IIA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
N1N2
B1
B2
B3
B4第六十一页,共一百一十页,2022年,8月28日信息集:房地产博弈IIIA开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
N1N2
B1
B2
B3
B4第六十二页,共一百一十页,2022年,8月28日信息集:房地产博弈IVN大小开不开开不开开发不开发开不开开不开开不开(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)
B1B2
A1A2A3A4第六十三页,共一百一十页,2022年,8月28日几个符号的意义第i个人的信息集为Hi,其中某特定信息集为hi,在hi的情况下会有A(hi)的行动。他的所有信息集所对应的所有行动A(hi)的集合为Ai,∪表示聚合第i个人有信息H,乃有行动A此时的战略是S(而且是纯战略,以后用其他字母表示“不纯”战略)→mapsinto第六十四页,共一百一十页,2022年,8月28日153页第二段:“每一个纯战略都是从信息集到行动集的一个映射,Si可以表示为在每一个信息集hi上的行动空间A(hi)的笛卡儿积”每一个纯战略都是原因现象依某种对应关系所导致的惟一结果现象(信息集可视为自变量,行动集可视为因变量),纯战略的集合Si就是行动空间A(hi)中各种行动的交叉乘积第六十五页,共一百一十页,2022年,8月28日完美信息博弈&不完美信息博弈一个信息集可能包含多个决策结,也可能只包含一个决策结。只包含一个决策结的信息集称为单结信息集;如果博弈树的所有信息集都是单结的,该博弈称为完美信息博弈(Gameofperfectinformation);否则就是不完美信息博弈。2.3子博弈精炼纳什均衡第六十六页,共一百一十页,2022年,8月28日2.3子博弈精炼纳什均衡可信性问题子博弈和逆向归纳法子博弈精炼纳什均衡应用举例有同时选择的两阶段动态博弈第六十七页,共一百一十页,2022年,8月28日可信性:开金矿博弈甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资。甲希望乙能将1万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢?参见谢识予p128第六十八页,共一百一十页,2022年,8月28日开金矿I——无法律的博弈乙甲借不借分不分(2,2)(0,4)(1,0)第六十九页,共一百一十页,2022年,8月28日开金矿II——有法律保障的博弈乙甲借不借分不分(2,2)打不打(1,0)(0,4)(1,0)第七十页,共一百一十页,2022年,8月28日子博弈由一个决策结x和所有该决策结的后续结T(x)(包括终点结)组成,它满足下列条件:(1)x是一个单结信息集;(2)子博弈不改变原博弈的信息集和支付向量子博弈条件1说的是一个子博弈必需从一个单结信息集开始。即:(1)当且仅当决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的开始。(2)如果一个信息集包含两个以上决策结,没有任何一个决策结可以作为子博弈的初始结。A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
N1N2
B1B2B3B4A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
N1N2
B1
B2
B3
B4条件2说的是,子博弈的信息集和支付向量都直接继承自原博弈,并不会发生任何变化。这意味着子博弈不能分割原博弈的信息集。A开发不开发大小大小开发不开发开不开开不开开不开(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
N1N2
B1
B2
B3
B4第七十一页,共一百一十页,2022年,8月28日逆向归纳法p157开不开开不开开不开(-3,-3)(1,0)(0,1)(0,0)A
BB房地产开发:需求小逆向归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始,逐步向前倒推以求解动态博弈的方法。第七十二页,共一百一十页,2022年,8月28日子博弈精炼纳什均衡p166扩展式博弈的战略组合s*=(s1*,…,si*,…,sn*)是一个子博弈精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出纳什均衡。一个战略组合是个子博弈精炼纳什均衡,当只当它在每一个子博弈上都构成一个纳什均衡第七十三页,共一百一十页,2022年,8月28日子博弈精炼纳什均衡均衡路径构成子博弈精炼纳什均衡的战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。这是纳什均衡与子博弈精炼纳什均衡的实质区别只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略序贯理性:不论过去发生了什么,参与人应该在博弈的每一个时点上最优化自己的决策第七十四页,共一百一十页,2022年,8月28日2.4子博弈精炼纳什均衡应用举例斯坦克尔伯格(Stackelberg)寡头竞争模型劳资博弈讨价还价博弈第七十五页,共一百一十页,2022年,8月28日Stackelberg寡头竞争模型一个市场上只有两个企业,他们的行动都是选择产量,但行动有先后顺序。企业1(领头企业,Leader)首先选择产量q10;企业2(尾随企业,Follower)观测到q1,然后选择自己的产量q20。设总产量Q=q1+q2,两个企业有相同的不变单位成本c0,需求函数P(Q)=a-Q=a-(q1+q2)。问题:两个企业应如何决策?第七十六页,共一百一十页,2022年,8月28日库诺特模型与斯氏模型比较库诺特模型均衡结果:q1*=q2*=1/3(a-c)q1*+q2*=2/3(a-c)1*=2*=1/9(a-c)2斯氏模型均衡结果:q1*=1/2(a-c)q2*=1/4(a-c)q1*+q2*=3/4(a-c)1*=1/8(a-c)22*=1/16(a-c)2张教材185页图第七十七页,共一百一十页,2022年,8月28日劳资博弈工会决定工资水平,但企业决定雇用多少人。工会不只追求高工资,还希望被雇人数多。不喜欢高工资高失业,也不喜欢低工资低失业。工会方的效用是工资水平和雇用人数两者的函数u=u(w,L)。工会的目标是最大化总效用假设收益是劳动雇用量的函数R(L)(边际效益递减),再假设只有劳动成本,工厂的利润函数为π=π(w,L)=R(L)-w×L第七十八页,共一百一十页,2022年,8月28日讨价还价博弈(1)谢识予p145假设有甲乙两人就如何分割1万元进行谈判,并且已定下了如下规则:首先,由甲提出一个分割比例,对此,乙可以接受也可以拒绝;如果乙拒绝,则乙自己应提出另一个方案,让甲选择接受与否。如此循环。在循环中,只要有任何一方接受对方的方案博弈就告结束,而如果方案被拒绝,则被拒绝的方案与以后的讨价还价过程不再有关系。第七十九页,共一百一十页,2022年,8月28日讨价还价博弈(2)每次一方提出一个方案和另一方选择是否接受为一个阶段。再假设讨价还价每多进行一个阶段,由于谈判费用和利息损失等,双方的得益都要打一次折扣,折扣率为,0<<1,称为消耗系数。如果限制讨价还价最多只能进行三个阶段,到第三阶段乙必须接受甲的方案,这就是一个三阶段讨价还价博弈。第八十页,共一百一十页,2022年,8月28日接受不接受,出S
乙必须接受讨价还价博弈(3)甲出S1乙接受不接受,出S2甲(S1,10000-S1)[S2,(10000-S2)][2S,2(10000-S)]第一阶段第二阶段第三阶段第八十一页,共一百一十页,2022年,8月28日2.5重复博弈和无名氏定理序贯博弈:不同阶段的博弈结构不同重复博弈:同样结构的博弈重复多次,其中的每次博弈可称“阶段博弈”影响重复博弈均衡结果有二,其一:博弈重复次数。多次博弈可能使参与人选择“合作”影响重复博弈均衡结果之二:信息的完备性。当一个人的支付函数(包括行动和结果)不为其他人所知时,他可能有积极性选择“合作”策略从而建立“好”声誉以换取长期利益第八十二页,共一百一十页,2022年,8月28日2.5.1有限次重复博弈:连锁店悖论市场的“先来后到”重复博弈中,在位者在第一次选择“斗争”时不可置信的威胁。惟一的子博弈精炼纳什均衡是他总是“默许”。倒着想:如果已经进入了n-1个,在最后一个时,其威胁本来是不可置信的,则最后一个会“默许”,再往前推,由于每阶段的“斗争”都是不可置信的,则所有大门都在“默许”下向后来者敞开悖论:我n大的市场岂容你染指?斗!但事实不会如此只要博弈的重复次数是有限的,“重复”并不改变囚徒困境的结果。第八十三页,共一百一十页,2022年,8月28日2.5.2无限次重复博弈和无名氏定理解开连锁店难题的办法之一是引入信息的不完全性。(不确定性可以成为经济运行的资源)当博弈重复无限次时,存在着完全不同与一次博弈的子博弈精炼纳什均衡冷酷战略或触发战略:只要你骗我一次/背叛,我永远不理你/不合作。无名氏定理:有一个一次博弈G可作为某无穷博弈的一个阶段,G有纳什均衡及其结果,对于无限博弈,肯定存在一个贴现因子,使无限博弈的结果不劣(弱优)于G的纳什均衡结果第八十四页,共一百一十页,2022年,8月28日2.5.3参与人不固定的重复博弈重复博弈时,厂商不敢以劣货欺人在经济学或管理学中使用“信誉”这样一个不好解释的概念,但在博弈论中却在某些假设之下“逻辑地”证明了。所谓“信誉”,无非对自己行为的预期为什么买于“坐贾”而非“行商”?为什么车站旁边的劣质品那么多?企业存在的一个原因是创造一个“长期参与人”,因其考虑长期利益而遵章守纪、态度积极第八十五页,共一百一十页,2022年,8月28日2.5.4不确定环境下的重复博弈寡头市场上,低需求时容易使他们都选择“合作”,但在高需求时,利润的诱惑使他们都选择“背叛”。这种情况可以重复能同甘却不能共苦,似乎有道德谴责的意味,但这一现象总是发生,发生的逻辑是什么?博弈论可以解释第八十六页,共一百一十页,2022年,8月28日3不完全信息静态博弈3.1不完全信息博弈在信息上,各对手有时势均力敌,可能形成完全信息博弈其技术标准是:支付函数是共同知识大量的对局中信息不对称,如古董(他们坐店收购时从来不先出价,卖猫的故事)企业选择员工保险销售至少有一个人不知道其他人的支付函数,即形成“不完全信息博弈”第八十七页,共一百一十页,2022年,8月28日3.1不完全信息博弈和贝叶斯纳什均衡3.1.1不完全信息博弈例:市场进入博弈进入者不知道在位者的成本函数,只能猜概率如果你是高成本,我就进入,预期收益40,如果你是低成本,我就不进入。到底进还是不进?进入者进入不进入在位者高成本情况低成本情况默许斗争默许斗争40,50-10,030,80-10,1000,3000,3000,4000,400期望利润:p×40+(1-p)×(-10).为保证不亏,期望利润为0,则p=0.2。大于0.2会赚钱。对p的判断就是“贝叶斯理念”第八十八页,共一百一十页,2022年,8月28日3.1不完全信息博弈和贝叶斯纳什均衡3.1.2海萨尼转换引入一个“自然”,尼不知道别人的类型,但“自然”已经选择好了。这时,“不完全”信息转换成“完全”信息,因为可以藉此展开分析246页图,有了概率(似乎是个代数符号),就可以运算了注意进入者的信息集。把未知的东西化为“非空有限集”(集合也同时意味着分布概率),则在理论上可知海萨尼转换已成为处理不完全信息博弈的标准方法通过海萨尼转换,博弈开始时,所有参与人对“自然”的行动有一致的信念,即都知道所有参与人类型的概率分布函数。此即“海萨尼公理”第八十九页,共一百一十页,2022年,8月28日3.1.3不完全信息静态博弈的战略式表述和贝叶斯纳什均衡贝叶斯纳什均衡是完全信息静态博弈纳什均衡在不完全信息上的扩展,不完全信息博弈又称“静态贝叶斯博弈”与完全信息静态博弈不同的是:参与人的行动空间可能依赖于他的类型静态贝叶斯博弈的战略式表述包括:战略空间、类型的表现、概率、支付函数静态贝叶斯博弈的时间顺序:“自然”选择各人的类型(参与人只知道别人的概率分布);各参与人同时选择相对,每个人各得其所如果各参与人的类型空间只有一个元素,则退化为完全信息静态博弈3.1不完全信息博弈和贝叶斯纳什均衡第九十页,共一百一十页,2022年,8月28日贝叶斯纳什均衡的定义如果我是某种类型则其他人属某类型的概率,乘以这种情况下其他人的最好选择时我所得到的效用。对此乘积加总,找出我的最大效用贝叶斯均衡相当于“各人的类型之和”个参与人的纳什均衡3.1不完全信息博弈和贝叶斯纳什均衡第九十一页,共一百一十页,2022年,8月28日3.2.1不完全信息古诺模型前面已经分析过完全信息静态古诺模型p74和动态斯坦克尔伯格模型p182。后者,由于先行者的优势而使均衡结果不同于完全信息下的结果(如果是选择价格,均衡结果不利于先行者)3.2贝叶斯纳什均衡的应用举例第九十二页,共一百一十页,2022年,8月28日3.2.3双方叫价拍卖doubleauction两群人各自出价,有中间的拍卖商。叫价较低者容易卖出,但成交价格有可能高于他的出价;出价高者容易买到,但成交价格有可能低于他的出价Chatterjee&Samuelson“双方叫价拍卖模型”假设你卖我买你觉得这东西值c,要价ps;我觉得这东西值v,要价pb。同时报数如果你要价较低,成交,价格为中间数如果你要价较高,不成交3.2贝叶斯纳什均衡的应用举例第九十三页,共一百一十页,2022年,8月28日3.2贝叶斯纳什均衡的应用举例3.2.3双方叫价拍卖doubleauction如果是完全信息,我知道那东西对你意味着什么,你也知道那东西对我来讲值多少钱。这将形成一个均衡:你我出价相等,皆大欢喜如果谁想沾便宜,生意就没法做还可能出现无效率的均衡:双方都没有认真选择价格,漫天要价,坐地还钱,做不成生意第九十四页,共一百一十页,2022年,8月28日3.2贝叶斯纳什均衡的应用举例3.2.3双方叫价拍卖doubleauction如果是不完全信息,我不知道那东西对你意味着多少钱,你也不知道那东西对我来讲有多大价值。但可以假设我们互相知道对方的分布函数根据纳什均衡的定义,我们都选择最大化根据均衡战略,即使我觉得它值1,但我最多只出3/4,如果想成交,你的要价必须不高于3/4第九十五页,共一百一十页,2022年,8月28日3.3贝叶斯博弈与混合战略均衡完全信息混合战略均衡可视为不完全信息纯战略均衡的极限混合战略均衡的纯化定理第九十六页,共一百一十页,2022年,8月28日3.4机制设计理论与显示原理贝叶斯博弈和机制设计3.4.2拍卖机制设计机制设计和显示原理3.4.4不完全信息与资源配置第九十七页,共一百一十页,2022年,8月28日有同时选择的两阶段动态博弈谢识予p163假设有两个阶段,在每个阶段有两个参与人同时选择(静态博弈)。此时,子博弈是第二阶段两参与人的同时选择。第九十八页,共一百一十页,2022年,8月28日银行挤兑(1)
王则柯“银行挤兑的成因和预防”两客户在同一银行各存有100元,银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金,则只能收回140元;但如果到期后再收回投资,则可收回本息280元。对客户来说,抽回存款的日期也有两种:一是在银行投资项目到期之前,称日期1;一是在到期之后,称日期2。假定如果两客户在日期1要求抽回资金则各得70元;如果只有一个客户在日期1要抽回资金则该客户得100元,另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如果到日期2还只有一方要求收回资
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能交通工具合作开发合同(2篇)
- 早期档案管理体系的演变-深度研究
- 互动电影与沉浸式体验-深度研究
- 桥梁加固设计方法创新-深度研究
- 二零二五年度船舶买卖合同风险防范与保险条款
- 2025年度生态公园休闲设施装饰装修施工合同
- 二零二五年度物业费收取与社区智能安防系统建设合同范本
- 2025年度工业用地租赁合同解除通知函
- 2025年旅行社接送机服务合同
- 个人借款借条与合同的区别
- 湖北省十堰市城区2024-2025学年九年级上学期期末质量检测综合物理试题(含答案)
- 导播理论知识培训班课件
- 电厂检修安全培训课件
- 四大名绣课件-高一上学期中华传统文化主题班会
- 高中生物选择性必修1试题
- 电气工程及其自动化专业《毕业设计(论文)及答辩》教学大纲
- 《客舱安全管理与应急处置》课件-第14讲 应急撤离
- 危险化学品押运员培训
- 2025届高考作文押题预测5篇
- 培训学校书法课家长会
- 一年级数学(上)计算题专项练习集锦
评论
0/150
提交评论