版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈论博弈论2 2l智猪博弈智猪博弈假设猪圈里有一大一小两只猪,猪圈的一头有一假设猪圈里有一大一小两只猪,猪圈的一头有一个猪食槽,另一头有一个控制猪食供应的按钮,按一个猪食槽,另一头有一个控制猪食供应的按钮,按一下按钮会有下按钮会有10个单位的猪食进槽。若小猪去按,大猪个单位的猪食进槽。若小猪去按,大猪先吃,大猪可吃到先吃,大猪可吃到9个单位,小猪吃到个单位,小猪吃到1个单位;若大个单位;若大猪去按,小猪先吃,小猪可吃到猪去按,小猪先吃,小猪可吃到4个单位,大猪吃到个单位,大猪吃到6个单位;若同时去按,大猪可吃到个单位;若同时去按,大猪可吃到7个单位,小猪吃个单位,小猪吃到到3个单位。个单位。
2、3 3小猪的策略小猪的策略按按等等大猪的大猪的策略策略按按7,36,4等等9,10,0策略均衡策略均衡(按,等)(按,等)在这种情况下,不论大猪采取何种策略,小猪的最佳在这种情况下,不论大猪采取何种策略,小猪的最佳策略是等待,即在食槽边等待大猪去按钮,然后坐享策略是等待,即在食槽边等待大猪去按钮,然后坐享其成。而由于小猪总是会选择等待,大猪无奈之下只其成。而由于小猪总是会选择等待,大猪无奈之下只好去按钮好去按钮,这就是社会中搭便车现象。这就是社会中搭便车现象。4 4l智猪博弈现象(搭便车现象)在日常生活中也是司智猪博弈现象(搭便车现象)在日常生活中也是司空见惯的。爱清洁的人经常打扫公共楼道,其
3、他人搭空见惯的。爱清洁的人经常打扫公共楼道,其他人搭便车;山村中出外跑运输、做生意的人掏钱修路,其便车;山村中出外跑运输、做生意的人掏钱修路,其他村民走修好的路;等等。他村民走修好的路;等等。5 5甲甲 前进前进 后退后退 前进前进 (-2,-2) (1,-1) 后退后退 (-1,1) (-1,-1) 乙乙l斗鸡博弈斗鸡博弈两只鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味两只鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却
4、。至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。网破的决心。该种博弈中,坚定不可与退却往往是一种可选择的策略运用。如该种博弈中,坚定不可与退却往往是一种可选择的策略运用。如在企业经营方面,在市场容量有限的条件下,一家企业投资了某在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃该项目。一项目,另一家企业便会放弃该项目。6 6第一章、博弈论基本概念与发展历史第一章、博弈论基本概念与发展历史1 1 博弈论定义博弈论定义l博博 弈弈下棋下棋
5、商家与商家,商家与商家与商家,商家与消费者,上级和下级,消费者,上级和下级,讨价还价讨价还价本义:对弈本义:对弈经济学中的含义:所有经济学中的含义:所有的互动情形的互动情形7 7博博 弈:弈:一些个人、团队或其他组织,依据所掌握的一些个人、团队或其他组织,依据所掌握的信息,在一定的规则约束下,同时或先后,信息,在一定的规则约束下,同时或先后, 一次或一次或多次从各自允许选择的行为或战略进行选择并加以多次从各自允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。实施,并从中各自取得相应结果或收益的过程。博弈论:博弈论:研究决策主体的行为及其相互决策和均衡问研究决策主体的行
6、为及其相互决策和均衡问题的学科。题的学科。博弈是一种极为普通的现象。在经济学中,博弈论博弈是一种极为普通的现象。在经济学中,博弈论是研究经济主体的决策相互影响。是研究经济主体的决策相互影响。8 8 博弈六大要素博弈六大要素l规则:规则:规定博弈各方的行动顺序、方式、以及最终规定博弈各方的行动顺序、方式、以及最终的结果等。的结果等。l局中人局中人(Player, 选手,玩家)选手,玩家):博弈参与人博弈参与人l战略:战略:一整套的行动方案,规定了各种情况下的行一整套的行动方案,规定了各种情况下的行动。动。人不犯我,我不犯人;人若犯我,我必犯人。人不犯我,我不犯人;人若犯我,我必犯人。l行动:行动
7、:局中人行为局中人行为l信息:信息:在行动时所掌握的信息。在行动时所掌握的信息。l报酬报酬(payoffs, 支付):博弈结束时,各方得到的支付):博弈结束时,各方得到的收益。收益。9 9两个两个OPEC成员国:成员国: 沙特沙特 与与 科威特科威特每个国家都有两种行动:增产每个国家都有两种行动:增产 或或 保持产保持产量量参与人参与人(局中人)(局中人)行动行动结果和报酬结果和报酬增产增产保持保持增产增产保持保持科科威威特特(6, 6)(7, 4)(4, 7)(5, 5)两国如何决策呢?两国如何决策呢?结果:双方都增结果:双方都增产产1010合作博弈与非合作博弈之间的区别主要在于人们的合作博
8、弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能达成行为相互作用时,当事人能达成个具有约束力的个具有约束力的协议。如果有,就是合作博弈;反之则是非合作协议。如果有,就是合作博弈;反之则是非合作博弈。例如两个寡头企业,如果它们之间达成一个博弈。例如两个寡头企业,如果它们之间达成一个协议,联合最大化垄断利润并按这个协议生产,协议,联合最大化垄断利润并按这个协议生产,就是合作博弈。协议没有约束力,两个寡头企业各就是合作博弈。协议没有约束力,两个寡头企业各自优化其最优产量(或价格),则成为非合作博弈。自优化其最优产量(或价格),则成为非合作博弈。用非合作博弈研究问题的较多、近几年合作博弈
9、研用非合作博弈研究问题的较多、近几年合作博弈研究呈现上升态势。究呈现上升态势。1)非合作博弈和合作博弈。)非合作博弈和合作博弈。 博弈分类博弈分类1111)双人博弈和多人博弈)双人博弈和多人博弈3)零和博弈、常和博弈与变和博弈)零和博弈、常和博弈与变和博弈 零和博弈:零和博弈:是指在博弈中,一方的得益就是另一是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零。(赌博)方的损失,所有博弈方的得益总和为零。(赌博) 常和博弈:常和博弈:是指所有博弈方的得益总和为非零的是指所有博弈方的得益总和为非零的常数。(分蛋糕,体育比赛等)常数。(分蛋糕,体育比赛等)变和博弈:变和博弈:也称非常
10、和博弈也称非常和博弈,它意味着不同的策略它意味着不同的策略组合或结果下各博弈方的得益之和一般是不相同组合或结果下各博弈方的得益之和一般是不相同的。的。12124)静态博弈和动态博弈)静态博弈和动态博弈静态博弈:静态博弈:是指所有博弈方同时或可看作同时选择是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。策略、采取行动的博弈。动态博弈:动态博弈:是指博弈方的选择、行动有先有后,而是指博弈方的选择、行动有先有后,而且后选择、后行动的博弈方在自己进行选择、行动且后选择、后行动的博弈方在自己进行选择、行动之前可以看到在他之前选择、行动的博弈方的选择、之前可以看到在他之前选择、行动的博弈方的选择、
11、行动的博弈。行动的博弈。1313)完全信息博弈和不完全信息博弈)完全信息博弈和不完全信息博弈完全信息博弈:完全信息博弈:是指每一参与者都拥有所有其他参是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的与者的特征、策略集及得益函数等方面的准确信息的博弈。博弈。不完全信息博弈:不完全信息博弈:是指参与者只了解上述信息中的是指参与者只了解上述信息中的一部分的博弈。一部分的博弈。 1414将博弈的信息特征和行为时间特征结合起来,可以把将博弈的信息特征和行为时间特征结合起来,可以把博弈细分为下面四种类型的非合作博弈:博弈细分为下面四种类型的非合作博弈:行动行动顺序顺序信息信息静
12、静 态态 动动 态态 完全信息完全信息不完全信息不完全信息完全信息博弈,纳什完全信息博弈,纳什均衡均衡纳什(纳什(1950,1951)完全信息动态博弈,子完全信息动态博弈,子博弈精练纳什均衡博弈精练纳什均衡 泽尔腾(泽尔腾(1965)不完全信息静态博弈,不完全信息静态博弈, 贝叶斯纳什均衡贝叶斯纳什均衡海萨尼(海萨尼(1967-1968)不完全信息动态博弈;不完全信息动态博弈;精练贝叶斯纳什均衡精练贝叶斯纳什均衡海萨尼(海萨尼(1975)1515萌芽阶段萌芽阶段1944年以前年以前产生阶段产生阶段1944年年-1959年年发展阶段发展阶段1960年年-1979年年繁荣阶段繁荣阶段1980年以后
13、年以后古诺古诺(Cournot,1838,法法国经济学家)模型(同国经济学家)模型(同时决策的产量博弈)时决策的产量博弈)斯坦克尔伯格(斯坦克尔伯格(1934,Stackelberg,德国经济学家德国经济学家) (不同时决策的产量博弈)(不同时决策的产量博弈)冯冯诺依曼和摩根斯特恩合著诺依曼和摩根斯特恩合著博弈论与经济行为博弈论与经济行为(1944年)年)纳什均衡纳什均衡(完全信息静完全信息静态态)(1950,1951)精练纳什均衡精练纳什均衡(完全完全信息动态信息动态)(泽尔腾,(泽尔腾,1965)贝叶斯纳什均衡(不完全信息静态贝叶斯纳什均衡(不完全信息静态,海萨尼,海萨尼,1967)与贝叶
14、斯精练纳什)与贝叶斯精练纳什均衡均衡(不完全信息动态不完全信息动态,海萨尼,海萨尼,1975)纳什,泽尔腾和海纳什,泽尔腾和海萨尼共同获得诺贝萨尼共同获得诺贝尔经济学奖(尔经济学奖(1994)维克里和莫里斯维克里和莫里斯获诺贝尔经济学获诺贝尔经济学奖(奖(1996)博弈模型的解的概念博弈模型的解的概念和分析方法,理论基和分析方法,理论基础,主要合作博弈,础,主要合作博弈,非合作零和博弈非合作零和博弈论文论文“N人博弈中的均人博弈中的均衡衡”点点(50年年),“非合非合作博弈作博弈”(51年年),提出,提出了非合作博弈均衡解,了非合作博弈均衡解,并证明了均衡解的存在并证明了均衡解的存在纳什均衡基
15、本纳什均衡基本思想:在解集思想:在解集中所有博弈者中所有博弈者的策略都是对的策略都是对其他博弈者所其他博弈者所用策赂的最佳用策赂的最佳对策对策1965年论文年论文一个具有需求惯性的寡头博弈模一个具有需求惯性的寡头博弈模型型,德国德国波恩大学波恩大学教授,数学家、经济学家教授,数学家、经济学家 美国美国加州大学加州大学教授,经济学教授,经济学家家 不对称信息下激励理论不对称信息下激励理论、博弈论产生与发展、博弈论产生与发展1994年到年到2007年年先后先后13位博弈论位博弈论和信息经济学专和信息经济学专家获得了诺贝尔家获得了诺贝尔经济学奖经济学奖16164 博弈论在经济学中重要地位博弈论在经济
16、学中重要地位 1)博弈论在经济学中的应用越来越广泛)博弈论在经济学中的应用越来越广泛. 博弈论许多成博弈论许多成果也是借助于经济学的例子来发展的果也是借助于经济学的例子来发展的, 相比其他领域来说相比其他领域来说,在经济领域应用最为成功的在经济领域应用最为成功的,已经形成了一套完整的经济已经形成了一套完整的经济博弈理论博弈理论,并且发挥了巨大经济效益。并且发挥了巨大经济效益。2)经济学和博弈论的研究模式是一样的,这就是强调个)经济学和博弈论的研究模式是一样的,这就是强调个人理性也就是在给定的约束条件追求效用最大化。在这人理性也就是在给定的约束条件追求效用最大化。在这一点上,博弈论与经济学是完全
17、一样的一点上,博弈论与经济学是完全一样的,使得博弈论分析使得博弈论分析方法在经济分析中发挥着重要作用。方法在经济分析中发挥着重要作用。3)现代经济学越来越转向人与人关系的研究,特别是人与)现代经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和作用,这与博弈论研究内容相一人之间行为的相互影响和作用,这与博弈论研究内容相一致致,所以所以,随着现代经济学的发展随着现代经济学的发展,博弈论显得更加重要。博弈论显得更加重要。17174)经济学越来越重视对信息的研究,特别是信息不对称对)经济学越来越重视对信息的研究,特别是信息不对称对个人选择及制度安排的影响。而博弈论不完全信息博弈模个人选
18、择及制度安排的影响。而博弈论不完全信息博弈模型正是解决这类问题的有效工具。如信息经济学是博弈论型正是解决这类问题的有效工具。如信息经济学是博弈论应用非对称信息经济领域的结果,所以信息经济学也被称应用非对称信息经济领域的结果,所以信息经济学也被称为非对称信息博弈论。为非对称信息博弈论。9.9,管科18185)博弈论和信息经济学专家获得了诺贝尔经济学奖博弈论和信息经济学专家获得了诺贝尔经济学奖,凸现了凸现了“博弈论博弈论”在主流经济学中日益重要的地位。在主流经济学中日益重要的地位。1994年年, 诺贝尔经济学奖由纳什、泽尔滕、海萨尼获得诺贝尔经济学奖由纳什、泽尔滕、海萨尼获得, 1996年年, 诺
19、贝尔经济学奖由莫里斯和维克瑞获得诺贝尔经济学奖由莫里斯和维克瑞获得(不对称信不对称信息下的激励理论息下的激励理论),2001年年, 阿克洛夫阿克洛夫,斯宾塞和斯蒂格利茨获得诺贝尔经济学斯宾塞和斯蒂格利茨获得诺贝尔经济学奖奖(不对称信息下市场交易理论不对称信息下市场交易理论).2005年年, 诺贝尔经济学奖由罗伯特诺贝尔经济学奖由罗伯特奥曼和托马斯奥曼和托马斯谢林获得谢林获得(通过博弈论分析冲突和合作通过博弈论分析冲突和合作)”. 表彰他们表彰他们“因通过博弈论因通过博弈论分析加强了我们对冲突和合作的理解分析加强了我们对冲突和合作的理解”所作出的贡献,所作出的贡献,2007年年, 诺贝尔经济学奖
20、由赫维茨诺贝尔经济学奖由赫维茨,马斯金马斯金,迈尔森获得迈尔森获得(机机制理论设计制理论设计).从从1994年到年到2007年先后有年先后有13位博弈论和信息经济学专家获位博弈论和信息经济学专家获得了诺贝尔经济学奖,在诺贝尔经济学奖的历史上,在这得了诺贝尔经济学奖,在诺贝尔经济学奖的历史上,在这么短的时期把这一科学研究最高荣誉授予同一领域,研属么短的时期把这一科学研究最高荣誉授予同一领域,研属罕见罕见. 1919 囚徒困境是两个嫌疑犯作案后被警察抓住,分别被关在不囚徒困境是两个嫌疑犯作案后被警察抓住,分别被关在不同房间审讯。警察告诉他们:如果两人都坦白,各判刑同房间审讯。警察告诉他们:如果两人
21、都坦白,各判刑8年;年;如果两个都抵赖,各判如果两个都抵赖,各判1 1年年( (因证据不足因证据不足) );如果其中一人坦白;如果其中一人坦白另另人抵赖,坦白者放出去,不坦白的判刑人抵赖,坦白者放出去,不坦白的判刑1010年年( (这有点这有点“坦坦白从宽、抗拒从严白从宽、抗拒从严”的味道的味道)。博弈支付见表:。博弈支付见表:(1)囚徒困境)囚徒困境5.博弈论几个典型实例博弈论几个典型实例囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖2020 在这个例子里,战略组合有四个:在这个例子里,战略组合有四个:(坦白,坦白),(坦白,坦白,
22、坦白),(坦白,抵赖),(抵赖,坦白),(抵赖,抵赖)。给定抵赖),(抵赖,坦白),(抵赖,抵赖)。给定B坦白的情况坦白的情况下,下,A的最优战略是坦白;同样,给定的最优战略是坦白;同样,给定A坦白的情况下,坦白的情况下,B的最优的最优战略也是坦白。各方最优战略的组合是战略也是坦白。各方最优战略的组合是(坦白、坦白坦白、坦白)。囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖 从博弈中两个利益主体出发选择行为,结果是既没有实现从博弈中两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,两人总体
23、的最大利益,也没有真正实现自身的个体最大利益,这就是所谓的囚徒困境。在经济领域中经常出现类似问题,如这就是所谓的囚徒困境。在经济领域中经常出现类似问题,如寡头竞争、公共产品的供给等等。寡头竞争、公共产品的供给等等。2121微观经济学的基本观点之一是在人人追求自身利益最大化的微观经济学的基本观点之一是在人人追求自身利益最大化的基础上基础上, 市场机制这只市场机制这只“看不见的手看不见的手”,可以使得全社会资源达,可以使得全社会资源达到最优配置。囚徒困境对此提出了新的挑战。到最优配置。囚徒困境对此提出了新的挑战。囚徒困境囚徒困境揭示了个体理性与集体理性之间的矛盾揭示了个体理性与集体理性之间的矛盾(
24、从个体利益出从个体利益出发的行为最终也不一定能真正实现个体的最大利益,甚至会得发的行为最终也不一定能真正实现个体的最大利益,甚至会得到相当差的结果到相当差的结果)。2222(2)寡头竞价模型)寡头竞价模型在市场竞争中寡头之间通过竞价,尤其是通过降价争夺市在市场竞争中寡头之间通过竞价,尤其是通过降价争夺市场是市场竞争中十分普通的行为。但削价竞争并不一定是场是市场竞争中十分普通的行为。但削价竞争并不一定是成功的策略,因为一个寡头的降价往往会引起竞争对手的成功的策略,因为一个寡头的降价往往会引起竞争对手的报复,此时降价不仅不能扩大销量,而且还可能会降低利报复,此时降价不仅不能扩大销量,而且还可能会降
25、低利润。润。下面我们用一个双寡头两种价格的价格竞争模型来说明上下面我们用一个双寡头两种价格的价格竞争模型来说明上述现象。述现象。2323假设两寡头采取原来的假设两寡头采取原来的“高价高价”策略策略,各可获得各可获得80万元的利润;万元的利润;如果某个寡头单独降价,它可获得如果某个寡头单独降价,它可获得130万元利润,另一寡头由于万元利润,另一寡头由于市场份额缩小,利润下降到市场份额缩小,利润下降到20万元;万元;如果另一寡头也跟着降价,则两寡头都只能得到如果另一寡头也跟着降价,则两寡头都只能得到60万元利润。万元利润。设寡头设寡头1和寡头和寡头2是双寡头市场上的两个寡头,它们共同用相是双寡头市
26、场上的两个寡头,它们共同用相同的价格销售相同的产品。现在假设这两个寡头不满足它们同的价格销售相同的产品。现在假设这两个寡头不满足它们各自的市场份额和利润,都想通过降价来争夺更大的市场份各自的市场份额和利润,都想通过降价来争夺更大的市场份额和更多的利润。额和更多的利润。2424博弈结果是双方都会坚持采用博弈结果是双方都会坚持采用“低价低价”策略,各策略,各自得到自得到60万元的利润。万元的利润。各得各得80万元利润的结果是无法实现的。万元利润的结果是无法实现的。因此这种双寡头竞价博弈也是一种囚徒困境式因此这种双寡头竞价博弈也是一种囚徒困境式的博弈关系。的博弈关系。2525(3)田忌赛马)田忌赛马
27、 “田忌赛马田忌赛马“是我国古代一个非常有名的故事,讲的是发生在是我国古代一个非常有名的故事,讲的是发生在齐威王与大将田忌之间的赛马的故事。这个故事讲的其实是一齐威王与大将田忌之间的赛马的故事。这个故事讲的其实是一个很典型的博弈问题。个很典型的博弈问题。双方各出上,中,下等三匹马,一对一比赛三场,每一场双方各出上,中,下等三匹马,一对一比赛三场,每一场的输方要赔一百匹马给赢方。的输方要赔一百匹马给赢方。齐威王的上、中、下三匹马分别比田忌的上、中、下三匹马齐威王的上、中、下三匹马分别比田忌的上、中、下三匹马略胜一筹,如果同等次的马进行比赛,田忌输三场,输三百略胜一筹,如果同等次的马进行比赛,田忌
28、输三场,输三百匹马。匹马。2626 1) 不能让对方知道或猜中自己的策略,从而导致自己输掉比赛。不能让对方知道或猜中自己的策略,从而导致自己输掉比赛。这也意味着任何一方的策略选择不能一成不变或者不能有规律性这也意味着任何一方的策略选择不能一成不变或者不能有规律性地变动,即必须以随机的方式选其策略,否则一旦对方捕捉到这种地变动,即必须以随机的方式选其策略,否则一旦对方捕捉到这种规律性的变动,就可以针对性地采取应对策略。规律性的变动,就可以针对性地采取应对策略。该博弈的特点该博弈的特点27272) 六种策略之间没有优劣之分六种策略之间没有优劣之分,只能随机选择只能随机选择。对齐威王来说,。对齐威王
29、来说,每一种策略都可能有六种不同的结果,究竞最终得哪种结果,每一种策略都可能有六种不同的结果,究竞最终得哪种结果,主要看对方策略与自己策略的对应状况,而不是己方的策略本主要看对方策略与自己策略的对应状况,而不是己方的策略本身。同样的,对田忌来讲六种策略本身也无好坏之分。因此,身。同样的,对田忌来讲六种策略本身也无好坏之分。因此,两博弈方在决策时对己方的可选策略并无偏好,应以相同的概两博弈方在决策时对己方的可选策略并无偏好,应以相同的概率选用。率选用。1-12342828囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖 各方最优战略的组合
30、是各方最优战略的组合是(坦白、坦白坦白、坦白),这就是一种均衡。,这就是一种均衡。第二章第二章 完全信息静态博完全信息静态博弈弈完全信息静态博弈完全信息静态博弈:各博弈方同时决策,且博弈要素各博弈方同时决策,且博弈要素为共同知识为共同知识.均衡:均衡:由最优战略构成的战略组合,即相对稳定的状态由最优战略构成的战略组合,即相对稳定的状态, 记为记为),(*1*2nssss1.基本概念:基本概念:2929 均衡结果:均衡结果:在均衡战略下参与人博弈后行动的组合。记为在均衡战略下参与人博弈后行动的组合。记为),(*1*naaa囚徒囚徒A囚徒囚徒B囚徒囚徒B坦白坦白抵赖抵赖坦白坦白抵赖抵赖抵赖抵赖坦白
31、坦白( -8,-8)( 0,-10)( -10,0)( -1,-1)囚徒囚徒B的最优战略是:的最优战略是:坦白坦白 坦白,抵赖坦白,抵赖 坦白坦白囚徒囚徒A的最优战略是:坦白的最优战略是:坦白均衡结果是:均衡结果是: 战略均衡是:战略均衡是: (坦白,(坦白,坦白坦白 坦白,抵赖坦白,抵赖 坦白坦白)(坦白(坦白 坦白)坦白)30302.完全信息静态博弈的分析基础完全信息静态博弈的分析基础参与人参与人 理性:参与人选择最大化自身支付的战略。理性:参与人选择最大化自身支付的战略。完全信息静态博弈的分析基础完全信息静态博弈的分析基础 (1)参与人是理性的参与人是理性的:与传统决策理论是一致的与传统
32、决策理论是一致的,但也有一些不同但也有一些不同, 博弈论中所有决策变量相互依赖,而其他理论决策变量是单向博弈论中所有决策变量相互依赖,而其他理论决策变量是单向 依赖依赖 (2)博弈结构博弈结构, 支付和参与人理性是共同知识支付和参与人理性是共同知识囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖如囚徒困境如囚徒困境,一旦违反一旦违反如上假定如上假定,均衡结果无均衡结果无法确定法确定31312 占优均衡占优均衡 占优战略:无论其他参与人选择什么战略,参与人占优战略:无论其他参与人选择什么战略,参与人 的的某一战略均是最优的,该战略称占优战
33、略。数学表达如下:某一战略均是最优的,该战略称占优战略。数学表达如下:i*),(),(iiiiiiiissssussu*is为占优战略,相应的称为占优战略,相应的称 is为劣战略。为劣战略。 占优战略均衡:由占优战略构成的战略组合。占优战略均衡:由占优战略构成的战略组合。囚徒困境中囚徒困境中(坦白、坦白坦白、坦白)就是占优战略均衡就是占优战略均衡囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖9.113232说明说明:1) 稳定性非常高稳定性非常高,2)无须知道其他人支付信息无须知道其他人支付信息.3)占优均衡不一定达到帕累托最优占优均
34、衡不一定达到帕累托最优.现实中可能不存在这种均衡现实中可能不存在这种均衡,是否存在其他均衡呢是否存在其他均衡呢?囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖3333 例例3 博弈支付如下:博弈支付如下: 1)不存在占优均衡不存在占优均衡:上述博弈中上述博弈中 K是参与人是参与人2的占优战略,但参的占优战略,但参与人与人1不存在占优战略。不存在占优战略。2) 但存在另外一种合理的均衡但存在另外一种合理的均衡(R,K):可以通过重复剔除劣战可以通过重复剔除劣战略得到。首先,对于参与人略得到。首先,对于参与人1,M是劣战略,将其剔除。在剔
35、除是劣战略,将其剔除。在剔除后的战略中,后的战略中,L是参与是参与1的劣战略,又将其剔除,最后剩下的战的劣战略,又将其剔除,最后剩下的战略组合(略组合(R,K)是重复剔除劣战略的占优均衡,)是重复剔除劣战略的占优均衡,R和和K分别是分别是参与人参与人1和参与人和参与人2的重复剔除劣战略的占优战略。的重复剔除劣战略的占优战略。参与人参与人2 (1,1)(8,0)(3,5)(4,2)参与人参与人1 M L R K3 重复剔除占优均衡重复剔除占优均衡3434思路:首先找到某个参与人的劣战略(假定存在),把这个思路:首先找到某个参与人的劣战略(假定存在),把这个劣战略剔除掉,重新构造一个不包含已剔除战
36、略的新的博弈,劣战略剔除掉,重新构造一个不包含已剔除战略的新的博弈,然后再剔除这个新的博弈中的某个参与人的劣战略,一直重然后再剔除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。复这个过程,直到只剩下唯一的战略组合为止。 这个唯一剩下的战略组合就是这个博弈的均衡解,称这个唯一剩下的战略组合就是这个博弈的均衡解,称为为“重复剔除劣战略的占优均衡重复剔除劣战略的占优均衡”。说明说明:1)需知道其他人支付信息需知道其他人支付信息.2)如果重复剔除后的战略组合不唯一,该博弈就不是如果重复剔除后的战略组合不唯一,该博弈就不是重复剔除占优可解的。重复剔除占优可解的。35
37、35例例4 支付如下支付如下(5,5)(6,7)(2,4)(1,2)(1,5)(4,1)(4,2)(5,3)(1,2)参与人参与人1参与人参与人2 LK RHNU经过重复剔除劣战略后得到(经过重复剔除劣战略后得到(R,N)。)。3636例例4 支付如下支付如下(5,5)(6,7)(2,4)(1,2)(1,5)(4,1)(4,4)(5,3)(1,2)参与人参与人1参与人参与人2 LK RHNU经过重复剔除劣战略后剩余的战略组合不唯一经过重复剔除劣战略后剩余的战略组合不唯一,所以不所以不存在重复剔除劣战略占优均衡存在重复剔除劣战略占优均衡.3737由于占优均衡一定是重复剔除劣战略后唯一组合由于占优
38、均衡一定是重复剔除劣战略后唯一组合,所以占优均衡所以占优均衡一定是重复剔除劣战略占优均衡一定是重复剔除劣战略占优均衡,但反之不成立但反之不成立.囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖占优均衡与重复剔除劣战略占优均衡有何关系占优均衡与重复剔除劣战略占优均衡有何关系?所以重复剔除劣战略占优均衡比占优均衡要求低所以重复剔除劣战略占优均衡比占优均衡要求低,稳定性更弱稳定性更弱.但现实中重复剔除劣战略占优均衡也可能不存在但现实中重复剔除劣战略占优均衡也可能不存在,是否还可能有是否还可能有其他均衡呢其他均衡呢?3838参与人参与人2 (4
39、,1)(2,0)(3,5)(4,8)参与人参与人1 M L R K上述博弈不存在占优均衡和重复剔除劣战略的占优均衡。上述博弈不存在占优均衡和重复剔除劣战略的占优均衡。下面考察战略组合(下面考察战略组合(L,K)。给定参与人)。给定参与人2选择选择K,L是是参与人参与人1的最优战略。反个来,给定参与人的最优战略。反个来,给定参与人1选择选择L,K是是参与人选择的最优战略。(参与人选择的最优战略。(L,K)是博弈双方不愿意偏)是博弈双方不愿意偏离的战略,即达到相对稳定。该战略组合也是一种合理均离的战略,即达到相对稳定。该战略组合也是一种合理均衡。这正是后面所要讲的纳什均衡衡。这正是后面所要讲的纳什
40、均衡.39394 纳什均衡纳什均衡参与人参与人2 (4,1)(2,0)(3,5)(4,8)参与人参与人1 M L R K(L,K)是纳什均衡)是纳什均衡.纳什均衡的含义就是:纳什均衡的含义就是:给定你的策略,我的策略是最好的策略;给定我给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。在给定的策略下不愿意调整自己的策略。4040 纳什均衡数学表述:任何参与人都不愿意偏离的战略组合,纳什均衡数学表述:任何参与人都不愿意偏离的战略组合,即对于一个战略组合即对于一个战略组合 ,若,若),(
41、*2*1nsssiSsssussuiiiiiiii对任意,),(),(*,称战略组合,称战略组合),(*2*1nsss为纳什均衡。为纳什均衡。纳什均衡是各博弈方都不愿意单独改变的战略的组合。纳什均衡是各博弈方都不愿意单独改变的战略的组合。4141囚徒囚徒A囚徒囚徒B -1, -1 -10, 0 0, -10 -8,-8坦白坦白抵赖抵赖坦白坦白抵赖抵赖参与人参与人1参与人参与人2ABCD 1, 5 0,2 -5, 0 2, 5纳什均衡有两个纳什均衡有两个4242由于重复剔除劣战略均衡将劣战略都删除了由于重复剔除劣战略均衡将劣战略都删除了,剩余的战略不可能剩余的战略不可能是劣战略是劣战略(相对于对
42、方的剩余战略相对于对方的剩余战略),最后相对于剩余的战略都是最最后相对于剩余的战略都是最优的优的,所以重复剔除劣战略均衡一定是纳什均衡所以重复剔除劣战略均衡一定是纳什均衡.重复剔除劣战略的占优均衡与纳什均衡有何关系重复剔除劣战略的占优均衡与纳什均衡有何关系?4343 纳什均衡求解方法:划线法纳什均衡求解方法:划线法划线法的基本思路是:划线法的基本思路是:(1)针对对方(参与人)针对对方(参与人B)所给的战略,找出一个参)所给的战略,找出一个参与人与人A的最优战略,并在对应的支付上划一横线,(的最优战略,并在对应的支付上划一横线,(2)针对参与人针对参与人A所给的战略,找出一个所给的战略,找出一
43、个参与人参与人B的最优战略,并在对应的支付上划一横线,的最优战略,并在对应的支付上划一横线,(3)支付均划有横线所对应的战略组合即为纳什均衡。)支付均划有横线所对应的战略组合即为纳什均衡。4444例例 市场进入博弈市场进入博弈 有一个垄断者巳在市场上(称为在位者);另有一个垄断者巳在市场上(称为在位者);另个企业个企业想进入想进入(称为进入者)。进入者有两个战略可以选择:进入和称为进入者)。进入者有两个战略可以选择:进入和不进入;在位者也有两个可选择的战略:默许(共享寡头利不进入;在位者也有两个可选择的战略:默许(共享寡头利润)和斗争(假设采取成本价销售,即低价战略)。假定进润)和斗争(假设采
44、取成本价销售,即低价战略)。假定进入之前的垄断利润为入之前的垄断利润为300,进入之后寡头利润为,进入之后寡头利润为100(各得(各得50),进入成本为),进入成本为10。各种战略组合的支付矩阵如下:。各种战略组合的支付矩阵如下:进入者进入者在位者在位者进入进入不进入不进入默许默许斗争斗争 0, 300 0, 300 -10, 0 40, 50由划线法可得两个纳什均衡由划线法可得两个纳什均衡:(进入,默许(进入,默许)和和(不进入,斗争)不进入,斗争)。45456 纳什均衡的应用纳什均衡的应用例例 1 古诺寡头竞争模型(古诺寡头竞争模型(Cournot,1838)有两个参与人,分别称为企业有两
45、个参与人,分别称为企业1和企业和企业2,每个企业的,每个企业的战略是选择产量;支付是利润,是两个企业产量的函数。战略是选择产量;支付是利润,是两个企业产量的函数。利润为个企业的为价格。第)(成本函数,个企业的)代表第(个企业的产量,代表用iPqqPPiqCiqii,212 , 1),()(),(2121iqCqqPqqqiiii4646找出纳什均衡的找出纳什均衡的个办法是对每个企业的利润函数求一阶个办法是对每个企业的利润函数求一阶导数并令其等于导数并令其等于零零:2 , 1),()(),(2121iqCqqPqqqiiii0)()()(0)()()(222122121112112111qCqq
46、PqqqPqqCqqPqqqPq4747上述两个方程分别定义了两个反应函数:上述两个方程分别定义了两个反应函数:112221()()qR qqR qq2)(21qR)(12qRNE*2q1q*1q4848 为了得到更具体的结果,我们来考虑上述模型的简单情况。为了得到更具体的结果,我们来考虑上述模型的简单情况。假设成本函数为假设成本函数为,)(,)(222111cqqCcqqC需求函数为需求函数为)(21qqaP0)(0)(221121cqqqacqqqa两个一阶条件方程两个一阶条件方程为为112112111112212222()()()0()()()0P qqq P qqC qqP qqq P
47、 qqC qq4949反应函数为:反应函数为:112222111()()21()()2qR qaqcqR qaqc联立解两个反应函数得纳什均衡为:联立解两个反应函数得纳什均衡为:)(31*2*1caqq5050每个企业的纳什均衡利润为每个企业的纳什均衡利润为2*2*12*2*11)(91),(),(caqqqq为了与垄断情况作比较,让我们计算一下垄断企业的最优产为了与垄断情况作比较,让我们计算一下垄断企业的最优产量和均衡利润。垄断企业的问题是:量和均衡利润。垄断企业的问题是:2 , 1),()(),(2121iqCqqPqqqiiii5151)(cQaQMaxQ)(32)(21*2*1caqq
48、caQ由一阶条件得企业的最优产量为由一阶条件得企业的最优产量为22)(92)(41*caca企业的垄断利润为企业的垄断利润为寡头竞争的总产量大于垄断产量的原因是在于每个企业在选择寡头竞争的总产量大于垄断产量的原因是在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另自己的最优产量时,只考虑对本企业利润的影响,而忽视对另 一个企业的外部负效应。这是典型的囚徒困境。一个企业的外部负效应。这是典型的囚徒困境。5252假定企业没有生产能力的限制。如果企业的生产能力是有假定企业没有生产能力的限制。如果企业的生产能力是有限的,它就无法供应整个市场,价格也不会降到边际成本的限的,它就无法
49、供应整个市场,价格也不会降到边际成本的水平上。水平上。 假定企业生产的产品是完全替代品。如果企业生产的产品假定企业生产的产品是完全替代品。如果企业生产的产品不完全相同,就可以避免直接的价格竞争。不完全相同,就可以避免直接的价格竞争。例例2 豪泰林豪泰林(Hotelling)价格竞争模型价格竞争模型“伯川兰德悖论伯川兰德悖论”(Bertrand Paredox):对于完全可以替代的产品,即使只有两个企业,在对于完全可以替代的产品,即使只有两个企业,在均衡情况下,价格等于边际成本,企业的利润为零,均衡情况下,价格等于边际成本,企业的利润为零,与完全竞争市场均衡一样。与完全竞争市场均衡一样。伯川德模
50、型存在以下两方面的问题:伯川德模型存在以下两方面的问题: 5353空间上的差异空间上的差异,即经典的豪泰林(即经典的豪泰林(hotelling)模型模型.产品在物质性能上是相同的,但在空间位置上有产品在物质性能上是相同的,但在空间位置上有差异。因为不同位置上的消费者要支付不同的运差异。因为不同位置上的消费者要支付不同的运输成本。输成本。解决办法之一是引入解决办法之一是引入产品的差异性。产品的差异性。5454 假定假定:1.有一个长度为有一个长度为1的线性城市,消费者均匀地分布在的线性城市,消费者均匀地分布在0,1区间里,分布密度为区间里,分布密度为1。2.有两个商店分别位于城市的两端,商店在有
51、两个商店分别位于城市的两端,商店在x=0,商店,商店2住住xl,出售物质性能相同的产品。,出售物质性能相同的产品。3.每个商店提供单位产品的成本为每个商店提供单位产品的成本为 c,4.消费者购买商品的旅行成本与离商店的距离成比例,单消费者购买商品的旅行成本与离商店的距离成比例,单位距离的成本为位距离的成本为t。这样,住在。这样,住在x的消费者如果在商店的消费者如果在商店1采采购,要花费购,要花费 t x 的旅行成本;如果在商店的旅行成本;如果在商店2采购,要花费采购,要花费 t (1一一x)。假定消费者具有单位需求,即消费。假定消费者具有单位需求,即消费1个单位。个单位。5555令令 为商店为
52、商店i的价格,的价格, 为需求函数。如果住在为需求函数。如果住在x的消的消费者在两个商店之间是无差异的那么,所有住在费者在两个商店之间是无差异的那么,所有住在x左边的将左边的将都在商店都在商店1购买,而住在购买,而住在x右边的将在商店右边的将在商店2购买购买 ,需求分别为,需求分别为ip),(21ppDi满足满足xxDxD.1,21)1 (21xtptxpttppxppDttppxppD2122121212211),(),(由此式得需求函数为5656利润函数为:)(21),()(),(1212111211tppcptppDcppp)(21),()(),(2122122212tppcptppDc
53、ppp020221221211ptcppptcpp5757020221221211ptcppptcpp解上述方程组得(纳什么均衡):解上述方程组得(纳什么均衡):tcpp*2*1各企业的利润为(均衡利润):各企业的利润为(均衡利润):221t5858结论结论1:由于两个企业的产品在空间位置存在差异,即由于两个企业的产品在空间位置存在差异,即旅行成本的差异。旅行成本越大,产品差异就越大,旅行成本的差异。旅行成本越大,产品差异就越大,均衡利润也就越高。均衡利润也就越高。结论结论2:当旅行成本为零时,不同商店的产品之间具有当旅行成本为零时,不同商店的产品之间具有完全的替代性,没有任何一个商店可以把价
54、格定得高完全的替代性,没有任何一个商店可以把价格定得高于成本,我们得到伯川德均衡结果。于成本,我们得到伯川德均衡结果。tcpp*2*1221t5959*12()ppcba t需求函数分别为:需求函数分别为: 更为一般地,我们可以讨论商店位于任何位置的情况。假更为一般地,我们可以讨论商店位于任何位置的情况。假定商店定商店1位于位于a,商店商店2位于位于b2111212212(,)22(,)22ppbaDppxatppbaDppbxt纳什均衡为:纳什均衡为:2122ppabxt6060当当0,1ab即为第一种情况:即为第一种情况:tcpp) 1 , 0() 1 , 0(*2*1当当ab*12ppc
55、两个商店位于同一个位置两个商店位于同一个位置x。此时,伯川兰德均衡。此时,伯川兰德均衡是唯一的均衡:是唯一的均衡:0,2121cpp*12()ppcba t6161例例3 3 公共地的悲剧公共地的悲剧这个例子证明,如果一种资源没有排他性的所有权,就这个例子证明,如果一种资源没有排他性的所有权,就会导致对这种资源的过度使用会导致对这种资源的过度使用 考虑一个有考虑一个有n个农民的村庄共同拥有一片草地,每个农个农民的村庄共同拥有一片草地,每个农民都有在草地上放牧的自由。每年春天,每个农民要民都有在草地上放牧的自由。每年春天,每个农民要决定自己养多少只羊。决定自己养多少只羊。1,2, ;in12.n
56、iiGg代表代表n个农民饲养的总数量;个农民饲养的总数量;), 0ig.用用 ,代表第代表第i个农民饲养的数量,个农民饲养的数量,62623.v代表每只羊的平均价值。代表每只羊的平均价值。 当当 v是是G的函数,的函数, 假设:假设:( )v v G最大可存活最大可存活的数量的数量: maxGmaxGG 当当 0)(Gv0)(,maxGvGG假定:假定: 0, 022GvGvmaxGGv每只羊的价值随每只羊的价值随饲养总数量的增饲养总数量的增加而下降加而下降6363在这个博弈里,每个农民的问题是选择在这个博弈里,每个农民的问题是选择ig以最大化自己的利润。假定购买一只小羊羔的价格以最大化自己的
57、利润。假定购买一只小羊羔的价格为为c,那么,利润函数为:那么,利润函数为: nicggvggggijinii, 2 , 1,)(),(1最优化的一阶条件是:最优化的一阶条件是:nicGvgGvgiii, 2 , 1, 0)()(6464因为因为222( )( )( )0( )( )0iiiiiijv Gv Gg v Ggv Gg v Gg g nicGvgGvgiii, 2 , 1, 0)()(2220iijiijiggggg 所以所以 即第即第i个农民的最优饲养量随其它农民的饲养量的增加个农民的最优饲养量随其它农民的饲养量的增加递减递减 6565N个反应函数的交叉点就纳什均衡:个反应函数的交
58、叉点就纳什均衡: ),(*1*nigggg纳什均衡的总饲养量为纳什均衡的总饲养量为 niigG1*将将n个一阶条件个一阶条件相加,得到:相加,得到:cGvnGGv)()(*()()0,1,2,iiiv Gg v Gcing-9.236666社会最优的目标是最大化如下定义的社会总剩余价值:社会最优的目标是最大化如下定义的社会总剩余价值: GcGMaxGvG)(最优化的一阶最优化的一阶条件为:条件为: cGvGGv*)*(*)*(*()()Gv Gv Gcn比较:(*)*(*)v GcGv G*()()Gv Gcv Gn比较:*GG如果,导致矛盾比较社会最优的一阶条件与个人最比较社会最优的一阶条件
59、与个人最优的一阶条件可以看到优的一阶条件可以看到 :*GG这就是公共地的悲剧。这就是公共地的悲剧。6868()104,3,4vv GG nc假设123( )( )0,1,2,104()( 1)40,25iiiiiv Gg v Gcingggggg1(,)(),25 2925 4625,1875,75iinijigggg vgg cGLL总利润为(*)* (*)104( 1)4,50v GGv GcGGG( )( )50 5450 42500GGV GGc不合作情形不合作情形合作情形合作情形6969 例例1 每一参与人拿有一枚硬币并必须选择是出正每一参与人拿有一枚硬币并必须选择是出正面向上还是反
60、面向上。若两枚硬币是一致的面向上还是反面向上。若两枚硬币是一致的(即全部即全部正面向上或全部反面向上正面向上或全部反面向上),则参与人,则参与人2赢走参与人赢走参与人1的硬币;如果两枚硬币不一致的硬币;如果两枚硬币不一致(一正一反一正一反),参与人,参与人1赢得参与人赢得参与人2的硬币。支付如下:的硬币。支付如下:在许多博弈模型中可能不存在纳什均衡,如下例。在许多博弈模型中可能不存在纳什均衡,如下例。参与人参与人1参与人参与人2 -1, 1 1,-1 1,-1 -1, 1正面正面反面反面正面正面反面反面7 混合战略纳什均衡混合战略纳什均衡由划线法可知,该博弈不存在纳什均衡。所以采取纯由划线法可
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 湖南农业大学《中国古典舞基训(一)》2021-2022学年第一学期期末试卷
- 湖南科技学院《广告设计与创意》2022-2023学年第一学期期末试卷
- 中学体育课件教学
- 毛中特第四章课件
- 2024至2030年中国车架用刹车座行业投资前景及策略咨询研究报告
- 2024至2030年中国矩管行业投资前景及策略咨询研究报告
- 2024至2030年中国月饼生产线行业投资前景及策略咨询研究报告
- 2024年中国高纯水处理设备市场调查研究报告
- 2024至2030年中国瓶盖消毒柜行业投资前景及策略咨询研究报告
- 2024至2030年中国小型中央空调控制系统行业投资前景及策略咨询研究报告
- T-CPHA 20-2023 集装箱起重机远程控制F5G网络系统技术要求
- 妇幼保健院健康宣教
- 湖南省长沙市湘郡金海2022年小升初考试语文试卷1
- 2024年同等学力人员申请硕士学位外国语水平全国统一考试
- 2024年全国初中数学联赛试题及答案(修正版)
- 解读2022年《全国护理事业发展规划(2021-2025年)》课件
- 谈谈如何做好科研工作课件
- b超室年终工作总结
- 《微小血管吻合技术》课件
- 6G网络关键技术与系统架构研究
- 城市综合管廊工程投资估算指标(完整版)
评论
0/150
提交评论