版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、课程设计(论文)经济博弈论课程PBL教学模式研究报告题目:城市经济合作与发展的博弈摘要本研究报告采用完全和不完全信息静态博弈和完全和不完全信息动态博弈来研究城市经济发展与合作的关系。通过建立囚徒困境模型、Stackelberg模型和古诺模型,分析了完全信息和非对称信息条件下城市间的战略选择。同时研究如何走出囚徒困境,进而分析促进城市间合作的各种机制。本报告主要包括四个部分。第一部分简要介绍了本报告的基本内容和背景。第二部分阐述了相关博弈理论和相关模型。第三部分是建立各种模型分析城市间合作与竞争的战略选择。第四部分是关于如何走出囚徒困境,促进城市间的合作。关键词:完全信息,不完全信息,城市产业,
2、古诺模型,囚徒困境目录TOC o 1-3 h z u HYPERLINK l _RefHeading_Toc421043871 第一章绪论5 HYPERLINK l _RefHeading_Toc421043872 1.1城市合作发展的背景与意义5 HYPERLINK l _RefHeading_Toc421043873 1.2问题的国外研究现状6 HYPERLINK l _RefHeading_Toc421043878 1.3研究容9 HYPERLINK l _RefHeading_Toc421043879 1.3.1基于完全信息静态博弈模型的城市产业发展分析9 HYPERLINK l _R
3、efHeading_Toc421043880 1.3.2基于完全信息动态博弈模型的城市产业发展分析9 HYPERLINK l _RefHeading_Toc421043881 1.3.3基于不完全信息静态博弈模型的城市产业发展分析9 HYPERLINK l _RefHeading_Toc421043882 1.3.4基于不完全信息动态博弈模型的城市产业发展分析9 HYPERLINK l _RefHeading_Toc421043883 第二章博弈论的相关理论9 HYPERLINK l _RefHeading_Toc421043884 2.1博弈论的基本概念9 HYPERLINK l _RefH
4、eading_Toc421043885 2.2完全信息静态博弈的基本概念和基本模型11 HYPERLINK l _RefHeading_Toc421043886 2.3完全信息动态博弈的基本概念和基本模型12 HYPERLINK l _RefHeading_Toc421043887 2.4不完全信息静态博弈的基本概念和基本模型15 HYPERLINK l _RefHeading_Toc421043888 2.5不完全信息动态博弈的基本概念和基本模型16 HYPERLINK l _RefHeading_Toc421043889 第三章基于完全信息的城市合作与竞争博弈的分析18 HYPERLINK
5、 l _RefHeading_Toc421043890 3.1基于完全信息静态博弈合作与竞争的分析19 HYPERLINK l _RefHeading_Toc421043891 3.1.1问题阐述19 HYPERLINK l _RefHeading_Toc421043892 3.1.2模型求解分析19 HYPERLINK l _RefHeading_Toc421043893 3.1.3结论20 HYPERLINK l _RefHeading_Toc421043894 3.2基于完全信息动态博弈合作与竞争的分析20 HYPERLINK l _RefHeading_Toc421043895 3.2
6、.1 问题阐述21 HYPERLINK l _RefHeading_Toc421043896 3.2.2 模型分析21 HYPERLINK l _RefHeading_Toc421043897 3.2.3 应用Stackelberg寡头竞争模型21 HYPERLINK l _RefHeading_Toc421043898 3.2.4结论:23 HYPERLINK l _RefHeading_Toc421043899 第四章基于不完全信息的城市合作与竞争博弈的分析23 HYPERLINK l _RefHeading_Toc421043900 4.1基于不完全信息静态博弈合作与竞争的分析24 HY
7、PERLINK l _RefHeading_Toc421043901 4.1.1问题阐述24 HYPERLINK l _RefHeading_Toc421043902 4.1.2 模型求解分析24 HYPERLINK l _RefHeading_Toc421043903 4.1.3 结论26 HYPERLINK l _RefHeading_Toc421043904 4.2基于不完全信息动态博弈合作与竞争的分析26 HYPERLINK l _RefHeading_Toc421043905 4.2.1 问题阐述27 HYPERLINK l _RefHeading_Toc421043906 4.2.
8、2 模型求解分析27 HYPERLINK l _RefHeading_Toc421043907 4.2.3结论31 HYPERLINK l _RefHeading_Toc421043908 第五章走出囚徒困境无限次重复性博弈32 HYPERLINK l _RefHeading_Toc421043909 5.1无限次重复博弈33 HYPERLINK l _RefHeading_Toc421043910 5.1.1模型分析选择合作33 HYPERLINK l _RefHeading_Toc421043911 5.1.2合作与重复性博弈的关系33 HYPERLINK l _RefHeading_To
9、c421043912 5.1.3认识无限次重复性博弈34 HYPERLINK l _RefHeading_Toc421043913 5.2无限重复古诺模型与其均衡分析35 HYPERLINK l _RefHeading_Toc421043914 5.2.1无限重复古诺模型35 HYPERLINK l _RefHeading_Toc421043915 5.2.2无限重复古诺模型的均衡分析35 HYPERLINK l _RefHeading_Toc421043916 5.2.3结论37 HYPERLINK l _RefHeading_Toc421043917 第六章走出囚徒困境的其他方法38 HY
10、PERLINK l _RefHeading_Toc421043918 6.1政府干预途径38 HYPERLINK l _RefHeading_Toc421043919 6.1.1 问题描述39 HYPERLINK l _RefHeading_Toc421043920 6.1.2 模型分析39 HYPERLINK l _RefHeading_Toc421043921 6.1.3 结论39 HYPERLINK l _RefHeading_Toc421043922 6.2外部性制度的改革40 HYPERLINK l _RefHeading_Toc421043923 6.2.1 现状阐述40 HYPE
11、RLINK l _RefHeading_Toc421043924 6.2.2 具体措施40 HYPERLINK l _RefHeading_Toc421043925 6.2.3 结论41 HYPERLINK l _RefHeading_Toc421043926 6.3第三方城市进入42 HYPERLINK l _RefHeading_Toc421043927 6.3.1新增前提假设42 HYPERLINK l _RefHeading_Toc421043928 6.3.2博弈模型的建立42 HYPERLINK l _RefHeading_Toc421043929 6.3.3分析43 HYPERL
12、INK l _RefHeading_Toc421043930 6.3.4结论44 HYPERLINK l _RefHeading_Toc421043931 6.4建立战略联盟44 HYPERLINK l _RefHeading_Toc421043932 6.4.1问题阐述45 HYPERLINK l _RefHeading_Toc421043933 6.4.2假设与分析45 HYPERLINK l _RefHeading_Toc421043934 6.4.3结论45 HYPERLINK l _RefHeading_Toc421043935 第七章结论45第一章导言1.1城市合作发展的背景和意义
13、第二次世界大战后,区域经济一体化成为世界发展的趋势,发达国家也把发展城市群作为国家经济实力发展战略。随着中国区域经济一体化的不断深入,城市合作和城市化战略已成为许多周边城市降低交易成本、提高核心竞争力、实现互利共赢的必然选择。探索适合中国国情和区域发展的城市合作模式势在必行。与此同时,全球化和区域竞争导致了广泛的城市合作做法。城市合作是特定区域空间中城市共生和演化的动态过程。城市合作的形成和发展是各种环境因素和历史因素影响下各种行为体互动博弈的结果。1中国发展的步伐越来越快,城市的规模越来越大,城市人口迅速膨胀。中国改革开放以来,初步形成了三大城市群的经济合作,即长三角城市群、珠三角城市群和京
14、津唐城市群。目前在建的国家级城市群主要有五大城市群,包括长三角城市群、珠三角城市群、京津冀城市群、长江中游城市群和成渝城市群。近年来,随着中国自贸区建设,长三角各大城市将根据不同区域、不同经济发展阶段,加强产业协同升级,搭建平台,促进人、财、物、信息等区域要素合理流动。加强对区域人口、土地、能源效率、投资等数据的分析监测,建立专家库,为长三角新型城镇化建设提供决策依据。通过长三角新型城镇化站点的研究和建设,促进长三角产业和城镇的有效融合,推动城镇化和新农村建设的协调推进。一带一路正式提出,随着基础设施建设,特别是高铁等交通设施的建设,中国城市的经济区域一体化和城市群的发展进程将继续推进。随着西
15、北和西南地区交通条件的改善,城市经济和城市群的区域一体化进程将更加迅速。在这个发展过程中,虽然促进了经济发展,改善了人们的生活环境,但也带来了许多困难和问题,如污染、失业、住房困难、交通堵塞等。另一方面,随着全球一体化的发展,城市在国际关系中的地位越来越重要,城市之间的交流与合作越来越密切,城市之间的合作与发展越来越重要。1.2国外对该问题的研究现状从总体上看,城市经济合作与发展的研究经历了从均衡发展到非均衡发展、从非均衡发展到非均衡协调发展的变化过程。区域经济理论的起源可以追溯到19世纪初创立的区位理论。德国经济学家图恩(Tunen,1886)从区域地租的角度探讨了不同土地价格导致的农业区划
16、现象,创立了农业区位理论,从而奠定了区位经济学的学科基础。20世纪初,随着资本主义的发展和垄断的出现,德国经济学家韦伯(Weber,1909)提出了工业区位理论。20世纪30年代,德国地理学家克里斯塔勒(Christaller,1933)通过研究村庄和区位,提出了中心理论。然后德国经济学家Losch,1940)利用Cristas的理论框架,将中心地理论发展为产业的市场区位理论,并由此开始形成相对完整的理论体系2。区域经济发展初始阶段理论是由埃德加胡佛和约瑟夫费希尔提出的。胡佛和费希尔指出,任何地区的经济发展都有一个“标准的阶段序列”。这个标准的阶段序列是指:区域自给自足的经济发展阶段;地区间贸
17、易和手工业发展阶段;区域农产品专业化发展阶段;区域工业化发展阶段;区域第三产业发展阶段。美国经济学家罗斯托认为,一个地区的经济增长一般经历以下六个阶段:以传统农业为主的地区经济发展初级阶段;以经济崛起所需的各种条件的形成为标志的区域经济起飞的准备阶段;以重要工业部门的出现为标志的区域经济起飞阶段;以现代技术浪潮和更大的经济活动为标志的区域经济正在走向成熟;以经济资源日益集中于耐用消费品生产为标志的区域性高消费阶段;以服务业发展为标志的区域追求生活质量阶段。美国经济学家约翰弗里德曼受罗斯托经济增长阶段理论的影响,用实例论证了区域经济增长从不平衡到平衡的过程,提出了空间组织阶段理论。他认为“区域经
18、济的持续增长促进了空间经济向一体化发展”3。上世纪四五十年代,著名发展经济学家罗森斯坦拉顿(1943)在传统发展经济学的经济增长理论基础上提出了大推动理论4。大推理论考虑了经济增长、生产函数、需求和储蓄供给这三个不可分割的方面,却忽略了经济学所强调的资源的稀缺性。后来,美国经济学家诺斯(1955)提出了出口基础理论5,并从扩大外生需求是增长的主要动力这一主要观点出发,论证了区域均衡发展的可行性。法国经济学家佩鲁(Perroux,1950)提出了增长极理论,其中主要关注的是优势产业的发展,即增长极,通过外部经济和产业的乘数效应促进其他产业的发展6。增长极理论只强调了增长极的正面影响,而忽略了其负
19、面影响。Myrdal(1957)提出了“地理二元结构”理论,但其认为,由于“累积因果循环”,经济发展的不平衡会扩大地区经济差距7。美国经济学家Hirschman(1958)利用集聚经济的“核心-边缘”理论,提出在区域发展不平衡的条件下,会形成区域发展的核心区和边缘区8。青(1994)指出,我国区域经济研究的热点问题主要包括布局原则、宏观区域发展战略、区域局部发展战略、区域产业区域经济管理体制、区域市场发育和区域经济协调发展等方面的研究9。夏玉龙和支军(1982)提出了梯度发展战略。他们指出,由于历史、自然、社会等原因,中国区域经济技术发展不平衡,中国生产力的空间还在继续。我们应该认清这个客观梯
20、度,因势利导,让梯度高的东部地区掌握先进技术,然后逐步向梯度低的中西部地区转移。鲁大道(1984)根据区位论和“空间结构论”的基本原理提出了点轴发展理论(点轴发展理论最早由波兰经济学家扎伦巴和马里斯提出。中国的点轴发展模式最初是由中国科学院地理研究所开发的。 HYPERLINK ./%20%20%20%20:/baike.baidu%20%20%20%20/view/242954.htm t _blank 陆大道并提出了系统的阐述)。点轴发展是指围绕全国或区域,确定若干层次的具有良好发展条件的线性基础设施轴线,并在轴线地带重点发展若干个点中心城市。中国应重点发展沿海轴和长江轴,形成“T”型战略
21、布局。关于中国城市圈的研究,高汝溪定义了“都市经济圈”,他认为“都市经济圈是以经济相对发达的城市为中心,通过 HYPERLINK ./:/wiki.mbalib 经济辐射,带动周边城市和农村形成统一 HYPERLINK ./%20%20%20%20:/wiki.mbalib%20%20%20%20/wiki/ 生产和 HYPERLINK ./:/wiki.mbalib 循环经济网络”。阎雪峰(1986)和徐秉文(1987)先后提出了“”的发展战略。这一理论的主要思想是,除了“一”和“L”(沿海地区和长江流域),国家发展重点还应把陇海-蓝欣作为另一个“”形发展轴。顾朝林(1987)结合我国实际提
22、出 HYPERLINK ./%20%20%20%20:/baike.baidu%20%20%20%20/subview/427944/427944.htm t _blank 城镇体系规划理论“三结构一网络”(地域空间结构、等级规模结构、功能类型结构和城市网络体系)对于城市规划来说, HYPERLINK ./%20%20%20%20:/baike.baidu%20%20%20%20/subview/3498681/3498681.htm t _blank 区域经济规划部门被广泛使用。侯凯(1995)提出了网络发展理论。他认为,区域经济的发展是一个动态过程,表现为增长极发展、点轴发展、网络发展三个
23、不同阶段。任何一个区域经济的发展,总是从某个点开始,然后在空间上沿着某个轴延伸。厉以宁(2000)针对现实中社会经济发展的不平衡,提出了中心辐射战略。程春(2008)在借鉴计算机双核之间的连接与分工机制的基础上,提出了城市群之间的连接与分工机制,力求为城市群尤其是京津冀城市群提供一定的理论和实施策略指导。根据现有文献可以看出,目前学术界关于城市产业合作与竞争的文献大多是基于宏观视角来研究城市群的产业结构和产业发展,研究视角是针对整个城市群的。在目前的研究中,从城市群中单个城市的角度研究产业发展的很少。1.3研究能力1.3.1基于完全信息静态博弈模型的城市产业发展分析通过对双城经济竞争博弈模型的
24、分析,将结果与“囚徒困境”博弈进行比较,从而检验双城的机会主义行为是否会使双方在一场博弈中陷入“囚徒困境”。1.3.2基于完全信息动态博弈模型的城市产业发展分析基于完全信息下绝对优势产业的动态博弈分析,分析了不同博弈情况下各城市的产业收入。1.3.3基于不完全信息静态博弈模型的城市产业发展分析假设每个参与城市拥有一个产业,两个城市的产业发展水平相同。本文利用库诺特模型研究了不完全信息下两市的静态博弈,进而求解并分析了两市的战略选择。1.3.4基于不完全信息动态博弈模型的城市产业发展分析在一维动态博弈的基础上,假设有两个城市,其中一个是占主导地位的市场垄断者,另一个是进入者,利用市场阻塞进入的博
25、弈模型求解并分析两个城市的最优策略。1.3.5走出囚徒困境的方法和分析通过查阅资料,结合书本知识,分析如何走出囚徒困境,进而代入本课题的研究,分析如何打破城市之间的竞争,促进双方合作,实现共赢。第二章是博弈论的相关理论。2.1博弈论的基本概念博弈论又称博弈理论,主要研究每个决策主体如何根据自己的能力和掌握的信息,做出有利于自己或决策者的理论。博弈论的基本概念包括游戏参与者、行动、信息、策略、支付(效用)、结果和均衡。其中,参与者、策略和支付构成了游戏的三大基本要素,也是游戏不可或缺的主要要素。(1)游戏者,又称玩家或游戏中的玩家,是指游戏中的决策主体,他根据自己的利益决定自己的行为。参与者可以
26、是自然人,也可以是各种社会组织,如企业、家庭、协会、政府等。一般用表示。为了分析方便,在博弈论中“自然”作为“虚拟参与人”来处理。这里,“自然”是指决定外生的随机变量的概率分布的机制。(2)行动(actions or moves),是参与人在博弈时的决策变量。一般用表示第个参与人的一个决策,表示第个参与人的决策集合。(3)信息(information),是参与人关于博弈的知识,如博弈规则以与其他参与人的特征、行动和选择的知识。信息集包含参与人有关其他参与人之前行动的知识。(4)战略(strategy),是参与人在博弈中选择行动的规则,它说明参与人在什么时候选择什么行动,称为“相机行动方案”。一
27、般用表示第参与人的一个战略,表示第参与人所有可选择的战略集合。(5)支付(payoff),是参与人从博弈中获得的效用水平,或者是期望效用水平,所以是参与者最关心的事情。参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择,一般用表示第参与人的效用。由于博弈参与者决策的相互影响,它是所有参与人战略选择的函数,即。(6)结果(outcome),是博弈分析者所感兴趣的所有东西,如均衡战略组合、均衡行动组合、均衡支付组合等。(7)均衡(equilibrium),是所有参与人的最优战略或行动组合,一般记为,其中表示第参与人在均衡情况下的最优战略,它是的所有可能的战略中使效用或期望效用
28、最大化的战略。在博弈论里,有各种各样的均衡概念,这里给出的是所有均衡概念的共同特征。博弈论根据参与者在博弈中的行为是否达成有约束力的协议,可以分为合作博弈和非合作博弈。如果达成有约束力的协议,就是合作博弈;反之,就是非合作博弈。根据游戏的时间或参与者的动作顺序,游戏可分为静态游戏和动态游戏。根据博弈双方的信息知识,博弈可以分为完全信息博弈和不完全信息博弈。根据收益的分配,游戏可以分为零和游戏和非零和游戏。2.2完全信息静态博弈的基本概念和基本模型1.完整的资料是指自然动作不是第一个或者自然初始动作被所有参与者准确观察到的情况,即事前没有不确定性。2.静态意思是所有参与者同时选择动作,只能选择一
29、次。3.完整的信息是静态的完全静态信息博弈是整个非合作博弈的基础。它将现实游戏形式中最基本的组成部分抽象出来形成数学模型,从而描述游戏者的理性行为,并进一步将其扩展为更复杂的游戏模型。完全信息静态博弈是最简单的博弈,每个人在不知道其他参与者行动的情况下选择自己的行动,策略和实际行动是一回事。例子:囚徒困境博弈模型b囚犯承认否认8,80 ,1010 , 01,1坦白的囚犯的否认4.战略方法策略表达式也叫标准表达式。在这个表达式中,所有参与者同时选择自己的策略,所有参与者选择的策略共同决定了每个参与者的支付。战略声明必须明确陈述以下三点:(1)游戏参与者集合:I r r = 1,2,3 n(2)每
30、个参与者的策略空间:si i = 1,2,3 n(3)每个参与者的支付功能:UI (S1、S2、S3.SN) I = 1,2,3.n一般为:g = (S1,.sn;U1,.UN)是指策略性描述的游戏。5.纳什均衡一、主导战略一个玩家的最优策略不依赖于其他玩家的策略选择,即无论其他玩家选择什么策略,他的最优策略都是唯一的,这样的最优策略称为“优势策略”。重复淘汰不良策略首先找出一个玩家的不良策略,消除这个不良策略,在没有消除策略的情况下重建一个新游戏。然后消除这个新博弈中一个参与者的不良策略;继续这个过程,直到只剩下一个独特的战略组合。唯一剩下的策略组合就是这个博弈的均衡解。纳什均衡的正式定义:
31、在一个有n个玩家的策略表达式博弈中,G=S1,Sn;U1,un,战略组合S1*,Sn*是一个纳什均衡。如果对于每个I,Si*是给定其他参与者选择的第I个人的最优策略S1*,S*i-1,S*i+1,Sn*,即UI。2.3完全信息动态博弈的基本概念和基本模型完全信息动态博弈基本概念所谓动态博弈,就是参与者的行动是有序的,后来者可以在自己行动之前观察先行者的行动。在博弈论中,扩展表达式通常用于描述和分析动态博弈。动态博弈的扩展表达包括以下要素:参与者集合:I = 1,2,.,n,另外我们会用n来表示虚拟参与者“自然”;参与者的行动顺序:谁将在何时行动;参与者的行动空间:参与者在每个行动中有哪些选择;
32、参与者的信息集:参与者每次行动都知道什么;参与者的支付功能;行动结束后每个参与者得到什么(支付是所有行动的函数);外源事件的概率分布(即自然选择)树博弈和子博弈正如两人有限策略博弈的策略表达式可以用博弈矩阵表示一样,n人有限策略博弈的扩展表达式可以用博弈树表示。博弈树在博弈论中有着广泛的应用,它给出了博弈的几乎所有信息。对于动态博弈,首先要理解“子博弈”的概念。子博弈是一个决策节点(单个节点信息集)的一部分,是该决策节点的所有后续节点的扩展形式。根据定义,子博弈是原博弈的一部分,可以作为一个独立的博弈来分析。除此之外,有几个概念应该明确:结:包括决策结和终点结;决策是参与者采取行动的时间,终点
33、是游戏行动路径的终点。分支:在博弈树上,分支是从一个决策节点到其直接后续节点的线(有时用箭头表示),每个分支代表参与者的一个行动选择。信息集:博弈树中所有决策节点划分的信息集。每个信息集是决策节点集的子集,决策节点集包括满足以下条件的所有决策节点:每个决策节点是同一参与者的决策节点;玩家知道博弈进入了集合的一个决策节点,但不知道子集在哪个决策节点。假设一个扩展游戏的游戏树如下:图2.1游戏树如图2.1所示,参与人1和参与人2的信息集是单结,所以参与人1和参与人2的任意决策结都可以形成子博弈,而参与人3的信息集不是单结,所以图中参与人3左侧的一个决策结不能形成子博弈。泽尔腾(1)概念:“子博弈精
34、炼纳什均衡”也叫“子博弈完美纳什均衡”。消除纳什均衡中包含的难以置信的威胁策略。它要求参与者的决策在任何时候都是最优的,决策者应该“随机应变”和“向前看”,而不是拘泥于旧的策略。在许多情况下,纳什均衡的数量通过精炼纳什均衡而减少,因为不可思议的威胁被消除了。这对预测和分析具有重要意义。当每个子博弈中只有局中人的策略构成纳什均衡时,称为精炼纳什均衡。换句话说,形成精炼纳什均衡的策略在每个子博弈中都必须是最优的。(2)定义:子博弈:一个子博弈G,是博弈的扩展表示,是原博弈的一部分,由单个节点信息集X和决策节点的所有后续节点(包括结束节点)组成。对于扩展博弈的策略组合S*=(S1*,Si*,Sn*)
35、,如果是原博弈的纳什均衡;也构成了每个子博弈中的纳什均衡,所以是子博弈精炼纳什均衡。博弈论专家常用“序贯理性”:意思是无论过去发生了什么,玩家都应该在博弈的每一点优化自己的策略。子博弈精炼纳什均衡要求参与人应该是有序理性的。对于有限完全信息的博弈,逆向归纳法是求解子博弈精炼纳什均衡最简单的方法。因为有限完美信息博弈中的每一个决策节点都启动了一个子博弈。解法:最后一个节点上的子博弈(纳什均衡)倒数第二个(纳什均衡)初始节点上的子博弈(纳什均衡)。(3)如果:是原博弈的纳什均衡;每个子博弈中都有。那么扩展博弈的策略组合就是一个精炼纳什均衡。(4)求解方法:逆向归纳法是求解子博弈精炼纳什均衡最简单的
36、方法。在求解子博弈的精炼纳什均衡时,是从最后一个子博弈逆向归纳。这是因为有限完美信息博弈中的每个决策节点都是一个独立的信息集,每个决策节点都是从一个子博弈开始的。所以逆向归纳法是从动态博弈的最后一个阶段或最后一个子博弈开始,向前向后推,求解动态博弈均衡的一种方法。2.4不完全信息静态博弈的基本概念和基本模型1.基本概念信息不完全的静态博弈是指至少一个参与人不完全了解另一个参与人的特征,即不知道一个参与人的真实类型,但知道每种类型的概率。海萨尼公理:假设概念分布密度P是所有玩家的共同知识。这个公理说明,关于自然动作的除夕夜对所有玩家都是一样的。贝叶斯纳什均衡(也称贝叶斯均衡)是完全信息静态博弈中
37、纳什均衡概念在不完全信息静态博弈上的扩展。2.贝叶斯纳什均衡定义:n人不完全信息静态博弈中的纯策略贝叶斯纳什均衡g = a1,an;1,n;P1,Pn;1,n;的纯策略贝叶斯纳什均衡是一种类型依赖的策略组合,每个参与人I在给定自己的类型1和其他参与人的类型依赖策略的情况下,最大化自己的期望效用函数Vi。换句话说,战略组合是一个贝叶斯纳什均衡,如果对所有在上面的定义中,A1,An代表策略空间,1,n代表参与者的类型空间,P1,Pn代表条件概率,1,n代表类型依赖支付函数。和纳什均衡一样,贝叶斯纳什均衡本质上是一致预测。贝叶斯均衡与纳什均衡的比较:与纯策略纳什均衡不同的是,在贝叶斯纳什均衡中,参与
38、人I知道有j的参与人J会选择aj(j)但不知道j,因此,即使是纯策略选择也必须取支付函数的期望值。但和纳什均衡一样,贝叶斯均衡本质上是一种共识猜测,即每个参与人I都能正确预测到类型为j的参与人J会选择aj*(j),所以参与人I对其他人信念的信念(条件概率)不进入均衡的定义。唯一重要的是参与人I自己的信念Pi和其他参与人的类型依赖策略。3.海萨尼变换在1967年之前,博弈论专家认为不完全信息博弈是无法分析的,因为当一个玩家不知道他在和谁玩的时候,游戏的规则是未定义的。海萨尼在1967-1968年提出的变换方法“海萨尼变换”已经成为解决这类博弈问题的标准方法。海萨尼在游戏中引入了一个虚拟玩家“自然
39、”。大自然首先选择行动来确定玩家的特征。球员知道自己的特点,但其他球员不知道。这样,不完全信息博弈就转化为完全但不完全的信息博弈,称为“海萨尼变换”。2.5不完全信息动态博弈的基本概念和基本模型1.基本概念在不完全信息的动态博弈中,每个参与者只知道自己的类型,不知道其他参与者的类型。就好比游戏开始的时候,有一个名为“自然”的玩家,它先选定每个玩家的类型,然后玩家开始行动。玩家的动作先来,然后后面的演员可以观察到第一个演员的动作,但是观察不到第一个演员的类型。但是,由于参与者的行动是根据参与者的类型做出的,每个参与者的行动都传达了关于自己类型的信息,后一个行动者可以通过第一个行动者的行动猜测第一
40、个行动者的类型或者修改第一个行动者类型的先验信念(表示为概率分布),然后根据修改后的后验信念选择自己的最佳行动。同样,先动者会预测到自己的行动会被后动者所利用,他会试图选择一些特定的行动来迷惑后动者,即那些传递对他最有利信息的行动,而避免传递对他不利的信息。因此,博弈过程不仅是参与者选择行动的过程,也是参与者不断修正信念的过程,比完全信息动态博弈更加复杂。2.提炼贝叶斯模型。假设博弈中有n个参与人,参与人i的所属类型是,i=1,2,n,是参与人i的私人信息,其他参与人并不知道且观察不到。记除了参与人p()是参与人i认为除了自己外其他参与人所属类型的信念,即先验概率。设S是参与人i的战略空间,它
41、包括参与人i所有的可能的战略;sS是i的一个特定战略,它依赖于参与人i的类型。是在h个信息集上参与人i观测到的其他参与人的行动组合,它是战略组合()的一部分,是除参与人i之外观测到的其他参与人的行动组合。条件概率是在观测到行动的情况下参与人i认为其他n-1参与人属于类型的后验概率,是上述的所有后验概率的集合,是属于类型的参与人i在选择战略s、其他参与人选择战略的情况下的效用函数。那么,精炼贝叶斯均衡可以定义如下:精炼贝叶斯均衡是一个战略组合()=(),()和一个后延概率组合=( ,),满足:(P)对于所有的参与人i,在每一个信息集,有(B)是使用贝叶斯法则从先验概率、观测到的以与最优战略得到(
42、在可能的情况下)。在上述定义中,(P)是精炼条件,它的意思是,给定其他参与人的战略和参与人i的后验概率,每个参与人i的战略在所有从信息集h开始的后续博弈上都是最优的,或者说,所有参与人都是序贯理性的。第三章是基于完全信息的城市合作与竞争博弈分析。3.1基于完全信息的静态博弈合作与竞争分析问题描述假设中央政府计划在两个城市(城市1和城市2)发展创新产业。两个城市的基础设施、经济发展水平、人口密度都是一样的,但他们的共同目标是让城市的经济发展得更好。假设两个城市只有“合作与竞争”两种选择,两个城市各自独立决策。如果两个城市共同发展产业,那么可以各自获得一份收入;如果一个城市选择合作,另一个城市选择
43、竞争,那么合作方得到B的收益,竞争方的收益就是C的;如果两个城市都选择竞争,那么双方的收益都是d,它的策略表达式如下:游戏中参与者的集合:I r r = city 1,city 2 ;大家的战略空间si i = 合作,竞争,Ir;每个参与者的支付函数:UI(合作,协作)=A,UI(合作,竞争)=B,UI(竞争,合作)=C,UI(竞争,竞争)=D,I R。G=i,Si,Ui,ir模型解决方案分析建立的模型如图1所示:城市2竞争城市1竞争合作D,D丙,乙乙,丙答,答图一。城市合作与竞争静态博弈的战略形式假设合作总收益大于竞争总收益,即CADB,那么,当城市2选择竞争时,对于城市1来说,他的最佳选择
44、是竞争(D B);当城市2选择合作时,对于城市1来说,他的最佳选择仍然是竞争(CA)。也就是无论城市2做出什么选择,对于城市1来说,他的最佳选择永远是竞争。同样,对于城市2来说,他的最佳选择永远是竞争,所以他们之间的博弈中的最佳选择,也就是纳什均衡是(竞争,竞争),对应的支付组合是(D,D)。3.1.3结论综上所述,两个城市的纳什均衡是在两个城市完全信息静态博弈,理性思考每个城市都以自身利益最大化为优先的前提下的(竞争,竞争)。但是通过各种组合函数的比较,可以发现两者之间的最优选择是(合作,配合)。某种程度上,两市陷入了“囚徒困境”,即理性地选择了一种非最优策略。要摆脱这种困境,我们需要在相关
45、的前提条件中加入博弈之间的无限重复博弈策略,使他们能够在支付组合中理性地选择最优组合(A,A)。3.2基于完全信息的动态博弈合作与竞争分析问题描述假设只有两个城市(城市1和城市2)。地方政府的目标是提高经济发展速度,增加地方财政收入,改善投资环境,获得城市的最大利益,并考虑是否与另一个城市合作。在完全信息动态博弈条件下,两个城市在考虑是否合作时存在一个序列,后行动的城市知道先行动的城市的选择。假设两个城市(城市1和城市2),如果两个政府合作,各自可以获得收益8;如果有合作和不合作,合作方获得1利润,不合作方获得10利润;如果两个政府相互竞争,他们将各自获得5%的利润。在完全信息的基础上,假设城
46、市1先行动,城市2后行动,展开如下:竞争竞争合作合作竞争合作城市2城市1城市2(1,10)(10,1)(5,5)(8,8)城市合作与竞争动态博弈的扩展模型分析通过逆向归纳法,当城市2选择竞争时,城市1的最佳选择是竞争。因为城市1选择竞争可以获得10个收益,远大于选择合作的1个收益。当城市2选择合作时,城市1的最佳选择也是竞争。因为城市1选择竞争可以获得10个收益,大于选择合作获得的8个收益。因为城市1先行动,他会选择竞争。3.2.3应用-Stackelberg寡头垄断模型概念:Stackelberg是一个动态寡头市场博弈模型。该模型假设寡头垄断市场中的两个公司中的一个较强,另一个较弱。较强的一
47、方(称为领导者)带头,较弱的一方(称为跟随者)在较强的一方之后行动。在这个模型中,两个厂商的选择是有序的,后一个厂商可以观察前一个厂商的选择,所以是一个动态博弈。但是,由于两个局中人的决策能力就是输出水平,有无限多种可能的输出水平,这是一个双方都有无限多种可能选择的无限战略博弈。Stackelberg模型和Kunott模型的唯一区别是前者有一个选择顺序问题,而其他如参与者、策略空间、收益函数都是一样的。按照逆向归纳法的思想,它首先分析了厂商2在第二阶段的决策,剔除了不好的策略,最后找出了构成精炼纳什均衡的策略。模型的求解:假设有两个城市,每个城市只有一个企业(企业1和企业2),它们的因素在各方
48、面都是相同的。边际成本c1=c2=c,产品完全一样。它们的价格函数都是P = P(Q)= A-Q;总输出:(连续输出)Q = Q1+Q2;总成本分别为:c q1和c q2。这个函数就是它的利润:u1(q1,Q2)= q1P(Q)C1 Q1 = Q1a-(Q1+Q2)cq1 = Q1a-(Q1+Q2)cu2(q1,Q2)= q2P(Q)c2q 2 = Q2a-(Q1+Q2)cq2 = Q2a-(Q1+Q2)c博弈过程如下:厂商1选择的产量是q1,城市2根据城市1的决策决定自己的产量。按照逆向归纳法的思路,首先要分析第二阶段厂商2的决策。出于这个原因,我们首先假设公司1对q1的选择已经确定。因此,
49、对于城市2,给定企业1的产量是q1,为了使u2达到最大q2,它必须满足:aQ1c2q 2 = 0 q 2 = R(Q1)= 1/2(aQ1c)实际上,它是公司2对公司1战略的反应函数。企业1知道企业2的这个决策思路,所以他在选择q1的时候就知道q2*是根据R(q1)确定的,所以他可以把q2=R(q1)代入自己的收益函数,然后求其最大值。u1(q1,R(Q1)= Q1aQ1R(Q1)-c= Q1(aQ1c)/2上述公式推导出q1:d u1/d q1=a-c-2 q1设导数为0。可以得到Q1 * =(ac)/2。这时你可以把Q1 *带入q2=R(q1),得到Q2 * =(ac)/4。双方收益分别为
50、(ac)/8和(ac)/16。结论:Stackelberg模型的结果与同时选择两个寡头的古诺模型有很大不同。其产量大于古诺模型,价格低于古诺模型,总利润(两家厂商利润之和)小于古诺模型。然而,在库诺特模型中,公司1的收入大于公司1的收入,甚至大于公司2的收入。这是因为两个厂商在这个模型中的地位不同,厂商1有先行动的主动权,他抓住了理性厂商2总会根据自己的选择做出合理选择的心理。这个博弈也揭示了一个事实,在不对称信息博弈中,拥有更多信息的博弈方(比如这个博弈中的厂商2,他可以在做出决策之前知道厂商1的实际选择,所以他拥有更多的信息)不一定会获得更多的利益。这就是多人游戏和单人游戏的区别。第四章是
51、基于不完全信息的城市合作与竞争博弈分析。4.1基于不完全信息的静态博弈合作与竞争分析问题描述在研究城市经济发展的过程中,完全信息只是城市博弈中的一个理想假设,城市之间不可能无所不知。在城市发展的具体博弈中,其中一个城市很可能不知道其他城市采取某种城市发展战略能得到多少。用更正式的话来说,就是他们不知道其他城市的支付功能结构。也就是说,在城市经济发展的现实博弈中,很多时候城市之间的博弈并不满足于完全信息,大部分博弈都是不完全信息的博弈。城市之间的竞争和发展主要是基于竞争,就像两个人之间的竞争一样。每个人都是利己的。为了达到自己的目的,他们不会互相帮助,也不会把自己的信息透露给竞争对手。城市之间的
52、竞争也是如此。即使城市信息化进程加快,也不会给与自己竞争的城市提供完全真实的信息。因此,在一个具体的城市博弈中,至少有一个城市不知道其他城市的发展战略、发展水平、发展成本和最终支付功能。那么在静态不完全信息条件下,城市之间的博弈会怎么样,博弈的结果是什么?模型解的分析假设城市1是企业1,城市2是企业2,用库诺特模型研究两个城市在不完全信息下的静态博弈。每个企业都有一个不变的单位成本c,逆需求函数为P=a-,企业I的利润函数如下:,i=1,2 企业1的单位成本c是共同认识,企业2的单位成本可能是,;企业2知道自己的成本是还是,但是企业1只知道,也就是说,假定企业1只有1个类型,企业2有两个类型。
53、我们进一步假定a=2,(企业2的成本期望值与企业1的成本一样)。企业2知道企业1的成本,企业2的最大利润函数为:,其中t=a-3/4=5/4或t=a-5/4=3/4,依赖于企业2的实际成本。从最优化的一阶条件可得企业2的反应函数为:也就是说,厂商2的最优产量不仅取决于厂商1的产量,还取决于其自身的成本。当是公司2的最优产量时,就是公司2的最优产量。所以,企业1不知道企业2的真实成本,所以不知道企业2的最优反应是不是。因此,企业1将选择最大化以下期望利润:优化的一阶条件导致公司1的反应函数如下:这是公司1对公司2产量的期望值。均衡是指同时建立两个反应函数,求解两个反应函数的贝叶斯均衡为:由、获取
54、:完全信息博弈下的纳什均衡可以计算如下:或者这里,的下标表示公司2是低成本的情况。因此,我们有:4.1.3结论与完全信息的博弈情况相比,在不完全信息的情况下,低成本企业的产量相对较低,而高成本企业的产量相对较高。原因是当厂商1不知道厂商2的时,只能产生期望的最优产量,该产量高于完全信息下低成本竞争者的产量,低于完全信息下高成本竞争者的产量,厂商2会对此做出反应。下图直观地展示了这两种情况之间的对比:纳什均衡4.2基于不完全信息的动态博弈合作与竞争分析问题描述现在我们假设城市1正在发展一个行业(城市1被称为市场在位者),城市2也想进入这个行业(城市2被称为市场进入者),因为它的盈利能力。所谓市场
55、进入博弈,是指城市2决定是否进入这个行业,一旦进入,城市1该如何决定的博弈问题。假设城市2不知道城市1的成本函数,也不知道城市1一旦进入会“合作”还是“竞争”。4.2.2模型解分析假设有两个周期,t = 1,2。t=1时,市场上有城市1垄断该行业,城市2正在考虑是否进入;如果进入者进入,在t=2时,两个城市会进行一个古诺博弈;否则,1号城市仍然是垄断者。假设城市1有两种可能的生产成本:高成本或低成本。城市1知道自己属于哪一种生产成本,而城市2只知道在职者有两种生产成本的事实,却不知道具体是哪一种成本。设城市1高成本的概率为u,低成本的概率为1-u,这个概率成为进入者的先验信念。假设只有一种类型
56、的城市2:进入成本为2;如果进入,生产成本函数与成本高的在位者(城市1)相同。在t=1时,在城市2决定是否进入之前,城市1作为垄断者,要决定那个时期的价格(或产量),假设只有三种可能的价格选择:p=4,p=5,p=6。如果城市1是高成本,单一价格选择对应的利润是:2,6,7;如果城市1是低成本,对应的利润是:6,9,8。因此,高成本在位者(城市1)的单阶段最优垄断价格为p=6,低成本单阶段最优垄断价格为p=5。t=2时,如果城市2已经进入,城市1的成本函数成为常识;如果城市1是高成本的,那么两个城市的成本函数是相同的,对称库诺特均衡产出下两个城市的利润是3。扣除进入成本2,进入者(城市2)的净
57、利润为1;如果城市1是低成本的,那么两个城市的成本函数是不同的。在非对称库诺特均衡产出下,在位者(城市1)的利润为5,进入者(城市2)的利润为1,进入者(城市2)扣除进入成本2后的净利润为-1。如果城市2不进入,城市1在t=2的时期内仍然是垄断者,不同价格选择下的利润水平与第一阶段相同。我们构造这些数字,使得在完全信息的情况下,如果城市1成本高,城市2选择进入;如果城市1成本低,城市2选择不进入。低的高的普通城市2P=6P=6P=5P=5P=4P=4城市2城市2城市2城市2城市2城市1城市11-竞争(7,0)(5,-1)(7,0)(3,1)(3,1)(7,0)(3,1)竞争竞争(9,0)竞争竞
58、争竞争合作合作合作合作合作合作(2,0)(8,0)(9,0)(9,0)(6,0)(6,0)(7,0)(7,0)(6,0)(6,0)(8,0)(2,0)第一阶段的第二阶段(9,0)(5,-1)(9,0)(5,-1)图5-1市场进入阻碍游戏。图5-1是这个游戏的简化扩展表达。图2中的城市1有两个单结信息集,这意味着城市1知道“自然”的选择(它自己的类型);三条虚线表示进入者有三个信息集,每个信息集有两个决策节点(虚线连接),表示城市2可以观察到城市1的价格选择,但不能观察到城市1的成本函数(即城市2观察到p=4,p=5,p=6,但每个价格可能是高成本城市1或低成本城市1的选择)。我们把第一阶段不同
59、价格选择下的利润向量写在博弈树的末端节点,虽然在城市2决定是否进入之前已经实现了实际支付。注意城市2第一阶段的利润不变为0。我们省略第二阶段博弈的展开,代之以古诺均衡支付向量和垄断利润。这样做的原因是,在博弈进入第二阶段后,如果城市2已经进入,库诺特均衡产量(以及相应的价格)是每个企业的最优选择;如果城市2不进入,单阶段垄断利润(和价格)是城市1的最优选择。虽然在游戏进入第二阶段时,双城的行动选择是一个简单的静态博弈决策问题,但第一阶段的选择要复杂得多。城市2是否进入,取决于它对城市1的成本函数的判断:给定城市1是高成本城市,它的净利润为1,当它是低成本城市时,它的净利润为-1。当且仅当城市2
60、认为城市1是高成本城市的概率大于1/2时,城市2才会选择进入。这和不完全信息静态博弈的决策没什么区别。但与静态博弈不同的是,现在,在观察了第一阶段城市1的价格选择后,城市2可以修正城市1的成本函数的先验概率u,因为城市1的价格选择可能包含了其成本函数的信息。比如,在任何情况下,低成本城市1都不会选择p=6(因为低成本城市1不希望进入者城市2认为自己成本高)。所以,如果城市2观察到城市1选择p=6,他可以推断城市1一定是高成本,选择进入是有利可图的。预测选择p=6会邀请城市2进入,即使成本高的城市1也不一定会选择p=6,尽管p=6是单阶段的最优垄断价格。同样,低成本城市1可能不会选择p=5,如果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人教A版山西省大同市2023-2024学年高二上学期期末质量监测数学试题
- 林徽因课件教案
- 娜塔莎课件高中
- 2024年吉林省中考生物真题卷及答案解析
- 模板 卡通 课件
- 西京学院《新媒体数据挖掘实训》2022-2023学年期末试卷
- 西京学院《软件测试技术》2021-2022学年期末试卷
- 测树叶的面积
- 西京学院《机床电气与技术》2022-2023学年期末试卷
- 西华师范大学《综合自然地理》2022-2023学年第一学期期末试卷
- 手术室锐器刺伤
- 中国食物成分表2018年(标准版)第6版
- 2023-2024苏教版小学五年级数学上册全册测评试卷(含答案)
- 科普类公园设计方案
- 小学英语就业能力展示
- 中医-艾灸治疼痛
- “安全风险分级管控”工作制度(2篇)
- 心肌病和心肌炎课件
- 《艾滋病毒》课件
- 平阳港区西湾作业区防浪导流堤工程海域使用论证报告书
- 管道保温计算公式
评论
0/150
提交评论