第五章-博弈与竞争策略(苏东水)课件

上传人：余*** IP属地：贵州上传时间：2023-08-06 格式：PPT 页数：31 大小：138.22KB 积分：20 举报 版权申诉

已阅读5页，还剩26页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第五章博弈与竞争策略

博弈论的基本概念博弈的类型竞争策略本章要求：理解博弈论的基本概念了解博弈的类型了解有几种竞争策略模型第五章博弈与竞争策略博弈论的基本概念1第一节博弈论的基本概念

一、市场竞争中的博弈

在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略及其相互作用纳入到经济模型中，这就是一种博弈分析。

“博弈”分析实际就是“对策”分析第一节博弈论的基本概念

一、市场竞争中的博弈在现实经济2二、现代经济学与博弈论

从现代观点看，经济学在某种意义上是研究人的决策行为的学问。经济学中的理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人。理性的主要意思就是，从不同的备选对象集合作出的选择之间应该满足的一致性条件”。而每一次选择中，决策者对自己的各种可能的选择所导致的各种结果都有一个偏好排序，这种偏好排序体现了决策者的效用，在数学上可以表达为决策者最大化其效用函数。G＝｛P，A，S，I，U｝价格理论有两个基本假定，即：第一，市场参与人的数量足够多，从而市场是竞争性的；第二，参与人之间不存在信息不对称问题。然而在现实生活中，这两个假设在许多情况下是不能被满足的，特别是在寡头垄断的市场上。寻求竞争与合作良性动态均衡效果的对策－博弈－始终伴随着决策者。1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾和海萨尼，这是对博弈论在经济学发展中的贡献和作用的充分肯定，确立了博弈论在现代主流经济学中的地位。

二、现代经济学与博弈论从现代观点看，经济学在某种意义上是研3三、博弈论的基本概念

(一)博弈论的定义博弈论（gametheory），又译为对策论，就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。实际上，博弈是一种日常现象。在经济学中，博弈论是研究当某一经济主体的决策受到其他经济主体决策的影响，同时，该经济主体的相应决策又反过来影响其他经济主体选择时的决策问题和均衡问题。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)。

博弈论是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。

博弈论作为分析和解决冲突和合作的工具，在管理科学、国际政治、生态学等领域得到广泛的应用。

三、博弈论的基本概念

(一)博弈论的定义博弈论（game4(二)博弈的组成要素

一个博弈一般由以下几个要素组成：参与人、行动、信息、策略、得益、结果、均衡等。（博弈是决策者求其最大化效用函数G＝｛P，A，S，I，U｝的过程）1、参与人，又称局中人，指博弈中选择行动以自身利益最大化的决策主体（可以是个人，也可以是团体，如厂商、政府、国家）。2、行为，指参与人的决策（变量），如消费者效用最大化决策中的各种商品的购买量；厂商利润最大化决策中的产量、价格等。3、策略，又称战略，指参与人选择其行为的规制，即参与人应该在什么条件下选择什么样的行动，以保证自身利益最大化。4、信息，指参与人在博弈过程中的知识，特别是有关其他参与人（对手）的特征和行动的知识。即该参与人所掌握的其他参与人的、对其决策有影响的所有知识。5、收益，是指参与人从博弈中获得的利益水平，它是所有参与人策略或行为的函数，是每个参与人真正关心的东西，如消费者最终所获得的效用、厂商最终所获得的利润。6、结果，指博弈分析者感兴趣的要素集合。7、均衡(equilibrium)是指所有参与人的最优策略或行动的组合。这里的“均衡”是特指博弈中的均衡，一般称之谓“纳什均衡”。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。

(二)博弈的组成要素一个博弈一般由以下几个要素组成：参与人5(三)博弈的分类

1、根据参与人的多少，可将博弈分为两人博弈或多人博弈；2、根据参与人是否合作，可将博弈分为合作博弈或非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。博弈论运用“二个囚犯，二种选择”的博弈模型从理论上深刻揭示了竞争与竞合为博弈双方带来的迥然相异的结局：零和博弈。在这种博弈中，一方的赢必然伴随着另一方的输，不管各博弈方如何进行决策，各博弈方得益之和都为零。常和博弈。在这种博弈中，各种结果下的各博弈方得益之和总是等于一个非零常数。与零和博弈一样，常和博弈各方的利益关系也是对立的，一方多占有一点利益，另一方必然会少占有一点。变和博弈。即意味着在不同策略组合下各博弈方的得益之和是不同的。倘若博弈各方之间相互配合，则可能争取到总得益和个人得益均较大的理想结局；反之则社会总得益和个人得益均较小。

(三)博弈的分类1、根据参与人的多少，可将博弈分为两人博弈63、从行动的先后次序来分，博弈可以分为静态博弈和动态博弈。静态博弈指在博弈中，参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。

4、从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息。☞将上述角度的划分结合起来，我们就得到四种不同类型的博弈，这就是：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈3、从行动的先后次序来分，博弈可以分为静态博弈和动态博弈。7表5-1博弈的分类和均衡表表5-1博弈的分类和均衡表8第二节博弈的种类

一、完全信息静态博弈

(一)完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么，且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。

(二)博弈的策略式表达在博弈论中，一个博弈可以用两种不同的方式表达：一是策略式表达，又称为标准式表达，另一种是扩展式表达。所有参与人同时选择自己的策略，所有参与人选择的策略一起决定每个参与人的得益。值得强调的是，这里参与人同时选择的是“策略”，而不是“行动”。当然在静态博弈中,由于参与人只选择一次，所以策略就等同于行动了。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。第二节博弈的种类

一、完全信息静态博弈(一)完全信息静9(三)博弈的得益矩阵表示

一个博弈被称为有限博弈，如果：第一，参与人的个数是有限的；第二，每个参人可选择的策略个数是有限的。两人有限博弈的策略式表达及其求解可以方便地用得益矩阵直观地给出。

(三)博弈的得益矩阵表示一个博弈被称为有限博弈，如果：第一10著名的“囚徒困境”的例子

警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判l年徒刑；如果两人中有一人坦白认罪,则坦白者立即释放而另一人将重判10年徒刑;果两人都坦白认罪，则他们将被各判8年监禁，问两个罪犯会如何选择（即是坦白还是抵赖）

著名的“囚徒困境”的例子警察抓住了两个罪犯，但是警察局却缺11表5-2囚徒困境表5-2囚徒困境12(四)纳什均衡

1、占优策略均衡一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。在一个博弈里，如果所有参与人都有占优策略存在，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里，{坦白，坦白}是占优策略均衡。囚徒困境反映了一个深刻问题，即个人理性与团体理性的冲突。这给我们一个启示，我们学习博弈论，也许更应该研究的是怎样设计一种制度，在满足个人理性的同时，去争取达到“集体理性”

(四)纳什均衡1、占优策略均衡132、严格劣策略的重复剔除重复剔除“严格劣策略”的思路如下：首先找出某个参与人的严格劣策略(假定其存在)，把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈；所谓“严格劣策略”是指：在博弈中，不论其他参与人采取什么策略，某一参与人可能采取的策略中，对自己严格不利的策略。重复这个过程，直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。注意，上述表述中强调了“唯一”这个词。也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。

2、严格劣策略的重复剔除14例如，在股份公司中，股东都承担着监督经理的职能，但是，大小股东从监督中获得的收益大小不一样。在监督成本相同的情况下，大股东从监督中获得的收益明显大于小股东。因此，小股东往往不会象大股东那样去监督经理人员，而大股东也明确无误地知道小股东会选择不监督（这是小股东的占优策略），大股东明知道小股东要搭大股东的便车，但是大股东别无选择。大股东选择监督经理的责任、独自承担监督成本是在小股东占优选择的前提下必须选择的最优策略。

例如，在股份公司中，股东都承担着监督经理的职能，但是，大小股153、纳什均衡纳什均衡是完全信息静态博弈解的一般概念，构成纳什均衡的策略一定是重复剔除严格劣策略过程中（留下的）不能被剔除的策略，即没有任何一个策略严格优于纳什均衡策略。当然，逆定理是不存在的。纳什均衡是指在均衡中，每个博弈参与人都确信，在给定其他参与人选择的策略的情况下，该参与人选择了最优策略以回应对手的策略。占优策略均衡一定是纳什均衡

纳什均衡的正式（数学）定义自己看书理解。

3、纳什均衡16现实生活中，有相当多的博弈，我们无法使用占优策略均衡或重复剔除的策略均衡的方法找出均衡解。例如：在房地产开发博弈中，假定市场需求有限，Ａ、Ｂ两个开发商都想开发一定规模的房地产，但是市场对房地产的需求只能满足一个房地产的开发量，而且，每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下，无论是对开发商Ａ还是开发商Ｂ，都不存在一种策略优于另一种策略，也不存在严格劣策略：如果Ａ选择开发，则Ｂ的最优策略是不开发；如果Ａ选择不开发，则Ｂ的最优策略是开发；类似地，如果Ｂ选择开发，则Ａ的最优策略是不开发；如果Ｂ选择不开发，则Ａ的最优策略是开发。现实生活中，有相当多的博弈，我们无法使用占优策略均衡或重复剔17(五)纳什均衡的多重性

一个博弈可能有多个纳什均衡，而具体哪个均衡会实现，纳什均衡本身不能给出回答,任何有限博弈都存在至少一个纳什均衡，若是无限博弈则不一定。

(五)纳什均衡的多重性一个博弈可能有多个纳什均衡，而具体哪18二、完全信息动态博弈

(一)完全信息动态博弈定义

完全信息动态博弈指的是各博弈方先后行动，后行动者知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。在动态博弈中,策略并不简单地等于行动。动态博弈中我们把一个参与人的一次行动称为一个“阶段”，因此一个动态博弈就会有多个甚至无限个博弈阶段。

二、完全信息动态博弈

(一)完全信息动态博弈定义完全信息19(二)博弈的扩展式表达

1、博弈的策略式表达包括三个要素：参与人集合；每个与人的策略集合；由所有参与人的策略组合决定的每个参与人的得益。总结一个动态博弈的扩展式表达应包含以下要素：(1)参与人集合：I＝1，…，n；此外我们以后将用N“代表虚拟的参与人——“自然”；(2)参与人的行动顺序：谁在什么时候行动；(3)参与人的行动空间：在每次行动时，参与人有些什么行动可供选择；(4)参与人的信息集：每次行动时，参与人知道些什么；(5)参与人的得益函数：在博弈结束后，每个参与人得到些什么；(6)外生事件(即“自然”的选择)的概率分布。

(二)博弈的扩展式表达1、博弈的策略式表达包括三个要素：参202、博弈树通常用“博弈树”来表述n个人有限策略动态博弈的上述全部要素。①结：结包括决策结和终点结。②枝：博弈树上，枝是从一个决策结到其直接后续结的连线，每一个枝代表参与人的一个行动选择。在每一个枝旁标注该具体行动的代号。一般地，每个决策结下有多个枝，给出每次行动时参与人的行动空间，即此时有哪些行动可供选择。③信息集：将博弈树中某一决策者在某一行动阶段具有相同信息的所有决策结称为一个信息集。

2、博弈树21博弈的扩展模型

包括五个要素：参与者、决策时点、策略空间、信息和收益函数。在简单的博弈中，扩展模型可以用博弈树表示。如上例的可乐价格博弈可表示如图下：不涨价涨价参与者1可口可乐10，10100，-30-20，30140，35不涨价涨价参与者2百事可乐不涨价涨价参与者2百事可乐博弈树一般用来分析动态博弈。在博弈过程中，从某一个决策点开始，参与者在已有行动的基础上开始选择，到博弈结束，称为“子博弈”。子博弈是相对的，从事态发展的历史来看，所有的博弈都是子博弈。博弈的扩展模型包括五个要素：参与者、决策时点、策略空间、信22(三)子博弈精炼纳什均衡

子博弈精炼纳什均衡是泽尔腾（Selten）于1965年首先提出的，其目的是将那些不可置信威胁策略的纳什均衡从均衡中剔除，从而给出动态博弈一个合理的均衡解。

1、不可置信威胁策略。在某一博弈中，一参与人承诺当某种情况发生时，比如其他参与人作出某一特定行动选择时，其将作出某种具体行动。而当该情况真的发生时，承诺人如果真的履行其承诺则会付出相当的代价，而不履行则会收益更大，那么该承诺就是不可置信的。“子博弈精炼纳什均衡”。将纳什均衡中包含有不可置信威胁策略的均衡剔除出去，就是说，使最后的均衡中不再包含有不可置信威胁策略的存在。

(三)子博弈精炼纳什均衡子博弈精炼纳什均衡是泽尔腾（Sel232、子博弈精炼纳什均衡。子博弈精炼纳什均衡要求均衡策略的行为规则在每一个信息集上都是最优的。子博弈定义：一个扩展式表示博弈的子博弈G是由一个单结信息集x开始的与所有该决策结的后续结(包括终点结)组成的能自成一个博弈的原博弈的一部分。

在动态博弈中，参与人的行动有先后顺序，后行动的参与人在自己行动之前就可以观察到先行动者（参与人）的行为，并在此基础上选择相应的策略。而且，由于先行动者拥有后行动者可能选择策略的完全信息，因而先行动者在选择自己的策略时，就可以预先考虑自己的选择对后行动者选择的影响，并采取相应的对策。

2、子博弈精炼纳什均衡。24我们继续沿用本节前面关于房地产开发的例子，讨论子博弈精炼纳什均衡。表5-3给出了静态条件下双方参与人的收益情况。从表5-3可以知道，该博弈有两个纳什均衡，即（Ａ开发，Ｂ不开发）和（Ａ不开发，Ｂ开发），我们无法确定是开发商Ａ选择开发，开发商Ｂ选择不开发，还是恰恰相反的结果。

从表5-3可以知道，该博弈有两个纳什均衡，即（Ａ开发，Ｂ不开发）和（Ａ不开发，Ｂ开发），我们无法确定是开发商Ａ选择开发，开发商Ｂ选择不开发，还是恰恰相反的结果。

表5-3房地产开发博弈（静态）的收收益矩阵

我们继续沿用本节前面关于房地产开发的例子，讨论子博弈精炼纳什25现在，我们讨论动态博弈。假定房地产开发商Ａ是先行动者。在行动之前，开发商Ａ对对手开发商Ｂ的策略进行了预测。在行动开始之前的Ａ看来，如果不计得失，Ｂ有四种策略可供选择：策略一：无论Ａ是否选择开发，Ｂ选择开发。策略二：若Ａ选择开发，Ｂ也选择开发；若Ａ选择不开发，Ｂ也选择不开发。策略三：若Ａ选择开发，Ｂ就选择不开发；若Ａ选择不开发，Ｂ就选择开发。策略四：无论Ａ是否选择开发，Ｂ都选择不开发。在表5-3的基础上，结合Ａ先行动，Ｂ可能选择的四种策略，不难得出表5-4先行动者Ａ对Ｂ预测结果的收益矩阵现在，我们讨论动态博弈。假定房地产开发商Ａ是先行动者。在行动26由表5-4可以看出，在开发商Ａ先行动的情况下，开发商Ｂ可供选择的策略中，策略一只包括了上述两个纳什均衡中的后一种均衡，即（Ａ不开发，Ｂ开发），而没有包括前一种纳什均衡，即（Ａ开发，Ｂ不开发）；策略二上述两种纳什均衡都没有包括；策略四只包括了上述两种纳什均衡中的前一种均衡，即（Ａ开发，Ｂ不开发），而未包括后一种纳什均衡，即（Ａ不开发，Ｂ开发）；只有策略三既包括了上述两种纳什均衡中的前一种均衡，又包括了后一种均衡。也就是说，如果Ｂ选择策略三，那么，无论Ａ作出什么选择，Ｂ的回应都能达到纳什均衡。反过来，在给定Ｂ会选择策略三来回应Ａ的选择的前提下，开发是Ａ的占优选择。因此，Ａ一定会选择开发。以上的分析，就是子博弈精炼纳什均衡解的过程。策略（Ａ开发，Ｂ不开发）就是上述子博弈精炼纳什均衡解。

由表5-4可以看出，在开发商Ａ先行动的情况下，开发商Ｂ可供选27所谓“子博弈”（sub-ga

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

第五章-博弈与竞争策略(苏东水)课件

文档简介

温馨提示

最新文档

评论

第五章-博弈与竞争策略(苏东水)课件

文档简介

温馨提示

最新文档

评论

相关文档