版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 问题的提出问题的提出 博弈论基础博弈论基础 纳什均衡纳什均衡 囚徒困境囚徒困境 序贯博弈序贯博弈 重复博弈重复博弈 博弈的种类总结博弈的种类总结 问题的提出问题的提出 1994年,诺贝尔经济学奖授给了美国人约年,诺贝尔经济学奖授给了美国人约 翰翰哈桑尼(哈桑尼(John C. Harsanyi)、美国人约)、美国人约 翰翰纳什(纳什(John F. Nash Jr.)和德国人莱因)和德国人莱因 哈德哈德泽尔腾(泽尔腾(Reinhard Selten),以表彰),以表彰 他们在非合作博弈的均衡分析理论方面所他们在非合作博弈的均衡分析理论方面所 做出的开创性贡献。做出的开创性贡献。 1996年,
2、诺贝尔经济学奖授给了英国人年,诺贝尔经济学奖授给了英国人 詹姆斯詹姆斯莫里斯(莫里斯(James A. Mirrlees)和美)和美 国人威廉国人威廉维克瑞(维克瑞(William Vickrey),以),以 表彰他们在信息经济学、激励理论、博弈表彰他们在信息经济学、激励理论、博弈 论等方面都做出的重大贡献。论等方面都做出的重大贡献。 2001年,诺贝尔经济学奖授给了美国人迈克年,诺贝尔经济学奖授给了美国人迈克 尔尔斯彭斯(斯彭斯(A. Michael Spence)、美国人约)、美国人约 瑟夫瑟夫斯蒂格利茨(斯蒂格利茨(Joseph E. Stiglitz)和美)和美 国人乔治国人乔治阿克尔
3、洛夫(阿克尔洛夫(George A. Akerlof),), 以表彰他们对信息不对称市场所作的精彩分以表彰他们对信息不对称市场所作的精彩分 析。析。 古语有云,世事如棋。生活中每个人如同棋古语有云,世事如棋。生活中每个人如同棋 手,其每一个行为如同在一张看不见的棋盘手,其每一个行为如同在一张看不见的棋盘 上布一个子,精明慎重的棋手们相互揣摩、上布一个子,精明慎重的棋手们相互揣摩、 相互牵制,人人争赢,下出诸多精彩纷呈、相互牵制,人人争赢,下出诸多精彩纷呈、 变化多端的棋局。博弈论是研究棋手们变化多端的棋局。博弈论是研究棋手们 “ “出出 棋棋” ” 着数中理性化、逻辑化的部分,并将其着数中理性
4、化、逻辑化的部分,并将其 系统化为一门科学。换句话说,就是研究个系统化为一门科学。换句话说,就是研究个 体如何在错综复杂的相互影响中得出最合理体如何在错综复杂的相互影响中得出最合理 的策略。事实上,博弈论正是衍生于古老的的策略。事实上,博弈论正是衍生于古老的 游戏或曰博弈如象棋、扑克等。游戏或曰博弈如象棋、扑克等。 数学家们将具体的问题抽象化,通过建立自数学家们将具体的问题抽象化,通过建立自 完备的逻辑框架、体系研究其规律及变化。完备的逻辑框架、体系研究其规律及变化。 这可不是件容易的事情,以最简单的二人对这可不是件容易的事情,以最简单的二人对 弈为例,稍想一下便知此中大有玄妙:若假弈为例,稍
5、想一下便知此中大有玄妙:若假 设双方都精确地记得自己和对手的每一步棋设双方都精确地记得自己和对手的每一步棋 且都是最且都是最“理性理性” ” 的棋手,甲出子的时候,的棋手,甲出子的时候, 为了赢棋,得仔细考虑乙的想法,而乙出子为了赢棋,得仔细考虑乙的想法,而乙出子 时也得考虑甲的想法,所以甲还得想到乙在时也得考虑甲的想法,所以甲还得想到乙在 想他的想法,乙当然也知道甲想到了他在想想他的想法,乙当然也知道甲想到了他在想 甲的想法甲的想法 博弈论是分析企业和个人行为的一个重博弈论是分析企业和个人行为的一个重 要工具,在分析企业与企业或个人与个要工具,在分析企业与企业或个人与个 人之间的互动的时候尤
6、为重要。人之间的互动的时候尤为重要。 博弈论(博弈论(game theory)研究企业或个人研究企业或个人 (agent)的策略行为()的策略行为(strategic behavior),这些策略行为取决于其他企),这些策略行为取决于其他企 业或个人的行动(业或个人的行动(action)互相依存又互)互相依存又互 相影响。相影响。 非合作博弈(非合作博弈(non-cooperative game):在在 非合作博弈中,不存在通过谈判协商非合作博弈中,不存在通过谈判协商 (negotiation)或有约束力的合约)或有约束力的合约 (binding contract)的方式限制博弈人的)的方式限
7、制博弈人的 行为。我们这里讨论的一般为非合作博弈。行为。我们这里讨论的一般为非合作博弈。 合作博弈(合作博弈( cooperative game ):在合作:在合作 博弈中,博弈人通过谈判一个有约束力的博弈中,博弈人通过谈判一个有约束力的 合约来实现其联合策略。合约来实现其联合策略。 博弈论可以帮助我们分析存在两个或数个博弈论可以帮助我们分析存在两个或数个 行为主体时的最佳策略。如分析在存在寡行为主体时的最佳策略。如分析在存在寡 头垄断时一个企业的行为,以及不同企业头垄断时一个企业的行为,以及不同企业 行为之间的相互影响。行为之间的相互影响。 博弈论应用的例子包括对寡头垄断行为的博弈论应用的例
8、子包括对寡头垄断行为的 分析,对外部性的分析,对军事策略的分分析,对外部性的分析,对军事策略的分 析,等等。析,等等。 q一个完整的博弈包括以下要素:一个完整的博弈包括以下要素: 博弈人(博弈人(players):两个以上。两个以上。 规则:谁在什么时候行动?如何行动?每个规则:谁在什么时候行动?如何行动?每个 博弈人有至少两个以上可供选择的博弈人有至少两个以上可供选择的策略策略 (strategies)。 结果:每个可能的策略都有一个相应的结果:每个可能的策略都有一个相应的报酬报酬 (payoffs)。一个假设是博弈人偏好于报酬。一个假设是博弈人偏好于报酬 高的结果。高的结果。 q作为博弈论
9、的介绍,我们主要讨论作为博弈论的介绍,我们主要讨论两人两人 博弈(博弈(two-player game)模型,即每个模型,即每个 博弈只有两个博弈人。博弈只有两个博弈人。 q同时,我们也假设每个博弈人只有两个同时,我们也假设每个博弈人只有两个 可供选择的策略。可供选择的策略。 q两人博弈的一个例子:两人博弈的一个例子: u我们将两个博弈人叫做我们将两个博弈人叫做A和和B。 uA有两个(策略)选择:上(有两个(策略)选择:上(up)或下)或下 (down)。)。 uB有两个选择:左(有两个选择:左(left)或右()或右(right)。)。 u说明:(说明:(1)A和和B的策略选择可以相同也可的
10、策略选择可以相同也可 以不同;(以不同;(2)每个策略选择可以被看作是)每个策略选择可以被看作是 一个投资决定或者利益分配计划。一个投资决定或者利益分配计划。 q两人博弈的一个例子(续):两人博弈的一个例子(续): u两个博弈人,每个博弈人各有两个选择,结两个博弈人,每个博弈人各有两个选择,结 果有四个不同的策略选择组合:上左,上右,果有四个不同的策略选择组合:上左,上右, 下左,下右。下左,下右。 u每个策略组合中,每个博弈人的报酬已知,每个策略组合中,每个博弈人的报酬已知, 见下页见下页收益矩阵(收益矩阵(payoff matrix)或一般形)或一般形 式(式(normal form)。
11、收益矩阵(收益矩阵(Payoff MatrixPayoff Matrix,又称报酬矩,又称报酬矩 阵,支付矩阵等)描述一个博弈结构。下阵,支付矩阵等)描述一个博弈结构。下 面支付矩阵中,面支付矩阵中,两个参与者两个参与者A A和和B B各自可以各自可以 选择两种策略,分别用选择两种策略,分别用“左右左右”和和“上下上下” 来标识;数字表示双方在不同策略选择组来标识;数字表示双方在不同策略选择组 合下得到的支付,较大数字代表较大利益。合下得到的支付,较大数字代表较大利益。 Player B Player A 通常的表达方式是,第一个博弈人的报酬在通常的表达方式是,第一个博弈人的报酬在 前,第二个
12、博弈人的报酬在后。前,第二个博弈人的报酬在后。 LR U D (3,9) (0,0) (1,8) (2,1) 报酬矩阵也可以用展开式(extensive form)或树 形图(tree diagram)来表示。 UD LLRR (3,9)(1,8) (0,0)(2,1) A BB 信息集(信息集(information set) 决策结(决策结(decision node) l信息集(信息集(information set)表明了哪一个博弈人表明了哪一个博弈人 应该作决定,并且每个博弈人作决定所掌握的应该作决定,并且每个博弈人作决定所掌握的 信息。信息。 l充分信息(充分信息(perfect
13、information):一个信息集:一个信息集 里只有一个决策结。里只有一个决策结。 l不充分信息(不充分信息(imperfect information):一个信:一个信 息集有多个决策结。博弈人不能区分其作决策息集有多个决策结。博弈人不能区分其作决策 时位于哪个决策结。时位于哪个决策结。 q报酬矩阵与展开形式之间的关系:报酬矩阵与展开形式之间的关系: u一个展开形式肯定有唯一相对应的一个展开形式肯定有唯一相对应的 报酬矩阵;报酬矩阵; u但一个报酬矩阵可能反映多个展开但一个报酬矩阵可能反映多个展开 形式。如下面两个不同的展开形式形式。如下面两个不同的展开形式 有相同的报酬矩阵。有相同的报
14、酬矩阵。 UD LLRR (3,9)(1,8) (2,1)(2,1) A BB 展开形式一展开形式一 UD LR (3,9)(1,8) (2,1) A B 展开形式二展开形式二 o博弈均衡博弈均衡指博弈中的所有参与者都指博弈中的所有参与者都 不想改变自己的策略的一种状态。不想改变自己的策略的一种状态。 前面我们讨论了一个博弈的表达形式。前面我们讨论了一个博弈的表达形式。 现在我们来解这个两人博弈,即每个现在我们来解这个两人博弈,即每个 博弈人的最佳策略是什么?博弈人的最佳策略是什么? l在回答前面这个问题之前,我们再看一个例在回答前面这个问题之前,我们再看一个例 子,这就是著名的囚犯困境(子,
15、这就是著名的囚犯困境(the prisoners dilemma)。)。 l这个例子是这样的,两个嫌疑犯同时被捕,这个例子是这样的,两个嫌疑犯同时被捕, 并被隔离审问。这两个囚犯都有两个选择:并被隔离审问。这两个囚犯都有两个选择: 坦白(坦白(confess)还是不坦白)还是不坦白(deny)他们的罪他们的罪 行。问题是:在互相不知道对方的选择的情行。问题是:在互相不知道对方的选择的情 况下,应该坦白还是不坦白呢?况下,应该坦白还是不坦白呢? q对这两个囚犯的惩罚(或者负的报酬)对这两个囚犯的惩罚(或者负的报酬) 是:是: 如果两个人都坦白,两个人的罪行一如果两个人都坦白,两个人的罪行一 样重
16、;样重; 如果一个坦白,一个不坦白,前者处如果一个坦白,一个不坦白,前者处 罚较轻,后者处罚较重;罚较轻,后者处罚较重; 如果两个人都不坦白,则因为没有证如果两个人都不坦白,则因为没有证 据,两个人的处罚较都坦白时轻。据,两个人的处罚较都坦白时轻。 这两个囚犯会作什么样的选择呢?这两个囚犯会作什么样的选择呢? 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) Deny Confess DenyConfess 如果甲不坦白,乙的最佳选择是坦白。如果甲不坦白,乙的最佳选择是坦白。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C
17、DC 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C DC 如果甲不坦白,乙的最佳选择是坦白。如果甲不坦白,乙的最佳选择是坦白。 如果甲坦白,乙的最佳选择还是坦白。如果甲坦白,乙的最佳选择还是坦白。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C DC 所以不管甲怎么做,乙的最佳选择都是坦白。所以不管甲怎么做,乙的最佳选择都是坦白。 对乙来讲,坦白是一个对乙来讲,坦白是一个主导性的策略主导性的策略 (dominant strategy)。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10
18、) D C DC 反过来也成立,即不管乙怎么做,反过来也成立,即不管乙怎么做, 对甲来讲,坦白也是一对甲来讲,坦白也是一个主导性的策略个主导性的策略。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C DC 所以,对囚犯所以,对囚犯A,B来说,无论对方如何选择,来说,无论对方如何选择, “坦白坦白”都是各自最优选择。所以都是各自最优选择。所以“坦白,坦白坦白,坦白 ”就是此博弈的就是此博弈的占优策略均衡占优策略均衡 不管其它参与者如何选择,每个局中人自有不管其它参与者如何选择,每个局中人自有 的那个最优选择称作的那个最优选择称作严格占优策略严格占优策略,由
19、此实,由此实 现的均衡是现的均衡是严格占优策略严格占优策略均衡均衡。 严格占优策略均衡的应用:逐步剔除严格劣严格占优策略均衡的应用:逐步剔除严格劣 策略均衡策略均衡见课本见课本P111P111:智猪博弈,寡头:智猪博弈,寡头 博弈,广告博弈等博弈,广告博弈等 1,2 1,02,1 0,1 左左 上上 右右 下下 厂商厂商B B 厂商厂商A A 可口可乐的决策可口可乐的决策 做做 广广 告告 不做广告不做广告 百百 事事 可可 乐乐 的的 决决 策策 做广告做广告 不不 做做 广广 告告 每家每家30亿美元的利润亿美元的利润 可口可乐得到可口可乐得到20亿美元利润亿美元利润 百事可乐得到百事可乐
20、得到50亿美元利润亿美元利润 可口可乐得到可口可乐得到50亿美亿美 元利润元利润 百事可乐得到百事可乐得到20亿美亿美 元利润元利润 每家都得到每家都得到40亿美元利润亿美元利润 做广告 在这个博弈中,只有一个唯一的在这个博弈中,只有一个唯一的纳什纳什 均衡均衡, 即(即(C,C)。但由于()。但由于(D,D)的回)的回 报较高,这个纳什均衡是报较高,这个纳什均衡是无效率的无效率的 (inefficient) 例子:例子: A A,B B在做广告上存在策略关系。在做广告上存在策略关系。A A没有支配策略,最佳决没有支配策略,最佳决 策取决于策取决于B B的选择:的选择:B B做广告时,做广告时
21、,A A应做广告,得到应做广告,得到1010而不而不 是是6 6的支付;但的支付;但B B不做广告时,不做广告时,A A也不应做广告,得到也不应做广告,得到2020而而 不是不是1515支付。如同时决策,支付。如同时决策,A A应如何决策?应如何决策? A A可以把自己放在可以把自己放在B B的位置,从的位置,从B B角度看什么是最好选择,角度看什么是最好选择, 并在此基础上考虑自己选择。并在此基础上考虑自己选择。B B有占优策略:选择做广告有占优策略:选择做广告 时利益较大时利益较大,A A判断判断B B会选择做广告。会选择做广告。B B做广告时,做广告时,A A应当选应当选 择做广告。均衡
22、结局是双方都做广告。择做广告。均衡结局是双方都做广告。 10,5 20,2 6,8 15,0 做广告做广告不做广告不做广告 厂商厂商B B 厂商厂商A A 做广告做广告 不做广告不做广告 指一组给定对手行为前提下对各博弈方存指一组给定对手行为前提下对各博弈方存 在的最佳选择,这时只要其它参与者不变在的最佳选择,这时只要其它参与者不变 换策略选择,任何单个参与者不可能单方换策略选择,任何单个参与者不可能单方 面通过变换策略来提高支付。面通过变换策略来提高支付。 广告策略事例中,给定厂商广告策略事例中,给定厂商B做广告,做广告,A的的 最好选择是做广告;当最好选择是做广告;当A做广告时,做广告时,
23、B的选的选 择仍是它能做的最好的。满足了纳什均衡择仍是它能做的最好的。满足了纳什均衡 条件。条件。 在纳什均衡下,在纳什均衡下,“我所做的是给定你的选择我所我所做的是给定你的选择我所 能做的最好的能做的最好的”,占优策略均衡下,占优策略均衡下, “ “我所做我所做 的是不论你的选择我所能做的更好的的是不论你的选择我所能做的更好的”。 占优策略均衡必然是纳什均衡,纳什均衡未必是占优策略均衡必然是纳什均衡,纳什均衡未必是 支配均衡。支配均衡。 纳什均衡的应用:情侣博弈,斗鸡博弈,古诺模型纳什均衡的应用:情侣博弈,斗鸡博弈,古诺模型 Read by yourself 一个博弈可能有几个纳什均衡,也可
24、能没有纳什均衡。左表两个纳什一个博弈可能有几个纳什均衡,也可能没有纳什均衡。左表两个纳什 均衡:其中均衡:其中“上,左上,左”是纳什均衡(是纳什均衡(A A选上,则选上,则B B选左;且选左;且B B选左时选左时A A仍仍 应选上);应选上);“下,右下,右”也是纳什均衡(也是纳什均衡(A A选下,则选下,则B B选右;且选右;且B B选右时选右时A A 仍应选下)。没有更多信息则无法判断均衡位置。右表没有纳什均衡。仍应选下)。没有更多信息则无法判断均衡位置。右表没有纳什均衡。 如如A A选选“上上”,B B则选则选“左左”;当;当B B选选“左左”时,时,A A却应当选却应当选“下下”。反。
25、反 之,之,A A选选“下下”时,时,B B应选应选“右右”;然而当;然而当B B选右时,选右时,A A又应选又应选“上上”。 2,1 1,2 0,0 0,0 左左 上上 右右 下下 局中人局中人B B 局中人局中人A A 0,0 -1,3 1,0 0,-1 左左 上上 右右 下下 局中人局中人B B 局中人局中人A A (左) (右) 在前面两个例子中,两个博弈人同时决在前面两个例子中,两个博弈人同时决 定他们的策略,这样的博弈叫定他们的策略,这样的博弈叫静态博弈静态博弈 或者或者同时博弈(同时博弈(simultaneous play game)。 我们知道同时博弈时,每个博弈的信息我们知道
26、同时博弈时,每个博弈的信息 是充分的,或不对称的是充分的,或不对称的 q在有些博弈中,一个博弈人先于另一个博弈在有些博弈中,一个博弈人先于另一个博弈 人决定其策略,这样的博弈叫人决定其策略,这样的博弈叫序贯博弈序贯博弈或或动动 态博弈(态博弈(sequential play game)。 q在序贯博弈中,先决定策略的那个博弈人叫在序贯博弈中,先决定策略的那个博弈人叫 领头者(领头者(leader),后决定策略的叫跟从者),后决定策略的叫跟从者 (follower)。)。 q在同时博弈时,一个博弈有多个纳什在同时博弈时,一个博弈有多个纳什 均衡,很难说哪个均衡更有可能发生。均衡,很难说哪个均衡更
27、有可能发生。 q如果这样的博弈是一个序贯博弈,我如果这样的博弈是一个序贯博弈,我 们可以决定哪个均衡更有可能发生。们可以决定哪个均衡更有可能发生。 q这里我们讨论一个序贯博弈时的一个这里我们讨论一个序贯博弈时的一个 均衡例子。均衡例子。 序贯博弈(序贯博弈(Sequential Game)Sequential Game)中,各博弈方先后中,各博弈方先后 依次行动。下面支付矩阵中,如果双方同时行动,依次行动。下面支付矩阵中,如果双方同时行动, 有两个纳什均衡点(有两个纳什均衡点(“甜,咸甜,咸”与与“咸,甜咸,甜”)。)。 序贯博弈假定:序贯博弈假定:A A先作决策,先作决策,B B随后选择。随
28、后选择。A A决策时决策时 需要考虑竞争者反应:它知道不论自己推出那种需要考虑竞争者反应:它知道不论自己推出那种 饼干,饼干,B B出于自身利益会推出另一种。因而出于自身利益会推出另一种。因而A A推出推出 甜饼干,甜饼干,B B在给定在给定A A决策时选择咸饼干;给定决策时选择咸饼干;给定B B的选的选 择择A A的选择仍然最佳。结果两个纳什均衡点收敛为的选择仍然最佳。结果两个纳什均衡点收敛为 一个(下,左),一个(下,左),A A获得先行者优势(获得先行者优势(First First Movers AdvantageMovers Advantage)。)。 -5,-5 -5,-5 20,1
29、0 10,20 咸饼干咸饼干 咸饼干咸饼干 甜饼干甜饼干 甜饼干甜饼干 厂商厂商B B 厂商厂商A A Player B Player A (U,L) and (D,R) are both Nash equilibria when this game is played simultaneously and we have no way of deciding which equilibrium is more likely to occur. LR U D (3,9) (0,0) (1,8) (2,1) Suppose instead that the game is played sequ
30、entially, with A leading and B following. We can rewrite the game in its extensive Form. Player B Player A LR U D (3,9) (0,0) (1,8) (2,1) UD LLRR (3,9)(1,8) (0,0)(2,1) A BB A plays first. B plays second. A plays first. B plays second. A UD LLRR (3,9)(1,8) (0,0)(2,1) BB (U,L) is a Nash equilibrium. A
31、 plays first. B plays second. UD LLRR (3,9)(1,8) (0,0)(2,1) A BB (U,L) is a Nash equilibrium. (D,R) is a Nash equilibrium. Which is more likely to occur? A plays first. B plays second. UD LLRR (3,9)(1,8) (0,0)(2,1) A BB If A plays U then B plays L; A gets 3. A plays first. B plays second. UD LLRR (3
32、,9)(1,8) (0,0)(2,1) A BB If A plays U then B plays L; A gets 3. If A plays D then B plays R; A gets 2. A plays first. B plays second. UD LLRR (3,9)(1,8) (0,0)(2,1) A BB If A plays U then B plays L; A gets 3. If A plays D then B plays R; A gets 2. So (U,L) is the likely Nash equilibrium. q这种由结果反推博弈人的
33、最佳策略的方法这种由结果反推博弈人的最佳策略的方法 叫逆向归纳(叫逆向归纳(backword induction)法。)法。 q这种方法在博弈论中的应用非常普遍。这种方法在博弈论中的应用非常普遍。 q见课本见课本P119例子:市场进入阻挠例子:市场进入阻挠 q阅读子博弈完美纳什均衡(泽尔腾)阅读子博弈完美纳什均衡(泽尔腾) “囚徒困境囚徒困境”的一次性博弈,陷入个体的一次性博弈,陷入个体 理性导致集体非理性结果。如是可重复理性导致集体非理性结果。如是可重复 博弈(博弈(Repeated Game)Repeated Game),选择坦白的机,选择坦白的机 会成本太高,可能成为不利选择。会成本太高
34、,可能成为不利选择。”沉沉 默默+ +沉默沉默“可能成为双方最佳选择,成为可能成为双方最佳选择,成为 纳什均衡点。博弈条件改变导致均衡状纳什均衡点。博弈条件改变导致均衡状 态变化。态变化。 o重复博弈重复博弈是动态博弈的一种特殊情况,是动态博弈的一种特殊情况, 在重复博弈中,同一个博弈被重复多次。在重复博弈中,同一个博弈被重复多次。 q例:国内飞机机票降价规定可行吗? q按照国家发展和改革委员会最近公布的按照国家发展和改革委员会最近公布的 新运价方案,机票价格最大下浮幅度是新运价方案,机票价格最大下浮幅度是 40%。 q南航、东航、国航、上航等几大企业,南航、东航、国航、上航等几大企业, 在新
35、票价方案公布之前曾有一次盟约:在新票价方案公布之前曾有一次盟约: 上海始发航班散客票价最低不得低于上海始发航班散客票价最低不得低于8.5 折。折。 q为方便讨论,我们假设只有两家航空公司:为方便讨论,我们假设只有两家航空公司: 南航和东航。这两家公司的盟约是:上海南航和东航。这两家公司的盟约是:上海 始发航班散客票价最低不得低于始发航班散客票价最低不得低于8.5折。折。 q这两家公司都有两个可能的策略:遵守盟这两家公司都有两个可能的策略:遵守盟 约(即诚实)或不遵守盟约(即欺骗)。约(即诚实)或不遵守盟约(即欺骗)。 假设的报酬矩阵见下页。假设的报酬矩阵见下页。 我们知道,尽管(我们知道,尽管
36、(H,H)的报酬都较高,)的报酬都较高, 这个博弈的唯一纳什均衡是(这个博弈的唯一纳什均衡是(C,C)。)。 H-honest C-Cheat 南航南航 东航东航 HC H C (5,5) (8,-2) (-2,8) (2,2) q单一博弈(单一博弈(one-shot game):两个博:两个博 弈人之间只博弈一次。前面的例子是弈人之间只博弈一次。前面的例子是 一个典型的单一博弈的结果。在单一一个典型的单一博弈的结果。在单一 博弈中,合作是很难建立的。博弈中,合作是很难建立的。 q重复博弈(重复博弈(repeated game):同样的:同样的 博弈人、同样的博弈重复进行多次。博弈人、同样的博
37、弈重复进行多次。 在重复博弈中,合作是可能的。在重复博弈中,合作是可能的。 q重复博弈可以促进合作(或诚实)主要重复博弈可以促进合作(或诚实)主要 是因为是因为:现在的合作是为了以后的合作,:现在的合作是为了以后的合作, 或者说,对现在的不合作或欺骗的惩罚或者说,对现在的不合作或欺骗的惩罚 是以后的不合作。当合作的报酬大于不是以后的不合作。当合作的报酬大于不 合作的报酬时,合作是一个较佳的策略。合作的报酬时,合作是一个较佳的策略。 q在重复博弈中,重复博弈的次数可以是在重复博弈中,重复博弈的次数可以是 有限的数次,也可以是无数次。在这两有限的数次,也可以是无数次。在这两 种情况下,结果是不同的
38、。种情况下,结果是不同的。 q 如果重复博弈的次数是有限的数次,比如如果重复博弈的次数是有限的数次,比如 说说5次,情况会怎么样呢?次,情况会怎么样呢? q 我们先看最后一次博弈,因为博弈双方都我们先看最后一次博弈,因为博弈双方都 知道这是最后一次,结果跟单一博弈时一知道这是最后一次,结果跟单一博弈时一 样,即(样,即(C,C)。)。 q 第四次博弈时,双方知道以后不会有合作,第四次博弈时,双方知道以后不会有合作, 所以最佳策略也是(所以最佳策略也是(C,C)。)。 q 如此反推,在第一次时也不会有合作。如此反推,在第一次时也不会有合作。 只有在重复博弈次数无限的时候,合作只有在重复博弈次数无
39、限的时候,合作 才有可能。才有可能。 如果你的对手现在选择如果你的对手现在选择C(欺骗),在(欺骗),在 以后的博弈你永远会选以后的博弈你永远会选C。 只要博弈双方都在意以后的报酬,那么只要博弈双方都在意以后的报酬,那么 彼此都有积极性在当前博弈中选彼此都有积极性在当前博弈中选H。 q重复博弈的机制,即所谓的重复博弈的机制,即所谓的“针锋相对针锋相对”策策 略(略(tit-for-tat strategy),是:),是: 在第一次博弈中,博弈人一选在第一次博弈中,博弈人一选H; 在以后的每次博弈中,只要在前一次博弈中在以后的每次博弈中,只要在前一次博弈中 博弈人二也是选博弈人二也是选H,博弈人
40、一继续选,博弈人一继续选H; 一旦在前一次博弈中博弈人二选了一旦在前一次博弈中博弈人二选了C,博弈,博弈 人一在当前博弈中肯定选人一在当前博弈中肯定选C。 反之亦然。反之亦然。 q名誉(名誉(reputation)的价值:如果你有诚实的的价值:如果你有诚实的 名誉,你现在的合作伙伴很可能也会选择诚名誉,你现在的合作伙伴很可能也会选择诚 实,你就会享受合作的成果。推而广之,你实,你就会享受合作的成果。推而广之,你 的新的合作伙伴也有较大的可能性会选择诚的新的合作伙伴也有较大的可能性会选择诚 实。实。 q“It helps with your customers, suppliers, and e
41、mployees. Your reputation is everything, and should be protected at any cost.” David Glass, CEO, Wal-Mart. 动态博弈动态博弈 / / 静态博弈静态博弈 单人博弈单人博弈/ /两人博弈两人博弈/ /多人博弈多人博弈 零和博弈零和博弈/ /常和博弈常和博弈/ /变和博弈变和博弈 有限策略博弈有限策略博弈/ /无限策略博弈无限策略博弈 完全信息博弈完全信息博弈/ /不完全信息博弈不完全信息博弈 非合作博弈非合作博弈 / / 合作博弈合作博弈 静态博弈:决策选择同步进行静态博弈:决策选择同步进行
42、动态博弈:决策选择有先后次序动态博弈:决策选择有先后次序 只有一个博弈方,一个博弈方面只有一个博弈方,一个博弈方面 对一定局面如何决策的问题。个体最优化问题对一定局面如何决策的问题。个体最优化问题 25万元万元-20万元 10万元10万元 受损事件发生受损事件发生25% 受损事件不发生受损事件不发生75% 自然自然 存入银行存入银行 投资证卷投资证卷 张三张三 投资证卷的期望收益投资证卷的期望收益: 25 75%( 20) 25%13.75 10 两人博弈:两人博弈:两个各自独立决策,相互具有策两个各自独立决策,相互具有策 略依存关系的博弈方之间的博弈。最常见,略依存关系的博弈方之间的博弈。最
43、常见, 最普通。最普通。 特点:特点: 两个博弈方利益可对抗,可不对抗两个博弈方利益可对抗,可不对抗 掌握信息多不一定得益多掌握信息多不一定得益多 个人追求利益最大化往往不能使社会利益最大化个人追求利益最大化往往不能使社会利益最大化 多人博弈:多人博弈:三个或三个以上的博弈方参加。三个或三个以上的博弈方参加。 特点:特点: 与两人博弈类似与两人博弈类似 可能存在破坏者可能存在破坏者 零和博弈:各博弈方得益之和总为零。零和博弈:各博弈方得益之和总为零。 “你死我活你死我活” Eg:剪刀石头布,打官司,竞选,竞标剪刀石头布,打官司,竞选,竞标 常和博弈:各博弈方得益之和为非零常数。常和博弈:各博弈
44、方得益之和为非零常数。 “你多我少你多我少” Eg:多人分食某物,某单位确定分配方案。多人分食某物,某单位确定分配方案。 变和博弈:博弈方的得益总和可大可小,可变和博弈:博弈方的得益总和可大可小,可 以变化。以变化。 博弈方的得益之和大小取决于博弈方采取的博弈方的得益之和大小取决于博弈方采取的 策略组合。如囚徒困境。策略组合。如囚徒困境。 有限策略博弈:有限策略博弈:可供博弈方选择的策略数量可供博弈方选择的策略数量 有限。有限。 无限策略博弈:无限策略博弈:可供博弈方选择的策略数量可供博弈方选择的策略数量 无限。无限。 完全信息博弈:完全信息博弈:各博弈方都完全了解所有博各博弈方都完全了解所有
45、博 弈方各种情况下得益。弈方各种情况下得益。 囚徒困境囚徒困境 不完全信息博弈:不完全信息博弈:至少存在部分博弈方不完至少存在部分博弈方不完 全了解其他博弈方的得益。全了解其他博弈方的得益。 竞标,打牌竞标,打牌 合作博弈:合作博弈:各博弈方能达成某种有约束力的各博弈方能达成某种有约束力的 协议,以使他们选择共同的或联合的策略,协议,以使他们选择共同的或联合的策略, 从而实现利益最大化。从而实现利益最大化。 非合作博弈:非合作博弈:各博弈方不存在任何有约束力各博弈方不存在任何有约束力 的协议,不能的协议,不能“串通,勾结,共谋串通,勾结,共谋”,只追,只追 求个人利益最大化。求个人利益最大化。
46、 猪圈里有两头猪,一头大猪,一头小猪。猪圈里有两头猪,一头大猪,一头小猪。 猪圈的一边有个踏板,每踩一下踏板,在远猪圈的一边有个踏板,每踩一下踏板,在远 离踏板的猪圈的另一边的投食口就会落下少离踏板的猪圈的另一边的投食口就会落下少 量的食物。如果有一只猪去踩踏板,另一只量的食物。如果有一只猪去踩踏板,另一只 猪就有机会抢先吃到另一边落下的食物。当猪就有机会抢先吃到另一边落下的食物。当 小猪踩动踏板时,大猪会在小猪跑到食槽之小猪踩动踏板时,大猪会在小猪跑到食槽之 前刚好吃光所有的食物;若是大猪踩动了踏前刚好吃光所有的食物;若是大猪踩动了踏 板,则还有机会在小猪吃完落下的食物之前板,则还有机会在小
47、猪吃完落下的食物之前 跑到食槽,争吃到另一半残羹。跑到食槽,争吃到另一半残羹。 小猪将选择小猪将选择“搭便车搭便车”策略,也就是舒舒服策略,也就是舒舒服 服地等在食槽边;而大猪则为一点残羹不知服地等在食槽边;而大猪则为一点残羹不知 疲倦地奔忙于踏板和食槽之间。疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,原因何在?因为,小猪踩踏板将一无所获, 不踩踏板反而能吃上食物。对小猪而言,无不踩踏板反而能吃上食物。对小猪而言,无 论大猪是否踩动踏板,不踩踏板总是好的选论大猪是否踩动踏板,不踩踏板总是好的选 择。反观大猪,已明知小猪是不会去踩动踏择。反观大猪,已明知小猪是不会去踩动踏
48、 板的,自己亲自去踩踏板总比不踩强吧,所板的,自己亲自去踩踏板总比不踩强吧,所 以只好亲力亲为了。以只好亲力亲为了。 “小猪躺着大猪跑小猪躺着大猪跑”的现象是由于故事中的的现象是由于故事中的 游戏规则所导致的。规则的核心指标是:每游戏规则所导致的。规则的核心指标是:每 次落下的事物数量和踏板与投食口之间的距次落下的事物数量和踏板与投食口之间的距 离。离。 如果改变一下核心指标,猪圈里还会出如果改变一下核心指标,猪圈里还会出 现同样的现同样的“小猪躺着大猪跑小猪躺着大猪跑”的景象吗?试的景象吗?试 试看。试看。 改变方案一:减量方案。投食仅原来的一半改变方案一:减量方案。投食仅原来的一半 分量。
49、分量。 改变方案二:增量方案。投食为原来的一倍改变方案二:增量方案。投食为原来的一倍 分量。分量。 改变方案三:减量加移位方案。投食仅原来改变方案三:减量加移位方案。投食仅原来 的一半分量,但同时将投食口移到踏板附近。的一半分量,但同时将投食口移到踏板附近。 法国经济学家古诺(法国经济学家古诺(Augustin CournotAugustin Cournot)1919 世纪提出一个简单双寡头模型。假定两个厂世纪提出一个简单双寡头模型。假定两个厂 商生产同样产品并都知道市场需求,各厂商商生产同样产品并都知道市场需求,各厂商 必须决定生产多少,并且它们同时作出决策。必须决定生产多少,并且它们同时作
50、出决策。 作产量决策时,各厂商必须考虑它的竞争者,作产量决策时,各厂商必须考虑它的竞争者, 因为对手也在考虑产量决策,并且它能够得因为对手也在考虑产量决策,并且它能够得 到的产量取决于两个厂商的总产量。到的产量取决于两个厂商的总产量。 古诺模型实质是各厂商将它的竞争者产量看古诺模型实质是各厂商将它的竞争者产量看 作固定的,然后决定自己生产多少。作固定的,然后决定自己生产多少。 如果如果A A认为认为B B不生产,不生产,A A需求线需求线 就是市场需求线:就是市场需求线:D DA A( (0 0)和 和 MRMRA A( (0 0),),假定边际成本为常 假定边际成本为常 数(数(MCMCA
51、A),利润最大化产出),利润最大化产出 为为5050。如。如A A认为认为B B产出为产出为5050, 则则A A需求线左移动需求线左移动5050个单位,个单位, 为为D DA A( (5050)和 和MRMRA A( (5050),),均衡产 均衡产 量量2525。如。如A A认为认为B B产出量为产出量为7575, 它最佳产出它最佳产出12.512.5;B B产出产出100100 或更多时,或更多时,A A产出量应为零。产出量应为零。 B B产量越大,产量越大,A A均衡产量越小,均衡产量越小, A A利润最大化产量是它预期的利润最大化产量是它预期的 B B产量减函数。产量减函数。B B均
52、衡产量也均衡产量也 是它预期的是它预期的A A产量的减函数。产量的减函数。 DA(0) MRA(0) DA(50) DA(75) MRA(50) MRA(75) Q 5025 12.5 P MCA 厂商厂商A A产量的决定函数产量的决定函数 称为厂商称为厂商A A的反应曲线的反应曲线 并表示为并表示为Q QA A* *(Q QB B);); 厂商厂商B B产量决定函数称产量决定函数称 为厂商为厂商B B的反应曲线并的反应曲线并 表示为表示为Q QB B* *(Q QA A)。图)。图 中中Q QA A* *(Q QB B)依据前面)依据前面4 4 个产量组合点作出,个产量组合点作出,B B 反
53、应曲线任意给出。反应曲线任意给出。 两个曲线交点给出了两个曲线交点给出了 均衡产量,称为古诺均衡产量,称为古诺 均衡。具有纳什均衡均衡。具有纳什均衡 性质。性质。 QB QA 10075 5025 25 50 75 100 古诺均衡点古诺均衡点 厂商厂商B的反应曲线的反应曲线Q QB B* *(Q QA A) 厂商厂商A的反应曲线的反应曲线Q QA A* *(Q QB B) 12.5 求解一个简单古诺模型,讨论它与竞争均衡和串求解一个简单古诺模型,讨论它与竞争均衡和串 谋均衡区别。谋均衡区别。 假定双寡头面临市场需求曲线:假定双寡头面临市场需求曲线: P = 60 - Q P = 60 - Q
54、 ;(;(Q = QQ = Q1 1 + Q + Q2 2);); 设设 MCMC1 1 = AC = AC1 1 = MC = MC2 2 = AC = AC2 2 = 6 = 6。 先求厂商先求厂商1 1反应曲线:反应曲线: TRTR1 1 = PQ = PQ1 1 = =(60 - Q60 - Q)Q Q1 1 = (60-Q = (60-Q1 1 - Q - Q2 2)Q)Q1 1 = 60Q = 60Q1 1 - Q - Q1 12 2- Q- Q2 2Q Q1 1 MRMR1 1 = dTR = dTR1 1/dQ/dQ1 1 = 60 - 2Q = 60 - 2Q1 1 - Q - Q2 2 由由MRMR1 1 = MC = MC1 1 = 6 = 6 解得厂商解得厂商1 1反应函数为:反应函数为: Q Q1 1 = 27 - Q = 27 - Q2 2/2 /2 (1 1) 类似方法求类似方法求TRTR2 2和和MRMR2 2,得厂商,得厂商2 2反应函数为:反应函数为: Q Q2 2 = 27 - Q = 27 - Q1 1/2 /2 (2 2) 古诺均衡解是(古诺均衡解是(1 1)和()和(2 2)的方程组解:)的方程组解
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药剂科年终工作汇报与未来规划计划
- 信阳师范大学《MG动画》2022-2023学年第一学期期末试卷
- 西京学院《景观小品设计》2023-2024学年第一学期期末试卷
- 西华师范大学《英语演讲与辩论》2023-2024学年第一学期期末试卷
- 西华大学《装饰基础》2021-2022学年第一学期期末试卷
- 西昌学院《版式设计》2022-2023学年第一学期期末试卷
- 西北大学《心理危机干预专题》2023-2024学年第一学期期末试卷
- 西北大学《色彩构成》2021-2022学年第一学期期末试卷
- 西北大学《包装设计》2023-2024学年第一学期期末试卷
- 11.2+化学肥料-2023-2024学年九年级化学人教版下册
- 应用文写作之新闻报道
- 卷膜按卷径计算公式
- 设计分包合作合同协议书范本
- 针灸专业词汇英文对照
- 破裂强度标准
- 核心素养视域下小学数学命题的创新策略分析
- 有源光器件及无源光器件区别及基础
- 传热学第五版答案
- 制粒机内部结构图ppt课件
- 毕业设计(论文)基于汇编语言与接口技术的音乐盒设计
- 中小学校消防器材配备标准
评论
0/150
提交评论