版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、经济与管理学院经济与管理学院 杜震杜震产业经济学产业经济学Industrial Economics 博弈论初步博弈论初步仙人指路仙人指路 有个智者去找神仙,走到一个三岔路口,不知道有个智者去找神仙,走到一个三岔路口,不知道往左走还是往右。路口边站着两个天使,他俩一往左走还是往右。路口边站着两个天使,他俩一个永远说真话,另一个永远说假话,现在要求这个永远说真话,另一个永远说假话,现在要求这个智者只能向其中一位天使问一句话,就确定神个智者只能向其中一位天使问一句话,就确定神仙的方位。仙的方位。 请问:这个智者怎么问才能有结果?请问:这个智者怎么问才能有结果?抢抢30游戏游戏 由甲、乙两人依次从由甲
2、、乙两人依次从1开始报数,每次可以连续开始报数,每次可以连续报数一个或两个,谁抢到报数一个或两个,谁抢到30就胜出。就胜出。抢抢30游戏游戏 如果要想抢到如果要想抢到30,那么对手一定要留下,那么对手一定要留下1个或个或2个数,即个数,即留下留下30或留下或留下29、30 再往前追溯一步,应该给对手留下几个数呢?再往前追溯一步,应该给对手留下几个数呢? 如果留下如果留下1个数或个数或2个数,那么对手直接获胜;个数,那么对手直接获胜; 如果留下如果留下3个数,那么对手只能给我们留下个数,那么对手只能给我们留下1个或个或2个数,我方个数,我方肯定获胜;肯定获胜; 如果留下如果留下4个数,对手可以留
3、下个数,对手可以留下3个数,只好输掉个数,只好输掉 结论:结论: 要抢到要抢到30,必须抢到,必须抢到27,要抢到,要抢到27,必须抢到,必须抢到24! 关键数关键数30、27、24、21、3。 只要在报数过程中,一旦抢到只要在报数过程中,一旦抢到3的倍数,就可以每次都抢到的倍数,就可以每次都抢到3的倍数,直到最后获得胜利。的倍数,直到最后获得胜利。Game Theory博弈论博弈论 Game theory involves the study of strategic situations博弈论涉及对策略性情况的研究博弈论涉及对策略性情况的研究 Game theory models atte
4、mpt to portray complex strategic situations in a highly simplified and stylized setting博弈论的模型试图用极简单和程式化的博弈论的模型试图用极简单和程式化的设定来描述复杂的策略情况设定来描述复杂的策略情况 abstract from personal and institutional details in order to arrive at a representation of the situation that is mathematically tractable 从个人和制度的细节中从个人和制度
5、的细节中进行抽象,以得到数学上可处理的表达式进行抽象,以得到数学上可处理的表达式博弈三要素博弈三要素 All games have three elements players 博弈方博弈方 strategies 策略策略 payoffs 报酬报酬规则、理性与最优规则、理性与最优博弈的表达方式博弈的表达方式1博弈的表达方式博弈的表达方式2优势均衡与纳什均衡优势均衡与纳什均衡 优势均衡:优势均衡:我所做的是不管你做什么我所能做的我所做的是不管你做什么我所能做的最好的;你所做的是不管我做什么你所能做的最最好的;你所做的是不管我做什么你所能做的最好的好的 纳什均衡纳什均衡:我所做的是给定你所做的我所
6、能做的:我所做的是给定你所做的我所能做的最好的;你所做的是给定我所做的你所能做的最最好的;你所做的是给定我所做的你所能做的最好的好的博弈均衡的求解博弈均衡的求解 优势均衡是稳定的优势均衡是稳定的 纳什均衡也是稳定的(理性共识)纳什均衡也是稳定的(理性共识) 占优决策可以看作是纳什均衡的特例占优决策可以看作是纳什均衡的特例 纳什均衡更具普遍性纳什均衡更具普遍性 纳什均衡是非合作博弈,纳什均衡未必是社会最纳什均衡是非合作博弈,纳什均衡未必是社会最优(囚徒困境)优(囚徒困境)优势均衡的求解方法优势均衡的求解方法 划线法划线法 适用于寻找最优解适用于寻找最优解 方法:先寻找行的最优解,划线,再寻找列的
7、最方法:先寻找行的最优解,划线,再寻找列的最优解,划线优解,划线 缺陷:只有少数博弈存在优势均衡解,多数博弈缺陷:只有少数博弈存在优势均衡解,多数博弈中不存在优势策略,但不代表均衡不存在中不存在优势策略,但不代表均衡不存在 典型:囚徒困境典型:囚徒困境 现实:寡头定价、二级密封价格拍卖、军备竞赛现实:寡头定价、二级密封价格拍卖、军备竞赛、公地悲剧和团队生产等、公地悲剧和团队生产等划线法可解的优势均衡划线法可解的优势均衡无占优决策的均衡解(多重解)无占优决策的均衡解(多重解)现实中的囚徒困境现实中的囚徒困境走出囚徒困境走出囚徒困境 报复报复 抵押抵押 文化、宗教和意识形态教育文化、宗教和意识形态
8、教育 声誉(重复博弈)声誉(重复博弈) 还有么?还有么?蚂蚁的交通问题蚂蚁的交通问题蚂蚁的交通问题蚂蚁的交通问题类似的例子类似的例子重复剔除严格劣策略重复剔除严格劣策略 重复剔除严格劣策略(重复剔除严格劣策略(IESDS) 理由:理性人不会选择一个严格劣策略理由:理性人不会选择一个严格劣策略 要求:理性共识要求:理性共识 方法:依次将严格劣策略划掉,最后剩下的是优势均衡方法:依次将严格劣策略划掉,最后剩下的是优势均衡 典型:智猪博弈典型:智猪博弈 特征:一方存在严格劣策略,会有一方特征:一方存在严格劣策略,会有一方free ride,IESDS均衡不保证均衡不保证pareto最优(外部性)最优
9、(外部性) 现实:企业广告、研发行为;大股东与小股东现实:企业广告、研发行为;大股东与小股东 解决方案:界定产权、制定法律、道德谴责等解决方案:界定产权、制定法律、道德谴责等智猪博弈与企业研发智猪博弈与企业研发极大化极小策略极大化极小策略Maxmin:寻找能在最坏处境下最好可能支付的行动方向。:寻找能在最坏处境下最好可能支付的行动方向。极小极大定理极小极大定理(1928;约翰;约翰冯冯诺依曼诺依曼1903-57) 对于每个两人零和博弈,每对于每个两人零和博弈,每个局中人都存在一个混合策略使得当局中人使用这些策略时,双方有相同的个局中人都存在一个混合策略使得当局中人使用这些策略时,双方有相同的支
10、付期望。而且,这个期望值也是每个局中人能指望从博弈的一局中得到的支付期望。而且,这个期望值也是每个局中人能指望从博弈的一局中得到的最优支付。因此,这些混合策略是两个局中人所用的最优策略。最优支付。因此,这些混合策略是两个局中人所用的最优策略。1943 俾斯麦海战俾斯麦海战1943 俾斯麦海战俾斯麦海战美丽心灵美丽心灵与纳什均衡与纳什均衡 亚当斯密与纳什亚当斯密与纳什 个体理性、集体理性和交互理性个体理性、集体理性和交互理性 NE的解的解纳什均衡的存在性问题:纳什均衡的存在性问题:No NE纳什均衡的存在性问题:多重解纳什均衡的存在性问题:多重解 麦琪的礼物麦琪的礼物与纳什均衡与纳什均衡Batt
11、le of Sexes 一男一女谈恋爱,业余活动安排:看足球比赛,或者去看芭蕾舞演出。男的一男一女谈恋爱,业余活动安排:看足球比赛,或者去看芭蕾舞演出。男的偏好足球,女的则更喜欢芭蕾。但他们都宁愿在一起,不愿分开。偏好足球,女的则更喜欢芭蕾。但他们都宁愿在一起,不愿分开。你如何解决多重解问题?你如何解决多重解问题? 男女足球芭蕾足球2 , 10 , 0芭蕾0 , 01 , 2Battle of Sexes 究竟哪一个纳什均衡会实际发生呢?究竟哪一个纳什均衡会实际发生呢? 我们不知道!我们不知道! 但聪明的恋爱中的人们总是能找到解决方案。但聪明的恋爱中的人们总是能找到解决方案。 也许是这一次看足
12、球,下次看看芭蕾,如此循环,形也许是这一次看足球,下次看看芭蕾,如此循环,形成一种默契。成一种默契。 也许存在先动优势(也许存在先动优势(first-move advantage),比如),比如说,若男的买票,两人就会出现在足球场(是如此吗说,若男的买票,两人就会出现在足球场(是如此吗?),若女的买票,两人就会出现在芭蕾舞厅。?),若女的买票,两人就会出现在芭蕾舞厅。 混合策略混合策略 混合策略是纯策略的概率分布。混合策略是纯策略的概率分布。 混合策略的解法混合策略的解法1:收益等价法:收益等价法 混合策略的解法混合策略的解法2:最大值法:最大值法麦琪的礼物麦琪的礼物的混合策略均衡的混合策略均
13、衡麦琪的礼物麦琪的礼物的混合策略均衡解:收益等价法的混合策略均衡解:收益等价法 混合策略均衡要求参与人在所有行动之间的期望混合策略均衡要求参与人在所有行动之间的期望收益相等,否则纯策略就可以解决。收益相等,否则纯策略就可以解决。救济悖论的混合策略均衡救济悖论的混合策略均衡救济悖论的混合策略均衡解:最大值法救济悖论的混合策略均衡解:最大值法纳什均衡的应用纳什均衡的应用纳什均衡的应用:古诺模型纳什均衡的应用:古诺模型 两个生产同样产品的厂商,他们都知道市场需求,并两个生产同样产品的厂商,他们都知道市场需求,并同时同时作出决策作出决策 厂商一在假定厂商二产量厂商一在假定厂商二产量为为Q Q2 2时,
14、它选择利润最大化产量时,它选择利润最大化产量Q Q1 1,即,即Q Q1 1(Q Q2 2););厂商二也是假定在厂商一产量厂商二也是假定在厂商一产量为为Q Q1 1时,时,它选择利润最大化产量它选择利润最大化产量Q Q2 2,即,即Q Q2 2(Q Q1 1) 均衡水平决定于均衡水平决定于Q Q1 1(Q Q2 2)和)和Q Q2 2(Q Q1 1)最优反应曲线的交点最优反应曲线的交点 这是一个纳什均衡点,各厂商采取了给定对手行为策略时这是一个纳什均衡点,各厂商采取了给定对手行为策略时,它所能做的最好行为,它所能做的最好行为例 双寡头,面临的市场需求曲线为P=30-Q,并且MC1=MC2=0
15、,它们的均衡产量为多少? 厂商厂商1 1:R R1 1=PQ=PQ1 1= =(30-Q30-Q)Q Q1 1=30 Q=30 Q1 1 - Q- Q1 1 Q QQ=QQ=Q1 1+Q+Q2 2R R1 1= 30 Q= 30 Q1 1 - Q- Q1 1 ( Q Q1 1+Q+Q2 2 )=30 Q=30 Q1 1 - Q- Q1 1 2 2 - Q- Q1 1 Q Q2 2 MRMR1 1= = R R1 1=30-2Q=30-2Q1 1-Q-Q2 2=MC=MC1 1=0=0Q Q1 1=15-=15-(1/21/2)Q Q2 2为厂商为厂商1 1针对厂商针对厂商2 2的最优反应曲线的
16、最优反应曲线纳什均衡的应用:古诺模型纳什均衡的应用:古诺模型 厂商厂商2 2 的最优反应曲线为:的最优反应曲线为:Q Q2 2=15-=15-(1/21/2)Q Q1 1 均衡点:均衡点: Q Q1 1=15-=15-(1/21/2)Q Q2 2 Q Q2 2=15-=15-(1/21/2)Q Q1 1 均衡产量:均衡产量: Q1=10Q1=10 Q Q2 2=10=10 均衡均衡P=10P=10 厂商厂商1 1和和2 2的利润为的利润为100100纳什均衡的应用:古诺模型纳什均衡的应用:古诺模型纳什均衡的应用:古诺模型纳什均衡的应用:古诺模型Q1Q21530Q1=15-1/2Q2Q2=15-
17、1/2Q115301010对照对照1:完全竞争:完全竞争 P=30-QP=30-Q为行业需求曲线为行业需求曲线 厂商的需求曲线为水平线,在均衡厂商的需求曲线为水平线,在均衡点点P=MR=MC=0P=MR=MC=0 30-Q=030-Q=0 Q=30Q=30 Q Q1 1+Q+Q2 2=30=30 势均力敌的两厂商平分势均力敌的两厂商平分Q Q,Q Q1 1=Q=Q2 2=15=15对照对照2:相互串通:相互串通 P=30-QP=30-Q为市场需求曲线为市场需求曲线 R=PQ=30Q-QR=PQ=30Q-Q2 2 R=30-2Q=0R=30-2Q=0 Q=15Q=15时,总利润最大时,总利润最大
18、 两厂商平分,两厂商平分,Q Q1 1=Q=Q2 2=7.5=7.5 P=15P=15 厂商厂商1 1,厂商,厂商2 2的利润各为的利润各为112.5112.5,利润最大利润最大纳什均衡的应用:斯塔克博格模型纳什均衡的应用:斯塔克博格模型 纳什均衡是针对同时作出产量决策的厂商,如果纳什均衡是针对同时作出产量决策的厂商,如果有一个先作出决策,这对它是否更有利?各生产有一个先作出决策,这对它是否更有利?各生产多少?多少? 厂商厂商2 2:它把厂商:它把厂商1 1产量看作既定时的反应:产量看作既定时的反应: Q Q2 2=15-=15-(1/21/2)Q Q1 1 厂商厂商1 1:R R1 1=PQ
19、=PQ1 1= =(30-Q30-Q)Q Q1 1= =(30-Q30-Q1 1-Q-Q2 2)Q Q1 1 R1=30QR1=30Q1 1-Q-Q1 12 2-Q-Q1 1Q Q2 2 厂商厂商1 1知道厂商知道厂商2 2会依据反应函数选择产量会依据反应函数选择产量Q Q2 2,将,将Q Q2 2代入代入R R1 1纳什均衡的应用:先行者利益(动态)纳什均衡的应用:先行者利益(动态)例 P=30-Q为市场需求曲线,MC1=MC2=0,厂商1先决定产量,厂商2后决定? R R1 1=30Q=30Q1 1-Q-Q1 12 2-Q-Q1 1Q Q2 2 R R1 1=30Q=30Q1 1-Q-Q1
20、 12 2-Q-Q1 1(15-1/2Q15-1/2Q1 1) R R1 1=15Q=15Q1 1-1/2Q-1/2Q1 12 2 MRMR1 1=15-Q=15-Q1 1=0=0 均衡点:均衡点: Q Q1 1=15=15 Q Q2 2=7.5=7.5 P=7.5P=7.5( P=30-QP=30-Q ) 厂商厂商1 1的利润为的利润为202 .5202 .5,厂商,厂商2 2的利润为的利润为56.2556.25 先行者获利更多先行者获利更多纳什均衡的应用:斯塔克博格模型纳什均衡的应用:斯塔克博格模型斯塔克博格均衡斯塔克博格均衡Q1Q21530Q1=15-1/2Q2Q2=15-1/2Q115
21、3010107.5斯塔克博格均衡斯塔克博格均衡产量竞争与价格竞争产量竞争与价格竞争 对于绝大多数产业来说,相对于价格决策而言,对于绝大多数产业来说,相对于价格决策而言,生产能力和产量决策是长期决策。生产能力和产量决策是长期决策。调整产量和生调整产量和生产能力要比调整价格困难得多。产能力要比调整价格困难得多。 企业需要在企业需要在第一阶段第一阶段先决定产量和生产能力,然先决定产量和生产能力,然后在后在第二阶段第二阶段决定价格。决定价格。 企业进行价格竞争时企业进行价格竞争时必须考虑生产能力的限制。必须考虑生产能力的限制。 任天堂的价格策略任天堂的价格策略 1999年年8月,索尼公司把电视游戏机的
22、价格从月,索尼公司把电视游戏机的价格从129美元降美元降到到99美元。美元。 令人惊讶的是,仅仅在索尼发布消息令人惊讶的是,仅仅在索尼发布消息1小时后,任天堂公小时后,任天堂公司就发表声明将与索尼同比降价。两家公司富有攻击性的司就发表声明将与索尼同比降价。两家公司富有攻击性的定价行为刺激了它们产品的消费。定价行为刺激了它们产品的消费。 然而,任天堂的产能却并不能满足需求量的大幅上升,结然而,任天堂的产能却并不能满足需求量的大幅上升,结果,果,1999年暑假期间,任天堂的产品极度短缺。年暑假期间,任天堂的产品极度短缺。 AMD Intel同质产品的价格竞争同质产品的价格竞争伯川德模型伯川德模型
23、三种情况三种情况 全部市场份额全部市场份额 均分市场份额均分市场份额 零零 如果不合作,纳什均衡解为完全竞争时价格如果不合作,纳什均衡解为完全竞争时价格3 伯川德悖论:寡头垄断无法进行控制价格伯川德悖论:寡头垄断无法进行控制价格P=30-Q为市场需求曲线,MC1=MC2=3,厂商1与厂商2进行价格竞争?伯川德均衡伯川德均衡 由于市场需求会倒由于市场需求会倒向价格较低者,价向价格较低者,价格战只会导致双方格战只会导致双方都定价为都定价为p1=p2=c 一方的价格高于此一方的价格高于此,就会失去全部市,就会失去全部市场份额,低于此就场份额,低于此就会亏损会亏损cc企业企业2的最佳对策的最佳对策pm
24、45。伯川德悖论的解伯川德悖论的解 生产能力约束生产能力约束 动态竞争动态竞争合谋合谋 产品差异化产品差异化哪些行业适合伯川德模型哪些行业适合伯川德模型 如软件业、保险业和银行业,生产能力的调整比如软件业、保险业和银行业,生产能力的调整比价格调整更快价格调整更快 全全32册精装大英百科全书的售价一直是册精装大英百科全书的售价一直是1600美元美元 1990年初,微软与年初,微软与Encarta联手出版了联手出版了CD版,售版,售价不超过价不超过100美元。美元。 大英百科全书立即也出版了自己的大英百科全书立即也出版了自己的CD版。版。 现在,这两种版本的售价都在现在,这两种版本的售价都在89.
25、99美元。美元。异质产品的价格竞争异质产品的价格竞争 产品存在差别时通过选择价格竞争是可行的产品存在差别时通过选择价格竞争是可行的 假设双寡头,各有固定成本假设双寡头,各有固定成本20美元,面临相同的需求曲线美元,面临相同的需求曲线。 厂商厂商1:Q1=12-2P1+P2 厂商厂商2:Q2=12-2P2+P11=P1Q1-C1=P1( 12-2P1+P2)-20=12 P1 -2P12+ P1 P2 20P2固定时,固定时, P1多少,多少, 1最大?最大? 1/ P1 = 12-4 P1 + P2=0P1 =3+1/4 P2(1)P2 =3+1/4 P1(2)异质产品的价格竞争异质产品的价格
26、竞争纳什均衡为:纳什均衡为:P1 =3+1/4 P2P2 =3+1/4 P1P1 = P2 =4MC=01= 2 =12异质产品的价格竞争异质产品的价格竞争串谋串谋= 1+ 2= P1 Q1 + P2 Q2 40= 12 P1 -2P12+ P1 P2 +12 P2 -2P22+ P1 P2 40当他们选择共同的价格时,当他们选择共同的价格时, P1 = P2 =P=24P-2P2-40 / P =24-4P=0P=6当当P1 = P2 =6时,共同利润最大,平分利润,各自利时,共同利润最大,平分利润,各自利润为润为16 异质产品的动态伯川德模型异质产品的动态伯川德模型 价格领导者:逆向归纳价
27、格领导者:逆向归纳 数量竞争与价格竞争数量竞争与价格竞争 取决于行业特性:产量的调整速度取决于行业特性:产量的调整速度 先发优势与后发优势(先发优势与后发优势(P66) 取决于反应曲线的斜率:取决于反应曲线的斜率: 斯塔克伯格负斯塔克伯格负战略替代战略替代 伯川德为正伯川德为正战略互补战略互补卡特尔卡特尔 既古诺与伯川德的串谋形式既古诺与伯川德的串谋形式 卡特尔的稳定性卡特尔的稳定性P72 影响稳定性的因素影响稳定性的因素 维持稳定性的条件维持稳定性的条件完全信息动态博弈完全信息动态博弈 博弈树博弈树 逆向归纳法逆向归纳法博弈树博弈树 动态博弈涉及时间顺序,普通矩阵结构难以表达动态博弈涉及时间
28、顺序,普通矩阵结构难以表达 若女生下午若女生下午2节课,男生下午节课,男生下午4节课,女生具有先选择权节课,女生具有先选择权男女拳击芭蕾拳击2 , 10 , 0芭蕾0 , 01 , 2博弈的扩展型表达方式博弈的扩展型表达方式博弈树中包含若干博弈树中包含若干“节节点点”,节点用小圆圈表示。,节点用小圆圈表示。位于博弈树最上端的节点位于博弈树最上端的节点称为称为“初始节点初始节点”,用空,用空心小圆圈表示,其他节点心小圆圈表示,其他节点均用实心小圆圈表示。均用实心小圆圈表示。在每个节点处均对应某个在每个节点处均对应某个博弈参与者,将节点对应博弈参与者,将节点对应的博弈参与者标识在节点的博弈参与者标
29、识在节点旁边。旁边。动态市场争夺战博弈的扩展型表达方式动态市场争夺战博弈的扩展型表达方式如果初始节点处的博弈参与如果初始节点处的博弈参与者存在者存在 N 种策略,那么就从种策略,那么就从初始节点处分出初始节点处分出 N 条路径。条路径。路径用线段表示。在线段旁路径用线段表示。在线段旁注明相应的策略。注明相应的策略。当博弈不再有后续节点时,当博弈不再有后续节点时,需要将博弈的收益标识在博需要将博弈的收益标识在博弈树末端。弈树末端。需要注意的是:各博弈参与需要注意的是:各博弈参与者的收益需要按照各参与者者的收益需要按照各参与者行动顺序进行排列。行动顺序进行排列。博弈树各节点之间存在顺博弈树各节点之
30、间存在顺序关系,博弈树由上至下序关系,博弈树由上至下的节点顺序表示各博弈参的节点顺序表示各博弈参与者进行决策的顺序。与者进行决策的顺序。博弈树与博弈顺序博弈树与博弈顺序从博弈树的节点从博弈树的节点可以引出多条线可以引出多条线段,但不能从博段,但不能从博弈树多个节点共弈树多个节点共同到达博弈树下同到达博弈树下方同一个后续节方同一个后续节点。点。错误的博弈树构造方法错误的博弈树构造方法构造博弈树时只构造博弈树时只能按照由上至下能按照由上至下的路径,而不能的路径,而不能存在由下向上的存在由下向上的路径,也不能形路径,也不能形成循环路径。成循环路径。回溯路径唯一性回溯路径唯一性在求解完全信息在求解完全
31、信息动态博弈时非常动态博弈时非常重要。重要。错误的博弈树构造方法错误的博弈树构造方法信息集:三人罢工模型信息集:三人罢工模型信息集:三人罢工模型信息集:三人罢工模型 在完全信息动态博弈中,如果将博弈树的在完全信息动态博弈中,如果将博弈树的多个节点多个节点用虚线连接起来用虚线连接起来,表明这多个节,表明这多个节点位于同一个博弈信息集中。点位于同一个博弈信息集中。 也就是说:博弈参与者不知道自己位于同也就是说:博弈参与者不知道自己位于同一个信息中的哪个博弈节点上。一个信息中的哪个博弈节点上。 可以通过可以通过“三人罢工博弈三人罢工博弈”来说明信息集来说明信息集的含义以及信息集在动态博弈中的重要性的
32、含义以及信息集在动态博弈中的重要性。员工员工 2 只有一个信息集的博弈树,即他不知道员工只有一个信息集的博弈树,即他不知道员工1如何决策如何决策信息集:三人罢工模型信息集:三人罢工模型员工员工 3 不能观察到员工不能观察到员工 2 的决策策略的决策策略信息集:三人罢工模型信息集:三人罢工模型员工员工 3 不知道员工不知道员工 1 的决策策略的决策策略信息集:三人罢工模型信息集:三人罢工模型员工员工 3 不知道员工不知道员工 1 和员工和员工 2 的决策策略的决策策略信息集:三人罢工模型信息集:三人罢工模型员工员工2、3都只有一个信息集的博弈都只有一个信息集的博弈信息集:三人罢工模型信息集:三人
33、罢工模型信息集与信息分割信息集与信息分割 结论:结论: 信息集包含的元素越多,越信息集包含的元素越多,越“糊涂糊涂” 信息集个数越多,越信息集个数越多,越“清楚清楚” 信息多未必是好事,信息少未必是坏事信息多未必是好事,信息少未必是坏事 确定性程度至关重要确定性程度至关重要 陈平脱衣自救的故事陈平脱衣自救的故事博弈树的方法不仅能表示动态博弈,还能表示静态博弈。博弈树的方法不仅能表示动态博弈,还能表示静态博弈。所谓的所谓的“博弈先后顺序博弈先后顺序”,主要是一个信息的概念,而不是一个纯时间先后的概,主要是一个信息的概念,而不是一个纯时间先后的概念。念。用博弈树表示囚徒困境用博弈树表示囚徒困境博弈
34、树与静态博弈博弈树与静态博弈嫌疑人乙嫌疑人乙坦白坦白不坦白不坦白嫌疑人甲嫌疑人甲坦白坦白(5,5)(1,10)不坦白不坦白(10,1)(2,2)三种博弈表达方式内涵相同三种博弈表达方式内涵相同 有有 A BA B 两家公司,两家公司, 各有两种选择各有两种选择 A A公司资金充足公司资金充足 先行先行 B B公司需要筹措资金公司需要筹措资金 后行后行 只一家开发,获利只一家开发,获利 两家都开发,各损失两家都开发,各损失博弈的矩阵表达式博弈的矩阵表达式A博弈的矩阵表达式博弈的矩阵表达式A博弈的矩阵表达式博弈的矩阵表达式含义:含义:B不能区分不能区分A的两种策略,尽管的两种策略,尽管A可能确实选
35、的是开发,可能确实选的是开发,B依然当作依然当作两种情形处理两种情形处理博弈的矩阵表达式博弈的矩阵表达式不论不论A开发还是不开发,开发还是不开发,B开发,记为(开发,开发)开发,记为(开发,开发)A开发,开发,B开发;开发;A不开发,不开发,B不开发,记为(开发,放弃)不开发,记为(开发,放弃)不论不论A开发还是不开发,开发还是不开发,B都不开发,记为(放弃,放弃)都不开发,记为(放弃,放弃)A开发,开发,B不开发;不开发;A不开发,不开发,B开发,记为(放弃,开发)开发,记为(放弃,开发)博弈的矩阵表达式博弈的矩阵表达式NE解:解:(开发,(放弃,放弃),(开发,(放弃,放弃),(放弃,(开
36、发,开发),(放弃,(开发,开发),(放弃,(开发,放弃),(放弃,(开发,放弃),不论不论A开发还是不开发,开发还是不开发,B开发,记为(开发,开发)开发,记为(开发,开发)A开发,开发,B开发;开发;A不开发,不开发,B不开发,记为(开发,放弃)不开发,记为(开发,放弃)不论不论A开发还是不开发,开发还是不开发,B都不开发,记为(放弃,放弃)都不开发,记为(放弃,放弃)A开发,开发,B不开发;不开发;A不开发,不开发,B开发,记为(放弃,开发)开发,记为(放弃,开发)可信性可信性 动态博弈的一个中心问题是动态博弈的一个中心问题是“可信性可信性”问题问题 所谓可信性是指动态博弈中先行为的参与
37、人是否所谓可信性是指动态博弈中先行为的参与人是否该相信后行为的参与人会采取对自己有利的或不该相信后行为的参与人会采取对自己有利的或不利的行为。利的行为。 因为后行为方将来会采取对先行为方有利的行为因为后行为方将来会采取对先行为方有利的行为相当于一种相当于一种“许诺许诺”,而将来会采取对先行为方,而将来会采取对先行为方不利的行为相当于一种不利的行为相当于一种“威胁威胁”,因此我们可将,因此我们可将可信性分为可信性分为“许诺的可信性许诺的可信性”和和“威胁的可信性威胁的可信性”。 开金矿博弈开金矿博弈 甲要开采一价值甲要开采一价值4万元万元的金矿,缺的金矿,缺1万元的资万元的资金,向乙借金,向乙借
38、1万元,许万元,许诺采到金子后与乙平分诺采到金子后与乙平分 乙是否借钱给甲呢?乙是否借钱给甲呢?开金矿博弈开金矿博弈 乙最需要关心的就是甲采到乙最需要关心的就是甲采到金子后是否会履行诺言跟自金子后是否会履行诺言跟自己平分,因为万一甲采到金己平分,因为万一甲采到金子后不但不跟乙平分,而且子后不但不跟乙平分,而且还赖帐或卷款潜逃,则乙连还赖帐或卷款潜逃,则乙连自己的本钱都收不回来。自己的本钱都收不回来。 关键的是要判断的许诺是否关键的是要判断的许诺是否可信!可信! 以自身利益最大化原则,甲以自身利益最大化原则,甲必然选择不分!必然选择不分! 乙清楚甲的行为准则,最好乙清楚甲的行为准则,最好的选择是
39、不借!的选择是不借! 对乙来说,甲的许诺是不可对乙来说,甲的许诺是不可信的!信的! 子博弈完美纳什均衡子博弈完美纳什均衡 SPNE 动态博弈中存在不可信的行为选择,纳什均衡具动态博弈中存在不可信的行为选择,纳什均衡具有不稳定性。有不稳定性。 为了排除不可信的威胁或承诺因素,泽尔腾(为了排除不可信的威胁或承诺因素,泽尔腾(1965)提出了)提出了“子博弈完美纳什均衡子博弈完美纳什均衡”,用来分,用来分析动态博弈。析动态博弈。 子博弈精炼纳什均衡子博弈精炼纳什均衡不仅要求均衡解是纳什不仅要求均衡解是纳什均衡,而且要求均衡解在每一个信息集上都均衡,而且要求均衡解在每一个信息集上都是最优解是最优解 。
40、 信息的分类信息的分类子博弈子博弈在图中,用虚线框起来的部分称作一个子博弈(在图中,用虚线框起来的部分称作一个子博弈(Sub-Game)。)。一个博弈的子博弈需一个博弈的子博弈需要满足两个条件。要满足两个条件。1子博弈的起始节子博弈的起始节点不能是原来博弈的点不能是原来博弈的起始节点起始节点2子博弈不能分割子博弈不能分割信息集信息集有些博弈包含多个子有些博弈包含多个子弈;有些博弈没有子弈;有些博弈没有子博弈博弈逆向归纳法逆向归纳法 逻辑基础:逻辑基础: 动态博弈中先行动的参与人,在前面阶段选择行为动态博弈中先行动的参与人,在前面阶段选择行为时必然会考虑后行动的参与人在后面阶段中的行为时必然会考
41、虑后行动的参与人在后面阶段中的行为选择选择 只有在最后一阶段的参与人才能不受其他参与人的只有在最后一阶段的参与人才能不受其他参与人的制约而直接做出选择(制约而直接做出选择(牵制最少,决策最明确牵制最少,决策最明确) 当后面阶段的参与人的选择确定后,前一阶段的参当后面阶段的参与人的选择确定后,前一阶段的参与人的行为也随之确定与人的行为也随之确定 适用范围:适用范围: 有限次重复动态博弈有限次重复动态博弈 排除了不可信的威胁和承诺排除了不可信的威胁和承诺经典案例:海盗分金经典案例:海盗分金 5个海盗抢来了个海盗抢来了100枚金币枚金币 分赃方式:分赃方式: 海盗海盗1提出一种分配方案,如果同意这种
42、方案的人达到半数,提出一种分配方案,如果同意这种方案的人达到半数,那么该提议就通过并付诸实施;那么该提议就通过并付诸实施; 若同意这种方案的人未达半数,则提议不能通过且提议人将被若同意这种方案的人未达半数,则提议不能通过且提议人将被扔进大海喂鲨鱼扔进大海喂鲨鱼 然后由接下来的海盗继续重复提议过程然后由接下来的海盗继续重复提议过程 假设每个海盗都绝顶聪明,也不相互合作,并且每个海盗假设每个海盗都绝顶聪明,也不相互合作,并且每个海盗都想尽可能多得到金币都想尽可能多得到金币 第一个提议的海盗将怎样提议第一个提议的海盗将怎样提议 既可以使得提议被通过既可以使得提议被通过 又可以最大限度得到金币呢又可以
43、最大限度得到金币呢经典案例:海盗分金经典案例:海盗分金第一个海盗将提出怎样的分配方案?第一个海盗将提出怎样的分配方案?(98,0,1,0,1)要求:完美信息要求:完美信息害怕:颤抖的手害怕:颤抖的手轮次轮次分配方案提出者分配方案提出者分配方案分配方案最后一轮最后一轮海盗海盗5自己独吞全部自己独吞全部100个金币个金币倒数第二轮倒数第二轮海盗海盗4自己独吞全部自己独吞全部100个金币个金币倒数第三轮倒数第三轮海盗海盗3分配自己分配自己99个金币,第四个海盗个金币,第四个海盗0个金币,个金币,第五个海盗第五个海盗1个金币。个金币。倒数第四轮倒数第四轮海盗海盗2分配给自己分配给自己98个金币,第三个
44、海盗个金币,第三个海盗0个金个金币,第四个海盗币,第四个海盗1个金币、第个金币、第5个海盗个海盗0个个金币。金币。子博弈与逆向归纳法子博弈与逆向归纳法 逆向归纳法:逆向归纳法: 首先找到博弈顺序在最后的子博弈,首先找到博弈顺序在最后的子博弈, 找到子博弈中博弈参与者的策略选择,找到子博弈中博弈参与者的策略选择, 然后按博弈顺序由后向前逆向归纳,然后按博弈顺序由后向前逆向归纳, 直至博弈树的初始节点,直至博弈树的初始节点, 从而找到博弈的均衡。从而找到博弈的均衡。子博弈与逆向归纳法子博弈与逆向归纳法子博弈与逆向归纳法子博弈与逆向归纳法 通过逆向归纳法求解博弈树得到的均衡是子通过逆向归纳法求解博弈
45、树得到的均衡是子博弈精炼纳什均衡。博弈精炼纳什均衡。 纳什均衡只对均衡处的策略有要求。纳什均衡只对均衡处的策略有要求。 子博弈精炼纳什均衡子博弈精炼纳什均衡不仅对均衡处的策略有不仅对均衡处的策略有要求,而且对到达均衡的路径有要求。要求,而且对到达均衡的路径有要求。(要(要求从博弈初始节点开始,博弈参与者到达均求从博弈初始节点开始,博弈参与者到达均衡处所经过的路径也必须是最优的。)衡处所经过的路径也必须是最优的。)子博弈精炼纳什均衡子博弈精炼纳什均衡子博弈精炼纳什均衡子博弈精炼纳什均衡NE解:解:(不进入,斗争),(不进入,斗争),(进入,默许),(进入,默许),SPNE解:解:( 进入,默许)
46、,进入,默许),对潜在进入对潜在进入者来说,在者来说,在位者的位者的“斗斗争争”策略是策略是一种不可置一种不可置信的威胁信的威胁 子博弈精炼纳什均衡就是把包含不可置信威胁子博弈精炼纳什均衡就是把包含不可置信威胁的纳什均衡从可能的均衡中剔除出去。的纳什均衡从可能的均衡中剔除出去。 “子博弈精练纳什均衡子博弈精练纳什均衡”是对纳什均衡的是对纳什均衡的“精精练练”。通过剔除包含不可置信威胁的纳什均衡,。通过剔除包含不可置信威胁的纳什均衡,减少纳什均衡的数目。减少纳什均衡的数目。子博弈精炼纳什均衡子博弈精炼纳什均衡不可置信的威胁不可置信的威胁 在很多完全信息动态博弈中,都存在不可置在很多完全信息动态博
47、弈中,都存在不可置信的威胁。信的威胁。 但不可置信威胁可以通过某种途径成为一个但不可置信威胁可以通过某种途径成为一个可置信的威胁(可置信的威胁(Credible Threat),那么博),那么博弈的均衡就会不同。弈的均衡就会不同。例:法律上的例:法律上的要挟诉讼要挟诉讼PDP(0,0)不指控不指控 指控指控(提出要求提出要求s0)拒绝拒绝 接受接受起诉起诉 放弃放弃(s-c,-s)(x-c-p,-x-d) (-c,0)两个参与人:原告P,被告DC0 指控成本S0 要求的支付P0 原告的起诉成本d0 被告的辩护成本X 起诉后以的概率赢得X不可信威胁和不可信威胁和承诺承诺两个参与人:原告P,被告D
48、C0 指控成本S0 要求的支付P0 原告的起诉成本d0 被告的辩护成本X 起诉后以的概率赢得XPDP(0,0)不指控不指控 指控指控(提出要求提出要求s0)拒绝拒绝 接受接受起诉起诉 放弃放弃(s-c,-s)(x-c-p,-x-d) (-c,0)不可置信威胁和不可置信威胁和承诺承诺如果如果X- c- p,原告最后阶段会起诉,原告最后阶段会起诉由于被告辩护成本很高,只要由于被告辩护成本很高,只要-rX- d=rX,原告就希望私了,要求,原告就希望私了,要求的支付的支付s的取值范围是的取值范围是rX,rX+d(赔赔偿区域偿区域),如果双方讨价还价能力相当,如果双方讨价还价能力相当,则最后,则最后s
49、=rX+d/2。原告总成本为原告总成本为c+p,即使胜诉概率很,即使胜诉概率很小,即小,即rX c+p还是可能会满还是可能会满足足此时子博弈精炼纳什均衡为此时子博弈精炼纳什均衡为(指控,(指控,起诉),接受起诉),接受注意:d越大,条件越容易满足。这就是大企业、大人物常受无端指控的原因之一PDP(0,0)不指控不指控 指控指控(提出要求提出要求s0)拒绝拒绝 接受接受起诉起诉 放弃放弃(s-c-p,-s)(x-c-p,-x-d) (-c-p,0)不可信威胁和承诺不可信威胁和承诺被告承诺行动被告承诺行动被告在被控之前就支付被告在被控之前就支付律师费律师费y,则赔偿区域变则赔偿区域变为为rX, r
50、X+d-y,讨价还,讨价还价解为价解为s=rX+(d-y)/2,即使即使rX+d/2c+p,rX+(d-y)/2c+p的条件的条件也可能不满足,也可能不满足,即若即若y2rX+d-2c-2p时时, rX+(d-y)/20)拒绝拒绝 接受接受起诉起诉 放弃放弃(s-c-p,-s -y)(x-c-p,-x-d-y) (-c-p, -y)逆向归纳法的局限逆向归纳法的局限通过逆向归纳法有时也会求解出通过逆向归纳法有时也会求解出“不合理不合理”的均衡。的均衡。经济学家罗森赛尔(经济学家罗森赛尔(Rosenthsal)提出的)提出的“蜈蚣博弈蜈蚣博弈(Centipede Game)”就是这样一个典型例证。就是这样一个典型例证。虽然通过逆向归纳法可以求出蜈蚣博弈的均衡解,但此均衡解虽然通过逆向归纳法可以求出蜈蚣博弈的均衡解,但此均衡解的合理性受到了普遍挑战。的合理性受到了普遍挑战。因此,蜈蚣博弈有时也被称为因此,蜈蚣博弈有时也被称为“蜈蚣博弈悖论蜈蚣博弈悖论”,简称,简称“蜈蚣蜈蚣悖论(悖论(Centipede Paradox)”。蜈蚣博弈蜈蚣博弈假设有两名博弈参与者:参与者假设有两名
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年森林资源培育与保护承包合同3篇
- 2024外资企业股权出售与境内投资合作合同范本3篇
- 2024年度医疗器械维修代加工及售后服务协议3篇
- 2024年度地区总代理销售权及品牌使用权合同范本3篇
- 2024年地质勘探服务地质勘察服务合同样本3篇
- 2024年度商业地产土地使用权永久转让与商业运营管理合同3篇
- 2024年太阳能组件安装及智能监控系统合作协议3篇
- 2024年新能源充电设施区域代理合同3篇
- 起草销售合同范例
- 土地搞标居间合同范例
- 贵州省铜仁市2023-2024学年高一上学期期末考试 生物 含解析
- 药学概论-第八章-药事管理学
- 大部分分校:地域文化形考任务三-国开(CQ)-国开期末复习资料
- 中国当代文学专题-002-国开机考复习资料
- 2025新版国家医保药品目录(完整版)
- 妊娠合并糖尿病病例讨论
- C语言程序设计(兰州石化职业技术大学)知到智慧树期末考试答案题库2024年秋兰州石化职业技术大学
- 质量工程师个人年终总结范文(12篇)
- 加工合同解除协议书(2024年版)
- 足球明星梅西课件
- 2024-2030年中国EPS电机行业需求态势发展策略分析报告
评论
0/150
提交评论