博弈论与领导干部决策思维_第1页
博弈论与领导干部决策思维_第2页
博弈论与领导干部决策思维_第3页
博弈论与领导干部决策思维_第4页
博弈论与领导干部决策思维_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、张泰城博弈论与领导干部决策思维引 言 20世纪90年代至2003年,诺贝尔经 济学奖三次(1994,1996,2001)授予 了与博弈论相关的研究领域,总共有八 位经济学家获奖,是获奖人数最多的领 域(排在第二位的是金融)。 博弈论研究的最大特点一般决策研究(数学表达): Y f ( x1, x2, , xn )博弈论的决策研究(数学表达): Y f ( x1, x2 , xn , z ) (z为他人行为)特点:决策者目标函数的自变量中包含他人行为。 严格地讲,博弈论是一种方法,应用范围不仅包括经济学,政治学、军事、外交、国际关系、公共选择,还有犯罪学,都涉及到博弈论。实际上,不少人把博弈论看

2、成是数学的一个分支。纳什1951年的奠基性文章就是发表在数学杂志上。夏普里1953年的文章本身也是一篇数学手稿。 一、博弈论基础知识 1. 博弈论的基本概念 “博弈论”译自英文“Game Theory”。直译:“游戏理论”。 游戏有下列特征:(1)都有规则。(2)都有结果(赢、输、平),结果能折算成数值。(3)都有策略或者说计谋,选择不同的策略或计谋 往往带来不同的结果。(4)策略和利益有相互依存性,即每一个游戏者所 得结果的好坏,不仅取决于自身的策略选择, 也取决于其他参加者的策略选择。策略本身常常没有绝对的好坏之分,只有相对于他方策略的相对好坏。 博弈论也称为“对策论”。其实并不是很恰当。

3、因为“对策”在实际中常被用来表示具体的针对性反应方案,或站在某个决策方的立场上找针对其他方的对策。博弈论所研究的决策问题却是有开始、有次序、有结果的整个过程。 “博弈”的通俗含意不过是弈棋、赌胜,但由于它是带有文言性质的词,因而显得学术味浓一些,既能反映这门学科的特点和实质,又给人一种高深莫测的感觉。 博弈的简明定义:博弈即一些个人 或其他组织,面对一定的环境条件,在 一定的规则下,同时或先后,一次或多 次,从各自允许选择的行为或策略中进 行选择并加以实施,各自取得相应结果 的过程。 博弈论,是研究决策主体的行为发 生直接相互作用时候的决策以及这种决 策的均衡问题。 博弈论研究的对象是理性的参

4、与者 如何选择策略或如何作出行动的决定, 使自己的目标最大化。 2. 构成一个博弈的基本要素 博弈的七要素参与人、行动、信息、战略、支付函数、结果、均衡。 参与人是博弈中选择行动以最大化自己效用的决 策主体(可以是个人、团体等);行动是参与人的决策变量;战略是参与人选择行动的规则,它告诉参与人在什么时候选择什么行动;信息指的是参与人在博弈中的知识,特别是有关其他参与人(对手)的特征和行动的知识;支付函数是参与人从博弈中获得的效用水平,是每个参与人真正关心的东西;结果是指博弈分析者感兴趣的要素的集合;均衡是所有参与人的最优战略或行动的组合。 博弈的三要素1) 博弈的参加者2) 博弈方各自可选择的

5、全部策略 或行动的集合3) 博弈方的得益3. 博弈的表述形式 (1) 标准形式(策略形式) 被擒,中计(主观) 胜利(客观)逃脱,和被擒,胜利逃脱,和守城弃城 攻城退兵诸葛亮司马懿捉住曹操,被捉 扑空,逃脱 扑空,逃脱 捉住曹操,被捉 华容道 大 路 华容道 大路诸葛亮曹 操(2)扩展形式(博弈树) 诸葛亮司 马 懿弃城守城进攻退兵 进攻退兵擒住孔明胜利 和和 司马懿诸 葛 亮攻城退兵 守城弃城 守城弃城逃脱被擒被擒逃脱(3)联盟形式(特殊函数形式) 4. 博弈的类别 博弈分类可依不同的判据进行:博弈人数单人博弈、两人博弈、多人博弈;策略的数量有限博弈、无限博弈;得益情况零和博弈、常和博弈、变

6、和博弈;博弈过程静态博弈、动态博弈、重复博弈;信息结构完全信息博弈(静、动态)、不完全信息博弈(静、动态) ,完美信息动态博弈、不完美信息动态博弈;博弈方的理性和行为逻辑完全理性博弈、有限理性博弈;合作博弈、非合作博弈。 常见的博弈分类 : 从这个角度,博弈可以分为静态博弈和动态博弈。 静态博弈指的是博弈参与人同时行动,或虽非同时但后行动者不知道前行动者采取了什么具体行动。 动态博弈指的是参与人的行动有先后顺序,且后行动者能观察到先行动者所选择的行动。(1) 参与人行动的先后顺序(2) 参与人的信息 从这个角度,博弈可以分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与

7、人(对手)的特征、战略空间及支付函数有准确的知识;否则,就是不完全信息。 将上述两个角度的划分结合起来,共有四种不同类型的博弈,即:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。 博弈的分类表 行动顺序信 息 静 态 动 态完全信息 完全信息静态博弈 完全信息动态博弈 不完全信息 不完全信息静态博弈 不完全信息动态博弈二、博弈论中的经典分析及启示1. 囚徒困境 “囚徒困境”博弈是1950年图克(Tucker)提出的。它非常简单,却反映了博弈的根本特征,是阐释众多经济社会问题的经典范式。 警察抓住两个罪犯,分别关押,并与罪犯讲清:如果一人坦白,一人抗拒,坦白者立即释

8、放,抗拒者判刑 8 年;若两人都坦白,按律从轻各判 5 年。罪犯知道,他们若抗拒,警察掌握的证据只能各判 1 年。最后的结果会怎样? -5,-5 0,-8 -8,0 -1,-1乙抗拒坦白甲抗拒坦白 博弈(完全信息)分析方法:上策 均衡,严格下策反复消去法,画线法, 箭头法等。 -5,-5 0,-8 -8,0 -1,-1乙抗拒坦白甲抗拒坦白此博弈的“均衡”为(坦白,坦白)该均衡就是大名鼎鼎的“纳什均衡” 纳什均衡:在对方策略确定的情况下,每个参与者的策略都是最好的,没有人愿意先改变自己的策略。 假如博弈中的所有参与人事先达成一项协议,这个协议是否可以自动实施? 若当事人都会自觉遵守这个协议,这个

9、协议就构成纳什均衡:没有人有积极性偏离协议。换句话说,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议。 结论: 一种制度安排要生效,必须是 纳什均衡。不满足纳什均衡要求的制 度没有意义 。 类似囚徒困境 应试教育 公共产品供给不足(修路、公 寓楼道 的路灯) 卡特尔的内在不稳定性产量限制、价格限制)商业诚信此博弈的纳什均衡为(3,3) 乙诚信 欺诈 10,10 0,18 18,0 3,3 诚信甲 欺诈 交通规则 乙守规 违规10,100,1818,03,3 守规甲 违规 启示: 个人理性与集体理性的矛盾; 冤假错案是怎样产生的; 个人的最优决策不一定带来集体

10、的最优结果, 集体的最优结果未必来源于个人的最优决策。 领导的政绩? 改变博弈结果的根本方法是改变博弈的支付 矩阵。 囚徒困境的解脱有这样一个博弈 此时,两者的纳什均衡为(不合作,不合作)。 奖励 假如对采取“合作”策略的博弈方奖励3奖励矩阵为:最终结果为上述两个矩阵相加:博弈的纳什均衡为(合作,合作),解开了囚徒困境。 惩罚 思拉恩埃格特森在新制度经济学中举 的例子。 非洲努埃尔人部落间有两个大家庭X、Y, 每家拥有同样的武力潜能和侵犯倾向,每家拥 有相当于10头牛的财产。 每家都拥有两种策略: 侵犯对方,不侵犯对方。博弈表述为:纳什均衡为(侵犯,侵犯),双方的收益为(4,4)。 通过联姻,

11、努埃尔人引入了一个惩罚矩阵: 由于亲戚关系,侵犯者遭受成本(包括心理成本)的损失。 此时,X、Y就由非合作均衡变为合作均衡。 上述方阵变为:2. 赌胜博弈 赌胜博弈属于“零和博弈”的范畴,是 具有某种对称性的零和博弈。猜硬币博弈 -1,1 1,-1 1,-1 -1,1 正面 反面 抛硬币方正面 反面猜 硬 币 方石头.剪子.布 博弈 0,0 1,-1 -1,1 -1,1 0,0 1,-1 1,-1 -1,1 0,0 石头 剪子 布 博弈方 1 石头 剪子 布博弈方 2齐威王、田忌赛马3,-31,-11,-11,-1-1,11,-11,-1 3,-31,-11,-11,-1-1,11,-1-1,

12、13,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-1 3,-3齐威王上中下田 忌上下中中上下中下上下上中下中上上中下下中上上下中中上下中下上下上中 以上三个博弈是零和博弈,没有纯策略纳什均衡。 纯策略:单一的确定的策略。 0,0 1,-1 -1,1 -1,1 0,0 1,-1 1,-1 -1,1 0,0 石头 剪子 布 博弈方 1 石头 剪子 布博弈方 2取胜原则: 保密(不泄漏自己的策略); 避免自己的决策有倾向性; 让对方琢磨不透。 混合策略: 以一定的概率分布在备选策略中

13、随机选取。 启示: 当博弈是零和博弈时,只有混合策略均衡。 什么样的决策是科学决策?随机决策(当面对零和博弈时)科学吗?3. 警卫与小偷 案例1 两地巡逻 警卫负责A、B两地保安,A地财产2万元,B地1万元。警卫一次只能在一个地方巡逻,小偷一次也只能去一个地方。警卫在某地巡逻,小偷也去了该地,便不会失窃;小偷去了警卫没去的地方,则偷盗成功。警卫怎么巡逻效果最好? 3 , 0 2 ,1 1 , 2 3 ,0 巡逻A地 巡逻B地 盗窃A地盗窃B地 警卫 小 偷 这个博弈是零和博弈,没有纯策略纳什均衡点,但有混合策略均衡点。 当警卫去A地巡逻时,小偷有 的机会去A 地, 的机会去B地,此时,A的得益

14、为: 3+ 2= 万元; 当警卫去B地时,同样小偷有 的机会去A 地, 的机会去B地,此时,B的得益为: 1+ 3= 万元。警卫总的得益为: + = 万元。 同理,我们可得小偷的总的得益为 万元。 警卫的最优策略是: 掷骰子决定去A地还是B地巡逻。掷l4点去A地,掷5、6两点去B地,这样警卫有23的机会去A地,13的机会去B地。警卫的期望得益是:7/3大于2。 小偷的最优策略是: 同样掷骰子决定去A地还是B地偷盗,掷到14点去B地,掷5、6两点去A地,即小偷有l/3的机会去A地,2/3的机会去B地,期望收益为2/3万元 启示: 当博弈是零和博弈时,即一方所得是另外一方的所失时,只有混合策略均衡

15、。博弈方的策略应当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。如果对方知道你出其中一个策略的“可能性”大,你失败的可能性就大。案例2 小偷和守卫: 此案例为塞尔顿(1994年诺贝尔经济学奖得主)1996年3月在上海讲演中举的例子 。 有一仓库,小偷行窃时守卫睡觉,可获价值 V 的财物,小偷行窃时守卫没睡觉,则被抓,被抓后要坐牢,效用为 P 。守卫睡觉而未遭偷窃有 S 的效用,因睡觉被窃遭解雇,得益为 D 。小偷不偷,守卫无得也无失。守卫不睡,出一份力挣一份钱,也无得失。V , -D -P , 0 0 , S 0 , 0小偷不偷偷 守 卫睡 不睡 分析:这个博弈不存在纯策略纳什均

16、衡。 小偷的策略D PtPt S0守卫得益(睡)小偷偷的概率1 小偷有“偷”与“不偷”两种策略。图中横轴表示小偷选择“偷”的概率 Pt, “不偷”的概率等于 1Pt。 守卫的策略P PgPg S0小偷得益(偷)守卫睡的概率1V 守卫有“睡”与“不睡”的策略,其概率分布也可用图表示。 激励悖论(政策目标和政策结果的意外关系)P PgPg S0小偷得益(偷)守卫睡的概率1V Pg P 加重对小偷的惩罚,相当于 P 向下移动到 P。短期内小偷会停止“偷”窃,但长期中,小偷减少“偷”窃会使守卫更多地选择“睡”觉。加重对小偷惩罚的主要作用是守卫可以更多地偷懒。D PtPt S0守卫得益(睡)小偷偷的概率

17、1Pt D 加重对失职守卫的处罚,意味着 D 增大到 D。短期效果是守卫更加尽职,长期中的真正作用,恰恰是会降低盗窃发生的概率。启示:怎样避免激励悖论? 4. 情侣博弈(性别战) 一对情侣,男的爱看足球,女的爱看芭蕾,都愿共度周末。其博弈表述为: 有两个纳什均衡:(足球,足球),(芭蕾,芭蕾)。 究竟哪一个会发生,不知道。 2,1 0,0 0,0 1,2男足球 芭蕾 足球芭蕾女 启示:先动优势,后动优势。 甲有先动优势,先选B策略,稳得10。 乙有后动优势,最好让A先选,乐得100。 10,0 5,4 10,100 5,0甲A BCD乙斗鸡博弈 两只斗鸡相遇,或进或退。双方都前进,两败俱伤。一

18、方前进,一方后退,前进者胜利,后退者丢面子。都后退,都丢面子。 博弈表述为: -2,-21,-1 -1,1 -1,-1鸡甲前进 后退 前进后退鸡乙 此博弈有两个纳什均衡:一方前进,一方后退。结果无法预测。 例子:20世纪60年代的古巴导弹危机 夫妻矛盾5. 智猪博弈 猪圈里有一大一小两头猪。食槽在一头,按钮在另一头。按一次有10个单位食品进入食槽,但按者要支付2个单位。若同时按,同时跑向食槽,各支付2 个单位,大猪吃7个单位,小猪吃3个单位。大猪按,小猪坐吃,大猪吃6个单位(支付2个单位),小猪吃4个单位。小猪按,大猪坐吃,大猪吃9,小猪吃1(支付2 个单位)。都坐等,都没吃。 5,1 4,4

19、 9,-1 0,0小猪 等按大猪 等 按智猪博弈(扣除支付) 此博弈的纳什均衡:大猪按,小猪坐吃(4,4) 启示: 多劳并不多得; 要推动工作,就要想办法找到“大猪”; 若你是“大猪”,做了好不仅不要想 得好,还要能受委屈。(大德无名) 6. 海滩占位博弈(霍特林模型) 有一海滩日光浴场,均匀地散布着许多日光浴者。有 A 与 B 两个小贩,以同样的价格、质量向日光浴者提供同一品牌的矿泉水。在直线状的海滩上他们会如何选择自己的摊位点呢?海滩占位 设海滩的长度为l,图中0,1线段表示 海滩,“*”号代表日光浴者。01 由于日光浴者总是到距自己最近的摊位购买矿泉水。理想的摊位点如下: A 在 14

20、处,B 在 34 处。这样既方便了日光浴者, A、B 两人又平分市场,可谓皆大欢喜。 01AB 然而,理性的小贩 A 会想:如果我将摊位往 B 那儿挪动至A位置,那么从 0 至 A 范围内的人显然是我的顾客,而 A与 B 之间的中点将从原来的 12 处移至 12 右边的 C 处,从 A至 C 范围内的人也将成为我的顾客,即从 B 那儿“夺”走了一部分生意。这当然是个好主意! B 也是一个理性的商人,A 的想法也是 B 想法。01ABAC 双方“斗智斗勇”(博弈)的结果:A、B 的摊位都定在海滩中点(12处),相安无事地做买卖。01AB 西方大国为什么都是两党政治?为什么第三个政党难成气候?两党

21、政治的稳定性和欺骗性。西方两党政治的博弈论解读 激进党 保守党第三党 激进党 保守党7. 先来后到博弈 厂商A先占领了一个容量有限的市场,厂商B也想进入该市场。厂商B知道一旦自己进入,厂商A可能采取降价等竞争手段打击他。如果厂商A采取打击行动,厂商B肯定会亏损。那么,厂商B要不要进入这个市场?如果厂商B真的进入,厂商A是否真会打击?先来后到博弈(完全信息) 分析: 假设A独占市场时利润为10。与B分享市场则各得5。如 B进入市场A打击,则 B亏损2,A的利润降为3。 我们可以用扩展形表示该动态博弈。B进入不进入打击 默许(0,10) (4,4)(-1,3)AB进入不进入打击 默许(0,10)

22、(3,3)(-1,5)A高成本低成本 在位者的类型有高成本、低成本之分。高成本的最优策略是默许,低成本则是打击。在位者知道自己的真实类型,进入者虽不知在位者的真实类型,但知道各种可能类型的概率分布。 设:高成本的可能性为x ,低成本的可能性则为(1X)。进入者不进入的期望利润为0,进入的期望利润为: 4x(1)(1x) 即: x 0.2 时,进入的期望利润大于不进入的期望利润。先来后到博弈(不完全信息) 启示:怎样的威胁和承诺是可信的(言语博弈)?信号博弈:高等教育的功能?8. 求爱博弈 有人向你求爱,接受还是拒绝?若求爱者品德优良,你接受;若求爱者品德恶劣,则拒绝。但你并不准确知道求爱者的品

23、德。你接受与否就取决于你对求爱者品德类型的概率判断,即你在多大程度上相信他是一个品德优良的人。求爱博弈(品德优良) 100,100 -50,0 0,0 0,0求爱者求爱不求爱 接受拒绝你求爱博弈(品德恶劣) 100,-100 -50,0 0,0 0,0求爱者求爱不求爱 接受拒绝你 假如你认为求爱者品德优良的概率为 X 。不接受求爱的期望效用为0,接受则为 100 X (100)(1X)。解之,当X 1/2 时,接受求爱。 启示:信息不完全带来决策风险。诸葛亮和司马懿相互知道类型(公共知识)空城计 9. 财产分配博弈 你的权力有多大?(权力指数) 有A、B、C三人委员会,A有两票,B、C各一票,

24、表决采取“多数”原则,一项议案获得3票及3票以上则通过。他们各自的权力有多大?权力是什么? 决策者的权力体现在他在形成“获胜联盟”中是否“关键加入者”。若决策者作为“关键加入者”出现,权力就大,反之则小。 决策者作为“关键加入者”的个数即为“权力指数”。 三人委员会的获胜联盟有: AB、AC、ABC。A在AB、AC和ABC中均是关键加入者, A的权力指数是3。B是联盟AB的关键加入者,B的权力指数为l。C与B一样只是联盟AC的关键加入者,权力指 数是1。A、B、C的权力指数之比是3:1:l。 群体中可能的权力结构有多少 ? A、B两人的群体,逻辑上有16种决策结构,以下4种最常见或在现实中有意

25、义:F=A,(2) F=B,(3) F=A+B,(4) F=AB (1)、(2) 表示A、B说了算。 (3)、(4) 中A、B权力相等。但在 (3) 中, 一人同意就行;在 (4)中,要A、B两人同时 同意才行。 夫妇间的决策无非是这4种方式。 3个人组成的群体,逻辑上可能的权力结构有256种之多! 但现实中的权力结构(不含“逻辑非”)为13种。 当人数超过3人或者人数很多时,可能的权力结构非常多,很难列举。这就是为什么社会形态多种多样,权争总是无止无息。 三人财产分配 案例: 在三人之间分配100万元财产。A有50的票,B有40的票,C有10的票。规定超过50的票认可某种方案时,才能分配整个

26、财产。 分析: 任何单独一个人的票都不超过50,从而不能单独决定财产的分配要超过50的票必须结成联盟。 若按票力分配,即A、B、C的财产分配为: 50,40,10。 C可以提这样的方案,A:70,B:0,C:30。这个方案能被A、C接受,尽管B被排除,但是A、C的票构成大多数(60)。 B会提出新方案,A:80,B:20,C:0。此时A和B所得增加,C一无所有。A、B的票力总和为(90) 这样的过程可以一直进行下去。 夏普里(LSShapley)1955年提出了一种计算权力的度量。根据他的理论求得的联盟者的实力称为Shapley值(夏普里值)。 夏普里值是:在各种可能的联盟次序下,参与者对联盟

27、的边际贡献(联盟的“关键加入者”)之和除以各种可能的联盟组合。 如果说纳什均衡是非合作博弈中的核心概念的话,夏普里值(shapley value)是合作博弈(或联盟博弈)中的最重要的概念。财产分配中各种排列下的关键加入者由此得A、B、C的夏普里值分别为: A=46,B=16,C=16按照夏普里值, 可将财产(100万元)分给A:46(66.7),B:16(16.67),C:16(16.67)。 启示: 权力指数和票数不是一回事,票数指标是虚假的实力表示。在设计投票制度时,票数的分配要考虑权力指数:票数的分配要与权力指数和人数成大致相同的比例。 S国的权力分配 S国有六个省:A、B、C、D、E、

28、F,实行代议民主政治,所有立法决策由这些省的代表投票实施。各省按人口比例分配的票数为: A:10;B:9;C:7;D:3;E:1; F:1。总票数为31。该国法律规定:一项决议拥有半数以上票(16票或16票以上)即获得通过。总统选举(两位候选人)也一样,获半数以上票即当选。该国的体制运行了多年,但D、E、F省的人民总觉得有点问题。班扎夫三世(1965年)的分析: D、E、F省分别有3、1、1票。但这3个省不是任何获胜联盟的“关键加入者”,其 权力指数均为0。 (16;10,9,7,3,1,1)体制下S国各省权力指数 省 票数权力指数权力指数() A10433.3 B9433.3 C7433.3 D30 E10 F10 班扎夫三世的建议:多给A省两张票。结果:减少了B、C省的权力比重 ; 增加了D、E、F省的权力比重。 (17;12,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论