博弈论与经济行为Game Theory_第1页
博弈论与经济行为Game Theory_第2页
博弈论与经济行为Game Theory_第3页
博弈论与经济行为Game Theory_第4页
博弈论与经济行为Game Theory_第5页
已阅读5页,还剩152页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

杨健中国人民大学RenminUniversityofChinaGameTheory2主讲人简介杨健(英国兰卡斯特大学管理科学博士)中国人民大学公共管理学院MPA定量分析首席教授公共管理定量分析研究所所长电子政务博士生导师金融信息中心主任《投资与证券》主编英国运筹学JORS国际顾问国家高技术研究发展计划(863)评审专家国家自然科学基金管理科学评审专家企业年金投资管理机构评审专家3国际评价“Yangetal.【2】isoneofthebestheuristicalgorithmsknowntodayfordeterminingtheoptimalreplenishmentpolicywhendemandisnon-linerincreasing.”

Computers&OperationsResearch29(2002)1819-1825

/locate/dsw4为什么学数学?“读史使人明智,读诗使人灵秀,数学使人严密,物理学使人深刻,伦理学使人庄重,逻辑学、修辞学使人善辩;凡有所学,皆成性格。”——培根《谈读书》5主要内容一、概述二、对策论问题三、基本概念四、两人零和对策五、混合策略六、西方对策论与东方谋略6一、概述博弈论(GameTheory),又称对策论、竞局理论、对局理论是使用严谨的数学模型研究冲突对抗条件下最优策略问题的理论。7犹太法典巴比伦王国的犹太法典,编辑记载了公元1—5世纪的古代法律及传统。犹太法典(Talmud)中讨论了一个所谓的“婚姻合同问题”,一个男人如何将死后的财产发给三个妻子的难题,被人们认为是最早地使用了现代合作博弈理论。8空中花园在公元前2000年左右,古巴比伦王国颁布了著名的汉穆拉比法典,全文共有280多条,其中对人的活动作了许多规定,如个人财产怎样受到保护;百姓应该遵守哪些规范;货物贸易如何进行;臣民之间的隶属关系;最低工资标准;家庭纠纷与犯罪的处理等。这里涉及了许多管理思想。9时间倒流假设你是一个处于古战场上的士兵,当面对敌方时你采取何种策略最佳?如果己方获胜,你的贡献不太可能是决定性的,你倒是冒着有可能受伤或者牺牲的风险;如果敌方取胜,你伤亡的可能性就更大了。于是,你唯一合理的结论是:逃跑!10如果每个士兵都如此推理的话,恐怕战争就不存在了。至少对逃跑士兵的处决,就使得逃跑的代价比起与战友同生共死来得严重。Plato在Republic中,Socrates就曾为上面战争前线的士兵困境问题而困扰。11精神恋爱12两害相权ThomasHobbes(1588-1679)用类似战场上逃跑行为的逻辑在其著作Leviathan中得出结论说,人与人的合作是不可能的,于是政府只能在无政府状态与强制之间取其轻:选择施予暴政,惩治任何不履行诺言的人,如同对逃兵的惩罚。

13破釜沉舟或者如当年西班牙征服者Cortez率领很少的人在墨西哥登陆后所做的那样,Cortez通过烧毁抵达的船只来断绝后退的生路,以面对人数众多的墨西哥中部的Aztec人。同时,Cortez故意将毁船的行为让Aztec人看见,让他们揣摩他必胜的信心。

14在Shakespeare的HenryV中,HenryV在占领法国北部的村庄Agincourt后屠杀法国战俘的时候也采用类似Cortez的策略。

15对策论旨在研究利害冲突的各方如果按照一定的规则采取行动,行动既互相影响而又不完全相关,如何使自己能获得利益最大或期望损失最小。16冲突行为自古有之我们每天都生存处于多方面利害冲突的环境:日常生活中的下棋、打牌、求职、恋爱等;社会生活中如国家之间的战争、商业竞争等,都具有竞争或对抗性质,这一类行为称为博弈。17“博弈”一词的英文单词是Game,意为对策、游戏。因此,一谈到博弈,人们自然会想到游戏,博弈论的早期思想也确实源于游戏。在诸如下棋、打牌、划拳等游戏中,人们要解决的问题是如何才能获胜,这实际上是当事人面对一定的信息量寻求最佳行动和最优策略的问题。18帝王将相、才子佳人在决策过程中,如果有两个或两个以上互相竞争(即他们的利益不同)的决策者参加,而过程的结果决定于所有参与者的策略,这是一种竞争型决策,是对策论研究的对象。事实上,大部分人类历史和记录就是在叙述这些不“文明”的冲突过程和结果。19《中国军队援朝战史》-双石中校20

甲车滚进特遣队来势汹汹

乱云纷飞志愿军危机重重

李奇微和范佛里特在双方这一回合的对策搏弈中,求得了一个最优纯策略。双方搏弈矩阵中的鞍点,被李奇微抓住了。彭德怀等中朝联军首长显然对李奇微这一手缺乏思想准备。更不要说下边的部队了。必须承认,相较于对手们基于良好数理逻辑基础的跳跃性思维,他们基于传统经验的习惯性思维反应非常明显也非常遗憾地慢了半拍。为这半拍的认识差距,中朝联军付出了沉痛的代价。

21大多数战略进攻只能进行到它的兵力恰恰足够维持其防御地位以待言和的时刻为止。超过了这个时刻,形势就会发生剧变,会遭到自己力所难拒的还击。进攻者就背上了债务。而这种还击力量一般都比先前进攻者所使用的力量更为剧烈,我们称此为进攻极点。

——[德]卡尔·克劳塞维茨《战争论》22"石头、剪刀、布"在实际生活中,许多游戏都反映了博弈论的思想。例如,在人们非常熟悉的"石头、剪刀、布"的游戏中,我们的问题是:对方如何行动?而我又将如何应对才是最佳?23谁敢与我赌一把!24军事博弈论在研究双方冲突、制胜对策方面有着十分重要的应用。由于原子武器、火箭、弹道导弹的发明与使用,今天军事重点转移了,许多战术涉及空军和坦克之间的作战。战术的问题不能用“零和对策”来表达,而且人的因素也没有被考虑进去。251965年以后,关于追踪问题中的追逃双方自由决策行动由微分对策论来处理。数学家还对水雷和舰艇、歼击机和轰炸机之间的作战、追踪等问题进行了研究,提出了追逃双方都能自主决策的数学理论。随着人工智能研究的进一步发展,对博弈论提出了更多新的要求。26生物它甚至被应用到「演化生物学」(evolutionarybiology)上来解释生物演化的现象,例如为何很多物种的雌雄比例总是约一比一的。27马基埃维利在15世纪的意大利,曾出现过一位著名的思想家和历史学家马基埃维利(MachiavelliNiccolo),他提出了四项领导原理:1、领导者必须要得到群众的拥护2、领导者必须具备维护组织内部的内聚力3、领导者必须具备坚强的生存意志力4、领导者必须具有崇高的品德和非凡的能力当领导本身就是博弈!28经济社会今日「博弈论」已被广泛应用于招标、国际贸易、选举、公共政策等等的经济及社会科学问题上。现在博弈论正在得到越来越多经济学科的接受和运用,贯穿了几乎整个微观经济学,并且已经扩展到宏观经济学、产业组织理论,在环境、劳动、福利经济学等方面的研究中也占有重要地位,其理论基础是数学、经济学、管理学、心理学等。29风云人物孙膑波莱尔冯.诺意曼纳什30孙膑:田忌赛马话说齐威王经常要大将军田忌与他赛马,赛马的规则是这样的:每次双方各出三匹马,一对一比赛三场,每一场的负方要赔一千斤铜给胜方。齐威王的三匹马和田忌的三匹马按实力都可以分为上、中、下三等,但齐威王的上、中、下三匹马分别比田忌的上、中、下三匹马略胜一筹,因为总是同等次的马进行比赛,因此田忌每次都是连输三场,连输三千斤铜。31实际上,田忌的上马虽然不如齐威王的上马,却比齐威王的中马和下马都要好,而田忌的中马比齐威王的下马要好一些,因此田忌每次都连输三场是有些冤枉的。32后来田忌的谋士孙膑给田忌出了个主意,改变了这种局面。孙膑让田忌不要用自己的上马去对抗齐威王的上马,而是用自己的下马去对抗齐威王的上马,上马则去对抗齐威王的中马,中马对抗齐威王的下马。这样,虽然第一场田忌必输无疑,但后两场却都能获胜,二胜一负,田忌反而能赢齐威王一千斤铜。

33这个著名的故事生动地告诉我们,巧用策略是多么重要。事实上,一旦齐威王发觉田忌在使用计谋,明白了自己为什么输给对方时,他必然也会改变自己三匹马的出场次序,以免再落入田忌的圈套。这样齐威王和田忌之间的赛马,便变成一个双方应如何选择策略的问题,这正是「博弈论」所要处理的课题。34极小极大值解的发现历史上第一个极小极大值解是由法国数学家瓦德哥锐(Jame

Waldegrave1684-1741)在1713年研究一个二人纸牌博弈(LeHer)时提出的。这个结果记录在法国数学家蒙特姆(deMontmort)写给数学家尼古劳斯.伯努利(NicolasBernoulli,1695-1726)的一封信中。35在LeHer博弈中,保罗拿了一副普通的纸牌,他从中任抽出一张后发给彼德,然后再随机给自己抽出一张,博弈的目的是看谁手中的牌值大,牌值的大小顺序为A、2、3…11、12、13。现在如果彼德对手中的牌不满意,他可以要求和保罗交换牌,但如果这时保罗的牌是“13”则不能进行交换,如果保罗对自己手中第一次拿到的牌不满意或对被迫和彼德交换的牌不满意,则他可以再随机地抽取一张牌来换掉他手中的牌,但是如果抽到的是“13”则不可以交换,必须保留原来的那张牌,如果保罗、彼德最终的牌值一样大,则算彼德输。36保罗的策略是如果手中的牌值比8大则保留,如果比8小则换牌,而彼德的策略是如果手中的牌比7大则保留,如果比7小则换掉。经计算可知,如果保罗总是换掉8而彼德也总是换掉7或保罗总是保留8而彼德也总是保留7,那么保罗将取胜,反之,如果保罗总是换掉8,而彼德总是保留7,或保罗总是保留8而彼德总是换掉7,那么彼德将取胜,因此,保罗希望二人总是采取相同的策略,而彼德则希望二人采取相反的策略。37瓦德哥锐考虑的是:是否能有一种策略可以使得局中人在无论对手采取何种策略时,他都能获得最大的赢得概率。在允许采用混合战略获胜的模型中,瓦德哥锐得出:保罗和彼德均有一种策略,采用这个策略可以使得无论对方如何行动,他都能保证一定的最低收入,而另一局中人采用他的“好”策略则可以防止对手获得更大利益。对于这个具体的例子来讲就是保罗应以5/8的概率保留8,而以3/8的概率换掉8,而彼德应以3/8的概率保留7,而以5/8的概率换掉7。38这实际就是以上博弈例子的一个极小极大值解,只不过作者当时并未用到极小极大值这个术语,但极小极大这个思想可以从中看出来,遗憾的是瓦德哥锐认为混合策略不满足一般博弈的规则,因而未把这一结果推广到其它博弈之中,而且1721年他离开法国到英国从事外交工作之后,便不再做数学研究了。39虽然蒙特姆出版了他与尼古劳斯`伯努利的通信,其中包括他关于LeHer的信,以此作他的一本书的第二版的一个附录,而这个附录因从尼古劳斯.伯努利给蒙特姆的信中开始了著名的“圣比德堡悖论(StPetersburyParadox)”的讨论而变得很有名,但是,瓦德哥锐关于LeHer的极小极大值仍然被大大地忽视了。40此后,在1865年法国数学家吐德哈特(IsaacTodhunter)在他简明的《概率的数学理论史》中曾提到过这个解,并做了一些说明,但这在当时并没引起概率论专家的注意。极小极大的解和思想一直到1921年才又一次被著名的法国数学家波莱尔(EmileBorel

1871-1956)发现。41E.波莱尔波萊爾,1871年1月生於法國阿韋隆省的聖‧阿弗里克;1956年2月3日卒於巴黎,享年85歲。1920-1930年间,法国数学家E.波莱尔(EmileBorel

)首先试图把对策问题系统化为数学理论,他讨论并分析了许多具体问题。42波萊爾在對策論上的一系列文章(1921~1927)首次定義了策略的應對,考慮了最優策略、混合策略、均衡策略和無限對策,並應用於戰爭及經濟建設,他證明了三個角逐者的極大極小定理,考慮了五個及七個的情況,並於1927年做出了一般性定理真實性的猜想,比J.VonNeumann對一般定理的證明早一年因此他至少稱得上是對策論的發明者之一。43波萊爾具有非凡才智和充沛精力,他嚴以律己,他喜歡務實而不喜歡形式主義、邏輯主義和直覺主義,他甚至公然放棄一般化而運用特殊的問題和結果作為科學的比喻以表達廣闊的理論,這種研究方法具有19世紀的特點,可是它的創新對20世紀的分析和概率的影響,卻無疑是深遠的,一直延至我們這個時代,P.A.蒙泰爾(Montel)說:”波萊爾的思想將會長久地繼續在研究中發揮影響,就像遙遠的星光,散布到廣闊的空間”。

44可怜的法国数学家In1921,EmileBorel,aFrenchmathematician,publishedseveralpapersonthetheoryofgames.Heusedpokerasanexampleandaddressedtheproblemofbluffingandsecond-guessingtheopponentinagameofimperfectinformation.Borelenvisionedgametheoryasbeingusedineconomicandmilitaryapplications.Borel'sultimategoalwastodeterminewhethera"best"strategyforagivengameexistsandtofindthatstrategy.WhileBorelcouldbearguablycalledasthefirstmathematiciantoenvisionanorganizedsystemforplayinggames,hedidnotdevelophisideasveryfar.Forthatreason,mosthistoriansgivethecreditfordevelopingandpopularizinggametheorytoJohnVonNeumann,whopublishedhisfirstpaperongametheoryin1928,sevenyearsafterBorel.45冯.诺意曼JohnvonNeumann(1903--1957)是这个世纪最传奇的数学人物之一。他是原籍匈牙利的美国人。在他三十多年的学术生涯之中,其工作范围几乎函盖了当时所有的数学,还独自开创了三、四种全新的数学学派。不谈他的数学,在关于计算器的贡献方面,他与当时的工程师共同开创了今日电子计算器的设计,并创造了自动机理论(automata)。46VonNeumannwiththefirstInstitutecomputer47关于他的奇闻轶事中,最常见的就是他那惊人的记忆力和推理速度。据说他在刚到纽约的时候,真的表演过翻看电话号码簿,就能在半小时内记得几千人的电话。他写的板书很大,而且速度又快,所以一个黑板立刻就被他写满。因此,在他演讲的时候,总是一边写、一边擦。然后,他会不断地指着黑板的某处,说,根据前三次写在这个位置的式子,或许再加上前五次写在那个位置的式子,可以得到以下的结论,如此这般。所以,有些数学家就说vonNeumann是个「用板擦证明」数学定理的人。就连当时最聪明的数学家和物理学家,都认为vonNeumann的脑袋可能不是人类。48vonNeumann清楚地认识到由其他数学家取得的研究结果和这些结果的内在发展可能性。在他开始的工作中,一篇由Borel写出的关于极小极大性的文章给了他提示,使他将已有的想法发展成一个原创的观点,即“博弈论”。49

1922年的11月4日,英国著名考古学家卡特等人发现了埃及十八王朝吐坦哈蒙法老的陵墓,并发掘出文物3600多件,现藏于埃及历史博物馆中。

1938年的11月4日,德籍奥地利科学家柯恩第一次分离得到纯净的维生素。

1944年的11月4日,美籍匈牙利数学家冯·诺伊曼等人提出了对策论,即博弈论。

1946年的11月4日,联合国教育、科学及文化组织在巴黎正式成立并召开第一次会议。

1980年11月4日下午,我国科学工作者在安徽省和县龙潭洞发现了一个30-40万年前的、保留完好的猿人头盖骨化石。50《博弈论与经济行为》对策理论的创始人是美国数学家约翰·冯·诺伊曼,1944年,诺伊曼和摩根斯顿共同撰写《对策理论与经济行为》的出版标志着现代系统对策理论的诞生。在诺伊曼和摩根斯顿眼里,经济是一种完全科学性的行为,需要数学理论对它进行规范。在博弈论中,vonNeumann证明了极小极大定理。他逐步扩大在这一领域内的研究。一般认为,博弈理论始于1944年。数学家约翰·冯·诺伊曼(JohnvonNeumann)和经济学家奥斯卡·摩根斯坦(OskarMorgenstern)合作出版了《博弈论与经济行为》一书,概括了经济主体的典型行为特征,提出了策略型与广义型(扩展型)等基本的博弈模型、解的概念和分析方法,奠定了经济博弈论大厦的基石,也标志着经济博弈论的创立。51诺贝尔经济学奖此后许多其他数学家也先后作出了重大贡献。对策论是研究竞争性行为的数学分支。

1994年诺贝尔经济学奖授给了三为对策论专家:纳什、泽尔腾和海萨尼,这件事说明了经济学家重视对策论的程度。52数学家小约翰·福布斯·纳什是一个天才人物,普林斯顿大学的著名教授,诺贝尔经济学奖的获得者,他在博弈理论方面的巨大发现甚至改变了我们的日常生活。53纳什是一个悲剧人物,他的一生为精神分裂症所困扰,曾经有一段时间他居然相信苏联人在《纽约时报》的头版上给他发“密码信息”。他麻烦缠身,有一次竟然因为在男洗手间“不恰当地”暴露了自己的身体被逮捕,而且跟某个女人有了私生子。在历经苦痛的人生里,纳什一方面在运用自己那优美绝伦的大脑,另一方面也在与他的大脑进行着顽强的抗争。最终理性为他带来了心灵的和平,纳什终于摘取了科学事业上的桂冠。

54JOHNNASH數學史上的天才,的確很容易感到寂寞,因為雖然數學的研究,可能帶給世人非常深切的影響,可是因為數學太難了,所以一般人根本就搞不懂數學家在做什麼,也不知道他們的人生成就在什麼地方,可是最近大家對於一位數學天才卻很有興趣,他叫做JOHNNASH,JOHNNASH之所以受到世人的注意是因為他得了諾貝爾獎,而且他的故事,被拍成了一部2002年得了四项大奖奧斯卡獎的好萊塢電影,在這部電影當中,我們看到了JOHNNASH的傳奇性的人生,其實他的人生,跟這部好萊塢電影所呈現的人生其間還是有差距的,如果你對JOHNNASH的真實人生有興趣的話,我们就讓你看到JOHNNASH的真實人生。

55《美丽心灵》ABeautifulMind

导演:朗·霍华德RonHoward

主演:罗素·克洛RusselCrowe

珍尼弗·康纳利JenniferConnelly

艾德·哈里斯EdHarris

亚当·戈德堡AdamGoldberg

克里斯托弗·普拉默ChristopherPlummer

类型:传记

级别:PG-1356在纳什本人所写的自传中他这样写道:“……我不敢说数学和疯狂有什么直接联系,但是毫无疑问,伟大的数学家都有偏执的个性,或者精神错乱,或者精神分裂。”57“天才和疯子只有一线之隔”精神病人,在当今社会一直处于边缘状态,从某种角度上人们惧怕精神病人甚于艾滋病人。纳什是幸运的。由不得让人想到,如果纳什呆在我们这里,不知有哪所大学原意给他提供避难所?58纳什在北京五洲大饭店8月26日晚,出席2002年国际大会的著名数学家纳什在北京五洲大饭店前的大草坪参加由组委会举办的露天招待会。59“纳什均衡”Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。60价格大战以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。61泽尔腾(Selten)泽尔腾1930年10月10日出生于德国的布雷斯劳(二战后,此地归于波兰),其父是一个经营租书店的犹太人。可以想象,在希特勒统治下的德国,他们一家的生活并不容易。因此,他14岁不得不辍学做工,而后不久全家离开德国,成为难民。

621951年到1957年,他在法兰克福大学学习数学。

1957年泽尔腾获得硕士学位后,到马恩法兰克福大学工作与学习,1961年获得了数学博士学位。其间他得到了摩根斯顿(Morgenstern)的赏识和帮助。63泽尔腾的贡献在纳什均衡的基础上,20世纪60、70年代是博弈论的发展时期,泽尔腾及其好友海萨尼的主要贡献正是在这一时期完成的。起初人们对合作博弈理论更感兴趣,认为如果合作能够获得利益,人们怎么会放弃呢?64泽尔腾与海萨尼(Harsanyi)及其他一些人则认为,合作理应是理论的结果而不是前提,应该以非合作博弈的方式建模型描述合作的达成,而且非合作博弈适用于更广阔的社会经济形势,为此亦需要丰富与完善的合作博弈理论的分析工具与手段。

65虽然同属对博弈论的研究,泽尔腾与海萨尼的侧重点不同,后者考察了信息问题,从而构造了不完全信息博弈理论,在此基础上后人建立了信息经济学;前者则正对纳什均衡概念的缺陷进行了深入分析,在扩展型博弈分析方面取得了重大成果。66纳什均衡的缺陷纳什均衡的缺陷是,一般情况下能够保证存在性,但不能保证唯一性。大多数情况下纳什均衡有多个,由此带来的问题就是,多个纳什均衡中究竟哪一个才是博弈的理性结局。泽尔腾在多个纳什均衡中剔除一些按照一定规则不合理的均衡点,从而形成了纳什均衡的"精炼"概念。泽尔腾前后提出了两种这样的概念,一是子博弈完美均衡,另一个是颤抖手完美均衡。67

1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlees)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。68目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。在这一点上,博弈论和经济学家的研究模式是完全一样的。经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作,而这正是博弈论的研究对象。一般认为,对策论的潜力还远远没有发掘。69对策论的深远意义恐怕还不完全表现在这里。对策论实际上研究人与人之间的关系,特别是生产关系,所以它必然会对政治学、法学以及整个社会科学都产生深远的影响。可以说对策论的发展,将会对人类社会产生不可估量的影响。70休息71二、对策论问题对策论主要是研究下述的问题:假设有n个局中人P1,P2,…,Pi,…,Pn参与某一种对策Γ,局中人Pi应采取什么对策以获得最有利的结果?72假定:在Γ的每一局之末,局中人Pi要通过支付Vi定输赢,Vi称为Pi的支付或酬报。Vi>0时为赢(收入),Vi<0时为输(支出),Vi=0时为平局(平衡)。每一个局中人都追求自己的最大的V。任何一种对策,总有一组各方必须共同遵守的规则,规定所有局中人在决策过程中可供选择地抉择和信息的数量。如果对策中还存在着随机因素,规则还规定管理随机变量的概率法则。同时还规定结束一个对策的方法、支付办法和支付值。73知己不知彼对策论是为每一个局中人在决策过程中提供准则的。对策论不同于其他理论之处,在于每个局中人的胜负不仅取决于他本人所采取的策略,而且也与对方所采取的策略密切相关的,所以要做到知己知彼。

74三、基本概念1.对策2.策略3.纯策略4.混合策略751.对策一个对策是由策略空间X,Y和支付形态K三部分组成的。以两人零和对策为例,X代表局中人之一PI的策略空间,Y代表局中人之二PII的策略空间,K是X、Y上的一个实值函数。如果PI从策略空间X中选择一策略x,PII从策略空间Y中选择一策略y,则(x,y)构成了一局博弈,这时PII支付给PI为K(x,y),PI支付给PII为-K(x,y)。762.策略策略就是行动,没有策略就无所谓对策。策略也是决定局中人胜负的关键。策略指局中人在各种情况下所能够采取的全部行动,包括随机发生的和由有关各方的行动所引起的各种情况。策略也是一种规则,它规定局中人在决定选择某个行动时,必须考虑在这以前已发生的一切事态,并考虑到可能产生的后果。773.纯策略纯策略是指局中人选择的一种单一的策略。各局中人均可根据对策的形势采用纯策略。纯策略是混合策略的一种特殊形式。784.混合策略混合策略指在一个对策中的一系列的局里,或者在只进行一局的对策中,局中人从有关这个对策的一些策略中,选择以概率为基础的策略,即局中人根据概率法则轮流选用几种策略。79对策的简单分类(1)按参与者人数分类:两人对策和n-人对策。(2)按参与者可采取行动的次数分类:有限次的和无限次的。(3)按支付函数分类:从略。(4)按支付总和分类:零和的与非零和的,零和指非零和指一80(5)按对策目的分类:合作性的与非合作性的。前者指全体参与者结成联盟争取共同的利益,后者则指参与者互不合作。81经典案例:囚犯的困境82监狱的狱长有两个囚犯,如果没有至少其中一人的自动供认,他就不能将他们处以绞刑。因此,他传唤了其中一个囚犯并答应,如果他能比第二个囚犯至少早一天供认,就给他自由和一大笔钱,并将第二个囚犯处以绞刑。如果第二个囚犯比他早一天供认,则结局会相反。同时,狱长还告诉他,如果两人同一天供认可以保住性命,不过得监禁10年。假若谁也不供认,则都将被释放,当然也得不到任何奖赏。83当然狱长也提醒第一个囚犯,“你敢用脑袋打赌认定你同狱的那个恶棍不会急着招供和往口袋里装赏金吗?”第二个囚犯在被传唤时也得到了同样的警告,两人各自孤单地彻底思考各自的困境。84理性与感性在“囚犯的困境”中,每个囚犯都有两种策略可供选择,要么保持沉默以与他的同伙合作,要么招供而背叛同伙,并会出现四种可能的结果。尽管知道了可能的结果和可供采取的策略,但不知道狱友的决定,且又无法与之沟通或协调的情况下,各个孤立的囚犯该选哪种策略最具合理性呢?85经典的对策论对此有清楚的答案:他应该背叛!86因为背叛的结果可能是:最好的情况是背叛能带来自由和金钱,而最坏的结果是坐10年牢;合作最好的情况是获释而得不到钱,最坏则是上绞架。而每一个囚犯出于理性的考虑必定是选择背叛对方,因为这一选择比起合作来看报酬较高而惩罚较轻。所以两个囚犯都会相应地这样做:招供!!由于他们一样有理性,他们会在同一天招供,这样,尽管他们如保持沉默而可能自由出狱,但现在却要坐牢10年!!!这是反思其冷酷的理性的后果。A.W.Tucker的囚犯困境(Prisoner’sDilemma)。87请添入你的判断同伙招供同伙不招供最惨的后果自己招供-105-10自己不招供-410-4188请添入你的判断专一不专一最惨的后果专一100-100-100不专一*2000089合作博弈和非合作博弈根据博弈方的理性和行为逻辑的不同,博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。前者主要强调的是团体理性;而后者主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,即策略选择问题,强调的是个人理性。90静态博弈、动态博弈和重复博弈在非合作博弈中,根据博弈过程的不同,可以分为静态博弈、动态博弈和重复博弈;根据博弈方对得益信息的掌握情况可分为完全信息博弈何不完全信息博弈。在动态博弈中根据对博弈进程信息的掌握则可以分为完美信息博弈和不完美信息博弈。这些博弈问题的类型特点,正是形成博弈理论结构的基础。91竞争92马克思的哲学是……?93经典案例:决斗模型

甲、乙、丙三人决斗规则是这样的,每个人设法打死他两人。不管是谁被打中了,则宣告此人失败并退出比赛,而其他两人继续比赛,直至最后只剩一人,此人即获胜者。每轮开枪时大家同时射击。94假设三人的中靶概率分别为0.6,0.5,0.4。不难说明,每个射手的最优策略是首先进攻较强的对手:即甲应先向乙射击,乙、丙应先向甲射击。95如果三人射击的事件是相互独立的,则我们可以算出三人获胜的概率分别是0.097,0.136,0.611,无胜者的概率是0.156。这是一种不公平的“鹬蚌相争、渔人得利”的竞争。在自然界里,有时弱者反而生存下来,就类似这种情形。96鹬蚌博弈赵且伐燕,苏代为燕谓惠王曰:“今者臣来,过易水,蚌方出曝,而鹬啄其肉,蚌合而莫过甘其喙。鹬曰:‘今日不雨,明日不雨,即有死蚌!’蚌亦谓鹬曰:‘今日不出,明日不出,即有死鹬!’两者不肯相舍。渔者得而并擒之。今赵且伐燕,燕赵久相支,以弊大众。臣恐强秦之为渔父也。故愿王熟计之也。”惠王曰:“善!”乃止。

97如果我们改变一下规则。假设三人轮流射击,按先弱后强的丙、乙、甲的顺序。那么最先射击的丙应采取什么策略呢?不管他打中甲或乙,另一人必然向他报复性地进攻,而如果他不向其他两人进攻,那么另外两人必然相互射击,这样他就可以“坐收渔人之利”了。如果三人都这样想,结果比赛就无法进行下去了。足球场上的打假球,就类似这种情形。98竞选问题上岗问题追求问题99案例分析:坚持国策与否?中国发展核武器是在美苏对峙的冷战时期,世界大战触发的可能性远比现在大,而且中国在核武研制成功后,立刻向世界承诺:中国在任何情况下,绝不首先使用核武器。100现代中国如是说:任何用武力干涉中国内政的行为,都将迫使中国采用包括把手伸向核按钮的一切手段来进行回击!如果布什或者其他什么人把中国的严正警告继续当作耳旁风,那么他就必须冒引起核大战的危险!101美国CBS民意测验根据最新的在CBS民意测验,65%的美国人认为任何借口都不能成为美国首先使用核武器的正当理由,只有25%的美国人认为有些情况下美国可以对另一国家首先动用核武。

55%的美国人认为这两年核武战争的危险增加了,8%的人认为核战争危险减小了,33%的人认为没有什么变化。65%的美国人认为美国如果受到恐怖分子核攻击的可能性比美国受到某一国家的核攻击的可能性要大。25%的人认为美国受到某一国家核打击的可能性更大。

《华盛顿观察》周刊,2002-10-23102俄罗斯俄罗斯核战争军演的基本目的是为了检阅武器库中陈旧武器的效能,由此延伸,军演为普京推广新式核武器奠定基础。而新武器“超音速飞行器”点中了美国导弹防御体系的“死穴”,并宣布要建立俄式导弹防御体系在核裁军领域发动频频攻势的同时,普京签署了批准俄新军事学说的命令。该学说放宽了对使用核武器的限制,明确了在任何情况下可能使用核武器先发制人的“迎击”立场,更加突出了核威慑战略。103俄罗斯总统普京在摩尔曼斯克地区北莫尔斯克海军基地视察参加军事演习的北方舰队,并乘坐“阿尔汉格尔斯克”号战略核潜艇。104陪同普京视察俄潜艇部队的还有国防部长伊万诺夫(左二)、海军司令库罗耶多夫(右一)105四、两人零和对策对策论最简单的也是最基本的模型是有限次的两人零和对策。在这种对策中,只有两个局中人,每个局中人各有有限个可供选择的策略。在每个对局中,两个局中人各自独立地选择一个策略(互相都不知道对方的策略),而两人的收益总和为零,V1+V2=0。这种对策中,两个局中人的利益是完全相反的,因此不存在合作的可能。因为仅两人(或两个集团)对阵,所以一方的得益引起对方相等的损失,没有其他支付。106定义:一个矩阵对策是由任何m×n矩阵

来决定的。在这个矩阵中,元素aij是任何一个实数。107“凡是敌人反对的,我们就要拥护!”

表征:假如,PI选择了与第i列有关的行动,而PII选择了与第j行有关的行动,则元素aij代表由PII支付给PI的数值。

输赢:对PI来讲,aij的数值越大越好,所以PI称为最大化的局中人;而对PII来讲,aij的数值越小越好,所以PII称为最小化的局中人。108定义:元素xi和yi分别代表PI选择的第个行动(列)的频率和PII选择的第个行动(行)的频率。按照对于PI的一个混合策略,我们将设一个列向量X=(x1,x2,…,xm),其中xi为非负值,而使x1+x2+…+xm=1;按照对于PII的一个混合策略,我们将设一个行向量Y=(y1,y2,…,yn),其中yi为非负值,而使y1+y2+…+yn=1。109

假设矩阵对策规则如下:PI和PII两个局中人可各自独立地选择三个抉择(x1,x2,x3)和(y1,y2,y3)。支付函数如下:110111PI推理对策一开始,先由PI推理:“假定我选择x1,支付函数就限于子阵(3-1-5)。倘对方事前知道了,他当然会选择y3,使我的支付为a13=-5”。“倘使我选择x2,支付的函数将限于子阵(2

1

2),PII的最好选择是y2,则我的支付是a22=1”。“最后,我如选择x3,那么对策函数将限于子阵(-1

0

7),对方当然选择y1,使我的支付为a31=-1”。112因此,PI的推理可作如下的总结:十分明显,如果PI选择x2,不管PII选择什么,他的最坏支付是1。其他x1、x3的选择,可使他冒损失高达5单位的风险。113PII的推理是:“假如我选择y1,那么,对策将缩到子阵,PI的最好选择将是x1,以获取a11=3的对他的支付”。“倘使我选择y2,支付函数将是,PI的最好选择是x2,以获取a22=1对他的支付”。最后,“我若选择y3,支付矩阵将缩减到,PI必将选择x3,使对他的支付为a33=7”。

114很明显,如果PII选择y2,他的最坏结果不会多于一个单位的损失,不管PI选择什么。115现在,PI可以论证:“我选择x2最为保险,稳蠃至少一个单位,而选择x1和x3是要冒险的”。同样,PII也可以论证:“我选择y2,最坏的情况不超过一个单位的损失,而y1和y3的损失可高达7个单位”。所以,PI作出结论:“我选择x2,不管对方如何,我至少可得一个单位;如他不明智,选择y1或y3,我将得2个单位”。PII也作出结论:“我选择y2,不管对方怎样,我最多损失1个单位。如他不明智,选择x1或x3,我可得平局或者得1个单位。”

116这样,PI和PII都不仅为自己选择了最好的策略,而且也为对方考虑了最好的策略。这里的(x2,y2)称为最佳波莱尔-诺意曼策略偶(a*,b*),简称最佳策略。双方采取最佳策略的结果支付是U(a*,b*),称为这个策略的值V=U(a*,b*)。如果V=0,则对策称为公平对策。

在本例中U(x2,y2)=a22=1。117波莱尔-诺伊曼最佳策略波莱尔-诺伊曼简单矩阵对策之最佳策略的准则是:每一个局中人假定,不管他选择什么,另一个局中人总希望使他方的损失最大化。因此,每一个局中人将选择这样的策略,使另一局中人把对方损失最大化的企图最小化。118“主观为自己,客观为别人。”在对策行为中,参加竞争的各方具有不同的目标和利益,为了达到各自的目标,各方必须考虑对方的各种可能的行动方案,力图选取对自己最有利的行动策略。119最佳纯策略解最佳策略的选择:当双方局中人都能为对方找到至少一个最好的抉择(根据预先的计算)时,这种对策可称为有一个最佳纯策略解。120极小极大值思想在某一博弈中如果一个局中人根据极小极大值理论的标准来选择他可以采取的战略,那么就是说对他的每一种策略,他首先考虑他采取该策略后能收到的最低支付,然后他在所有最低支付中选择能得到最大支付值的那个战略。极小极大值理论表明二人零和有限纯战略(或连续纯战略和连续纯凸支付函数)的博弈是确定的(即有解)。121计算例题现在我们考虑一个3*4的两人零和矩阵对策122现根据波来尔-诺意曼准则来考虑,PI的每一种抉择的后果。如果他限于第一个策略,则他的支付函数是[a1j]=[3

1

5

6],此策略对他的值V11,即同样,如果他限于第二个策略,对他的值是V2

对于第三个策略,对他的值是V3

123PI考虑了{V1,V2,V3}={1,-1,-5}这个集合,而取其最大的。这样,他找到了一个抉择x1,i*=1,使根据波来尔-诺意曼准则,PI应从安全出发选择第一个策略,使V不少于1。124局中人PII从他的立场出发,也检查了每一个子阵

125PII考虑每一策略对他的值V的影响,计算如下:{V’1,V’2,V’3,V’4}={3,1,5,6}126PII为了保证Vˊ保持在1或更少的支付,只好选择了第二个策略y2。这样,PII找到了一个抉择,j*,使

在这个对策中,

这个对策的值是1。

127抽象地说,对于双方局中人,存在着一对最佳策略的选择(i*,j*),使容易看出,ai*j*是它的所在列的最大元素,也是它的所在行的最小元素。例中是ai*j*

恰好是a12,对所有的i和j,有

ai2

a12a1j

这种元素称为矩阵的鞍点

128鞍点SADDLE129当一个对策矩阵有一个鞍点时,就存在着一个最佳策略;反之亦然。若矩阵中含有一鞍点S,PI应选择S的所在列,而PII应选择S的所在行,该对策的值为V。130数学上,鞍点不是唯一的!一个矩阵可有一个以上的鞍点,例如

a11和a13都是鞍点。

131鞍点是共轭存在的!在具有几个鞍点的大型矩阵中,鞍点是共轭存在的,如果是某一矩阵有两个鞍点,则共轭点也必然是鞍点。132鞍点共轭存在例如,在中a11和a32

是鞍点,a12和a31也自然成为鞍点。

133鞍点不一定存在!但是,不是每一个矩阵都有鞍点的。在矩阵

=中,若某一对角线上的两个元素同时大于或小于另一对角线上的两个元素时就没有鞍点。

134适用范围许多管理问题很难用一般数学的方法去直接解答,但对于某些问题可以把可能的选择设法“浓缩”至正反两个方面,然后用对策论加以解决。特别是这样一类的问题:在几个阶段分别实施决策,而各阶段的决策不会直接影响到最后结果时,尤其适用对策论。135例如,在只有两个竞争者的对策时,双方都是为追逐最大利益或最小损失,在牺牲对方的情况下达到最佳的决策。所以,每一方除了考虑本身的策略外,还必须考虑对方的策略。在有多方面竞争者参加时,决策问题更加复杂。136案例分析:组织冲突“组织冲突”具体到每一种冲突对领导活动和目标的实现在实践上到底产生何种意义,这往往是与领导者采取何种态度和策略有直接关系。正确的策略,可以化害为利,而错误的策略就可能化利为害,所以采取何种策略是领导科学和领导者所关注的重要问题。137美国西点军校的《军事领导艺术》对领导者可以采取的策略概括归纳为五种:回避、建立联络小组、树立超级目标、采取强制办法、解决问题。138对策处理冲突对策之一:回避

在领导活动中,无论是个体还是群体之间冲突是屡见不鲜的,并且常常是一件令人不快的事情。139处理冲突对策之二:建立联络小组

领导者可以用来处理冲突的第二种策略是建立联络小组。当组织内的群体交往照例不很频繁,而组织目标又要求他们协同解决问题时,群体间就可能产生冲突:因此,在这种情况下,相互交往对组织是非常重要的,这时采取建立联络小组的方法来处理群体之间的相互关系。

140处理冲突对策之三:树立超级目标

树立超级目标是处理群体间冲突的另一种策略,尤其对群体之间存在着相互依赖关系的情况下,这种策略有助于领导者处理组织冲突和提高组织效率。141处理冲突对策之四:采取强制办法

处理冲突的第四种策略是科层制组织内常见的办法--强制。领导者或处于冲突中的群体采取这种策略,是利用组织赋予的权力有效地处理并最终从根本上强行解决群体间的冲突。142处理冲突对策之五:解决问题

解决问题是处理冲突策略中最具有对峙性的方法。由于组织内的群体、个体往往可能不总进行相互间的沟通,在这种情况下,采取解决问题的办法来处理组织冲突或许最合适,它可能是比较永久性的固定形式,它可以用来就事论事地处理某些具体问题。143对策合作观望对立回避20%30%50%建立联络小组30%25%45%树立超级目标50%40%10%采取强制办法40%35%15%解决问题60%15%25%144五、混合策略当对策矩阵没有鞍点时,局中人就要计算并确定各自的每种纯策略的使用频率;换

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论