




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
杨义群经济管理网、杨义群投资理财网博弈论中常见的一些例子1、(夫妻争执问题) 一对新婚夫妻为晚上看什么电视节目争执不下,丈夫(记为I方)要看足球比赛节目,而妻子(记为方)要看戏曲节目.他们新婚燕尔,相亲相爱,所以若这方面的行动不一致,则是很伤感情的.因此,这对夫妻间的争执是一次非零和对策。2、(entry deterrence市场威慑) 设某市场已被方(场内者)占据,现I方(场外者)正在考虑是进去争夺(记为策略I1)还是不进去争夺(记为策略I2),而方相应应考虑的是采取合作共享的态度(记为策略1)还是采取坚决斗争的态度(记为策略2)。3、(prisoners dilemma囚犯困境) 设有两个囚犯曾犯过大罪,现因犯小罪而被捕,正分别受警方审讯.这两个囚犯都明白:如果两人都拒不坦白犯过大罪,那么当局只能以当前的小罪而判处1年徒刑;要是两人都坦白犯过大罪,那么当局将判处9年徒刑;如果一人坦白,而另一人拒不坦白,那么坦白者将会立即获得释放,另一个将会被判处10年徒刑。(北京大学1999年研究生入学考试微观试题) 举出一个你在现实生活中遇到的囚犯两难困境的例子。4、(两寡头降价竞争) 这一模型,在数学结构上,与上例完全相同。设某一市场上仅有两个寡头,他们分别都可以选择降价与不降价两种策略。5、(打假) 设当局对商品采取查假行动的费用为a万元,查出假货后,罚款为b万元,且销毁的假货成本为c万元;若商人出售假货,而当局不采取查假行动,则商人可额外获利d万元,且社会的进一步损失为e万元。6、(监督博弈)设税务局查税的费用为a万元,查出逃税后,罚款为b(ba)万元,纳税人应纳的税金为c万元。则税务局与纳税人的该两人非零和对策模型的赢得表具体如下。7、(boxed pigs智猪博弈) 设猪圈里有一个按钮与两只猪,大猪与小猪,按一次按钮,就会有10份食品进入,大猪与小猪同时吃的话,将分别能吃到7份与3份,但去按一次按钮,必须耗费a份食品,而且按按钮者,由于耽误了时间,还将少吃到2份食品。当1a5时,2(等待)是小猪的占优策略,所以大猪只能采用策略I1(去按),于是,多劳者反而少得!这主要是小猪在此有机遇。当a5时,“等待”既是小猪的占优策略,也是大猪的占优策略,所以变成了占优战略均衡,大家都等待,陷入困境。8、(两寡头产量竞争) 设某市场只有两个寡头厂商,其中厂商1与2的产量分别记为x与y,市场总产量记为 Q:xy. 又设,厂商1与2的产量边际成本都恒为2,而且都没有固定成本,也即他们的成本分别为2x与2y。 再设,将这些产品全部销售出去的平均价格函数为 P8Q.于是,厂商1与2的利润分别为9、(北京大学1995年研究生入学考试微观试题,招生专业:国民经济学、产业经济学、金融学、企业管理、管理科学与工程) A、B两企业利用广告进行竞争。若A、B两企业都作广告,在未来销售中,A企业可以获得20万元利润,B企业可以获得8万元利润;若A企业作广告,B企业不作广告,A企业可以获得25万元利润,B企业可以获得2万元利润;若A企业不作广告,B企业作广告,A企业可以获得10万元利润,B企业可以获得12万元利润;若A、B两企业都不作广告,A企业可以获得30万元利润,B企业可以获得6万元利润。10、(北京大学1998年研究生入学考试微观试题,2003年浙江大学博士生入学考试微观试题) 家用电气市场上有两个厂商,各自都可以选择生产空调和彩电,彼此的利润如下列收益矩阵所示11、可口可乐与百事可乐(参与者)的价格决策:双方都可以保持价格不变或者提高价格(策略);博弈的目标和得失情况体现为利润的多少(收益); 利润的大小取决于双方的策略组合(收益函数); 博弈有四种策略组合,其结局是:(1)如果双方都不涨价,各得利润10单位;(2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100,百事可乐利润-30;(3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20,百事可乐利润30;(4)如果双方都涨价,可口可乐利润140,百事可乐利润35;博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡称为博弈的解,它是由博弈规则(即参与者采取什么策略会取得什么结局,市场的需求弹性、交叉价格弹性等)决定的。博弈论与诺曼底战役决策普林斯顿大学的一道习题题目:如果给你两个师的兵力,由你来当“司令”,任务是攻克“敌人”占据的一座城市,而敌军的守备力量是三个师,规定双方的兵力只能整师调动。通往城市的道路只有甲乙两条。当你发起攻击的时候,你的兵力超过敌人,你就获胜;你的兵力比敌人的守备兵力少或者相等,你就失败,那么,你将如何制定攻城方案?“司令”发牢骚躺倒不干:“为什么给敌人三个师的兵力,而只给我两个师?这太不公平,兵力已经吃亏,居然还要规定兵力相等则敌胜我败,连规则都不公平,完全偏袒敌人。”为此你也许会大为不满。来个躺倒不干。其实,这次模拟“作战”,每一方取胜的概率都是50,即谁胜谁负的可能性是一半对一半。你这个司令能否神机妙算,指挥队伍克敌制胜,还得看你的本事。为什么说取胜的概率是一半对一半呢,让我们先学一点儿“纸上谈兵”。我们来分析一下:敌人有三个师,布防在甲乙两条通道上。由于必须整师布防,敌人有四种部署方案,即:A、三个师都驻守甲方向;B、两个师驻守甲方向,一个师驻守乙方向;C、一个师驻守甲方向,两个师驻守乙方向:D、三个师都驻守乙方向。同样,你有两个师的攻城部队,可以有三种部署方案,即:a、集中全部两个师的兵力从甲方向攻击;b、兵分两路,一师从甲方向,另一师从乙方向,同时发起攻击;c、集中全部两个师的兵力从乙方向攻击。和以前一样,如果我们用“+,-”表示我方攻克,用“-,+”表示敌方守住,就可以画出交战双方的胜负分析表: 敌 A B C Da -,+ -,+ +,- +,-我b +,- -,+ -,+ +,-c +,- +,- -,+ -,+假设你采取a方案,那么如果“敌人”采取A方案,你的两个师将遇到敌军三个师的抵抗,你要败下阵来,所以是(一,十);如果“敌人”取B方案,你的两个师遇到敌军两个师以逸待劳的抵抗,你也要败下阵来,同样是(一,+);但是如果“敌人”取C方案,你以两个师打“敌人”一个师,你就会以优势兵力获得胜利,结果是(十,一);同样,如果“敌人”采取D方案,你攻在敌军的薄弱点上,你就能长驱直入,轻取城池,结果也是(十,一)。和以前的博弈表示略微不同的地方,是现在每个格子里面只有正负号,没有数目字。希望这不会使你感到不安。如果你还是喜欢有数目字,那也容易得很,每个正负号后面都加上同一个数目字就行,同一个1同一个1944,或者同一个1998。要紧是表达出输赢。这你就知道,在上述表达中,正负号要紧,具体数目字无所谓。诺曼底登陆模拟:取胜概率相等交战双方的胜负分析表画出来以后,从“,一”的分布来看,似乎双方取胜的机会都一样大。一直看博弈论平话的读者,可以运用劣势策略消去法把它化简。实际做这个题目的时候,如果先从我方入手,一下子是分不出优劣来的。a和b,b和c,a和c之间,都说不上谁比谁优,谁比谁劣。于是,我们从敌方入手,尝试站在敌军的立场,比较策略A和B。如果我军采取策略a,敌军取A或B都会赢,结果一样。如果我军采取策略b,敌军取A会输取B会赢,如我军采取策略c,敌军取A或B都会输。可见,在敌军看来,策略B比策略A好:采取策略A会赢的话(如果我军取a),采取策略B一定也会赢;采取策略A会输的话(如果我军取b或c),采取策略B却不一定会输,因为假如我军取b,敌军就赢了。同样,策略C和D比较,C是优势策略,而D是劣势策略。智慧的或者说理性的局中人是不会采用劣势策略的,所以当做出博弈的矩阵表示以后,如果发现劣势策略,你就可以把它划去,这就是劣势策略消去法。现在,剩下上边那个三行两列的矩阵,六个格子中,(一, )比(十,一)多,似乎敌方的赢面比较大,其实不然。因为到了敌方不会采用“笨蛋”策略的时候,到了敌方只剩下B和C两个较优策略的时候,我方的三个策略之中,原来不是劣势策略的b现在就变成劣势策略了。我们也不是笨蛋,所以我们也应该把b删去。最后,得到下边那个两行两列的矩阵博弈表示。情况最终就是这样:敌军必取B或C那样的二一布防,一路两个师,另一路一个师,而我军必集中兵力于某一路实施攻击,即a或c那样的攻击策略。这样,你若攻在敌军的薄弱处,你就获胜,你若攻在敌人兵力较多的地方,你就失败,总之,敌我双方获胜的可能性还是一样大,“司令”先生:不要躺倒不干,你不比对方吃亏。这虽然是一个模拟的例子,却具有相当的现实意义,诺曼底战役前的情况,大体也是这个样子。跨海作战,攻方能够调动来渡海作战的兵力,通常总是比守方可以用于守备的兵力少。模拟作战中假设攻方兵力力两个师而守方的兵力为三个师,就是这样的背景。另外,渡海登陆作战,通常至少在一开始的时候,攻方要承受很大的牺牲。模拟作战中规定若攻守双方兵力相等则攻方失败,体现了这个意思。博弈论简介董志强 对于一些非数学专业和经济学专业的人们来说,博弈论可能是一个极为陌生的概念。事实上,就是一些经济学专业毕业的学生,他们的博弈论知识也十分有限,我自己也是这样,略知皮毛而已(不,甚至连皮毛都未能真正了解)。因为国内学者把博弈论运用于经济学研究不过是近几年的事,也不普遍,而且它本身的内容也博大精深。但在国外,博弈论已成为占据主流的分析工具,如果你不懂得博弈论,那么你会被认为是没有真正懂得经济学。 博弈论的提法可能太过于学术化,容易让人们退避三舍。其实它有一个非常通俗的名字游戏理论(博弈论的英文名字叫做“Game Theory”,如果直译,就是“游戏理论”)。博弈论在我国还有一个名字,叫对策论。这些名字都很好理解,博弈字面意思就是赌博、下棋,赌博和下棋当然是游戏了,赌博和下棋的时候常常要千方百计地应付对手,自然是要讲究对策了。如果我们要进行一场游戏,首先肯定要有参加游戏的人,没有人参加,游戏就不会进行下去,游戏活动的参与人有一个学术名称叫“局中人”;其次,每一个“局中人”都有自己的“行动”,或者叫做“策略”、“对策”,如果行动不是单一的,那么这个局中人所有的行动构成一个集合,称行动组合或策略组合;另外,还应该约定输家要付出什么代价,赢家可获得什么利益,这在术语上叫做“支付”(或“报酬”)。当然,一场游戏肯定结果不是唯一的,各个参与人分散决策采取不同的行动,会造成不同的结果。但是纳什证明出,在有限个局中人参加的有限行为对策中,至少存在一个所有参与人的最优战略的组合,这叫做“纳什均衡”。处于纳什均衡状态下,每个人都不能通过改变策略来得到更大的收益,所以谁也不存在改变现状的动力。举一个具体的例子来说明一下。这个例子叫“囚犯困境”,是被一些教材广泛引用的例子,并且西方经济学者围绕这个例子发表过不下百篇学术论文。它是这样的(有兴趣的读者可参见青年经济学家张维迎的博弈论与信息经济学,这本书几乎成了经济学研究生的必读书):两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是“坦白从宽,抗拒从严”,如果两人都坦白各判8年,如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年,如果都不坦白则因证据不足各判1年。在这个例子里,局中人就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。我们可以用下面的表来表述这个博弈,表中,第一个数字是A的支付(因为是判刑是负效用,故以负号记之),第二个数字是B的支付。囚犯B 坦白 抵赖囚犯A坦白 -8,-80,-10 抵赖 -10,0-1,-1我们看到,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。张维迎指出,囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个“攻守同盟”,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。“囚犯困境”在经济学上有很多应用,也有力地解释了一些经济现象。比如中东石油输出国组织(Organization of Petroleum Exporting Countries,简称OPEC)的成立,本身要限制各石油生产国的产量,以保持石油价格,以便获取利润。但成员国并不遵守组织的协定,每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌我们不妨考察一下历史:1960年,5个产油国成立欧佩克(OPEC)。1973年成员国扩大到13个。当时各国还少有产量欺骗行为。1973年,阿-以战争爆发,为了报复以色列和西方国家,OPEC突然大幅度削减石油出口,致使世界原油价格由$2.91/桶暴涨到1974年$10.77/桶。这一意外事件让OPEC看到了组建卡特尔的诱人前景。1978年伊朗发生革命,其石油生产一度陷于瘫痪,既而两伊战争爆发,许多石油设施受到破坏,世界石油价格进一步涨到80年代初的$40/桶。但是,高额的利润导致各个国家的产量欺骗行为(实际产量大于限产计划),即各国不再遵守产量协定,擅自提高产量以获取更大的市场和更多的利润,从而导致石油价格下跌当然,价格下跌也与世界其他地区如墨西哥油田、阿拉斯加油田、北海油田等石油供给增加有关。1982年世界石油价格为$32/桶,1984年为$27/桶,1987年为$18/桶,以后基本上在$15-18/桶之间波动。理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。最近发生的一个案例再次证明了这一点。今年4月,长虹突然宣布彩电降价,对彩电业带来了巨大震动。随即,康价佳老总陈伟荣、TCL老总李东生、创维老总黄宏生达成默契:建立彩电联盟。直到4月20日下午,康佳仍表示不降价,但当晚陈伟荣突然改变主意,搞得李、黄措手不及。4月24日,本来三方准备坐下来商讨降价后的进一步策略,结果又是陈伟荣爽约。那么不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那么再第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能再第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作一直到,从第一次开始大家都不会采取合作态度。当然,这只是理论上的分析。现实中影响人们决策和态度的因素很多,所以,有些博弈的结果并不体现为纳什均衡。在国外曾做过一个“囚犯困境”的实验,被实验者是素未谋面的一个男生和一个女生。开始,这个男生每次都选择“坦白”,这是符合纳什均衡的。后来实验者有意安排了一次喝咖啡的机会,使男生发现自己的对手是一个漂亮的女生。结果以后的测验中,男生每次都选择不坦白以获取女孩的好感。不过,不管怎样,博弈论都是一个强有力的分析工具。现在,它不仅在经济学领域得到广泛应用,在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如控制论工程也少不了它。我们举的例子,只是帮助大家形成博弈论的基本概念,实际上它是非常精深的。现在与它紧密联系的经济学分支是信息经济学。信号游戏、拍卖形式、激励机制、委托人代理人理论和公共财政学是博弈论和信息经济学研究的重要课题。应该感谢美国数学家冯?诺依曼(Von Neumann)和摩根斯坦(Morgenstern),是他们在博弈论和经济行为(1944)一书中提出了博弈论的经济思想。冯?诺依曼在数学、计算机、经济学等领域都有奇才般的贡献,可惜英年早逝。1950-1954年,美国数学家统计学家纳什接连发表多篇论述对策论的文章,奠定了现代博弈论学科体系的基础。 生活中的游戏博弈无处不在董志强 日常生活中的一切,均可从博弈论得到解释,大到近段时间北约轰炸南联盟,小到今天早上你突然咳嗽了几声。因为生活的本质,就是在进行一场游戏。可能你觉得,北约轰炸南联盟用博弈论来分析是可以的,但对自己早上咳嗽也可以用博弈论来理解觉得不可思议,因为自己就一个人,和谁进行游戏?非也,并非只有你一人,还有一个叫做“自然(Nature)”的“人”,你在同它进行游戏。你可以把“自然”理解为无所不能的上帝,上帝现在有两种策略,让你生病或不生病。你咳嗽了,你就不得不根据自己咳嗽的信息判断上帝的策略,然后采取对应的策略。上帝采取让你生病的策略,你就采取吃药的策略来对付;上帝采取不让你生病的策略,你就采取不予理睬的策略。看,这不就是一场你和上帝进行博弈的游戏吗?“自然”是研究单人博弈的重要假定。比如一个农夫种庄稼也是同自然进行博弈的一个过程。自然的策略可以是:天旱、多雨、风调雨顺。农夫对应的策略分别是:防旱、防涝、放心地休息。当然,自然究竟采用哪种策略并不确定,于是农夫只有根据经验判断(或根据气象预报)来确定自己的行动。如果估计今年的旱情教重,就可早做防旱准备;如果估计水情严重,就早做防涝准备;如果估计是风调雨顺,农夫就可以悠闲地东转转西走走了。又比如,农夫该在土地上种小麦还是水稻?也是一个同自然进行博弈的游戏。自然可以选择小麦买高价还是水稻卖高价,农夫则根据对自然的可能行动的猜测来确定自己的行动。与一般的博弈不同的是,不管“自然”采取何种策略,也不管你采取何种策略,“自然”的支付(或得益)都是为0的。生活中更多的游戏不是单人博弈,而是双人或多人的博弈。比如:商场谈判、政治斗争、夫妻吵架、恋爱结婚都是这类博弈。再给大家介绍一个有趣的博弈例子。它出自张维迎教授的博弈论与信息经济学,讲的是猪圈里有一头大猪和一头小猪,猪圈的一头有一个饲料槽,另一头装有控制饲料供应的按钮。按一下按钮就会有10个单位饲料进槽,但谁按谁就要付出2个单位的成本。若大猪先到,大猪吃到9个单位,小猪吃到一个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃六个单位,小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示(没格第一个数字是大猪的得益,第二个数字是小猪的得益):小猪按 等待大猪按 5,14,4等待 9,-1 0,0 /注:此例中,谁去按按纽则谁后到;都去按则同时到。在这个例子中,我们可以发现,大猪选择按,小猪最好选择等待,大猪选择不按,小猪还是最好选择等待。即不管大猪选择按还是不按,小猪的最佳策略都是等待。也就是说,无论如何,小猪都只会选择等待。这样的情况下,大猪最好选择是按,因为不按的话都饿肚子,按的话还可以有4个单位的收益。所以纳什均衡是(大猪按,小猪等待)。这个例子是一个多劳不多得的例子。现实中这种情况是很普遍的,一些努力工作的人和不工作的人得到与付出并不相称。改革也有类似的情况,在改革过程中利益的转移必定使一部分人先富一部分人生活水平没得到改善,前一部分人更有改革的积极性。也就是说,改革往往由“大猪”推动,“大猪”越多,改革速度越快。这个例子也可以反映斯密的“看不见手”教条,本来大猪是追求自身的利益,结果给小猪也带来了利益。它也解释了“搭便车”行为,例子中的小猪是一个典型的“搭便车”者,因为它坐享大猪的成果。在这里我们可以联系一下第二章提到的科斯定理,如果我们严格界定产权,是可以改变这种状况的。比如,以法律的形式规定,大猪按出的饲料归大猪支配,小猪按出的饲料归小猪支配,那么大猪小猪都存在去按的动力和积极性。相反,产权不清晰,比如吃大锅饭的情况下,结果是不劳有获、劳而少获,有点类似一幅漫画卖力的驴子挨鞭子(一只驴子拉着一辆车,车上是一个农夫和另外几头驴子,农夫的鞭子落在拉车的驴子身上催它快跑;这只驴子并没有错,它遭罪只因为它比别的驴子强壮)。于是人们工作的积极性没有了。我想,这也是为什么我国改革开放不久,就提出了废除“大锅饭”,砸碎“三铁”(铁饭碗、铁交椅、铁工资)的原因所在了。在智猪博弈中,无论大猪采取何种行动,小猪都是采取等待。我们把小猪的“等待”称为“占优战略”(有点“以不变应万变”的意思)。生活中这样的博弈也不少。比如,某一天你觉得应该是你太太的生日,但又不能肯定:如果是太太的生日的话,你可以送一束花,太太会特别高兴,你的效用增加5个单位,你不送花,但太太会埋怨你忘了她的生日,你的效用降低2个单位;如果不是太太的生日的话,你可以送太太一束花,太太感到意外的惊喜,你的效用增加3个单位,你不送花,结果生活同往常一样,可视为你的效用增加0单位。在这个博弈里,我们看到,“自然”可以有两种策略:确定今天是太太的生日或确定今天不是太太的生日,但不论“自然”采取何种策略,你的最好行动都是买花。买花是你的占优战略。博弈距阵如下(自然的得益皆为0):自然是太太的生日 不是太太的生日你买花5,0 3,0不买花 -2,0 0,0夫妻吵架也是一场博弈。夫妻双方都有两种策略,强硬或软弱(或称鹰派和鸽派)。博弈的可能结果有四种组合:夫强硬妻强硬、夫强硬妻软弱、夫软弱妻强硬、夫软弱妻软弱。至于哪一种是纳什均衡,必须列出其支付矩阵才可以确定。支付矩阵不一定非要用量化确定的数字表示,也可以用支付函数表示。经济学家们常用支付函数进行讨论。根据生活的实际观察,夫软弱妻软弱是婚姻最稳定的一种,因为互相都不愿让对方受到伤害或感到难过,常常情愿自己让步。动物学的研究有相同的结论,性格温顺的雄鸟和雌鸟更能和睦相处,寿命也更长。夫强硬妻强硬是婚姻最不稳定的一种,大多数结局是负气离婚。夫强硬妻软弱和妻强硬夫软弱是最常见的一种,许多夫妻吵架都是这样,最后终归是一方让步,不是丈夫撤退到院子里点根烟,就是妻子避让到卧室里嚎啕大哭。犯罪和防止犯罪是罪犯和警察之间进行博弈的一场游戏。警察可以加强巡逻,或者休息。犯罪者可以采取作案、不作案两种策略。如果罪犯知道警察休息,他的最佳选择就是作案;如果警察加强巡逻,他最好还是不作案。对于警察,如果他知道犯罪者想作案,他的最佳选择是加强巡逻,如果犯罪者采取不作案,自己最好去休息。当然,犯罪者和警察都不可能完全知晓对方将采取的行动,因此他们都将估计对方采取某种行动的概率,从而决定自己要采取的行动。结果是,他们将以一定的概率随机地采取行动,这叫“混合策略”。 我们可以简单地分析一下混合策略(对数字不感兴趣的读者可以不看下面一段)。下面是犯罪者与警察的支付矩阵(假定犯罪者在警察休息时一定作案成功,在警察巡逻时作案一定会被抓住): 犯罪者不作案 作案警察 巡逻 0,0 2,-2 休息 2,0 -1,1这个矩阵的数字含义可以表示,警察巡逻,犯罪者不作案,双方都没有收益也没有损失;警察巡逻,犯罪者作案,警察因抓到罪犯受到表彰,得到效用2单位,罪犯被判刑丧失效用2单位;警察休息,犯罪者不作案,警察休息的很愉快得到效用2单位,犯罪者没有收益也没有损失;警察休息,犯罪者作案,警察因失职被处分而丧失效用1单位,罪犯犯罪成功获得效用1单位。这个博弈是没有纳什均衡的。但是,如果警察知道犯罪者以p的概率选择作案(不作案概率就为1-p),他该怎样采取自己的行动?对警察而言,巡逻的预期效用为0(1-p)+2p=2p,休息的预期效用为2(1-p)-1p=2-3p。显然,当2p2-3p即p0.4的时候,警察最好选择巡逻;反之2p2-3p即p0即q0.33时,他的理性选择是作案,反之不作案。在这个博弈中,警察以0.33的概率巡逻0.67的概率休息,犯罪者以0.4 的概率作案0.6的概率不作案构成一个混合纳什均衡。上述混合纳什均衡可以这样理解,如果警察以高于0.33的概率巡逻,犯罪者最好是躲避起来。犯罪者一旦躲避,警察就没有收获,于是降低巡逻的概率,于是犯罪者重新活跃,于是警察又提高巡逻概率从一个长期来看,两者的均衡将维持在警察以0.33的概率巡逻犯罪者以0.4的概率作案上面。现实中,我们看到,当严打的时候(警察出击的概率较高),犯罪分子便收敛一阵(降低作案概率);严打的时期一过,犯罪分子又开始兴风作浪,在不能容忍罪犯过分猖狂的时候,警界不得不再次开始严打。在上述例子中,可能大家觉得警察和犯罪者都根据一定概率采取自己的行动不太好理解,那么可以尝试这样理解他们:作案的犯罪者越多,那么出动的警察将会越多,作案的犯罪者越少,出动的警察将越少;反过来,出动的警察越多,作案的犯罪者就越少,出动的警察越少,作案的犯罪者就越多。极端地假设一个例子(它有助于我们的理解),警局有100名警察,犯罪集团有100名犯罪者,那么上例博弈中,警察以0.33的概率巡逻而犯罪者以0.4 的概率作案这一纳什均衡可以理解为:在巡逻的警察少于33人时,犯罪集团最好派40名以上的犯罪者作案;在巡逻警察多于33人时,犯罪集团最好派40名以下的犯罪者作案;反过来,犯罪集团派40名以下犯罪者作案,警局最优选择出动33名以下的警察;犯罪集团派40名以上犯罪者作案,警局最优选择出动33名以上的警察。当然,如果犯罪集团倾巢出动,那么警察的选择也是全部出动,但警察一旦全部出动,犯罪者最好选择全部不作案,犯罪者一旦选择全部不作案,警察最好全部选择休息最后长期的均衡状态是,警局派33名警察巡逻,犯罪集团派40个人作案。这可以解释现实中,为什么警界总安排有巡逻力量,而犯罪者也总保持一定的作案数量。一个分析的例子求职欺骗博弈董志强 现在我们用博弈论来分析现实生活的一个现象:求职中的欺骗行为。这个例子旨在为读者将博弈论运用于分析社会现象提供一个例子。从事过人力资源管理工作的人都知道,招募新雇员可能是最易导致失败的工作之一。一名求职者在将来的表现可能有两种:胜任工作和不胜任工作;而招募方的甄选决策也有两种:接受某个求职者和拒绝某个求职者。这样,一次招募行为就面临下面四种结果: 雇主 接受 拒绝求职者 将来称职 将来不称职 显然,、两种结果都是成功的。、两种结果却说明招募工作失败了。情况意味着,雇主错误地拒绝了一个将来表现会比较成功的求职者,从而不得不花费更多的精力和财力去甄选更多的候选人,使甄选费用增加,同时也可能使组织名声受到破坏(比如,你拒绝的是一个妇女,完全可能被妇联指责为歧视妇女)。情况意味着,雇主错误地接受了一个将来表现很差劲的人,这将给组织造成显著的成本费用,包括为该雇员支付的培训成本、员工无能造成的生产成本上升和赢利机会丧失,以及解聘此雇员的费用和选聘新员工的费用等。错误地拒绝或错误地接受一名求职者,都是雇员招募中面临的风险。不过,导致错误接受的因素较少且一般可以由雇主控制(如歧视、偏见等)。导致错误接受的因素较多且雇主很难控制它们,比如求职者有意夸大自己的能力,或者求职者某一方面突出给雇主形成胜任工作的错觉,以及求职者有意的信息隐瞒和诈骗行为等等,都可能导致雇主错误接受。这些因素中,求职者的信息隐瞒和诈骗最严重也最常见。事实上,求职者的信息隐瞒和诈骗行为一直是管理中的道德困境问题。比如,一名下岗女工为了应聘文秘工作谎称她曾受过专门训练(实际上她仅仅在培训班听过几次课),对她的这种行为应严厉指责吗?不过作为雇主,不论是同情还是指责她,显然都不能把她的话当作可靠信息,否则就会作出不利选择。问题是,许多的事实表明,很多的求职者都会有意进行信息隐瞒和信息诈骗。我们可以把招募和应聘看作雇主和求职者之间的一场博弈。求职者有两种策略:欺骗或不欺骗雇主;雇主也有两种策略:相信与不相信求职者。我们假设:求职者不欺骗而雇主相信,双方从彼此的坦荡与信任中可获得效用各5单位;求职者欺骗而雇主相信,那么求职者欺骗成功,获得10单位效用,雇主损失10单位效用(因为雇主可能因此作出错误的决策);求职者欺骗而雇主不相信,求职者的伎俩被识破获得效用0,雇主也未能从发现作弊中得到正效用,其效用也记为0;求职者不欺骗而雇主不相信,那么求职者因觉得冤枉丧失2个单位效用,雇主因没有相信实话也可能决策失误,丧失2个单位效用。下面就是这个博弈的报酬矩阵(每格第一个数字表示求职者的效用,第二个数字表示雇主的效用: 雇主 相信 不相信求职者 欺骗 10,-10 0,0 不欺骗 5,5 -2,-2当求职者不欺骗的时候,雇主的最佳选择是相信。但求职者预计雇主会相信的时候,便会采取欺骗。雇主一旦发觉求职者的欺骗行为就会采取不相信。在这个博弈中,求职者不欺骗而雇主相信带来的总体效用(5+5=10)最大,可惜它不是均衡点。只有求职者欺骗而雇主不相信才是一个纳什均衡。博弈的结果将是求职者欺骗,当然雇主也不会相信。这很好理解:假如现实生活中有人凭借欺骗的手段获得了职位(的确有这样的例子的,而且肯定很多,因为有媒体报道过有人曾伪造公文骗得了市委副书记职务,就更不要说一般的企业招募员工了),势必引起更多的人妄图走此捷径;而雇主一旦发觉更多的人开始有欺骗行为时就会采取审慎的态度,不会轻易相信求职的人们;面对雇主的不信任加剧,原来一些诚实的求职者也开始采取欺骗态度(因为反正你不会轻易相信我是诚实的,我干脆就就不诚实,而且别人骗得我也就骗得),于是更多的求职者不诚实;更多求职者不诚实又加剧了雇主对求职者的不信任最后就到了我们的纳什均衡:求职者欺骗而雇主不相信。上述结论与现实情况是相符合的。生活中,人才市场的通常结果是:由于金钱、升官、新工作的名声等强烈诱惑,由于社会监督检查不力,越来越多的人企图通过“瞒天过海”的手段发迹;寻求工作的急迫心情使人们产生作弊的邪念;作弊成功的范例为进一步作弊推波助澜。我们不难看到这些事例:一个刑满人员为了求职隐瞒其服刑经历,一个高中生为了谋取较高的职位伪造学位证书或购买假文凭。有调查表明,70%以上的求职者在应聘中有信息隐瞒和信息诈骗行为。甚至您可以想想您自己,在您的求职书中真的没有伪造和故意夸大的部分吗?尽管您非常明白,聪明的雇主会看透您求职书的某些部分。学生常常被认为是很单纯的,但我的调查,大学毕业生在他们的求职书中往往言过其实,其文字的煽动性大于纪实性。对于求职中的欺骗行为我很有体会,我的大学同学大多在一些企业的人力资源管理部门工作,使我多少对求职中的欺骗都有些感受。发生在别人身上也就罢了,有的时候发生在你身上可能令你哭笑不得。比如我自己,以前有些朋友借我的毕业证和学位证去作假,没想到有一次弄假成真,我的名字被挂在一个单位的设计部门,“我”成了那儿的工程师可我自己居然还不知道,直到一年多以后才偶然地发现。好了,现在我的一切证件都不敢外借了。雇主可以不相信求职者,却不能不招募必要的雇员填充工作空位。面临求职者的信息隐瞒和欺骗行为,他如何防范和规避可能发生的风险?我们可以假设求职者和雇主有各自的收益函数,然后讨论各种情况下的纳什均衡及其条件。不过那样太学术化,而且会使本书失去普通的读者。因此我省略了那样的做法。单单指出,雇主防范和规避求职者信息隐瞒或欺骗带来的招募风险的具体措施可包括两个方面:雇主应尽可能多掌握求职者的信息,以利形成正确判断,作出正确决策。这方面的工作包括向求职者毕业的学校及原雇主核实其工作情况,对雇员进行背景调查,以及利用其他一些可资利用的信息网络等;设法使求职者采取诚信态度。这一方面的内容包括a.降低求职者欺骗成功的概率,打击其侥幸心理,比如采用申请表、笔试、绩效模拟和测验、工作抽样、面谈、专门的测评中心、履历调查、体格检查等多种手段进行甄选就是有效的办法,以及b.增大求职者欺骗行为的成本(相当于降低求职者欺骗的效用),比如:出台有关制度,对求职者的重大欺骗行为予以制裁(如法律规定通过欺骗签定的劳动合同无效且须补偿受害方的损失);向求职者暗示强硬信息说谎将失去就业机会;在面试中询问有关专业知识方面的问题,如果工作是技术性的,求职者的欺骗行为很容易暴露;实行“降格录用”,即“高学历低就业”,比如研究生先作本科生使用,本科生先作专科生使用,确有能力才提高其就业待遇;约定低报酬的考察期,有能力和绩效方正式录用,正式录用后给予经济补偿;让求职者明白,每一雇员都可能面临历史调查,一旦发现隐瞒和欺诈行为,将受到处理;健全内部劳动力市场,规范内部晋升、报酬等制度。此外,选择采取欺骗手段可能性相对较小的群体作为招募对象(如到学校招聘学生),也是一种规避风险的措施。当然,在不对称信息条件下,不管机制多么完善,代理人的机会主义行为都不可能完全消除。也就是说,我们将没有办法彻底使求职者的欺骗行为在这个世界上消失,虽然,使更多的人不要欺骗是可能的.游戏规则董志强 进行游戏,必然要有游戏规则。人生是一场游戏,人们同命运、他人进行博弈,也有一些规则;经济活动也是博弈,也要讲游戏规则。 游戏规则可以简单地看作是博弈各方(局中人)必须在博弈过程中遵守的一些规定或约定。没有规矩,不成方圆。没有游戏规则,博弈就无法进行。我的理解,游戏规则是游戏参与者的共同知识。在人生和生活的博弈中,游戏规则非常的多,比如法律、道德等等各种正式的或非正式的约束都是游戏规则。违反规则的人,将受到规则的惩罚。游戏规则保证博弈能够有所依据地进行,但并不意味着规则一定是公正和平等的。比如在古代社会,奴隶主或地主可以买卖奴隶或农奴,这是游戏规则许可的,但游戏规则不许可奴隶或农奴有选择主人的权利。中国漫长的封建社会里,“君要臣死,臣不得不死;父要子亡,子不得不亡”、“三纲五常”、妇女的“三从四德”等等都是游戏规则,但这些规则都并不公正平等。生活中的游戏规则通常都是有某些集团或阶层建立起来,不可避免地,将维护一部分人而排斥另一些人,因此也不可能有普遍意义的的公正和平等。正如马克思指出,所谓“民主”的国家只是统治阶级享有民主的国家,被统治阶级是没有民主可言的。什么规则可以是公平和平等的?我想应该是,假如有一个人,他不参与游戏活动,所有的博弈结果跟他没有厉害关系,由他按照公平和平等原则制造出的规则,才可能是公平的。比如,自然是超脱于人类社会的,自然界的“优胜劣汰”、“适者生存”等自然法则就是真正公平和平等的游戏规则。只要规则的制定者参加游戏,那么游戏规则的公正性就得不到保证。就想现在一些经济学家对国有企业受到保护的批评一样,政府是经济活动规则的制定者,但政府又在作为游戏参与者处处践踏规则。在我看来,游戏规则本身也是在博弈中建立起来的。比如,一个社会要建立自己的道德体系,总是在不断的斗争中建立起来。大家从历史和当代都可以看到,在一个道德观念大变革的时期,总是各种观念纷纭,口诛笔伐,激烈争辩甚至运用暴力工具,然后慢慢地有一种观念占据主流,于是以此观念为主体的道德体系开始建立起来。一个国家的法律体系,也是在不断的斗争中建立起来,我的意思不是简单地指那些议员在是否通过一项法案时不停争吵直到最后达成妥协,也包括为使法律成为人人遵守的规则而付出的努力,比如在法令初期对以身试法者的毫不手软。统治者建立的游戏规则的权威性常常建立在许多被统治者的被制裁上面也有例外,战国商鞅立木建信说明也有其他的方法来提高规则的权威性;资本主义国家偶尔也牺牲一点点资产阶级的利益向广大劳动阶层贫民显示规则的权威。还有,大义灭亲也是牺牲自己的利益维护规则的权威性。那些在游戏规则中受到不平等待遇的人们,通常采用这么一些手段作为博弈的策略:改变自己的效用函数,即改变自己对于人生的期望。比如“认命”、信教,养成对生活逆来顺受的品德或者同流合污(比如绍兴师爷里的董知县,年轻时刚正廉洁结果屡屡受挫,心中很是愤懑,后来对官场的黑暗习以为常,有时也仿效几招,官倒越做越大了);退出游戏。比如自杀。当然不仅只是自杀,有的人看透官场的黑暗(即感受到官场游戏规则的不公平)而隐归乡野也是退出游戏;更改游戏规则。比如发动起义、革命,建立新的国家和制度。改革也是更改游戏规则。其实人生在世,受到的众多约束都是游戏规则。如果你没有能力建立有利于自己的新规则,那么还是老老实实地接受既有的规则吧。不过,现在许多的年轻人都对世俗的道德提出了挑战,他们要建立一种多元化的游戏规则这也许是值得高兴的,因为多元化意味着更多的自由。最后有一点想说的是,现代社会的游戏规则已经愈来愈有利于知识阶层,如果你没有能力改变现状,那么你就应该多学点知识,才可能在游戏中立于不败之地。信息的作用董志强 (信息产业报2000年月26日以信息经济学与人生博弈为题转载)在博弈论里面,信息是一个非常重要的概念。现代经济学最为激动人心的领域之一的信息经济学就建立在博弈论的基础上。 虽然信息在信息经济学中有严格的定义,即:信息就是知识差。但是既然我们现在不是讨论学术,所以您也不妨就把信息理解成为您平时所理解的信息,没有关系这不过意味着你理解的信息比信息经济学里的信息范围更宽一些而已。信息对生活的影响是深刻的。从人们赶时髦的一些流行的提法诸如信息经济、知识经济、信息战我们就可以感觉到。更有一些走极端者竟然量出了这样的观点:知识经济的出现彻底否定了斯密以来的两百多年积累和发展起来的经济学理论。从人类历史以来,人们从来没有象现在这样深刻地意识到信息对于生活的重要影响。也从来没有任何一个时代象现在一样,报纸漫天飞,广告遍街是,电台电视台频道不计其数,互联网更是把触角伸向世界每一角落您每天都在信息的狂轰烂炸下苟延残喘!信息实际上也是知识,拥有某方面信息就是拥有某方面知识。比如,你拥有一条信息是甲商场货品比乙商场货品便宜,就相当于你拥有“知道在甲买东西更便宜”的知识。信息是重要的,在商业争斗、军事战争、政治角逐中都表现得十分明显。孙子兵法云:知己知彼,百战不殆。这说明掌握足够的信息对战斗的好处是大大的。 在生活的“游戏”中,掌握更多的信息一般会有好处的。比如,你要恋爱,你得明白他(她)有何所好,然后才能对症下药投其所好,不至于吃闭门羹。你猜拳行令(南方的人们喜欢在喝酒时猜拳助兴),如果你知道对方将出什么,那你绝对赢。信息是否完全会给博弈带来不同的结果。有一个劫机事件的例子(张维迎,1996)可以说明。假定劫机者的目的是为了逃走,政府有两种可能的类型:人道型和非人道型。人道政府出于对人道的考虑,为了解救人质,同意放走劫机者;非人道政府在任何时候总是选择把飞机击落。如果是完全信息,非人道政府统治下将不会有劫机者(这与现实是相符的,在汉武帝时期,法令规定对劫人质者一律格杀勿论,有一次一个劫匪绑架了小公主,武帝依然下令将劫匪射杀,公主也死于非命,但此后国内一直不再有劫人质者),人道政府统治下将会有劫机者。但是,如果想劫机的人不知道政府的类型,那么他仍然有可能劫机的。所以我想,一个国家要防止犯罪的发生,仅有严厉的刑罚是不够的,还要让人民了解那些刑罚(进行普法教育)。因为,他不知道会面临刑罚,他就不会用那些规则来约束他的行为。在我国,法盲是很多的,许多悲剧也正是因为不了解法律而酿成的。加里贝克尔认为影响个人犯罪的因素有被发现的概率和处罚的严重程度,我认为还要加上个体对法律的了解程度这一项这表明,进行普法教育是重要的。更进一步讲,一项制度要规范人们的行为,必须要使人们具备关于这项制度的“共同知识”。比如,规定“车辆右行”的交通规则,就必须使每个司机都具备“车辆右行”的知识,否则交通仍是混乱的。你当然可以对不守规矩的司机进行处罚,是其明白自己的错误从而具备“车辆右行”的知识,那么可能的结果是,每个司机被处罚一次后,“车辆右行”才成为共同知识与其这样,还不如一开始就对申请驾照的人进行交通知识教育。总之,对人们进行关于“制度”的知识教育是重要的。在上面的劫机案例中,非人道主义的政府最好把自己的信息传递给所有的人民,才能使劫机现象不发生。生活中,作为个人而言,有时候也需要把自己的信息传递给别人。比如求职,你就需要尽可能把你的优势长处展示给招募者。 教育程度就是你求职时需要向雇主传递的一个重要信息。大家应该还记得我们讲到过人力资本,那时我们认为较高教育水平劳动力具有较高的劳动生产率,因此所得报酬也较高。但一个叫斯宾塞的经济学家指出:教育水平只是一种信号,可能并不与劳动生产率有相关关系。可以这样理解他的意思:接受教育水平较高的人常常是更具有学习能力的人,较高的教育水平传递了这么一个信息,我具有较强的能力。作为企业,当然更愿意雇佣能力较强的人,于是教育程度就成了企业过滤人才的一个标准。实际上,高教育水平也许并没有带来高产出。当教育程度作为一个信号的时候,我们就可以解释为什么那么多人要去争取一个文凭甚至伪造学历,而且许多企业单单看了求职者的文凭就决定录用而没有仔细去验证求职者的真实能力如何,直到最后才发现,自己接受的大学高材生原来是个高分低能之辈。教育为什么能作为一种信号,而且为什么需要这种信号?用“柠檬市场”原理可以解释。“柠檬市场”本身讨论的是旧车市场,现在我们以劳动力市场来进行同样的讨论。假设劳动力市场上的求职者质量只有两种:高质量和低质量。求职者自己知道自己是高质量还是低质量,但雇主不知道求职者是高质量还是低质量。假设:高质量求职者要求的薪资是500元以上,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 割席分坐、管宁割席、割席断交-【2022年暑假预习】云名著《世说新语》之“德行”卷
- 冀教版九年级上册24.3 一元二次方程根与系数的关系教学设计
- 六年级语文下册 第二单元 习作 写作品梗概教学设计 新人教版
- 今天天气怎么样(教学设计)-2024-2025学年苏教版科学二年级上册
- 全国河大版(三起)小学信息技术第二册第1单元第1课《独一无二的变化-图片处理(1)》教学设计
- 2024中国航信校园招聘笔试参考题库附带答案详解
- 安全标准化基础管理培训教程
- 2024中国移动北京公司社会招聘笔试参考题库附带答案详解
- 项目安全总监安全生产责任制及履职清单
- 冬季八防专项安全培训
- 通用门座机安装工艺2
- 农夫山泉产品陈列手册(共45页).ppt
- 【原创】《“备-教-学-评”目标一致性的实施策略》讲座PPT
- 企业集团财务管理综合练习计算
- 【北师大版】六年级下册数学教学设计-总复习《数的认识》(1)
- 行政事业单位财务管理制度范文
- 机房专用精密空调巡检维护
- 养老机构服务高质量115项明细
- 动、静平衡原理及平衡方法
- 船舶首制船设计任务书doc
- 创业路演路演(PPT课件)
评论
0/150
提交评论