博弈论:原理、模型与教程第02章Nash均衡第01节占优行为_第1页
博弈论:原理、模型与教程第02章Nash均衡第01节占优行为_第2页
博弈论:原理、模型与教程第02章Nash均衡第01节占优行为_第3页
博弈论:原理、模型与教程第02章Nash均衡第01节占优行为_第4页
博弈论:原理、模型与教程第02章Nash均衡第01节占优行为_第5页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《博弈论:原理、模型与教程》第一部分完全信息静态博弈第2章Nash均衡第2.1节占优行为第2.2节重复剔除劣战略行为第2.3节Nash均衡本章将通过分析理性参与人在博弈中的选择行为,探讨完全信息静态问题的求解,并给出完全信息静态博弈的解一Nash均衡。2.1占优行为(已精细订正!经典博弈:囚徒困境1、定义2-1【例2-1】2、定义2-2【例2-2]首先考察博弈论中最为经典的一个博弈模型一“囚徒困境”(prisoners'dilemma)博弈。两个小偷作案后被警察抓住,分别关在不同的屋子里审讯。在审讯之前,小头偷从律师那里得知:如果两个人都坦白,将被个判刑4年;如果两个人都抵赖,将会因为证据不足而各判1年;如果其个一人坦白另一人抵赖,坦白的讲将会得到宽大处理而被无罪释放,而抵赖的将被重刑,判刑6年。试问两个小偷将会如何选择?上述“囚徒困境”博弈问题是Tucker在20世纪50年代提出的,该问题不仅“可以作为实际生活中许多现象的一个抽象概括”,而且对它的研究在一定程度上也奠定了非合作博弈论的理论基础。在“囚徒困境”博弈问题中,参与人是两个小偷,参与人的战略都是:坦白和抵赖,支付就是在各种选择下所得到的刑期。图2-1给出了“囚徒困境”博弈问题的战略式描述。-4,-40,-6-6,0-1,-1小偷2坦白小偷1抵赖坦白抵赖图2-1“囚徒困境”博弈显然,在“囚徒困境博弈”中,小偷选择的结果不仅与自己的选择有关,而且与另一小偷的选择有关,那么小偷如何选择呢?不妨这样考虑小偷的决策过程:假设对方坦白,自己该怎么做;假设对方抵赖,自己应该怎么做。也就是,给定另一小偷的决策,寻找自己的最优决策。对于每个小偷,当对方坦白时,自己坦白得-4,抵赖得一6,所以应该选择“坦白”;而当对方抵赖时,自己坦白得0,抵赖得-1,所以还是应该选择“坦白”。也就是说,无论对方如何选择,每个小偷都会选择“坦白”。因此,博弈的结果就是两个小偷都选择“坦白”。两个小偷都选择“坦白”,这样的结果似乎与我们的直觉相矛盾。因为在“囚徒困境”的4种结果(即(坦白,坦白)、(坦白,抵赖)、(抵赖,坦白)、(抵赖,抵赖))中,虽说不能肯定(坦白,坦白)这个结果是最差的,但它显然不如(抵赖,抵赖)。这是因为(坦白,坦白)导致两个小偷都得—4,而(抵赖,抵赖)却能使大家都得—1,也就是说,(抵赖,抵赖)是Pareto优于(坦白,坦白)的。既然选择“抵赖”对双方都有好处,那么两个小偷是否都会选择“抵赖”呢?只要小偷是前面所假设的完全理性的参与人,答案就是否定的。不妨假设两个小偷都选择“抵赖”,现在分析小偷的这种选择是否是理性的。对小偷1而言,小偷2选择“抵赖”的情况下,自己选择“抵赖”得-1,选择“坦白”得0,显然“坦白”优于“抵赖”。因此,理性的小偷1将会偏离“抵赖”而选择“坦白”。基于同样的原因,理性的小偷2也会偏离“抵赖”而选择“坦白”。除了(坦白,坦白)和(抵赖,抵赖)以外,“囚徒困境”是否会出现其他结果呢?比如说一个人坦白,一个人抵赖?我们说这样的结果也是不会出现的,因为在对方选择“坦白”的情况下,自己选择“抵赖”显然是不理性的。剩下的问题是:当两个小偷都选择“坦白”时,是否有人偏离“坦白”而选择“抵赖”。基于同样的分析,两个小偷只要是理性的,这种情况就不会发生因此,虽然结果(抵赖,抵赖)是结果(坦白,坦白)的种情况就不会发生Pareto改进(即所有的人都得到好处),但只要两个小偷是理性的,这种对所有人都有好处的“改进”两人都无法得到。这也反映出现实生活中经常出现的“个人理性与集体理性间的矛盾”。事实上,“囚徒困境”在现实生活中有着许多应用。也许“囚徒困境”博弈是人们虚构出来的一个博弈模型,但在现实生活中与“囚徒困境”相似的情形却很多。例如,寡头垄断市场上厂商间的价格大战,就是典型的“囚徒困境20世纪90年代末期我国出现的彩电企业间的价格大战就是这种情形,还有目前人们议论比较多的有关中小学生教育方式的选择。家长明知道素质教育对孩子的长远发展更有益处,但为了应付各种各样的升学考试,也不得不让孩子参与各种名目的“模拟考试”或“考试培训”,这也是典型的“囚徒困境”。诸如此类的例子,现实生活中还有很多。1也许有人会问:如果两个小偷在被抓之前就制定攻守同盟,决定双方选择“抵赖”,这是否可以是博弈的结果为(抵赖,抵赖)呢?这要取决于“攻守同盟”对双方是否具有约束力,是否对双方的支付产生影响。只要这种“攻守同盟”对双方的选择没有约束力,不能对违背协议(即“攻守同盟”)的参与人的支付产生影响,理性的参与人都会选择偏离“抵赖”而选择“坦白”。进一步分析“囚徒困境”中小偷的战略,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略。考察更一般的n人博弈情形。n人博弈中,参与人~=1,2广川)的支付Ui=Ui(s,sQ既与自己的选择s有关,也与其他参与人的选择s」有关。因此,在一般情况下,使某参与人的支付u=Ui(s,,s」)最大化的最优战略S”与其他参与人的选择s」有关。但在某些特殊情况下,如“囚徒困境”博弈中,可能会出现这样的情况:参与人i(i=1,2,…,n)的最优战略s1与其他人参与人的s」无关。也就是说,无论其他参与人选择什么战略,参与人的最优战略总是唯一的。这样的最优战略称为“占优战略”(dominantstrategy),如“囚徒困境”中参与人的“坦白”战略。定义2-1在n人博弈中,如果对于所有的其他参与人的选择s,,s:n都是参与人i的最优选择,即Vsi£Si(si丰Si)VStw%Sj,有j4Ui(si,s>u⑸sG

则称s”为参与人i的占优战略显然,在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略,参与人的这种选择行为称为占优行为。占优行为是理性参与人选择行为的最基本特征。2,1-2,-61,20,13,0-1,23,3-1,-2参与人2―db3bib2b4【例2-1】考察图2-2所示的战略式博弈,其中参与人1有两个战略一为和2,1-2,-61,20,13,0-1,23,3-1,-2参与人2―db3bib2b4ai参与人11a2图2-2战略式博弈更进一步,如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略,在这种情况下,博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategyequilibrium)。定义2-2在n人博弈中,如果对所有参与人i(i=1,2;1n),都存在占优战略0”,则占优战略组合s*=(s*,或…,吟称为占优战略均衡。显然,在一个博弈问题中,如果所有参与人都有占优战略存在,那么占优战略均衡就

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论