数学文化课件_第1页
数学文化课件_第2页
数学文化课件_第3页
数学文化课件_第4页
数学文化课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学文化与思维主讲人:吴东灵博弈论剧情回顾

影片中有这样一个情节:在美国普林斯顿大学的酒吧里,4个男生正商量着如何去追求一位漂亮女生,当时还正在大学读书的纳什却在朦胧的“博弈论”思维逻辑引导下喃喃自语:“如果他们4个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当‘次品’。但如果他们先追其他女生,那么漂亮女生就会感到被孤立,这时再追她就会容易得多。”在纳什眼里,追求女生就是一场“博弈”,而“博弈”是要遵循一定规则的,是需要“博弈”策略的。博弈论是什么?博弈论又被称为对策论(GameTheory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论是研究具有斗争或竞争性质现象的数学理论和方法。它考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。目前已被广泛运用到各个领域,在经济学中取得了尤为突出的发展。战争是怎样发生的?

8岁的男孩问父亲:“爸爸,战争是怎样发生的?”男孩的父亲回答:“很简单。比如说第一次世界大战的爆发,是因为德国入侵比利时……”在一旁的妻子立即打断他的话:“你讲的不对。第一次世界大战的起因是有人在萨拉热窝被刺杀了。”丈夫听了一脸不悦,冲妻子不耐烦地说道:“是你回答这个问题,还是我回答?”妻子听了也是满脸的不高兴,她转身跑出起居室,砰的一声将门关上。紧接着,从厨房里传出了碗碟猛摔在地上的声音,过了一会儿,整个屋子陷入死一般沉寂。男孩眼眶里含着泪水,轻声说:“爸爸,你不用说了,我知道战争是怎样发生的了."远观博弈论夫妻二人以一种两败俱伤的方式,使自己的孩子明白了战争的发生和夫妻两个人吵架之间的内在关联:让国家之间一步一步走向世界大战的机制,同样也正是同一屋檐下夫妻失和的原因。也就是说,无论是国与国之间,还是人与人之间的合作和冲突,其中所蕴含的博弈原理是大同小异的。诺贝尔经济学奖得主奥曼在权威的《帕尔格雷丈夫辞典》中,对“博弈论”此条的解释十分精辟和凝练。他认为,博弈论描述性的名称应该是“互动的决策论”。因为人们之间的决策与行为会形成互为影响的关系,一个主体在决策时必须考虑到对方的反应。博弈的形成博弈的目的是利益,利益形成博弈的基础。最基本的假设就是经济人或理性人的目的就在于使收益最大化。参与博弈者正是为了自身收益的最大化而互相竞争。参与博弈的各方形成相互竞争、相互对抗的关系,以争得利益的多少来决定胜负,一定的外部条件又决定了竞争和对抗的具体形式。这样就形成了博弈。简单的案例夫妻俩下班回到家,吃完晚饭想看电视。电视预报显示,一个频道会播放丈夫喜爱的足球赛,而另一个频道会播放妻子喜爱的选秀节目。但是家里只有一台电视机。这样,围绕着到底看什么节目。一场博弈就展开了。要素分析在这场博弈中,完整地包含了形成一个博弈的4个要素:(1)2个或2个以上的参与者(player)。

博弈中必需的条件:不是一个人在一个毫无干扰的环境中做决策。(2)博弈要有参与各方争夺的资源或收益(resources/payoff)

资源指的不仅仅是自然资源,还包括了各种社会资源,如人脉、信誉、学历、职位等。人们之所以参与博弈是受到利益的吸引,将来所获得利益的大小直接影响到博弈的吸引力和参与者的关注程度。

简单说就是:凡是自己主观需要的就是资源;相反,主观不需要的对自己就不能构成资源。这就是“情人眼里出西施”的道理。要素分析(3)参与者有自己能够选择的策略(strategy)

通俗地说,策略就是计策,是博弈参与者所选择的手段和方法。制定博弈论中的策略,要先对局势和整体状况进行分析,确定局势特征,再找出其中关键因素,最后才进行手段选择。

由此可见,博弈论中的策略是牵一发而动全身的,直接对整个局势造成重大影响。(4)参与者拥有一定量的信息(information)

博弈就是个人或组织在一定的环境条件与已定的规则下,同时或先后,一次或是多次选择策略并实施从而得到某种结果的过程。案列分析上述“夫妻博弈”模型大致会出现三种情况:一是两人争执不下,于是干脆关掉电视,谁都别看;二是你看足球,我到其他地方看选秀,或你看选秀,我到其他地方看足球;三是其中一方说服另一方,两人同看足球或同看选秀节目。案例分析夫妻二人通常不会因为电视节目的分歧而分开活动的。这是研究该问题的潜在前提。但是,对于看什么节目,双方又各有偏好。因此我们可以假定:如果丈夫和妻子分开活动,男女双方的效用为0,如果双方一起去看球赛,则丈夫的效用为5,而妻子的效用为1;如果双方一起看选秀,则丈夫的效用为1,妻子的效用为5。案例分析

根据上述假定夫妻双方不同选择的所有结果及其效用组合如下表。

就是这样一个矩阵,可以一目了然地把我们介绍的几种因素包含在里面。

矩阵是博弈论中用来描述两个或多个参与人的策略和效用的最常用工具,又被称为“收益矩阵”或“得益矩阵”。均衡思想

均衡可以说是博弈论中最重要的思想之一,但是却并不复杂。我们可以用描述法来加以定义:在博弈达到均衡时,局中的每一个博弈者都不可能因为单方面改变自己的策略而增加收益,于是各方为了自己利益的最大化而选择了某种最优策略,并与其他对手达成了某种暂时的平衡。在外界环境没有变化的情况下,倘若各方坚持原有的利益最大化原则并理性面对现实,那么这种平衡状况就能够长期保持稳定。纳什均衡

在所有的均衡中,“纳什均衡”又是一个基础性的概念。简单地说,所谓“纳什均衡”就是所有人的选择综合在一块,不一定所有选择都能实现最大化原则,但能使所有人都达到最大化的均衡状态。

纳什均衡是一种最常见的均衡。在纳什均衡点上,每个参与者的策略是最好的,此时没有人愿意先改变或主动改变自己的策略。也就是说此时如果他改变策略,他的收益将会降低,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡不仅要求所有的博弈参与人都是理性的,而且要求每个参与人都了解所有其他参与人也都是理性的。需要注意的是,博弈的结果并不都能成为均衡。博弈的均衡是稳定的,因此可以预测。轻松一刻在斯大林时代的苏联,一位乐队指挥坐火车前往下一个演出地点。正当他在车上翻看当晚就要指挥演奏的作品乐谱时,两名克格勃(KGB,苏联国家安全警察,实际是政治特务)将他作为间谍逮捕了。他们以为那乐谱是某种密码。这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,根本无济于事。在乐队指挥被投入牢房的第二天,审问者自鸣得意地走进来说:“我看你最好还是老实招了吧,我们已经抓住你的朋友柴可夫斯基了。他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了,只判你10年。”经典模型之一:囚徒困境模型

1950年,担任斯坦福大学客座教授的数学家图克(Tucker),给一些心理学家解释他正在研究的完全信息静态博弈问题。为了更形象地说明博弈过程,他用两个犯罪嫌疑人的故事构造了一个博弈模型,即“囚徒困境模型”。

这一模型的过程具体是这样的:囚徒困境模型两个共同偷窃的犯罪嫌疑人甲和乙被带进警察局。警方对两名犯罪嫌疑人实行隔离关押,隔离审讯,每个犯罪嫌疑人都无法观察到同伴的选择。警方怀疑他们作案,但手中并没有掌握确凿证据,于是明确地分别告知两名犯罪嫌疑人,对他们犯罪事实的认定及相应的罪刑完全取决于他们自己的供认。警方提出条件如下:囚徒困境模型分析

两名囚徒面临的选择及其带来的后果组合用收益矩阵表示如下:哪一种选择对犯罪嫌疑人更有利呢?囚徒困境模型分析

从上表中可以知道:每个犯罪嫌疑人都有两种可供选择的策略:供认或抵赖。而且,每个犯罪嫌疑人选择的最优策略不依赖于其同伙的策略选择。如果甲选择抵赖,那么就可能会出现两种情况:如果乙选择供认,那么甲将被加重惩罚,判刑10年,而乙则无罪释放;如果乙也同样选择抵赖,那么他们两个都将因证据不足而被释放。很显然,这第二种结果对于两个人都是最有利的。但是,因为警方没有把两名嫌疑人放在一间囚室里,因而这种合作难以顺利进行,使得结果预测的不确定性加大,或者说增加了抵赖合作的风险性。

因此,基于人是理性的这一前提。由于犯罪嫌疑人不知道对方的想法,最理性的博弈策略,就是选择供认。这时的策略,我们可以称为占优策略。占优策略与劣势策略

而如果所有参与人都有占优策略存在,那么博弈将在所有参与人的占优策略的基础上达到均衡,这种均衡称为占优策略均衡。在囚徒困境中,“甲供认,乙供认”就是占优策略均衡,因为不管甲乙两人谁供认,都将得到减轻惩罚的结果:如果甲供认了,乙抵赖。甲将免于惩罚,如果乙也供认了,那么罪名各担一半,从甲个人看来,也减轻了惩罚;甲乙互换位置,结果依然是一样。显然,这一策略是一个占优策略。

与占优策略相对应,劣势策略则是指在博弈中,不论其他参与人采取什么策略,某一参与人可能采取的策略中,对自己严格不利的策略。

有一个要注意的问题是,采用优势策略得到的最坏结果,并不一定比采用其他策略得到的最佳结果要好。应该说,参与人采用优势策略时,无论对方采取任何策略总能够显示出优势。聪明还是不聪明?两个旅行者从一个出产细瓷花瓶的地方回来,都买了花瓶。可是提取行李的时候,发现花瓶被摔坏了。于是。他们向航空公司索赔。航空公司知道花瓶的价格总在八九十元上下浮动,但是不知道两位旅客买的确切价格是多少。于是,航空公司请两位旅客在100元以内自己写下花瓶的价格。如果两人写的一样,航空公司将认为他们讲的是真话,并按照他们写的数额赔偿;如果两人写的不一样,航空公司就论定写得低的旅客讲的是真话,并且照这个低的价格赔偿。但是对讲真话的旅客奖励10元钱,对讲假话的旅客罚款10元。为了获取最大赔偿,甲乙两位旅客最好的策略就是都写100元,这样两人都能够获赔100元。可是甲很聪明,他想:如果我少写1元变成99元,而乙会写100元,这样我将得到109元。何乐而不为?所以他准备写99元。可是乙更加聪明,他算计到甲要算计自己而写99元。“人不犯我,我不犯人,人若犯我,我必犯人”,于是他准备写98元。想不到甲又聪明一层,算计出乙要这样写98元来坑他,“来而不往非礼也”,他准备写97元…

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论