![博弈中学习机制问题_第1页](http://file4.renrendoc.com/view/2c0ff12d3ee87562638f5738b6a3755c/2c0ff12d3ee87562638f5738b6a3755c1.gif)
![博弈中学习机制问题_第2页](http://file4.renrendoc.com/view/2c0ff12d3ee87562638f5738b6a3755c/2c0ff12d3ee87562638f5738b6a3755c2.gif)
![博弈中学习机制问题_第3页](http://file4.renrendoc.com/view/2c0ff12d3ee87562638f5738b6a3755c/2c0ff12d3ee87562638f5738b6a3755c3.gif)
![博弈中学习机制问题_第4页](http://file4.renrendoc.com/view/2c0ff12d3ee87562638f5738b6a3755c/2c0ff12d3ee87562638f5738b6a3755c4.gif)
![博弈中学习机制问题_第5页](http://file4.renrendoc.com/view/2c0ff12d3ee87562638f5738b6a3755c/2c0ff12d3ee87562638f5738b6a3755c5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、博弈中的学习机制问题一:归纳和演绎二:行动中的两种推理:归纳与演绎三:酒吧问题四、少数者博弈及其应用: 股票买卖与交通拥挤问题五、对称的人群为什么会出现破缺性的行动盲目的学习1一:演绎推理和归纳推理、演绎推理:是由某个普遍性的原理推出某种特殊的结论 (三段论) 大前提:“所有人皆要死”; 小前提:“张三是人”; 结论:“张三要死”。只要前提真,推理过程无误,演绎推理的结论就是真的。演绎推理是由某个普遍性的原理推出某种特殊的结论。这个结论其内容不会超过前提蕴涵的内容 。2、归纳推理 由个别性的真的现象或前提推导出普遍性的结论就是归纳推理。 前提1:张三要死; 前提2:李四要死; 结论:所有人都死
2、。归纳出来的普遍性的结论不是必然真的,而是归纳真的,或者说是“或然真的”。即:结论可能是真的,也可能是假的。 3、归纳法的问题()归纳法是跳跃的。()归纳法是人们的习惯联想(甲现象-乙现象)但是不一定合理。()归纳法是一种有用的思维工具,但不是时时有效。()归纳法存在困境,其合理性会受到质疑。()归纳法在现实生活中到处可见。4如何用归纳法对人的行动进行归纳,决定自己的行动的、对事物规则性的归纳得出的结论叫规律,用归纳法来对人下结论。、 根据不同情况将进行分类。、这样的归纳会发生错误,随着交往的深入,归纳会发生改变。这是个不完全信息动态博弈。5 由于人们利用归纳法,在生活中就会形成均衡态:周边的
3、情况基本上被定了位,形成了固定的关系。所以现实生活一切从归纳开始,并且在不断的交往中对所归纳的看法给以改正。 这是一个博弈,在这个博弈中存在着一个对周边的人不断认识(不完全信息动态博弈)的过程,在博弈中称之为学习过程。6二、行动中的两种推理:归纳与演绎 博弈论是研究人的行为的,在博弈论中参与者一方面猜测其他参与者的策略,同时计算各种策略可能性下的支付(得益)。人们往往准备了各种备选策略,当其他参与者采取一确定策略时,自己将决定采取某种策略。(“人不犯我,我不犯人;人若犯我,我必犯人”) 、我们经常用逻辑推理的方法来确定自己的行动;逻辑是社会行动的基础。 (“如果天下雨,我将带伞”)前提1:如果
4、天下雨,我将带伞前提2:今天下雨;结论;我要带伞。这是一个演绎推理、 逻辑推理在社会行动中是确定策略的工具。参与者在计算支付时,也是一样确定自己的策略,即确定:一旦别人采取什么策略,我将采取什么支付更大策略更好7、行动中的逻辑推理与认识中的逻辑推理的关系 ()在行动的推理中只要前提是真的,推理形式正确,结论肯定是真的。这与认识中的逻辑推理是一样的。()人们的行动中的推理前提其正确性如何呢(是由行动者根据自身的利益来决定的)行动的正确性是由行动者的理性与行动结构所决定的。就博弈来说,这个结构就是博弈的结构。一旦行动者的结构给定了,理性的行动者的策略决定就确定了。对于日常非博弈的情况,理性的行动者
5、总是最大化自己的利益制定策略的。8三、酒吧问题有一群人,例如总共有人,每个周末,均要决定是去一洒吧活动还是呆在家里。酒吧的容量是有限的,比如空间是有限的或者座位是有限的,如果人去多了,去酒吧的人会感到不舒服,此时,他们留在家里比去酒吧更舒服。我们假定酒吧容量是人或者说座位是个,如果某人预测去酒吧的人数超过人,他的决定是不去,反之则去。这人如何作出去还是不去的决策呢?9、这是一个不完全信息动态博弈,人们根据以前去酒吧的人的不完全的信息来作出一个去与不去的决策。、对博弈的参与者来说。问题是他如何才能归纳(预测 )出合理的行动策略 。、经过一段时间这个系统中的人群去与不去的人数之比是60:40,形成
6、一个生态稳定系统。10、如何解释()混沌现象()非线性过程非线性的过程是说,系统未来对初始值有强烈的敏感性。(“蝴蝶效应”) ()推理过程酒吧问题中,假如其中一个人对未来的人数作出了一个预测而决定第n天去还是不去,他的行为反映在下次去酒吧的人数上,这个数目对其他人的预测及第n1天去和不去的决策造成影响,即第n1天中去酒吧的人数中含有他第n天的决策的影响。而他对第n2天人数的预测要根据第nl天的人数,这样,他第n天的预测及行为给其他人造成的影响反过来又对他第n+2天的行为造成影响。随着时间的推移,他的第n天的决策的效应会越积越多,从而使得整个过程变成不可预测的。()这个过程是一个不完全信息的动态
7、博弈,是在每一次完全信息博弈的基础上对整个博弈过程的推测。11酒吧问题所反映的是这样一个社会现象:我们在许多行动中,要猜测别人的行动,然而我们没有更多关于他人的信息,我们只有通过分析过去的历史来预测未来。你能举出相关的例子吗?12四、少数者博弈及其应用: 股票买卖与交通拥挤问题、少数者博弈 有一群人,比如n人,n为奇数。这n人被告知要决定站在A边或站在B边失火时你跑向哪个门。如果你选择的是少数人选择的,你就赢了,反之就输了。这样的游戏重复进行,参与者努力使自己赢更多的次数。()公共信息:过去的记录()怎样决策:为了方便分析,我们用一个2值序列来表示结果序列:1表示选A,表示选B,1表示A赢的一
8、边,表示赢的一边。记忆长度为3(m3)。1314从表可见:一个可能的策略,决定是根据以往的3个记录来作出的。行动者根据这个策略就能在不同情况下作出具体决定,如记录为“1”,决定为“”,即:当决策者观察列最近3次的赢的一边分别是:最近的一次为选A门赢;最近的第二次为选B门赢;最近的第三次为选B门赢那么他将选择B门。15表中只是某一个行动者可以选取的一个策略。不同的行动者根据记录有不同的决定方式,这样便有不同的策略。在这个例子中,记录有8种(2的m次方8),而每个记录下的决定一发生变化,就形成一区别的策略,如表中是一个可能策略,而当记录为“”,下次可以决定为“”,而其他记录下的决定不变,此时构成一
9、个新的策略。这样,我们可得出,共有256(2的次方)种策略,当记忆很长时,策略便多得惊人。当m5时,策略总数为2的的次方655362。16有些物理学家用计算机进行数值模拟,人数为101人的群体,记忆长度分别有m13,m26,给出的初始的策略为2时,数值模拟出两个结论:(1)将记忆长度长的人,即m2=6的人,加入记忆长度短m13的群体,对群体将有改进,即有更多的人赢;(2)记忆长度长的人(m2=6)有优势,即他赢的机会大于记忆长度短的人。但是这个结论不具有普遍意义.这说明记忆长度越长,其掌握的信息就越多,博弈的策略也就越多,胜利的可能性就越大。17、生活中少数者博弈的应用()股票市场的应用少数者
10、博弈可以运用于股票市场每个股民都猜测其他股民的行为而努力与大多数股民不同。如果多数股民处于“卖”股票的位置,而你处于“买”的位置,股票价格低,你就是赢家;而当你处于少数的“卖”股票献位置,多数人想“买”股票,那么你持有的股票价格将上涨你将获利。股民采取的策略多种多样,而策略的得出完全是根据他们以往的经验归纳出来的因而类似于这里的少数者博弈的情况。18()交通拥挤问题交通拥挤问题的模型也是一个少数者博弈的问题。城市的交通越来越拥挤,司机选择行车路线也是不断的博弈过程。在交通高峰期间司机面临两条路的选择时往往要选择没有太多车的路线行走,此时他宁愿多开一段路程而不愿意在塞车的地段焦急地等待。司机只能
11、根据以往的经验来判断哪条路更好走,而所有司机都不愿意在塞车的道路上行走因此一个司机的选择必须考虑其他司机的选择。这也是一个少数者博弈问题。19生活中我们还能找到很多这样的例子由此可见,人在不同的情况下的策略是很多的,那得根据你的经验来作出决定,这也正是博弈的学习机制所在。20五、对称的人群为什么会出现破缺性的行动盲目的学习、什么是对称对每个人讲,他的预测与行动独立于其他人将要作出的选择因假定他们之间没有信息交流或对信息都不完全了解。这时两边的信息是对称的。、信息的对称学习信息的非对称人的从众心理盲目学习、信息的对称通过学习使均衡的打破信息不对称盲目学习来达到均衡、 出现选择的非对称性完全由于人们的选择行动之间的相互作用。其实这是微妙的,同时是不合理的学习过程。21这就是为什么出现非对称的选择结果了。这种传递不是通过语言,而是通过对前面人的选择行动的观察。这是一个学习的过程,并且是一个没有理由的学习过程,也就是说这样的学习过程是没
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 远程教育在宠物行业人才培养中的应用
- 风险导向下企业内部财务控制的改进措施研究
- 餐饮应急预案
- 监控施工方案范文(6篇)
- 二手机械销售合同模板
- KTV装修合同执行管理制度范文
- 不锈钢建筑材料加工合同
- 交通损害赔偿合同示例
- 业务合作及分成合同书
- 个人创业借款合同条款
- 《电子技术基础(第二版)》中职技工全套教学课件
- 人教版五年级上册小数乘除法竖式计算题200道及答案
- 五年级上册美术《传统门饰》课件
- DL∕T 1309-2013 大型发电机组涉网保护技术规范
- (2020版)煤矿安全生产标准化管理体系评分表
- 城乡低保待遇协议书
- DL-T5153-2014火力发电厂厂用电设计技术规程
- 华为HCIA-Storage H13-629考试练习题
- 辽宁省抚顺五十中学2024届中考化学全真模拟试卷含解析
- 2024年中国科学技术大学少年创新班数学试题真题(答案详解)
- 2024年新疆维吾尔自治区成考(专升本)大学政治考试真题含解析
评论
0/150
提交评论