博弈论-博弈分类

上传人：1*** IP属地：湖北上传时间：2024-12-11 格式：PPTX 页数：27 大小：1.20MB 积分：6 举报 版权申诉

已阅读5页，还剩22页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

博弈论及其应用

GameTheorywithApplications

第二章：博弈分类

ChapterII:Classification2024/12/11覃燕红——重庆理工大学21、博弈定义与要素I博弈定义处于互动局势中的个体在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。六个基本要素参与人/局中人(players)：互动局势中的行为决策主体行动(actions/moves)：局中人可能选择的行为收益/支付/得益(payoff)：局中人的利益或效用战略(strategies)：各种情形下的行动选择方案（相机行动）信息(information)：对他人类型、行为或效用的了解程度次序(order)：各博弈方选择实施行为的先后顺序注：某些教材分为四要素或者五要素：参与人、行动或策略、信息、支付2024/12/11覃燕红——重庆理工大学31、博弈定义与要素I六个基本要素均衡：确定了博弈要素后，均衡分析就成了博弈分析的主要内容均衡是博弈的一种状态，通常用博弈各方的策略组合来描述均衡状态下，满足如下特征：在其他参与人坚守各自均衡策略的前提下，所有参与人都不愿意单方面改变自己的策略2024/12/11覃燕红——重庆理工大学4一项基本假设：完全理性(completerationality)追求个人最大利益——经济学中的经济人假设非常聪明——在任何情况下都知道如何追求个人最大利益一个专业术语：共同知识(commonknowledge)知道对方所知道的，并且知道对方知道自己所知道的，而且知道对方知道自己知道对方所知道的……在博弈论中，关于对方理性层次的推断，称为信念(belief)大量心理学实验研究表明，普通人的推理层次不超过七层选美博弈实验假如你和很多人一起参加一项游戏：要求每个人独立地选择1到100之间的任意一个整数，选择了与大家选择的数的平均数的一半最接近的那个人将获得一笔丰厚的奖金。面对奖金的诱惑，聪明的你会选择哪个数？1、博弈定义与要素II2024/12/11覃燕红——重庆理工大学52、博弈模型示例I囚徒困境(Prisoners’Dilemma)来源：普林斯顿大学的塔克(tunker)教授杜撰（上海演讲）的故事梗概：两个小偷行窃未果被抓，隔离审讯。“坦白从宽，抗拒从严”：如果两人都坦白则各判8年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白则因证据不足各判1年。坦白否？六个基本要素分别是什么？基于收益矩阵(payoffmatrix)的模型描述：-8，-80，-10-10，0-1，-1囚徒A坦白抵赖坦白抵赖囚徒B2024/12/11覃燕红——重庆理工大学6囚徒困境(Prisoners’Dilemma)没有实现两人总体的最大利益没有实现自身的个人最大利益类似：广告商之间耗资巨大的广告营销战、人们对公共资源的掠夺式使用、森林砍伐、实际和网络上的牛皮广告等-8，-80，-10-10，0-1，-1囚徒A坦白抵赖坦白抵赖囚徒B2、博弈模型示例I2024/12/11覃燕红——重庆理工大学72、博弈模型示例II剪刀-石头-布0，01，-1-1，1-1，11，-10，01，-1-1，10，0石头剪子布博弈方2石头剪子布博弈方1策略相互依存不仅取决于自身的策略选择，也取决于其他博弈方的策略选择如果只博弈一次，输赢主要取决于机会和运气2024/12/11覃燕红——重庆理工大学82、博弈模型示例III田忌赛马3，-31，-11，-11，-1-1，11，-11，-13，-31，-11，-11，-1-1，11，-1-1，13，-31，-11，-11，-1-1，11，-1，1，-13，-31，-11，-11，-11，-11，-1-1，13，-31，-11，-11，-1-1，11，-11，-13，-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田忌齐威王2024/12/11覃燕红——重庆理工大学93、博弈结构和分类依据I博弈中的博弈方单人博弈：就是个体最优化问题两人博弈双方利益很可能不一致掌握信息多的博弈方并不一定保证利益也较多追求最大自身利益的行为，常常不能导致实现整体的最大利益，也常常不能真正实现个人自身的最大利益多人博弈可能存在破坏者：其策略选择对自身利益并没有太大影响，但却会对其他博弈方的利益产生很大的甚至是决定性的影响如三个城市竞选？？：A城市33票、B城市29票、C城市18票，如果有11票转向B，结果难确定，破坏者弱者的生存之道——联吴抗曹、坐山观虎斗2024/12/11覃燕红——重庆理工大学103、博弈结构和博弈依据II博弈的过程静态博弈所有博弈方同时或可看作同时选择策略的博弈田忌赛马，猜硬币，古诺模型，投标活动，隔离审讯动态博弈各博弈方的选择和行动有先后次序且后选择、后行动的博弈方在自己选择行动之前可以看到其他博弈方选择的行动如弈棋、市场进入、领导——追随型市场结构等重复博弈同一个博弈反复进行所构成的博弈，提供了实现更有效率博弈结果的新可能长期客户、长期合同、信誉问题有限次重复博弈、无限次重复博弈2024/12/11覃燕红——重庆理工大学113、博弈结构和博弈依据III博弈中的策略/战略(strategies)策略博弈中各博弈方的选择内容在静态博弈中，策略就是行动(actions)在动态博弈中，策略是局中人各阶段所选择行动的时序集合不同博弈方之间不仅可选策略不同，而且可选策略数量也可不同有限博弈——离散情形每个博弈方的策略数都是有限的无限博弈——连续情形至少有某些博弈方的策略有无限多个2024/12/11覃燕红——重庆理工大学123、博弈结构和博弈依据IV博弈中的得益/收益/支付(payoffs)得益各博弈方从博弈中所获得的利益是各博弈方追求的根本目标及行为和判断的主要依据零和博弈也称为“严格竞争博弈”，博弈方之间利益始终是对立的，偏好通常不同如猜硬币、田忌赛马、石头-剪刀-布等。常和博弈博弈方之间利益的总和为常数，博弈方之间的利益是对立的且是竞争关系，如分配固定数额的奖金、利润、遗产官司等。变和博弈零和博弈和常和博弈以外的所有博弈，合作利益存在，博弈效率问题的重要性，如囚徒困境、产量博弈、制式问题等。2024/12/11覃燕红——重庆理工大学133、博弈结构和博弈依据V博弈中的信息结构完全(complete)/对称(symmetric)信息博弈各博弈方都完全了解所有博弈方在各种情况下的得益不完全信息博弈至少部分博弈方不完全了解其他博弈方的得益，也称为“不对称信息博弈”完美(perfect)信息博弈每个轮到行为的博弈方对博弈的进程完全了解不完美信息博弈至少某些博弈方在轮到行动时不完全了解此前的进程2024/12/11覃燕红——重庆理工大学144、博弈总体分类博弈的综合分类非合作博弈完全理性博弈完全信息静态博弈*完全信息动态博弈*完全且完美信息动态博弈

重复博弈完全且不完美信息动态博弈不完全信息静态博弈*不完全信息动态博弈*不完全理性博弈演化博弈合作博弈2024/12/11覃燕红——重庆理工大学154、博弈分类区分I：非合作和合作博弈博弈的分类非合作博弈强调个人理性博弈方不能达成有约束力协议的博弈该门课程主要涉及的内容属于非合作博弈如零和博弈、性别战、斗鸡博弈、囚徒困境博弈等合作博弈强调群体理性通过人与人之间的讨价还价，可以制定一个具有约束力的协议进而达成合作的实现。参与人之间能够达成有约束的协议。可传递效用在合作博弈中起着至关重要的作用，该效用就像货币一样如沃尔玛和家乐福的达成可信协议，最低价承诺，具体见后。如西方国家的小费制度形成、性别战的默契和习惯形成合作博弈2024/12/11覃燕红——重庆理工大学164、博弈分类区分I：非合作和合作博弈1、性别战非合作博弈：个人理性出发有2个纯战略纳什均衡合作博弈：实际生活中，也许会形成一种默契：也许这一次看足球、下一次就看芭蕾，如此循环，形成一种默契，就是合作博弈的情形2，10，00，01，2妻子韩剧足球韩剧足球丈夫4、博弈分类区分I：非合作和合作博弈2、家乐福和沃尔玛之间的价格战2024/12/11覃燕红——重庆理工大学184、博弈分类区分I：非合作和合作博弈2、家乐福和沃尔玛之间的价格战2，29，11，96，6家乐福降价不降价降价不降价沃尔玛非合作博弈：均衡结果（降价，降价），分别得到（2,2）显然，（不降价，不降价）是一个帕累托效率结果，但却不是纳什均衡合作博弈：如果双方达成可信协议，相约绝不降价；同时，家乐福和沃尔玛都对顾客承诺，如果所售商品不是最低价（刺激购买），愿意承担100倍赔偿。这个协议肯定可信？想一想为什么？因此，这个协议是能够自动执行的合作博弈，从而达到结果（6,6），都改善了4。最低价承诺到底对谁有利？2024/12/11覃燕红——重庆理工大学194、博弈分类区分I：非合作和合作博弈3、西方的小费制度4，1-4，510，-52，-1消费者给小费不给优质服务一般服务服务员非合作博弈：均衡结果（不给，一般服务），分别得到（2,-1）显然，（给小费，优质服务）是一个帕累托效率结果，但却不是纳什均衡合作博弈：欧美存在一种潜在的社会规范，即消费者应该通过给小费的方式来表达对服务员服务的劳动尊重和感谢。尽管这不是一个正式的协议，但作为社会规范对于消费者同样具有很强的约束力，因此，构成一种可信的协议2024/12/11覃燕红——重庆理工大学204、博弈分类区分II：完全理性和不完全理性完全理性：人们在决策时遵循最大化原则选择最优方案，谋求最大效益作为决策的主体，始终坚持理性化活动，不存在任何非理性成分。不完全理性：有限理性有限理性决策的前提是现实生活过于复杂，人们只能遵循满意原则受到情感、偏好（如公平、互惠、利他）的影响中国人：不患寡，患不均；滴水之恩，涌泉相报；以牙还牙等2024/12/11覃燕红——重庆理工大学214、博弈分类区分III：课程涉及的4种博弈类型静态动态完全信息完全信息静态博弈纳什均衡完全信息动态博弈子博弈精炼纳什均衡不完全信息不完全信息静态博弈贝叶斯纳什均衡不完全信息动态博弈精炼贝叶斯纳什均衡4种基本的博弈类型完全信息：每个参与人都拥有所有其他参与人的特征、策略及支付函数等方面准确信息的博弈。不完全信息：非对称信息，是指至少存在一个参与人的偏好、支付函数、策略等方面的知识是不完全的。静态博弈：策略等于行动。动态博弈：区分策略和行动，策略是一个完备的相机行动方案，要求参与人在任何可能的决策场景都要给出行动方案。2024/12/11覃燕红——重庆理工大学224、博弈分类区分III：课程涉及的4种博弈类型完全信息静态博弈所有参与者同时决策，且所有参与者对其他局中人在不同条件下的策略空间和收益函数完全了解的博弈问题完全信息动态博弈每个参与者都有关于各方收益的全部知识（完全信息），但参与者的行动顺序有先后（完全且完美、完全但不完美）不完全信息静态博弈不仅至少有一个参与者不知道其他参与者的收益函数，而且所有参与者进行决策时并不知道其他参与者的策略（或者行动）不完全信息动态博弈结合不完全信息和动态博弈的概念。市场交易中普遍存在的讨价还价就是不完全信息动态博弈的典型例子。了解：根据后行动者是否能够完全了解自己行动之前的博弈过程，可以将完全信息动态博弈分为：A完全且完美信息动态博弈：所有参与者都具有自己行动之前的博弈过程的信息B完全但不完美信息动态博弈：只要有一个或一些参与人不知道行动之前的博弈过程2024/12/11覃燕红——重庆理工大学235、特殊的博弈重复博弈Repeatedgames一种与静态博弈和动态博弈都有密切关系的博弈重复进行某个博弈构成的博弈过程构成重复博弈的一次性博弈（one-shotgames），也称为“原博弈”或者“阶段博弈”不能把重复博弈割裂为一次一次的独立博弈进行分析，必须作为整体进行研究重复博弈是特殊的动态博弈，原博弈大多为静态博弈如果参与人足够耐心，且当前行为对未来有显著的影响，那么对未来的期许可能会导致当前博弈选择“不那么理性”的行动。如体育竞技中的多局制、商业中的回头客、企业之间的长期合作或者竞争等课后习题

人人文库> 全部分类> 毕业设计 > 开题报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论-博弈分类

文档简介

温馨提示

最新文档

评论

博弈论-博弈分类

文档简介

温馨提示

最新文档

评论

相关文档