博弈论初步高级管理学讲义课件

上传人：漫*** IP属地：贵州上传时间：2022-12-19 格式：PPTX 页数：40 大小：183.66KB 积分：25 举报 版权申诉

已阅读5页，还剩35页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

《高级管理学》

第八讲博弈论初步12/19/20221SchoolofEconomics&Management,TongjiUniversity《高级管理学》

第八讲博弈论初步12/17/20221Sc1囚徒困境和纳什均衡

囚徒困境（prisoners’dilemma）博弈论的著名的例子，纳什均衡是博弈论的重要概念。囚徒困境说的是，两个嫌疑犯作案后被捕，起诉机构没有足够的证据证明他们抢劫了银行。所以，若犯人们不坦白，起诉者只能就非法持有武器罪起诉，判犯人有期徒刑2年。起诉者于是向犯人采取攻心战，说可以“坦白从宽、抗拒从严”。如果一人坦白，则坦白者从宽处理，判徒刑1年，抗拒者从严处理，判徒刑12年。如果两人都坦白，每人依法判徒刑10年。两个囚徒是坦白还是不坦白呢？12/19/20222SchoolofEconomics&Management,TongjiUniversity1囚徒困境和纳什均衡囚徒困境（prisoners’dil1.1囚徒困境12/19/20223SchoolofEconomics&Management,TongjiUniversity1.1囚徒困境12/17/20223SchoolofEc1.2博弈均衡博弈论假设博弈的参加者都是理性的，即在对手战略给定的条件下，每个参加者都会选择适当的战略来实现自己报酬的最大化（或损失最小化）。问题是博弈的一方不能控制另一方的决策。当参加者甲以最优战略对付乙的某个战略时，乙会发现原先的战略不是对付甲的实际战略的最佳战略，因而会改变其战略。要是乙改变了战略，参加者甲也要进行相应的改变。这样的改变行为会否停止？这里借用经济学常用的均衡概念，我们把博弈的稳定结果称为均衡，博弈的均衡也称为博弈的解。均衡是指所有的参加者都不想改变战略的状态。

12/19/20224SchoolofEconomics&Management,TongjiUniversity1.2博弈均衡博弈论假设博弈的参加者都是理性的，即在对手战1.3占优均衡在一些特殊的博弈中，一个参加者的最优战略可能并不依赖于其他参加者的战略选择，也就是说，不论其他参加者选择什么战略，他的最优战略是唯一的，这样的最优战略被称为“占优战略”（dominantstrategy）。在上述的囚徒困境博弈中，每个囚徒可选择的战略有两种：坦白与不坦白。显然，不论另外一个囚犯选择什么战略，每个囚犯的最优战略都是“坦白”。例如，如果乙选择坦白，囚犯甲选择坦白时的报酬为-10，选择不坦白的报酬为-12，因而坦白比不坦白好；如果乙选择不坦白，甲坦白的报酬为-1，不坦白的报酬为-2，所以坦白还是比不坦白好。也就是说，“坦白”是囚犯甲的占优战略。由于对称性，“坦白”也是囚犯乙的占优战略。于是，（坦白，坦白）或（-10，-10）是囚徒困境博弈的占优均衡。

12/19/20225SchoolofEconomics&Management,TongjiUniversity1.3占优均衡在一些特殊的博弈中，一个参加者的最优战略可能个人理性与集体理性甲乙两人都寻求最好的结果，而得到的却是较糟的结果。这个例子说明，在多人决策的环境里，个人理性与集体理性经常是矛盾的，这种集体利益和个人利益的之间的冲突被称为“囚徒困境”。

12/19/20226SchoolofEconomics&Management,TongjiUniversity个人理性与集体理性甲乙两人都寻求最好的结果，而得到的却是较糟1.4纳什均衡纳什均衡是这样一种稳定状态，博弈的任何一方参加者都不会改变其战略，如果其他参加者都不改变战略的话。

依定义，任何占优战略均衡必定是纳什均衡，但纳什均衡却不一定是占优战略均衡，占优战略均衡是比较强的均衡概念。囚徒困境中的（坦白，坦白）就是纳什均衡。经济生活中的众多集体利益和个人利益的之间的冲突带来的非帕累托有效状态都是纳什均衡。12/19/20227SchoolofEconomics&Management,TongjiUniversity1.4纳什均衡纳什均衡是这样一种稳定状态，博弈的任何一方参纳什均衡(严格的定义)12/19/20228SchoolofEconomics&Management,TongjiUniversity纳什均衡(严格的定义)12/17/20228Schoolo完全信息静态博弈的几个著名博弈智猪博弈(boxedpigs)猪圈里有两头猪，一头大猪，一头小猪，猪圈的一头有个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有10单位的猪食进槽，但谁按按钮谁就要付2个单位的成本。若大猪先到，大猪吃到9个单位，小猪只能吃1个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。12/19/20229SchoolofEconomics&Management,TongjiUniversity完全信息静态博弈的几个著名博弈智猪博弈(boxedpigs标准型支付矩阵12/19/202210SchoolofEconomics&Management,TongjiUniversity标准型支付矩阵12/17/202210SchoolofE性别战（battleofthesexes）12/19/202211SchoolofEconomics&Management,TongjiUniversity性别战（battleofthesexes）12/17/市场进入阻挠博弈12/19/202212SchoolofEconomics&Management,TongjiUniversity市场进入阻挠博弈12/17/202212Schoolof2动态博弈静态博弈，即博弈各方同时行动，但是经济生活中许多情形是动态博弈，也就是指博弈参加者的行动有先后顺序，又叫序贯博弈。

12/19/202213SchoolofEconomics&Management,TongjiUniversity2动态博弈静态博弈，即博弈各方同时行动，但是经济生活中许多情2.1完全信息动态博弈的分类博弈总的可以分为完全信息的博弈（即博弈参加者的收益函数是共同知识的博弈）和不完全信息博弈（博弈中的一些参加者不知道其它参加者的收益函数）。完全信息动态博弈又分为完全且完美信息（completeandperfectinformation）的动态博弈和完全但不完美信息博弈两类。前者是指在博弈进行的每一步当中，要选择行动的参加者都知道这一步之前博弈进行的整个过程；后者是指在博弈的某些阶段，要选择行动的参加者并不知道在这一步之前博弈进行的整个过程

12/19/202214SchoolofEconomics&Management,TongjiUniversity2.1完全信息动态博弈的分类博弈总的可以分为完全信息的博弈（2.2子博弈完美纳什均衡（SPNE）一个子博弈是全部博弈的一部分，当全部博弈进行到任何一个阶段，到此为止的进行过程已经称为博弈参加各方的共同知识，而其后尚未开始进行的部分就是一个子博弈。如果博弈参加者的战略在每一子博弈中都构成纳什均衡，我们称此纳什均衡是子博弈完美纳什均衡（subgameperfectNashequilibrium）（Selten,1965）。所有动态博弈的中心问题是可信任性，所以不可置信的威胁被研究较多，子博弈完美纳什均衡（SPNE）是不含不可置信的威胁的。子博弈完美纳什均衡可以用逆向归纳法（backwards-induction）找出

12/19/202215SchoolofEconomics&Management,TongjiUniversity2.2子博弈完美纳什均衡（SPNE）一个子博弈是全部博弈的一几种著名的动态博弈Stackelbeg模型Hotelling模型（地点模型）12/19/202216SchoolofEconomics&Management,TongjiUniversity几种著名的动态博弈Stackelbeg模型12/17/2023重复博弈:特殊的动态博弈同一博弈重复多次，称为重复博弈（repeatedgame），，其中的每一次博弈称为“阶段博弈”（stagegame），事实上它是动态博弈的一种特殊情况。它的均衡状况可能与一次性博弈不同，被研究最多的重复博弈还是囚徒困境博弈。

12/19/202217SchoolofEconomics&Management,TongjiUniversity3重复博弈:特殊的动态博弈同一博弈重复多次，称为重复博弈（r例子:古诺产量博弈12/19/202218SchoolofEconomics&Management,TongjiUniversity例子:古诺产量博弈12/17/202218Schoolof作为囚徒困境的一个例子，其占优战略均衡的结局双方都增加产量，它们的报酬各为900。如果它们能合作，共同压缩产量，则可以实现各自1000的报酬。它们都想合作，但是又怕被欺骗，于是就此陷入“囚徒困境”。关键是在一次性博弈中，被欺骗之后就无法报复了，当然也无法建立公司的声誉。重复博弈下的情形就会发生变化。因为博弈的其它参加者过去行动的历史是可以观测得到的，一个参加者可以使自己在某个阶段博弈的战略选择依赖于其它参加者过去的行动历史。这样企业就可以报复和建立合作的声誉，合作发生的原因在于公司的长远利益。12/19/202219SchoolofEconomics&Management,TongjiUniversity作为囚徒困境的一个例子，其占优战略均衡的结局双方都增加产量，在重复博弈里，参加者每个阶段都得到一定的报酬，长期博弈就要把所有的各期报酬加总起来进行比较。这里引进一个指标：时间折扣率δ，数值等于明年的一元前相当于今年的金额，δ也称为贴现因子。例如，明年的利润为，折算到现在就是δ。熟悉财务的同学都知道这是货币的时间价值，但是δ不是贴现率r，而是1-r，这里不多解释。还有一点不一样，贴现率r更多的是由社会决定的，而时间折扣率δ更多的是博弈参加者的主观判断。假定企业甲和企业乙从头到尾均合作，那么两家企业的总报酬为如果一开始就不合作，那么每个公司的总报酬为12/19/202220SchoolofEconomics&Management,TongjiUniversity在重复博弈里，参加者每个阶段都得到一定的报酬，长期博弈就要把《高级管理学》

第八讲博弈论初步12/19/202221SchoolofEconomics&Management,TongjiUniversity《高级管理学》

第八讲博弈论初步12/17/20221Sc1囚徒困境和纳什均衡

囚徒困境（prisoners’dilemma）博弈论的著名的例子，纳什均衡是博弈论的重要概念。囚徒困境说的是，两个嫌疑犯作案后被捕，起诉机构没有足够的证据证明他们抢劫了银行。所以，若犯人们不坦白，起诉者只能就非法持有武器罪起诉，判犯人有期徒刑2年。起诉者于是向犯人采取攻心战，说可以“坦白从宽、抗拒从严”。如果一人坦白，则坦白者从宽处理，判徒刑1年，抗拒者从严处理，判徒刑12年。如果两人都坦白，每人依法判徒刑10年。两个囚徒是坦白还是不坦白呢？12/19/202222SchoolofEconomics&Management,TongjiUniversity1囚徒困境和纳什均衡囚徒困境（prisoners’dil1.1囚徒困境12/19/202223SchoolofEconomics&Management,TongjiUniversity1.1囚徒困境12/17/20223SchoolofEc1.2博弈均衡博弈论假设博弈的参加者都是理性的，即在对手战略给定的条件下，每个参加者都会选择适当的战略来实现自己报酬的最大化（或损失最小化）。问题是博弈的一方不能控制另一方的决策。当参加者甲以最优战略对付乙的某个战略时，乙会发现原先的战略不是对付甲的实际战略的最佳战略，因而会改变其战略。要是乙改变了战略，参加者甲也要进行相应的改变。这样的改变行为会否停止？这里借用经济学常用的均衡概念，我们把博弈的稳定结果称为均衡，博弈的均衡也称为博弈的解。均衡是指所有的参加者都不想改变战略的状态。

12/19/202224SchoolofEconomics&Management,TongjiUniversity1.2博弈均衡博弈论假设博弈的参加者都是理性的，即在对手战1.3占优均衡在一些特殊的博弈中，一个参加者的最优战略可能并不依赖于其他参加者的战略选择，也就是说，不论其他参加者选择什么战略，他的最优战略是唯一的，这样的最优战略被称为“占优战略”（dominantstrategy）。在上述的囚徒困境博弈中，每个囚徒可选择的战略有两种：坦白与不坦白。显然，不论另外一个囚犯选择什么战略，每个囚犯的最优战略都是“坦白”。例如，如果乙选择坦白，囚犯甲选择坦白时的报酬为-10，选择不坦白的报酬为-12，因而坦白比不坦白好；如果乙选择不坦白，甲坦白的报酬为-1，不坦白的报酬为-2，所以坦白还是比不坦白好。也就是说，“坦白”是囚犯甲的占优战略。由于对称性，“坦白”也是囚犯乙的占优战略。于是，（坦白，坦白）或（-10，-10）是囚徒困境博弈的占优均衡。

12/19/202225SchoolofEconomics&Management,TongjiUniversity1.3占优均衡在一些特殊的博弈中，一个参加者的最优战略可能个人理性与集体理性甲乙两人都寻求最好的结果，而得到的却是较糟的结果。这个例子说明，在多人决策的环境里，个人理性与集体理性经常是矛盾的，这种集体利益和个人利益的之间的冲突被称为“囚徒困境”。

12/19/202226SchoolofEconomics&Management,TongjiUniversity个人理性与集体理性甲乙两人都寻求最好的结果，而得到的却是较糟1.4纳什均衡纳什均衡是这样一种稳定状态，博弈的任何一方参加者都不会改变其战略，如果其他参加者都不改变战略的话。

依定义，任何占优战略均衡必定是纳什均衡，但纳什均衡却不一定是占优战略均衡，占优战略均衡是比较强的均衡概念。囚徒困境中的（坦白，坦白）就是纳什均衡。经济生活中的众多集体利益和个人利益的之间的冲突带来的非帕累托有效状态都是纳什均衡。12/19/202227SchoolofEconomics&Management,TongjiUniversity1.4纳什均衡纳什均衡是这样一种稳定状态，博弈的任何一方参纳什均衡(严格的定义)12/19/202228SchoolofEconomics&Management,TongjiUniversity纳什均衡(严格的定义)12/17/20228Schoolo完全信息静态博弈的几个著名博弈智猪博弈(boxedpigs)猪圈里有两头猪，一头大猪，一头小猪，猪圈的一头有个猪食槽，另一头安装一个按钮，控制着猪食的供应。按一下按钮会有10单位的猪食进槽，但谁按按钮谁就要付2个单位的成本。若大猪先到，大猪吃到9个单位，小猪只能吃1个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃6个单位，小猪吃4个单位。12/19/202229SchoolofEconomics&Management,TongjiUniversity完全信息静态博弈的几个著名博弈智猪博弈(boxedpigs标准型支付矩阵12/19/202230SchoolofEconomics&Management,TongjiUniversity标准型支付矩阵12/17/202210SchoolofE性别战（battleofthesexes）12/19/202231SchoolofEconomics&Management,TongjiUniversity性别战（battleofthesexes）12/17/市场进入阻挠博弈12/19/202232SchoolofEconomics&Management,TongjiUniversity市场进入阻挠博弈12/17/202212Schoolof2动态博弈静态博弈，即博弈各方同时行动，但是经济生活中许多情形是动态博弈，也就是指博弈参加者的行动有先后顺序，又叫序贯博弈。

12/19/202233SchoolofEconomics&Management,TongjiUniversity2动态博弈静态博弈，即博弈各方同时行动，但是经济生活中许多情2.1完全信息动态博弈的分类博弈总的可以分为完全信息的博弈（即博弈参加者的收益函数是共同知识的博弈）和不完全信息博弈（博弈中的一些参加者不知道其它参加者的收益函数）。完全信息动态博弈又分为完全且完美信息（completeandperfectinformation）的动态博弈和完全但不完美信息博弈两类。前者是指在博弈进行的每一步当中，要选择行动的参加者都知道这一步之前博弈进行的整个过程；后者是指在博弈的某些阶段，要选择行动的参加者并不知道在这一步之前博弈进行的整个过程

12/19/202234SchoolofEconomics&Management,TongjiUniversity2.1完全信息动态博弈的分类博弈总的可以分为完全信息的博弈（2.2子博弈完美纳什均衡（SPNE）一个子博弈是全部博弈的一部分，当全部博弈进行到任何一个阶段，到此为止的进行过程已经称为博弈参加各方的共同知识，而其后尚未开始进行的部分就是一个子博弈。如果博弈参加者的战略在每一子博弈中都构成纳什均衡，我们称此纳什均衡是子博弈完美纳什均衡（subgameperfectNashequilibrium）（Selten,1965）。所有动态博弈的中心问题是可信任性，所以不可置信的威胁被研究较多，子博弈完美纳什均衡（SPNE）是不含不可置信的威胁的。子博弈完美纳什均衡可以用逆向归纳法（backwards-induction）找出

12/19/202235SchoolofEconomics&Management,TongjiUniversity2.2子博弈完美纳什均衡（SPNE）一个子博弈是全部博弈的一几种著名的动态博弈Stackelbeg模型Hotelling模型（地点模型）12/19/202236SchoolofEconomics&Management,TongjiUniversity几种著名的动态博弈Stackelbeg模型12/17/2023重复博弈:特殊的动态博弈同一博弈重复多次，称为重复博弈（repeatedgame），，其中的每一次博弈称为“阶段博弈”（stagegame），事实上它是动态博弈的一种特殊情况。它的均衡状况可能与一次性博弈不同，

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

博弈论初步高级管理学讲义课件

文档简介

温馨提示

最新文档

评论

博弈论初步高级管理学讲义课件

文档简介

温馨提示

最新文档

评论

相关文档