博弈论中的相关概念_第1页
博弈论中的相关概念_第2页
博弈论中的相关概念_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、新古典经济学前提:理性选择 减少不确定; 经济系统效用最大化。理性 新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场) ,在此基础上以获取利益 最大化为目的。隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。弊端: 限制了理论的使用围,现实中竞争 并不完全; 无法解决货币经济以外的决策难题。 博弈论的优势: 不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。游戏规则:

2、两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。通常假设参与者将采取最优反应战略而理性行事, 最大化利润、 力争在游戏中获胜、 达到主 观收益最大化,或者惩罚最小化,皆属于理性行为。最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战 略。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济

3、学,我们把一个参与者的最优反应( best response )定义为,在其他参与者 已经选定战略, 或者可以预计到他们将选择何种战略时, 能够给该参与者带来的最大收益的 战略。标准式 数字矩阵;扩展式 树形图不确定事件( contingency ):相机战略( contingent strategy ):仅在不确定事件发生时才会采取的战略信息集( information set ):节点 2 包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: 展示了每一阶段掌握的信息; 展示了参与者掌握信息的不完全所有博弈问题均可用标准式描述, 即绘制一个表格, 边缘列出参与者的战略, 里面列出

4、参与 者的收益;有些博弈的部分战略是相机战略, 只有当对方已经采取了特定的行动时, 这些战略才会生效。 相机战略和应急计划非常重要,尤其是当参与者能够通过其掌握的信息而获取优势时; 如果一个参与者不知道对手已经做出或将要做出的决策, 我们就把他所有可能的选择标在同 一节点上, 在树形图中, 该节点会包括多条分支, 由于它说明了决策者掌握的信息,我们将 其称为一个信息集。 确切地说, 信息集反映的是决策者不知道的信息, 因为他不知道对手将 如何决策; 博弈的两种描述方法 扩展式和标准式可以相互替代。占优战略占优战略均衡合作解非合作解社会两难 博弈论的精髓:行为互动。在经济学中,稳定、可预测的互动

5、行为模式被称为均衡。 博弈论要做的就是探寻博弈回合的均衡模式。占优战略( dominant strategy ):无论对方采取何种战略,其都是最优反应的战略。 占优战略均衡: 当每一位参与者都选择了各自的占优战略时, 相应的博弈结果就是占优战略 均衡。劣战略( dominated strategy ):如果无论对手选择哪种战略,一个战略的收益总高于另一个 战略,第二个战略就被称为劣战略社会两难( social dilemma ):是一种存在占优战略均衡的博弈,并且参与者采用这种均衡战 略的收益比采用非均衡战略的收益要差。合作解:因合作而提高收益。非合作解: 在没有可能达成有约束力的协议, 以协

6、调不同参与者的战略时, 参与者们所选的 战略及其收益就是一个博弈的非合作解。例如占优战略。占优战略的存在以及它与合作解相悖的事实是导致社会两难的根本原因。 占优战略均衡也是合作解。这种合作的占优战略均衡并不是社会两难问题。 占优战略均衡与合作解之间不冲突。但这是最好的结果吗? 博弈分析的目标之一就是找到参与者之间稳定的、 可预测的互动行为模式。 按照经济学家的 说法,我们称之为均衡。因为我们假设参与者都是理性的, 所以, 只有一个参与者选择的是针对对手战略的最优反应 战略,其选择才是稳定的。如果存在一个针对对手所有战略来说都是最有反应的战略,我们就称之为占优战略; 如果博弈中的每个参与者都有占

7、优优势, 并且也实施其占优优势, 我们就可以获得一个占优 战略均衡;占优战略均衡是一个非合作均衡, 每位参与者都独立行动, 而不是一起协商战略选择, 如果 博弈中的参与者都能够保证自己履行协商后的战略,那么他们选择的战略就被称为合作均 衡。合作均衡和占优战略均衡有可能一样,也可能不一样; 社会两难问题是一类重要的占优战略均衡博弈, 代表就是囚徒困境。 社会两难问题都有一个 共性:存在一个与合作均衡冲突的占优战略均衡;并非所有的博弈都存在占优战略均衡。纳什均衡;协调博弈;林点。纳什均衡( Nash equilibrium ):是全部参与者所选战略的一个组合,在这个战略组合中,每 个人的战略都是针

8、对其他人战略的最优反应。任何一方都不可能单方面变换战略而改善自己的境况。 由于纳什均衡战略的选择者也是没有协商的,因此也是非合作均衡。收益占优均衡( payoff dominant equilibrium ):均衡获得最大收益。 风险占优均衡( risk dominant equilibrium ):均衡规避最大损失。 协调博弈( coordination game ):只有协调彼此的战略选择,两个参与者才能得到最优的收、益。两点启示: 在特定情况下,惯例和传统能够提供多纳什均衡博弈的解; 协调博弈中的纳什均衡可以解释为什么习俗和惯例看似很随意, 实际却很稳定, 因为它 们都是纳什均衡,能够自

9、我强化。没有林点。 二者收益并不均衡,一方必须接受收益低的现实。 如果双方都认为对方会选择追求其他女士,则又回到(0, 0)的初始状态在一个没有占优战略均衡的博弈中, 如果每一个参与者都采用了针对其他参与者所选战略的 最优反应战略, 那么参与者的战略选择仍然是确定、 可预测且理性的, 我们把这种情况称之 为纳什均衡。占优均衡战略是一种纳什均衡,但有些纳什均衡不是占优均衡。 纳什均衡是一种非合作均衡,与博弈的合作均衡可能相同,也可能不同。 纳什均衡是求解博弈问题的一个普遍适用的方法。但也有缺点: 有些博弈的纳什均衡不是唯一解; 如果有线索是决策者认为某个均衡更可能发生, 则这 个均衡被称为林点;

10、 并不是所有博弈都存在纳什均衡。零和博弈( zero-sum game ):参与者收益之和为零的博弈;非常数和博弈( nonconstant-sum game ): 常数和博弈:最大最小收益( minimax payoff ):最优战略是其最小收益中数值最大的收益所对应的战略。 最大最小解并非适合于所有双人零和博弈 零和博弈尽管在博弈论发展史上具有重要的意义,但是过于简化,并不能完全适合于现实。 因此又不要引入非常数和博弈 在非常数和博弈中,最大最小解与纳什均衡可能不完全一致。两种博弈在博弈论发展中具有重要影响: 零和博弈:依赖最大最小法则或最小最大法则确定纳什均衡; 存在两个纳什均衡的 2疋

11、非常数和博弈。联盟: 拆台者;公共物品联盟( coalition ):在博弈论中,把协调相互战略的参与者称为联盟。 当所有参与者联合起来时政治学上称为大联盟( grand coalition )。 单人联盟( single coalition ):博弈论中将一个参与者单独行动视为自己与自己的联盟,可以 称为单人联盟。联盟结构( coalition structure ):三人以上的非合作博弈形成联盟也有可能, 但是缺少制约机制情况下, 实现纳什均衡的联盟 才能存在。2. 政治博弈中的 “拆台者 ”3. 有时第三方充当 “拆台者 ”的角色。4. 拆台者( spoiler ):是指自己不可能获胜却

12、可以阻止其他人获胜的参与者5. 股票投资建议6. 当博弈中存在三个或更多的参与者时,对任一参与者来说,与大多数人合作总是比较好的 选择。7. 两人作伴,三人拥挤 ”的博弈8. 前面的博弈有三种类型:9. 一是有人始终被排除在联盟之外;10. 二是有人扮演拆台者的角色;11. 三是第三人必须与大多数人保持一致。12. 现在有第四种情况,即 “两人作伴,三人拥挤 ”的现象。13. 公共物品 (public good ):带有某种特性的某种商品或服务, 政府提供类似服务要优于个 人。14. 公共物品具有两个特征:15. 每个人都可以从中受益,特别是没有付费的人可以与付费的人同等享用该物品;16. 成

13、本由提供服务的水平决定,而不取决于接受服务的消费者数量。同等水平下,消 费者数量的增加不会导致成本的升高, 而且没有人能够通过减少公共物品对他人的服务以增 加对自己的服务。17. 例如非商业用途的广播、免费的乡间公路、国防等。18. 三人博弈中,两人可以形成联盟以抵抗第三人;但非合作博弈中,联盟并非总是可行, 只有符合纳什均衡的联盟才可能稳定。19. 三人博弈中还有 “拆台者 ”现象。20. 三人博弈中,参与者会遵循服从大多数的原则。概率;期望值;风险厌恶概率( probablity ):衡量可能性的一种数字度量,取值围为0, 1。期望值( expected value ):所有可能收益的加权

14、平均之和,权重为各种可能的对应概率。 例 1 :赌博中投出 6 得到 10 美元,投出其他数字什么也没有。期望值=10 X1/6 + 0拓/6=5/3 自然的不确定性( natural uncertainty ): 是博弈的一方重要力量。“自然”同“机遇 ”都是相当特殊的博弈参与者,与理性行为不同的是,自然界从不关心结果, 而是随机地采取具有特定概率的战略。创新产品未来面临的市场是 “好”还是 “不好 ”是未知的;未来条件的 “好”与“不好 ”由自然随机决定,发生的概率各占50%;在某种意义上讲, 数学期望是不确定收益的公平价值。 由于期望值带有风险, 而人们常常希 望规避风险,所以仅仅知道期

15、望值是不够的。风险厌恶 (risk averse ):如果某人选择具有相同期望值的无风险收益,而不是带有风险的收益时,我们就说他是风险厌恶的;风险偏好( risk loving ):如果某人选择带有风险的收益,而不是具有相同期望值的无风险 收益,我们就说他是风险偏好的;风险中立( risk neutral ):如果某人不考虑风险,只考虑期望值的大小,我们称之为风险 中立 期望效用效用( utility )将风险厌恶与其他类型的主观动机联系起来。首先假定在博弈中,获胜方的 主观收益可以用数字测量,即效用。效用不一定等同于货币收益 期望效用:消费者在不确定条件下的可能得到的各种结果的效用的加权平均

16、数。 pU(W1)+(1-p)U(W2) 期望值的效用:不同结果下的消费者所拥有的货币财富量的加权平均数的效用。UpW1+(1-p)W2当无风险收益 (虚线曲线) 相比具有相同期望值的有风险收益 (实线直线) 具有更大的效用。 这是一种风险厌恶型纯战略;混合战略;随机选择战略;混合战略均衡。 纯战略和混合战略基本界定 纯战略( pure strategy ):单一的、确定的战略选择。混合战略( mixed strategy ):战略决策者选择纯战略的方式不可预测,这种不可预测性意味 着战略选择中包含随机因素, 每一种战略都有一定的概率被选中, 因为是多种纯战略的混合, 因此叫做混合战略。混合战略均衡 ( mixed strategy equilibrium ):由于以上例题中的决策者所选择的混合战略都 是基于对手选择的最优反应, 因此也属于纳什均衡, 这种类型的纳什均衡被称为混合战略均 衡。这是社会两难问题。 对于社会两难问题,占优战略均同时占优

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论