洪开荣《经济博弈论》习题答案_第1页
洪开荣《经济博弈论》习题答案_第2页
洪开荣《经济博弈论》习题答案_第3页
洪开荣《经济博弈论》习题答案_第4页
洪开荣《经济博弈论》习题答案_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 经济博弈论思考题 第1章 纳什均衡1、每位学者的贡献都是建立在前者理论基础之上的,排名考虑的因素是理论的原创性。纳什提出了纳什均衡概念,建立了一种互动分析模式;泽尔腾以纳什均衡为基础建立了策略性思维的动态分析模式;海萨尼提出海萨尼转换及其均衡体系。2、博弈论学科对数学工具的利用使得博弈论乃至经济学成为一门真正的科学。博弈均衡数学表达式的简明与繁复意味着背景事实的简明与繁复。3、要素包括参与人,行动,支付和信息。明确了三要素也就完成了建模。模型的表述需要将各要素参数化和数据化。 参与人1参与人2尽力不尽力闹(5,-5)(0,0)不闹(0,0)(-5,5) 4、博弈论模型中的元素就是对经济分析中

2、因素的抽象,分析方法就是关注各个参与人之间的互动及相互之间的影响。比如,甲、乙两公司分数两个国家,在开发某种新产品时有下面矩阵表示的博弈关系(单位:百万美元)。乙公司开发不开发甲公司开发10,10100,0不开发0,1000,0 在这个收益矩阵中,将原本复杂的经济问题抽象化,用明确的数据表示出双方的博弈的收益,这些不同策略组合下的收益则是双方互动选择的结果。5、博弈论和经济学都是基于“理性人”的假设,人们都是追求自身利益的最大化。以性别战博弈为例,女生选择芭蕾时,尽管男生更偏好足球,但此时他为使收益最大化,会选择芭蕾,即男生的最适反应是芭蕾。同样,男生选择足球时,尽管女生更偏好芭蕾,但此时她为

3、使收益最大化,会选择足球,即女生的最适反应是足球。6、(1)博弈双方是在比较每个策略下自己的受益而做出选择,得益值的绝对值也就失去了意义。 (2)若对受益矩阵修改如下:囚徒2坦白不坦白囚徒1坦白-5,-5-1,-7不坦白-7,-10,0此时,(坦白,坦白)和(不坦白,不坦白)是两个纳什均衡,但如果双方稍作协商,必然会选择(不坦白,不坦白),因为这样双方的收益都能最大化。7、博弈至少是在两方之间进行的,博弈的过程中双方都是理性的,在理性的指引下做出策略选择,故博弈论应包含理性、互动和决策。其中理性是前提,互动是过程,决策时结果。博弈过程中,各方都追求其自身的利益最大化,也就是给定对方的策略,自己

4、的策略总是最优的。博弈双方的两个最优反应以最适合的方式结合起来,也就是互为最适反应,这就会说博弈论的决策方法。8、以囚徒困境为例,若双方同时选择抵赖,收益为(-1,-1),此时,双方收益和最大,但这种非纳什均衡的情况是不稳定的。纳什均衡下,双方的策略为(坦白,坦白),收益为(-8,-8),此时收益明显比双方同时抵赖要低。纳什均衡是完全自利的双方理性作用的结果,但结果却并非最优。在现实生活中,在各方同时逐利的前提下,往往会造成结果的次优,如劣币驱逐良币,这也就是说在各方同时理性(追求自身利益的最大化)的情况下,有时会引导出非理性。9、交互理性指个体的利益与他人的行为有关,或者相互取决于其他人的行

5、为时追求自身利益的意识或能力。不论是策略互动还是信念互动,都是博弈主体在保证自身利益的前提下,各方的一种交互。特定主体内心的交互理性是个人追求自身利益最大化;而关联主体之间的交互理性是个体之间利益关联之下,各方在其他人的策略下选定自己的策略。双方的差别在于参与方数量的不同、主体考虑的角度不同。10、不是的。存在多重纳什均衡时,博弈方的决策只会是纳什均衡下的各项策略,不会是随意的。 11、模型是对已有信息的加工和抽象,当通过该模型运算出的结论与之前的假设不相符合,这存在两种可能,一是假设存在错误,另一种是模型本身存在缺陷。因此,这就要求我们在构建模型时要将严格把握控制变量,减少其对因变量的影响。

6、12、博弈论是以完全自利人为假设的,也就是说,经济学中的理性人为完全自利人。这一假设是经济学的基础,实际是有悖于实际生活的,因此就需要更加深入的研究来探讨有限理性下的决策模型和非完全自利人的决策问题。纳什均衡的精炼将最基本的纳什均衡进行扩展,使其适用范围更广。纳什均衡的三种精炼为“策略支持式”精炼、“信念扩展式”精炼和“自利坚守式”精炼。它们的区别在于一个对纳什均衡扩展的方向不同,前者由静态扩展至动态,由完全信息扩展至不完全信息;中间方将个体完全理性扩展至有限理性;后者放松了主体的完全自利假设。博弈论就是在个体之间寻求最适策略组合,而纳什均衡是在理性人的假设之下,各方的最适反应,这也就是博弈论

7、的内核之所在。纳什均衡就是个博弈主体在信念的支持下做出的最优策略的组合,因此博弈均衡就是策略互动均衡与信念互动均衡。不可或缺的关键词是纳什均衡,因为纳什均衡是博弈论的关键性支柱,各类博弈最终的结果都是寻找纳什均衡。本书从第3章到第10章,遵循由一般到具体,由原理到应用实例,由简单到复杂的原则进行编排,内容充实有序。第2章 博弈逻辑 1、从最简化意义上,博弈均衡就是纳什均衡。博弈均衡就是互为最适反应,纳什均衡尽管外在表现为特定形式的策略组合,但在完全信息下而隐藏信念互动,而在不完全信息以及非对称信息下,信念互动甚至对博弈均衡的结果产生关键性影响。策略互动逻辑是指纳什均衡直接表现为一种策略组合,信

8、念互动逻辑是指支撑策略组合的信念互动才是决策的关键动因。自利互动逻辑是指支撑主体策略选择的自利特征决定了决策的关键特征。 2、颤抖手均衡是纳什均衡思想的扩展。从理性基础的扩展角度,颤抖手均衡把自利主体可能的犯错行为(决策颤抖)考虑进纳什均衡中,是围绕策略互动,信念互动和自利假设的纳什均衡概念,扩展纳什均衡的思想,强化均衡思维的博弈均衡的概念。 3、以采金矿博弈为例: 资本家资本家借不借企业家还( 1 , 0 )不还( 0 , 4 )( 2 , 2 )由于信念的非对称性,企业家无法让其对手相信其还钱承诺,则均衡为(1,0),社会财富无法增长,而当美德形成,企业家具有遵守承诺的美德,并且资本家也认

9、可这种美德,于是资本家将会借钱给企业家,形成(2,2)的均衡,社会财富增长。群体性策略互动逻辑是由特殊利益群体的策略选择来决定,个体之间存在特殊的利益关联和相同的策略选择。 4、海萨尼转换盒贝叶斯均衡是建立在信念互动的基础上,信念互动在完全信息的情况下隐藏在策略互动之中。而在不完全信息和非对称信息中更是影响策略均衡结果的关键因素,由此我们发现信念是一种隐藏在心中,但却一直影响人行为的偏好,从某种意义上是精神信仰,乃至宗教。如在囚徒困境中,由于博弈方2有义气的信念存在,原本(坦白,坦白)的博弈均衡成为了(抵赖,抵赖)的均衡,两者发生了颠覆性的改变,这就是革命的力量。 5、真正的理性是私利,私利是

10、理性的唯一标准,江湖道义也是一种追求私利的表现。在法官私恩和江湖道义中,对于博弈方2来说,坦白会产生-6的心理惩罚,这-6是理性的私利,出于不愿让自己心理难受的私利,于是博弈方2选择抵赖,由此产生了“美德”。而在完全且完美信息的囚徒困境中,只会出现双方都认为对方会坦白,于是“美德”无法产生,私利也无法实现。 6、在真假话博弈中,假定其中一个博弈方相信对方讲真话,而这种相信也被策略对手充分认知,如此的信念互动将引导出帕累托效率的纳什均衡,讲假话的策略选择被排除了,有帕累托效率的纳什均衡精炼实现了。而在社会稳定诉求的博弈中,会产生(0,0)、(2,2)两种均衡,政府应当引导博弈双方都能在特定阶段共

11、同寻找到策略2选择的信念判断,从而达到更好的均衡(2,2)。 7、狭义自利:性别战博弈; 广义自利:拆迁问题; 完全信息:美苏争霸; 不完全信息:连锁店博弈; 个体:美苏争霸;群体:资本家和企业家博弈; 8、在群体性策略互动逻辑下,特殊的利益群体中,个体之间存在特殊的利益关联和相同的策略选择,在个体作用微乎其微的特殊博弈环境中,相同利益需求的个体构成特殊利益群体,于是产生了社会群体疯狂事件。在道德沦丧的社会中,在利益群体的博弈中,由于背叛的存在,(不相信,背叛)将成最终的博弈均衡结果。于是社会财富无法得到增长,整个社会向下沉沦。 9、在慈善式财富创造的博弈均衡假设中,由于对于商家来说,生产优质

12、产品会使得心理得到极大的满足,由此我们构造:厂家消费者少买多买劣质产品10,-110,-2优质产品5 ,220 ,1从而产生(优质产品,少买)的均衡。10、瓦尔拉斯均衡指整个经济体系处于均衡状态时,所有消费品和生产要素的价格将有一个确定的均衡值,它们的产出和供给,将有一个确定的均衡量。在“完全竞争”的均衡条件下,出售一切生产要素的总收入和出售一切消费品的总收入必将相等。博弈逻辑是研究理性的行动者或参与者在互动过程中如何选择策略或如何做出行动的逻辑。从经济观念来看,博弈逻辑是基于经济个体的行为逻辑,要保证经济问题分析的正确性,就必须要保证任何现实行动的主体一定要具有符合博弈逻辑的个体理念,自利观

13、念和理性观念。所以博弈论是现在经济学一个特别重要的组成部分。11、博弈方1博弈方2高尚卑鄙高尚5,5-2,2卑鄙2 ,-20,0 第1、2节,是对人类生存世界的黑暗体验并由此产生质疑。在诗中所描绘的世界里,卑鄙者以卑鄙的手段可以在世上畅行,高尚者的高尚品行却使其自身走向墓地。“镀金的天空”喻示着以辉煌的表象掩盖了一个时代真正的黑暗,到处是歌功颂德,到处是粉饰太平,人性被扭曲成“弯曲的倒影”四处凋落。博弈方1博弈方2相信不相信相信2,23,1不相信1 ,30,0 从第3节开始,“我”作为抒情主体,出现在一片死寂、冰凉、规则混乱和缺乏公正的世界,以一种理性的声音,开始对世俗世界审判、否定和挑战,对

14、一切习以为常的规则表示质疑:“我不相信!” 12、从经济观念来看,个体观念是站在自我本体立场上各自依据各自主观价值的独立判断,自利观念是与个体观念相依托,是不必证明的先验判断,而理性观念是主体行为的观念标准。从经济行为来看,逐利源于人类天性,在追求利益最大化的同时,也会寻求损失最小化。同时特定主体也具有不可更改的信念判断。所以政府在制定决策时,也一定要考虑到上文所述的观念的行为,只有均衡,理性,微观的政策才能长久有效的实行。例如将贫民区搬到富人区,希望发达带动落后,但是由于人对于逐利的理性观念,使得这种理想化的政策无法实行。 第3章 完全信息博弈1、完全信息博弈分析纯粹自利支配个人行动的博弈均

15、衡,将经济问题高度抽象为具有完全理性和完全信息的博弈问题,是经济问题分析的极度深化。囚徒困境博弈:生产优质和劣质产品的生产者与多买和少买商品的消费者博弈,双方都基于完全自利和完全信息的支配下,生产者不相信消费者愿意多花钱买更多的优质产品,从而生产劣质产品;消费者不相信生产者会多生产优质产品,从而花更低的价格少买商品。最终博弈的结果就是厂商生产更多的劣质产品,消费者用较低的价格买较少的商品,个人和社会效用并没有达到最优。斗鸡博弈:三星手机厂商与苹果手机厂商在某技术研发方面的竞争也属于斗鸡博弈。双方同时投入研发,增加双方研发投入和产品竞争成本,若只有其中一人研发,研发者获取更大收益,若都不研发,则

16、减少相应成本。性别战博弈与猜硬币博弈当中,在现实经济博弈过程中,若博弈双方对其策略选择并不是百分之百的倾向,而是存在不同的概率,但双方都知道自己和对方的倾向,这时可以用混合策略博弈均衡求解。2、混合策略纳什均衡是博弈方以概率判断的方式进行策略选择,这种随机选择的概率判断正是博弈主体信息或信念判断不完全性的特殊表现而已,表现为博弈主体对可选策略的不确定性。从不完全信息博弈的角度看,混合策略纳什均衡是完美贝叶斯均衡的一种特例。以猜硬币博弈为例,博弈主体双方猜正面和反面各自存在两种概率,由于在互为最适反应的情况下无法得到纯策略纳什均衡,所以根据支付均等化方法,使博弈主体的两种策略选择效用支付值相等,

17、从而得出混合策略均衡解。3、 表3 打假对策博弈厂家消费者少买(p)多买(1-p)劣质产品(q)5,-7-3,0优质产品(1-q)0,40,0(1)如上表3打假对策博弈所示,在互为最适反应的完全信息博弈条件下,不存在打假对策的纯策略纳什均衡。因此,只能通过求混合策略纳什均衡的方式来球均衡解。厂家和消费者各自策略选择的概率如上表中小括号所示,给定p,厂家选择“劣质铲平”的支付值为:5p-3(1-p);选择“优质产品”的支付值为:0。根据混合策略支付均等方法,令5p-3(1-p)=0,得出p=3/8。给定q,消费者选择“少买”的支付值为:-7q+4(1-q);选择“多买”的支付值为:0。根据支付均

18、等方法,令-7q+4(1-q)=0,得出q=4/11。因此,打假对策博弈的混合策略均衡解为(3/8,4/11),即消费者以3/8的概率选择少买,厂商4/11的概率选择劣质产品。当社会上厂家认为消费者愿意花更多的钱买更多的买优质产品,更少的买劣质产品,以及消费者更愿意相信厂家生产的更多是优质产品时,或者国家出台相应假冒伪劣产品严厉的惩罚措施,提高产品信息透明度,让消费者清楚了解优质产品的价值和劣质产品的坏处,打假对策将对得到纯策略纳什均衡(优质产品,多买)。这里面,只需要将消费者生产优质产品的支付值分别增加到6和7,消费者多买的支付值都增加到7就能够实现。若在完全信息博弈条件下,改变支付值得到一

19、个纯策略均衡(劣质产品,少买);但即使若在动态博弈环境下,无论谁具有先行优势,在狭义自利互动下,仍然无法改变(劣质产品,少买)的囚徒困境均衡4、 表4 智猪博弈(小国占优)小猪大猪踩不踩踩1.5,3.5-0.5,6不踩5,0.50,0智猪博弈中,在完全信息博弈的互为最适反应条件下,小猪必然会选择“不踩”策略,而大猪不能忍受任何利益的损失,只能选择“踩策略”。其现实意涵就在于,在小国与大国的利益博弈过程中,小国需要抓住大国不愿利益受到任何损失的弱点,积极构建利于自身最有优势策略选择地位的条件,使大国只能服从自己的最优策略选择。就比如,中国所主导的APEC组织,中国在该组织中起主导地位,拥有绝对的

20、话语权,而美国若不加入这个组织将会失去很多利益,但若要加入这个组织,则必须服从中国的话语权。 表5 智猪博弈(弱国无外交)小猪大猪踩不踩踩1.5,3.51,6不踩-1,0.50,3如上表5所示“弱国无外交”的智猪博弈中,由于大猪在能力、资源等各方面的条件都优于小猪,所以无论大猪选择“踩”还是“不踩”策略,小猪都只能向大猪妥协选择“踩策略”,才能最大化自己的利益;而当小猪选择“踩”的策略时,大猪选择“不踩”的策略能实现最大化利益。其现实意涵为,大国有其强力优势,小国在大国面前只能选择屈服于大国才能保全自己微弱的利益,否则损失更大,而且在小国选择与大国诚心合作的情况下,大国可以随意选择不合作以获取

21、更大利益,此谓“弱国无外交”。5、 表6 转型升级博弈政府政策企业生产方式选择传统生产方式转型升级生产方式传统发展政策0,63,0转型升级发展政策1,18,3上表6是在汽车厂引擎厂博弈模型基础上构建了转型升级博弈模型,博弈参与者有政府(政策),企业(生产方式选择);支付值在原汽车厂引擎厂的基础上稍有改变,纯策略纳什均衡结果也变为唯一的(转型升级发展政策,转型升级生产方式)。在未改变支付值之前,存在两个纯策略纳什均衡,(传统政策,传统方式),(转型升级政策,转型升级方式),其总社会效用相等。但政府为了实现国家产业转型升级,实现更长远、更大的社会效用,愿意出台政策,使传统发展政策的效用支付由3,变

22、为0,即政府愿意牺牲暂时的税收和就业等效用收入,促进产业转型升级;在这种情况下,企业也明知政府的政策意图,会意识到从长远上来看,政府的转型升级政策会给企业带来更大的政策红利,因而会选择转型升级方式,在这种策略和信念互动的情况下,得到唯一纯策略纳什均衡(转型升级政策,转型升级方式),国家产业转型升级会慢慢形成。此外,在计划经济向市场经济转型的过程中,政府的政策对市场仍然有很大的导向作用,政府这只有形的手可以引导市场,通过政策调控快速而有力地促进市场的产业转型升级,发挥中国政府调控力的特色优势;中国作为人口大国,其国内市场的需求和消费能力潜力巨大,因此可以引导需求和消费,增大对转型升级产品的需求和

23、消费,促进转型升级。6、采金矿博弈中,在完全信息博弈条件下,博弈双方基于完全自利理性的人,企业家会选择不还款以获得更大利益,资本家在明知企业家策略选择和不守信的信念条件下,会选择不借款,保证1个单位的利益,但社会总效用最低。当加入一个打官司博弈环节时,资本家可以通过法律保障利益,企业家有法律限制其不守信行为,资本家会愿意借款,企业家会选择还款,社会生产得以进行,社会总财富得以增加。7、福利博弈中,并不存在纯策略纳什均衡,因为政府愿意救助愿意找工作的贫民,而不愿救济那些游手好闲坐等救济的贫民;但一般情况下,贫民只有在得不到政府救助时才会找工作,而政府无法准确辨别贫民的这种非对称选择,所以只有通过

24、概率判断的形式寻找混合策略均衡。在这种博弈情况下,政府只能遵循福利保障与市场机制平衡的原则,让那些确实需要救助的贫民及时得到救助,那些坐等救助的人刺激其找工作。如果不这样,则会造成社会上大量游手好闲的人存在。如下表7所示,可以通过改变支付值的相对大小,使得到唯一纯策略纳什均衡结果为(救济,游手好闲)。其现实意涵在于,若政府欲打造成绝对平等、正义的福利主义政府,对所有贫民实行救助计划,为贫民提供丰厚的救助,政府会在全国乃至全世界得到一个美名,得到很大的效用支付。但对于贫民而言,其不用工作就能够得到巨大的政府补助,而工作的贫民选择工作却只能得到较少的工资收入,并且还付出劳动力,从而造成社会上大多数

25、人选择游手好闲,社会不再有工作的动力,最终社会财富创造停止。 表7 福利博弈(纯策略纳什均衡)政府贫民工作游手好闲救济2,23,3不救济-1,10,08、(1)典型特征:可能存在所谓的“破坏者”或“建设者”,其策略选择的变化可能对自身利益影响并不大,但对其他博弈方可能产生很大影响。(2)因为对于某个特定利益主体来说,多主体博弈的破坏者肯能对其他博弈主体造成利益损失,但对于整个社会来说可能带来社会总体效用的增加。(3)根据“三主体共谋和防共谋”博弈模型,在多主体博弈中,不同的利益判别标准导致对多主体策略选择的破坏性和建设性判别不同,但这都是基于每个博弈方追求自身利益最大化的先验理性假设下形成的,

26、谁也不会偏离这以共同认知,这是分析任何博弈问题可能性的必要前提。9、(1)在现实博弈问题中,多主体博弈使得个体的策略互动和信念互动不再突出显像,个体已无法直接影响和觉察博弈的均衡结果,而是基于由相同关联主题组成的群体之间的策略和信念互动博弈,现代经济问题的实质就是各种不同利益集团之间的博弈。(2)当完全信息博弈的高度抽象性思考对应到经济社会问题分析的极端深刻性要求,通过一种极值化与极端化的逻辑分析构架构建,各种形式经济社会博弈问题的实质内涵被充分显现出来,使自利主体博弈方的道德包袱完全卸下,让所有博弈问题有了共同的论证基础。10、首先,企业成长是社会帕累托效率提升的基础动力,而企业竞争行为是维

27、持这一动力的源泉,寡头竞争的博弈模型能对产业竞争进行数理化分析;其次,将寡头竞争模型集合起来,产业组织理论化产业经济学的模型体系也就建立了;然后,最经典的寡头竞争模型常常以连续性策略互动的完全信息博弈形式出现,充分体现虚拟性和现实性,使得现代经济社会的深层次难题有了简单的破解之法。11、完全信息古诺模型构建的最优产量博弈竞争模型;完全信息斯坦伯格模型构建的动态博弈产业组合均衡;完全信息贝特朗模型构建的价格竞争的古诺模型;完全信息霍特林模型构建的企业区位竞争博弈模型,等等。12、以日元兑美元的折现率与汇率博弈为例,若日元价格与美元价格相同,二者货币发行量相互均衡,折现率和汇率相等;若美元率先定价

28、,日元再确定自身的价格,并且日元接受美元价格作为汇率计算和调整价格,以确定日元的折现率,那么美元发行更多的货币可以是日元升值,提高日元兑美元汇率,折现率提高;发行更少的货币,可以使降低日元兑美元汇率,降低折现率,即美元有绝对的定价权。13、(1)在有限重复博弈中,原博弈的一次性博弈有均衡得益数组由于一次性博弈中最差的均衡得益,那么在该博弈的多次重复中,所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限平均得益来实现它们在无限次重复博弈中,博弈主体对于未来博弈结果无法准确预期,但只要关联主题对于未来的利益看得足够的重,折现率足够的大,博弈者就会出于自利动机选择触发策略,实现

29、合作博弈。(2)以双寡头三价博弈为例,若是有限重复博弈,博弈方第一次选择(H,H)而第二次则选择M,若第一次结果选择其他策略组合,则第二次选择L,而到了第二阶段的(L,L)策略,任何一方都不会偏离;若是无限重复博弈,只要博弈方队未来利益看得足够重,贴现率达到一定的临界值,那么博弈方从第一阶段到最后阶段都不会偏离选择(H,H),合作博弈实现。14、在完全且完美信息的极端化假设下,作为支撑博弈主体均衡策略行为基础的完全自利假设被凸显,这种伴随共同知识和共同理性的完全自利假设,使策略互动的博弈逻辑找到一个可以先验假定的论证基础。而这种先验假定也隐含了第三方“自然”的支撑和左右,因为没有这个第三方“自

30、然”的先验假定,博弈主体必然陷入思想悖论,无法逃脱现实决策的行为困境。15、(1)以囚徒困境博弈为例,在完全且完美信息特殊假定前提下,博弈双方为完全自利的理性人,始终摆脱不了囚徒困境的均衡结果;但若在不完全信息博弈的条件下,博弈双方不仅存在策略互动,更多的是一种信念互动,江湖道义信念的存在使得博弈主体能够摆脱囚徒困境。(2)完全信息博弈均衡类型包括:一是纯策略纳什均衡。博弈主体完全以其个体自利理性行为偏好做出个体经济效用最大化的互为最适反应决策;二是混合策略纳什均衡。博弈主体在给定对手策略选择以概率判断的情况下选择最大化自身利益的策略,在混合策略当中根据概率判断随机选择;三是子博弈完美纳什均衡

31、。博弈主体并不是同时决策,而是存在决策的先后顺序的动态博弈过程时,先行的博弈方具备先行优势,但其必须考虑后行动者的策略互动选择,所以采取逆推归纳法进行决策;四是触发机制下的子博弈完美纳什均衡,也就是有限重复博弈和无限重复博弈均衡。重复博弈的各个博弈方既有有限次和无限次阶段博弈的每一阶段最大化自己利益的选择,也同时追求所有阶段平均利益或整体利益的最大化。 第四章 不完全信息博弈因为在海萨尼转换的这种方式下,原本不利于双方的决策不一定是百分之百的,所以博弈决策必须以一些先验而不必证明的人性假设为基础,在此种方式下有利于博弈方实现最大效益。在囚徒困境博弈中,当其中一个囚徒在先验判断基础上后验判断出其

32、策略对手百分之百不会选择坦白(P值为0)时,他实际确信其策略对手是百分之百的侠士,维持讲义气的江湖道义是其必然选择。如此一来,囚徒困境将在特定的策略信念组合下消失,保证江湖道义的策略选择成为了两个囚犯谁也不会偏离的均衡选择。博弈方1不确定博弈方2是否有义气,能使得博弈方1可能会得到优于(坦白,坦白)决策的博弈结果。对于囚徒1选择坦白的概率判断为P,选择抵赖的概率判断为1-P,如此一来,囚徒2找到了选择坦白或者抵赖的依据。在附加主体策略的信念概率判断时,纳什均衡的精炼选择方式也确定了。引进虚拟的第三方“自然”是不完全信息博弈均衡求解的关键步骤的原因是第三方“自然”赋予博弈方决策的先验概率能把博弈

33、结果的不确定性转换成博弈过程的不完美,能使有效的博弈决策出现。另外,当博弈方对于博弈结果的不确定时,有效的博弈就无从谈起。3、海萨尼转换和序列理性决定了不完全信息博弈决策的特殊方式的原因是博弈方认为会影响其决策的任何因素都成为信念更新的条件和判断,从而能在一种序列理性的决策框架中有效整合了关联主体的决策互动与信念互动。4、在海萨尼转换中假定“自然”博弈方的行为的唯一功能是赋予实际博弈方以决策行为开始前的先验概率判断。为了解决不确定性决策问题,引进虚拟的第三方“自然”可以保证不完全信息博弈的纳什均的策略有效性的互动。在典型的囚徒困境博弈中,其现实理解是所有博弈主体都是百分之百自私自利的,然而这种

34、情况有时候是各博弈方最不愿出现的结果。其决策意涵是各博弈方都是在争取最大利益的基础上做的决策,然而会出现类似于“囚徒困境”的情况。5、经过海萨尼转换,不完全信息条件被巧妙地潜入纳什均衡的互为最适反应的分析框架中,纳什均衡不再仅仅表现为策略互动均衡,也同时表现为信念互动均衡,纳什均衡成为了策略互动均衡与信念互动均衡的整合,不然会使任何博弈主体判断和决策无从谈起。进行海萨尼转换之前进行博弈行为时是对博弈结果不清楚,而转换之后主体是对博弈过程不完美。因为,海萨尼转换使原本是不完全信息博弈转化为了完全但不完美信息的动态博弈。因为特定博弈方既要保证自己在前后阶段中信念判断的一致性,保证自己在前一阶段的信

35、念判断与之后阶段的信念判断相互契合,同时在特定博弈方对于其他博弈方策略的一致性,博弈方之间关于均衡策略的相互判断不能在不同阶段相互冲突,只有同时保证两方面序列理性要求的策略互动与信念互动组合才是真正稳定的不完全信息博弈均衡。基于海萨尼转换的主体理性基础假设是给定各博弈方的策略判断,他们的策略必须是序列理性的。特殊意涵是在每个信息集合处,如果给定信念和策略选择顺序,策略是最优的。7、主体1主体2LRO1,41,4T2,10,0B0,20,1如上图所示,可以很快看出那是均衡有:(T,L)、(O,R)。尽管都是那是均衡,但是(O,R)是不可置信的,行为R是主体2在信息集合上是一个被严格优超的策略,因

36、为海萨尼转换本身就有独特的宗教意涵与哲学逻辑,各博弈方都是自私自利的。 在性别战博弈中,若男生或女生的其中一个是百分之百雷锋,结果会是非百分之百雷锋博弈方较为倾向的选择,而百分之百雷锋会选择博弈对手所倾向的博弈选择,因为百分之百活雷锋会放弃自己的利益而使博弈对方的利益最大化,这也是一个纯策略纳什均衡。若男生和女生两个都是百分之百雷锋,结果则是(足球,足球),因为这个博弈选择使博弈双方的总收益最大。旧车市场博弈指明了维护市场秩序和提升市场效率的基本途径,明确了促进市场健康有序发展的有效政策措施,而这些政策举措主要与有关政策意涵的分离均衡相互联系。而分析双价旧车交易博弈及有退款保证的旧车市场博弈,

37、完善的市场机制必须有保证效率和公平的博弈规则,而这些博弈规则必须表现为社会共同接受的道德体系和法律体系,才有助于市场化改革战略的选择。博弈方1可能得到法官私恩,博弈方2拥有江湖道义能使双方博弈利益最大化,大多数时候囚徒困境也不复存在了。“好人”因为在这种贝叶斯规则下,大家一致公认的“好人”有可能会选择抵赖,这是有违于社会道德的。“完全且完美信息可能导致疯狂”是指类似于“囚徒困境”这种博弈情况的出现,会使博弈双方的利益受到最大的损害,而“不完全信息可能产生美好”是指不完全信息博弈在引入第三方“自然”之后可能会使博弈双方利益最小的困境得到改善。完全信息博弈下的囚徒困境会使两个囚徒都付出5支付值,为

38、最差博弈选择。而法官私恩与江湖道义博弈及其各种变化形式的均衡是不完美信息博弈,可能会使得囚徒选择(坦白,抵赖)、(抵赖,抵赖)等,这些选择都优于(坦白,坦白)策略。不完全信息“好朋友博弈”朋友1 朋友2合作背叛合作(10,10)(0,17)背叛(15,0)(-5,1) 朋友1知道朋友2是百分之百好朋友,而朋友2不知道朋友1是不是百分之百好朋友。因为朋友1是百分之百雷锋,因此肯定会选择“合作”,而行为“背叛”是朋友2在信息集合上是一个严格优超的策略,因此百分之百选择背叛,使得朋友1无收益,说明了“朋友之交淡如水”和“千金易得而知己难求”。最好法律(完美合同)的判别标准是在正确道德基础上使各博弈方

39、的利益最大化。因为最好的合同使利益最大化,所以说“最好的合同是谁也不愿不会违背的合同”。因为法律对各博弈方的行为决策会有一定的约束和制约,所以说“最好的法律是所有关联主体都实现了自我利益的法律”。社会认同感对于社会财富创造的特别意义在于博弈主体对世界的一定认识有助于博弈主体进行博弈选择,促进实现利益最大化。从现实意义来看,不完全信息吓阻博弈表明由于不完美信息博弈均衡以来于第三方“自然”赋予的先验概率判断,所以博弈主体对世界的认识,这里就是P和1-P,影响到最后的均衡,或者说先验和后验判断决定了最终均衡。 15、 政府 贫民 工作 游手好闲 救济(3,2)(-1,3) 不救济(-1,1)(0,2

40、) 如上图所示,行为“游手好闲”为贫民在信息集合上优超策略,因此贫民肯定会选择游手好闲,而政府知道这种现象之后肯定会选择救济,但是(救济,游手好闲)不能使得社会效益最大化。因此,参与人宁可拥有更差的信息。 第5章 非对称信息博弈 1、因为从建模目的来比较,非对称信息博弈均衡是私人信息或非对称新年互动支配下的策略互动均衡,而这些均衡都以特定的契约安排形式出现,这种契约安排常常与现实博弈问题的关键性特征相对应。相比对称信息博弈,声明博弈通过类型差异与偏好差异显现一种“内在非对称性”,这种非对称性的私有信息支持了非对称的信念互动,而这种非对称的信念互动又支配了博弈方的策略互动。比如社会阶层的不同。2

41、、因为任何形式的非对称信息博弈均衡一定可以寻找到特殊表现的现实问题。在更为现实的博弈环境中,博弈方的不完全信息实际上是一种非对称信息,即特定博弈方相对于其他博弈。因为非对称信息博弈的关键之处在于,非对称信息导致了博弈主体的非对称信念,而非对称信念支持了非对称的策略互动,从而产生了非对称性的策略互动均衡与信念互动均衡。因此,可以说非对称信息博弈是一种策略互动极小化和信念互动最大化特征的博弈均衡。决策意涵表现为分析非对称信息博弈问题,实际就是思考非对称信念支配下的各种博弈均衡表现,就是提炼现实博弈问题的主体非对称信念判断,分析其非对称信念支配下的策略互动均衡与信念互动均衡。3、在一般意义上,非对称

42、信息博弈主体会各自发挥委托人和代理人的功能,在激励相容和个体理性约束下进行委托代理机制设计。实际上,触发策略机制下的子博弈完美均衡就是重复博弈环境的一种机制设计。非对称信息博弈的博弈均衡不再是一种可以简单表示的策略组合,而是需要多种信念判断假定及多种策略选择的策略信念判断组合。这种策略信念判断组合就是非对称信念博弈主题各自寻求多种多重利益组合的契约安排,也可以说,非对称信息博弈的均衡特征就是实现关联主体利益最大化的最优契约设计。不完全的贝叶斯纳什均衡,可以视为特殊形式的最优契约,只不过这种最优契约是非对称条件下不完全契约设计的极端简化版本,也是一种机制设计。非对称信息博弈均衡是私人信息或非对称

43、新年互动支配下的策略互动均衡,而这些均衡都以特定的契约安排形式出现。以委托代理来说,道德风险在现实中表现为委托人只能观察到结果,不能知道代理人的行动和状态本身,或者是委托人只能观察到代理人的行动,而不能观测到自然的选择,逆向选择表现为如果委托人针对代理人的激励契约不合适,那么代理人的选择很可能和委托人所期望的方向不同,做出逆向的选择。信号传递表现为代理人在逆向选择下传达自己类型的一种手段,信号甄别与信号传递相反,表现为代理人在委托人提供契约之后选择信号。机制设计表现为比如委托人提供给代理人的部分契约或全部契约,就是针对不同客户的一种机制,机制设计的理想结果是最优契约。知识分子宿命在非对称信息博

44、弈中是一种特定的契约安排形式。秀才遇到兵,有理说不清实际上就是一种非对称信息的博弈,秀才和兵成长于不同的环境,两人拥有的信息并不是对称的。秀才应该针对小兵的偏好与逻辑传递不同的信号。好人形成阿规律在非对称信息博弈中是一种特定的契约安排形式。好人的高尚并不等同于道德的高尚,在有具体支付值的非对称信息博弈中,好人的高尚并不一定表现为道德的高尚。与对称信息博弈相比较,主要差异在于一个是非对称信息,一个是对称信息。与对称信息博弈相比较,非对称信息博弈的特殊性在于非对称信息博弈都有特定的激励相容约束和委托代理框架,委托代理框架下的博弈均衡都可以理解为特定形式的最优契约选择,而且非对称信息博弈都是委托代理

45、博弈。比如在囚徒困境中,囚徒2知道囚徒1选择坦白或抵赖后自己的结果,但是囚徒1不知道,存在非对称信息,在这种情况下,囚徒1很有可能选择抵赖,而囚徒2选择坦白。特殊要求即非对称信息博弈建模需要特定的激励相容约束和委托代理框架。不卖买 3不卖买 3 1 2 2差好卖不卖卖不买买不买 斯宾塞雇佣博弈: 劳动力市场 劳动力市场不接受能力高教育水平低教育水平高接受不接受能力低能力高能力低雇员接受中国教育体制改革战略设计的认识:对完善我国教育体制的一些建议。(1)加大投入,调整结构。对于中、高等教育,因其具有消费的排他性,可依照谁受益谁负担的利益原则,由政府、受教育者和社会共同分担,以政府为主渠道,以补助

46、和贷款的方式给予支持。最后,公共财政应加强对贫困地区和贫困家庭的直接资金补助,对城市“外来人口”的子女应和当地户籍孩子一样,就地接受义务教育和参加高考,平等竞争和录取。(2)制定、完善和严格执行教育财政法规。应修订现行有关教育法规和财政法规中有关教育财政的条款,完善我国的教育财政法规体系,使教育经费的筹集、负担、分配、使用都有法可依,责任明确。(3)建立公平公正的资源配置制度。针对教育投入,应借鉴发达国家公共财政的经验,首先重点倾向基础教育,本着公平的原则进行全社会范围内的基础教育资源均等化分配,缩小城乡之间、地区之间、校际之间的办学水平,以保证国民接受大体相同的基础教育,体现公民最基本的社会

47、公平价值理念。其次随着经济的发展,政府财力的不断增强,才逐渐增加对中等及高等教育的投入。 9、我认为大学教育不应该免费。如果大学教育免费,会给社会带来不公平,只要学生有能力考上大学,政府就会免费让他们读书,这样会让社会矛盾激化。能考上大学的学生享受到社会的优待,二没考上大学的学生就必须自己辛苦打拼吧,这样会让社会贫富差距越来越大,也会引起部分人的不满,考不上大学并不是他们的过错,国家也没必要对考上大学的学生负担学费,因为他们现在的学费付出只是为以后的高质量生活预付费而已。 10、利益的驱使会使人们偏离原有的道德约束。博弈的结果由博弈方的策略互动与信念互动决定,在该博弈中,信念使他会忽视自身道德

48、、信用,追求自身最大利益,法律的强制性迫使人们履行自己的承诺,按照契约的金额支付给代理人,因此,道德标准的实施需要法律的保障。 11、在投保人投保时,保险公司为安全者设置的意外补偿将会高于不安全者的补偿,因此,不安全者受利益的驱使,会受到为不安全者设计的风险合同的诱惑。对于老年人而言,由于他们发生意外风险的可能性是很大的,所以必须要针对他们这样的群体设计风险合同,所以,对于风险,我们不能简单地判断好坏,要从各方面去评价。 12、我将会根据老师开的车、穿着、讨论的话题来评价哪个老师最富有。主要理由:一个人是否富有,可以从他平时的行为表现看出,如果他较为富有,那么他选择车时,肯定尽量选好些的,因为

49、他不会太计较钱的因素,他有能力使自己的生活质量较好。并且,在平时穿着打扮时也会注重质量(当然这只是对于大部分而言)。遵循的博弈论原理: = 1 * GB3 * MERGEFORMAT 个人是自我主观价值判断的唯一源泉; = 2 * GB3 * MERGEFORMAT 每个人具有不同偏好或不同的偏好集合是此时自我主观价值判断的基础,于是每个个人分别具有自我独特的主观价值参考系; = 3 * GB3 * MERGEFORMAT 对任何具有正常思维能力的个人而言,其行为特征都只能是根据既有信息和其他条件,采取自以为是的博弈策略,以最大努力谋求尽可能充分的自我主观价值。 13、非对称信息博弈是相互对应

50、的市场参与者之间关于特定事件的非对称知识分布或非对称概率判断。由于每人所掌握的信息量不同,博弈方A知道的信息博弈方B不知道,那么该信息就是博弈方A的私有信息,因此非对称信息博弈均衡就是私有信息与非对称信息信念互动支配下的博弈均衡,也就是信念互动相比于策略互动具有非对称信息优势表现的纳什均衡。 14、从广义来理解,委托代理就是非对称信息博弈,二委托代理机制就是非对称信息博弈或信息经济学的代名词。在委托代理机制下,博弈主体互动转换为委托人和代理人之间的互动,二关联主题之间的委托代理关系可以泛指任何一种对称信息交易,交易中有信息优势的一方称为代理人,另一方称为委托人,或者简单地说,知情人是代理人,不

51、知情人是委托人,如此隐含假定知情人的私人信息影响不知情人的得益,不知情人不得不为知情人的行为承担风险。 在委托代理模型中,博弈主体是存在非对称信息结构差异的委托人和代理人,博弈关键在于一种激励企鹅曰设计,而得益支付多少的关键则在于委托人设计的激励器乐类型或契约要素选择,以及委托人如何根据观察到的产出高低对代理人进行奖惩。第六章 演化博弈1、如在囚徒困境中,如果前提条件是法官私恩和江湖道义,最终的博弈均衡结果会是(抵赖,抵赖),而非之前的(坦白,坦白)。2、如果在t时期博弈方的两个邻居只要有一个采取同意,那么博弈方1在t+1期采取同意,否则采取不同意。所以只要同意策略出现,都选择同意的演化博弈均

52、衡一定会实现。3、 签协议博弈的演化稳定策略均衡分析再次凸显了初始条件对于演化博弈的特别重要意义。而基于复制动态建模的基本逻辑,可以把采用不同策略的博弈方看作是不同“类型”的博弈方,于是我们发现初始条件决定最终均衡。宿命论由此得来。4、战争与和平存在一种内在的联系逻辑,战争与和平的策略选择并不一定是大多博弈方都选择战斗时才会出现。甚至只要少数博弈方将战争策略作为其最优策略战争就会出现。通过理清战争与和平策略选择的基础条件可以明确一个致力于和平发展的国家如何实现真正意义上的和平发展。5、根据签协议博弈,社会的变革都是在有一人选择变革然后选择变革是若优超策略。所以只要变革策略出现,都选择变革的演化

53、稳定策略均衡就一定会实现。所以只有对各种离经叛道行为宽松才会演化成社会的转型发展。6、在签协议博弈中,只有同意才能有收益,为何不能一次性认识到这点,而是需要经过多阶段学习演进调整?所以我们发现真理在演进的过程中也是通过从少数逐步以先验性概率判断方式出现。在签协议博弈主体的信念集合中,达到真理被多数人认可的稳定博弈中。7、具有真正稳定性的均衡一定是博弈方模仿学习和策略调整过程的策略均衡。在生活中,往往一件不经意的小事A在经过多阶段学习演进调整后人们发现其是弱优超策略,从而所有人都选择A。这便成为了命运的转折。8、真假话博弈可以作为道德形成原因与制度演进规律的一种解释,但在解释这些现实问题时,真假

54、话博弈均衡实际上可以理解为演化心理均衡,即同时考虑有限理性和行为偏好的博弈均衡。当社会中的小群体都进行真假话博弈时,说真话就不仅有道德意义,还有社会发展意义。9、演化博弈均衡分析的有限理性假设并不与博弈均衡的先验性人性假设相互冲突,有限理性不能理解为无法预测或无法把握的非理性,博弈论归根结底是一种理性决策理论,是博弈方通过信念学习机制的特殊表现与策略调整机制而逐步实现稳定的均衡的博弈方式。10、在演化稳定策略均衡的精炼路上,理性的有限与初始宿命被放大观看。不管特定博弈方具有多强的学习调整能力,那些实际上先验存在的初始条件决定了他们的最终结果与最终命运。演化博弈逻辑的自然推论就是,在人性与世界的

55、双重制约下,那些被第三方“自然”审视的博弈方都必须接受一种特定形式的路径依赖人生。第7章 期权博弈1、(1)处理技巧:按照海萨尼逻辑,博弈在实际开始前一定存在关于博弈所有要素的先验信念,而拥有这些先验信念的博弈主体通过后验判断来更新信念,并在策略互动、信念互动和自利互动的博弈逻辑下实现稳定性的博弈均衡。(2)若把期权价值视为特定的先验信念,这种处理方式实际上认可了顺推归纳法对于子博弈完美纳什均衡的支持价值,因为当期权价值以先验信念方式存在于两个博弈方的行为偏好时,将这种先验信念进行后验判断,并以此来决定自己的策略互动均衡和信念互动均衡,是更为合乎逻辑的博弈均衡分析方法。2、(1)处理技巧:假定

56、期权博弈均衡已内生存在于同时行动的静态博弈,博弈主体不同策略选择代表了不同的内生化期权价值,从而间接地反应了那些放弃了的策略选择期权价值。(2)因为期权价值内生化方法早已存在于博弈建模者的实际考量之中,但他们并没有意识到期权价值内生化方法实际上已经体现在博弈得益支付值相对大小上,内生化期权价值的期权博弈与一般形式的策略式博弈具有几乎完全相同的外在表现形式。 3、企业A企业BLWFL2,28,57,7W5,810,105,3F7,73,54,4 如果把期权定价理解为不确定性价值的随机过程分析,博弈均衡就可以理解为不确定性价值的策略信念分析4、按照海萨尼转换逻辑,博弈在实际开始前一定存在关于博弈所

57、有要素的先验信念,而拥有这些先验信念的博弈主体通过后验判断来更新信念,并在策略互动、信念互动和自立互动的逻辑下实现稳定的博弈均衡。Van Damme博弈模型就很好支持了这种说法。博弈方2一开始有R和D两种策略选择,若选择R,双方各得2,博弈结束;若选择D,则进入第二阶段博弈,在该阶段下双方各有S和W两种选择,两个纯策略纳什均衡是(W,S)和(S,W),并且也优于其直接选R的收益,因为32。现在的问题是,对于完全理性的博弈方2而言,如果放弃R,那么在第二阶段一定会选S,因为如果选择W的话,他完全可以直接选择R,因为2比1好,也就是说博弈方2放弃选择R,是为了得到3的收益。根据相同的逻辑,就可以得

58、出上述的均衡结果。总的来说,若把期权价值视为特定的先验信念,这种处理方式也实际上认可了顺推归纳法对于子博弈完美纳什均衡的支持价值。博弈方1博弈方2SWS(0,0)(3,1)W(1,3)(0,0)期权博弈实际上是在博弈均衡分析框架中同时考虑环境不确定性或主体决策柔性的期权价值,所以内生化期权价值的两种处理方法同时决定了期权博弈关联主体的两种均衡决策方式:第一种均衡决策方式可称为先验判断的期权博弈均衡决策;第二种均衡决策方式可称为尽可能推迟实际决策的期权博弈均衡决策。对于前者,当期权价值被视为博弈主体先验信念的一部分时,这种决策方式就形成了,而正因其形成对应不确定性的海萨尼处理方式,因此其决策方式

59、也具有不完全信息博弈决策意涵。对于后者,期权博弈的特殊性源于期权价值与博弈均衡结合的特殊性,期权价值的存在与否也实际体现了主体决策柔性的价值。因为如果是二阶段博弈,则额外选择权往往出现在第一阶段,其结果对最终博弈结果有着决定性的作用,而拥有额外选择权的人往往起到主导最终结果的角色,所以有特别的权利感和幸福感。但因此,他也需要考虑如何实现帕累托最优,也会面临其他博弈对象的猜测甚至威胁,这会使他产生责任感或痛苦感。从项目评价和博弈均衡的内在联系来看,期权博弈均衡分析也提供了一种项目价值分析的创新思路。在博弈均衡分析框架中,同时考虑环境不确定性或主体选择权的项目价值意义,期权博弈评价成为了兼容净现值

60、方法和实物期权方法优点的更为理想的项目评价方法。8、期权博弈均衡帮助我们可以在标准的博弈均衡表达形式中数量化分析不确定性环境导致的主体策略选择权价值。在期权博弈均衡中,Smit&Trigeorgis(2004)模型分别展示了单阶段、多阶段的策略性互动投资价值、合作研发和直接研发竞争下的项目价值。下面以波士顿矩阵战略为例,分别进行说明:(1)狗:较少的现金流入和较低的市场增长率,意味着企业应该采取清算战略或放弃战略。如下,此时只有一个纯策略均衡(退,退),即双方都选择退出这个市场。企业A企业B进退进(1,1)(0,20)退(20,0)(10,10)(2)金牛:较高的现金流入和较低的市场增长率,意

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论