对寝室违章电器问题的博弈分析

上传人：s*** IP属地：上海上传时间：2022-03-02 格式：DOCX 页数：10 大小：167.09KB 积分：20 举报 版权申诉

已阅读5页，还剩5页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、对寝室违章电器问题的博弈分析本文得到了张树民老师和李毅老师的指导，吴开超老师的建议也令笔者深受启发，在此一并表示感谢。当然，文责自负。沈鹏(西南财经大学2002级经济学基地班)内容提要在现实经济生活中，监督者往往试图通过对违规的被监督者施加高额的惩罚，以达到政策目标。但现实证明这常常是无效的。本文以“寝室违章电器问题”为切入点，运用博弈论的方法对此校园现象进行了分析，解释了为何“高惩罚政策”在一定情况下是无效的，并提出解决方案。揭示了：影响众多监督博弈问题的本质因素，并非是监督者对被监督者所实施惩罚的程度，而是博弈中参与人的信息结构。通过对此问题的分析，以小见大地为存在于现实生活中的若干

2、类似问题提供解决思路。关键词高惩罚政策完全信息静态博弈混合战略纳什均衡序贯博弈逆向归纳解一提出问题：为何“高惩罚政策”无效学生在寝室违规用电能获得一时的便利，但会在一定的概率下引起火灾。假如火灾真的发生，后果不堪设想。据调查，近年来国内高校频频发生的火灾，大多数都是由于学生在寝室违规使用电器所致。请看以下资料：2003年2月11日，中央民族大学8号楼学生宿舍发生火灾，经调查为宿舍内私拉电线所致。2003年2月19日武汉大学测绘校区4号楼学生宿舍起火，三十多间寝室均遭火劫，房顶几乎全部坍塌。起火原因是使用电热毯不当。2003年12月2日，北京交通大学18号宿舍楼626室突然发生火灾，室

3、内物品全部被烧毁。起火原因是该宿舍一位女研究生使用“热得快”烧水所致。2003年12月23日，东北大学第四学生宿舍楼219室突然失火，千余名女生被困楼内。起火原因是219室一位女生使用“热得快”烧水所致。2004年3月6日，西安财经学院一栋4层女生宿舍楼发生火灾，大火从二楼一间宿舍燃起，后来蔓延至三楼。经调查大火原因依然是学生违规用电。火灾已造成了极大的损失，国内各高校都制定了相应的规定，防范于未“燃”。基于成本方面的考虑，学校不能每天都进行全面检查。但为了杜绝违章电器，许多高校出台了相关的校规和处罚条例与不定期的检查配合执行，对被发现使用违章电器的学生给予严厉的处分。例如，西南财经大学学生宿

4、舍管理规定第二十七条，“对私接乱接电线，使用电炉、热水器等违章电器者，给予警告处分对因违章用电、用火等引起火灾，造成损失者，视其情节轻重，给予严重警告处分直至勒令退学处分，并赔偿经济损失。”这种“杀一儆百”的做法再好理解不过了：学校试图通过“高惩罚政策”，达到约束学生行为的目的。从一开始的批评教育到现在的严厉处分，学校已经给出了其所能给予学生的最大行政处罚。但令人费解的是，学生们使用违章电器的热情并未减退。不久前，对西南财经大学学生校园诚信情况的匿名问卷调查显示：有六成以上的学生都承认曾经使用或正在使用违章电器。我不禁想问：明知学校会不定期地检查，明知处分会对自己造成极大的负面影响，学生为何还

5、要为了那点“小方便”以身犯险？为何学校施行的“高惩罚政策”无效率？二解释问题违章电器博弈下面，我将现实情况模型化，通过一个完全信息静态博弈模型违章电器博弈，描述现实情况并解释监督者在一定条件下实施的“高惩罚政策”无效的原因。1模型设定（1）博弈的参与人：学校和全体学生。为使分析简便，假设学生的类型相同，且参与人之间没有私人信息，可以将全体学生看作一个参与人。（2）参与人的战略：对学生而言使用，不使用；对学校而言检查，不检查（3）参与人的支付：学校的目标是以最小的成本杜绝学生使用违章电器的现象，学生也只有当他们认为自己不会被学校查处时才会使用。假设学校成功防止或查处违章电器的收益为，

6、相反，如果不能防止，那么学校会有的损失。学校对全体学生寝室进行一次性全面检查的成本为，且只要检查就能成功防止学生使用，；学生使用违章电器的收益为，不使用的收益为，若一旦被查处，学生会受到的惩罚，均为大于零的正数。学校和学生面临的问题可以用下图所示的双变量矩阵表来描述。违章电器博弈使用不使用检查不检查 , , , , （4）支付矩阵中的数值均为效用值。每个参与人的偏好关系满足冯·诺依曼和摩根斯坦的假设。2模型求解因为，所以，这是只存在一个混合战略纳什均衡的非协调博弈。对学生而言，学校的混合战略代表了学生对学校将选择的战略的不确定性，据此计算学生对学校混合战略的最优反应。假定学

7、生推断学校以的概率选择检查，以的概率选择不检查（），即学校的混合战略为（，）。学生选择“使用”的期望收益为 ; 学生选择“不使用”的期望收益为。令（，）表示学生的混合战略，即学生将以的概率选择使用违章电器，以的概率选择不使用。那么学生的期望收益为：在混合战略纳什均衡下，给定学校的战略，学生在选择任何战略之间是无差异的。所以，的值是不随的变化而变化的。故，同样地，可以求出学校的期望收益为：其中，结论：违章电器博弈的混合战略纳什均衡是学校以的概率选择检查；学生将以的概率选择使用违章电器。将解出的均衡值代入（1）式和（2）式。可求出学校的期望收益为；学生的期望收益为。3对均衡解的

8、分析在违章电器博弈中，学生使用违章电器的概率为，仅与有关。大家都知道发生火灾意味着什么，所以可以将视为外生给定的。那么，要迫使学生减小使用违章电器的概率，学校只能降低检查的成本。但在现实中，所能下降的幅度，无疑是十分有限的。也就是说，学生总会以一个不太低的概率使用违章电器。这是一个符合现实情况但让人沮丧的结论。从均衡解中，我们还可以发现一个重要的事实：每一参与人的混合概率仅取决于另一参与人的支付参数。对任何混合战略纳什均衡，这个结论都具有一般性美艾里克·拉斯缪森：博弈与信息，8082页，北京：北京大学出版社，2003。在文中作者对此问题做了一般性的推导。这也回答了本文一开始便提

9、出的问题：为何学校的“高惩罚政策”是无效的。虽然，学校为了约束学生的行为而提高惩罚的程度，符合人们的直觉，学校的决策者也凭着这种直觉制定了高惩罚的政策，但在模型的混合战略纳什均衡中，学校最大限度地提高惩罚程度，只能减小学校自身进行检查的概率，不能减小学生使用违章电器的概率，也不能增进学校的期望收益。上述模型是一个完全信息静态博弈，要从现实中理解以上的结论，需要通过以下的动态过程：（1）假定一个混合战略纳什均衡已经存在。（2）学校不改变检查概率，加大惩罚力度。（3）学生观察到更高额的惩罚后，减小使用的概率。（4）学校观察到学生的行动之后由于成本的考虑，减小检查的概率（5）参与人重复（2）（3）（

10、4）的过程，最后形成新的均衡。学校与学生的博弈始终在只存在一个混合战略纳什均衡的模型中运行，并且学校的政策所能决定的变量不能进入学校自身的支付（学校不会以处分学生为荣耀）。所以，学校对使用违章电器的学生进行处分，看似极具威慑力，却无法仅凭此就达到清除违章电器的政策目标。在更为现实的情况中，上面的信息完全的假设往往很难得到满足。参与人对自己的效用评价存在一定的私人信息，即参与人明确知道自己的支付参数，但对另一参与人的支付参数只能做一个大致的估计。可以在模型中引入随机变量表示这种私人信息。假设有一个连续可微的密度函数和一个绝对连续的分布函数，并且是独立的。虽然假设的扰动是微小的，但模型已变成一个复

11、杂的不完全信息静态博弈。可即便如此，海萨尼（1973）的结论表明，前文的违章电器博弈依然是有效的。因为，不确定化博弈纯战略均衡的均衡战略的概率分布，在当时，收敛于确定性博弈均衡战略的概率分布（即混合战略纳什均衡）参阅：加马丁J.奥斯本美阿里尔·鲁宾斯坦：博弈论教程，39页，北京：中国社会科学出版社，2000.4. 张维迎博弈论与信息经济学，273页，上海：上海人民出版社，1996。通过海萨尼的结论，我们不难发现对混合战略纳什均衡的一个更合理的解释：从长期来看，学校检查的概率为，学生使用违章电器的人数比例为。在真实世界中，监督者往往试图通过对违规的被监督者施加高额的处罚，以达到政策

12、目标。但正如违章电器问题一样，这样的解决问题的思路常常是无效的。这样的例子实在太多了，博弈的结论具有很强的现实意义，它不仅解释了为何学生甘冒受处分的危险使用违章电器，也解释了为何运动员们要冒着被禁赛的风险服用禁药，为何无数贪官们哪怕被杀头也要贪污。三解决问题违章电器博弈下面，我将学校的策略稍加改变，设计出新的模型违章电器博弈，并通过模型说明：只要学校政策设计得当，完全可以解决校园违章电器问题。而使结论出现本质变化的并非是惩罚程度的大小，而是信息结构的改变。1模型设定（1）博弈的参与人：学校和学生。依然假设学生的类型相同，且没有私人信息。（2）博弈顺序：学校首先选择一个比例对寝室进行抽样检查

13、，学生观察到学校的行动后选择使用或不使用违章电器。（3）参与人的支付：与违章电器博弈中大致相同。但由于学校的策略改变，对检查成本作以下假设：。代表学校检查之前的组织工作成本（如召集检查人员，分派检查任务等），不随检查的寝室数量而变化。表示学校检查的边际成本。当时，便回到模型中对成本的假设。（4）所有的支付值均代表参与人的效用。每个参与人的偏好关系满足冯·诺依曼和摩根斯坦的假设。2模型求解违章电器博弈是学校首先选择一个值，然后学生再行动的序贯博弈。用逆向归纳法求解：假设学校选择，学生的期望收益为：当时，是的增函数，学生会选择“使用”的纯战略，即。则学校的期望收益为：是的增函

14、数，但由于，所以，学校会在)范围内选择一个尽可能大的值，，其中。当时，是的减函数，学生会选择“不使用”的纯战略，即。则学校的期望收益为：是的减函数，但由于，所以，学校会在( 范围内选择一个尽可能小的值。，其中。当时，学生们会任意地选择的值，因为此时学生的期望收益恒等于，博弈回到违章电器博弈。由得：结论：违章电器博弈的逆向归纳解为：学校选择，从右侧趋近于，期望收益为；学生选择不使用违章电器的纯战略，期望收益为。3两点操作性说明第一. 学校可以通过计算机完成随机抽样工作，并每天详细公布当天的检查结果。重要的是保证随机性和透明性，因为学生会通过观察学校的行动随时更新自己的信息，

15、调整策略。如果信息传递模棱两可，学生有可能因为追求自身利益最大化的冲动，怀疑学校是否会严格地执行政策，选择偏离纳什均衡的战略从而导致效率的损失。第二. 所求得的逆向归纳解有一个小小的缺陷：在实际操作中，我难以找到一个能使学校期望收益最大化的值。学校的选择集是开的，但要保证最大值存在却要求一个集合是有界且闭的。在现代博弈理论中开集问题一般都由以下的“黑箱操作”解决：可以由某种外生过程所决定。比如，直接将它外生给定为。这虽然看起来是如此的鲁莽和武断，并且，在理论上它也严格劣于任意一个从右侧更加趋近于的值。但在真实世界中，由于不同学生对使用违章电器的效用评价会有微小的差异，依然会有一部分学生使用

16、违章电器。而以一个更大的值检查至少可以使那些对违章电器有“特殊偏好”的学生也选择不使用违章电器的纯战略。所以，以这样的方法决定值在现实操作中是合理的。开集问题仅仅有理论上的意义，在实际操作中并不重要。在真实世界中，影响结果的因素并不仅限于模型中抽象出来的那几个字母和关系。博弈是模型而不是现实，其用意在于去掉真实情况中不重要的细节将其简化到本质内容上。而开集问题在这里即使和那些被去掉的细枝末节相比，也是极为次要的。4对均衡解的分析从逆向归纳解中可以发现，在模型中，学校提高惩罚程度有利于增进自己的期望收益，是有效率的。也许，在一个更为苛刻的政策制定者看来，即使同学们都选择不使用的纯战略，学校也必须

17、继续进行看似徒劳无益的检查，这还有令人不满意的地方。但我们也应该注意到：违章电器博弈的结果与违章电器博弈相比，在不减少学生期望收益的情况下，增进了学校的期望收益，并且达到了学校的政策目标，这已是一个较令人满意的帕累托改进。比较两个模型，不难发现学校的政策是何其相似：在模型中，学校选择对寝室进行不定期的随机检查，从长期来看，检查的概率为；在模型中，学校选择每天对学生寝室抽样检查，抽样的概率仅略大于。但是微小的政策变动却使参与人的信息结构发生改变，使模型的本质发生变化，进而造成了结果的剧变。学校不能改变学生的偏好，也不能使政策所决定的变量进入自身的支付，但学校却能运用制度改变博弈进行的“环境”。在

18、介绍博弈理论的教科书中，这种外在“环境”（或者说博弈规则）是外生给定的，但在现实经济生活中，有的参与人往往可以决定这种“环境”，模型中的学校就是这类参与人的代表。这个解决问题的思路是如此关键，但却经常被广大建模者所忽略。学校在模型中不仅加重惩罚，并且通过其政策的主导力量让学生明确知道对学校而言是否稽查并非无差别，进而达到政策目标，这个例子就是对上述理论的一个完美应用。四对一些流行观点的批评违章电器博弈只是众多存在于现实生活的监督者与被监督者博弈问题中的一个典型例子。和其它众多监督博弈问题相比，这个问题微不足道，但也正因为其参与者类型简单，便于分析，恰能为其它更为复杂的问题提供很好的解决思路。这

19、让我想到了其它的监督问题，比如长期困扰政府的税收问题。现在有大量的文献将注意力集中在类似于我前面所提出的在非合作博弈理论框架下建立的模型。形成了两个似乎得到大家公认的流行观点。这类文献多年前就有了由于此类文献实在太多，不便一一引用。仅在中国期刊全文数据库中搜索近五年来在核心刊物上发表的此类文献，就有五十多篇。，并且现在还在“继续生产”，但税收问题却依然存在。第一个观点，也是最流行的观点：尽可能加大惩罚力度，提高罚款数额。其实这个现象就好象前文的“高惩罚悖论”一样。他们之所以能通过模型得出这个结论，在于模型设定时，将罚款金额不仅处理成为企业的负效用，同时成为税务局的正效用，并且正负效用的绝对值

20、居然还是相等的。其实更为一般的情况是不少建模者不加处理地直接用货币金额表示参与人的效用，这样一来，罚款数额“理所当然”地进入了税务机关的支付，进而得出“应该加大惩罚力度”的结论就很自然了张维迎教授的这个模型（博弈论与信息经济学，109111页，上海：上海人民出版社，1996）被诸多文献引用。笔者认为若此模型出现在以讲授混合战略博弈模型本身为目的的教科书中尚可令人接受，但在探讨更为复杂的税收问题时，以此模型为基础，实在欠妥。但这却在建模上犯了严重的认识错误。现实中的货币支付变化只能进入结果集合，我们需要一个函数，它将结果与行动组合（为行动集合）联系起来，以及一个上的偏好关系组合（），并将参与人

21、的偏好关系组合定义为：当且仅当加马丁J.奥斯本美阿里尔·鲁宾斯坦：博弈论教程，11页，北京：中国社会科学出版社，2000.4.。如果直接使货币支付进入博弈支付，必须满足两个假设：（1）参与人风险中立（2）参与人服从相同的偏好。如果当张三和李四博弈时，作这样的假设还能勉强让人接受，那么当博弈双方是张三和国家政法机关时，依然假设双方对一百元钱的效用评价相同显然太荒谬了。我在两个模型中将支付参数均假设为效用值就避免了这个误会。税收博弈和前文中的违章电器博弈对“高惩罚为何无效”这个问题的解答是相似的：由于罚款本质上不能看作监察机关的正效用，所以监督者所选择的决策变量在博弈中并没有影响到

22、被监督者的决策。另外一个很流行的观点是：企业与税务局在企业的实际纳税能力上存在不对称信息，税务机关应该设置有效的征管办法，尽可能地获得充分信息。持此观点的文章一般都会在模型分析之后兴致勃勃地提出一系列解决信息不对称问题的配套措施。这种观点本身是没有错的，但我认为这并非是税收博弈的本质问题。将税收博弈的参与双方看成是企业和代表国家利益的税务机关，本身就很牵强。国家是一个虚拟的参与人，但博弈中决定税务局行动的是具体的征收人员，尽管税务人员职业道德规范上说这两者的偏好应该相同，可在具体操作中我们常常发现，征收人员的行为很难代表国家利益，征收人员与企业相勾结的情况常常发生。那么所提出的一系列“全方位，

23、立体化”的配套措施，能有效实施的可能性又有多大呢？反倒是操作越是具体越是复杂，最后“变味儿”的可能性也越大。现行税收体系中的不同环节的众多参与人都能影响政策的施行，这使得国家对具体工作人员的监管成本甚巨，监管效果奇差。那么，税收人员没有足够的积极性认真执行国家的政策法规便不足为奇了。（这点与校园违章电器博弈有很大不同。在违章电器博弈中，参与人很少，负责检查的是校学工部的老师，学校对老师的监督成本小，且学校，老师，学生三者之间的利益关系极为单纯，所以，负责检查的老师完全可以代表学校的利益。）由于税收博弈中的利益关系复杂，使得问题本身早已超出了那些已有文献中在非合作博弈理论框架下建立的模型。我认为税收问题本质上是一个联盟博弈问题，解决问题的思路应是：首先，政策制定者必须接受征税人员并不能代表国家利益这个事实，并将其看作为一个独立的利益主体；然后，国家应该利用合理的政策尽量使征收人员与国家形成联盟，或者最大

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

对寝室违章电器问题的博弈分析

文档简介

温馨提示

最新文档

评论

对寝室违章电器问题的博弈分析

文档简介

温馨提示

最新文档

评论

相关文档