【重复博弈模型在企业管理中的应用实证研究13000字（论文）】

上传人：E*** IP属地：湖北上传时间：2024-08-04 格式：DOCX 页数：28 大小：137.22KB 积分：22 举报 版权申诉

已阅读5页，还剩23页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第第页第一章绪论作为我国可持续发展战略中的一个重要组成部分，党中央和国务院高度重视安全生产工作，企业作为我国安全生产建设的主力军，安全问题深受关注，习近平总书记在2013年11月24日的讲话中提出：安全生产必须警钟长鸣、常抓不懈，丝毫放松不得，否则就会给国家和人民带来不可挽回的损失。因此我国企业都应严格遵守“安全第一、预防为主、综合治理”的方针，并力求将安全作为企业发展的核心要求。安全生产是企业发展的保障，为营造优良的企业建设环境，保证我国安全生产活动的顺利进行,企业安全管理水平的提高至关重要。1.1研究意义及目的1.1.1研究意义目前我国安全管理水平虽取得阶段性成果，但仍处于安全管理未落实或水平不高的阶段。许多学者在提高安全管理水平的问题上采用了不同的研究方法以及整改措施。李凯认为有明确安全生产标准化的行业可以更好地进行安全管理[1]；张宇提出从关键因素下手进行研究，可以有效的提高管理水平[2]；田苏明等人利用风险监控相关技术将化工企业的生产风险进行监控，以求达到更好的安全保障效果并可以对危险隐患预警的目的[3]；陈芳等人提出利用AI智能系统建立预警体系，提高安全生产过程中的预警速度以及系统数据库的建立[4]；刘开石提出安全生产企业应该明确管理核心，以便能进行全面的落实工作，更好的进行安全管理[5]；李海瑞根据企业安全管理的相似性建立的企业安全管理模型，并且可以通过管理系统有效的预防事故发生[6]。政府或企业强制性的单方面输出安全管理办法普遍存在，并没有考虑到在管理过程中其他参与者所做出的决策对最后的结果造成的影响。从目前的态势来说，安全管理所涉及的三个主要群体是政府、企业管理层以及工作在一线的员工。政府相关职能部门对企业的监管、或是企业管理层对员工所采取的管理制度的不同都有可能造成安全管理水平的效果波动。这个时候，参与方形成了互相博弈的局势。我们往往会注重他们博弈的局势，而忽略他们效益的长远化，所以我们不仅要考虑当下决策的影响，还要考虑对后续结果的落差。一次博弈仅仅涉及到参与方一次性的博弈决策，不存在对后续结果存在影响，则这个时候，参与双方都会追求自身利益最大化，这种情况下做出的决策，虽然是最优决策，但是双方却并不能获取最大利益。这个时候我们就考虑重复博弈。在进行重复博弈的情况下，参与方会因为出现多种博弈结果而进行深思熟虑每一阶段的决策对于未来合作的影响，在多次博弈的过程中，双方产生信任，进行长期合作，以追求双方利益的最大值。最典型的案例就是“囚徒困境”中的多次博弈模型[7]1.1.2研究目的笔者拟通过对政府、企业两个主要参与方建立重复博弈模型，通过模拟参与方关于安全管理进行重复博弈的过程，不同的参与方作出的决策对博弈结果的影响，选取其中最优的决策方案，并根据最优决策提出建议，从而达到更好的提高企业安全管理水平的目的。1.2研究现状及评述1.2.1国内研究现状安全管理是我国企业进行安全生产的保障，可有效的预防安全生产事故的发生，能够有效的降低人员伤亡和财产损失的风险。20世纪安全管理理论以及方法进入我国，我国在其基础上不断进行研究和完善，逐渐出现成型的管理模式，我国学者也认为应该系统化的对现代企业进行安全管理，内容包括安全生产过程中的危险源辨识、风险评价、危险预警以及过程监测。自二十一世纪以来，党和国家对于安全生产的重视，也使得我国安全管理研究得到了较快的发展。从安全管理的内容上来说，我国学者也都各有见解。李国华等人提出可以通过规范安全检查、考核、评价，及时了解安全管理现状，从而做出合理的调整[8]；张强认为，对安全质量制定完善的标准可以有效的提高整个企业安全生产的管理能力[9],这一思想运用在我国的各个领域一样适用，如陈湘兰等人建议通过提高化工厂员工安全培训能力来进行安全管理的统一化[10]；张宏亮通过对当前危化品行业中生产企业的现状进行分析，认为危化品在生产过程中出现的安全问题应从静态管理和动态管理两方面相结合，使事故达到可防可控[11]；从8.12天津港发生的爆炸事故来看，反映了我国安全管理存在着形式主义的问题，李合林就解决化工企业安全管理工作形式主义提出了相关对策[12]；刘开石提出需要对安全管理的核心内容重新定位并建议用六步法来确定企业文化建设流程[13]；而随着科技的发展，传统的员工管理难度增大，于是我国安全管理逐渐变化信息化、数据化的管理，不仅可以节省更多的人员劳动力，还可以提高生产效率和生产安全性[14]，大数据的科学管理、安全高效[15]是一种管理趋势，广泛运用于我国煤矿、建筑以及化工等行业中。李广飞通过融合多模态数据分析技术，提出相关电力企业的安全管理策略，用以实现预防和控制为主，构建便是、评价、预控安全管理体系[16]；王其宏对我国石化企业的设备安全管理进行了分析，可通过利用RBI技术来提高装置的可靠性[17]；而广泛运用于数学领域和经济学领域的博弈论，也开始出现在各种企业安全管理模式中，但在化工、建筑、煤矿、食品安全生产等方面还未取得较大进展。因此，许多人主张将博弈思想应用到管理过程中去：陈博宁提出可以将博弈论作为主要研究方法运用到企业安全管理过程中去，以企业管理层与员工作为博弈方，在执行政策方面形成的博弈关系中，有效开展企业安全生产工作和安全管理制定[18]；江自强提出通过实际建筑共轭很难过管理运用博弈论下非合作博弈理论只是，使得建筑工程管理水平能有进一步提升[19]。张进等人也提出应将博弈论应用与尾矿库的安全运营中[20]；张龙、薛习谨就煤矿安全管理问题建立了政府部门与煤矿企业的博弈模型[21]，通过政府查处企业安全生产成本以及煤矿隐藏安全隐患的概率可以选择最优的博弈结果，从而起到提高安全管理的作用；薛满合等人针对民航维修企业在安全管理以及安全管理体系中出现的问题，利用博弈思想建立了非合作博弈模型，大大的调动了各级人员对于安全管理的积极性，提高了安全管理水平[22]；而想要切实的运用于企业安全管理中去，需要对所分析的管理技术进行仿真试验，来了解是否适用。1.2.2国外研究现状二十年代初期，KivimÄki等人就通过对员工进行安全调查问卷的研究，在某种程度上证明了员工所能感知到的风险跟该组织管理层的关系最密切[23]，于是开始重视安全管理水平的提高；Holmberg,jan等人通过应用决策模型进行了运营安全管理中的基准研究，概述了用于安全相关问题的决策分析框架[24]；赵怡青等人利用故障树分析方法揭示隐藏因素之间的关系，创建了3D模型来模拟事故，对事故的模拟确定设计到的风险因素，这项研究有助于管理者制定循证规则[25]；NektariosKaranikas提出了通过交叉引用安全审计、会议和调查的数据来进行研究安全管理活动的协调性[26]，研究结果证明安全管理的协调需要具有一个完善的安全信息数据库；JoanM等人就医疗保健职业，利用职业健康和安全管理系统（OHSMS）中的领先指标，进行干预措施，优化安全管理[27]；Alkaissy等人用继承的风险建模方法，综述了安全管理的当代文献，为未来建筑安全研究等防线确定了多种建模方法[28]；苗程林等人基于DEA-Tobit的两阶段模型准确分析了我国煤炭企业的安全管理效率，确定了各种影响因素对煤炭企业安全管理效率的政府影响，并提出了相应对策和加你，有利于提高安全管理效率和经济效益[29]；MuhammadYazdi等人则利用改进的DEMATEL法（决策试验和评估实验室）用于安全管理决策[30]；徐磊等人论述了PDCA与实验室安全管理的结合，论述了PDCA的优缺点，提出对策，减少实验室发生事故的可能性[31]；MartinSkitmore等人也基于可视化技术在安全管理中的研究与开发，应用成果与障碍等提出了建议[32]；在物联网环境下，对于联邦信任管理的安全问题成了一个关注性的问题，边缘节点和物联网节点的相互作用也被认为是一个信号博弈，这个博弈被研究并且公式化，用于建设一个文件的证据聚合和实现文件的信任估计·一个经验评估被提交与超分类账平台,实现更动态的安全管理[33];而冯芬玲等人为了为铁路行业的信息监管方面制定一个更合理的监管机制，在体系中引入公众监督机制，提出了一种动态的奖惩机制来实现SRA最低监管投资、提高了CR的安全生产比例，减少了SRA的监管投入[34]；陶相龙还就目前中小企业发展的问题，如信贷不足、企业财务信息披露不规范等问题运用博弈论的方法研究我国中小企业融资难的现在，提出了相应的政策建议[35]；李春斌等人为实现风险优化，建立了基于合作博弈理论的GCPS风险转移模型[36]，米智勇为空管行业安全工作中绩效的绩效管理，试图从博弈论的角度对空管技保部门实施安全极限管理提供一些思考[37]；张玉运用博弈理论对建筑安全管理中各方的行为特点和管理均衡的形成机制，总结建筑安全管理中的不足，提出改进措施[38]。从目前国外研究现状来看，在安全管理方面期望通过博弈进行选取最优决策，达到事半功倍的效果。1.2.3研究评述建立良好的安全管理系统，提高安全管理水平是企业，才能有效的预防各类安全事故的发生，实现在安全生产的同时，保护从业人员的健康安全。而我国目前对于安全管理所进行的研究和改进，都或多或少的推动了安全管理水平的提升，一次博弈或许可以获得短暂的成功，但是却不是整体的最优解，而重复博弈就可以一定程度的解决这个问题，企业在安全管理的过程中，可以通过不断地重复博弈，从而实现共同的长期利益。1.3基本研究内容（1）了解企业提高安全管理水平的因素；（2）以某企业为例，对各参与方建立博弈模型，基于重复博弈思想进行仿真研究；（3）进行政府与企业管理者之间的博弈；（4）分析博弈结果，择取最优决策方案；（5）根据最优结果，提出企业提高安全管理水平的建议。1.4研究方法及研究路线1.4.1研究方法（1）方法一文献资料法本课题通过查阅有关企业安全管理与博弈思想的相关文献资料搜集、整理、提炼和证明所要研究对象的理论和规律性的内涵的方法，积累大量国内外文献资料和阅读相关书籍，通过有效地整理筛选选取对本课题帮助最大的部分。（2）方法二仿真调查法首先，制定观察计划、明确目的任务、搜寻观察地点、做好观察记录和现场记录，最后整理仿真记录，为进行下一步课题研究提供直接的感性的依据。通过引入政府部门与企业安全管理具有相关性的因素，例如产量与安全成本、政府相关部门管理与企业安全生产管理的策略、工作过程中员工的工作状态等，建立博弈模型，分析在博弈过程中，可能出现的情况，对比投入生产成本以及最终收益，选取最优方案，从而提升企业安全管理水平。（3）方法三问卷调查法通过调查问卷、访谈、测量等具体方法进行咨询，了解实际客观情况比如企业目前安全管理现状，直接获取有关材料，加以分析并开展研究，为本课题提供第一手资料。调查研究是科学研究中的常用方法，通过调查可以发现新问题从而提出新的假设和独到见解。

1.4.2技术路线重复博弈视角下企业安全管理水平提高仿真研究重复博弈视角下企业安全管理水平提高仿真研究国内外国内外相关文献，资料及研究现状对对企业安全管理进行调查研究查阅文献查阅文献建立模型建立模型企业企业政府政府分析模型分析模型得出结论得出结论图1-1研究技术路线第二章重复博弈分析相关理论2.1博弈论一般认为，1949年冯·诺依曼和摩根斯坦恩合作的《博弈论和经济行为》为博弈论奠定了理论基础。博弈论，又称为对策论，最早是微观经济学的组成部分，现在逐渐发展成现代数学一个新的分支，主要运用在某一个决策方在与其他决策方进行合理选择的问题时，决策方的选择会与其他决策方的选择互相影响。博弈可以从两个方面来进行划分，第一个方面，可以根据决策者的行动策略是否具有先后次序，可分为动态博弈和静态博弈，动态博弈是指决策者的行动具有先后顺序并且后进行选择的决策者可以观察到前者的行动策略，而静态博弈是指虽然决策者的行动具有先后次序但后者并不能知道前者具体采用了什么行动策略。第二个方面是从决策者与其他决策主体之间的信息完整性，如特征、战略空间以及支付函数等方面来划分，可以分为完全信息博弈和非完全信息博弈。博弈的分类如图2-1所示。博弈博弈完全信息博弈非完全信息博弈完全信息博弈静态博弈完全信息博弈动态博弈非完全信息博弈静态博弈非完全信息博弈动态博弈图2-1博弈分类2.1.2纳什均衡纳什均衡是由所有参与者中的最优战略所组成的战略组合，假设进行博弈的参与者有n人，在指定其他参与者战略的条件下，参与者可以依赖他人的战略或不依赖他人的战略选择自身利益最大化的战略，这样的组合称为博弈论中的纳什均衡纳什均衡的定义：在博弈G=﹛S1,…,Sn：u1,…，un﹜中，如果由各个博弈方的各一个策略组成的某个策略组合（s1*,…，sn*）中，任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…，sn*）的最佳对策，也即ui（s1*,…s*i-1,si*,s*i+1,…，sn*）≥ui（s1*,…s*i-1,sij*,s*i+1,…，sn*）对任意sij∈Si都成立，则称（s1*,…，sn*）为G的一个纳什均衡[39]。2.2重复博弈论的基本概念与特征将结构相同的博弈重复进行有限次或无限次的过程，称为重复博弈，其中每次博弈都可以称为阶段博弈，在每一次博弈的过程中，每一次博弈决策者的战略、博弈规则以及博弈目标都是相同的，但是不同于一次决策的是，由于出现一个长期博弈的存在，因此各个参与方需要在博弈过程中考虑到自己的决策对未来收益的影响，从而选择最优决策，实现长远的共同获益。重复博弈具有三个特征：（1）各阶段博弈独立存在，每次博弈结构、内容不变，并不受上一阶段博弈的影响；（2）重复博弈的每一阶段中，所有参与博弈的决策者都能够知道已经博弈过的历史；（3）任意参与者在重复博弈过程中的总收益是他在所有阶段博弈获得的收益的总和。2.3重复博弈的影响因素影响重复博弈的均衡结果的主要原因有两个，一是重复博弈进行的次数，二是在博弈过程中决策参与方的信息完备性。当博弈只是一个短期行为甚至一次性行为时，参与方都会在有限条件下选择自己利益最大化的战略行动，而当博弈次数增多，参与人就需要考虑自身决策对于长远合作的影响，极有可能改变行动策略，此时博弈次数的重要性就体现出来了；另一影响因素是信息的完备性，当参与者自身的支付函数不被其他人知道时，参与人很有可能会为了营造一个好的形象来换取长期的利益。2.3.1有限次重复博弈当重复博弈的次数是有限次时，博弈的本身并不改变囚徒困境的均衡结果。可以表示为令G为阶段博弈，G(T)是G重复T次的重复博弈（T<∞）,那么如果有唯一的纳什均衡，重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次[40]而如果阶段博弈出现多个纳什均衡时，参与者可以选择使用不同的纳什均衡来惩罚前一阶段的不合作行为或者奖励前一阶段的合作行为。2.3.2无限次重复博弈当重复博弈的次数是无限次，冷酷战略会成为无限重复博弈的纳什均衡，同时引入贴现因子δ（δ<1），同时引入无名氏定理可以得出无限重复博弈中的子博弈精炼均衡结果。可以理解为在无限重复博弈中，如果参与人有足够的耐心（δ足够大），那么，任何满足个人理性的可行支付向量都可以通过一个特定的子博弈精炼均衡得到[41]。2.4重复博弈模型的基本情况博弈论认为，人总是理性的，在博弈过程中理所当然的会作出条件内的利益最大化的决策，本文主要以两个参与方在非完全信息的机制下，通过建立相关重复博弈模型，求出双方在重复博弈过程中对手可能处于非理性状态的概率，从而从理性角度出发结合实际情况作出相关决策，达到长期合作并且获利的目的。企业在进行安全管理过程中，需要接收政府相关职能部门下发的安全文件并且负责承接办理各项批文，并在企业内部进行贯彻落实，这一管理措施，政府与企业存在博弈局势，双方的决策具有先后顺序，且并不知道对方的决策。可以作以下假设：一是政府相关职能部门进行下发文件时，需与企业进行交接，因此，对于安全文件的下发以及执行这一博弈过程，是有两个参与方，是企业与政府；而当企业进行内部安全管理的过程中时，参与方则变成企业与员工；二是在安全管理进程中参与方能够选择的决策行动分别有：（1）政府部门将文件下发之后，企业有两种可供选择的策略：按照文件认真执行（C）和不认真执行（D）；（2）政府也有两个可供选择的策略，依法对企业安全管理状况进行监督检查（C）与不进行监督检查（D）。本文引用钱珍在《重复博弈理论及其应用》中建立的一般重复博弈模型通过推理博弈参与方处于非理性状态的的概率，分析当对手处于非理性状态时理性的决策者会作出的决策，结合现实情况进行分析博弈战略是否具有可行性，从而得出结论，对于提高企业安全管理水平提出建议。

第三章重复博弈模型的构建及分析3.1模型建立假设两个决策者P1，P2的类型为{t1，t2}，其中t1表示非理性，t2表示理性。在博弈过程中，无法认定具体一方是何种状态，所以两者皆有可能为理性决策者或非理性决策者。其中类型为理性的决策者（Pi）采用S={C,D}策略[42]，即类型为非理性的决策者（Pi）的采用的是“针锋相对针锋相对策略：即若对手在上一阶段选择合作，那“我”在这一阶段也选择合作策略，对手在上一阶段选择不合作，那“我”也选择不合作策略。针锋相对策略：即若对手在上一阶段选择合作，那“我”在这一阶段也选择合作策略，对手在上一阶段选择不合作，那“我”也选择不合作策略。为使得博弈成为囚徒困境型，我们假定博弈过程中决策者关于C，D选择的收益a，b，c，d如下表3-1所示:当双方都不合作，则双方都获利a；当P1不合作，P2合作时，P1获利b，P2亏损c；当P1合作，P2不合作时，P1亏损c，P2获利b；当双方都合作时，双方都获利d；其中a，b，c，d∈R,b>d>a>c，2d>b+c以保证合作的效率最高。表3-1决策者关于C，D选择的收益P2C（合作）D（不合作）P1C（合作）(a,a)(b,c)D（不合作）(c,b)(d,d)3.2模型求解假设博弈次数T=2在t=1阶段，类型为（不理性）t1的决策者Pi均会先选择不合作策略D使自己获利；理性的决策者Pi选择的策略未知，可以是合作策略，或是不合作策略；在t=2阶段，类型为（理性）t2的Pi选择合作策略C可以使自己在博弈过程中获得最大利益，类型为（不理性）t1的Pi将会模仿类型为（理性）t2的对手在t=1阶段的选择[42]，i=1,2,表3-2为重复两次博弈路径，M，N为决策者可能选择的行动，均可以表示为合作策略C或不合作策略D。表3-2重复两次的博弈路径重复两次的博弈路径参与方类型概率t=1t=2P1t1pDNt21-pMCP2t1qDMt21-qNC（1）当M=D,N=D，即当理性的决策者在第一阶段选择的策略均为不合作策略D的情况时，理性的P1，P2在博弈结束后获得的收益为：UP1t2=u(D,D)+[qu(C,D)+(1-q)u(C,C)]=d+[qb+(1-q)a]（3-1）UP2t2=u(D,D)+[pu(D,C)+(1-p)u(C,C)]=d+[pb+(1-p)a]（3-2）（2）当M=C,N=C，即当理性的决策者在第一阶段均选择合作策略C时：理性的P1，P2在博弈结束后获得的收益为：UP1t2=u(C,C)+[qu(C,D)+(1-q)u(C,C)]=a+[qb+(1-q)a]（3-3）UP2t2=u(C,C)+[pu(D,C)+(1-p)u(C,C)]=a+[pb+(1-p)a]（3-4）（3）当M=C,N=D，即理性的决策者P1选择合作策略C，理性的决策者P2选择不合作策略D时：理性的P1，P2在博弈结束后获得的收益为：UP1t2=u(C,D)+U(C,C)=b+a（3-5）UP2t2=[pu(D,D)+(1-p)u(C,D)]+[pu(D,C)+(1-p)u(C,C)]=pd+(1-p)c+pb+(1-p)a（3-6）（4）当M=D,N=C，即理性的决策者P1选择不合作策略D，理性的决策者P2选择合作策略C时：理性的P1，P2在博弈结束后获得的收益为：UP1t2=[qu(D,D)+(1-q)u(D,C)]+[qu(C,D)+(1-q)u(C,C)]=qd+(1-q)c+qb+(1-q)a（3-7）UP2t2=u(D,C)+u(C,C)=b+a（3-8）决策者对应M,N选择的收益为表3-3:表3-3参与方P1、P2对应M、N选择的收益矩阵NMCDC(a+[qb+(1-q)a],a+[pb+(1-p)a])(b+a,pd+(1-p)c+pb+(1-p)a)D(qd+(1-q)c+qb+(1-q)a,b+a)(d+(qb+(1-q)a),(pb+(1-p)a))其中，当M=C,N=C，即双方都选择合作策略时，双方收益分别为a+[qb+(1-q)a]，a+(pb+(1-p)a；当M=C,N=D，即其中一方合作，另一方不合作时，双方收益分别为b+a，pd+(1-p)c+pb+(1-p)a；当M=D,N=C时，即其中一方合作，另一方不合作时，双方收益分别为qd+(1-q)c+qb+(1-q)a，b+a；当M=D,N=D时，双方都选择不合作策略时，，双方收益分别为d+(qb+(1-q)a)，(pb+(1-p)a)；已知M，N表示理性决策者在博弈后可以获得的收益表达式，通过收益表达式的两两比较，可以得出当M，N代表不同决策时，理性决策者认为对手是不理性的概率p(q)关于a，b，c，d的关系式：（1）当满足下述条件时，M=C（a）（3-3）的值大于等于（3-7）的值（b）（3-5）的值大于等于（3-1）的值由（a）即：a+q(c-d)≥c-a由于b>d>a>cq≤由（b）解得：q≤（2）当满足下述条件时，N=C（c）（3-4）的值大于等于（3-6）的值（d）（3-5）的值大于等于（3-2）的值由（c）（d）解得：p≤a−cd−c且QUOTEp≥a−cd−c（3）当满足下述条件时，M=D（g）（3-3）的值大于等于（3-7）的值（f）（3-5）的值大于等于（3-1）的值由（g）（f）解得：q≥a−cd−c（4）当满足下述条件时，N=D（m）（3-6）的值大于等于（3-4）的值（n）（3-2）的值大于等于（3-5）的值由（m）和（n）解得：p≥a−cd−c综上所述：（1）非理性参与者可能选择的策略为D,即选择不合作时，可以表示为M=D或N=D，得到概率表达式q(p)，当概率q(p)大于等于两者中最大值时认为对方是不理性的状态，则此时理性参与者应该在t=1阶段选择不合作策略，可以获益；（2）同理，非理性参与者可能选择策略C，即选择合作，表示为M=C或者N=C，得到概率表达式q(p)，概率q(p)小于等于两者中最小值时，认为对方是理性状态，则理性参与者应该在t=1阶段选择合作策略，可以获益；得出以下结论：（1）类型为t2（理性）的决策者认为对方的类型是t1（不理性）的概率为[42]q(p)≤min⁡{a−cd−c当理性参与者认为对手为不理性的概率小于两者中最小值时，不理性概率越低，对手就越理性，则对手会选择合作策略使自己获益，那么理性的决策者在第一阶段选择合作时自己也获益。（2）类型为t2（理性）的决策者认为对方是t1（不理性）的概率为[42]q(p)≥max⁡{a−cd−c,b−d当理性决策者认为对手为不理性的概率大于两者中最大值时，不理性概率越大，对手就越不理性，那么对手会选择不合作策略，此时理性决策者可以在第一阶段选择不合作策略使自己获益最大。接下来讨论类型为理性的参与者认为对方类型是非理性的概率为min⁡{a−cd−c则理性的pi如何进行选择假设类型为t2的pi认为对方是t1的概率q（p）≥x时，不理性的对手在t=1阶段选择不合作策略D,类型为t2（理性）的pi以1-x的概率选择不合作策略D，以x的概率选合作策略C,若满足[42]xuq≤令x=记m=b-a+c-d，n=d-b，l=a-b,有mx2+(l-m)x-n=0，则有x=故当理性的pi认为对方是非理性的概率q(p)≥x时，他在t=1阶段选择不合作策略D，t=2阶段选择合作策略C博弈重复两次的均衡路线[42]，如表3-4所示:表3-4重复两次博弈的均衡路线参与方类型t=1t=2Pit1DDt2DC即当理性的参与方认为对方是非理性的概率大于等于x时，不理性概率越高，对手越不理性，当对手为不理性状态时，会一直选择不合作策略，而理性的参与者只有在t=1阶段选择不合作策略时自己也获利，在最后一次博弈阶段中，选择合作策略能使自己达到利益最大化。当T>3次时，若q(p)≥x，类型为t2的pi从1~T-1阶段选择不合作策略D，T阶段选合作策略C,类型为t1的pi一直选不合作策略D，则博弈均衡路径如表3-5：同理，当博弈次数T>3次时，或博弈次数趋于无穷时（T→∞）,则理性的参与者在1~T-1阶段都选择不合作，在最后一个阶段选择合作，。表3-5T>3次后的博弈均衡路径参与方类型t=1…t=T-1t=Tpit1D…DDt2D…DC同理，表中当理性的参与方认为对方是非理性的概率大于等于x时，不理性概率越高，对手越不理性，当对手为不理性状态时，在1~T阶段会一直选择不合作策略，而理性的参与者只有在1~T-1阶段选择不合作策略时自己也获利，在T阶段博弈中，选择合作策略能使自己达到利益最大化。此模型表示，当对手是不理性状态下，会在所有阶段博弈过程中选择不合作策略使自己获益，而理性的决策者会因为想争取利益最大化从而在1~T-1阶段选择不合作策略，在最后一阶段选择合作策略。博弈论认为，人都是理性的，都会追求个人利益最大化，但是当模型运用到现实实例中时，（不合作，不合作）不满足个人理性要求，而（合作，合作）不仅是纳什均衡，还是一个占优策略，不管对手怎么选择，自己选择才是最优决策，双方都有积极性去保持这个策略。

实例模拟4.1企业基本情况科盾技防科技有限公司总部位于贵州省贵阳市云岩区宝山北路180号贵州师范大学国家大学科技园文科综合楼1楼2号，是经贵州省公安消防总队认证批准的消防技术服务机构，是全省最早开展建筑消防设置检测服务的独立法人企业。科盾技防致力于为内社会单位提供优质的建筑消防设施维保检测，电气线路消防安全检测，消防安全技术咨询与培训等消防技术服务。主要表现为为贵州省内各社会单位承接委外项目。企业目前主要负责贵州贵阳轨道公司1号线及2号线的各项消防设施设备维保，按计划进行日常检修、周检、月检、年检。同时主要经营计算机技术及服务、消防安全系统竣工检测、消防产品质量检验、电器线路消防安全监测、消防器材销售、消防安全系统维修、消防安全技术咨询以及软件技术开发及应用。4.2方法及数据来源由于企业工作性质，企业需要对自身的安全管理工作进行一定的统筹协调，在这个过程中会涉及利益以及公司价值公信力的问题，而另一方面，政府作为一个监管型的机构，需要对企业的相应的运转进行一定的调控，在这个过程中同样也有政府的公信力和利益问题出现。由于在实际生活中参与方都会出现理性和不理性的状态，不理性的状态在实际生活中表现为为了当前的利益选择不合作等情况，理性的状态则会考虑当下所做的决策对未来的影响，是为了长久的共同利益会作出的判断；这个不理性的状态是一种概率，这个概率的出现可以帮助我们解决长远合作的问题。本文基于重复博弈的理论基础，通过进行分析政府与企业两者之间的博弈关系解决参与方长远合作的问题。本文将运用重复博弈模型将政府以及贵州省科盾技防科技有限公司作为参与方进行重复博弈模拟，拟通过模拟计算，得出企业与政府在博弈过程中呈非理性状态下的概率。表4-1中数据来源于各网络平台。贵州科盾技防科技有限公司在2021年度中，企业总收入125.2万元，企业营业净利润29.2万元，企业在安全管理过程中投入的安全成本为6.5万元，企业在运营过程中，会出现信用价值，表示的是企业在社会层面的一个形象，当企业认真管理、严格执法时出现信用价值呈正值，当企业产生负面信息时信用价值会出现亏损，价值约为2.1万元，除未公示的信息外，由于未按照政府监督部门规定对建筑工地进行严格管理及其他违法行为，共罚款5.5万元；政府在进行监管时需成立专项部门进行监管或帮扶，费用大约为1.5万元，政府若不作为，会使政府公信力下降，损耗价值无法估值，本文认为其与企业亏损价值等值。表4-1企业相关数据数据名称价值企业总收入1252000元营业总成本960000元企业营业净利润292000元安全投入成本65000元企业信用价值21000元企业罚款55000元政府监管/帮扶15000元4.3模拟过程本次模拟主要针对于企业是否将政府下发的安全管理文件贯彻落实到安全生产工作中、而政府是否依法履行对企业进行监督管理的职能，由于企业和政府在进行决策时不知道对方的支付函数，所以我们讨论参与方是非完全信息的情况，C表示执行（监管），D表示不执行（不监管）可以得出企业政府在进行博弈时的收益，如表4-2：表4-2博弈双方支付矩阵政府CD企业C（27.7,27.7）（34.7，-7.6）D（-7.6,34.7）（31.3,31.3）以下结论我们以理性的企业角度进行解读：将a=27.7、b=34.7、c=-7.6、d=31.3代入式3-1,3-2,3-3中可以求出：（1）理性的企业认为政府是非理性状态的概率为：q当企业认为政府出于非理性时概率小于3470时（2）理性的企业认为政府是非理性状态的概率为：q企业认为政府为非理性状态概率大于353389时，认为政府是不理性阶段状态，则政府不会对企业进行监管，那么理性的企业为追求自身利益最大化则会在t=1选择不合作策略（3）当理性的企业认为政府是非理性的概率为：min⁡{计算x=m−l±(l−m)2+4mn2m的概率，得出结果x≈0.89,此时，理性的企业认为政府为非理性状态的概率q(p)≥x4.4模拟结果及分析根据模拟，我们可以得出模拟的重复路径，得到最佳的均衡决策，结论也适用于重复次数大于三次的有限重复博弈，博弈路径如下：（1）当理性的企业认为政府是非理性状态的概率q(p)≥x时，他在t=1阶段选择了不合作策略D,t=2阶段选择策略合作策略C,可以获得最大利益，重复两次的均衡路径如表4-3所示：表4-3重复两次的博弈均衡路径参与方类型t=1t=2t1DD企业（政府）t2DC（2）T>3时，理性的企业将在1~T-1阶段选择不合作策略D，T阶段选择合作策略C，非理性的企业一直选择不合作策略D，那么双方在博弈过程中会获得最大利益，则博弈均衡路径如表4-4所示：

表4-4重复T次的博弈均衡路径参与方类型t=1…t=T-1t=T企业（政府）t1D…DDt2D…DC（3）设定贴现因子δ，表示参与者在进行博弈中的耐心，则有限次重复博弈的期望收益为:ht为阶段t的历史U由于重复博弈次数可以趋于无穷，当趋于无穷时为无穷博弈，其期望收益为：U贴现因子越大，表明参与者具有足够的耐心，则任何短期的机会主义行为的所得都是微不足道的，参与者有积极性去建立一个声誉良好的形象，从而获取利益，并且期望收益越高，则表示参与方合作得到的利益越高，双方参与者对于长远合作的想法就越坚定，对于选择其他行动的积极性就会降低。博弈论认为，人都是理性的，即政府和企业都是理性的，虽然企业不执行，政府不监管可以使双方获得最大利益，但是却没有人有积极性去遵守，不能构成合作关系，达不成长期合作的目的；所以如果双方在博弈过程中都选择合作策略，这样无论对方选择什么策略，自己都能够获利。即政府会一直进行监管，以求获得好的社会形象和盈利，企业也会一直选择执行，获得良好的形象和收益，且在这个过程中，企业一定会通过贯彻落实安全管理这一行为达到提高企业安全管理水平的目的。

第五章结论与建议从文中的博弈过程中，我们可以得出以下结论：（1）从式3-1中可以得出，a-c越小或d-c越大的时候，此时理性参与方认为对方不理性的概率q(p)的概率越小，表明对手越理性，因此双方更应该选择合作，即企业选择贯彻落实安全管理文件，政府选择进行监督检查；b−db−a（2）由式3-3，认为不理性的参与者在第一阶段将会选择不合作，理性的参与者以x的概率选择合作，以1-x的概率选择不合作，计算x的值，若理性参与方认为对方不理性的概率q(p)≥x，则表示对手为非理性的概率就越大，对手为不理性状态的可能性就越大，那么此时企业可以在1~T-1次方可以选择不合作，在最后一次博弈中选择合作，可以使自己获得最大利益，得出有限次博弈路径。虽是利益最大的战略，但因为当博弈次数增多，不理性的对手始终会有偏离的几率，只有自己不受对手影响，从始至终都选择合作策略，才会一直获得利益。（3）博弈论认为，人都是理性的，即政府和企业都是理性的，虽然企业不执行，政府不监管可以使双方获得最大利益，但是却没有人有积极性去遵守，不能构成合作关系，达不成长期合作的目的；所以如果双方在博弈过程中都选择合作策略，这样无论对方选择什么策略，自己都能够获利。即政府会一直进行监管，以求获得好的社会形象和盈利，企业也会一直选择执行，获得良好的形象和收益，且在这个过程中，企业一定会通过贯彻落实安全管理这一行为达到提高企业安全管理水平的目的本文通过重复博弈模型进行模拟，得出的一般性结论可以应用到具体实例中，在非完全信息情形下也能够实现合作均衡，达到长期进行合作双方均能获益的目的。由于企业在运营过程中数据存在保密性，不能准确完整地获得全部数据，所以研究有限。

参考文献[1]李凯.基于安全生产标准化的机械制造企业安全管理[J].中国高新科技,2020(11):63-64.[2]张宇.企业安全管理的关键控制因素研究[J].经济技术协作信息,2020,(24):66-66[3]田苏明,张静.化工企业生产系统中的风险监控和安全管理[J].化工设计通讯,2020,46(11):122-123.[4]陈芳,刘阳,马昆.基于AI的煤矿安全管理智能预警体系的探索与应用[J].价值工程,2020,39(32):187-189[5]刘开石.企业安全管理核心内容的重新定位[J].企业改革与管理,2020(09):30-31.[6]李海瑞.企业安全管理的通用模型浅析[J].科学大众,2020,(5):262-263[7]钱珍.重复博弈理论及其应用[D].西安建筑科技大学,2018.[8]李国华,李美中,李美霞.规范安全检查、考核、评价,促进安全管理水平提高[J].机电安全,2007(8):15-17.[9]张强.探索安全质量标准化对机械制造企业安全管理工作的作用[J].科学与信息化,2020(31):152.[10]陈湘兰,吴洁葵,吴欢.做好危险化学品企业安全培训促进企业安全管理水平的提高[J].化工安全与环境,2010,23(5):13-13[11]张宏亮.危险化学品生产企业安全管理探讨[J].中小企业管理与科技,2020(12):33-34.[12]李合林.剖析化工企业安全管理存在问题及对策[J].科学与信息化,2020(25):164-164.[13]刘开石.企业安全管理核心内容的重新定位[J].企业改革与管理,2020(9):30-31.[14]迟宇.“数据化管理”在注汽锅炉安全管理中的应用[J].石油石化物资采购,2020(31):91-91.[15]高红岩.大数据助力企业安全管理领域的研究[J].网络安全和信息化,2020(5):124-124.[16]李广飞.融合多模态数据分析的电力企业安全管理策略研究[J].数字通信世界,2020(9):113-113.[17]王其宏.石化企业设备安全管理——基于风险的检验(RBI)技术.江苏安全生产,2020(10):39-40.[18]]陈博宁.基于博弈论的企业运行研究[J].商讯,2020(13):106-106.[19]江自强.博弈论非合作均衡博弈在建筑工程管理中的应用研究[J].广西质量监督导报,2020(7):82-82.[20]张进,马斌,王可娜.博弈论在尾矿库安全运营管理中的应用研究[J].济宁学院学报,2016,37(6):26-29.[21]张龙,薛习谨.基于博弈论的煤矿安全管理问题[J].内蒙古煤炭经济,2018(16):105-105.[22]薛满合,李洪枚.基于博弈论的人员安全积分管理体系建立与评估[J].安全与环境学报,2020,20(5):1773-1781.[23]KivimÄki,Mikaél.Perceivednuclearrisk,organizationalcommitmentandmanagementassessment:Astudyofnuclearplantpersonnel[j].RiskAnalysis:InternationalJournal,1900,15(3):391-396.[24]Holmberg,January,operationalsecuritymanagementriskdecision-making--Nordicbenchmarkingexperience[j].RiskAnalysis:InternationalJournal,1900,14(6):983-991.[25]YiqingZhaoetal.Scenariossimulationofhigh-temperaturemoltenmetaltippingaccidentswithRealFlowsoftware[J].SafetyScience,2020,131[26]NektariosKaranikas.Evaluatingthehorizontalalignmentofsafetymanagementactivitiesthroughcross-referenceofdatafromsafetyaudits,meetingsandinvestigations[J].SafetyScience,2017,98:37-49.[27]Almost,JoanofEngland,QueenofSicilyHealthCareOccupationalHealthandSafetyManagementSystemleadingindicatorstudy[J].BMCHealthServicesStudy,2018,18(1):296[28]Alkais

人人文库> 全部分类> 行业资料 > 工业设计

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

【重复博弈模型在企业管理中的应用实证研究13000字（论文）】

文档简介

温馨提示

最新文档

评论

【重复博弈模型在企业管理中的应用实证研究13000字（论文）】

文档简介

温馨提示

最新文档

评论

相关文档