一类特殊变异煤矿安全监察行为进化博弈分析_第1页
一类特殊变异煤矿安全监察行为进化博弈分析_第2页
一类特殊变异煤矿安全监察行为进化博弈分析_第3页
一类特殊变异煤矿安全监察行为进化博弈分析_第4页
一类特殊变异煤矿安全监察行为进化博弈分析_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021 年 5 月Journal of Guilin University of TechnologyMay 2021文章编号: 1674 9057( 2021) 02 0309 05一类特殊变异煤矿平安监察行为进化博弈分析黄定轩1 ,付茂林2( 1. 桂林理工大学 管理学院,广西 桂林 541004; 2. 西南交通大学 经管学院,成都 610031)摘 要: 运用进化博弈理论建立了最优受贿概率时的煤矿平安监察行为进化博弈模型,对该条件下煤矿平安监察行为的稳定状态进行了分析。研究说明: 最优受贿概率条件下的监察人员监察行为稳定状 态主要与监察人员接受贿赂金额、认真执行监察职能获得的鼓励、不

2、认真执行监察职能节约的本钱、 上级领导监督概率、不执行监察职能所受处分相关。最后,对最优受贿概率条件下稳定状态受相关参 数的影响进行了分析。关键词: 进化博弈;中图分类号: O225;最优受贿概率; 平安监察; 煤矿文献标志码: AX924煤矿平安事故是当前公众瞩目的问题之一。中国平安生产监督管理总局公开的数据表 明:2001 11 012021 01 01 共发生一次死亡 1 人以上 10 人以下的煤矿平安事故 7 544 次; 一次 死亡 11 人以上 50 人以下的煤矿平安事故 274 次; 一次死亡 50 人以上的煤矿平安事故 15 次,其中 2 次发生在 2021 年。根据我国煤矿平

3、安面临的严峻 形势,国务院办公厅曾于 2005 年 8 月发出紧急通 知,要求坚决遏制煤矿事故频发多发的势头。紧 急通知强调,严格平安生产行政问责制,认真查 处煤矿平安生产和煤矿事故背后的失职渎职、官 商勾结和腐败现象。国内运用进化博弈理论研究煤矿平安监察的 研究文献较少: 文献1研究了煤矿企业与煤矿安 全监察部门之间不存在相互勾结或串谋的有限理 性行为,通过对监察方和被监察方的博弈过程分 析,揭示出双方在排除腐败行为前提下的标准行为 取向及其稳定点; 文献2进一步研究了存在腐败 情况下的煤矿企业与政府监察部门之间的标准行 为取向及其稳定点; 在文献1 2的根底上,文献3作了进一步的分析,重点

4、研究了煤矿平安监察 部门以恒定概率接受贿赂条件下的煤矿平安监察行为模型及其稳定点。但在实际情况中,以贿赂为典型代表的腐败概率是随着一定的社会环境发生 相应变化的。针对存在贿赂等腐败现象的煤矿安 全监察行为研究的缺陷,笔者拟采用进化博弈理论 建立煤矿平安监察人员在最优受贿概率条件下的 煤矿平安监察行为进化博弈数理模型,对最优受贿 概率时的煤矿平安监察行为的稳定状态进行分析。进化博弈模型进化博弈具有以下 3 个假设: ( 1 ) 具有较高支 付的战略随时间的推移而取代较低支付的战略;( 2) 存在一些惯性; ( 3 ) 局中人并没有系统地影响 其他局中人未来的行动4。国外进化博弈研究主 要经历了

5、3 个阶段: 第 1 阶段是一些生物学家为了 构建其研究领域中诸如动物竞争、动物群中的性别 分配、植物的生长等生物进化模型,从经济学家使 用的博弈论中借用了一些概念5 6; 第 2 阶段是一 些生物学家修正了博弈论中相关的定义和内容,进 化稳定策略的概念( ESS) 、复制动态都是这一阶段 的成果7 8; 第 3 阶段,生物学家的创新又反过来 被经济学家所吸收,经济学家更新和扩大了生物学 家对博弈论根本概念的理解,对纳什均衡的稳定性、1收稿日期: 2021 07 08基金工程: 四川省软科学规划工程 ( 2021ZR081)作者简介: 黄定轩 ( 1970) ,男,博士,研究员,huangdi

6、ngxuan 126. com。引文格式: 黄定轩,付茂林 一类特殊变异煤矿平安监察行为进化博弈分析J 桂林理工大学学报,2021,31( 2) : 309 313桂 林 理 工大 学 学 报2021 年310弱占优战略的不合理都进行了修订9 12,所有这些改良都为构建经济竞争模型带来了新的思路。在进化博弈中,核心的概念是演化稳定策略( ESS) 和复制动态( RD) 。ESS 表示一个种群抵抗 变异策略进入的一种稳定状态,其定义: 当博弈 参与者随机配对进行博弈时,在位种群成员的支 付水平高于入侵者的支付水平。每个博弈参与者 都有 ( 1 ) 的概率遇到选择策略 x 的参与者, 同时,还有

7、的概率遇到入侵者,从而 ESS 的定 义条件式为ux,( 1 ) x + x ux,( 1 ) x + x。( 1)其中, 是一个极小的正数,0 珔。复制动态方程实际上是描述一个特定策略在 一个种群中被采用的频数或频度的微分方程。其基 本思想是: 如果策略 x 的结果优于平均水平,那么选 择该策略的那些群体在整个种群中的比重就会上 升。复制动态的微分方程一般如下:并不能掩盖其工作绩效。因此,正常条件下煤矿安全监察人员的博弈支付矩阵如表 1 所示。表 1 正常条件下煤矿平安监察行为博弈支付Table 1 Game payoff of colliery safety supervision und

8、er normal condition认真监察不认真监察认真监察不认真监察A /2,A /2( S fD) ,AA,( S fD)( S fD) ,( S fD)假设监察人员对煤矿认真监察的概率为 ,那么监察人员认真执行监察职能时的期望支付:A1 ( superv) = + ( 1 ) A。 ( 3)= A1 22相应地,监察人员不认真执行监察职能时的期望支付:( unsuper) = ( S fD) + ( 1 ) ( S fD)= ( S fD) 。( 4)式( 3) 和( 4) 反映了正常条件下监察人员采用不同策略时的支付,那么正常条件下监察人员的平均 期望支付:dxk= xku( k,

9、s) u珔( s,s) ,k= 1,n。 ( 2)珚dt= A( 1 /2) + ( 1 ) ( S fD)= A2 /2 + ( A S + fD) + ( S fD) 。其中,xk 为一个种群中采用策略 x 的比例,u( k,s) 表( 5)示采用策略 k 时的适应度,u珔( s,s) 表示平均适应度。 2. 2存在贿赂的煤矿平安监察行为模型假设及其分析两种煤矿平安监察博弈模型正常条件下的煤矿平安监察行为模型假设在某一区域内有不同的监察人员行使监察22. 1除继承监察人员在正常条件下的博弈支付外,这里还考虑煤炭企业在生产过程中,必须接受监 察人员对其是否执行煤矿平安生产操作规程的监 督,如

10、果其没有认真执行相关操作规程,将受到 监察人员勒令停产等处分,而监察人员如不认真 执行监察职能也将受到上级的处分。基于上述分 析,此处假设监察人员对其所管辖区域内的煤炭 企业进行监察时,其不认真执行监察职能是因为 接受了煤矿企业各种形式的贿赂。为分析上的方 便假设 E fD,即监察人员接受贿赂的必要条件是 贿赂金额必须大于其因不认真执行监察职能受到 领导处分的期望损失。相应的博弈支付矩阵如表 2 所示。( S fD) 为在正常条件下不认真执行监察职 能也不接受贿赂时的支付。职能。由于监督本钱限制,下级监察人员行使监察职能时上级不可能完全有效地对其进行监督,只能 以一定的概率 f 检查其工作情况

11、。如果某一监察人 员一旦被发现没有认真履行监察职责其将被处以罚 款 D。监察人员不认真执行监察职能相比认真执行 监察职能时,将节约监察经费 S( 这笔费用可通过减 少监察次数及设备使用等获得) 。为鼓励下级认真 执行煤矿平安监察职能,上级将从煤矿收取的行业 费用或其他费用中( 如对煤矿罚款等) 设定奖励,当 所有的下级监察人员都认真执行监察职能时,由全 部下级机构( 假定为 2 个) 平分这笔经费,假设各获 得 A /2; 如果只有一局部机构认真执行监察职能时, 认真监察者平分全部奖励,为分析方便假设认真执 行者获得 A; 当都不认真执行监察职能时那么都不能 获得这笔奖励。还假设上级对下级监察

12、人员的工 作进行随机检查,因此监察人员相互间的通风报信表 2 存在贿赂时的煤矿平安监察行为博弈支付Table 2 Game payoff of colliery safety supervision with bribery认真监察不认真监察认真监察不认真监察A /2,A /2( S + E fD) ,AA,( S + E fD)( S + E fD) ,( S + E fD)第 2 期黄定轩等: 一类特殊变异煤矿平安监察行为进化博弈分析311假设存在贿赂条件下监察人员监察的概率为,那么监察人员认真执行监察职能的期望支付:根据式( 9) 和式( 10) 的结果,监察人员的平均期望支付如式( 1

13、1) :珚= A( 1 /2) + ( 1 ) E + ( S fD) = A2 /2 + ( A E ( S fD) ) += A1 1 ( superv)+ ( 1 ) A。 ( 6)= A22相应地,监察人员不认真执行监察职能的期望支付:( unsuper) = ( S + E fD) + ( 1 ) ( S + E fD)( S fD + E) 。( 11)假定在连续时间内监察人员倾向模仿相对有回报的行为; 更特别地,在给定当前行为分布中一 个战略的回报越大,其受到模仿就越多。在本文的 具体情况下,一个战略行为的频数增加当且仅当它 能够提供比式( 11) 所示总体平均更好的支付,那么监

14、 察人员选择认真监察的复制动态方程为: = ( ( superv) 珚) = A( 1 /2) A2 /2 + ( A= ( S + E fD) 。( 7)相应地,存在贿赂条件下监察人员的平均期望支付:珚= A( 1 /2) + ( 1 ) ( S + E fD)= A2 /2 + ( A ( S + E fD) ) + ( S + E fD) 。( 8)最优受贿概率条件下的煤矿平安 E ( S fD) ) + ( S fD + E) = /2( 1) 2( A ( S fD) E) A = /2( 1 ) 2( A 3( S fD) ) A 2E。( 12)监察行为模型及其分析3. 1 最优

15、受贿概率 的博弈模型分析现在考虑不认真执行监察职能的监察人员以 一个最优概率 接受贿赂,也就是说,存在不认 真执行监察职能的监察人员会因为社会环境或道 德等原因拒绝接受贿赂。这时对煤矿贿赂失败要 求有一个清晰说明,即假定只有当煤矿平安出事 以后我们才能知道其是否对监察人员实施了贿赂, 但此时已经没有了盘旋的余地。这就给实施贿赂 行动的煤矿提供了一些选择的时机,其要么对监 察人员实施贿赂不执行平安操作规程,要么执行 操作规程,或者既不执行平安操作规程也不实施 贿赂而是碰运气看其能否被监察人员发现。监察人员不接受贿赂时其博弈支付矩阵见表1,其接受贿赂时的博弈支付矩阵见表 2。由于监 察人员接受贿赂

16、的不确定性与监察人员的决定相 联系,假定不认真执行监察职能的机构以最优的 概率值 0 1 接受贿赂,那么相应的博弈支付就是 表 1 和表2 所示两种行为模式的以权重 的凸组合。相应地,监察人员选择认真执行监察策略时的 期望支付:( superv) = A( 1 /2) + ( 1 ) A( 1 /2)由于式( 12) 方括号中的式子是 的线性方程,因此可能在区间0,1内存在一个平衡点。该点为 NC= 2( A ( S fD) E) / A。( 13)3. 2最优受贿概率 分析假设煤矿平安监察人员的行动能够被不腐败的上级官员监督,并且假设接受贿赂的煤矿平安监察人员被监督的概率随着观察到的行贿煤炭

17、企 业的比例及监察人员受贿倾向的上升而上升。如 果监察人员一旦被发现其接受了贿赂,通常将被 处以惩罚 D E,腐败监察人员因此选择最正确的受 贿概率值 0 1 以优化腐败的期望支付。假设 被监督的监察人员是肯定接受了受贿,因此监察 人员接受贿赂的期望支付E( Corruption)= ( E + S D) p( Monitoring,Bribe) + ( E + S) p( No Monitoring,Bribe) 。 ( 14)将式( 14) 改写为式( 15) :E( Corruption)Bribe) p( Bribe)= ( E+ ( ES D) p( Monitoring |S) p

18、( No Monitoring |( 15)+Bribe) p( Bribe) 。假设接受贿赂的监察人员被监督的概率 k 与其接受腐败的概率成正比,因此受贿的监察人员被监 督的概率= A( 1 /2) 。( 9)p( Monitoring | Bribe)= k( 1 ) 。( 16)同理,监察人员选择不认真执行监察策略时的期望支付:( unsuper) = ( 1 ) ( S fD) + ( S + E fD)这里 0 k 1。根据式( 14) 和( 15) 可以得到相应的式( 17) :E( Corruption)= ( E + S D) k( 1 ) ( 1 = E + ( S fD)

19、。( 10) + ( E + S) 1 k( 1 ) ( 1 ) = ( 1桂 林 理 工大 学 学 报2021 年312 ) ( E + S) Dk( 1 ) 。( 17)= 1 A3 + 2( S fD) 3A2 +2注意到式( 17) 中 ( 1 ) 是监察人员接受贿赂的概率( 即煤矿尝试贿赂监察人员且后者接受了 贿赂) ,相应地( E + S) Dk( 1 ) 那么是监察人 员受贿行为发生时的期望支付。监察人员受贿时其 期望的支付必然是式( 17) 为正。监察人员的最优行为就是在约束条件 0 1 下最大化式( 17) 的值。由于式( 17) 是 的二次函 数,因此当一个最优解 * 存在

20、时,根据最大值存在时的最优条件,那么有2 A ( S fD) ( E + S) 。( 21)2DK用式( 21) 对 求一阶导数可得如下所示的式( 22) ,其可反映复制动态方程在平衡点的稳定性:3 A2=+ ( 2S 2fD 3A) +2 A ( S fD) ( E + S) 2。( 22)2DK用式( 21) 对 求该公式二阶导数可得式( 23) :* ( ) = ( E + S) /2Dk( 1 ) 。( 18)2 = 3A + ( 2S 2fD 3A) 。( 23)由式( 18) 注意到 * 本身依赖于 ,也就是说,监察人员接受贿赂的倾向与其不执行监察职能相 适应,也就是说与相应的社会

21、环境相关。更准确地 说,当 趋向于 1 时( 即监察人员接受贿赂的概率趋 向于零并且其受到监督的概率趋向于零) ,受贿的 监察人员可以没有约束地增加其受贿的倾向。显然 * 是具有一定限制条件的,也就是说,有 一个足够大的 对应这个解。相应地,通过式( 18) 可以解出这个关键的 值2由假设( S fD) A 可知,该方程一阶导数在2点 = 0 的值为 A ( S fD) E + S =2DK 0,当 0 时,由此可知,复制动态方程在 = 02是稳定的 复制动态方程的二阶导数 当 0。2时,二阶导数小于 0。因此,由此可知复制动态方程在 = 0 附近为向上的凸函数。为分析复制动态方程在区间( 0

22、,1) 中的平衡点*= 1 ( E + S) / ( 2Dk) 。( 19)由式( 19) 可知,当( E + S) / ( 2Dk) 1 时,有 02是否稳定,这里假设: B = ( S fD) ,C = ( E + S)* 1; 而且当 Dk 时有 * 1,即意味着。2DK上级的监督力度为无限大时,监察人员都不得不去认真执行监察职能工作。相应地,* 可以改写成式( 20) :因此,式( 21) 所示 可以转化为式( 24) :1 A2 + ( 2B 3A) + ( A B C) 。 ( 24)=2上式中大括号内的式子可以视为 的方程。该( E + S), 当 * ;* ( )2Dk( 1

23、)( 20)=式的判别式为式( 25) :当 *1,。= ( 2B 3A) 2 4A( A B C)= 4B2 + 5A2 8AB + 4AC= 4( A B) 2 + A2 + AC A2 0。( 25)由式( 20) 可知,随 Dk 的增加,* 的值将逐渐减少,即监察人员受贿的概率减少。相应地,将式( 20) 代入式( 16) ,监察人员接受 贿赂的概率( 1 ) * ( ) 在 * 时是恒定的, 即( 1 ) * ( ) = ( E + S) / ( 2Dk) 。对于这个范围 内的 值,接受贿赂的监察人员的期望支付为( E +S) 2 / ( 4Dk) 。此时意味着监察人员的腐败期望支付

24、 与上级官员的监察力度成反比。因此式( 22) 有 2 个解,如式( 26)所示:= ( 3A 2B += ( 3A 2B ) /2A;( 26a)( 26b)槡1) /2A。槡2又因为 A B,所以有3 A 2 B + 槡3 A 2 B + A2 A最优受贿概率 条件下的稳定点分析将式( 12) 中恒定概率替换成最优受贿概率 * ( ) 那么可以得式( 21) ,其为在最优受贿概率下的 动态复制方程:= 2A = 1。3. 312A2A( 27)由 = ( 2B 3A) 2 4A( A B C) 可知: ( 2B 3A) 2 ,因此有 因此有式( 28) := ( 3A 2B ) /2A 0

25、,槡21 ( 1 ) 2( A ( S fD) )( E + S)2 = A 2Dk( 1 )第 2 期黄定轩等: 一类特殊变异煤矿平安监察行为进化博弈分析313比拟多,如何使我国煤矿平安监察行为尽快到达良性循环的状态是大家共同关心的问题,以进化 博弈方法去研究煤矿平安监察有着很好的理论发 展前景,同时对政策研究也很有参考价值。3A 2B 2( A B) 13A 2B 槡2= 2 。2A2A( 28)因此有 0 2 1 /2,由上述分析可知,复制动 态方程在区间0,* ) 有 2 个平衡点,但只有点 =0 是稳定的。当 * 时,方程转变为受贿概率为 1的情形,即式( 12) 变为式( 29)

26、: = ( ( superv) 珚)参考文献:1 付茂林,刘朝明 煤矿平安监察进化博弈分析 J 系统管理学报,2007,16 ( 5) :579 5842 付茂林,黄定轩 存在腐败的煤矿平安监察进化博弈分析 J 中国煤矿,2006,32 ( 8) :67 71= ( 1 ) ( 2( A ( S fD) ) A) 2E/2。( 29)3 付茂林,郭红玲 贿赂概率恒定条件下的煤矿平安监察行为进化博弈分析 J 生产力研究,2021 ( 12 ) :594 Schmidt C Are evolutionary games another way of thinking a- bout game th

27、eory J Journal of Evolutionary Economics,2004,14 ( 2) : 249 2625 Lewontin R C Evolution and the theory of games J Jour- nal of Theoretical Biology,1961,1 ( 3) : 382 4036 Hamilton W D The genetical evolution of social behavior,I andIIJ Journal of Theoretical Biology,1964,7 ( 1) : 17 327 Smith J M, Pr

28、ice G R The logic of animal conflicts J Nature,1973,246 ( 5427) : 15 188 Smith J M The theory of games and the evolution of animal conflicts J Journal of Theoretical Biology, 1974, 47 ( 1) : 209 2219 Gilboa J, Matsui A Social stability and equilibrium J Econometrica,1991,59 ( 1) : 859 86810 Boyland

29、R T Laws of large numbers for dynamical systems, with randomly matched individuals J Journal of Economic Theory,1992,57 ( 2) : 473 50411 Young P The evolution of conventions J Econometrica,1993,61 ( 2) : 57 8412 Samuelson L Limit evolutionarily stable strategies in two- player,normal form games J Games and Economic Be- havior,1991,2 ( 1) : 110 12857 对复制动态式( 29) 求导得式( 30) ,该式反映了相应区间的稳定情况:3 A2 + ( 2S + 2E 3A 2fD) +=2= 1 ( 1 2) ( A ( S fD) E)2 A A( 1 ) 。 ( 30)2( A S E + fD)很容易由式( 30) 可知: 在 = 1 时,= ( S +A ,在 EAE fD) ( S fD)时, = 1 是稳22定点,说明如果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论