下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 基于apriori算法及方差分析的电力故障原因相关度分析 中图分类号:tp391 文献标识码:a0.引言电力系统在空间上的广域分布,导致电力事故的发生是不可避免的,事故数据的收集、分析很难全面、系统地进行。分析2003年2015年中国南方电网电力生产事故,目前同类事故重复现象比较普遍。采用故障树分析法无法确定导致事故发生的上下级原因之间的相关度,不能确定主要的事故防范措施;另一方面,故障树分析法缺乏对事故分析结果的系统应用,要想全面查找到各个根本原因间的逻辑关系,十分困难,不能建立多方面、多维度防范措施,无法真正达到事故预防目的。利用基于apriori算法及方差分析的故障树上下级原因相关度分
2、析方法,分析事故上下级原因的相关度可以有针对性地对事故进行防范,降低事故发生概率,减少事故的发生。apriori算法是一种最有影响的挖掘布尔关联规则频繁项集合的算法。apriori算法通过查找事务数据库中所有支持度大于最小支持度的频繁项集。将apriori算法利用于事故树上下级原因分析,得出的频繁项集合的支持度便是事故树上下级原因之间的相关度,此时最小支持度应该设定为零;另外,apriori算法还可以在频繁项集合中产生所有大于等于最小可信度的关联规则,即可分析同级原因的关联规则。对于电网发生的电力事故来说,在某一个确定的时间段上,电力安全生产管理水平是趋于一个稳定的程度,则对应的电力生产事故发
3、生的可能性也是趋于一个确定的值。因此,在一个确定的时间段内发生的电力生产事故的次数服从正态分布,也就是说在这段时间内导致电力生产事故发生的直接原因事件出现的次数成正态分布。方差分析法是一种常用的统计方法,方差分析就是将总的方差分解为各个方差的成分,然后利用显著性检验法进行分析判断和做出适当的结论。对需要进行分析的因素进行方差分析,若分析结果落入拒绝域,说明下级因素对上级因素没有显著影响;若分析结果落在拒绝域外,则说明有显著的影响。分析得出存在显著影响的因素,可以针对性地对事故进行防范,降低事故发生的概率。1. apriori算法1.1 概述apriori算法是一种以概率为基础的具有影响的挖掘布
4、尔型关联规则频繁项集合的算法。同时,apriori算法是第一个关联规则挖掘算法,也是最为经典的算法。apriori算法利用逐步检索的迭代方法寻找出某数据库中项集合的密切联系,通过这种密切联系来形成规则。apriori算法中包含了几个重要的概念,其中项集(itemset)就是项的集合,包含k个项的集合为k项集;项集合出现的频率表示在某数据库中,包含项集合的个数,称为项集合的频率。通过制定的最小支持度,如若某项集合满足最小支持度,则称它为频繁项集。apriori算法是一个基于频集理论递推的方法,它利用“频繁项集的所有非空子集必定是频繁的,非频繁项集的所有超级必定是非频繁的”这一性质来实现。其根本原
5、理是:通过查找数据库中的所有数据项,从而得到一个大项集l1,如果大项集l1为非空,根据此大项集得到一个候选项集合c1,然后对该数据库中的每一个数据项数据项t,求出t在c1中的全部子集ct。子集ct中的每一个的候选项集c,令c加l。当扫描该数据库一遍后,筛选出候选项集合c1中所有计数大于或等于最小支持度的项集组成频繁项集合。1.2 apriori算法步骤apriori算法的挖掘任务分为以下问题:(1)找出某数据库中所有支持度大于或等于最小支持度的候选项集。具有最小支持度的候选项集称为频繁项目集。(2)在频繁项集合中产生所有大于等于最小可信度的关联规则。1.2.1 具体步骤首先确定在该数据下的最小
6、支持度。apriori算法采用了候选项集合的概念,通过查找数据库中的所有数据项,得到一个大项集l1,根据大项集得到候选项集,若候选项集的支持度大于或等于最小支持度,则该项集合为频繁项集合(large itemset)。此支持度为频繁项集合的概率。假设一个简单事务数据库d的模型,数据库d的数据如图1所示的事故树。分别求取一级原因a、b、c与事故之间的关联程度,二级原因a1、b1、c1分别与一级原因a、b、c的关联程度,三级原因a11、b11、b12、c11分别与二级原因a1、b1、c1的关联程度,四级原因b111与三级原因b11的关联程度,须从数据库中计及事故的次数以及各原因的次数。表1中:00
7、1010代表10个电网事故故障树编号,a、b、c、d、e分别代表事故一级原因。若要求取一级原因与事故之间的额关联程度首先通过扫描数据库d,生成项集,见表2。其次利用apriori算法对数据库中的项集进行扫描,计数每个项集在数据库中的次数,即在每一次迭代过程中,apriori算法都产生了一个大项集,然后计算每一个候选项集所出现的次数,最后在预先给定的最小支持度s=0%的基础上确定大项集。对上表所示的各个项集进行计数,通过扫描数据库d中的数据得出表3所示的计数次数并求出其支持度。 由于某种事故原因导致事故发生是存在可能性的,尽管有些导致事故发生的概率很小,但是最终却不可避免,所以在此设定最小支持度
8、为s=0%,即出现的事故原因都应该纳入考虑范围。发掘大项集,也就是支持度大于预先给定的最小支持度的项的集合。在第一次迭代的第一步中,所有单个项都作为候选集。接着计算每一个候选集的出现次数,然后在最小支持度s的基础上选择频繁项集。表3所示的s分别代表该项集的支持度即上下级原因之间的相关程度。1.2.2具体实例分析某110kv八所站1#主变因遭受雷击,造成中压侧b相线圈损坏示例,其故障树如图2所示。由上述事故树分析得出该事故是由一级原因环境因素、物的因素-物理性危险和有害因素,二级原因自然因素、制造质量不良、设备缺陷、规划设计不周和三级原因雷击、工艺缺陷、绝缘不良、绝缘配合不当引起的。利用apri
9、ori算法对20032015年2046个事故树进行扫描计数,统计到以上原因的次数和最小支持度见表4。如图3所示,相关度的计算结果在事故树模型的基础上表示出来,可以直观地看到各级故障原因之间的相关程度。通过进一步的计算便可以得出底层原因对该次事故的影响程度。2.方差分析在实际问题的研究过程中,影响某一事物的因素往往很多。其中每一个因素的改变都有可能影响产品的数量和质量,并且有些因素影响大,有些因素影响小,所以要找出对产品数量和质量影响显著的那些因素。方差分析是检验各因素对实验结果影响程度的一种有效方法。方差分析又称“变异数分析”或“f检验”。多元方差分析要求样本须满足3个基本条件:(1)抽样样本
10、是从母体中随机选取;(2)样本必须服从正态分布并且样本相互独立,(3)在各种处理条件下的样本方差必须相同,也就是必须满足方差齐性。对于一个企业或者一个行业来说,在某一个确定的时间段上,安全生产管理水平是趋于一个稳定的程度,某一稳定的值,则对应的事故发生的可能性也是趋于某一个稳定程度和某一个确定的值。因此,在一个确定的时间段内发生的电力生产事故的事故原因次数服从正态分布,也就是说在这段时间导致事故发生的直接原因事件出现的次数成正态分布。考虑电力事故下的各级事故原因是多因素影响下的,利用多元方差分析对下级原因对上级原因的影响程度作为一个研究母体。2.1 数学模型电力生产事故是一种由于人、物、环境等
11、的因素失去控制或错误引起的意外事件,可以认为是系统正常过程中出现的各类异常或者是所不期望的效应,或是某些计划好的事情没有按照计划本身执行,出现在计划外的偏差。而在理想情况下,事故是不会发生的,由于在人、物、环境和管理4种情况下差生偏差,事故就显然发生了。将某一段确定时间内、特定范围内发生的所有电力生产事故事故原因集合在一起作为母体,即将导致这段时间、这个特定范围内事故发生的原因事件作为母体,不同级的事故原因作为影响因子。结合对事故原因特点的统计分析,假设在各种的影响因子组合水平下的样本方差相同,满足方差分析的条件后,建立多元方差分析模型进行事故原因统计分析。2.2 统计分析每个事故考虑下级原因
12、对上级原因的影响程度,把上级原因所对应的所有下级原因作为影响因子,将事故下级原因发生对相应的上级原因发生的影响关联程度假设为一级相关和二级相关,以a、b、c代表不同的下级原因,用1,2代表一级相关和二级相关,得到表5的所示的结果.。2.3 模型统计结果计算分析根据伤亡事故原因统计的特点,假定母体yn服从正态分布n(ijk,2),其中式(1)中,ai,bj,ck分别表示下级原因a、b、c在各自对应水平上的效应。其中效应表示一个下级原因在某种水平上对母体平均数的影响程度。事故次数对应的数学模型如式(2)。在公式(2)中,表示母体平均数,ijk是组合内部yn因2引起的抽样误差。公式(2)须满足3个约
13、束条件,即:a1+a2=0,b1+b2=0,c1+c2=0。(1)假设条件假设3个下级原因中任意两个原因之间没有任何交互作用,为了检验下级原因a、下级原因b和下级原因c三种影响因子对母体所产生的效应,则需要进行影响效应的显著性分析。假设的条件有以下3个:假设h1:a1=a2=0假设h2:b1=b2=0假设h3:c1=c2=0其中a1、a2代表下级原因a在各自水平上的效应。若假设h1成立,则表示下级原因a在这一段时间内对上级原因的发生无显著影响;否则,下级原因a在这一段时间内对上级原因的发生有显著影响。同样,假设h2和h3成立,则分别表示下级原因b和下级原因c在这一段时间内对上级原因的发生无显著
14、影响,否则,分别表示下级原因b和下级原因c在这一段时间内对上级原因的发生有显著影响。(2)计算平均数计算总平均数电力生产事故发生总平均数在某一段时间内、某特定范围内导致电力生产事故发生的直接原因事件出现的基本情况,用表示。计算各原因分水平平均值下级原因a、下级原因b和下级原因c三个影响因子分别在一级相关和二级相关两种水平上有其对应的平均值,反映一个原因在对应各种水平上导致上级原因发生的平均次数。对于下级原因a来说,其两种水平上的平均值分别用k1a和k2a表示。同样,对于下级原因b因素和下级原因c来说,其在两种水平的平均值分别用k1b 、k2b 和k1c 、k2c 表示。2.4 计算离差平方和离
15、差平方和反映下级原因a、下级原因b和下级原因c三种影响因子对平均上级原因发生次数的离散程度,用qt表示。 式(10)可以进行分解:其中:qa是下级原因a引起的离差平方和;qb是下级原因b引起的离差平方和;qc是下级原因c引起的离差平方和;qe表示误差的大小。下级原因a引起的离差平方和qa反映了下级原因a在两种相关水平上的平均值之间的差异;同理,qb和qc分别反映了下级原因b和下级原因c在不同的两种相关水平上平均值之间的差异。2.5 判别量计算(1)首先确定自由度自由度等于水平减1,即qa、qb、qc的自由度都为1,qt的自由度为7。(2)f值计算利用分解定理可知,fa、fb、fc均服从自由度为
16、(1,4)的f分布。其中sa2 、sb2 和sc2 分别是由下级原因a、下级原因b和下级原因c引起的均方离差,也就是指均方误差。2.6 假设检验为了验证3个假设h1、h2和h3是否成立,首先需要给定显著水平,通过查询f分布上侧分位数表,从表中得出与显著水平相同自由度对应的f值,使得pff=成立。根据计算得到fa,如果存在faf(1,4),则该数值表示小概率事件,则拒绝假设h1,即认为这一段时间内、特定范围内下级原因a对所对应的上级原因的发生有显著贡献;如果存在fa同样,根据计算得到的fb、fc值,如果存在fbf(1,4)、fcf(1,4),则该数值表示小概率事件,则分别拒绝假设h2和h3,即认
17、为这一段时间内、特定范围内下级原因b或下级原因c对所对应的上级原因的发生有显著贡献;如果存在fb3. 实例统计分析3.1 基础统计量统计为了验证模型的实际可操作性,对中国南方电网自2003年2015年期间发生的2046起电力生产事故按照本文建立的模型进行统计分析,其中上级原因(一级原因)环境因素出现的次数为855次,下级原因(二级原因)自然因素、生产环境不良、外力破坏分别出现的次数为557、68、338次,以其中某一年的54次为例,所对应的二级原因自然因素、生产环境不良、外力破坏(分别用a、b、c表示自然因素、生产环境不良、外力破坏)引起一级原因环境因素出现的次数见表6。3.2 方差分析表根据建立的模型,通过计算公式计算得到的数值,采用表格的形式给出,即得到表7的多元方差分析表。3.3 统计结果分析假设给定的显著水平=0.1,查询f分布上侧分位数表可知:f0.1(1,4)=4.54。根据表3得到的fa和f0.1(1,4)相比较:存在faf0.1(1,4)=4.54,因此拒绝假设h1,即认为二级因素a对一级原因有显著影响。同样,将fb、fc与f0.1(1,4)比较:存在fb结论利用基于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 110发配电课程设计
- 地板的密铺课件
- 2024年天津市宝坻一中高三12月考-地理试卷
- 【大学课件】管理研究方法
- 世界粮食日珍惜节约粮食主题144
- 力的探究教学模板
- 保险业务知识培训课件讲解
- 《施工组织举例》课件
- 《语文中国古代刑法》课件
- 吉林新型防火电缆施工方案
- GB/T 16717-1996包装容器重型瓦楞纸箱
- 机械制图之平面投影
- 2023年杨家小学音体美测查方案范文
- 《食品包装学(第三版)》教学PPT课件整套电子讲义
- MISSILE-DATCOM使用教程课件
- 高校毕业生就业推荐表模板
- 网络搭建综合知识试题与答案
- Differences-between-Chinese-and-British-Tea-Culture中英茶文化差异论文
- (完整版)office办公软件上机操作练习题
- 天然气长输管道安全事故应急演练脚本
- 电机端盖的机械加工工艺工装设计毕业论文
评论
0/150
提交评论