家用电器故障实时检测_第1页
家用电器故障实时检测_第2页
家用电器故障实时检测_第3页
家用电器故障实时检测_第4页
家用电器故障实时检测_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十届华中地区大学生数学建模邀请赛承诺书我们仔细阅读了第十届华中地区大学生数学建模邀请赛的竞赛细那么。我们完全明白,在竞赛开始后参赛队员不能以任何方式〔包括、电子邮件、网上咨询等〕与队外的任何人〔包括指导教师〕研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规那么的,如果引用别人的成果或其他公开的资料〔包括网上查到的资料〕,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规那么,以保证竞赛的公正、公平性。如有违反竞赛规那么的行为,我们将受到严肃处理。我们的参赛报名号为:参赛队员(签名):队员1:队员2:队员3:湖北省工业与应用数学学会第十届华中地区大学生数学建模邀请赛组委会第十届华中地区大学生数学建模邀请赛编号专用页选择的题号:参赛的编号:〔以下内容参赛队伍不需要填写〕竞赛评阅编号:第十届华中地区大学生数学建模邀请赛题目:家用电器故障实时检测【摘要】本文就家用电器的故障问题,根据传感器的异常数据,对其提出了一种实时检测的方案。对于问题一,我们在查阅了相关资料后,首先分析了异常数据的来源,并将其分为两类,一类是粗大误差或者无意义误差〔如测量仪器存在的不精确性、外界环境的干扰等〕;另一方面是有意义误差,主要是数据来源异常。然后我们对检测异常数据的意义进行了阐述,再选用了DouglasHawkins的异常定义对其进行了本质上的解释,最后总结了检测并剔除〔主要为无意义〕异常数据的方法。对于问题二,由于数据庞大,所以可以利用不同参数之间的相关性情况对数据进行筛选,从而简化模型。由于是实时检测,所以我们先去掉不随时间变化的参数,再去掉非数值类参数,用SPSS对余下参数做降维处理,选出最影响结果的参数,分别为A2、A3、A4、A5、A6、A7,对这6个参数作相关性分析,发现它们存在相关关系,适合做故障分析。于是有如下方程:

K其中Ki为非故障系数,当Ki大于标准距离时,我们认为数据故障;反之对于问题三,将工作环境C〔正常〕和工作环境C〔有故障〕的数据带入之后,我们发现问题二中建立的模型失效了,说明根据附件一所建立的模型并不适用于附件二。我们认为产生这种现象的原因是正常圆的半径取得过大,导致一局部偏离幅度不大的异常数据被我们包含在了正常范围之内。于是我们对作为标准的六个参数的异常程度进行了加权处理,在修改了模型之后,该模型对于工作环境A、B、C均适用,于是我们认为这样的修改是合理的。用修改后的模型进行验证,我们判断工作环境D、E均正常。对于问题四,由于在筛选数据过程中舍弃了很多异常数据,所以可能会出现误判,且更易出现将故障判断为正常的情况,这种情况更应该防止。可以参加异常数据的平均值这一影响因子提高模型准确度。对于问题五,在问题二的解答过程中,我们发现,有的参数对于故障判断的影响程度几乎可以忽略不计,所以我们可以通过筛除这些参数来到达简化计算的目的。同时我们在测量数据时不需要每分每秒都进行检测,可以设计一个测量时间体系,以到达减少电器控制的负担。【关键词】outlier格拉布斯准那么相关性检验spss一、问题重述家用电器是日常生活中不可或缺的一份子,但是时长日久,电器的老化会使其工作能力弱化。电器老化的原因有很多种,我们无法防止它的老化,但当使用者开始对其进行维修时,一般来讲电器的损伤已经无法逆转。为了保证用户的体验效果,现需要一种能够对电器运行状况进行实时监测并判别的方法来解决该问题。现有某家电公司提供的经过脱敏处理后的某种电器运行数据,请你根据已有数据,并结合自己所掌握的知识,利用数学建模的方法来解决以下问题:问题一:电器在情况多变的环境下工作时,有可能会使得传感器读取到异常数据,请对此给出你的解决方案。问题二:由附件一中的数据,请分析不同参数之间的相关性以及其对故障判别的重要程度。结合你之前解决方案,建立一个该电器的故障判别模型并对附件一中的数据进行判别。问题三:请问你根据附件一的数据所建立的模型,是否依然适用于附件二中的数据?如果不适用,请给出你的修正方案。将你的模型修正后,请尝试着判断附件三中的数据,判断其状态为正常或故障〔附件三中的数据标签已隐藏,你的判断结果将作为评奖时的参考〕。问题四:当你的模型出现错误判断时,将正常判断为故障和将故障判断为正常这两种错误,哪一种更应该防止?能不能在模型中嵌入一个影响因子来解决这个问题?如果可以,请给出你的解决方案。问题五:在实际情况中,因家用电器的控制器计算能力比拟低下,所以不能应对计算量特别大的模型。请问你能否在保证判断准确的前提下尽可能地降低计算的复杂程度?如果可以,请给出你的解决方案。二、问题分析2.1问题一的分析传感器读取到异常数据的原因有很多,我们首先要对其进行分类和总结,才能提出解决方案。在此之后,我们阐述了检测异常数据的意义。在总结检测异常数据的方法之前,我们先对异常值〔outlier〕进行了定义,这样才能判断哪些数据属于异常,这里我们选取了统计学家DouglasHawkins的定义。最后根据查找到的资料,我们列举了检测异常数据的方法。2.2问题二的分析由于数据进行了脱敏处理,我们无法得知数据的具体含义,在对工作环境A〔正常〕、B〔正常〕的总体数据分析后,选择了十六个异常参数,然后对它们进行相关性检验,排除粗大误差之后,最终选取了六个参数作为判断依据。建立模型如下:将工作环境〔正常〕时各项参数平均值所构成的6维向量记为该组正常值的中心点,在二维平面上进行处理后,以距离中心点最远的点和中心点之间的距离的绝对值为半径作圆,至此,圆内包含了所有正常情况的数据点,再将故障环境下工作的样本平均值来观察它是否落在圆内,假设样本落在圆内,那么样本对应的情况为正常情况,否那么就是出现故障。2.3问题三的分析将工作环境C〔正常〕和工作环境C〔有故障〕的数据带入之后,我们发现问题二中建立的模型失效了,说明根据附件一所建立的模型并不适用于附件二。在研究之后,我们发现Ki的系数存在误差,为产生这种现象的原因是正常圆的半径取得过大,由于所取半径为“中心点最远的点和中心点之间的距离的绝对值〞,导致一局部偏离幅度不大的异常数据被我们包含在了正常范围之内。于是我们对作为标准的六个参数的异常程度进行了加权处理,在修改了模型之后,该模型对于工作环境A、B、C均适用,于是我们认为这样的修改是合理的。用修改后的模型进行验证,判断工作环境D、E2.4问题四的分析由于我们在进行异常数据筛选时,去掉了这个时间点的所有异常数据,其中可能有一些有用的数据被我们筛除了,所以必然会出现误判,我们更应该防止将异常数据判断为正常的这一种错误。2.5问题五的分析简化计算的主要方法是减少相关参数,同时我们可以减少计算的次数,即增大计算的时间间隔,到达降低控制器计算压力的目的。三、问题假设1.电器本身合格,出厂时不存在质量问题;2.仪器的读取和传输不存在问题,均为可到达的最精准数值;四、符号说明KiXij五、模型建立与求解5.1问题一的求解异常数据〔outlier〕的来源1〕粗大误差仪器自身的缺陷和外界环境的变化〔如光照、湿度、温度、电磁场等〕产生的误差,其特点为测量结果向一侧偏移,数据按照一定的规律进行变化;需要注意,屡次测量求平均值无法消除仪器误差。数据测量时产生的误差,如读数的精确度、传输错误、操作人员的失误等,这种误差具有偶然性。2〕数据误差这类误差是由于观测对象本身的变化产生的。观测对象出现故障,或者因为环境的周期性变化导致的周期性变化,这些都会使数据出现异常。异常数据的意义粗大误差对我们的分析研究有影响,要尽量防止出现无意义误差,一般将其作为噪点删除。数据误差非常有意义,它揭示了观测对象出现的问题,可以获取到正常数据无法得到的信息,有特殊价值异常数据〔outlier〕的定义关于异常数据的定义有很多,我们这里采用了统计学家DouglasHawkins的定义方式:outlier是在数据集中与众不同的数据,使人们疑心这些数据并非随机偏差,而是产生于完全不同的机制。这种定义被认为是本质性的,且被广泛采用。异常数据的检测对于屡次重复测定的数据,异常数据常用的统计识别与剔除法有拉依达准那么〔3σ准那么)、格拉布斯〔Grubbs〕准那么、肖维勒〔Chauvenet〕准那么、罗马诺夫斯基〔t检验〕准那么。在25≤n≤185的范围内,建议使用格拉布斯准那么〔a=0.01〕来判别可疑数据[[]熊艳艳,吴先球,粗大误差四种判别准那么的[]熊艳艳,吴先球,粗大误差四种判别准那么的比拟和应用,大学物理实验,第23卷第1期:66-68页,2023年2月。[]费业泰,误差理论与数据处理,北京:机械工业出版社,2023年6月。设对某量做屡次等精度独立测量,数据为(x1,xvσ=将数据按大小顺序排列成顺序统计量x(i),格布罗斯导出了gn=xn-xσ及表SEQ表格\*ARABIC1nαnα0.050.010.050.01gg31.151.16112.232.4841.461.49122.282.5551.671.75132.332.6161.821.94142.372.6671.942.10152.412.7082.032.22202.562.8892.112.32302.743.10102.182.411003.173.59假设认为x(1)可疑,那么g假设认为xn可疑,那么g当g即判别该测得值含有粗大误差,应删除。5.2问题二的模型建立与求解不同参数的相关性在研究相关性之前,我们对数据进行筛选,发现:1〕不管是正常还是故障,把不随时间变化的参数去掉之后,发现A正常相比于A故障少了参数78,B正常相比于B故障少了参数73。在不同的工作环境下,我们的影响参数也会发生变化,为简化步骤,现在只考虑他们之间共同的影响参数。我们选出可能的影响因素为2,3,4,5,6,7,8,9,10,18,60,72,74,75,78,83这些参数。2〕用spss对数据进行分析表SEQ表格\*ARABIC2相关矩阵表3公因子方差A2A3A4A5A6A7A8A9A10初始1.0001.0001.0001.0001.0001.0001.0001.0001.000提取0.9890.9220.9590.9870.9860.8640.9150.9300.913A18A60A72A74A75A78A80A83初始1.0001.0001.0001.0001.0001.0001.0001.000提取0.9830.9660.9510.9980.9980.9280.9750.894从表3中可以看出变量的共同度较高,变量中大局部信息都能被因子提取,因子的分析效果有效。图4碎石图从图4中我们可以看出前面6个因子都处在陡峭的斜率上,第8个因子变缓,因此我们选择前6个参数即参数2,3,4,5,6,7来作为主成分进行分析。下面分析这6个参数的相关性,如表5所示。表5选取的6个参数的相关矩阵表6KMO和Bartlett检验表中数据第一行接近1,第四行的数据小于0.05,说明选取的参数之间存在相关关系,即适合做因子分析。故障判别模型1〕模型的建立现在的系统中包含6个参数,这6个参数可以看成是一个6维向量〔即6维空间〕中的一点。为了对样本进行分类,现在引进故障系数这一概念:故障系数为1-Ki2〕模型的求解首先,通过故障范围的公式,得出给定样本中正常者的数据,在6维欧式空间里描绘出相应的点,我们将将工作环境〔正常〕时各项参数平均值所构成的6维向量记为该组正常值的中心点,在二维平面上进行处理后,以距离中心点最远的点和中心点之间的距离的绝对值为半径作圆,至此,圆内包含了所有正常情况的数据点,再将故障环境下工作的样本平均值来观察它是否落在圆内,假设样本落在圆内,那么样本对应的情况为正常情况,否那么就是出现故障。为说明该模型的正确性,我们利用附件一中的两个不同的工作环境A,B的正常与故障所给的数据进行运算,在进行模型分析前,我们首先咬碎实验数据进行选择,通过Excel软件去除异常数据,最后用spss对A,B所得的分析结果如下:表7工作环境A〔正常〕的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23441010.160.0060.3680.1361.8370.0421.3750.083参数334410700.36421.37521.375456.8802.0230.0422.3330.083参数4344109005.608328.987328.987108232.4921.8520.0421.4430.083参数5344109284.453261.205261.20568228.2740.1440.0422.9920.083参数634411501830.40823.94523.945573.3720.7620.0427.5390.083参数734412401440.97957.41357.4133296.232-0.1110.042-1.9140.083有效的N〔列表状态〕3441离散点的中心点为〔0.16,9.11,14.03,108.82,249.90,305.03〕,我们所做的圆的半径为4.24。当点到中心的距离大于4.24时,我们可以认为它是异常数据。表8工作环境A〔有故障〕的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23239023231.670.71740.8011664.71956.9100.0433238.8360.086参数3323906628.720.44525.308640.4871.0430.0433238.8360.086参数432390900544.897.707438.621192388.183-0.4340.043-1.6720.086参数532390352113.392.181124.12915407.9600.7010.043-1.8070.086参数632390333288.350.98355.9483130.184-1.9970.043-0.9420.086参数732390380310.310.75643.0531853.571-0.8270.0430.4000.086有效的N〔列表状态〕3239我们得到的点为〔1.67,28.72,544.89,113.39,288.35,310.31〕,经过计算发现该点与我们的中心点距离是5.01,不在我们所描述的范围内,故该模型有一定的正确性。表9工作环境B〔正常〕的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23586010.540.0080.4990.249-0.1470.041-1.9800.082参数3358606620.070.35020.963439.4310.3760.041-1.2370.082参数435860900466.907.497448.963202367.899-0.0760.041-1.9920.082参数535860992289.035.093304.96693004.1390.4220.041-1.1230.082参数635864329313.780.42825.651657.968-4.1840.04119.6650.082参数735860380346.480.23413.999195.974-4.2290.041103.2690.082有效的N〔列表状态〕3586离散点的中心点为〔0.54,20.07,466.90,289.03,313.78,246.68〕,我们所做的圆的半径为8.15。当点到中心的距离大于8.15时,我们可以认为它是异常数据。表10工作环境B〔有故障〕的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23456010.570.0080.4950.245-0.2830.042-1.9210.083参数334560600.3690.36921.686470.2721.1550.042-0.3080.083参数4345609007.1637.163421.086177313.6080.7130.042-1.4810.083参数5345603201.8501.850108.74611825.7011.2610.042-0.0120.083参数6345604000.9570.95752.27830167.1950.8050.0423.4140.083参数734563043620.1500.1508.81677.7181.3080.0422.3870.083有效的N〔列表状态〕3456我们得到的点为〔0.57,13.65,298.18,65.87,263.17,324.62〕,经过计算发现该点与我们的中心点距离是375.11,不在我们所描述的范围内,故该模型有一定的正确性。3〕结果分析该模型进过验证有较高的准确性,从以上过程能看到,通过引进故障范围的这个方法来判断一个电器是否故障准确率还是比拟高的,说明此方法确实可行.通过此方法得到了大量数据的验证,但是故障判别的模型没有理论依据,也许这只是数据上的重合,要想结果更加具有说服力,还得需要很多不同工作情况下的大量数据来进行验证。5.3问题三的求解是否适用于附件二表11工作环境C〔正常〕的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数23468010.510.0080.5000.250-0.0220.042-2.0010.083参数3346805716.630.31818.740351.1930.5080.042-1.1530.083参数434680900426.047.619448.675202309.1330.1060.042-1.9870.083参数534680832232.244.537267.15571371.9600.6000.042-0.9510.083参数63468180333315.010.40623.893570.873-4.2710.04217.9420.083参数73468320360346.970.18210.746115.482-0.4350.042-1.4020.083有效的N〔列表状态〕3468离散点的中心点为〔0.5,16.03,426.04,3.24,315.01,346.97〕,我们所做的圆的半径为7.69。当点到中心的距离大于7.69时,我们可以认为它是异常数据。表12工作环境C〔有故障〕的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数229851010.400.0090.4900.2400.4070.045-1.836参数329856606613.530.41922.865522.8031.2270.045-0.211参数429859000900262.617.445406.757165451.6150.9120.045-1.156参数52985352035271.032.265123.76315317.3911.2950.045-0.069参数629853330333293.500.72539.6361570.996-3.4760.04518.085参数7298580300380327.610.25814.087198.4443.0090.0458.255有效的N〔列表状态〕2985我们选取的平均值点是〔0.40,13.56,262.31,71.03,293.50,327.61〕他与中心点的距离是1.83,小于我们所选取的圆的半径,故我们呢在上面所建立的模型并不适用于附件二的数据。修改模型为什么会出现这样的情况呢?我们初步的想法是我们对于圆的半径的选择上出现了问题。我们在之前的考虑中,想的是将正常情况下所有的样本数据有包含在一个以中心点为圆心的圆内。虽然我们在进行验证时去掉了一局部的相对异常的数据,但是对于那些偏离幅度不大的数据我们还将之发在试验数据中,所以我们在选择实验数据时比更不需要将所有的点都包含进去,大局部在里面就行。所以我们将对圆的半径的求取按照我们每个参数对故障系数的影响程度来进行一个比例划分〔表13〕。表13解释的总方差判断附件三根据以上改良我么所求的C环境下的非故障的圆的半径是1.26.满足我们定下的要求。同时我们也将这个代入进A,B这两个工作环境中去验证也是符合定义的。判断附件三中的两个工作环境表14工作环境D的描述统计量N极小值极大值均值标准差方差偏度峰度统计量统计量统计量统计量标准误统计量统计量统计量标准误统计量标准误参数2175723221232377.659.900414.978172206.4965.2320.05825.403参数317576006028.910.61425.729661.961-0.1230.058-1.797参数4175790000900561.4110.311432.219186813.041-0.5180.058-1.717参数517572880288133.282.992125.43215733.290-0.0230.058-1.844参数6175731122333254.681.37357.5553312.543-0.1150.058-0.515参数7175748304352328.910.25710.775116.091-0.6570.058-0.217有效的N〔列表状态〕1757离散点的中心点为〔77.65,28.91,561.41,133.28,254.68,328.91〕,我们所做的圆的半径为3.12。当点到中心的距离大于3.12时,我们可以认为它是异常数据。表15我们可以从图中看到这个参数随时间的变化,除了参数2在一段时间内发现了较大的变化,其他的因素在这些时间点的呈周期性的变化。参数二对判断故障程度的影响为53.093%。虽然参数二对其影

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论