电气测试技术课件:粗大误差与数据处理_第1页
电气测试技术课件:粗大误差与数据处理_第2页
电气测试技术课件:粗大误差与数据处理_第3页
电气测试技术课件:粗大误差与数据处理_第4页
电气测试技术课件:粗大误差与数据处理_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

电气测试技术

误差分析与数据处理粗大误差与数据处理在一系列重复测量数据中,如有个别数据与其它的有明显差异,则它(或它们)很可能含有粗大误差(简称粗差),称其为可疑数据,记为。根据随机误差理论,出现大误差的概率虽然小,但也是可能的。因此,如果不恰当剔除含大误差的数据,会造成测量精密度偏高的假象。反之如果对混有粗大误差的数据,即异常值,未加剔除,必然会造成测量精密度偏低的后果。以上两种情况还都严重影响对的估计。因此,对数据中异常值的正确判断与处理,是获得客观的测量结果的一个重要方法。一、粗大误差产生的原因产生粗大误差的原因是多方面的,大致可归纳为:

①测量人员的主观原因

②客观外界条件的原因测量者工作责任感不强、工作过于疲劳、缺乏经验操作不当,或在测量时不小心、不耐心、不仔细等,造成错误的读书或记录。测量条件意外地改变(如机械冲击、外界振动、电磁干扰等)。2二、判别粗大误差的准则在测量完成后也不能确知数据中是否含有粗大误差,这时可采用统计的方法进行判别。统计法的基本思想是:给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就认为它不属于偶然误差的范围,而是粗大误差,该数据应予以剔除。

(一)准则准则是最常用也是最简单的判别粗大误差的准则,它是以测量次数充分大为前提,但通常测量次数比较少,因此该准则只是一个近似的准则。实际测量中,常以贝塞尔公式算得,以代替真值。对某个可疑数据,若其残差满足:(2-90)

则可认为该数据含有粗大误差,应予以剔除。3

利用贝塞尔公式容易说明:在n≤10的情形,用准则剔除粗误差注定失败。为此,在测量次数较少时,最好不要选用准则。下表是准则的“弃真”概率,从表中看出准则犯“弃真”错误的概率随n的增大而减小,最后稳定于0.3%。

例2-18

对某量进行15次等精度测量,测得值如下表2-11所列,设这些测得值已消除了系统误差,试判别该测量列中是否含有粗大误差的测得值。

表准则“弃真”概率an11 1661121333a0.0190.0110.0050.0040.003

序号12345678910111213141520.4220.4320.4020.4320.4220.4320.3920.3020.4020.4320.4220.4120.3920.3920.40+0.016+0.026-0.004+0.026+0.016+0.026-0.014-0.104-0.004+0.026+0.016+0.006-0.014-0.014-0.0040.0002560.0006760.0000160.0006760.0002560.0006760.0001960.0108160.0000160.0006760.0002560.0000360.0001960.0001960.000016+0.009+0.019-0.011+0.019+0.009+0.019-0.021——-0.011+0.019+0.009-0.001-0.021-0.021-0.0110.0000810.0003610.0001210.0003610.0000810.0003610.000441——0.0001210.0003610.0000810.0000010.0004410.0004410.0001214由表2-11可得根据准则,第八测得值的残余误差为:即它含有粗大误差,故将此测得值剔除。再根据剩下的14个测得值重新计算,得:

由表2-11知,剩下的14个测得值的残余误差均满足,故可以认为这些测得值不再含有粗大误差。(二)格拉布斯准则

1950年格拉布斯(Grubbs)根据顺序统计量的某种分布规律提出一种判别粗大误差的准则。1974年我国有人用电子计算机做过统计模拟试验与其它5几个准则相比,对样本中仅混入一个异常值的情况,用格拉布斯准则检验的功率最高。设对某量作多次等精度独立测量,得,当服从正态分布时,计算得

为了检验中是否含有粗大误差,将按大小顺序排列成顺序统计量,而格拉布斯导出了及的分布,取定显著度(一般为0.05或0.01),可得如表2-12所列的临界值,而

及若认为可疑,则有6若认为可疑,则有当(2-91)

即判别该测得值含有粗大误差,应予剔除。例2-19

用例2-18测得值,试判别该测量列中的测得值是否含有粗大误差。解:由表2-11计算得:,0.050.010.050.013456789101112131415161.151.461.671.821.942.032.112.182.232.282.332.372.412.441.161.491.751.942.102.222.322.412.482.552.612.662.702.75171819202122232425303540501002.482.502.532.562.582.602.622.642.662.742.812.872.963.172.782.822.852.882.912.942.962.993.013.103.183.243.343.597按测得值的大小,顺序排列得今有两测得值,可怀疑,但由于故应先怀疑是否含有粗大误差,计算查表2-12得则故表2-11中第八个测得值含有粗大误差,应予剔除。剩下的14个数据,再重复上述步骤,判别是否含有粗大误差。解:

故可判别不包含粗大误差,而各皆小于1.18,故可认为其余测得值也不含粗大误差。

8(三)狄克松准则

1950年狄克松(Dixon)提出另一种无需估算和的方法,它是根据测量数据按大小排列后的顺序差来判别是否存在粗大误差。有人指出,用Dixon准则判断样本数据中混有一个以上异常值的情形效果较好。以下介绍一种狄克松双侧检验准则。设正态测量总体的一个样本,将按大小顺序排列成顺序统计量,即构造检验高端异常值和低端异常值的统计量分别为和,分以下几种情形:(2-92)

以上的简记为和。狄克松导出了它们的概率密度函9数,选定显著性水平,查表2-13得临界值。当测量的统计值或大于临界值时,则认为或含有粗大误差。对不同的测量次数,应选用相应的统计量,才能收到良好的效果。统计量统计量0.010.050.010.053456789101112130.9880.8890.7800.6980.6370.6830.6350.5970.6790.6420.6150.3410.7650.6420.5600.5070.5540.5120.4770.5760.5460.5211415161718192021222324250.6410.6160.5950.5770.5610.5470.5350.5240.5140.5050.4970.4890.5460.5250.5070.4900.4750.4620.4500.4400.4300.4210.4130.40610例2-20

同例2-18测量数据,将排成如下表顺序测量。首先判断最大值,因n=15,故按式(2-92)计算统计量:查表2-13得:则故不含有粗大误差。再判别最小值,按式(2-92)计算统计量:

因顺序号顺序号顺序号顺序号20.3020.3920.3920.3920.4020.4020.4020.4112345678——123456720.4220.4220.4220.4320.4320.4320.43910111213141589101112131411故含有粗大误差,应予剔除。剩下14个数据,再重复上述步骤。对于,因n=14,按式(2-92)计算:查表2-13得:则故不含有粗大误差。对,按式(2-92)计算:显然,故不含有粗大误差。(四)罗曼诺夫斯基准则

当测量次数较少时,按t分布的实际误差分布范围来判别粗大误差较为合理。罗曼诺夫斯基准则又称t检验准则,其特点是首先剔除一个可疑的测得值,然后按t分布检验被剔除的值是否是含有粗大误差。设对某量作多次等精度测量,得,若认为测量值为可疑数据,将其剔除后计12算平均值为(计算时不包括):并求得测量列的标准差(计算时不包括):

根据测量次数n和选取的显著度,即可由表2-14查得t分布的检验系数。

K

n0.050.01

K

n0.050.01

K

n0.050.0144.9711.46132.293.23222.142.9153.566.53142.263.17232.132.9063.045.04152.243.12242.122.8872.784.36162.223.08252.112.8682.623.96172.203.04262.102.8592.513.71182.183.01272.102.84102.433.54192.173.00282.092.83112.373.41202.162.95292.092.82122.333.31212.152.93302.082.8113若(2-93)则认为测量值含有粗大误差,剔除是正确的,否则认为不含有粗大误差,应予保留。例2-21

试判断例2-18中是否含有粗大误差。解:首先怀疑第八组测得值含有粗大误差,将其剔除。然后根据剩下的14个测量值计算平均值和标准差,得:

选取显著度,已知n=15,查表2-14得:则因故第八组测量值含有粗大误差,应予剔除。然后对剩下的14个测得值进行判别,可知这些测得值不再含有粗大误差。

14四种粗大误差的判别准则,根据前人的实践经验,建议按如下几点考虑去具体应用:

①大样本情况(n>50)用3σ准则最简单方便,虽然这种判别准则的可靠性不高,但它使用简便,不需要查表,故在要求不高时经常使用;30<n≤50情形,用格拉布斯准则效果较好;3≤n<30情形,用格拉布斯准则适于剔除一个异常值,用狄克逊准则适于剔除一个以上异常值。当测量次数比较小时,也可根据情况采用罗曼诺夫斯基准则。

②在较为精密的实验场合,可以选用二、三种准则同时判断,当一致认为某值应剔除或保留时,则可以放心地加以剔除或保留。当几种方法的判断结果有矛盾时,则应慎重考虑,一般以不剔除为妥。因为留下某个怀疑的数据后算出的σ只是偏大一点,这样较为安全。另外,可以再增添测量次数,以消除或减少它对平均值的影响。15三、防止与消除粗大误差的方法

对粗大误差,除了设法从测量结果中发现和鉴别而加以剔除外,更重要的是要加强测量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论