第二章误差的基本性质与处理_第1页
第二章误差的基本性质与处理_第2页
第二章误差的基本性质与处理_第3页
第二章误差的基本性质与处理_第4页
第二章误差的基本性质与处理_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章

误差的基本性质与处理

本章分别详细阐述随机误差、系统误差、粗大误差三类误差的来源、性质、数据处理的方法以及消除或减小的措施。特别是在随机误差的数据处理中,掌握等精度测量和了解不等精度测量的不同数据处理方法。通过学习本章内容,使学生能够根据不同性质的误差选取正确的数据处理方法并进行合理的数据处理。教学目标三大类误差的特征、性质以及减小各类误差对测量精度影响的措施掌握等精度测量的数据处理方法了解不等精度测量的数据处理方法重点与难点

当对同一测量值进行多次等精度的重复测量时,得到一系列不同的测量值(常称为测量列),每个测量值都含有误差,这些误差的出现没有确定的规律,即前一个数据出现后,不能预测下一个数据的大小和方向。但就误差整体而言,却明显具有某种统计规律。随机误差是由很多暂时未能掌握或不便掌握的微小因素构成,主要有以下几方面:

①测量装置方面的因素

②环境方面的因素

人为方面的因素零部件变形及其不稳定性,信号处理电路的随机噪声等。温度、湿度、气压的变化,光照强度、电磁场变化等。瞄准、读数不稳定,人为操作不当等。第一节随机误差(P9)一、随机误差产生的原因

随机误差的分布可以是正态分布,也有非正态分布。现分析服从正态分布的随机误差的特性。设被测量值的真值为L0,一系列测得值为li,则测量列的随机误差δi可表示为:(2-1)式中。正态分布的分布密度与分布函数为

(2-2)(2-3)

式中:σ—标准差(或均方根误差);e—自然对数的底它的数学期望为(2-4)它的方差为:(2-5)第一节随机误差(P9-P10)二、正态分布

其平均误差为:(2-6)此外,由可解得或然误差为:

(2-7)

由式(2-2)可以推导出随机误差的几个特征:

①由,可知分布具有对称性,即绝对值相等的正误差与负误差出现的次数相等,这称为误差的对称性;

②当δ=0时有,即,可推知单峰性,即绝对值小的误差比绝对值大的误差出现的次数多,这称为误差的单峰性;

③虽然函数f(δ)的存在区间是[-∞,+∞],但实际上,随机误差δ只是出现在一个有限的区间内,即[-kσ,+kσ],称为误差的有界性;

④随着测量次数增加,随机误差的算术平均值趋向于零:这称为误差的补偿性。第一节随机误差(P9-P10)

图2-1为正态分布曲线以及各精度参数在图中的坐标。σ值为曲线上拐点A的横坐标,θ值为曲线右半部面积重心B的横坐标,ρ值的纵坐标线则平分曲线右半部面积。第一节随机误差(P10)

正态分布的随机误差都具有这四个特征:对称性、单峰性、有界性、抵偿性。由于多数随机误差都服从正态分布,因此正态分布在误差理论中占有十分重要的地位。

对某量进行一系列等精度测量时,由于存在随机误差,因此其获得的测量值不完全相同,此时应以算术平均值作为最后的测量结果。

(一)算术平均值的意义设为n次测量所得的值,则算术平均值为:

(2-8)

第一节随机误差(P10)三、算术平均值可以证明:当测量次数无限增加时,算术平均值必然趋近于真值Lo。即

由前面正态分布随机误差的第四特征可知,因此

结论:当测量次数无限增大时,算术平均值(数学上称之为最大或然值)被认为是最接近于真值。但由于实际上都是有限次测量,因此,我们只能把算术平均值近似地作为被测量的真值。第一节随机误差(P10-P11)第一节随机误差

一般情况下,被测量的真值为未知,不可能按式(2-1)求得随机误差,这时可用算术平均值代替被测量的真值进行计算。此时的随机误差称为残余误差,简称残差:(2-9)

可用简便算法求算术平均值。任选一个接近所有测得值的数

作为参考值,计算每个测得值与的差值:(2-10)

按上式求算术平均值比较简单。【例2-1】测量某物理量10次,得到结果见表2-1,求算术平均值。序号123456789101879.641879.691879.601879.691879.571879.621879.641879.651879.641879.65-0.01+0.04-0.05+0.04-0.07-0.03-0.010-0.0100+0.05-0.04+0.05-0.07-0.020+0.010+0.01

第一节随机误差(P11)解:任选参考值=1879.65,计算差值和列于表中,很容易求得算术平均值:=1879.64(mm)(二)算术平均值的计算校核

算术平均值及其残余误差的计算是否正确,可用求得的残余误差代数和来校核。由,式中的是直接计算得到的,当求得的为未经凑整的准确数时,则有:(2-11)残余误差代数和为零这一性质,可用来校核算术平均值及其残余误差计算的正确性。但当实际得到的为经过凑整的非准确数,存在舍入误差Δ,即有:成立。而

第一节随机误差(P11-P12)

分析证明,用残余误差代数和校核算术平均值及其残差,其规则为:

①残差代数和应符合:当,求得的为非凑整的准确数时,为零;当,求得的为非凑整的准确数时,为正,其大小为求时的余数;当,求得的为非凑整的准确数时,为负,其大小为求时的亏数。

②残差代数和绝对值应符合:当n为偶数时,;当n为奇数时,。式中的A为实际求得的算术平均值末位数的一个单位。以上两种校核规则,可根据实际运算情况选择一种进行校核,但大多数情况选用第二种规则可能较方便,它不需要知道所有测得值之和。第一节随机误差(P12)【例2-2】用例2-1数据对计算结果进行校核。解:因n为偶数,A=0.01,由表2-1知故计算结果正确。序号

(mm)

(mm)12345678910112000.072000.052000.092000.062000.082000.072000.062000.052000.082000.062000.07+0.003-0.017+0.023-0.007+0.013+0.003-0.007-0.017+0.013-0.007+0.003

第一节随机误差(P12-P13)【例2-3】测量某直径11次,得到结果如表2-2所示,求算术平均值并进行校核。解:算术平均值为:用第一种规则校核,则有:用第二种规则校核,则有:故用两种规则校核皆说明计算结果正确。第一节随机误差(P13)取=2000.067(mm)(一)均方根误差(标准偏差)σ

为什么用σ来作为评定随机误差的尺度?可以从高斯(正态)分布的分布密度推知:令,则有:

高斯参数h为精密度。由于h值无法以实验中得到,故以σ值代之。

第一节随机误差(P13、补充)四、测量的标准差

由于σ值反映了测量值或随机误差的散布程度,因此σ值可作为随机误差的评定尺度。σ值愈大,函数减小得越慢;σ值愈小,减小得愈快,即测量到的精密度愈高,如下图所示。第一节随机误差(P13-P14)标准差σ不是测量列中任何一个具体测量值的随机误差,σ的大小只说明,在一定条件下等精度测量列随机误差的概率分布情况。在该条件下,任一单次测得值的随机误差δ,一般都不等于σ,但却认为这一系列测量列中所有测得值都属于同样一个标准差σ的概率分布。在不同条件下,对同一被测量进行两个系列的等精度测量,其标准差也不相同。(二)或然误差ρ

测量列的或然误差ρ,它将整个测量列的n个随机误差分为个数相等的两半。其中一半(n/2个)随机误差的数值落在-ρ—+ρ范围内,而另一半随机误差的数值落在-ρ—+ρ范围以外:,查表,得到时,z=0.6745,故有其实际意义是:若有n个随机误差,则有n/2个落在区间[-ρ,+ρ]之内,而另外n/2个随机误差则落在此区间之外。第一节随机误差(补充)(三)算术平均误差θ第一节随机误差(补充)测量列算术平均误差θ的定义是:该测量列全部随机误差绝对值的算术平均值,用下式表示:由概率积分可以得到θ与σ的关系:目前世界各国大多趋于采用σ作为评定随机误差的尺度。这是因为:①σ的平方恰好是随机变量的数字特征之一(方差),σ本身又恰好是高斯误差方程f(δ)式中的一个参数,即,所以采用σ,正好符合概率论原理,又与最小二乘法最切合;②σ对大的随机误差很敏感,能更准确地说明测量列的精度;③极限误差与标准偏差的关系简单:;④公式推导和计算比较简单。标准偏差的几种计算方法

第一节随机误差(P14)(一)等精度测量列单次测量标准差2、贝塞尔(Bessel)公式当被测量的真值为未知时,按式(2-12)不能求得标准差。实际上,在有限次测量情况下,可用残余误差代替真误差,得到标准差的估计值。

1、直接计算法

应用条件:被测量真值已知;测量次数n应充分大。第一节随机误差(P14)2、贝塞尔(Bessel)公式由此可得:式中,称为算术平均值误差,将它和代入上式,则有将上式对应相加得:,即若将式(2-14)平方后再相加得:将式(2-15)平方有:当n适当大时,可以认为趋近于零,并将代入式(2-16)得:(2-17)由于,代入式(2-17)得:,即(2-18)第一节随机误差(P14-P15)3、别捷尔斯法

由贝塞尔公式得:进一步得:则平均误差有:

由式(2-6)得:故有:

(2-26)

此式称为别捷尔斯(Peters)公式,它可由残余误差的绝对值之和求出单次测量的标准差,而算术平均值的标准差为:

(2-27)第一节随机误差(P17-P18)【例2-4】用别捷尔斯法求得表2-3的标准差。

解:计算得到的值分别填于表中,因此有序号1234567891075.0175.0475.0775.0075.0375.0975.0675.0275.0575.08-0.035-0.005+0.025-0.045-0.015+0.045+0.015-0.025+0.005+0.0350.0012250.0000250.0006250.0020250.0002250.0020250.0002250.0006250.0000250.001225

第一节随机误差(P18)4、极差法用贝赛尔公式和别捷尔斯公式计算标准差均需先求算术平均值,再求残余误差,然后进行其他运算,计算过程比较复杂。当要求简便迅速算出标准差时,可用极差法。第一节随机误差(P18)

若等精度多次测量测得值服从正态分布,在其中选取最大值与最小值,则两者之差称为极差,即:

(2-28)根据极差的分布函数,可求出极差的数学期望为因故可得的无偏估计值,若仍以表示,则有(2-30)式中的数值见表2-4。n2345678910111213141516171819201.131.692.062.332.532.702.852.973.083.173.263.343.413.473.533.593.643.693.74第一节随机误差(P18)【例2-6】仍用表2-3的测量数据,用极差法求得标准差。

解:5、最大误差法

在某些情况下,我们可以知道被测量的真值或满足规定精度的用来代替真值使用的量值(称为实际值或约定值),因而能够算出随机误差,取其中绝对值最大的一个值,当各个独立测量值服从正态分布时,则可求得关系式:(2-31)

一般情况下,被测量的真值为未知,不能按(2-31)式求标准差,应按最大残余误差进行计算,其关系式为:(2-32)式(2-31)和(2-32)中两系数、的倒数见表2-5。第一节随机误差(P19)

最大误差法简单、迅速、方便,且容易掌握,因而有广泛用途。当时,最大误差法具有一定精度。【例2-7】仍用表2-3的测量数据,按最大误差法求标准差,则有,而故标准差为n1234567891011121314151.250.880.750.680.640.610.580.560.550.530.520.510.500.500.49n1617181920212223242526272829300.480.480.470.470.460.460.450.450.450.440.440.440.440.430.43n2345678910152025301.771.020.830.740.680.640.610.590.570.510.480.460.44第一节随机误差(P19)【例2-8】

某激光管发出的激光波长经检定为,由于某些原因未对此检定波长作误差分析,但后来又用更精确的方法测得激光波长,试求原检定波长的标准差。

解:因后测得的波长是用更精确的方法,故可认为其测得值为实际波长(或约定真值),则原检定波长的随机误差为:

故标准差为:

第一节随机误差(P19)④用最大误差法计算σ更为简捷,容易掌握,当n<10时可用最大误差法,计算精度大多高于贝氏公式,尤其是对于破坏性实验(n=1)只能应用最大误差法。第一节随机误差(补充)几种计算方法的优缺点①贝塞尔公式的计算精度较高,但计算麻烦,需要乘方和开方等,其计算速度难于满足快速自动化测量的需要;②别捷尔斯公式最早用于前苏联列宁格勒附近的普尔科夫天文台,计算速度较快,但计算精度较低,计算误差为贝氏公式的1.07倍;③用极差法计算σ,非常迅速方便,可用来作为校对公式,当n<10时可用来计算σ,此时计算精度高于贝氏公式;(二)多次测量的测量列算术平均值的标准差

在多次测量的测量列中,是以算术平均值作为测量结果,因此必须研究算术平均值不可靠的评定标准。如果在相同条件下对同一量值作多组重复的系列测量,每一系列测量都有一个算术平均值,由于随机误差的存在,各个测量列的算术平均值也不相同,它们围绕着被测量的真值有一定的分散,此分散说明了算术平均值的不可靠性,而算术平均值的标准差则是表征同一被测量的各个独立测量列算术平均值分散性的参数,可作为算术平均值不可靠性的评定标准。算术平均值为:取方差得因故有第一节随机误差(P15-P16)

所以(2-21)

即在n次测量的等精度测量列中,算术平均值的标准差为单次测量标准差的,当n愈大,算术平均值越接近被测量的真值,测量精度也愈高。增加测量次数,可以提高测量精度,但测量精度是与n的平方根成反比,因此要显著提高测量精度,必须付出较大的劳动。由图2-3可知,σ一定时,当n>10以后,的减小很慢。此外,由于增加测量次数难以保证测量条件的恒定,从而引入新的误差,因此一般情况下取n=10以内较为适宜。总之,提高测量精度,应采取适当精度的仪器,选取适当的测量次数。第一节随机误差(P16)第一节随机误差(P16)评定算术平均值的精度标准,也可用或然误差R或平均误差T,相应公式为:若用残余误差表示,则有:【例2-4】用游标卡尺对某一尺寸测量10次,假定已消除系统误差和粗大误差,得到数据如下(单位为mm):

75.01,75.04,75.07,75.00,75.03,75.09,75.06,75.02,75.05,75.08。求算术平均值及其标准差。

解:算术平均值为:因为:第一节随机误差(P16-P17)序号1234567891075.0175.0475.0775.0075.0375.0975.0675.0275.0575.08-0.035-0.005+0.025-0.045-0.015+0.045+0.015-0.025+0.005+0.0350.0012250.0000250.0006250.0020250.0002250.0020250.0002250.0006250.0000250.001225

与表中的结果一致,故计算正确。根据上述各个误差计算公式可得:第一节随机误差(P17)(一)单次测量的极限误差第一节随机误差(P20)当研究误差落在区间(-δ,+δ)之间的概率时,则得:五、测量的极限误差测量的极限误差是极端误差,测量结果(单次测量或测量列的算术平均值)的误差不超过该极端误差的概率为p,并使差值(1-p)可予忽略。

正态分布曲线和横坐标轴间所包含的面积等于其相应区间确定的概率,即:进行变量置换,设经变换,前式成为:(2-34)

第一节随机误差(P20)表2-6列出t=0.67,1,2,3,4等几个特殊值的积分值,并求出随机误差不超出相应区间的概率p=2φ(t)和超出相应区间的概率p’=1-2φ(t)。此函数φ(t)称为概率积分。为了应用方便,其积分值一般列成表格形式,称为正态分布积分表(见教材附录1)。当t给定时,φ(t)值可由该表查出。当t=2,即|δ|=2σ时,在22次测量中只有1次的误差绝对值超出2σ范围;t超出的概率测量次数n超出的测量次数0.67σ12340.49720.68260.95440.99730.99990.50280.31740.04560.00270.0001111112322370156260.671234不超出的概率第一节随机误差(P20)由表可以看出,随着t的增大,超出|δ|的概率减小得很快。当t=3,即|δ|=3σ时,在370次测量中只有1次误差绝对值超出3σ范围。由于在一般测量中,测量次数很少超过几十次,因此可以认为绝对值大于3σ的误差是不可能出现的,通常把这个误差称为单次测量的极限误差,即当t=3时,对应的概率p=99.73%。

t=2.58,p=99%;t=2,p=95.44%;t=1.96,p=95%等。第一节随机误差(P21)

在实际测量中,有时也可取其它t值来表示单次测量的极限误差。如取一般情况下,测量列单次测量的极限误差可用下式表示:若已知测量的标准差σ,选定置信系数t,则可由上式求得单次测量的极限误差。

t--为置信系数,为算术平均值的标准差。第一节随机误差(P21)(二)算术平均值的极限误差测量列的算术平均值与被测量的真值之差称为算术平均值误差,即:当多个测量列的算术平均值误差为正态分布时,同样可得测量列算术平均值的极限表达式为:

通常取t=3,则

式中:为置信系数,它由给定的置信概率和自由度来确定,见附录3;为超出极限误差的概率(称显著度或显著水平),通常取=0.01或0.02,0.05;n为测量次数;为n次测量的算术平均值标准差。第一节随机误差(P21)

实际测量中,有时也取其它t值来表示算术平均值的极限误差。但当测量列的测量次数较少时,应按“学生氏”分布(“student”distribution)或称t分布来计算测量列算术平均值的极限误差,即

对于同一测量列,按正态分布和t分布分别计算时,即使置信概率的取值相同,但由于置信系数不同,因此求得的算术平均值极限误差也不同。【例2-9】对某量进行6次测量,测得数据如下:802.40,802.50,802.38,802.48,802.42,802.46。求算术平均值及其极限误差。

第一节随机误差(P20-P22)解:算术平均值则有:标准差

因测量次数较少,应按t分布计算算术平均值的极限误差。已知取则由附录表3查得若按正态分布计算,取,相应的置信概率,由附录表1查得:t=2.60,则算术平均值的极限误差为:第一节随机误差(P22)由此可见,当测量次数较少时,按两种分布计算的结果有明显的差别。六、不等精度测量第一节随机误差(P22)在不同的测量条件下,用不同的仪器、不同的测量方法、不同的测量次数以及不同的测量者进行测量和对比,这种测量称为不等精度测量。实际测量中,由于客观条件限制,所进行的测量往往是不等精度测量。对于精密科学实验,为得到准确的测量结果,常采用不等精度测量。如果这些测量结果是相互一致的,那么测量结果就是真正可以信赖的。在一般测量工作中,常遇到的不等精度测量的两种情况:用不同测量次数进行对比测量;用不同精度的仪器进行对比测量。这些情况下,该如何求得最后的测量结果和精度?(一)权的概念

第一节随机误差(P22)

在等精度测量中,各个测量值认为同样可靠,并取所有测得值的算术平均值作为最后的测量结果。在不等精度测量中,各个测量结果的可靠程度不一样,不能简单地取各测量结果的算术平均值作为最后的测量结果,应让可靠程度大的测量结果在最后测量结果中占有的比重大些,可靠程度小的占比重小些。各测量结果的可靠程度可用一数值来表示,这数值即称为该测量结果的“权”。可以理解为当它与另一些测量结果比较时,对该测量结果所给予信赖程度。(二)“权”的确定方法

第一节随机误差(P22)测量结果的权说明了测量的可靠程度,因此可根据这一原则来确定权的大小。最简单的方法可按测量的次数来确定权。即测量条件和测量者水平皆相同,则重复测量次数愈多,其可靠程度也愈大,因此完全可由测量的次数来确定权的大小,即。由此得:或表示为:(2-42)因为故上式又可写成第一节随机误差(P23)

假定同一被测量有m组不等精度的测量结果,它们是从单次测量精度相同而测量次数不同的一系列测量值求得的算术平均值。因为单次测量精度皆相同,其标准差均为σ,则各组算术平均值的标准差为:结论:每组测量结果的权与其相应的标准偏差平方成反比。

【例2-10】对一级钢卷尺的长度进行了三组不等精度测量,其结果为第一节随机误差(P23)求各测量结果的权。解:由式(2-42)得:因此各组的权可取为(三)加权算术平均值

第一节随机误差(P23-P24)

若对同一被测量进行m组不等精度测量,得到m个测量结果为,设相应的测量次数为n1,n2,…,nm,即:根据等精度测量算术平均值原理,全部测量的算术平均值应为:将式(2-43)代入上式得:或简写为:(2-44)当各组的权相等,即时,加权算术平均值可简化为:第一节随机误差(P24)上式求得的结果即为等精度的算术平均值。由此可见等精度测量是不等精度测量得特殊情况。为简化计算,加权算术平均值可表示为:(2-46)式中的为接近的任选参考值。【例2-11】工作基准米尺在连续三天内与国家基准器比较,得到工作基准米尺的平均长度为999.9425mm(三次测量的),999.9416mm(两次测量的),999.9419mm(五次测量的),求最后测量结果。解:按测量次数来确定权:选则有:第一节随机误差(P24)利用单位权化的思想,可以将某些不等精度测量问题化为具有单位权的等精度测量问题来处理。第一节随机误差(P24)(四)单位权的概念由式(2-41)知此式又可表示为式中:为等精度单次测量值的标准差。因此,具有同一方差的等精度单次测量值的权数为1。若已知,只要确定,根据(2-47)式就可求出各组的方差。由于测得值的方差的权数为1在此有特殊用途,故称等于1的权为单位权,而为具有单位权的测得值方差,为具有单位权的测得值标准差。例如,将不等精确测量的各组测量结果皆乘以自身权数的平方根,此时得到的新值z的权数就为1。不等精度测量列,经单位权化处理后,就可按等精度测量列来处理。第一节随机误差(P25)单位权化的实质,是使任何一个量值乘以自身权数的平方根,得到新的量值权数为1。由此可知,单位权化以后得到的新值z的权数

为1,用这种方法可以把不等精度的各组测量结果皆进行了单位权化,使该测量列转化为等精度测量列。证明:设取方差以权数来表示上式中的方差,则对同一个被测量进行m组不等精度测量,得到m个测量结果为:若已知单位权测得值的标准差σ,则有:第一节随机误差(P25)(五)加权算术平均值的标准差全部(m×n个)测得值的算术平均值的标准差为:因为比较上面两式可得:代入式(2-48)得当各组测量的总权数为已知时,可由任一组的标准差和相应的权,或者由单位权的标准差σ求得加权算术平均值的标准。当各组测量结果的标准差为未知时,则不能直接用式(2-49),而必须由各测量结果的残余误差来计算加权算术平均值的标准差。第一节随机误差(P25-P26)将各组单位权化,则有:已知各组测量结果的残余误差为:上式中各组新值已为等精度测量列的测量结果,相应的残差也成为等精度测量列的残余误差,则可用等精度测量时的Bessel公式推导得到:用式(2-51)可由各组测量结果的残余误差求得加权算术平均值的标准差,但是只有组数m足够多时,才能得到较为精确的值。一般情况下的组数较少,只能得到近似的估计值。第一节随机误差(P26)【例2-12】求例2-11的加权算术平均值的标准差。解:前已计算出加权算术平均值:又已知:可得各组测量结果的残余误差为:代入式(2-51)得将式(2-50)代入式(2-49)得:七、随机误差的其他分布

第一节随机误差(P26)正态分布是随机误差最普遍的一种分布规律,但不是唯一分布规律。下面介绍几种常见的非正态分布。(一)均匀分布

在测量实践中,均匀分布是经常遇到的一种分布。其主要特点是(参见图2-5):①误差有一确定的范围;②在此范围内,误差出现的概率各处相等。故又称均匀分布为矩形分布或等概率分布。均匀分布的分布密度(图2-5)和分布函数分别为:第一节随机误差(P27)它的数学期望为:它的方差和标准差分别为:数据计算中的舍入误差、仪器刻度盘刻度误差引起的误差、数字式仪器在±1单位以内不能分辨的误差均可看作均匀分布。(二)反正弦分布第一节随机误差(P27-P28)

其特点是该随机误差与某一角度成正弦关系。例如仪器盘偏心引起的角度测量误差、电子测量中谐振中的振幅误差等。反正弦分布的分布密度(图2-6)和分布函数分别为:它的数学期望为:

它的方差和标准差分别为:(三)三角形分布

当两个误差限相同且服从均匀分布的随机误差求和时,其和的分布规律服从三角形分布,又称辛普逊(Simpson)分布。实际测量中,若整个测量过程必须进行两次才能完成,而每次测量的随机误差服从相同的均匀分布,则总的测量误差为三角形分布误差。第一节随机误差(P28-P29)三角形分布的分布密度和分布函数分别为:它的方差和标准差分别为:它的数学期望为:在测量工作中,除上述的非正态分布外,还有直角分布、截尾正态分布、双峰正态分布及二点分布等,在此不做叙述。下面再介绍几种随机变量分布分布、t分布和F分布,它们在后面章节里有应用。第一节随机误差(P30)(四)分布

令为个独立随机变量,每个随机变量都服从标准化的正态分布。定义一个新的随机变量

随机变量称为自由度为ν的卡埃平方变量。自由度ν表示上式中项数或独立变量的个数。

分布的分布密度

(如图2-8)第一节随机误差(P30)由图2-8的两条曲线看出,当逐渐增大时,曲线逐渐接近对称。可以证明当足够大时,曲线趋近正态曲线。需要指出,称为自由度,它的改变将引起分布曲线的相应改变。

式中的为Γ函数。它的数学期望为:它的方差和标准差分别为:在本书最小二乘法中要用到分布,此外它也是t分布和F分布的基础。令和是独立的随机变量,具有自由度为的分布函数,具有标准化正态分布函数,则定义新的随机变量为

第一节随机误差(P30-P31)(五)t分布可以证明,当自由度较小时,t分布与正态分布有明显区别,但当自由度时,t分布曲线趋于正态分布曲线。随机变量t称自由度为的学生氏t变量。t分布的分布密度为(图2-9):它的数学期望为:它的方差和标准差分别为:F分布也是一种重要分布,在检验统计假设和方差分析中经常应用。第一节随机误差(P31-P32)(六)F分布若具有自由度为的卡埃平方分布函数,具有自由度为的卡埃平方分布函数,定义新的随机变量为随机变量F称为自由度为、的F变量。F分布的分布密度如图2-10所示。它的数学期望为:它的方差和标准差分别为:第二节系统误差

系统误差的产生原因系统误差的特征与分类系统误差的发现方法系统误差的减小和消除方法研究系统误差的重要意义第二节系统误差

实际上测量过程中往往存在系统误差,在某些情况下的系统误差数值还比较大。因此测量结果的精度,不仅取决于随机误差,还取决于系统误差的影响。由于系统误差和随机误差同时存在测量数据之中,而且不易被发现,多次重复测量又不能减小它对测量结果的影响,这种潜伏使得系统误差比随机误差具有更大的危险性,因此研究系统误差的特征与规律性,用一定的方法发现和减小或消除系统误差,就显得十分重要。

系统误差是指在确定的测量条件下,某种测量方法和装置,在测量之前就已存在误差,并始终以必然性规律影响测量结果的正确度,如果这种影响显著的话,就要影响测量结果的准确度。一、系统误差产生的原因

系统误差是由固定不变的或按确定规律变化的因素造成,在条件充分的情况下这些因素是可以掌握的。主要来源于:

①测量装置方面的因素

②环境方面的因素

测量方法的因素

测量人员的因素第二节系统误差计量校准后发现的偏差、仪器设计原理缺陷、仪器制造和安装的不正确等。测量时的实际温度对标准温度的偏差、测量过程中的温度、湿度按一定规律变化的误差。采用近似的测量方法或计算公式引起的误差等。测量人员固有的测量习性引起的误差等。第二节系统误差二、系统误差的分类和特征

特征:

在同一条件下,多次测量同一测量值时,误差的绝对值和符号保持不变(不具有补偿性);或者在条件改变时,误差按一定的规律变化。

图2-11为不同特征的系统误差曲线。a为不变的系统误差,b为线性变化的系统误差,c为非线性变化的系统误差,d为周期性变化的系统误差,e为复杂规律变化的系统误差。

根据系统误差在测量过程中所具有的不同变化特性,将系统误差分为不变系统误差和变化系统误差两大类。图2-11不同特征的系统误差第二节系统误差(一)不变系统误差

固定系统误差是指在整个测量过程中,误差的大小和符号始终是不变的。

如:千分尺或测长仪读数装置的调零误差,量块或其它标准件尺寸的偏差等。误差为常量,属于最常见的一类系统误差。(二)变化系统误差

指在整个测量过程中,误差的大小和方向随测试的某一个或某几个因素按确定的函数规律而变化。又可分为以下几种:①线性变化的系统误差

在整个测量过程中,随某因素而线性递增或递减的系统误差。

例如,量块中心长度随温度T的变化:第二节系统误差

②周期变化的系统误差

在整个测量过程中,随某因素作周期变化的系统误差。

例如,仪表指针的回转中心与刻度盘中心有一个偏心量e

,则指针在任一转角处引起的读数误差为。此误差变化规律符合正弦曲线规律。

③复杂规律变化的系统误差

在整个测量过程中,随某因素变化,误差按确定的更为复杂的规律变化,称其为复杂规律变化的系统误差。

例如:微安表的指针偏转角与偏转力距间不严格保持线性关系,而表盘仍采用均匀刻度所产生的误差就属于复杂规律变化的系统误差。第二节系统误差

由于形成系统误差的原因复杂,目前尚没有能够适用于发现各种系统误差的普遍方法。但是……可针对不同性质的系统误差,按照下述两类方法加以识别:

1、用于发现测量列组内的系统误差

包括:三、系统误差的发现方法计算数据比较法秩和检验法t检验法实验对比法残余误差观察法残余误差校核法不同公式计算标准差比较法2、用于发现各组测量列间的系统误差

包括:第二节系统误差

1、实验对比法

实验对比法是改变产生系统误差的条件,进行不同条件的测量,以发现系统误差。

这种方法适用于发现不变的系统误差。

2、残余误差观察法残余误差观察法是根据测量列的各个残余误差大小和符号的变化规律,直接由误差数据或误差曲线图形来判断有无系统误差。

这种方法适于发现有规律变化的系统误差。(一)测量列组内的系统误差发现方法可以证明,若系统误差显著大于随机误差,则有:

3、残余误差校核法第二节系统误差

式(2-83)说明:显著含有系统误差的测量列,其任一测量值的残余误差约为系统误差与测量列系统误差平均值之差。①用于发现线性系统误差设有测量列,它们的系统误差为,它们不含系统误差之值为。(2-83)式中:为系统误差平均值.若将测量列中前K个残余误差相加,后(n-K)个残余误差相加(当n为偶数,取K=n/2;n为奇数,取K=(n+1)/2)。当测量次数足够多时,可以推得下式:第二节系统误差

若上式的两部分差值Δ显著不为O,则有理由认为测量列存在线性系统误差。这种校核法又称“马列科夫准则”,它能有效地发现线性系统误差。但要注意的是,有时按残余误差校核法求得差值Δ=0,仍有可能存在系统误差。

②用于发现周期性系统误差:若一等精度测量列,接测量先后顺序将残余误差排列为,可用统计准则进行判断,令第二节系统误差若(2-85)则认为该测量列中含有周期性系统误差。这种校核法又叫阿卑——赫梅特准则(Abbe-Helmert准则),它能有效地发现周期性系统误差。

4、不同公式计算标准差比较法

在判断含有系统误差时,违反“准则”时就可以直接判定,而在遵守“准则”时,不能得出“不含系统误差”的结论,因为每个准则均有局限性,不具有“通用性”。

第二节系统误差对等精度测量,按贝塞尔公式:按别捷尔斯公式:令若(2-86)则怀疑测量列中存在系统误差。

若对同一量独立测量得

m组结果,并知它们的算术平均值和标准差为:(二)测量列组间的系统误差发现方法则任意两组结果与间不存在系统误差的标志是:第二节系统误差(2-87)而任意两组结果之差为:其标准差为:1、计算数据比较法解:两者差值第二节系统误差因为两种方法所得结果的差值Δ远远大于两倍标准差,故两种方法间存在系统误差。【例2-15】

雷莱用不同方法制取氮,测得氮气相对密度平均值及其标准差如下。由化学法制取氮:

由大气中提取氮:

用计算数据比较法检验两种方法间是否存在系统误差?而标准差2、秩和检验法

第二节系统误差

若独立测得两组的数据为:

将它们混和以后,按从小到大的顺序重新排列,观察测量次数较少那一组数据的序号,数出它的测得值在混合后的次序(即秩),再将所有测得值的次序相加,即为秩和

T。

1)两组的测量次数,可根据测量次数较少的组的次数n1

和测量次数较多的组的次数n2,由秩和检验表2-10查得T-

和T+

(显著度0.05),若

则无根据怀疑两组间存在系统误差。

243112531326414274162841829420210521336153471735720368223792438927391029310113144122445132746143047153348163649173941018425519365620405722435823475925505102654662820673054683258693363610356777396678417179437671046808852848954908105795996610591069111101083127第二节系统误差2)当,秩和T近似服从正态分布(括号中第一项为数学期望,第二项为标准差,此时T-

和T+

可由正态分布算出)根据求得的数学期望值a和标准差σ,则:选取概率,由正态分布分表(附录表1)查得t,若,则无根据怀疑两组间存在系统误差。解:将两组数据混合排列成下表

【例2-16】对某量测得两组数据如下,判断两组间有无系统误差。

xi:14.7,14.8,15.2,15.6

;

yj:14.6,15.0,15.1

i1234567xi14.714.815.215.6yj14.615.015.1第二节系统误差

已知:计算秩和:T=1+4+5=10

查表2-10得:

因故无根据怀疑两组间存在系统误差。

注意:若两组数据中有相同的数值,则该数据的秩按所排列的两个次序的平均值计算。3、t检验法

令变量第二节系统误差

当两组测量值服从正态分布,可用t检验法判断两组间是否存在系统误差。

设独立测得两组数据为:

其中:

由数理统计知,新变量t是服从自由度为(

)的t分布变量。

取显著性水平α,由t分布表查出中的。若,则无根据怀疑两组间有系统误差。

注意:(2-89)式中使用的和,不是方差的无偏估计,若将贝塞尔计算的和用于上式,则该式应作相应的变动。解:计算两组数据的算术平均值及偏差平方和的平均值第二节系统误差【例2-17】

对某量测得两组数据为:

x:1.9,0.8,1.1,0.1,-0.1,4.4,5.5,1.6,4.6,3.4

y:0.7,-1.6,-0.2,-1.2,-0.1,3.4,3.7,0.8,0.0,2.0

用t检验法判断两组数据是否含有系统误差?则

由及取,查t分布表(附录表3)得,又因,故无根据怀疑两组间有系统误差。四、系统误差的减小和消除(一)消除误差源法

用排除误差源的方法消除系统误差是最理想的方法。它要求测量人员,对测量过程中可能产生系统误差的各个环节作仔细分析,并在正式测量前就将误差从产生根源上加以消除或减弱到可忽略的程度。由于具体条件不同,在分析查找误差源时,并无一成不变的方法,但以下几方面是应予考虑的:

①所用基准件、标准件(如量块、刻尺等)是否准确可靠;

②所用量具仪器是否处于正常工作状态,是否经过检定,并有有效周期的检定证书;

③仪器的调整、测件的安装定位和支承装卡是否正确合理;

④所采用的测量方法和计算方法是否正确,有无理论误差;

⑤测量的环境条件是否符合规定要求;

⑥注意避免测量人员带入主观误差。如视差、视力疲劳等。第二节系统误差(二)加修正值法

这种方法是预先将测量器具的系统误差检定出来或计算出来,取与误差大小相同而符号相反的值作为修正值,将测得值加上相应的修正值,即可得到不包含该系统误差的测量结果。由于修正值本身也包含有一定的误差,因此用这种方法不可能将全部系统误差修正掉,总要残留少量的系统误差。采用加修正值的方法消除系统误差,关键在确定修正值或修正函数的规律。第二节系统误差1、消除恒定系统误差的方法

第二节系统误差在使用丝杠转动机构测微小位移时,为消除微丝杠与螺母间的配合间隙等因素引起的定回误差,往往采用往返两个方向的两次读数取均值作为测量结果,以补偿定回误差的影响。(三)改进测量方法

在没有条件或无法获之基准测量的情况下,必须设计适当的测量方法,使恒定系统误差在测量过程中予以消除。常用的方法有:

①反向补偿法:先在有恒定系统误差的状态下进行一次测量,再在该恒定系统误差影响相反的另一状态下测一次,取两次测量的平均值作为测量结果。这样,大小相同但符号相反的两恒定系统误差就在相加后再平均的计算中互相抵消了。

②代替法:其实质是在测量装置上对被测量测量后不改变测量条件,立即用一个标准量代替被测量,放到测量装置上再次进行测量,从而求出被测量与标准量的差值,即:被测量=标准量+差值

第二节系统误差③抵消法:这种方法要求进行两次测量,以便使两次读数时出现的系统误差大小相等,符号相反,取两次测得值的平均值,作为测量结果,即可消除系统误差。这种方法跟反向补偿法相似。④交换法:根据误差产生原因,将某些条件交换,以消除系统误差。等臂天平称重,先将被测量X放于天平一侧,标准砝码放于其另一侧,调至平衡,则有。若将X与P交换位置,由于,天平将失去平衡。原砝码P调整为砝码才使天平再次平衡,于是有

2、消除线性误差的方法——对称法

如图2-19所示。随着时间的变化,被测量作线性增加,若选定某时刻为对称中点,则此对称点的系统误差算术平均值皆相等。即利用这一特点,可将测量对称安排,取各对称点两次读数的算术平均值作为测得值,即可消除线性系统误差。例如测定量块平面平行性时(见图2-20),先以标准量块A的中心0点对零,然后按图中所示被检量块B上的顺序逐点检定,再按相反顺序进行检定,取正反两次读数的平均值作为各点的测得值,就可消除因温度变化而产生的线性系统误差。第二节系统误差

对周期性误差,可以相隔半个周期进行两次测量,取两次读数平均值,即可有效地消除周期性系统误差。周期性系统误差一般可表示为:设时,误差为:当时,即相差半周期的误差为:取两次读数平均值则有由此可知半周期法能消除周期性系统误差。例如仪器度盘安装偏心、测微表针回转中心与刻度盘中心的偏心等引起的周期性误差,皆可用半周期法予以剔除。第二节系统误差3、消除周期性系统误差的方法—半周期法第二节系统误差构造数学模型回归统计补偿和修正如:用于检定线纹尺的组合定标法和度盘测量中的定角组合测量法以及力学计量中检定砝码的组合测量法等。方法1:方法2:组合测量

使系统误差以尽可能多的组合方式出现于被测量中,使之具有偶然误差的抵偿性,即以系统误差随机化的方式消除其影响,这种方法叫组合测量法。4、消除复杂规律变化系统误差的方法

在一系列重复测量数据中,如有个别数据与其它的有明显差异,则或它们很可能含有粗大误差(简称粗差),称其为可疑数据。如果不恰当剔除含大误差的数据,会造成测量精密度偏高的假象。反之如果对混有粗大误差的数据(异常值),未加剔除,必然会造成测量精密度偏低的后果。因此,对数据中异常值的正确判断与处理,是获得客观的测量结果的一个重要方法。一、粗大误差产生的原因产生粗大误差的原因是多方面的,大致可归纳为:

①测量人员的主观原因

②客观外界条件的原因责任感不强、疲劳、缺乏经验、操作不当,不小心、不耐心、不仔细等,造成错误的读数。测量条件意外地改变(如机械冲击、外界振动、电磁干扰等)。第三节粗大误差二、判别粗大误差的准则第三节粗大误差测量中确实是因读错记错数据,仪器的突然故障,或外界条件的突变等异常情况引起的异常值,一经发现,就应在记录中除去,但需注明原因。有时,测量完成后也不能确知数据是否含粗大误差,可用统计方法判别。在判别某个测得值是否含有粗大误差时,要特别慎重,应作充分的分析和研究,并根据判别准则予以确定。常用的判别准则有:(一)准则(莱以特准则)

准则是最常用也是最简单的判别粗大误差的准则,它是以测量次数充分大为前提。实际测量中,常以贝塞尔公式算得,以代替真值。对某个可疑数据,若其残差满足:(2-90)

则可认为该数据含有粗大误差,应予以剔除。在测量次数n≤10的情形,最好不要选用3σ准则。序号ν12345678910111213141520.4220.4320.4020.4320.4220.4320.3920.3020.4020.4320.4220.4120.3920.3920.40+0.016+0.026-0.004+0.026+0.016+0.026-0.014-0.104-0.004+0.026+0.016+0.006-0.014-0.014-0.0040.0002560.0006760.0000160.0006760.0002560.0006760.0001960.0108160.0000160.0006760.0002560.0000360.0001960.0001960.000016+0.009+0.019-0.011+0.019+0.009+0.019-0.021——-0.011+0.019+0.009-0.001-0.021-0.021-0.0110.0000810.0003610.0001210.0003610.0000810.0003610.000441——0.0001210.0003610.0000810.0000010.0004410.0004410.000121第三节粗大误差表2-11【例2-18】对某量进行15次等精度测量,测得值如下表2-11所列,设这些测得值已消除了系统误差,试判别该测量列中是否含有粗大误差的测得值。

由表2-11可得根据3σ准则,第8测得值的残余误差为:即它含有粗大误差,故将此测得值剔除。再根据剩下的14个测得值重新计算,得:

由表2-11知,剩下的14个测得值的残余误差均满足,故可以认为这些测得值不再含有粗大误差。第三节粗大误差并求得测量列的标准差(计算时不包括):

当测量次数较少时,按t分布的实际误差分布范围来判别粗大误差较为合理。罗曼诺夫斯基准其特点是首先剔除一个可疑的测得值,然后按t分布检验被剔除的值是否是含有粗大误差。(二)罗曼诺夫斯基准则-

t检验准则第三节粗大误差设对某量作多次等精度测量,得,若认为测量值为可疑数据,将其剔除后计算平均值为(计算时不包括xj):

K

n0.050.01

K

n0.050.01

K

n0.050.0144.9711.46132.293.23222.142.9153.566.53142.263.17232.132.9063.045.04152.243.12242.122.8872.784.36162.223.08252.112.8682.623.96172.203.04262.102.8592.513.71182.183.01272.102.84102.433.54192.173.00282.092.83112.373.41202.162.95292.092.82122.333.31212.152.93302.082.81第三节粗大误差若:根据测量次数n和选取的显著度α,即可由表2-14查得t分布的检验系数。

则认为测量值含有粗大误差,剔除是正确的,否则认为不含有粗大误差,应予保留。【例2-19】

试判断例2-18中测量列是否含有粗大误差。

第三节粗大误差解:首先怀疑测量列中残余误差最大者含有粗大误差。第8个测得值残余误差最大,先将其剔除。再分析剩下的14个测量值计算平均值和标准差。选取显著度,已知n=15,查表2-14得:则因故第八组测量值含有粗大误差,应予剔除。然后对剩下的14个测得值进行判别,可知这些测得值不再含有粗大误差。第三节粗大误差(三)格拉布斯准则

1950年格拉布斯(Grubbs)根据顺序统计量的某种分布规律提出一种判别粗大误差的准则。

设对某量作多次等精度独立测量,得,当服从正态分布时,计算得

为了检验中是否含有粗大误差,将按大小顺序排列成顺序统计量,而

显然,若测量列有粗大误差存在,则首先应怀疑为可疑数据。若认为可疑,则有若可疑,则有格拉布斯准则认为:当,即判别该测得值含有粗大误差。0.050.010.050.013456789101112131415161.151.461.671.821.942.032.112.182.232.282.332.372.412.441.161.491.751.942.102.222.322.412.482.552.612.662.702.75171819202122232425303540501002.482.502.532.562.582.602.622.642.662.742.812.872.963.172.782.822.852.882.912.942.962.993.013.103.183.243.343.59第三节粗大误差

格拉布斯导出了及的分布,取定显著度α(一般为0.05或0.01),可得如表2-12所列的临界值,而故应先怀疑是否含有粗大误差,计算

第三节粗大误差【例2-20】用例2-18测得值,判别该测量列中的测得值是否含有粗大误差。解:前已计算得出:按测得值的大小,顺序排列得今有两测得值,可怀疑,但由于

查表2-13得

故表2-11中第8个测得值含有粗大误差,应予剔除。

剩下的14个数据,再重复上述步骤,判别是否含有粗大误差。(四)狄克松准则

第三节粗大误差构造检验高端异常值和低端异常值的统计量分别为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论