对实验数值误差理论和数据处理_第1页
对实验数值误差理论和数据处理_第2页
对实验数值误差理论和数据处理_第3页
对实验数值误差理论和数据处理_第4页
对实验数值误差理论和数据处理_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

误差来源设备误差环境误差人员误差方法误差误差分类系统误差、随机误差、过失误差

(1)系统误差

系统误差是由某种确定的因素造成的,使测定结果系统偏高或偏低;当造成误差的因素不存在时,系统误差自然会消失。当进行重复测量时,它会重复出现。系统误差的大小,正负是可以测定的,至少在理论上说是可以测定的,系统误差的最重要特性是它具有‘‘单向性”。(2)随机误差(偶然误差)随机误差又称偶然误差,它是由一些随机的、偶然的原因造成的。由于偶然误差是由一些不确定的偶然原因造成的,因而是可变的,有时大,有时小,有时正,有时负,所以又称不定误差。偶然误差在分析操作中是无法避免的。偶然误差的产生难以找出确定的原因,似乎没有规律性,但如果进行很多次测定,便会发现数据的分布符合正态分布规律。(3)过失误差由粗心大意引起,可以避免。重做!3.1.2准确度和精密度准确度:表示分析结果与真实值接近的程度。精密度:表示各次分析结果相互接近的程度。精密度高不一定准确度高,因为这时可能有较大的系统误差。例如甲、乙、丙、丁四人同时测定一铁矿石中的含量(真实含量37.40%),各分析四次,测定结果(%)如表所示。3.准确度与精密度的关系1.精密度是保证准确度的先决条件;精密度低:说明所测结果本身就不可靠,当然准确度也就不高。2.精密度好,不一定准确度高.3.2有效数字及其计算规则

有效数字就是在测量中所能得到的有实际意义的数字(只作定位用的”0”除外)。在确定有效数字时要注意:

(1)数字“0”有时为有效数字,有时只起定位作用,例如20.50就有4为有效数字,其中的“0”都是有效数字;再如0.108就只有3位有效数字,其中前一个“0”只起定位作用。

(2)有些数字如48000、0.00051等,有效数字位数不定,为明确其有效数字,可采用如下表达形式。例如48000若记为4.8×104,就表示有两为有效数字;记为4.80×104,则表示有3位有效数字。0.00051若记为5.1×10-3,表示有2位有效数字,记为5.10×10-3,则表示有3位有效数字。1在记录一个测量所得的数量时,数据中只应保留一位不确定数字。有效数字是包括全部可靠数字以及一位不确定数字在内的有意义的数字的位数。2在运算中弃去多余数字时,一律以“四舍六入五留双”为原则,而不要“四舍五入”。3几个数相加减时,保留有效数字的位数,决定于绝对误差最大的一个数据。如13.65+0.00823+1.6334,其中13.65小数点后的位数最少,故计算结果宜取为15.29。4几个数相乘除时,以有效数字位数最少的为标准,即以相对误差最大的数据为标准,弃去过多的位数。如0.0121×25.64×1.05782,其0.0121为三位有效数字,故计算结果宜记0.3285在所有计算式中,常数π,e的数值,以及,1/2等系数的有效数字位数,可以认为无限制,需要几位就可以取几位。6在对数计算中,所取对数位数,应与真数的有效数字位数相等。例如,pH12.25和[H+]=5.6×10-13M;Ka=5.8×10-10,logKa=-9.24等,都是两位有效数字。换言之,对数的有效数字位数,只计小数点以后的数字的位数,不计对数的整数部分。7如果要舍去的不止一位数,而是几位数字,则应该一次完成,而不应该连续修约。8在修约标准偏差的值或其它表示不确定度的值时,修约的结果通常是使准确度的估计值变得更差一些。例如,标准偏差s=0.213单位,取两位有效数字时,要入为0.22单位,而取一位有效数字时,就要入为0.3单位。9平均值的有效数字位数,通常和测量值相同。当样本容量较大,在运算过程中,为减少舍入误差,平均值可比单次测量值多保留一位数。3.3实验数据的初步整理实验数据的列表整理1.数据的归类整理2.数据的分组整理3.3.2分布规律判断的基本方法——统计直方图1.统计直方图为了对某个随机变量的分布规律作出判断,最基本的方法就是在对该变量进行大量观测的基础上,对观测结果进行统计分析,将其绘制成为图形,从而估计其总体分布规律或直接给出其函数形式,进而求得随机变量的概率密度函数f(x)。2.统计直方图的作法

(1)从观测值中找出最大值和最小值xmax和xmin;(2)确定作图区间:选取作图起点a(a<xmin)和终点b(b≥xmax);(3)确定分组区间和组数:将[a,b]分成n个小区间,每个小区间的长度为△ti,每一小区间的数据为一组,共有n组;(4)计算各组的中间值:x=1/2(ti-1+ti);(5)统计各组内测量值出现的频数mi(测量值出现的次数);(6)计算各组频率:fi=mi/∑mi×100%(7)绘制频率直方图在作直方图时,要注意分组问题。组数的多少往往影响直方图反映数据分布的效应。如果组数过多,每组所占的区间就很狭窄,这不仅造成计算上的麻烦,而且也有可能因随机因素导致某组内数据稀少,甚至没有;如果组数过少,那么落在每组内的数据就较多,从而掩盖了组内数据变化的情况。在实际应用中,一般当数据多于100个时,宜分为10~20组,当数据少于50个时,分为5~6组为宜。120次测量结果计算机绘制频数分布图OFFICE-EXCELL输入120个值,单列。横坐标次数,纵坐标浓度,折线图。从小到大排列,分组。直方图,频数分布图。折线图一、求极差:极差=样本数据中最大值-最小值归纳1、分组的一般步骤:二、确定组距与组数:(设k=极差÷组距)(1)若k为整数,则组数=k,(2)若k不为整数,

则组数=[k]+1.三、分组:分组区间常取左闭右开区间,最后一组取闭区间说明:样本容量不超过100时常分成5-12组.作频率分布直方图的方法:归纳2、画频率分布直方图步骤:1、把横轴等分成若干段,每段对应每组组距;2、依次以组距为宽、频率/组距为高作出矩形。3、每个矩形的面积恰好是该组上的频率,这些矩形就构成频率分布直方图。

用Excel制作频数分布表和直方图

输入数据对数据进行分组,得到分组结果调出数据分析工具加载宏分析工具库工具菜单原始数据+分组结果:原始数据+分组结果:工具菜单数据分析直方图输入相关数据项目得到频数分布表和简易直方图对直方图进行修饰得到直方图a=[0.870.820.87…0.770.76]用Matlab绘制频率直方图b=a’x=unique(a);[n,xout]=hist(a,x);figure;bar(xout,n);3.4测量数据的合理性检验虽然从理论上讲,测量中的系统误差、随机误差与过失误差性质各异不难分辨。但在实际过程中,这几种误差总是纠缠在一起而难以区分。实验数据的合理性检验就是利用数理统计方法对误差进行分析,从而正确地评价测量数据,并对如何有效改进实验提供有用的信息。3.4.1可疑值检验由于测量误差的不可避免,有时会发现一组测量值中总会有一二个值明显偏大或偏小,这样的测量值称为可疑值(离群值)。如果可疑值并未超出随机误差的限度,属正常值应予保留;如果超出随机误差的限度,应予舍弃。判断测量值应该保留还是舍弃的过程就是测量数据的合理性检验。在试验过程中,若发现异常数据,应停止试验,分析原因,及时纠正错误;试验结束后,在分析试验结果时,如发现异常数据,则应先找出产生差异的原因,再对其进行取舍;在分析试验结果时,如不清楚产生异常值的确切原因,则应对数据进行统计处理再做取舍;对于舍去的数据,在试验报告中应注明舍去的原因或所选用的统计方法。对于异常数据的取舍一定要慎重,一般处理原则如下:1).4法检验根据测量值的正态分布可知,偏差大于3σ的测量值出现的概率约为0.3%,此为小概率事件,而小概率事件在有限次实验中是不可能发生的,如果发生了则是不正常的。即偏差大于3σ的测量值在有限次检验中是不可能的,如果出现则为异常值,为过失所致应舍弃。(概率不超过5%的事件称为小概率事件)。68.3%95.5%99.7%u

-3s

-2s-s0s2s3s

x-m

m-3s

m-2s

m-s

m

m+s

m+2s

m+3s

x

y标准正态分布曲线N(0,1)由前面的分析已知,总体的平均偏差为对于n个测量数据,样本的平均偏差为在正态分布下这样就有缺点:由于所以替代会产生误差。优点:4法比较简便,不用查表。用4d法判定异常值时:(1)先将可疑异常值除去后,计算其余(n-1)个测量值的平均值及平均偏差。(2)如果可疑异常值χ与之差的绝对值不小于4,即则该值为异常值应舍去,否则为正常值应保留。【例3-1】测定碱灰的总碱量(Na20%),得到5个数据:40.02,40.13,40.15,40.16,40.20。试问40.02是否应舍去?解:除去40.02后,其余数据的平均值和平均偏差为

由于︱40.02-40.16︱

,故40.02应舍去。

2.Q检验法将一组数据从小到大排列,其中x1或xn可能为异常值,引进统计量Q:若x1为异常值,则有若xn为异常值,则有可见,Q为邻差与极差之比。如果Q大于与测量数据相关的临界值,则可疑值应舍去,否则应保留。Q表示了“舍去离群值的判断是正确”这一事件的概率。【例3—2】测定碱灰的总碱量(Na20%),得到5个数据:40.02,40.13,40.15,40.16,40.20。试问40.02是否应舍去?用Q检验法判断40.02是否应舍去(P=95%)。解:因为Q<Q0.95,所以40.02应保留,显然Q检验法与法结论不同。可见,法虽然简单,但不够严密。3.格鲁布斯法则(Grubbs)将一组数据从小到大排列成x1,x2,x3…….xn

其中x1,xn可能为可疑值。先求出这组数据的平均值和标准差S,然后求出统计量T。若x1为可疑值,则若xn为可疑值,则如果计算出的T值>临界值Tα,n,离群值应舍去,否则应保留。其中α为信度(显著性水平),即正常值被错误地判断为离群值的概率。【例3-3】用格鲁布斯法判断例3-1中的40.02和40.20是否应舍去(P=95%)。总之,对于可疑数据要慎重,不能任意抛弃和修改。往往通过对可疑数据的考察,可以发现引起系统误差的原因,进而改进试验方法,有时甚至得到新试验方法的线索。3.4.3平均值检验1.基本原理对于正态总体N(μ,σ2)的一个样本,n次测定结果的平均值为,且~N(μ,σ2/n),标准化可得

u=,u~N(0,1)

此时P〔-1.96,+1.96〕=0.95P﹛︱u︱>1.96﹜=0.05这称为小概率事件,对于少数几次测量,出现这种情况的可能性很小。若这种事件发生了,则有95%的把握断定测量值有问题。2.u—检验法(正态检验法)由u=可知,进行u检验的先决条件是必须已知总体标准差σ。方法:用求得的u值与一定概率下(若未指明,则取95%)对应的u值比较。若求得的u偏大,则说明测量值存在系统误差;否则,在该概率下无系统误差。0接受域拒绝域拒绝域½½-uu【例3—4】某工厂实验室经过长年的例行分析,得知一种原材料中含铁量符合正态N(4.55,0.112)。一天,某实验员对这种原材料测定5次,结果为4.38,4.50,4.52,4.45,4.49。试问测定结果是否存在系统误差?3.t—检验众所周知,在有限次测定中,由于σ未知,故用S代替,此时测量值符合t-分布,t-分布的统计量为t=

对于样本平均值则有:t=根据已知条件不同,可以进行不同的t-检验,主要有以下4种:(1)平均值与标准值的比较为了判断一种方法,一种分析仪器,一种试剂以及某实验室或某人的操作是否可靠,即是否存在系统误差,可以将所得样本的平均值与标准值μ进行比较,进行t-检验。如果样本(x1,x2…..xn)来自正态总体N(μ,σ2),假设无系统误差,那么样本平均值与标准值μ之间的偏离为随机误差所致(过失误差的数据已舍去)。求得的t值大于表中所列值tα,f,说明对μ的偏离已超过随机误差的范围,原假设不成立,必然存在系统误差,称与μ之间存在显著性差异。反之,如果求得的t小于tα,f,原假设成立,即不存在系统误差,称与μ之间无显著性差异。【例3—5】用一种方法测定标准试样中的二氧化硅含量(%),得以下8个数据:34.30,34.32,34.26,34.35,34.38,34.28,34.29,34.23。标准值为34.33%。问这种新方法是否可靠(P=95%)?解:=34.30S=0.048μ=34.33n=8t==1.77<2.365=tα,f故新方法不存在系统误差,结果可靠。(2)平均值与理论值或用可靠方法测得的值作为标准值进行比较。【例3-6】某药厂生产复合维生素丸,要求每50g维生素丸中含铁2400mg。先从一批产品中进行随机抽样检查,5次测定结果分别为2372,2409,2395,2399,2411。产品含铁量是否合格(P=95%)?3.5实验数据的插值处理Interpolation插值法是数值分析中的一个古老的分支。等距节点内插法—隋朝数学家刘焯(公元544-610年)首先提出的不等距节点内插法—唐朝数学家张遂(公元683-727年)首先提出的插值法在数值积分、数值微分、微分方程数值解、曲线曲面拟合、函数值近似计算中有着广泛的应用。3.5.1引言插值法的提出以近似计算函数值为例说明插值法的应用。历史背景插值法就是一种最简单的重要方法函数的插值法的提出背景实际问题中经常要涉及到函数值的计算问题: (1)如果函数表达式本身比较复杂,且需要多次重复计算时,计算量会很大;(2)有的函数甚至没有表达式,只是一种表格函数,而我们需要的函数值不在该表格中。对于这两种情况,我们都需要寻找一个计算方便且表达简单的函数来近似代替,这就是数值逼近问题。

设函数f(x)在区间[a,b]上有定义,且已知在点a≤x0<

x1<

…<

xn≤b

处的函数值y0

=f(x0),y1

=f(x1),…yn

=f(xn),若存在一简单的函数P(x),满足条件P(xi)=f(xi)(i=0,1,…n),就称P

(x)称为f(x)的插值函数。插值法点x0,

x1,

…,

xn称为插值节点,区间[a,b]称为插值区间,求插值函数P(x)的方法称为插值法。几何意义:x0x1x2x3x4xP(x)f(x)常用插值函数的类型代数插值:多项式插值有理插值:有理分式函数三角插值:三角函数(1.3)

设在区间上给定个点上的函数值,求次数不超过的多项式,使多项式插值问题由插值条件得关于系数的元线性方程组(1.4)问题:P(x)是否存在?若存在,是否唯一?如何求?系数矩阵为(1.5)称为范德蒙德(Vandermonde)矩阵,由互异,故因此线性方程组(1.4)的解存在且唯一.结论定理1

设x0,x1,…,xn

是n+1个互异节点,函数f(x)在这组节点的值yk=f(xk)(k=0,1,…,n)是给定的,那么存在唯一的次数≤n的多项式P(x)满足

P(xk)=yk,k=0,1,…,n。P(x)

但遗憾的是方程组(1.4)是病态方程组,阶数n越高,病态越严重。为此我们从另一途径寻求获得P(x)的方法----Lagrange插值和Newton插值。(这两种方法称为基函数法)Interpolationpolynomial

3.5.2拉格朗日多项式niyxPiin,...,0,)(==求n

次多项式使得条件:无重合节点,即n=1已知x0,x1;

y0,

y1,求使得111001)(,)(yxPyxP==P1(x)是过(x0,y0)和(x1,y1)两点的直线。)(1xP101xxxx--010xxxx--=y0+y1线性插值与抛物插值两点式)()(0010101xxxxyyyxP---+=点斜式)(001010xxxxxxy---+=(())ff线性插值二次插值n=2已知x0,x1,x2;

y0,

y1,y2,求使得002,)(yxP112)(yxP==222)(yxP=,方程组求解麻烦抛物插值

思路:对于线性插值的两种形式解进行适当的分析,从中寻求规律得到拉格朗日插值(公式)和牛顿插值(公式).我们先来看看如何得到二次拉格朗日插值公式.)(1xP101xxxx--010xxxx--=y0+y1两点式)()(0010101xxxxyyyxP---+=点斜式)(001010xxxxxxy---+=(())ff

首先,线性插值的两点式可看作是两个特殊的一次式的一种线性组合.101xxxx--010xxxx--)(1xP=y0+y1==10)(iiiyxl对称式l0(x)l1(x)实质上()和()即是满足函数表的一次插值多项式,称l0(x)和l1(x)为以x0,x1为节点的基本插值多项式,也称为线性插值的插值基函数。基函数的线性组合基函数法其中,l0(x)和l1(x)满足:l0(x0)=1,l0(x1)=0,l1(x0)=0,l1(x1)=1,L1(x)L1(xj)==10)(iiiyxjl=yj启发:其中,l0(x),l1(x),l2(x)都是二次多项式,且应满足满足(2.1)的

li(x)是否存在?若存在,具有什么形式呢?(2.1)二次Lagrange插值多项式为

L2(x)=y0l0(x)+y1l1(x)+y2l2(x)二次插值是否能由一些二次插值基函数来线性组合?先考虑l0(x)。l0(x)=0(x-x1)(x-x2),其中0

是待定系数。同理

l1(x)=1(x-x0)(x-x2),

l2(x)=2(x-x0)(x-x1),1=(x1-x0)(x1-x2)12=(x2-x0)(x2-x1)1此即二次拉格朗日插值公式,其中,l0(x),l1(x),l2(x)是满足(2.1)的特殊(基本)二次插值多项式;称为二次插值基函数.L2(x)=y0+y1+y2(x-x0)(x-x2)(x1-x0)(x1-x2)(x-x1)(x-x2)(x0-x1)(x0-x2)(x-x0)(x-x1)(x2-x0)(x2-x1)0=(x0-x1)(x0-x2)1

l0(x)=0(x-x1)(x-x2),由l0(x0)=1,所以0(x0-x1)(x0-x2)=1,则L2(xj)==20)(iiiyxjl=yjn

1li(x)每个li有n

个根x0…

xi…xn=-=---=njjijiniiixxCxxxxxxCxl00)())...()...(()(-==jijiiiixxCxl)(11)(

拉格朗日多项式节点f3.5.3拉格朗日插值多项式展开n次插值多项式

:求次数≤n的多项式Ln(x),

使其满足

Ln(x0)=y0,Ln(x1)=y1,......,Ln(xn)=yn

令Ln(x)=l0(x)y0+l1(x)y1+…+ln(x)yn其中满足条件(2.9)易求得(2.10)记(2.11)

注意:次插值多项式通常是次数为的多项式,特殊情况下次数可能小于.三点共线注:若不将多项式次数限制为n

,则插值多项式不唯一。例如也是一个插值多项式,其中可以是任意多项式。二次插值多项式一条直线一次多项式.例1求经过A(0,1),B(1,2),C(2,3)三个点的二次Lagrange插值多项式.解:插值条件

Lagrange插值公式(利用插值基函数很容易得到):

含义直观,结构紧凑,在理论分析中非常方便;

计算机上实现也很容易.也有一些缺点:一是计算量大,这是显然的;另外,还有一个更严重的缺点,当插值节点增加时,全部插值基函数均要随之变化,整个计算工作必须从头开始:不仅原来的每一项都要改变,还要增加一项计算。

为克服上述两个缺点,

努力:把插值多项式变形为便于计算的形式。希望:计算改变的过程中,尽可能能利用已有的计算结果.下面我们将看到,这是可能的。我们利用所谓的牛顿公式。983.5.3.差商与牛顿插值公式

1.差商

利用插值基函数很容易得到拉格朗日插值多项式,公式结构紧凑,在理论分析中甚为方便,但当插值节点增减时全部插值基函数均要随之变化,整个公式也将发生变化.99其中为待定系数,确定.

为了克服这一缺点,可把插值多项式表示为如下便于计算的形式:可由个插值条件100

当时,

当时,依此递推可得到.

当时,推得推得由,由101

称为函数关于点的一阶差商.称为的二阶差商.定义2102

一般地,称为的阶差商.103

104差商有如下的基本性质:

1°阶差商与节点的排列次序无关。称为差商的对称性.即f[x0,x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论