第二章 误差及分析数据统计处理_第1页
第二章 误差及分析数据统计处理_第2页
第二章 误差及分析数据统计处理_第3页
第二章 误差及分析数据统计处理_第4页
第二章 误差及分析数据统计处理_第5页
已阅读5页,还剩43页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、

误差的表示从理论上说,样品中某一组分的含量必有一个客观存在的真实数据,称之为“真值”。测定值(x)与真实值(µ)之差称为误差(绝对误差)。

误差

E=x-µ误差的大小反映了测定值与真实值之间的符合程度,也即测定结果的准确度。误差有正负,

测定值>真实值,误差为正;测定值<真实值,误差为负。

分析结果的准确度也常用相对误差表示。

相对误差

Er

=E/µ×100%=(x-µ)/µ

×100%用相对误差表示测定结果的准确度更为确切。

二、误差的分类根据误差的性质与产生原因,可将误差分为:系统误差、随机误差和过失误差三类。(一)系统误差

系统误差也称可定误差、可测误差或恒定误差。系统误差是由某种固定原因引起的误差。1、产生的原因(1)方法误差:是由于某一分析方法本身不够完善而造成的。如滴定分析中所选用的指示剂的变色点与化学计量点不相符;又如分析中干扰离子的影响未消除等,都系统地影响测定结果偏高或偏低。(2)仪器误差:是由于所用仪器本身不准确而造成的。如滴定管刻度不准(1ml刻度内只有9个分度值),天平两臂不等长等。(3)试剂误差:是由于实验时所使用的试剂或蒸馏水不纯造成的。例如配制标准溶液所用试剂的纯度要求在99.9%;再如:测定水的硬度时,若所用的蒸馏水含Ca2+、Mg2+等离子,将使测定结果系统偏高。(4)操作误差:是由于操作人员一些主观上的原因而造成的。比如,某些指示剂的颜色由黄色变到橙色即应停止滴定,而有的人由于视觉原因总是滴到偏红色才停止,从而造成误差。2、特点:(1)单向性:使测定结果系统偏高或系统偏低,其大小也有一定规律;(2)重现性:当重复测量时,它会重复出现;(3)可测性:一般说来,产生系统误差的具体原因都是可以找到的,因此也就能够设法加以测定,从而消除它对测定结果的影响。2、特点随机误差的出现表面极无规律,忽大忽小,忽正忽负,但在同样条件下进行多次测定,则可发现随机误差的分布符合正态分布曲线,具有如下特点:(1)、对称性:大小相等的正负误差出现的机会(即几率)相等,而且彼此对称,因而可以互相补偿,使误差的总和为零。这点可以说明为什么多次测定的平均值更接近真实值。(2)、单峰性:小误差出现的几率大,大误差出现的几率小,个别特大误差出现的几率极少。误差有明显的集中趋势,误差分布曲线只有一个峰值。(3)、有界性:小误差测量值出现的机会大,大误差测量值出现的机会小,极大误差的测定值出现的机会更小。实际测定的结果总是被限制在一定的范围内波动。

(4)、抵偿性:误差的算术平均值的极限为零。

有关随机误差分布规律的正态分布曲线将在后面详细介绍。(三)过失误差这种误差不同于上面讨论的两类误差,它是由于操作者粗心大意或操作失误造成的。在分析工作中应避免这类误差的发生。三、偏差

(一)、偏差、平均偏差、相对平均偏差前已指出:误差是测定值与真实值之间的差值。在实际工作中,往往并不知道真实值,一般是用多种方法进行多次平行分析所得到的平均值代替真实值,将某次测定结果与其平均值的差值称为偏差。

偏差

di=xi(个别测定结果)-(平均值)

因此,偏差与误差不同,不能直接衡量测量的准确度的高低,它反映测量结果的符合程度,即精密度的高低。

误差

准确度,偏差

精密度精密度通常用偏差、平均偏差、相对平均偏差或标准偏差的大小来度量。

平均偏差

相对平均偏差

从平均偏差和相对平均偏差的定义式可以看出:平均偏差和相对平均偏差都为正值。显然,平行测定的数据相互越接近,平均偏差或相对平均偏差就越小,分析的精密度越高;反之,平行测定的数据越分散,平均偏差或相对平均偏差就越大,分析的精密度越低。

(二)、标准偏差在引出标准偏差之前,先看下列例题:例:用碘量法测定某铜合金中的铜的百分含量第一批测定结果、第二批测定结果见下表:例:用碘量法测定某铜合金中的铜的百分含量如下第一批测定结果及第二批测定结果:(见下表)∑(Xi-)2=0.99第一批测定值第二批测定值Xi|Xi-|(Xi-

)2Xi|Xi-

|(Xi-

)210.30.30.0910.000.009.80.20.0410.10.10.019.60.40.169.30.7*0.4910.20.20.0410.20.20.0410.10.10.019.90.10.0110.40.40.169.80.20.0410.00.00.0010.50.5*0.259.70.30.099.80.20.0410.20.20.0410.30.30.099.70.30.099.90.10.01=10.0∑|Xi-|=2.4∑(Xi-)2=0.72=10.0∑|Xi-|=2.4=0.24=0.24第一批测定结果及第二批测定结果:(见下表)∑(Xi-)2=0.99第一批测定值第二批测定值Xi|Xi-|(Xi-

)2Xi|Xi-

|(Xi-

)210.30.30.0910.000.009.80.20.0410.10.10.019.60.40.169.30.7*0.4910.20.20.0410.20.20.0410.10.10.019.90.10.0110.40.40.169.80.20.0410.00.00.0010.50.5*0.259.70.30.099.80.20.0410.20.20.0410.30.30.099.70.30.099.90.10.01=10.0∑|Xi-|=2.4∑(Xi-)2=0.72=10.0∑|Xi-|=2.4=0.24=0.24

第一批测定值第二批测定值Xi|Xi-|(Xi-

)2Xi|Xi-

|(Xi-

)210.30.30.0910.000.009.80.20.0410.10.10.019.60.40.169.30.7*0.4910.20.20.0410.20.20.0410.10.10.019.90.10.0110.40.40.169.80.20.0410.00.00.0010.50.5*0.259.70.30.099.80.20.0410.20.20.0410.30.30.099.70.30.099.90.10.01=0.24s1=0.28=0.24s2=0.33∑|Xi-|=2.4=10.0

∑(Xi-)2=0.72

∑|Xi-|=2.4=10.0

∑(Xi-)2=0.99

从这两批数据的个别测定值的偏差来看,第二批较分散,因为其中有两个较大的偏差(上角标*者)。所以用平均偏差反映不出这两批数据的好坏。从表中第三列的计算可以看出:将偏差平方后再加和,所得结果分别为0.72、0.99,清楚看出两批数据的差异。

总体标准偏差(均方根偏差)

µ为无限多次测定的平均值,称为总体平均值。即

显然,在校正系统误差的情况下,µ即为真值。在一般的分析工作中,只做有限次测量,此时的标准偏差表达式为:

标准偏差(样本标准差)

式中n-1称为独立偏差数,也称为自由度。采用偏差的平方求和来计算,可以使大偏差能更显著地反映出来,更好地反映测定数据的精密度。例如:上例中s1=0.28,s2=0.33,可见第一批数据的精密度好。在许多情况下也使用相对标准偏差(亦称变异系数)来说明数据的精密度:

(周一、四)相对标准偏差RSD(%)

(变异系数CV)四、准确度和精密度准确度和精密度的关系可以下例予以说明:

铁含量(%)测定结果示意图

上图为甲乙丙丁四人分析同一标准试样中铁含量的结果。甲所得结果的准确度精密度均好,结果可靠。乙测得的精密度很好,但准确度太低,说明它的测定存在较大的系统误差。丙测定的准确度与精密度都很差,结果当然不可靠。丁测定的精密度很差,但其平均值却很接近真值。但并不能说丁的分析结果很可靠,因为丁的平均值接近真值只是由于较大的正负误差恰好相互抵消才形成的。丁如果少取一次测定值或多做一次测定,都会显著影响其平均值的大小。

可见,高精密度是获得高准确度的必要条件,准确度高的一定要求精密度高。但是精密度高的却不一定准确度高,只有消除了系统误差之后,精密度高,准确度才高。五、随机误差的正态分布当测定值连续变化时,其随机误差的分布特性可用正态分布(又称高斯分布)的正态概率密度函数来表示。

此表达式又称为高斯方程,

是总体平均值,函数y表示x出现的概率密度,也可以理解为在无限多次测量中,测量值x在某一范围内出现的频率。是总体标准偏差,自变量x表示个别测定值,以x值表示横坐标,y值表示纵坐标,就得到测定值的正态分布曲线(p12,图2-2)。若求在x1~x2这个范围内测量值出现的概率,只需对y在此范围内积分

这里的P就是在x1~x2这个范围内测量值出现的概率,在正态分布曲线图上表现为曲线下x=x1和x=x2两条直线之间所夹的面积。

由于高斯方程的表达式较复杂,积分计算无法得到它的解析解。在实用中,通常都是采用数值计算的方法,把每个区间积分结果计算出来,列成积分表,再通过查表解决具体的积分计算问题。

正态分布曲线的形状和位置要受到µ值和值大小的影响,不同的µ值和值就会有不同的正态分布,各种不同的正态分布的数目将是无限多的,显然不可能给每一个正态分布都准备一个积分表。

为了把一个普通的正态分布转换为标准正态分布,

x为测定值,µ为总体平均值,σ总体标准偏差。

设u称为标准正态变量此时高斯方程就转化为只有变量u的函数表达式,

即此式就是标准正态分布曲线方程,从形式上看,标准正态分布与的正态分布完全相同,所以标准正态分布记作N(0,1)。各种不同的正态分布都可以通过上述变化而转换成标准正态分布。以u值为横坐标,误差出现的概率为纵坐标,当测定次数无限多时,得到随机误差标准正态分布曲线,如p12,图2-2。由数值计算的方法可计算出u在不同的取值范围与误差出现的概率有如下关系,p13,表2-1。

u=±1(即测定值在µ±σ区间内),曲线所包围的面积为68.3%,误差出现的几率为68.3%;

u=±2(即测定值在µ±2σ区间内),误差出现的几率为95.5%;

u=±3(即测定值在µ±3σ区间内),误差出现的几率为99.7%,即误差大于3σ的几率仅为0.3%(一千次测量中误差大于3σ的只有3次)。

标准正态分布曲线与横坐标从-∞至+∞之间所包围面积为所有随机误差出现的概率的总和为100%。六、有限次测定中随机误差的t分布曲线

在有限次测定中无法计算总体标准差和总体平均值,其随机误差并不完全符合正态分布,而是服从于t分布。

(与u相比,用s代替σ)

t分布曲线如P14,图2-3。t分布曲线的特点:(1)(2)t在不同的自由度f(f=n-1)下,t分布曲线具有不同的形状。

f对t分布的影响实质上反映的是测量次数n对t分布的影响。

从图3-6可以看出:t分布曲线一般总要比标准正态分布曲线“矮胖”,这表明有限次测量的分布要更分散。

与u的区别在于用有限次测量的标准偏差s代替了总体标准偏差时,s才趋于t分布曲线才与标准正态分布曲线完全吻合,因此也可以把标准正态分布看成是t分布的一个特例。

这个式子表明:真实值µ可能存在于

这个区间之中,此区间称为置信区间。决定置信区间大小的t值,对应着一定的置信概率,这个置信概率称为置信度,也即真值位于该置信区间内的把握。由P14表2-2的t值表可以看出:t值与置信度及测定次数n有关。

首先,当测定次数相同时,置信度越大,t值越大,则置信区间就较宽,测量的精确度下降。反之,置信度越小,t值越小,置信区间就越窄。此时尽管置信区间的准确度提高了,但其可靠性却降低了(见P15,例3)。置信区间的准确性与可靠性是两个相互矛盾、相互制约的因素,为了兼顾这两个方面,通常都将置信度定为90%或95%。在相同置信度下,n越大,置信区间就越小,平均值与真值就越接近,测定的准确性就越高。但当n大于20后,t值的变化不大,再增加测定次数对提高测定结果的准确度已经没有什么意义了。例:分析Fe%,求:(1)置信度为95%时平均值的置信区间

=39.16%,s=0.05%,n=5

解:先查表找出相应的t值,查表(2)如果置信区间为(39.16±0.05)%,问至少测定几次?

由所以

n=2,,t=12.706

n=3,,t=4.303

n=4,,t=3.182

n=5,2.236,t=2.776

n=6,2.449,t=2.571,所以至少需平行测定六次,才能使置信区间为(39.16±0.05)%§2-2分析结果的数据处理

在一组平行测定值中常常出现某一、两个测定值比其余测定值明显地偏大或偏小,我们称之为可疑值(离群值)。比如四次平行测定值为0.1010,0.1012,0.1014和0.1024,其中0.1024与其他三个数据相差较远,究竟应该舍去还是保留?由于可疑值的取舍对结果的平均值影响较大,所以对可疑数值的取舍必须十分慎重,尤其当数据较少时,可疑数据的取舍对结果影响更大,不能为了单纯追求实验结果的精密度高,而随便舍弃可疑数值。必须用统计的方法对可疑数据先进行判断,以决定是否应该舍去。一、可疑测定值的取舍

常用的方法有格鲁布斯(Grubbs)检验法(G检验法)、

Q值检验法等。1、格鲁布斯检验法(G检验法)G检验法适用于测定次数为3-20次。具体步骤如下:

(1)、设有n个测定值,其递增顺序为:其中或可能是可疑数值。(4)、若x1为可疑值时,统计量G算式为:

为可疑值)

(若为可疑值时,统计量G算式为:(为可疑值)

(2)、求出可疑值与平均值之差(3)、求出标准偏差s

查G值表,P17,表2-3,根据测量次数n和测定置信度P查得相应的G

p,n,如果则可疑数据应弃去,否则应保留。

2、Q值检验法Q检验法适用于测定次数为3-10次。具体步骤如下:1.将测得的数据由小到大排列为:其中

或为可疑数值;

2.求出最大与最小数据之差(极差)

;3.求出可疑数据与其最邻近数据之差

或:4.求出舍弃商Q计

(可疑)

(

可疑)5.查Q值表,p18,表2-4,可得相应n值和置信度下的Q表值,若Q计>Q表,则应将极端值舍弃,否则应保留。如果出现Q计=Q表,最好再补测一、二次,再用Q检验法决定取舍。此外如果需对一个以上可疑值决定取舍时,首先检验最小值,然后再检验最大值。

例题:用Na2CO3标定HCl溶液的浓度,测定六次(n=6),结果如下:

0.5050,0.5042,0.5086,0.5063,0.5051,0.5064mol/L问:用Q检验法判断0.5086

是否应舍去?

解:(1)按由小到大排列:

0.5042,0.5050,0.5051,0.5063,0.5064,0.5086

(2)xn-xn-1=0.5086-0.5064=0.0022

(3)xn–x1=0.5086-0.5042=0.0044

(4)

(5)查Q值表,当置信度P=90%,n=6时,Q表=0.56Q计<Q表,所以该值应该保留

Q检验法的优点是设定了一定的置信度(通常为90%)因此判断的确定性较高。缺点是:数据的离散性(xn–x1)越大,Q计反而越小,可疑数据越不能舍去。

例:测定氯化物中氯的百分含量,共测定了8次,所得结果分别为:59.83%,60.04%,60.45%,59.88%,60.33%,60.24%,60.28%,59.77%,试用Grubbs检测法对上述数据作出判断(置信度取95%)

解:将数据按递增顺序排列为:59.77,59.83,59.88,60.04,60.24,60.28,60.33,60.45(%)求出其平均值和标准偏差s为:,s=0.26%

根据Grubbs检验法

查G值表,当n=8和置信度为95%时,,故59.77%和60.45%均应保留。因此,上述8个数据的平均值仍为60.10%

,所以该氯化物中氯的真实含量为:二、平均值与标准值的比较(检查方法的准确度或方法是否可行,显著性检验,t检验)

在分析工作中为了检查某一分析方法是否存在较大的系统误差,可用标准样品作n次测定,然后利用上述检验法,检测测定结果的平均值

与标准值

之间是否存在显著性差异,从而判定某一分析方法是否可靠。作t检验时,先将标准值

与平均值

代入下式,计算t值:

根据所要求的置信度P(通常取95%)和测量次数n,由t值表查出相应的t表值。若t计<t表,说明

没有显著性差异,表示该方法没有系统误差存在,所得结果可靠。若t计>t表,

说明与

存在显著性差异,表示该方法有系统误差存在,所得结果不可靠。例题:采用一种新的方法分析标准钢样中的铬含量

5次测定结果为1.12,1.15,1.13,1.16和1.14%,问这种新方法是否可靠?解:

=1.14,s=0.016,n=5,故

查表:P=0.95,n=5时,t表=2.78由于

,因此认为

之间存在显著差异,此种新方法不可靠。§2-3有效数字及其运算规则一、有效数字

在分析测定工作中,不仅要注意在实验中减少误差,力求准确,还应正确记录和计算实验结果。也就是说表示实验结果的数值即要表示数量的大小,同时也要反映出测量的准确程度。例如,用一般的分析天平称得某物体的质量为0.5180g,这一数值中,0.518是准确的,最后一位数值“0”是估读的,可能有上下一个单位的误差,即其实际质量是0.5180±0.0001g范围内的某一数值。此时称量的绝对误差为±0.0001g,相对误差为

若将上述称量结果写成0.518g,则该物体的实际质量将为0.518±0.001g范围内的某一数值,即绝对误差为±0.001g,而相对误差则为±0.2%。可见记录时多写一位或少写一位“0”数字,从数学角度看关系不大,但是所反映的测量精确度无形中被扩大或缩小了10倍。在分析测定工作中,通常用有效数字来体现测定值的大小及精度。

所谓有效数字,就是指实际上能测量到的数字,通常包括全部准确数字和一位不确定的可疑数字。记录数据和计算结果时,所保留的有效数字只有最后一位是可疑的数字。例如:用感量为百分之一克的台秤称物体的重量,由于仪器本身能准确称到±0.01g,所以物体的重量如果是10.4g,就应写成10.40g,不能写成10.4。如果用万分之一的分析天平称,由于其可称量准至±0.0001g,所以上述重量应写为10.4000g。

从前面的例子中可以看出:有效数字的位数直接与测定的相对误差有关。因此,记录测量数据时,决不要因为最后一位的数字是零而随便舍去。

数据中的“0”要作具体分析,数字中间的0,都是有效数字;数字前的0,都不是有效数字;数字后面的0是有效数字,但要注意进行单位换算时,数字后面用来定位的零不是有效数字,这时最好采用指数形式表示,否则,容易引起有效数字位数的误解。例如:质量为25.0g若换算为毫克,写成25000mg,容易误解为五位有效数字,若写成2.50×104

mg就比较准确的反映有效数字的位数。

(1)分析化学中常遇到的pH、pKa等对数值,其有效数字的位数仅取决于小数部分的位数,其整数部分只说明该数的方次。例如:[H+]=2.1×10-13,pH=12.68,其有效数字为两位,而不是四位。

(2)若第一位有效数字大于或等于8,则有效数字的位数可多算一位。如8.37虽三位但可看做四位有效数字。

(3)定量分析实验数据一般保留四位(例如:求百分含量、浓度、硬度等)

(4)表示误差时,取一位至多两位有效数字即可。

0.2098%0.21%

要注意的几点:

二、有效数字的修约和运算规则1、有效数字的修约规则

数字修约规则和实例

修约规则修约前修约后(小数点后保留一位)

四要舍12.343212.3六要入25.474225.5五后有数要进位2.05212.1五后无数看前方前为奇数就进位0.55000.6前为偶数全舍光0.65000.6

2.05002.0(0视为偶数)

2.545462.5不论舍去多少位都要一次修停当(不要

)2、运算规则(一)加减法运算有效数字的位数应以参加运算的各数据中小数点后位

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论