第四章误差分析及数据的处理_第1页
第四章误差分析及数据的处理_第2页
第四章误差分析及数据的处理_第3页
第四章误差分析及数据的处理_第4页
第四章误差分析及数据的处理_第5页
已阅读5页,还剩114页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

分析化学AnalyticalChemistry主讲:江忠远2023/2/6第四章

误差与实验数据的处理教学目标:1.了解频率分布、正态分布、标准正态分布。2.理解准确度与精密度的关系;选择适当的分析方法、减小测量的相对误差、检验和消除系统误差。2023/2/6教学目标:3.撑握测定值的准确度与精密度的概念、区别、联系;绝对误差、绝对误差、绝对偏差、平均偏差、相对平均偏差、标准偏差、相对标准偏差、总体标准偏差的计算;随机误差的区间概率;置信度与µ的置信区间;可疑值的取舍;显著性检验;有效数字的意义和位数;数字修约规则、有效数字的运算;2023/2/6

第一节误差的基本概念一、准确度与误差1.真值(truevalue,T):是试样中待测组分客观存在的真实含量。2.准确度:是分析结果与真值的相符程度。准确度通常用误差来表示,误差越小,表明分析结果的准确度越高。3.绝对误差:绝对误差是分析结果与真值之差,表示为:Ea=x-T或2023/2/64.相对误差:相对误差是绝对误差与真值的百分比率。表示为:

绝对误差和相对误差都有正负之分。当测定值大于真值时,误差为正,表明测定结果偏高;反之误差为负,表明测定值偏低。在测定的绝对误差相同的条件下,待测组分含量越高,相对误差就越小;反之,相对误差就越大。因此,在实际工作中,常用相对误差表示测定结果的准确度。2023/2/6

5.中位数:即一组测定数据从小至大进行排列时,处于中间的那个数据或中间相邻两个数据的平均值、用中位数表示分析结果比较简单,但存在不能充分利用数据的缺点。

6.真值:由于误差不可避免地存在于测定中,所以任何真值都难以得知。在实际工作中,通常将纯物质中元素的理论含量等于理论真值,国际计量大会上确定的长度、质量和物质的量单位等计量学约定真值,或公认的权威机构发售的标准参考物质(也称为标准试样)给出的参考值等当作真值来使用。2023/2/62023/2/6二、精密度与偏差精密度:表示数次测定值相互接近的程度。它反映了测定值的再现性。精密度与准确度的关系可通过打靶的例子形象地加以说。2023/2/6准确度与精密度2023/2/6(一)绝对偏差、平均偏差和相对平均偏差绝对值偏差平均偏差:

:单次测量偏差的绝对值的平均值.

2023/2/6(二)标准偏差和相对标准偏差总体:一定条件下无限多次测定数据的全体。样本:从总体中抽出的一组测定值。样本大小(样本容量):样本中所含测定值的数目。若样本容量为n,平行测定数据为,则此样本平均值为:当测定次数无限多时,所得的平均值即为总体平均值µ:2023/2/6

无限次测定时,总体的分散程度用总体标准偏差来衡量:有限次测定(n<20)时,采用样本标准偏差S来衡量测定数据的分散程度,并将样本标准偏差简称为标准偏差。式中n为测定次数,f=n-1称为自由度。2023/2/6

标准偏差比平均偏差能更正确、更灵敏地反映测定值的精密度,能更好地说明数据的分散程度。

样本的相对标准偏差(变异系数),简称相对标准偏差:2023/2/6(三)平均值的标准偏差2023/2/6与测定次数n的关系结论:1、增加测次数以提高精密度。

2、增加(过多)测量次数代价不一定能从减小误差得到补偿。般,3-4次就够了,较高要求时可测5-9次。2023/2/62023/2/62023/2/6三、系统误差和随机误差(一)系统误差

系统误差是由分析过程中某些确定的、经常性的因素引起的,因此对测定值的影响比较恒定。系统误差的特点是具有“重复性”、“单向性”和“可测性”。1.方法误差2.仪器和试剂误差

3.操作误差

2023/2/6二、随机误差1.随机误差随机误差又称偶然误差(accidenterror),它是由一此难以控制、无法避免的偶然因素造成的一类误差。它具有大小和正负的不确定性,也称为不确定误差。

2023/2/62.系统误差与随机误差的比较

:项目

系统误差

随机误差

产生原因

固定的因素

不定的因素

分类

方法误差、仪器与试剂误差、主观误差

性质

重现性、单向性(或周期性)、可测性

服从概率统计规律、不可测性影响

准确度

精密度

消除或减小的方法

校正

增加测定的次数

2023/2/63.系统误差与随机误差的关系

系统误差与随机误差经常同时存在,有时也可能相互转化。例如,在重量分析中,称量时试样因严重吸湿会产生系统误差,而因轻微吸湿则可能产生随机误差、又如,滴定管的刻度误差属于系统误差.但因其误差小也可作为随机误差来处理。2023/2/6第二节随机误差的正态分布一、频率分布:

虽然随机误差是由一些偶然因素引起,其大小及正负均具有随机性。但经对大量测定数据进行统计学处理后,可以看出大多数数据是符合或基本符合正态分布规律。

在相同的实验条件下,对某一合金中铁的质量分数(%)进行重复测定,获得以下100个测定值:2023/2/62023/2/6

本例分为10组,再将全部数据由小至大排列成序,算出极差R。本例中R=1.92-1.63=0.29,由极差除以组数可计算出组距:

为了使每个数据只能进入某一组中,避免“骑墙”现象发生,通常将组界值多取一位,且以5为佳。频数(frequency,ni):测定值落在每组内的次数称为频数。频率:频数除以数据总数(n)称为相对一频数或者称频率。2023/2/62023/2/62023/2/6

由表4—1中的数据和图4-4可以看出,测定数据具有明显的集中趋势。在全部测定数据中,位于1.715—1.835之间的数据是大多数(占79%),小于l.685的数据(占5%)和大于1.865的数据(占3%)都很少。上述图形总结出测定值随机分布的特点:

①离散特性,在平均值周韦分布;②集中趋势,测定值向平均值集中;③远离平均值的数据很少。2023/2/6二、正态分布

如果测定数据越多,分组越细,相对频数直方图的多边形就将逐渐趋于一条峰状的平滑曲线,即正态分布(normaldistribution)曲线,测定值及其随机误差大多数是服从正态分布规律的。2023/2/6(一)正态分布曲线的数学表达式

正态分布曲线是由著名数学家高斯(Gauss)在研究误差理论时提出的,又称高斯曲线(Guassiancurve),如图4-4所示。其数学表达式为:y——概率密度;总体平均值,表示无限次测量值集中的趋势。

——总体标准偏差,它为总体平均值μ到曲线拐点的距离,表示无限次测量分散的程度。2023/2/6x——个别测量值;x-——随机误差据此方程所绘制的曲线称正态分布曲线。2023/2/6

1.随机误差的正态分布(ξ分布)将上述正态分布曲线的横坐标x以(测定值)改用随机误差ξ来表示,ξ=x-μ,纵坐标则为误差的概率密度函数f(ξ),就得到随机误差的正态分布曲线(图4-5)随机误差有如下规律性:

(1)正误差与负误差出现的概率相等;

(2)小误差出现的慨率大,大误差出现的概率小,特别大的误差出现的概率极小。2023/2/6第三节有限测定数据的统计处理

正态分布曲线反映了无限次测定数据(或测定次数大于20次)的分布规律。在实际分析工作中,测定次数都是有限的(n<20),其随机误差因此不服从正态分布。如何根据有限的测定值,合理地推断总体的情况,就需要对它们进行统计处理。2023/2/6一、t分布曲线对于有限次数测定,μ和σ都未知。在这种情况下,只能用样本标准偏差S来表示测定数据的分散情况。但若简单地用S代替σ,按理论上的正态分布去处理数据,必然会引起误差,而且测定次数越少,误差就越大。为了解决这个问题,英国统计学家兼化学家戈塞特(W.S.Gosset)在1908年提出用t值代替u值,以对上述误差进行补偿。t定义为:2023/2/6这时随机误差已不遵从正态分布而呈t分布(studentdistribution)(图4-7)。2023/2/6分布曲线反映了有限次测定数据及其随机误差的分布规律(n<20),其中纵坐标仍然为概率密度,横坐标为统计量t值)从图4-7可以看出,t分布曲线与标准正态分布曲线相似,都是对称分布,只是t分布随自由度f(f=n-1)而变化。

随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当n→∞时,t分布就趋近于标准正态分布,因此可认为标准正态分布就是t分布的极限。2023/2/62023/2/6

置信度(confidence,P)表示样本平均值出现在显然,出现在此区间之外的概率为(1-P)。(1-P)称为显著性水平,用α表示,即α=1-P。由于t值与置信度和自由度均有关,使用时常加脚注说明,一般表示为。例如,例如表示置信度为95%,自由度为10时的t值。

表4—3中的数据可知,f值较小时(例如f<10),t与u相差较大;随着自由度的增加,t值逐渐减小并与u值接近,当f=20时,t与u已经相当接近、当f→∞时,t→u,s→σ。在引用t值时,一般取置信度为95%。2023/2/6二、平均值的置信区间

置信区间(confidenceinterval):它指在一定置信度(所作判断有把握的程度)下,以测定结果为中心,包含总体平均值的取值范围。2023/2/6

该范围愈小,说明测定值与μ愈接近,即测定的准确度愈高。在消除了系统误差之后,总体平均值即为真值,因此仅通过有限次数的测定,就可以计算出以一定的概率包含真值的取值范围,这就是置信区问的意义所在。

但是由于测定次数较少,由此计算出的置信区间不可能以百分之百的把握将μ包含在内,只能以一定的置信度进行判断,一般应用下列两种方法进行计算:2023/2/6

(一)已知总体标准偏差σ的情况此时,既可根据单次测定值(x),也可用样本平均值()进行计算,用平均值时精密度高一此,由u的定义式(4—14)可知:2023/2/62023/2/6(二)已知样本标准偏差S的情况对于少量测定数据,已知S时,必须根据t分布进行统计处理。2023/2/62023/2/6

计算结果表明,置信度越高,置信区间就越宽。这就是说,要使判断的可靠性增在,所给的区间就会加宽。区间的大小反映了估计的准确程度,而置信度高低说明估计的把握程度、100%的置信度意味着在无限大的区间内肯定会包含μ,但是这样的区间毫无意义。

置信度的大小应根据实际工作的需要而定,在分析化学中,通常将置信度定为95%或90%。2023/2/6

必须指出的是,对例4-5中的置信区间,应理解为“在50.47%-50.49%的区间中包含总体平均值μ的把握有95%”;

但若理解为“未来测定的实验数据,可能有95%将落入50.47%-50.49%区间内”就是错误的。2023/2/6三、显著性检验

经常遇到这样一些情况,某一分析人员对标准试样进行分析,所得分析结果的平均值与标准值不完全一致;或者采用两种不同的分析方法对同一试样进行分析,得到的两组数据的平均值也不完全相符。还经常遇到这样的情况,两个不同分析人员、不同实验室或采用不同的分析方法对同一试样进行分析时,两组数据的平均值也存在较大的差异。2023/2/6如果上述分析结果之间存在明显的系统误差,就认为它们之间有“显著性差异”;否则,就没有显著性差异,也就是说,分析结果之间的差异纯属随机误差引起的,属于正常的原因。

这种判断显著性差异的方法称为显著性检验(significanttest),其实质是对一分析结果或分析方法的准确度作出评价。

在分析化学中经常遇到下列三种情况:2023/2/6

(一)平均值与标准值的比较(t检验法)t检验法是样本平均值置信区间的一种应用。当样本的随机误差遵从t分布时,考虑到已消除系统误差后的总体平均值μ即是标准值(视为真值T)。由公式(4-21)得:2023/2/6为了检验某一方法或某一操作过程是否存在系统误差,可对标准试样进行n次平行测定,并将所得数据代入式4-22中求出t值。再根据确定的置信度和已知的自由度,从表4-3中查出相应的t值,若计算出的中心的某区间已按指定的置信度将真值T包含在内,即两者之间不存在显著性差异,该差异由随机误差引起。反之则认为之间存在系统误差。2023/2/62023/2/6(二)两组数据平均值精密度的比较(F检验法)

F检验法是通过比较两组数据的方差s2,以判定它们的精密度是否存在显著性差异的方法。首先计算出,它们分别代表方差较大和较小的那组数据的方差,其次根据下式计算F值:2023/2/62023/2/62023/2/62023/2/62023/2/62023/2/6

(三)两组平均值的比较(F检验和t检验)

不同分析人员或同一分析人员采用不同的方法分析同一试样,所得到的平均值一般是不相等的。如何判断这两组数据之间是否存在系统误差,即两组平均值之间是否存在显著性差异?这类问题的回答,亦可用t检验法。2023/2/62023/2/6

应强调指出,如果两组平均值的精密度之间存在显著性差异,则表明方差较大的那组数据因测定的精密度低,其准确度已值得怀疑,因此不必再对两个平均值进行t检验。2023/2/62023/2/62023/2/6二、可疑测定值的取舍

在一组平行测定数据中,常会出现与其他结果相差较大的个别测定值,该值称为可疑值或异常值(也叫离群值或极端值等)。对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。

如果已经确定测定过程中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计学方法进行检验,然后再对取舍作出判断。以下介绍使用简便的Q检验法和效果较好的格鲁布斯(Grubbs)法。。2023/2/6(一)Q检验法2023/2/62023/2/6(二)格鲁布斯法2023/2/62023/2/62023/2/6

在运用格鲁布斯法判断可疑值的取舍时,由于引入了t分布中最基本的两个参数,故该方法的准确度较Q检验法高,因此得到普遍采用。2023/2/6第四节提高分析结果准确度的方法一、选择适当的分析方法

根据试样的组成和性质等,结合对测定准确度的要求选择合适的、有相应准确度的方法,制订正确的分析方案是取得准确结果的重要因素。

各种分析方法的准确度和灵敏度各异,重量分析法和滴定分析法测定的准确度高但灵敏度低,适用于常量组分的分析;而仪器分析法具有较高的灵敏度,但是其准确度较低,适用于微量或痕量组分含量的测定。一般来讲,相对误差小的适用于常量分析;相对误差大的适用于微量或痕量组分含量的测定。2023/2/6二、减小分析过程中的误差

(一)减小测定误差分析天平的绝对误差是2023/2/6在滴定分析中,滴定管读数误差一般为,为了使读数的相对误差小于0.1%,滴定时所消耗的滴定剂的体积就应在20mL以上;若使用25ml的滴定管,则一般将滴定剂的体积控制在18-22ml之间。

若吸光光度法的相对误差为2%,那么理论上只要称样时大于0.002g/2%=0.01g 就可以满足要求了。2023/2/6(二)适当增加平行测定次数,减少随机误差

一般定量分析中,平行测定3-4次;对测定结果的准确度要求较高时,测定次数为10次左右。2023/2/6(三)消除测定过程中的系统误差1.系统误差的检验对照试验用于检验和消除方法误差

(1)用标准试样进行对照试验

用待检验的分析方法测定某标准试样,并将测定结果与标准值进行比较,从而判断该方法是否存在系统误差:由于标准试样的数量和品种有限,所以有些单位采用自制的“管理样”进行对照试验;有时也可根据试样的大致组成用纯物质制成“人工合成样”进行对照试验。2023/2/6

(2)用标准方法进行对照试验

没有合适的标准试样时,常采用标准方法或公认的经典方法进行对照试验。即用被检验的方法和标准方法对某试样同时进行测定,然后对两种方法的测定结果进行统计学检验、如果判断两种方法之间确有系统误差存在,则需找出原因并予以校正。

若没有合适的标准方法或公认的经典方法时,也可以采用文献报道的同类方法进行对照试验。2023/2/6(3)采用回收法进行试验

当不具备上述两种条件时,也可以采用回收法。回收法就是在待测定的试样或试液中加入已知量的欲测定组分,进行多次平行测定,计算回收率(recovery):

根据回收率是否满足准确度的要求,判断方法是否可靠。例如,要求方法的相对误差小1%,则回收率应99%-101%范围内。2023/2/6

此外在实际工作中,为了检查分析人员之间的操作是否存在系统误差或确定一批试样分析结果的可靠性,常将一部分试样重复安排给不同的分析者进行测定,称之为“内检”、有时又将部分试样送交其他单位进行测定,称之为“外检”。

2023/2/6

2.系统误差的消除

如果经对照试验表明有系统误差存在,则应设法找出其产生的原因并加以消除,通常采用以下方法:

(1)空自试验

由试剂、蒸馏水、实验器皿和环境带入的杂质所引起的系统误差,可通过空自试验来扣除。

空自试验是在不加试样的情况下,按照试样的分析步骤和条件而进行的分析试验,所得的结果称为空自值,从试样测定结果中扣除空白值就起到了校正误差的作用。2023/2/6空白值一般应该比较小,经扣除后就可以得到比较可靠的测定结果。如果空白值较大,就应该通过提纯试剂、改用纯度较高的溶剂或采用其他更合适的分析器皿等来解决问题,才能提高测定结果的准确度。

空自试验对微(痕)最组分的测定具有很重要的意义、至于应选取何种纯度的试剂和溶剂,应根据测定的要求而定,而不应盲目使用高纯度的试剂,以免造成浪费。2023/2/6(2)校准仪器和量器

对于仪器不准确引起的系统误差,可通过校准仪器来减免。在准确度要求较高的分析中,对所用滴定管、移液管、容量瓶和天平等都必须进行校准,计算测定结果时应采用校准值,以消除仪器和量器不准确带来的误差。

当允许测定结果的相对误差大于0.1%时,一般不需要校准仪器。2023/2/6

(3)校正方法

某些分析方法的系统误差可辅以其他方法进行校正。例如,重量分析法测定SiO2时,滤液中的硅,可用光度分析法测定后再加到重量分析法的结果中去。

综上所述,选择合适的分析方法;尽量减小测定误差;适当增加平行测定的次数;消除或校正系统误差;杜绝过失,就可以提高分析结果的准确度。2023/2/6

分析结果的正确表示也是分析过程中的一个重要环节,故不仅要表明其数值的大小,还应该反映出测定的准确度、精密度及次数。

采用置信区间也是表示分析结果的常用方式之一。

此外还应特别注意分析结果的有效数字,其位数必须与测定方法和仪器的准确度一致。2023/2/62023/2/62023/2/6三、分析化学中的质量保证与质量控制

每种方法获得的一组分析结果中,都存在一定的随机误差。为了保证分析结果准确可靠,需对可能影响测定结果的各种因素和测定环节进行全面的控制和管理,使之处于受控状态。因此建立一个完善的实验室质星保证体系,对整个分析过程进行质量控制,就显得异常要。2023/2/6第五节有效数字及其运算规则

在定量分析中,欲得到准确可靠的分析结果,不仅要准确地测定每个数据,而且还要进行正确的记录和计算。

由于测定值不仅表不仅表示试样中被测组分的含量,而且还反映了测定的准确程度,因此,在记录实验数据和计算结果中,保留几位数字不是任意确定的,而是应根据测量仪器和分析方法的准确度而定。2023/2/6一、有效数字的意义和位数

1.有效数字——实际上能测量得到的数字(即具有实际意义的数字)。它由全部准确数字和最后一位不确定数字组成。2.计算有效数字位数时,必须注意“0”的位置。3.对于非测量所得的数字,如倍数、分数关系、它们没有不确定性,其有效数字可视为无限多位。2023/2/64.等对数和负对数值,其有效数字的位数仅取决于小数点后数字的位数,因其整数部分只说明了该数据的方次。5.在乘除运算中,如果有效数字位数最少的因数的首数是“8”或“9”,则积或商的有效数字可以比这个因数多取一位。如:2023/2/6二、数字修约规则

“四舍六入五留双”。即:当尾数≤4时舍去;当尾数≥6时进位;当尾数为5而后面的数为0时,则偶舍奇入;当尾数为5,而后有不是零的数时进位。0.55764→0.5576;0.28366→0.2837;1.02150→1.022;5.14250→4.142;12.3050→12.30;18.06501→18.07

注意:进行数字修约时只能一次修约完成,不能分步修约。2023/2/6三、有效数字的运算规则—先修约,后计算(一)加减法

计算结果的小数点后的位数应以参加运算各数据中小数点后位数最少(即绝对误差最大)的那个数为依据。2023/2/6(二)乘除法计算结果的有效数字位数应以参加运算各数据中有效数字位数最少(即相对误差最大)的那个数为依据。(1)运算中,若有效数字位数最少的因数的首数为“8”或“9”,则积或商的有效数字位数可比这个因数多取一位。(2)采用计算器进行计算时,一般不对中间每一步骤的计算结果进行修约,仅对最后的结果进行修约。2023/2/6四、有效数字运算规则在分析化学中的应用1.正确记录测定值,只保留一位不确定数字;2.在计算测定结果这前,先根据运算方法(加减或乘除)正确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约后计算。最后的计算结果需保留几位有效数字,一要符合事先确定的情况。2023/2/63.分析化学中的计算主要有两大类。一类是各种化学平衡中有关浓度的计算。此时可依照上述平衡常数的位数来确定计算结果的有效数字的位数,一般为两至三位。

4分析结果的表示:高含

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论