第2章 误差及分析数据的统计处理_第1页
第2章 误差及分析数据的统计处理_第2页
第2章 误差及分析数据的统计处理_第3页
第2章 误差及分析数据的统计处理_第4页
第2章 误差及分析数据的统计处理_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

误差及分析数据的统计处理第二章最可靠的分析方法最精密的仪器熟练的操作人员不能得到绝对准确的结果误差是客观存在的误差产生的原因及出现规律,减小误差对数据进行正确统计处理本章内容最可靠的数据2.1有关误差的一些基本概念1.误差(Error):测量值(xi)与真值(μ)之间的差值(E)。绝对误差(Absoluteerror):表示测量值与真值的差。

E=Xi-μ相对误差(Relativeerror):表示误差在真值中所占的百分率。

建立误差的意义:估计真值误差的大小反映了准确度的高低,误差的绝对值越小,准确度越高

2.真值

(Truevalue)某一物理量本身具有的客观存在的真实值。

真值是未知的量。①纯物质的理论值(如化合物的理论组成,NaCl中Cl-的含量)②计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等,以及标准参考物质书上给出的数值)③相对真值(如高一级精度的测量值相对于低一级精度的测量值)(例如,标准样品的标准值)在特定情况下认为

是已知的:

某黄铜标样中Pb和Zn的含量分别为2.00%和20.00%,试验测定结果分别为2.02%和20.02%,试比较两组测定结果的准确度。解:Pb的测定绝对误差d=2.02%-2.00%=+0.02%

相对误差dr=+0.02%/2.00%=+1%Zn的测定绝对误差d=20.02%-20.00%=+0.02%

相对误差dr=+20.02%/20.00%=+0.1%6设一组平行测定值为x1、x2、x3、•••xn,那么平均值为:3.偏差(deviation):平均值是一组平行测定值中出现可能性最大的值,代表数据的平均水平和集中趋势,但不能反映测定数据的分散程度。偏差(d):个别测定值与平均值之差表示精密度高低的量,偏差越小精密度越高。绝对偏差(d):单次测量值与平均值之差相对偏差(dr):绝对偏差占平均值的百分比平均偏差:各测量值绝对偏差的算术平均值

相对平均偏差:平均偏差占平均值的百分比

测定HCl和NaOH溶液的体积比。4次测定结果如下。求测定的平均偏差和相对平均偏差。

VHCl/VNaOH1.0011.0051.0001.0021.002

解:d=x-xx1.0011.0051.0001.002d-0.001+0.003-0.0020.000d=(|-0.001|+|+0.003|+|-0.002|+|-0.000|)/4=0.002d/x×100%=0.002/1.002×100%=0.2%标准偏差:

相对标准偏差(变异系数)μ未知μ已知

标准偏差可以将较大偏差显著地表示出来。

5.精密度(Precision)

4.准确度(Accuracy)测量值与真实值相符合的程度,用误差表示。测定值越接近真值,准确度越高。表示各次分析结果相互接近的程度,用偏差表示。如数据较分散,则精密度较差。

例:A、B、C、D四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。表观准确度高,精密度低准确度高,精密度高准确度低,精密度高准确度低,精密度低准确度与精密度的关系重点准确度高,要求精密度一定高但精密度好,准确度不一定高(存在大的系统误差)准确度反映了测量结果的正确性精密度反映了测量结果的重现性精密度是保证准确度的前提精密度高,不一定准确度就高1.系统误差(DeterminateError,可测误差)是由测定过程中某些经常性的、固定的原因造成的比较恒定的误差。系统误差影响分析结果的准确度,对精密度影响不大。

2.随机误差(IndeterminateErrors,偶然误差)

由一些偶然的不确定的因素所引起。偶然误差影响

精密度

2.2误差的分类及减免误差的方法3.系统误差产生的原因①方法误差:方法不恰当产生(如反应不完全;

干扰成分的影响;指示剂选择不当)②仪器误差:仪器不精确产生(如容量器皿刻度不

准又未经校正,电子仪器“噪声”过

大等造成)③试剂误差:试剂中含被测组分或不纯组分产生(试剂或蒸馏水纯度不够)④操作误差:操作方法不当引起(如观察颜色偏深

或偏浅,第二次读数总是想与第一次

重复等造成)(1)重复性:同一条件下,重复测定中,重复地出现;(2)单向性:测定结果系统偏高或偏低;(3)恒定性:大小基本不变,对测定结果的影响固定。(4)可校正性:其大小可以测定,可对结果进行校正4.系统误差的性质5.系统误差的校正方法误差——方法校正操作误差——对照实验校正(外检)仪器误差——对照实验校正试剂误差——空白实验校正对照实验和空白实验:(1)对照试验:选择一种标准方法与所用方法作对比或选择与试样组成接近的标准试样作试验,找出校正值加以校正。(2)空白试验:除了不加试样外,其他试验步骤与试样试验步骤完全一样的实验,所得结果称为空白值。空白试验扣除空白值加以修正试剂或实验用水是否带入被测成份或所含杂质是否有干扰是否存在系统误差回收试验回收试验

在测定试样某组分含量(x1)的基础上,加入已知量的该组分(x2),再次测定其组分含量(x3)。由回收试验所得数据计算出回收率。由回收率的高低来判断有无系统误差存在。常量组分:一般为99%以上,微量组分:90~110%。6.随机误差的正态分布由一些无法控制的不确定因素所引起的,如:环境温度、湿度、电压、污染情况等的变化引起试样质量、组成、仪器性能等的微小变化。操作人员实验过程中操作上的微小差别。其他不确定因素误差值时大时小,时正时负,难以找到具体的原因,更无法测量该值。

多次测量结果表明,随机误差仍符合一定规律。重点测定次数无限多;系统误差已经排除。前提6.1随机误差分布特性对称性:大小相近的正负误差出现的概率相等,误差分布曲线对称单峰性:小误差出现的概率大,大误差的概率小。误差分布曲线只有一个峰值。误差有明显集中趋势(3)有界性:由随机误差造成的误差不可能很大,即大误差出现的概率很小;(4)抵偿性;误差的算术平均值的极限为零。定义横坐标:随机误差的值纵坐标:误差出现概率大小

:总体平均值,即σ:总体标准偏差,即Sx-μ:随机误差y:概率密度;x:测量值μ:总体平均值,即无限次测定数据的平均值,无系统误差时即为真值;反映测量值分布的集中趋势。σ:标准偏差,反映测量值分布的分散程度;

值小,数据集中,曲线瘦高;值大,数据分散,曲线矮胖x-μ:随机误差高斯方程正态分布曲线反映出随机误差的规律:小误差出现的概率大,大误差出现的概率小,特别大的误差出现的概率极小,正误差和负误差出现的概率是相等的。由于正态分布曲线的形状随

而异,若将横坐标改用u表示,则正态分布曲线都归结为一条曲线,此时得到的曲线与的大小无关。这样的分布称为标准正态分布。6.2误差范围与出现的概率之间的关系正态分布曲线下面的面积表示全部数据出现概率的总和,显然应当是100%(即为1)随机误差在某一区间内出现的概率,可取不同的u值通过积分得到。

7.置信度与置信区间置信度(ConfidenceLevel):在某一定范围内测定值或误差出现的概率

68.3%,95.5%,99.7%即为置信度μ±σ,μ±2σ,μ±3σ等称为置信区间。置信度选得高,置信区间就宽。一定置信度下,知道了任何单次测定值,无限次测量的算术平均值µ的可能范围(x±uσ),称为置信区间。8.有限次测定中随机误差服从t

分布有限次测定无法计算总体标准差σ和总体平均值μ,则随机误差并不完全服从正态分布,服从类似于正态分布的t

分布。

t的定义与u

一致,用s

代替σ,t

分布曲线随自由度f(f=n-1)而变,当f>20时,与正态分布曲线很近似,当f→∞时,二者一致。t值与置信度p和自由度

f有关。由式:置信区间的宽窄与置信度、测定值的精密度和测定次数有关,当测定值精密度↑(s值小),测定次数愈多(n↑)时,置信区间↓,即平均值愈接近真值,平均值愈可靠。得:平均值的置信区间它表示在一定置信度下,以平均值

为中心,包括总体平均值

μ

的范围。在一定置信度下(如95%),真值(总体平均值)将在测定平均值附近的一个区间即()之间存在,把握程度95%。

,,置信度↑,置信区间↑,其区间包括真值的可能性↑,一般将置信度定为95%或90%。μ是客观存在的,没有随机性,不能说它落在某一区间的概率是多少;只能说某区间包括总体平均值的概率是多少。例测定SiO2的质量分数,得到下列数据,求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。28.62,28.59,28.51,28.48,28.52,28.63解:查表2-2置信度为90%,n=6时,t=2.015。置信度为95%时:置信度↑置信区间↑测定钢中含铬量时,先测定两次,测得的质量分数为1.12%和1.15%;再测定三次,测得的数据为1.11%,1.16%和1.12%。计算两次测定和五次测定平均值的置信区间(95%置信度)。查表2-2,得t95%=12.7解:n=2时例

n=5时:查表2-2,得t95%=2.78在一定测定次数范围内,适当增加测定次数,可使置信区间显著缩小,即可使测定的平均值与总体平均值μ接近。系统误差与随机误差的比较9.公差公差:生产部门对于分析结果允许误差的一种表示法超差:分析结果超出允许的公差范围。需重做。公差的确定:(1)组成较复杂的分析,允许公差范围宽一些;(2)一般工业分析,允许相对误差在百分之几到千分之几;(3)原子质量的测定,要求相对误差很小;(4)国家规定。2.3分析结果的数据处理

为什么要对数据进行处理?个别偏离较大的数据(称为离群值或极值)是保留还是该弃去?测得的平均值与真值(或标准值)的差异,是否合理?相同方法测得的两组数据或用两种不同方法对同一试样测得的两组数据间的差异是否在允许的范围内?

数据进行处理包括哪些方面?可疑数据的取舍——过失误差的判断分析方法的准确度(可靠性)——系统误差的判断测定碱灰总碱量(%Na2O)得到6个数据,按其大小顺序排列为40.02,40.12,40.16,40.18,40.18,40.20。第一个数据可疑,不舍去第一个数据,这组数据的平均值是40.14;若舍去第一个数据,五个数据的平均值是40.17。必须按照科学的统计方法来决定数据的取舍。例题2.3.1可疑数据的取舍1.Grubbs

法(4)由测定次数和要求的置信度(置信度选择95%),查表得G

表(5)比较若G计算>G

表弃去可疑值,反之保留。

(1)排序:将测量的数据按大小顺序排列x1,x2,

x3,x4……

xn,x1<x2<

x3<……<xn

其中x1或xn是可疑值(2)求

和标准偏差s(3)计算G值:2.Q值检验法(测定次数小于10次)(1)测量的数据按大小顺序排列:x1

x2……xn(2)求极差xn-x1(3)求可疑数据与相邻差:xn-xn-1或x2-x1(4)计算:(5)根据测定次数和要求的置信度,(如90%)查表2-4:(6)将Q与Qx(如Q90)相比,若Q>Qx

舍弃该数据,(过失误差造成)若Q≤Qx

保留该数据,(随机误差所致)例测定某药物中Co的含量(10-4)得到结果如下:1.25,1.27,1.31,1.40,用Grubbs法和Q值检验法判断1.40是否保留。查表2-3,置信度选95%,n=4,G表=1.46

G计算<G表故1.40应保留。解:①用Grubbs法:x=1.31;s=0.066②用Q值检验法:可疑值xn查表2-4,n=4,

Q0.90=0.76Q计算<Q0.90故1.40应保留。讨论:(1)Q值法不必计算x

及s,使用比较方便;(2)Q值法在统计上有可能保留离群较远的值。(3)Grubbs法引入s,判断更准确。(4)不能追求精密度而随意丢弃数据;必须进行检验;例:三个测定值,40.12,40.16和40.18置信区间:40.07~40.23之间(置信度为95%)。置信区间:40.04~40.30,变大。舍去40.12:

用4d法判断异常值的取舍时,首先求出除异常值外的其余数据的平均值和平均偏差d,然后将异常值与平均值进行比较,如绝对差值大于4d,则将可疑值舍去,否则保留。当4d法与其他检验法矛盾时,以其他法则为准。2.3.2平均值与标准值的比较(方法准确性)

检验一个分析方法是否可靠,常用已知含量的标准试样,用t检验法将测定平均值与已知值(标样值)比较:若t计算>t表,则与已知值有显著差别(存在系统误差)若t计算≤t表,正常差异(随机误差引起的)。例用一种新方法来测定试样含铜量,用含量为11.7mg/kg的标准试样,进行五次测定,所得数据为:10.9,11.8,10.9,10.3,10.0判断该方法是否可行?(是否存在系统误差)。解:计算平均值=10.8,标准偏差S=0.7查表2-2t值表,t(0.95,n=5)=2.78t计算

>t表说明该方法存在系统误差,结果偏低。2.3.3两个平均值的比较相同试样、两种分析方法所得平均值的比较(缺标准值时)

——系统误差的判断对两个分析人员测定相同试样所得结果进行评价;对两个单位测定相同试样所得结果进行评价;对两种方法进行比较,即是否有系统误差存在;判断方法:

t检验法+F

检验法前提:两个平均值的精密度没有大的差别。F

检验法也称方差比检验:若F计算<F表,(F表,查表2-5),再继续用t检验判断是否有显著性差异;若F计算>F表,被检验的分析方法存在较大的系统误差t检验式:S大和S小分别代表两组数据中标准偏差大的数值和小的数值例甲、乙二人对同一试样用不同方法进行测定,得两组测定值:甲:1.26,1.25,1.22乙:1.35,1.31,1.33,1.34问两种方法间有无显著性差异?解:n甲

=3S甲

=0.021n乙

=4S乙=0.017说明两组的方差无显著性差异。可以进一步用t公式进行计算。<9.55

(F值查表2-5)再进行

t检验:查表2-2t值表f=n1+n2-2=3+4-2=5,n=6,置信度95%t表=2.57,t计算>t表表明二人采用的不同方法间存在显著性差异上例的讨论:计算表明甲乙二人采用的不同方法间存在显著性差异;如何进一步查明哪种方法可行:分别与标准方法或使用标准样品进行对照试验,根据实验结果进行判断。系统误差有多大:本例中两种方法所得平均值的差为:其中包含了系统误差和偶然误差。2.4误差的传递

分析结果包含了多步计算;每个测量值的误差将传递到最后的结果中去,传递方式随误差的性质而不同。2.4.1系统误差的传递公式

如以测定量A、B、C为基础,得出分析结果R1.加减法运算:R=A+B–C

分析结果最大可能的绝对误差:各个测定值绝对误差之和(△R)max=△A+△B+△C2.乘除法运算:R=AB/C分析结果最大可能的相对误差:各个测定值相对误差之和

最大可能误差,即各测定量的误差相互累加。但在实际工作中,各测定量的误差可能相互部分抵消使得分析结果的误差比计算的最大可能误差要小。若R=m(AB/C),误差传递公式同上。2.4.2随机误差的传递公式1.加减法运算:

式中:S为标准偏差,SA即A的标准偏差。2.乘除法运算分析结果的标准偏差的平方是各测量值标准偏差的平方之和分析结果的相对偏差的平方等于各测量值的相对偏差平方之和2.5有效数字及其运算规则

2.5.1有效数字1.实验过程中遇到的两类数字(1)非测量值如测定次数;倍数;系数;分数;常数(π)有效数字位数可看作无限多位。按计算式中需要而定。(2)测量值或计算值

有效数字:就是在实验中实际测到的数字,数据位数反映测量的精确程度。

可疑数字:有效数字的最后一位数字,通常为估计值,不准确。一般有效数字的最后一位数字有±1个单位的误差重点如根据滴定管上的刻度可以读出:12.34mL,该数字是从实验中得到的,因此这四位数字都是有效数字。最后一位数字4是估计值,是可疑数字。又如用万分之一天平称样品质量得0.1053克,此四位数字就是有效数字。2.有关有效数字的讨论

(1)正确记录实验数据(2)实验记录的数字不仅表示数量的大小,而且要正确地反映测量的精确程度。(3)一般有效数字的最后一位数字有±1个单位的误差,而其它各位数都是确定的。结果绝对偏差有效数字位数0.51800±0.0000150.5180±0.000140.518±0.0013(4)数据中零的作用数字零在数据中具有双重作用:

a.作普通数字用,如0.5180;4位有效数字5.18010-1

b.作定位用,如0.0518;3位有效数字5.1810-2(5)注意点

a.容量器皿:滴定管,移液管,容量瓶;4位有效数字

b.分析天平(万分之一)取4位有效数字

c.标准溶液的浓度,用4位有效数字表示:0.1000mol/L

3、确定有效数字的位数①有零的数字1.00085位0.03823位,0.10004位②整数:43184位;542位③对数值:其有效数字的位数仅取决于小数部分(尾数)

数字的位数。pH5.11位pH8.722位→[H+]=1.9×10-9mol.L-1

lgX=2.38

2位→lg(2.4102)④分数、倍数:视为无限多位有效数字。如:1/2,1000重点2.5.2有效数字的修约规则1.为什么要进行修约?有效数字位数能正确表达实验的准确度,舍去多余数字的过程,称为数字修约2.修约规则:“四舍六入五留双”(1)当多余尾数≤4时舍去尾数,≥6时进位。(2)尾数正好是5时分两种情况:

a.若5后数字不为0,一律进位,0.1067534

b.5后无数或为0,采用5前是奇数则将5进位,5前是偶数则把5舍弃,简称“奇进偶舍”。

(1)示例:保留四位有效数字,修约:14.2442→14.2426.4863→26.4915.0250→

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论