第2章分析数据的误差与统计处理-new_第1页
第2章分析数据的误差与统计处理-new_第2页
第2章分析数据的误差与统计处理-new_第3页
第2章分析数据的误差与统计处理-new_第4页
第2章分析数据的误差与统计处理-new_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

误差客观存在定量分析数据的归纳和取舍(有效数字)计算误差,评估和表达结果的可靠性和精密度了解误差的原因和规律,减小误差,使测量结果趋于真值第二章分析数据的误差及统计处理

2023/2/3

2.1分析数据的准确度和精密度误差客观存在,不可避免,但可采取有效措施减小误差,使测量结果尽可能准确反应待测样品的真实含量。定量分析要求一定的准确度,但是实际测量过程中,受分析方法、测量仪器、所用试剂、和操作者主观因素等影响,是测量值和真值不可能完全一致。即使同一个人,用同一台仪器,同一种方法对同一个样品进行多次测量,也不可能得到完全一致的结果。3定义:由于某种确定的原因引起的误差,也称可测误差分类:1).方法误差:由于不适当的实验设计或所选方法不恰当所引起溶解损失终点误差①重现性②单向性③可测性特点:1.系统误差2.1.1误差的分类42).仪器误差:由于仪器未经校准或有缺陷所引起。刻度不准砝码磨损3).试剂误差:试剂变质失效或杂质超标等不合格所引起蒸馏水显色剂54).操作误差:定义:由一些不确定的偶然因素所引起的误差,也叫随机误差.分析者的习惯性操作与正确操作有一定差异所引起。

颜色观察水平读数2.偶然误差6特点:不具单向性(大小、正负不定);不可消除(原因不定)但可减小(增加测定次数);分布服从统计学规律(正态分布);2.偶然误差

产生原因:主要是偶然的,难以控制的因素,如环境温度变化,空气湿度变化,气压变化等等实际分析测试,系统误差和偶尔误差可能同时存在7

(

1)准确度──分析结果与真实值的接近程度准确度的高低用误差的大小来衡量;误差一般用绝对误差和相对误差来表示。(2)精密度──几次平衡测定结果相互接近程度精密度的高低用偏差来衡量,偏差是指个别测定值与平均值之间的差值。准确度和精密度——分析结果的衡量指标8一准确度和误差1.准确度指测量结果与真值的接近程度,反映了测量的正确性,越接近准确度越高。2.误差准确度的高低可用误差来表示。误差有绝对误差和相对误差之分。(1)绝对误差:测量值与真实值之差

9(2)相对误差:绝对误差占真实值的百分比例题:用分析天平称两个重量,一是0.0021g(真值为0.0022g),另一是0.5432g(真值为0.5431g)。两个重量的绝对误差分别是(-0.0001/0.0022)×100%=-4.8%(+0.0001/0.5431)×100%=+0.018%相对误差分别是-0.0001g,+0.0001g,10(2)约定真值:

由国际权威机构国际计量大会定义的单位、数值,如时间、长度、原子量、物质的量等3.真值与标准参考物质真值:客观存在,但绝对真值不可测(1)理论真值理论上存在、计算推导出来如:三角形内角和180°如:基准米(λ:氪-86的能级跃迁在真空中的辐射波长)1m=1650763.73λ11

由某一行业或领域内的权威机构严格按标准方法获得的测量值。(3)相对真值:如卫生部药品检定所派发的标准参考物质,其证书上所表明的含量(4)标准参考物质具有相对真值并具有证书的物质,也称为标准品,标样,对照品。

标准参考物质应有很好的均匀性和稳定性,其含量测量的准确度至少要高于实际测量的3倍。12二、精密度与偏差指平行测量值之间的相互接近的程度,反映了测量的重现性,越接近精密度越高。1.精密度受偶然误差影响2.偏差精密度的高低可用偏差来表示。(1)绝对偏差:单次测量值与平均值之差

13(2)平均偏差:绝对偏差绝对值的平均值

(3)相对平均偏差:平均偏差占平均值的百分比(4)标准偏差14(5)相对标准偏差(relativestandarddeviation-RSD,又称变异系数coefficientofvariation-CV)例:用邻二氮菲显色法测定水中铁的含量,结果为10.48,10.37,10.47,10.43,10.40mg/L;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。解:1516三、准确度与精密度的关系17三、准确度与精密度的关系

准确度是测定值与真实值的接近程度,因此它与系统误差、偶然误差均有关。精密度是测定值之间的相互接近程度,在求测定值彼此间接近程度时抵消了系统误差的影响,因此只与偶然误差有关。讨论1

准确度与误差、精密度与误差分别有何关系?18讨论2

要想得到一准确度和精密度都好的分析结果,对测定误差有何要求,怎样才能做到这一点?

消除系统误差后,再降低偶然误差就可得到一准确度与精密度都好的分析结果。19讨论3

据以上探讨,你认为精密度好的分析结果准确度一定好吗?为什么?请试着总结准确度和精密度的关系。

精密度只与偶然误差有关,而准确度与偶然误差、系统误差均有关。

精密度好只说明偶然误差小,但是否存在系统误差及系统误差有多大都不知道,因此精密度好准确度未必高。

准确度好需要两种误差均小,即准确度高也需要精密度好。实例分析

甲、乙、丙三人分析同一试样中某组分含量,分别得出三组数据,(真实值为30.39)你认为哪组数据更可靠,为什么?甲30.2230.2030.1830.16乙30.2030.3030.2530.35丙30.4430.4230.3830.40

1.计算每组数据的平均值和平均偏差。

2.分析三组数据的准确度和精密度。

3.通过分析选择可靠的数据组。图示展示真实值:30.391.精密度好的分析结果准确度不一定好。2.精密度不好的分析结果准确度也不好。3.精密度和准确度都好的结果才是可靠的。4.准确度好需要精密度好做保障。

○表示个别测定值│表示平均值

甲乙丙

30.1030.2030.3030.4022例223总结:准确度与精密度的关系

1.精密度低说明所测结果不可靠,当然准确度就不高。因此,精密度高是准确度高的前提条件,即准确度高一定需要精密度高。

2.准确度与真实值有关,精密度与真实值无关,因此精密度高的分析结果准确度不一定高,

3.准确度与系统误差、偶然误差均有关,精密度只与偶然误差有关,因此,消除了系统误差后,精密度高的分析结果才是既准确又精密的。

24课堂练习

1.从精密度好就可以断定分析结果可靠的前提是:

A.偶然误差小B.系统误差小

C.平均偏差小D.标准偏差小

2.一样品的真实值为7.02%,对其进行分析,A的测定结果为6.96%,标准偏差为0.03;B的测定结果为7.10%,标准偏差为0.05;与B的测定结果比较,A的测定结果是:

A.不太准确,但精密度好;B.准确度较好,但精密度较差;

C.准确度较好,精密度也较好;

D.准确度与精密度均较差。25四、误差的传递误差的传递分为系统误差的传递和偶然误差的传递。1.系统误差的传递①和、差的绝对误差等于各测量值绝对误差的和、差。δR=δx+δy-δz

②积、商的相对误差等于各测量值相对误差的和、差

R=xy/z

R=x+y-z26

用减重法称得AgNO34.3024g,溶于250ml棕色瓶中,稀至刻度,配成0.1003mol/L的AgNO3标液。经检查发现:倒出前的称量误差是-0.2mg,倒出后的称量误差是+0.3mg,容量瓶的容积误差为-0.07ml。问配得AgNO3的绝对误差、相对误差各是多少?272.偶然误差的传递①和、差结果的标准偏差的平方,等于各测量值的标准偏差的平方和。

R=x+y-z

②积、商结果的相对标准偏差的平方,等于各测量值的相对标准偏差的平方和。R=xy/z28

分析天平称量时,单次的标准偏差为0.10mg,求减量法称量时的标准偏差。3.测量值的极值误差在分析化学中,若需要估计整个过程可能出现的最大误差时,可用极值误差来表示。它假设在最不利的情况下各种误差都是最大的,而且是相互累积的,计算出结果的误差当然也是最大的,故称极值误差。29①和、差的极值误差等于各测量值绝对误差的绝对值之和。R=x+y-z

②积、商的极值相对误差等于各测量值相对误差的绝对值之和。R=xy/z标定NaOH溶液,称取KHP0.2000g,溶解,用NaOH溶液滴定,消耗20.00ml。计算结果的极值相对误差。3031五、提高分析结果准确度的方法(一)选择恰当的分析方法应根据待测组分的含量、性质、试样的组成及对准确度的要求等来选择化学定量分析准确度高(RE≤0.2%)灵敏度低适合于>1%组分的测定仪器分析准确度较差灵敏度高适合于<1%组分的测定32

天平一次的称量误差为0.0001g,两次的称量误差为0.0002g,RE%0.1%,计算最少称样量?(二)减小测量误差提高仪器测量精度,减小绝对误差1/万分析天平1/10万分析天平±0.0001g±0.00001g增大称量质量或滴定剂体积,减小相对误差33例:滴定管一次的读数误差为0.01mL,两次的读数误差为0.02mL,RE%0.1%,计算最少移液体积?增加平行测定次数,用平均值报告结果,一般测3~6次。(三)减小偶然误差的影响34(四)消除测量过程中的系统误差1.对照试验

选用组成与试样相近的标准试样,在相同条件下进行测定,测定结果与标准值对照,判断有无系统误差。

用标准方法和所选方法同时测定某一试样,测定结果做统计检验,判断有无系统误差。2.校正仪器对砝码、移液管、酸度计等进行校准,消除仪器引起的系统误差

353.回收试验向试样中加入已知量的被测组分(标准),进行平行试验,看加入的待测组分是否能定量地回收,以判断分析过程是否存在系统误差一般要求95%~105%5.空白试验在不加试样的情况下,按试样分析步骤和条件进行分析实验,所得结果为空白值试样结果扣除空白36(1)准确度高,要求精密度一定好;但精密度好,准确度不一定高.(2)准确度反映了测量结果的正确性;精密度反映了测量结果的重现性.371、过失误差

过失误差是由于操作人员粗心大意、过度疲劳、精神不集中等引起的。其表现是出现离群值或异常值。过失误差加错试剂读错数据若无明显过失,离群值不可随意舍弃,382、过失误差的判断——离群值的舍弃

在重复多次测试时,常会发现某一数据与其它值或平均值相差较大,这在统计学上称为离群值或异常值。23.45,23.42,23.40,23.87离群值的取舍问题,实质上就是根据统计学原理,区别两种性质不同的偶然误差和过失误差。大概率事件小概率事件391)将所有测定值由小到大排序,其可疑值为X1或Xn2)求出极差x2-x1或xn-xn-1

常用的取舍检验方法有:(1)Q检验法3)求出可疑值与其最邻近值之差4)求出统计量Q

40或5)查临界值QP,n

6)若Q>QP.n,则舍去可疑值,否则应保留。测定次数n345678910Q(90%)0.940.760.640.560.510.470.440.41Q(95%)0.970.840.730.640.590.540.510.49Q(99%)0.990.930.820.740.680.630.600.57不同置信度下的Q值表过失误差造成偶然误差所致41例题:标定一个标准溶液,测得4个数据:0.1014、0.1012、0.1030和0.1016mol/L。试用Q检验法确定数据0.1030是否应舍弃?P=90%,n=4,查表Q90%,4=0.76<Q,所以,数据0.1030应舍弃,该离群值系过失误差引起。421)将所有测定值由小到大排序,其可疑值为X1或Xn2)计算平均值3)计算标准偏差S4)计算统计量G5)查临界值GP,n6)若G>GP,n,则舍去可疑值,否则应保留。或(2)G检验法43测定次数n345678910P=90%1.151.461.671.821.942.032.112.18P=95%1.151.481.711.892.022.132.212.29P=99%1.151.491.751.942.102.222.322.41Gp,n临界值表由于格鲁布斯(Grubbs)检验法引入了标准偏差,故准确性比Q检验法高。44例:测定某药物中钴的含量,得结果如下:1.25,1.27,1.31,1.40μg/g,

试问1.40这个数据

是否应该保留(P=95%)?P=0.95,n=4,G0.95,4=1.48>G

所以数据1.40应该保留。该离群值系偶然误差引起。45数学上:1.8=1.80分析化学中,能简单地把1.80后面的0去掉吗?

1.8=1.80?有效数字位数不同,数字所包含的误差不同46第三节有效数字及其运算法则一、有效数字定义:有效数字就是实际能测到的数字,包括全部准确数字和最后一位欠准的数(±1)构成:全部准确数字+最后一位估计的可疑数字4748常量滴定管:0.01ml台秤:0.1g25.21ml(4位)36.4g(3位)49例:滴定管读数为20.30毫升,两个0是有效数字;表示为0.02030升,前两个0起定位作用,不是有效数字“0”的作用:用作有效数字或定位几项规定:(1)数字后的0含义不清楚时,最好要用科学计数法表示。例:3600→3.6×103

两位→3.60×103

三位(2)在分析化学计算中遇到倍数、π、e等常数时,视为无限多位有效数字。505位4位3位2位1位位数含糊不确定3.单位变换不影响有效数字位数例:10.00[mL]→0.001000[L]均为四位4.pH,pM,pK,lgC,lgK等对数值,其有效数字的位数取决于小数部分(尾数)数字的位数,整数部分只代表该数的方次例:pH=12.68→[H+]=2.1×10-13[mol/L]两位5.结果首位为8和9时,有效数字可以多计一位例:90.0%,可示为四位有效数字52分析化学实验中需要注意的几点:532.2.2有效数字的修约规则有效数字的修约规则1.四舍六入五成双2.只能对数字进行一次性修约例:12.21500,12.22500均修约至四位有效数字例:6.549,2.451一次修约至两位有效数字12.2212.22

6.5

2.512.21510,12.22501均修约至四位有效数字12.2212.2355一次修约到位,不能分次修约在修约相对误差、相对平均偏差、相对标准偏差等表示准确度和精密度的数字时,一般取1~2位

有效数字,只要尾数不为零,都要进一位0.57490.570.5750.58×0.45%0.5%0.4410%0.44%修约后会使标准偏差结果变差,从而提高可信度56练习57三、有效数字的运算法则(一)加减法:以小数点后位数最少的数为准(即以绝对误差最大的数为准)

50.1+1.45+0.5812=52.1δ±0.1±0.01±0.0001方法:先修约再计算以小数点后位数最少的数据为基准,确定其他数值保留的位数和决定计算结果的有效数字位数。(注:每个数值可暂且多保留一位,计算结果再修约到最终的有效数字位数)58计算:50.1+1.45+0.5812=?修约为:50.1+1.45+0.58=52.13=52.1计算:50.1+1.45+0.5812=?修约为:50.1+1.45+0.5812=52.1312=52.1例题:59练习:60(二)乘除法:以有效数字位数最少的数为准(即以相对误差最大的数为准)δ±0.0001±0.01±0.000010.0121×25.64×1.05782=0.328RE±0.8%±0.4%±0.009%61练习62(三)乘方、开方

结果的有效数字位数不变(四)对数换算结果的有效数字位数不变[H+]=6.3×10-12[mol/L]→pH=11.20

63642.3分析数据的统计处理一、偶然误差的正态分布偶然误差符合正态分布,正态分布的概率密度函数式:65(1)μ为无限次测量的总体均值,表示无限个数据的集中趋势(无系统误差时即为真值)(2)σ是总体标准偏差,表示数据的离散程度y正态分布的两个重要参数:(位置,形状)σ661.x=μ时,y最大2.曲线以x=μ的直线为对称3.当x→﹣∞或﹢∞时,曲线以x轴为渐近线4.σ大,数据分散,曲线矮胖;σ小,数据集中,曲线瘦高5.测量值落在-∞~+∞,总概率为1特点:67为了计算和使用方便,作变量代换68以u为变量的概率密度函数表示的正态分布曲线称为标准正态分布曲线,此曲线的形状与σ大小无关注:u是以σ为单位来表示随机误差x–μ。u=0时,x=μU(0,1)重要概念置信度(置信水平)P:某一u值时,测量值出现在μ±u•范围内的概率显著性水平α:落在此范围之外的概率置信区间:在一定置信度下,以测量值为中心,包括真值在内的区间(

x±u•)7068.3%95.5%99.7%u

-3s

-2s-s0s2s3s

x-m

m-3s

m-2s

m-s

m

m+s

m+2s

m+3s

x

y标准正态分布曲线:置信度和置信区间的关系71正态分布是无限次测量数据的分布规律,对于有限实验数据必须根据t分布进行处理。二、t分布曲线在t分布曲线中,纵坐标仍为概率密度,横坐标是统计量t而不是u。72t分布曲线随自由度f=n-1变化,当n→∞时,t分布曲线即是正态分布。注:t是以S为单位来表示随机误差x–μ。t=0时,x=μ对于t分布曲线,当t一定时,由于f不同,相应曲线所包括的面积,即概率也就不同。重要概念置信度(置信水平)P:某一t值时,测量值出现在μ±t•s范围内的概率显著性水平α:落在此范围之外的概率置信区间:在一定置信度下,以测量值为中心,包括真值在内的区间t值与α、f有关,应加注脚标,用tα,f

表示。例如,t0.05,4表示置信度为95%(显著性水平为0.05)、自由度f=4时的t值。74t分布值表(双侧检验)

t

f显著水平α0.50*0.10*0.050.0111.006.3112.7163.6620.822.924.309.9330.772.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.36200.691.732.092.85∞0.671.641.962.5875三、平均值的精密度和置信区间(一)平均值的精密度76平均值的标准偏差与样本的标准偏差(即单次测量值的标准偏差)S有以下关系:77(二)平均值的置信区间我们以为中心,在一定置信度下,估计实际μ值所在的范围,称为平均值的置信区间:78

用8-羟基喹啉法测定Al含量,9次测定的标准偏差为0.042%,平均值10.79%。计算置信度为95%和99%时的置信区间。P=0.95;α=1-P=0.05;f=9-1=8;t0.05,8=2.306792.P=0.99;α=1-P=0.01;f=9-1=8;t0.01,8=3.3551.置信度越大且置信区间越小时,数据就越可靠2.置信度一定时,减小偏差、增加测量次数,可以减小置信区间3.在标准偏差和测量次数一定时,置信度越大,置信区间就越大80分析方法及结果准确度和精密度的检验四、显著性检验(一)F检验

比较两组数据的方差(S2),确定它们的精密度是否存在显著性差异,用于判断两组数据间存在的偶然误差是否显著不同。检验步骤:◆计算两组数据方差的比值F,81◆查单侧临界值自由度ff1234567∞f2219.0019.1619.2519.3019.3319.3619.5039.559.289.129.018.948.888.5346.946.596.396.266.166.095.6355.795.415.195.054.954.884.3665.144.764.534.394.284.213.6774.744.354.123.973.873.793.2384.464.073.843.693.583.502.9394.263.863.633.483.373.292.71∞3.002.602.372.212.102.011.00显著水平为0.05的F分布值表82◆比较判断:两组数据的精密度不存在显著性差别,S1与S2相当。两组数据的精密度存在着显著性差别,S2明显优于S1。

用两种方法测定同一样品中某组分。方法一,共测6次,S1=0.055;方法二,共测4次,S2=0.022。在P=95%时,试问这两种方法的精密度有无显著性差别。83f1=6-1=5;f2=4-1=3,α=0.05

由表查得F0.05,5,3=9.01>6.25因此,S1与S2无显著性差别,即两种方法的精密度相当。(二)t检验

将平均值与标准值或两个平均值之间进行比较,以确定它们的准确度是否存在显著性差异,用来判断分析方法及结果是否存在较大的系统误差。84平均值与标准值(真值)比较◆查双侧临界临界值tα,f

检验步骤:◆计算统计量t◆比较判断:当t>tα,f时,说明平均值与标准值存在显著性差异,分析方法或操作中有较大的系统误差存在当t<tα,f

时,说明平均值与标准值不存在显著性差异,分析方法或操作中无明显的系统误差存在。85

用某种新方法测定基准明矾中铝的百分含量,得到下列9个分析结果:10.74,10.77,10.77,10.77,10.81,10.82,10.73,10.86,10.81。已知明矾中铝的标准值为10.77。试问采用新方法后是否引起系统误差(置信度为95%)?f=9-1=8,α=0.05,tα,f=2.31>t说明平均值与标准值不存在显著性差异,新方法无明显的系统误差存在。862.平均值与平均值比较两个平均值是指试样由不同的分析人员测定,或同一分析人员用不同的方法、不同的仪器测定。◎计算统计量t检验步骤:式中SR称为合并标准偏差:87◎查双侧临界临界值tα,f◎比较判断:总自由度f=n1+n2-2当t>tα,f

时,说明两个平均值之间存在显著性差异,即至少有一个存在较大的系统误差当t<tα,f

时,说明两个平均值之间不存在显著性差异,即两个平均值的准确度相当

要检查两组数据的平均值是否存在显著性差异,必须先进行F检验,确定两组数据的精密度无显著性差异。如果有,则不能进行t检验。88检验Fe(Ⅱ)含量测定,新的重量法(用一种新的有机沉淀剂)是否可替代经典重量(P=95%)?新方法与经典法测定的结果如下:新方法:20.10%、20.50%、18.65%、19.25%、19.40%及19.99%,均值为19.65%

经典法:18.89%、19.20%、19.00%、19.70%及19.40%,均值为19.24%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论