分析化学中误差与数据处理_第1页
分析化学中误差与数据处理_第2页
分析化学中误差与数据处理_第3页
分析化学中误差与数据处理_第4页
分析化学中误差与数据处理_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1

第二章分析化学中误差与数据处理22.1分析化学中的误差2.1.1误差与偏差绝对误差:

测量值与真值间的差值,用E表示E=x-xT误差:表示准确度高低的量。误差小准确度高误差相对误差:绝对误差占真值的百分比,用Er表示Er=E/xT=x-xT/xT×100%3真值:客观存在,但绝对真值不可测1、理论真值(化合物的理论组成等)2、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)3、相对真值(如高一级精度的测量值相对于低一级精度的测量值;标准参考物质证书所给的数值)4例:滴定的体积误差VEEr20.00mL0.02mL0.1%2.00mL0.02mL1.0%滴定剂体积应为20~30mLmEEr0.2000g0.2mg0.1%0.0200g0.2mg1.0%称量误差称样质量应大于0.2g5偏差:表示精密度高低的量。偏差小,精密度高。d=x-x∑di=0偏差的表示方法有:偏差di

平均偏差标准偏差S

相对标准偏差RSD(变异系数CV)

极差R1.偏差:

测量值与平均值的差值,用d表示62.平均偏差:各单个偏差绝对值的平均值

相对平均偏差:平均偏差与测量平均值的比值73.标准偏差:s

相对标准偏差:RSD4.极差(全距)R=xmax-xmin8882.1.2准确度和精密度准确度:测定结果与真值接近的程度,用误差衡量。精密度:平行测定结果相互靠近的程度,用偏差衡量。9准确度与精密度的关系结论:1、精密度好是保证准确度好的前提。2、精密度好不一定准确度就高。准确度及精密度都高-结果可靠102.1.2系统误差与随机误差1.系统误差:又称可测误差方法误差:溶解损失、终点误差-用其他方法校正

仪器误差:刻度不准、砝码磨损-校准(绝对、相对)操作误差:颜色观察试剂误差:不纯-空白实验主观误差:个人误差具单向性、重现性、可校正特点112.随机误差:又称偶然误差过失

由粗心大意引起,可以避免的不可校正,无法避免,服从统计规律不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定4-6次重做!122.1.3误差的传递1.系统误差的传递ki为常数设分析结果R

由测量值A、B、C计算获得,测量值的系统误差分别为

A、

B、

C,标准偏差分别为sA、sB、sC。132、随机误差的传递设分析结果Y由测量值A、B、C计算获得,测量值的系统误差分别为

A、

B、

C,标准偏差分别为sA、sB、sC。143、极值误差15例1天平称量的标准偏差s=0.10mg,求称量试样时的标准偏差。解:称一个样需读两次平衡点,例2滴定管的初读数为(0.05±0.01)mL,末读数为(22.10±0.01)mL,问滴定剂的体积可能在多大范围内波动?解:极值误差

V=0.01+0.01=0.02滴定剂体积为:(22.10-0.05)

0.02mL=22.050.02mL162.2有效数字及运算规则

1有效数字:分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内a

数字前0不计,数字后计入:0.03400b数字后的0含义不清楚时,最好用指数形式表示:1000(1.0×103,1.00×103,1.000×103)c自然数和常数可看成具有无限多位数(如倍数、分数关系)d

数据的第一位数大于等于8的,可多计一位有效数字,如9.45×104,95.2%,8.65e对数与指数的有效数字位数按尾数计,如pH=10.28,则[H+]=5.2×10-11f误差只需保留1~2位17m

分析天平(称至0.1mg):12.8228g(6), 0.2348g(4),0.0600g(3)

千分之一天平(称至0.001g):0.235g(3)

1%天平(称至0.01g):4.03g(3),0.23g(2)

台秤(称至0.1g):4.0g(2),0.2g(1)V

☆滴定管(量至0.01mL):26.32mL(4),3.97mL(3)

☆容量瓶:100.0mL(4),250.0mL(4)

☆移液管:25.00mL(4);

☆量筒(量至1mL或0.1mL):25mL(2),4.0mL(2)2有效数字运算中的修约规则尾数≤4时舍;尾数≥6时入尾数=5时,

若后面数为0,舍5成双;若5后面还有不是0的任何数皆入四舍六入五成双例下列值修约为四位有效数字

0.32474 0.32475 0.32476 0.32485 0.324851

0.32470.32480.32480.32480.324918禁止分次修约运算时可多保留一位有效数字进行0.57490.570.5750.58×19加减法:

结果的绝对误差应不小于各项中绝对误差最大的数。(与小数点后位数最少的数一致)

0.112+12.1+0.3214=12.5乘除法:结果的相对误差应与各因数中相对误差最大的数相适应(与有效数字位数最少的一致)

0.0121×25.66×1.0578=0.328432

3运算规则20例0.0192H2O+CO2212.3分析化学中的数据处理总体样本样本容量n,自由度f=n-1样本平均值总体平均值m真值xT标准偏差sx总体样本数据统计方法抽样观测221.总体标准偏差σ无限次测量;单次偏差均方根2.样本标准偏差s样本均值n→∞时,

→μ

,s→σ3.相对标准偏差RSD(变异系数CV)x23244.衡量数据分散度:标准偏差比平均偏差合理5.标准偏差与平均偏差的关系

δ=0.7979σ6.平均值的标准偏差2.3.1随机误差的正态分布系统误差:可校正消除随机误差:不可测量,无法避免,可用统计方法研究1.测量值的频数分布频数,相对频数,骑墙现象分组细化

测量值的正态分布25262.正态分布测量值正态分布N(,

2)

的概率密度函数

1=0.047

2=0.023

xy

概率密度x

个别测量值

总体平均值,表示无限次测量值集中的趋势。

总体标准偏差,表示无限次测量分散的程度。x-

随机误差随机误差的正态分布测量值的正态分布0x-

27测量值和随机误差的正态分布体现了随机误差的概率统计规律1、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。2、正误差出现的概率与负误差出现的概率相等。3、x=

时,y值最大,体现了测量值的集中趋势。集中的程度与有关。平均值结论:增加平行测量次数可有效减小随机误差。x2728标准正态分布曲线N(0,1)令:正态分布函数转换成标准正态分布函数:68.3%95.5%99.7%u2829随机误差的区间概率|u|面积|u

面积|u

面积|u

面积0.6740.25001.0000.34131.6450.45001.9600.47502.0000.47732.5760.49503.0000.4987

0.5000正态分布概率积分表(部分数值)30随机误差出现的区间u(以为单位)测量值出现的区间概率%(-1,+1)(-1,+1)68.3(-1.96,+1.96)(-1.96,+1.96)95.0(-2,+2)(-2,+2)95.5(-2.58,2.58)(-2.58,+2.58)99.0(-3,+3)(-3,+3)99.7测量值与随机误差的区间概率31例1(1)解查表:u=1.5时,概率为:20.4332=0.866=86.6%(2)解查表:u>2.5时,概率为:0.5–0.4938=0.0062=0.62%一样品,标准值为1.75%,测得

=0.10,求结果落在(1)1.750.15%概率;(2)测量值大于2%的概率。86.6%0.62%P½a½aP+a=1a

显著性水平

P置信度1.平均值的标准偏差设有一样品,m

个分析工作者对其进行分析,每人测n

次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。试样总体样本1样本2……样本m平均值的总体标准偏差对有限次测量2.3.2总体平均值的估计3233对有限次测量:1、增加测量次数可以提高精密度。2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。结论:测量次数34(1)t分布曲线无限次测量,得到

有限次测量,得到su分布曲线2有限次测量数据的统计处理35t分布值表自由度f=(n-1)显著水平0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.85

0.671.651.962.58还原为u分布36(2)平均值的置信区间概率区间大小例:

包含在

包含在把握相对大把握相对小100%的把握无意义

包含在37区间概率与置信区间例查表若用单次测量值来估计

的区间:

这是一个在一定置信度下总体平均值的置信区间的问题,是说在区间有95%的可能包含

。则即

实际分析工作中通常是以样本平均值估计总体平均值是说有一定的把握说

包含在的范围内。

这是一个区间概率的问题,是说测量值落在范围内的概率为95%。

某一区间包含真值(总体平均值)的概率(可能性)置信区间:一定置信度(概率)下,以平均值为中心,能够包含真值的区间(范围)置信度越高,置信区间越大平均值的置信区间3839例2.某试样测定Cl-,4次结果为47.64%,47.69%,47.52%,47.55%。计算置信度为90%,95%和99%时,总体平均值μ的置信区间。

置信度为90%时,t0.10,3=2.35μ=(47.60±0.09)%

置信度为95%时,t0.05,3=3.18μ=(47.60±0.13)%

置信度为99%时,t0.01,3=5.84μ=(47.60±0.23)%说明:1.在S和f不变的条件下,置信度P越高,置信区间的范围就越宽.2.在P和S不便的条件下,自由度f变大,将使置信区间变窄.3.在P和f不变的条件下,提高测量精度S,将使置信区间变窄.解:402.4显著性检验SignificantTest(1)对含量真值为T的某物质进行分析,得到平均值(2)用两种不同的方法、或两台不同的仪器、或两个不同的实验室对同一样品进行分析,得到平均值问题:是由随机误差引起,或存在系统误差?显著性检验显著性差异非显著性差异系统误差校正随机误差正常显著性检验但但411-

1/2

1/2

-t

,ft

,f1.平均值与标准值的比较t检验法假设不存在系统误差,那么是由随机误差引起的,测量误差应满足t

分布,t检验法的方法(1)根据算出t值;(2)给出显著性水平或置信度(3)将计算出的t值与表上查得的t值进行比较,若根据计算出的t值应落在指定的概率区间里。否则,假设不满足,表明存在着显著性差异。习惯上说表明有系统误差存在。表示落在

为中心的某一指定概率之外。在一次测定中,这样的几率是极小的,故认为是不可能的,拒绝接受。4142例3.某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:问此测定有无系统误差?(给定

=0.05%)解查P61表3-3比较:说明

和T有显著差异,此测定有系统误差。假设:

=T432、两组平均值的比较两个实验室对同一标样进行分析,得到:和假设不存在系统误差,那么:

是由于随机误差引起的,应满足自由度

f=(n1+n2–2)的t

分布,44两组平均值的比较的方法(1)F检验法检验两组实验数据的精密度S1和S2之间有无显著差异:查表(P64表3-4)精密度无显著差异。(2)t

检验确定两组平均值之间有无显著性差异(3)查P61表(3-3)(4)比较非显著差异,无系统误差45例4.用两种不同方法测定合金中铌的质量分数,结果如下:

第一法:1.26%1.25%1.22%

第二法:1.35%1.31%1.34%1.33%问:两种方法之间是否有显著性差异(置信度90%)?解:n1=3x1=1.24%S1=0.021%n2=4x2=1.33%S2=0.017%F计=(0.021)2/(0.017)2=1.53

查表(3-4)f大=2f小=3F表=9.55

F计≺

F表说明两组数据的标准偏差之间无显著性差异

S=?

46

查表(3-3),当P=0.90,f=n1+n2-2=5时,t0.10,5=2.02.t计

t

,f

故两种方法之间有显著性差异.=6.21471、法(1)将可疑值除外,求其余数据的平均值和平均偏差;(2)求可疑值x与平均值之间的差的绝对值(3)判断舍弃。统计学方法证明,当测定次数非常多(例如大于20时,总体标准偏差与总体平均偏差有下列关系=0.79790.8043,偏差超过4的测量值可以舍弃。2.5异常值的取舍48482、格鲁布斯Grubbs)法(1)将测量的数据按大小顺序排列。

(2)设第一个数据可疑,计算或设第n个数据可疑,计算(3)查P67表3-5表:T计算>Tα.n

,舍弃。493.Q检法:若Q计›Q表,该可疑值应舍去.注:数据处理时,首先进行可疑值取舍后,才能进行其他计算.502.6标准曲线及线性回归(P68-71)

No.标样浓度

g/L吸收值15.000.045210.00.093320.00.140430.00.175540.00.2366试样0.200问题1、每个测量值都有误差,标准曲线应怎样作才合理?2、应怎样估计线性的好坏?51线性回归1.标准曲线应怎样作才合理?最小二乘法设对y作n次独立的观测,得到一系列观测值。一元线性回归方程表示为:根据最小二乘法的原理,最佳的回归线应是各观测值yi与相对应的落在回归线上的值之差的平方和(Q)为最小。

yiyx52令解得其中53相关系数Correlation

coefficient相关系数的定义为:2、应怎样估计线性的好坏?——相关系数的问题判断一元回归线是否有意义,可用相关系数来检验。54相关系数的意义3.当

R的绝对值在0与1之间时,可根据测量的次数及置信水平与相应的相关系数临界值比较,绝对值大于临界值时,则可认为这种线性关系是有意义的。1.

当所有的yi值都在回归线上时,R=

1。yxR=1xyR=-12.

当y与x之间不存在直线关系时,R=0。xyR=055例

f=n-20.100.050.010.00110.9880.9970.99980.99999920.9000.9500.9900.99930.8050.8780.9590.991相关系数的临界值表(部分)做了一条工作曲线,测量次数n=5,R=0.920,因变量与自变量之间有无相关性(置信度95%)?解:f=5–2=3,=0.05,查表R0=0.878,R>R0,有相关性562.6提高分析结果准确度的方法1.选择合适的分析方法:根据待测组分的含量、性质、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论