误差及分析数据的处理资料doc_第1页
误差及分析数据的处理资料doc_第2页
误差及分析数据的处理资料doc_第3页
误差及分析数据的处理资料doc_第4页
误差及分析数据的处理资料doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章 误差及分析数据的处理【教学目标】 1.掌握误差和偏差的意和表示方法,理解准确度和精密度的意义与关系 2.掌握随机误差的正态分布 3. 掌握有限测定数据的统计处理 4. 理解有效数字的意义并掌握其用算规则【重点难点】1.统误差与偶然误差的区别和减免2.准确度与精密度的区别联系与表示方法3.提高分析结果准确度的方法 【课时安排】计划8课时【教学内容】共六节 第一节误差及其产生的原因 一系统误差(可测误差): 由固定原因产生 特点:单向性(大小正负一定 ) 可消除(原因固定) 重复测定重复出现 分类(按来源分): a.方法误差:方法不恰当产生 b.仪器与试剂误差:仪器不精确和试剂中含被测组分

2、或不纯组分产生 c.操作误差: 操作方法不当引起二随机误差(偶然误差,不可测误差):由不确定原因引起 特点:1.不具单向性(大小正负不定) 2.不可消除(原因不定) 但可减小(测定次数) 3.分布服从统计学规律(正态分布)3、 过失误差 由操作者的过失引起 第二节 测定值的准确度与精密度 一准确度与误差 1.准确度:指测量结果与真值的接近程度 2.误差 a.绝对误差Ea:测量值与真实值之差 绝对误差=测定值-真实值 b.相对误差Er:绝对误差占真实值百分比 相对误差% =(绝对误差/真实值) ×100% 二精密度与偏差 精密度:平行测量的各测量值间相互接近的程度.精密度用“偏差”表示

3、偏差越小说明分析结果的精密度越高(一)绝对偏差平均偏差和相对平均偏差 1)绝对偏差 :单次测量值与平均值之差 2)相对偏差:绝对偏差占平均值的百分比相对平均偏差% = (二)标准偏差和相对标准偏差 总体:研究对象的全体(母体);样本:总体中随机抽出的一部分样品(子样)容量:(样本大小)样本中所含测量值的数目例:对某一批煤中硫的含量进行分析,首先是进行取样粉碎缩分,最后制成一定数量的分析试样,这就是供分析用的总体如果我们从中称取10份煤样进行平行测定,得到10个测定值,则这一组测定结果就是该试样总体的一个随机样本,样本容量为10 若样本容量为n,平行测定次数分别为x1,x2,x3,xn,则其样本

4、平均值为: 当测定次数无限增多,既n时,样本平均值即为总体平均值: 若没有系统误差,且测定次数无限多(或实用上n>30次)时,则总体平均值就是真实值T此时,用 代表总体标准偏差,其数学表示式为:在定量分析的实验中,测定次数一般较少(n<20次),故其平均偏差 ,须由式(3-9)求得 分析化学中测定次数一般不多(n<20),而总体平均值又不知道,只好用样本的标准偏差S来衡量该组数据的分散程度样本标准偏差的数学表达式为:(n-1):自由度,以f表示指在n次测量中,只有n-1个可变的偏差自由度也可以理解为:数据中可供对比的数目 当测定次数非常多时,测定次数n与自由度(n-1)的区别

5、就变得很小 变异系数(%)= (三) 平均值的标准偏差 从同一总体中随机抽出容量相同的数个样本,由此可以得到一系列样本的平均值这些样本平均值也并非完全一致,它们的精密度可以用平均值的标准偏差来衡量与上述任一样本的各单次测定值相比,这些平均值之间的波动性更小,即平均值的精密度较单次测定值的更高 实际工作中 ,常用样本的平均值 对总体平均值进行估计平均值的标准偏差与单次测定值的标准偏差之间关系 (n) (3-11) 有限次测定则有: 平均值的标准偏差与测定次数的平方根成反比增加测定次数可以减小随机误差,提高测定的精密度 除偏差之外,还可用极差R表示样本平行测定值的精密度极差又称全距,是测定数据中的

6、最大值与最小值之差,其值愈大表明测定值愈分散因无充分利用所有数据,故精确性较差偏差和极差的数值一定程度上反映了测定中随机误差影响的大小三准确度和精密度的关系 说明: 系统误差是定量分析中误差的主要来源,影响分析结果的准确度;偶然误差影响分析结果的精密度1.准确度高,要求精密度一定高, 但精密度好,准确度不一定高2.准确度反映了测量结果的正确性, 精密度反映了测量结果的重现性 四提高分析结果准确度的方法1.选择合适的分析方法 例:测全Fe含量 K2Cr2O7法 40.20% ±0.2%×40.20% 比色法 40.20% ±2.0%×40.20%2.减小测

7、量误差1)称量 例:天平一次的称量误差为 0.0001g,两次的称量误差为 0.0002g,RE% 0.1%,计算最少称样量?2)滴定 例:滴定管一次的读数误差为0.01mL,两次的读数误差为 0.02mL,RE% 0.1%,计算最少移液体积? 3.增加平行测定次数,一般测34次以减小偶然误差4.消除测量过程中的系统误差1)校准仪器:消除仪器的误差2)空白试验:消除试剂误差3)对照实验:消除方法误差4)回收实验:加样回收,以检验是否存在方法误差 第五节有效数字及其运算规则一有效数字的运算法则有效数字:实际可以测得的数字(一) 有效数字位数1. 有效数字位数包括所有准确数字和一位欠准数字 例:滴

8、定读数20.30mL,最多可以读准三位 第四位欠准(估计读数)±1%2. 在0-9中,只有0既是有效数字,又是无效数字 例: 0.06050 四位有效数字 定位 有效位数 例:3600 3.6×103 两位 3.60×103 三位3.单位变换不影响有效数字位数 例:10.00mL0.001000L 均为四位4.pH,pM,pK,lgC,lgK等对数值,其有效数字的 位数取决于小数部分(尾数)数字的位数,整数部 分只代表该数的方次 例:pH = 11.20 H+= 6.3×10-12mol/L 两位5.结果首位为8和9时,有效数字可以多计一位 例:90.0

9、% ,可示为四位有效数字 例:99.87% 99.9% 进位 二有效数字的修约规则 1.四舍六入五留双 2.只能对数字进行一次性修约 3.当对标准偏差修约时,修约后会使标准偏差结果 变差,从而提高可信度 例:s = 0.134 修约至0.14,可信度 三有效数字的运算法则1.加减法:以小数点后位数最少的数为准(即以 绝对误差最大的数为准)例: 50.1 + 1.45 + 0.5812 = ? ±0.1 ±0.01 ±0.0001 保留三位有效数字2.乘除法:以有效数字位数最少的数为准(即以相对误差最大的数为准)例:0.0121 × 25.64 ×

10、; 1.05782 = ?第三节偶然误差的正态分布一 频率分布 在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下: 1.60 1.67 1.67 1.64 1.58 1.64 1.67 1.62 1.57 1.60 1.59 1.64 1.74 1.65 1.64 1.61 1.65 1.69 1.64 1.63 1.65 1.70 1.63 1.62 1.70 1.65 1.68 1.66 1.69 1.70 1.70 1.63 1.67 1.70 1.70 1.63 1.57 1.59 1.62 1.60 1.53 1.56 1.58 1.60 1.58 1.59

11、 1.61 1.62 1.55 1.52 1.49 1.56 1.57 1.61 1.61 1.61 1.50 1.53 1.53 1.59 1.66 1.63 1.54 1.66 1.64 1.64 1.64 1.62 1.62 1.65 1.60 1.63 1.62 1.61 1.65 1.61 1.64 1.63 1.54 1.61 1.60 1.64 1.65 1.59 1.58 1.59 1.60 1.67 1.68 1.691.分组:视样本容量的大小将所有数据分成若干组:容量大时分为10-20组,容量小时(n<50)分为5-7组,本例分为9组2.排序:3.找最大值和最小值4.

12、算极差RR=1.74%-1.49%=0.25%,组距= R/9=0.25%/9=0.03%每组内两个数据相差0.03%即:1.48-1.51,1.51-1.54等等为了使每一个数据只能进入某一组内,将组界值较测定值多取一位 1.545-1.575等 频数:测定值落在每组内的个数相对频数:数据出现在各组内的频率 分组(%) 频数 频率 1.485-1.515 2 0.022 1.515-1.545 6 0.067 1.545-1.575 6 0.067 1.575-1.605 17 0.189 1.605-1.635 22 0.244 1.635-1.665 20 0.222 1.665-1.6

13、95 10 0.111 1.695-1.725 6 0.067 1.725-1.755 1 0.011 90 1.00全部数据中,平均值1.62%所在的组(第五组)具有最大的频率值,处于它两侧的数据组,其频率值仅次之结果:测定值出现在平均值附近的频率相当高,具有明显的集中趋势;与平均值相差越大的数据出现的频率越小二正态分布1.数学表达式即正态分布函数式为:2.正态分布的两个重要参数(1)为无限次测量的总体均值,表示无限个数据的 集中趋势(无系统误差时即为真值) (2)是总体标准差,表示数据的离散程度3.x -为偶然误差x =时,y 最大大部分测量值集中 在算术平均值附近曲线以x =的直线为对称

14、正负误差 出现的概率相等当x 或时,曲线渐进x 轴, 小误差出现的几率大,大误差出现的 几率小,极大误差出现的几率极小,y, 数据分散,曲线平坦 ,y, 数据集中,曲线尖锐测量值都落在-+,总概率为1四随机误差的区间概率 正态分布曲线与横坐标之间所夹的总面积,等于概率密度函数从-至+的积分值它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1 (3-16) 求测定值或随机误差在某区间出现的概率P,可取不同的u值对式(3-16)积分求面积而得到例如随机误差在±区间(u=±1),即测定值在±区间出现的概率是: 第四节 有限数据的统计处理和

15、t分布一置信度与的置信区间引言:日常分析中测定次数是有限的,总体平均值自然不为人所知但是随机误差的分布规律表明,测定值总是在以为中心的一定范围内波动,并有着向集中的趋势因此,如何根据有限的测定结果来估计可能存在的范围(称之为置信区间)是有实际意义的该范围愈小,说明测定值与愈接近,即测定的准确度愈高但由于测定次数较少,由此计算出的置信区间也不可能以百分之百的把握将包含在内,只能以一定的概率进行判断 (一) 已知总体标准偏差时 对于经常进行测定的某种试样,积累了大量的测定数据,可认为是已知的根据(3-14)式并考虑u的符号可得: (3-14a) 由随机误差区间概率可知,测定值出现的概率由

16、u决定例当u=±1.96时x在-1.96至+1.96区间出现的概率为0.95如果希望用单次测定值x来估计可能存在的范围,则可以认为区间x±1.96能以0.95的概率将真值包含在内即有平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围置信度:在置信区间内包含的概率,它表明了人们对所作的判断有把握的程度,用P表示对真值进行区间估计时,置信度的高低要定得恰当一般以95%或90%的把握即可 式(3-14b)和(3-17)还可看出置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关当一定时,置信度定得愈大,u值愈大,过大的置信区间将使

17、其失去实用意义若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或 越接近真值,即测定的准确度越高注意:是确定且客观存在的,没有随机性而区间具有随机性的,即它们均与一定的置信度相联系因此我们只能说置信区间包含真值的概率是0.95,而不能认为真值落在上述区间的概率是0.95 (二)已知样本标准偏差S时 实际工作中,通过有限次的测定是无法得知和的,只能求出 和S而且当测定次数较少时,测定值或随机误差也不呈正态分布,给少量测定数据的统计处理带来了困难此时若用S代替从而对作出估计必然会引起偏离,而且测定次数越少,偏离就越大如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正 t分布法: t分布是有限测定数据及其随机误差的分布规律其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分布与测定次数有关随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显当f时,t分布曲线就与正态分布曲线合为一体,可以认为正态分布就是t的极限 二可疑测定值的取舍 平行测定的数据中,有时会出现一二个与其结果相关较大的测定值,称为可疑值或异常值对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响(一)Q检验法(舍弃商) 将测定值由小至大按顺序排列,其中可疑值为x1或

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论