![第三章化学中的误差与数据处理毕春燕_第1页](http://file4.renrendoc.com/view/2e23f35a3f9ed7b23193e8b43e69b3a8/2e23f35a3f9ed7b23193e8b43e69b3a81.gif)
![第三章化学中的误差与数据处理毕春燕_第2页](http://file4.renrendoc.com/view/2e23f35a3f9ed7b23193e8b43e69b3a8/2e23f35a3f9ed7b23193e8b43e69b3a82.gif)
![第三章化学中的误差与数据处理毕春燕_第3页](http://file4.renrendoc.com/view/2e23f35a3f9ed7b23193e8b43e69b3a8/2e23f35a3f9ed7b23193e8b43e69b3a83.gif)
![第三章化学中的误差与数据处理毕春燕_第4页](http://file4.renrendoc.com/view/2e23f35a3f9ed7b23193e8b43e69b3a8/2e23f35a3f9ed7b23193e8b43e69b3a84.gif)
![第三章化学中的误差与数据处理毕春燕_第5页](http://file4.renrendoc.com/view/2e23f35a3f9ed7b23193e8b43e69b3a8/2e23f35a3f9ed7b23193e8b43e69b3a85.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章分析化学中的误差
与数据处理
北京化工大学北方学院理工院授课教师:毕春燕3.1误差3.2有效数字及运算规则3.3数据处理3.4显著性检验3.5可疑值取舍3.6回归分析法3.7提高分析结果准确度的方法基本内容:误差的基本概念,准确度与精密度及其关系;误差的分类、特点及其减免测定误差的措施;有效数字及其运算规则;平均值的置信区间,t检验法、F检验法、Q检验法的应用;提高分析结果准确度的方法。重点:误差的特点及其减免测定误差的措施,平均值的置信区间,t检验法、F检验法、Q检验法的应用。难点:误差的分布规律,显著性检验本章节基本内容、重点及难点
实验结果都有误差,误差自始至终存在于一切科学实验的过程之中。测量结果只能接近于真实值,而难以达到真实值。3.1误差绝对误差:测量值与真值间的差值,用E表示E=x-xT3.1.1误差与偏差误差相对误差:绝对误差占真值的百分比,用Er表示Er=E/xT=x-xT/xT×100%真值(xT
):某一物理量本身具有的客观存在的真实数值。但绝对真值不可测理论真值:化合物的理论组成约定真值:公认的量、单位相对真值:采用可靠的分析方法、精密仪器,平行分析得到的结果3.1.1误差与偏差偏差:
测量值与平均值的差值,用d表示d=x-x精密度:平行测定结果相互靠近的程度,用偏差衡量。∑di=0中位值:
将数据由小到大排列,奇数个测量值,取中间值;偶数个测量值,取中间相邻的的平均值全距(极差):
测量数据中最大值与最小值的差值3.1.1误差与偏差平均偏差:各单个偏差绝对值的平均值相对平均偏差:平均偏差与测量平均值的比值标准偏差:s
相对标准偏差:RSD标准偏差通过平方运算,能将较大的偏差更显著地表现出来,能更好地反映测定值的精密度准确度Accuracy准确度表征测量值与真实值的符合程度。准确度用误差表示。精密度Precision精密度表征平行测量值的相互符合程度。精密度用偏差表示。3.1.2准确度与精密度两者的关系:
(1)准确度是测量结果接近真值的程度,精密度表示测量的再现性;
(2)精密度是保证准确度的先决条件;精密度高不一定准确度高;
(3)两者的差别主要是由于系统误差的存在。3.1.2准确度与精密度结论:1、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。3、在消除系统误差的前提下,精密度好,准确度就高。3.1.2准确度与精密度根据误差的来源与性质,可分为系统误差和偶然误差两类。3.1.3系统误差与随机误差1、系统误差:又称可测误差方法误差:
溶解损失、终点误差-用其他方法校正
仪器误差:
刻度不准、砝码磨损-校准(绝对、相对)试剂误差:
不纯-空白实验操作误差:
洗涤次数太多主观误差:
个人误差具单向性、重现性、可校正特点2、随机误差:又称偶然误差过失
由粗心大意引起,可以避免的。如果发生,不能计入平均值不可校正,无法避免,服从统计规律不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定4-6次公差:生产部门对分析结果误差允许的一种限量。范围的确定:1、根据实际情况对分析结果准确度的要求而定。2、根据试样组成及待测组分含量而定。3、根据分析方法所能达到的准确度而定。3.1.4公差1、系统误差的传递:设测量值为A、B、C,其绝对误差为EA、EB、EC,结果用R表示
a.加减法
R=mA+nB-pCER=mEA+nEB-pECb.乘除法
R=mA×nB/pC
ER/R=EA/A+EB/B-EC/Cc.指数运算
R=mAn
ER/R=nEA/Ad.对数运算
R=mlgA
ER=0.434mEA/A3.1.5误差的传递2、随机误差的传递:用s表示
a.加减法
R=mA+nB-pC
sR2=m2sA2+n2sB2+p2sC2b.乘除法
R=mA×nB/pC
sR2/R2=sA2/A2+sB2/B2+sC2/C2c.指数运算
R=mAn
sR/R=nsA/Ad.对数运算
R=mlgA
sR=0.434msA/A极值误差:最大可能误差
R=A+B-C
ER=|EA|+|EB|+|EC|R=AB/C
ER/R=|EA/A|+|EB/B|+|EC/C|有效数字——在分析工作中实际上能测量到的数字。它既表示数量的大小,也反映测量的准确程度。3.2有效数字及其运算规则
有效数字:分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内3.2.1有效数字判断有效数字的位数的原则:1、包括全部可靠数字及一位不确定数字(最后一位)在内。2、0至9均为有效数字。0的位置与有效数字小数:数字前面的0只起定位作用,数字后面或数字之间的0是有效数字如:0.03080共四位有效数字整数:数字后面的0不一定是有效数字如:36000有效数字的位数不确定3、变换单位时,有效数字的位数必须保持不变。例如:10.00ml0.01000L;10.5L1.05×104ml4、自然数可看成具有无限多位数(如倍数关系、分数关系),可根据需要决定位数;常数亦可看成具有无限多位数,
如,e5、pH及pKa等对数值,其有效数字仅取决于小数部分数字的位数。例如:pH=10.28,换算成[H+]=5.2×10-11
有效数字是两位而不是四位。1.00080.1000pH=3.320.0903600五位有效数字四位有效数字二位有效数字二位有效数字不确定例题四舍六入五成双尾数≤4时舍;尾数≥6时入尾数=5时,若后面数为0,舍5成双;若5后面还有不是0的任何数皆入3.2.2有效数字的修约规则例:下列值修约为四位有效数字
0.32474 0.324760.32475 0.32485 0.324851
0.32470.32480.32480.32480.3249禁止分次修约运算时可多保留一位有效数字进行0.57490.570.5750.58×加减法:结果的绝对误差应不小于各项中绝对误差最大的数。(与小数点后位数最少的数一致)0.112+12.1+0.3214=12.5乘除法:结果的相对误差应与各因数中相对误差最大的数相适应(与有效数字位数最少的一致)
0.0121×25.64×1.05782=0.328432
3.2.3运算规则
自总体中随机抽出的一组测量值称为
所考察对象的全体称为在统计学中
样本中所含测定值的数目称为样本的容量,用
n
表示。总体样本3.3分析化学中的数据处理频数分布某试样在相同条件下,测得其铁含量从1.26%至1.56%,共100个测量值。由于测量过程存在随机误差,其分析结果时高时低。为了研究随机误差的分布规律,将上述100个杂乱无章的数据分为10组,每组的组距为0.03%,每组中测量值出现的次数为频数,频数除以数据总数为相对频数.
为了避免骑墙数据可能跨在两个组中重复计算,分组时各组界的数值比测量值多取一位数。3.3.1随机误差的正态分布
频数分布表
相对频数分布直方图
s:
总体标准偏差
离散特性:各数据是分散的,波动的相对频数分布直方图的特点样本中,n<20当n∞
xμsσ集中趋势:有向某个值集中的趋势m:总体平均值d:总体平均偏差当n>20时,d=0.797s
正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称。现今德国10马克印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。正态分布2023/2/62、正态分布:分析化学中测量数据一般符合正态分布,即高斯分布。y表示概率密度,x测量值,μ总体平均值,σ总体标准偏差1、集中性:正态曲线的高峰位于正中央,即均数μ所在的位置。2、对称性:正态曲线以均数μ为中心,左右对称,曲线两端永远不与横轴相交。3、均匀变动性:正态曲线由均数μ所在处开始,分别向左右两侧逐渐均匀下降。4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。5、u变换:为了便于描述和应用,常将正态变量作数据转换。正态分布曲线的特征
标准正态分布曲线
由于N(μ,σ
)曲线的形状随б而异,若将横坐标改用u表示,则正态分布曲线都归结为一条曲线.
.定义:又由记为N(0,1)
标准正态分布曲线
随机误差的区间概率正态分布曲线下的面积表示全部数据出现概率的总和。随机误差在某区间的概率表3-2正态分布概率积分表
[例]已知某试样中Co%的标准值为μ=1.75%,σ=0.10%,若无系统误差存在,试求:分析结果落在[1.75±0.15]%范围内的概率.
[解]
|X-μ||X-1.75%|0.15%
|u|=———=————
=———
=1.5σ0.10%0.10%查表得概率为2×0.4332=86.6%(双边)解:查表:u>2.5时,概率为:0.5–0.4938=0.0062=0.62%例:一样品,标准值为1.75%,测得=0.10,求结果落在测量值大于2%的概率。86.6%0.62%平均值的标准偏差:
从总体中分别抽出m个样本(通常进行分析只是从总体中抽出一个样本进行n次平行测定),每个样本各进行n次平行测定。因为有m个样本,也就有m个平均值,,由m个样本计算得到的平均值来估计总体平均值µ比只有一个样本(做n次测定)求得的平均值要好。很显然,由,计算得到的平均值的标准偏差一定比单个样本做n次测定得到的标准偏差s小。3.3.2总体平均值的估计
可以用统计学方法证明:用m个样本,每个样本作n次测量的平均值的标准偏差与单次测量结果的标准偏差s的关系为:
对于无限次测定,则为表明:平均值的标准偏差随着n的增大而减小;即平均值的精密度会提高。当n>5时变化很慢。增加(过多)测量次数的代价不一定能从减小误差得到补偿。
与n的平方根成反比,增加测定次数,可使平均值的标准偏差减小,但并不能使精密度成比例提高,通常测量4~6次足以.平均值的标准偏差与测定次数的关系2.少量实验数据的统计处理(1)t分布曲线正态分布是无限次测量数据的分布规律。对于有限次测量数据则用t分布曲线处理。
用
代替σ,纵坐标仍为概率密度,横坐标则为统计量t。图3-6t分布曲线f=1,5,∞
t分布曲线下面表示一定区间内的积分面积,就是该区间内随机误差出现的概率。这与标准正太分布曲线u是一致的。t分布曲线与标准正态分布曲线u的相同点1).n→∞时,t分布=u分布2).f:自由度f=(n-1)3).t与u分布不同的是,t曲线形状随自由度f而变化
4).P:置信度,测量值落在(μ+uσ)或(μ+ts)范围内的概率5).α:危险率(显著性水平),数据落在置信区间外的概率α=(1-P)6).t:置信因子,随α减小而增大,置信区间变宽7).t随P和f而变化,当f=20时,t≈u
t分布曲线与标准正态分布曲线u的区别t值与置信度P及自由度f关系写作tα,f例:t0·05,10表示置信度为95%,自由度为10时的t值。t0·01,5表示置信度为99%,自由度为5时的t值。(2)
平均值的置信区间tα,f值表(双边)P,α
→
对于少量测量数据,即当n有限时,必须根据t分布进行统计处理:
含义:表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。
例:测定未知试样中Cl-的质量分数,4次结果为47.64%,47.69%,47.52%,47.55%。计算置信度为90%,95%和99%时,总体平均值μ的置信区间。解:3.4分析方法准确性的检验(显著性检验)
b.由要求的置信度和测定次数,查表,得:t表
c.t计>
t表,表示有显著性差异,存在系统误差,
被检验方法需要改进
t计<
t表,
表示无显著性差异,被检验方法可以采用多以95%置信度为标准。3.4.1t检验法---系统误差的检测
1.平均值与标准值()的比较
步骤
:a.计算t值例:采用某新方法测定基准明矾中铝的质量分数,9次的分析结果为:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已知标准值为10.77%。试问采用该新方法是否引起系统误差(置信度95%)?解:n=9,f=8
查表:P=0.95,f=8时,t0.05,8=2.31。t<t0.05,8,故x与μ之间不存在显著性差异。即采用新方法没有引起明显的系统误差。d.查表(自由度f=f
1+f
2=n1+n2-2),
比较:t计>
t表,表示有显著性差异2.两组数据的平均值比较(同一试样)
c.计算t值:步骤:a.先用F检验法检验两组精密度无显著性差异。b.求合并的标准偏差:3.4.2F检验法-两组数据间偶然误差的检测b.按照置信度和自由度查表(F表),
c.比较F计算和F表步骤:a.计算F值:若则不存在显著性差异,否则存在显著性差异。置信度为95%时F值(单边)2345678910∞f大:大方差数据自由度f小:大方差数据自由度
单侧和双侧检验
1)单侧检验→检验某结果的精密度是否大于或小于某值,置信度为95%
[F检验常用]2)双侧检验→检验两结果是否存在显著性差异,置信度为90%
[t检验常用]例:当置信度为95%时,下列两组数据是否存在显著性差异?A:0.09896;0.09891;0.09901;0.09896
n=4B:0.09911;0.09896;0.09886;0.09901;0.09906
n=5[解]属两平均值的比较,先用F检验精密度,证明无差异之后,再用t检验系统误差.
_
(2)XB=0.09900SB2=92.5×10-10
S大2SB292.5×10-10
(3)F计=——=——=—————
=5.54
S小2SA216.7×10-10
(4)查表F=9.12因F计<F表
故SA与SB精密度无显著性差异
(6)查t0.05,7=2.36t计<t表
故两组数据无显著性差异3.5异常值的取舍
在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。统计学中处理方法有4d法、格鲁布斯(Grubbs)法和Q检验法。3.5.14d法根据正态分布规律,偏差超过3σ的个别测定值的概率小于0.3%,故这一测量值通常可以舍去。而δ=0.80σ,3σ≈4δ,即偏差超过4δ的个别测定值可以舍去。用4d法判断异常值的取舍时,首先求出除异常值外的其余数据的平均值和平均偏差d,然后将异常值与平均值进行比较,如绝对差值大于4d,则将可疑值舍去,否则保留。当4d法与其他检验法矛盾时,以其他法则为准。例:测定某药物中钴的含量如(μg/g),得结果如下:1.25,1.27,1.31,1.40。试问1.40这个数据是否应保留?解:不计异常值1.40,求得其余数据的平均值和平均偏差:异常值与平均值的差的绝对值为
|1.40一1.28|=0.12>4d(0.092)故1.40这一数据应舍去。3.5.2格鲁布斯(Grubbs)法有一组数据,从小到大排列为:
x1,x2,……,xn-1,xn。其中:x1或xn可能是异常值。用格鲁布斯法判断:首先计算出该组数据的平均值及标准偏差s,再根据统计量T进行判断。若T计>T表,则异常值应舍去,否则应保留。例:上例中的数据用Grubbs法判断,1.40这个数据是否保留(P=95%)解:与上例结论不同,该法可靠性较高格鲁布斯法优点,引人了正态分布中的两个最重要的样本参数
及s,故方法的准确性较好。缺点是需要计算
和s,手续稍麻烦。
3.5.3Q检验法一组数据,从小到大排列为:x1,x2,……,xn-1,xn若x1和xn为异常值,则统计量Q(舍弃商)为:Q值越大,说明xn离群越远。当Q计算>Q表时,异常值应舍去,否则应予保留。表3-6Q值表例:测量得结果:1.25、1.27、1.31、1.40,试问用Q检验法判断,1.40这个数据是否保留(P=90%)Q检验法的特点Q检验法符合数理统计原理,特别具有直观性和计算简便的优点。测定次数限制在3-10次。2-803.6回归分析法分析化学中经常用工作曲线来获取未知物的量,A与C的关系是否为线形相关(各实验点是否全部落在一条直线上?)用数理统计方法找出各实验点误差最小的直线→回归分析3.6.1一元线性回归方程(linearregression)回归直线的方程中,a为线的截矩,b为直线的斜率,,分别为x和y的平均值,它们的值确定之后,一元线性回归方程及回归直线就定了。2-82a.从一组数据出发确定这些变量间的定量关系→回归方程的建立b.评价和度量变量间的关系的密切程度→相关系数检验c.应用回归方程,从一些变量值去估计另一变量值d.对回归方程的主要参数作进一步评价和比较→回归曲线的检验
回归方程的意义和用途2-833.6.2相关系数1.r值计算判断y与x之间的相关性好坏的尺度2.r值的物理意义当都在回归线上时,r=±1完全相关当y与x无相关性时,r=0r在0~1之间时,y与x有相关性,r愈接近1,相关性愈好3.相关系数的显著性检验求r值在一定置信度下,当,则x和y相关,所拟合的回归曲线有意义,
否则x与y不相关,所得回归方程不可靠例用吸光光度法测定合金钢中Mn的含量,吸光度与Mn的含量间有下列关系:Mn的质量μg:0,0.02,0.04,0.060.080.1010.12未知样吸光度A0.0320.1350.1870.2680.3590.4350.5110.242试列出标准曲线的回归方程并计算未知试样中Mn的含量。解
此组数据中,组分浓度为零时,吸光度不为零,这可能是在试剂中含有少量Mn,或者含有其它在该测量波长下有吸光的物质。设Mn含量值为x,吸光度值为y,计算回归系数a,b值。
a=0.038b=3.95
标准曲线的回归方程:y=0.38+3.95xr=0.9993<r99%,f标准曲线具有很好的线性关系,未知试样中含Mn0.052μg。3.7提高分析结果准确度的方法
1.选择合适的分析方法
(1)根据试样的中待测组分的含量选择分析方法。如:高含量组分用滴定分析或重量分析法,这两种方法相对误差较小,故准确度高,但是灵敏度较低;低含量用仪器分析法,灵敏度高,准确度低。(2)充分考虑试样中共存组分对测定的干扰,采用适当的掩蔽或分离方法。
如:
(3)对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定。2-90
2.减少测量误差
称量:分析天平的称量误差为±0.2mg,为了使测量时的相对误差小于0.1%,试样质量必须在0.2g以上。滴定管读数有±0.01mL的误差,一个数据需读数两次,有±0.02mL的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在20mL以上,最好在25mL左右。一般在20~30mL。微量组分的光度测定中,可将称量的准确度提高约一
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 超声O-RADS分类在卵巢肿瘤中的诊断价值及卵巢癌风险预测模型的构建
- 中外硕士学位论文结论语步中立场副词的对比研究
- 2025至2030年红竹扎线笛项目投资价值分析报告
- CeO2-MnO2-NF粒子电极协同臭氧降解染料废水研究
- 同心圆环结构的液晶透镜设计及光学特性研究
- 虚拟实践中人的主体性消解及其重建
- 细胞外囊泡miR-143-3p作为脑出血后分子标志物及治疗靶点的研究
- 光纤Bragg光栅金属化封装工艺及其低温传感特性研究
- 2025年非热杀菌先进设备项目发展计划
- 认知工具对数据分析能力培养效果的影响研究
- 中国电信行业人工智能行业市场调研及投资规划建议报告
- 建筑工地工人职业健康体检计划
- 河南省郑州市十校联考2024-2025学年高二上学期11月期中考试语文试题
- 妊娠期肝内胆汁淤积症临床诊治和管理指南(2024版)解读课件
- 山东省潍坊市2024-2025学年高三上学期期末 地理试题(含答案)
- 招聘专职人员报名表
- 《感冒中医治疗》课件
- 牛津上海版小学英语四年级下册(英语单词表)
- 2024年体育赛事运动员赞助合同3篇
- 2023年中考英语话题复习课件 健康与饮食
- 2023年机动车检测站质量手册和程序文件(根据补充要求编制)
评论
0/150
提交评论