版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1第03章分析化学中的误差与数据处理§3.1分析化学中的误差§3.2有效数字及其运算规则§3.3分析化学中的数据处理§3.4显著性检验§3.5可疑值取舍§3.6回归分析法§3.7提高分析结果准确度的方法2§3.1
分析化学中的误差
一、基本概念
1.真值某一物理量本身具有的客观存在的真实数值,即为该量的真值。一般说来,真值是未知的,但下列情况的真值可以认为是知道的:a.理论真值
如某化合物的理论组成3b.计量学约定真值如国际计量大会上确定的长度、质量、物质的量单位等c.相对真值认定精度高一个数量级的测定值作为低一级的测量值的真值,这种真值是相对比较而言的。如科学实验中使用的标准试样及管理试样中组分的含量。42.平均值几次测量数据的算术平均值为:平均值虽然不是真值,但比单次测量结果更接近真值。所以在日常工作中,总是重复测定次数,然后求得平均值。数理统计方法证明,在没有系统误差时,一组测量数据的算术平均值为最佳值。53.中位值一组测量数据按大小顺序排列,中间一个数即为中位数。当测量值的个数为偶数时,中位数为中间相邻两个测量值的平均值。优点是能简便直观地说明一组测量数据的结果,且不受两端具有过大误差的数据的影响;缺点是不能充分利用数据,因而不如平均值准确。
64.误差分析结果与真实值之间的差值称为误差。
E=x-xT分析结果大于真实值,误差为正;分析结果小于真实值,误差为负。
75.极差一组测量数据中,最大值(Xmax)与最小值(Xmin)之差称为极差,(全距或误差范围)。
R=Xmax-Xmin相对极差:用该方法表示误差,十分简单,适用于少数几次测定中估计误差的范围。不足之处——没有利用全部测量数据。
8二、误差的分类根据误差的来源和性质,可将误差分为两类:
1.系统误差系统误差又称可测误差,是由某种固定的原因引起的误差。特点:
A、单向性:它对分析结果的影响比较固定,可使测定结果系统偏高或偏低。
B、重现性:当重复测定时,它会重复出现。
C、可测性:一般来说产生系统误差的具体原因都是可以找到的。因此也就能够设法加以测定,从而消除它对测定结果的影响,所以又称可测误差。
如:未经校正的砝码或仪器。9根据系统误差产生的具体原因,分为:
①、方法误差:
是由分析方法本身不够完善或有缺陷而造成的,如:滴定分析中所选用的指示剂的变色点和化学计量点不相符;分析中干扰离子的影响未消除;重量分析中沉淀的溶解损失而产生的误差。
②、仪器误差:由仪器本身不准确造成的。
如:天平两臂不等,滴定管刻度不准,砝码未经校正。
10③、试剂误差:使用的试剂或蒸馏水不纯而造成的误差。
④、主观误差(或操作误差)
由操作人员一些生理上或习惯上的主观原因造成的,如:终点颜色的判断,有人偏深,有人偏浅。重复滴定时,有人总想第二份滴定结果与前一份相吻合。在判断终点或读数时,就不自觉地受这种“先入为主”的影响。
112.随机误差(或称偶然误差)
它是由某些无法控制和避免的偶然因素造成的。如:测定时环境温度、湿度、气压的微小波动,仪器性能的微小变化,或个人一时的辨别的差异而使读数不一致等。如:天平和滴定管最后一位读数的不确定性。它的特点:大小和方向都不固定,也无法测量或校正。
12除这两种误差外,往往可能由于工作上粗枝大叶不遵守操作规程等而造成的“过失误差”。过失
由粗心大意引起,可以避免的如:器皿不洁净,丢损试液,加错试剂,看错砝码、记录或计算错误等。
13(一)准确度与误差(accuracyanderror)准确度:测量值(x)与真值()之间的符合程度。
它说明测定结果的可靠性,用误差值来量度绝对误差:测量值与真值间的差值,用E表示
Ea=x-
误差越小,表示测定结果与真实值越接近,准确度越高;反之,误差越大,准确度越低。分析结果大于真实值,误差为正值,表示测定结果偏高;分析结果小于真实值,误差为负值,表示测定结果偏低。
三、准确度和精密度14但绝对误差不能完全地说明测定的准确度,即它没有与被测物质的质量联系起来。如果被称量物质的质量分别为1g和0.1g,称量的绝对误差同样是0.0001g,则其含义就不同了,故分析结果的准确度常用相对误差(RE%)表示:相对误差:绝对误差占真值的百分比,用Er表示(Er%)反映了误差在真实值中所占的比例,用来比较在各种情况下测定结果的准确度比较合理。15(二)精密度和偏差
在实际工作中,真实值往往是不知道的,因此无法求得分析结果的准确值。因此,我们常用另一种表示方法。精密度:平行测定结果相互靠近的程度,用偏差衡量。精密度的高低用偏差来衡量其大小,偏差越小,分析结果的精密度越高。16常用的几种偏差表示方法为:
绝对偏差和相对偏差
绝对偏差
相对偏差
17例:标定某一溶液浓度,三次测定结果为:
0.18270.18250.1828(mol/L)
解:其相对偏差依次为:
0,-0.1%,+0.06%
显然,偏差愈小,表示分析结果间精密度愈高。
182.平均偏差当测定为无限多次,实际上>30次时:总体平均偏差
总体——研究对象的全体(测定次数为无限次)样本——从总体中随机抽出的一小部分19当测定次数仅为有限次,在定量分析的实际测定中,测定次数一般较小,<20次时:平均偏差(样本)
相对平均偏差
用平均偏差表示精密度比较简单,不足之处:在一系列测定中,小的偏差测定总次数总是占多数,而大的偏差的测定总是占少数。因此,在数理统计中,常用标准偏差表示精密度。203.标准偏差(1)总体标准偏差当测定次数大量时(>30次),测定的平均值接近真值此时标准偏差用表示:21(2)样本标准偏差
在实际测定中,测定次数有限,一般n<30,此时,统计学中,用样本的标准偏差S
来衡量分析数据的分散程度:式中(n-1)为自由度,它说明在n
次测定中,只有(n-1)个可变偏差,引入(n-1),主要是为了校正以样本平均值代替总体平均值所引起的误差。22即
而S
(3)样本的相对标准偏差——变异系数
(4)样本平均值的标准偏差
此式说明:平均值的标准偏差按测定次数的平方根成正比例减少23(三)准确度与精密度之间的关系
准确度是指测定值和真实值的符合程度,用误差的大小来度量。而误差的大小与系统误差和随机误差都有关,它反映了测定的正确性。精密度则是指一系列平行测定数据相互间符合的程度,用偏差大小来衡量。偏差的大小仅与随机误差有关,而与系统误差无关。偏差的大小不能反映测定值与真实值之间相符合的程度,它反映的只是测定的重现性。所以应从准确度与精密度两个方面来衡量分析结果的好坏。
24如下图:甲、乙、丙、丁四人分析同一标准铁试样中铁的含量的结果。
25高精密度是获得高准确度的必要条件,精密度好,是保证准确度的先决条件;精密度高却不一定准确度高。精密度高只反映了随机误差小,并不保证消除了系统误差。因此,要从准确度和精密度这两个方面,从消除系统误差和减小随机误差这两方面来努力,以保证测定结果的准确性和可靠性。
26四.公差公差是生产部门对于分析结果允许误差的一种表示方法。如果分析结果超出允许的公差范围,称为“超差”。公差范围的确定:①根据实际情况对分析结果准确度的要求;②公差范围常依试样组成及待测组分含量而不同。27五误差的传递
(一)系统误差
加减法若R=A+B-C,则ER=EA+EB-EC若
R=A+mB-C,则ER=EA+mEB-EC
分析结果的绝对误差是各测量步骤绝对误差的代数和。28
乘除法
若,则
若
则
分析结果的相对误差是各测量步骤相对误差的代数和。29
指数关系若R=mAn,则
对数关系若
R=mlgA,则
分析结果的相对误差是测量值的相对误差的指数倍。30(二)偶然误差
1、加减法若R=A+B-C,则SR2=SA2+SB2+SC2若
R=aA+bB-cC+…,则
SR2=a2SA2+b2SB2+c2SC2+…
分析结果的标准偏差的平方是各测量步骤标准偏差的平方总和。31
若,则
若
,则
2、乘除法分析结果的相对标准偏差的平方是各测量步骤相对标准偏差的平方的总和。32
3、指数关系若R=mAn,则4、对数关系若R=mlgA,则
SR=0.434m33(三)极值误差----最大可能误差
加减法若R=A+B-C,则
乘除法若 ,则在分析化学中,通常考虑在最不利的情况下,各步骤带来的误差互相累加在一起,这种误差称为极值误差。34§3.2有效数字及运算规则1有效数字:分析工作中实际能测得的数字,包括全部可靠数字及一位不确定数字在内a数字前0不计,数字后计入:0.03400b数字后的0含义不清楚时,最好用指数形式表示:1000(1.0×103,1.00×103,1.000×103)c自然数和常数可看成具有无限多位数(如倍数、分数关系)d
数据的第一位数大于等于8的,可多计一位有效数字,如9.45×104,95.2%,8.65e对数与指数的有效数字位数按尾数计,如pH=10.28,则[H+]=5.2×10-11f误差只需保留1~2位35m
分析天平(称至0.1mg):12.8228g(6), 0.2348g(4),0.0600g(3)
千分之一天平(称至0.001g):0.235g(3)
1%天平(称至0.01g):4.03g(3),0.23g(2)
台秤(称至0.1g):4.0g(2),0.2g(1)V
☆滴定管(量至0.01mL):26.32mL(4),3.97mL(3)
☆容量瓶:100.0mL(4),250.0mL(4)
☆移液管:25.00mL(4);
☆量筒(量至1mL或0.1mL):25mL(2),4.0mL(2)362有效数字运算中的修约规则尾数≤4时舍;尾数≥6时入尾数=5时,若后面数为0,舍5成双;若5后面还有不是0的任何数皆入四舍六入五成双例下列值修约为四位有效数字
0.32474 0.32475 0.32476 0.32485 0.324851
0.32470.32480.32480.32480.324937禁止分次修约运算时可多保留一位有效数字进行0.57490.570.5750.58×38加减法:结果的绝对误差应不小于各项中绝对误差最大的数。(与小数点后位数最少的数一致)
0.112+12.1+0.3214=12.53运算规则乘除法:结果的相对误差应与各因数中相对误差最大的数相适应(与有效数字位数最少的一致)
0.0121×25.66×1.0578=0.328432
39例0.0192H2O+CO240§3.2分析化学中的数据处理
一、随机误差的正态分布1.频数分布算出极差:
R=Xmax—Xmin确定组数和组距:
R/组数算出频数:
含量落在每组内的数目算出相对频数(频率):
频数与样本容量总数之比频率密度:
频率除以组距系统误差:可校正消除随机误差:不可测量,无法避免,可用统计方法研究41频数分布直方图根据测量数据的组值范围与相应的频数
(或相对频数
)绘制成的直方图。由图表明:随机误差的存在,分析数据具有分散性,又有向某个中心值集中的趋势,这种既分散又集中的特性,形象地表示随机误差分布的规律。结论:◆测量值具有分散的特性,不同测定值之间各种大小偏差的出现是彼此独立、互不相关;◆测定值具有明显的集中趋势,位于中间数值的数据多一些。
42
当测量次数为无限时,测量数据一般符合正态分布规律,其概率密度函数为:2正态分布式中,x为测量值;y为概率密度,x的函数;μ为总体平均值,无限多次测定数据的平均值,相应于曲线最高点的横坐标值,在没有系统误差时,即是真值,表示测量值的集中趋势;σ为总体标准偏差,从总体平均值μ到曲线拐点间的距离,它反映测量值的分散程度,σ越小,测量值的分散程度就越小,即精密度越高。x-μ:表示随机误差。m43若以x-μ为横坐标,则曲线最高点对应的横坐标值为零,这时曲线成为随机误差的正态分布曲线。
44由正态分布曲线及其数学表达式可见:a.x=μ时,y值最大,此即分布曲线的最高点。它体现了测定值的集中趋势。这就是说,大多数测量值集中在算术平均值的附近;或者说算术平均值是可信赖值或最佳值,它能很好地反映测量值地集中趋势。b.曲线以x=μ这一直线为其对称轴。这一情况说明正误差和负误差出现的概率相等。
45c.当x趋-∞或+∞时,曲线以x轴为渐近线,说明小误差出现的概率大,大误差出现的概率小,出现很大误差的概率极小,趋近于零。d.当
x=μ时的概率密度为:
y=1/σ(2π)1/2概率密度乘上dx即为测量值落在该dx范围内的概率。由上式可见,σ越大,测量值落在μ附近的概率越小。这意味着测量的精密度越差,测量值的分布就越分散,正态分布曲线也就越平坦。反之,σ越小,测量值分散程度越小,正态分布曲线也就越尖锐。46随机误差的特点:
(1).
对称性绝对值相等的正负误差出现的概率相等。
(2).单峰性绝对值小的误差出现的概率大,绝对值大的误差出现的概率小。
(3).有界性绝对值很大的误差出现的概率极小。
正态分布曲线依赖于μ和σ两个基本参数,μ反映测量值分布的集中趋势,σ反映测量值分布的分散程度。这种正态分布曲线以N(μ,σ2)表示。
47标准正态分布N(μ,σ2)分布曲线有两个参数,它随着μ和σ改变而改变,通过变量代换,可将任一正态分布化为同一分布——标准正态分布:参数μ=0,σ2=1的正态分布称为标准正态分布,以N(0,1)表示。这一变换是将正态分布曲线的横坐标用u为单位来表示。48u定义:u=x-μ/σy=f(x)=1/σ(2π)1/2EXP[-u2/2]du=dx/σ∴f(x).dx=1/σ(2π)1/2EXP[-u2/2].du.σ=1/(2π)1/2EXP[-u2/2].du=Φ(u).duy=Φ(u)=1/(2π)1/2EXP[-u2/2]49标准正态分布曲线是以总体平均值μ为原点,以σ为横坐标单位的曲线。横坐标:以标准偏差σ为单位的(x-μ)的偏差值即u值;纵坐标:相对频数或概率密度,它对不同μ和σ的任何测量值都适用。
50正态分布曲线变换为以标准偏差σ为单位的
u值作横坐标的标准正态分布曲线,相应的以
u值为变量的φ(u)称为标准正态分布概率密度函数。
513、随机误差的区间概率正态分布曲线与横坐标-∞到+∞之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即概率P为:P=∫Φ(u).du=∫1/(2π)1/2EXP[-u2/2].du=1任一随机变量在某一区间出现的概率,可由概率密度函数f(x)在该区间的定积分求得。P(a≤x≤b)=1/σ(2π)1/2∫
EXP[-(x-μ)2/2σ2].dxP(u1≤x≤u2)=1/(2π)1/2∫
EXP[-u2/2].du52为了使用方便,对于标准正态分布曲线,不同u值时所占面积已用积分方法求得,并制成各种形式的概率积分表以供查用。P573-2正态分布概率积分表。表中列出的面积与图中阴影部分相对应,表示随机误差在此区间的概率。u值有正有负,表中只列出∣u∣值。若求-u到+u值区间的概率,则必须将所查到的值乘以2。53例
.计算测量值落在区间μ±1.64σ内的概率。
解:
查标准正态分布概率积分表,
u=1.64时,面积为0.4495,求得测量值落在区间μ±1.64σ内的概率为:
2×0.4495=89.9%。同理,可求出测量值落在其它区间的概率
54面积区间概率%1.00.341368.31.960.475095.02.00.477395.52.580.495199.03.00.498799.755例
.某班学生的
117个数据基本遵从正态分布
N(66.62,
0.21)。求数据落在
66.20~
67.08中的概率及大于
67.08的数据可能有几个
?解:
μ=66.62σ=0.21
当
x=66.20时,
u=(
x-μ)/σ=(66.20-66.62)/0.21=-2.0
查表|
u|
=2.0时,概率为
0.4773
当
x=67.08时,
u=(x-μ)/σ=(67.08-66.62)/0.21=2.19
概率为
0.4857
数据落在
66.20~
67.08内的概率为
0.4774+0.4857=96.3%
数据大于
67.08的概率为
0.5000-0.4857=0.0143
可能个数为:
117×0.0143≈2个56二、少量数据的统计处理
1、平均值的可靠性
平均值的精密度x:数据的算术平均值能较好地体现其集中趋势。x=1/n(x1+x2+…+xn)s:
标准偏差,体现了单次测量值的精密度。57多个样本的精密度Sx:总体标准偏差:平均偏差:582、t分布曲线当测量数据不多时,总体标准偏差σ是不知道的,只好用样本标准偏差s来估计测量值的分散情况。用s代替σ,必然引起正态分布的偏离,这时可用t分布来处理。t分布如图3-6所示,纵坐标仍为概率密度,但横坐标则为统计量t。t的定义为:59由图可见,
t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当
f趋近无穷时,t分布就趋近正态分布。
60与正态分布曲线一样,t分布曲线下面一定区间的积分面积,就是该区间内随机误差出现的概率。不同的是t分布曲线形状不仅随t值而改变,还与f值有关。不同f值及概率所相应的t值已计算出来。表3-3列出最常用的t值。表中置信度用P表示,它表示在某一t值时,测定值落在(μ±ts)范围内的概率,显然,落在此范围之外的概率为(1-P),称为显著性水准,用α表示。由于t值与置信度、自由度有关,一般表示为tα,f61例如:t0.05,10表示置信度为95%,自由度为10时的t值t0.01,5表示置信度为99%,自由度为5时的t值理论上,只有当f→∞时,各置信度对应的t值才与相应的u值一致,但由表可以看出,当f=20时,t值与u值已充分接近了。
62633、平均值的置信区间由随机误差的区间概率可知,当用单次测量结果(x)来估计总体平均值μ的范围,则μ包括在(x±1σ)范围内的概率为68.3%,在(x±1.64σ)范围内的概率为90%,在(x±1.96σ)范围内的概率为95%,它的数学表达式为
μ=x±uσ不同置信度的u值可查表得到。64若以样本平均值来估计总体平均值可能存在的区间,可按下式进行估算对于少量测量数据,必须根据t分布进行统计处理,按t的定义可得出65它表示在一定置信度下,以平均值为中心,包括总体平均值μ的范围,即平均值的置信区间。对于置信区间的概念必须正确理解,如μ=47.50%±0.10%(置信度为95%),应当理解为在47.50%±0.10%的区间内包括总体平均值μ的概率为95%。因为μ是客观存在的,没有随机性,不能说它落在某一区间的概率是多少。在分析化学中,一般将置信度定在95%或90%。66§3.4显著性检验
在实际工作中,往往会遇到对标准试样或纯物质进行测定时,所得到的平均值与标准值不完全一致;或者采用两种不同分析方法或不同分析人员对同一试样进行分析时,两组分析结果的平均值有一定差异;这种差异是由偶然误差引起的,还是系统误差引起的?这类问题在统计学中属于“假设检验”。如果分析结果之间存在“显著性差异”,就认为它们之间有明显的系统误差;否则就认为没有系统误差,纯属偶然误差引起的,认为是正常的。显著性检验方法在分析化学中常用的有t检验法和F检验法。67①平均值与标准值的比较
为了检查分析数据是否存在较大的系统误差,可对标准试样进行若干次分析,再利用
t检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。
进行
t检验时,首先按下式计算出
t值:
1.t检验法如果t值大于表(3-3)中的ta,f值,则认为存在显著性差异,否则不存在显著性差异。分析化学中,通常以95%的置信度为检验标准,即显著性水准为5%。68②两组平均值的比较
不同分析人员或同一分析人员采用不同方法分析同一试样,所得到的平均值,经常是不完全相等的。要判断这两个平均值之间是否有显著性差异,亦可采用
t检验法。
设两组分析数据为:n1s1
1n2s2
2s1和s2分别表示第一组和第二组分析数据的精密度,它们之间是否有显著性差异,可采用后面介绍的F检验法进行判断。如证明它们之间没有显著性差异,则认为s1≈s2,用下式求得合并标准偏差s:
69或
70然后计算出t值:
在一定置信度时,查出表值t表(总自由度f=n1+n2-2),若t>t表,两组平均值存在显著性差异
t<t表,则不存在显著性差异。
712.
F检验法
F检验法是通过比较两组数据的方差s2,以确定它们的精密度是否有显著性差异的方法。统计量F
的定义为:两组数据的方差的比值,分子为大的方差,分母为小的方差,即:
将计算所得F值与表中所列F值进行比较。如果两组数据的精密度相差不大,则F值趋近于1;如果两者之间存在显著性差异,F值就较大。在一定的置信度及自由度时,若F值大于表值,则认为它们之间存在显著性差异(置信度95%),否则不存在显著性差异。p64表中列出的F值是单边值,引用时宜加以注意。72§3.5可疑值的取舍
实验中得到一组数据,往往个别数据离群较远,这一数据称为异常值,又称可疑值或极端值。如果是由于过失造成的,如溶解试样有溶液溅出,滴定时加入了过量的滴定剂等等,则这一数据必须舍去。若并非这种情况,则对异常值不能随意取舍,特别是当测量数据较少时,异常值的取舍对分析结果产生很大影响,必须慎重对待。对于不是因为过失而造成的异常值,应按一定的统计学方法进行处理。统计学处理异常值的方法有好几种,下面重点介绍处理方法较简单的
4d法、
Q检验法及效果较好的格鲁布斯
(Grubbs)法。
7314法根据正态分布规律,偏差超过3σ的个别测定值的概率小于0.3%,故这一测量值通常可以舍去。而δ=0.8σ,3σ≈4δ,即偏差超过4δ的个别测定值可以舍去。对少量实验数据,只能用s代替σ,用代替δ,故可以粗略地认为,偏差大于4的个别测定值可以舍去。这样处理问题存在较大的误差。但是,这种方法比较简单,不必查表,至今为人们所采用。当4法与其它检验法矛盾时,应以其它法为准。
744法判断异常值的取舍※
求出除异常值外的其余数据的平均值和平均偏差,※将异常值与平均值进行比较,绝对偏差大于4,则将可疑值舍去;否则保留。
752.Q检验法有一组数据,从小到大排列为:
x1,x2,…,xn-1,xn设xn是异常值,则统计量Q为
如果x1是异常值,则统计量Q为
76式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差。Q值越大,说明
xn离群越远。
Q称为“舍弃商”。统计学家已经计算出不同置信度时的Q值
(表
3-6),当计算所得Q值大于表中的Q值时,该异常值即应舍去。否则应于保留。
77Q-检验法
(3~10次测定适用,且只有一个可疑数据)
(1)
将各数据从小到大排列:x1,x2,x3……xn
(2)计算
(x大-x小),即
(xn-x1)
(3)计算
(x可-x邻),
(4)计算舍弃商
Q
计
=
x可-x邻/xn-x1
(5)根据
n和
P查
Q
值表得
Q表
(6)比较
Q表
与
Q
计
若:Q
计
Q表
可疑值应舍去
Q
计<Q表可疑值应保留783.格鲁布斯(Grubbs)法将计算所得T值与表3-5中相应数值比较,若T>Tα,n,则异常值舍去,否则应保留。有一组数据,从小到大排列为:x1,x2,…,xn-1,xn,其中x1或xn可能是异常值。用格鲁布斯(Grubbs)法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量T进行判断。设x1是可疑的,则
若xn是可疑的,则79G检验法(Grubbs法)设有n各数据,从小到大为x1,x2,x3,……xn;
其中
x1或
xn为可疑数据:(1)计算
(包括可疑值x1、
xn在内)、∣x可疑-∣及S;(2)计算T:
(3)查T值表得Tα,n
(4)比较T计与Tα,n
:若
T计
Tα,n则舍去可疑值;
T计
<Tα,n则保留可疑值。80格鲁布斯法的优点在判断异常值的过程中,引入了正态分布中的两个重要的样本参数和s,方法的准确度较好。缺点是需要计算和s,手续麻烦。
81
异常值的取舍是一项十分重要的工作。在实脸过程中得到一组数据后,如果不能确定个别异常值确系由于“过失”引起的,我们就不能轻易地去掉这个数据,而是要用上述统计检验方法进行判断之后,才能确定其取舍。在这一步工作完成后,我们就可以计算该组数据的平均值标准偏差以及进行其他有关数理统计工作。
82§3.6回归分析法
变量之间的关系,有的是确定的函数关系,有的没有确定的函数关系,变量y随着变量x而变化,但不能由x的取值精确求出y的值,变量y与x间的这种关系称为相关关系。回归分析就是研究变量间相关关系的一种数理统计方法。
分析化学中,
经常涉及到研究两个变量之间的线性相关关系,
这就是一元线性回归分析。
83一、一元线性回归方程y=a+bxa、b称为回归系数。
由实验数据计算出a和b,就得到确定的一元线性回归方程和确定的回归直线。
84二、相关系数
当两个变量之间直线关系不够严格,数据的偏离较严重时,虽然可以求得一条回归线,但是,实际上只有当两个变量之间存在某种线性关系时,这条回归线才有意义。相关系数r是表示变量y与x间相关程度的一个系数,可用此判断回归方程是否有意义。85a.当所有的yi值都在回归线上时,r=1b.当y与x之间完全不存在线性关系时,r=0c.当r值在0至1之间时,表示y与x之间存在相关关系。r值越接近1,线性关系就越好。还应考虑测量次数及置信水平。表3-7:不同置信水平及自由度时的相关系数(P71)。若计算出的相关系数大于表上相应的数值,就可以认为这种线性关系是有意义的。
相关系数的物理意义:86
§3.7提高分析结果准确度的方法三.消除系统误差系统误差可采用一些校正的办法和制定标准规程的办法加以校正,使之接近消除。
1>.采用标准方法,找出校正数据消除方法误差
2>.实验前校正器皿和仪器消除仪器误差一、选择合适的分析方法二、减小测量误差873>.空白实验检验和消除——试剂误差
空白试验:就是在不加试样的情况下,按照试样分析同样的操作条件和手续进行试验。试验所得结果称为空白值。4>.对照试验
对照试验是检验系统误差的最有效的办法。可以与标准试样的标准结果进行对照;也可以与其它成熟的分析方法进行对照;或者由不同分析人员,不同实验室来进行对照试验。88
标准试样的结果比较可靠,可供对照试验选用。进行对照试验时,尽量选择与试样组成相近的标准试样进行对照分析。根据标准试样的分析结果,可由统计方法进行检验,以判断试样分析结果有无系统误差。
由于标准试样的数量和品种有限,所以有些单位又自制一些所谓“管理样”,以此代替标准进行对照分析。管理样事先经过反复多次分析,其中各组分的含量也是比较可靠的。
89
如果没有适当的标准试样和管理试样,有时可以自己制备“人工合成试样”来进行对照分析。人工合成试样是根据试样的大致成分由纯化合物配制而成。
进行对照试验时,如果对试样的组分不完全清楚,则可以采用“加入回收法”进行试验。这种方法是向试样中加入已知量的被测组分,然后进行对照试验,看看加入的被测组分能否被定量回收,以此判断分析过程是否存在系统误差。
90
用其它可靠的分析方法进行对照试验也是经常采用的一种方法。作为对照试验用的分析方法必须可靠,一般选用国家颁布的标准分析方法或公认的经典分析方法。
在许多生产单位中,为了检查分析人员之间是否存在系统误差和其它问题,常在安排试样分析任务时,将一部分试样重复安排在不同分析人员之间,互相进行对照试验,这种方法称为“内检”。有时又将部分试样送交其它单位进行对照分析,这种方法称为“外检”。
对照试验是用已知含量的标准试样,按所选用的测定方法,同样的条件、试剂进行分析试验,找出校正值,纠正可能引起的误差。
91二.减少随机误差
偶然误差是由偶然因素引起的,可大可小,可正可负,粗看起来,无规律可循,但经过大量实验可以发现,偶然误差的分布也有一定规律性:
(
1)大小相近的正误差和负误差出现的机率相等,即绝对值相近
(或相等
)而符号相反的误差以同等的机率出现。
(
2)小误差出现的频率高,而大误差出现的频数较低,很大误差出现的机率近于零或极少。即:偶然误差的规律符合正态分布。在消除系统误差的情况下,增加测定次数,取其平均值,可减少偶然误差。
92§3.23.3有限数据的统计处理总体样本样本容量n,自由度f=n-1样本平均值总体平均值m真值xT标准偏差sx931.总体标准偏差σ无限次测量;单次偏差均方根2.样本标准偏差s样本均值n→∞时,→μ
,s→σ3.相对标准偏差(变异系数RSD)3.3.1标准偏差x944.衡量数据分散度:标准偏差比平均偏差合理5.标准偏差与平均偏差的关系
d=0.7979σ6.平均值的标准偏差σū=σ/n1/2,s
ū=s/n1/2s
ū与n1/2成反比95s:
总体标准偏差
随机误差的正态分布m离散特性:各数据是分散的,波动的集中趋势:有向某个值集中的趋势m:总体平均值d:
总体平均偏差d=0.797s96N→∞:随机误差符合正态分布(高斯分布) (,)n有限:t分布和s代替,x3.3.3有限次测量数据的统计处理t分布曲线曲线下一定区间的积分面积,即为该区间内随机误差出现的概率
f→∞时,t分布→正态分布97
某一区间包含真值(总体平均值)的概率(可能性)置信区间:一定置信度(概率)下,以平均值为中心,能够包含真值的区间(范围)置信度越高,置信区间越大平均值的置信区间98
定量分析数据的评价---解决两类问题:(1)可疑数据的取舍
过失误差的判断方法:4d法、Q检验法和格鲁布斯(Grubbs)检验法确定某个数据是否可用。(2)分析方法的准确性系统误差及偶然误差的判断
显著性检验:利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异。方法:t检验法和F检验法确定某种方法是否可用,判断实验室测定结果准确性99可疑数据的取舍过失误差的判断
4d法
偏差大于4d的测定值可以舍弃
步骤:求异常值(Qu)以外数据的平均值和平均偏差
如果Qu-x>4d,舍去
100Q检验法
步骤:(1)数据排列X1
X2……Xn
(2)求极差Xn-X1
(3)求可疑数据与相邻数据之差
Xn-Xn-1或X2-X1
(4)计算:101(5)根据测定次数和要求的置信度,(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 逛超市课件教学课件
- 冲刺一级建造师考试教案案例试题
- 《骆驼寻宝记》教案设计
- 《相互协作的人体器官》教案
- 婚礼活动租赁协议
- 五年级上册艺术教案
- 媒体传播培训合同
- 体育馆观众自行车车棚施工合同
- 天津市菜市场垃圾分类指南
- 能源开发行业薪资管理策略
- 电子商务平台2024年电子商务平台选择与搭建指南
- 精神障碍患者的社交技巧训练
- 2024年广发证券股份有限公司招聘笔试参考题库含答案解析
- 50音图-な行课件【知识精讲精研】高中日语新编日语第一册
- 电子商务与新零售
- 青岛版科学(2017)六三制六年级上册实验报告单
- 如何在酒店管理中培养创新思维
- 合伙人协议 合伙经营协议全套
- 小学教学信息化管理章程
- 统编版五年级上册语文第五单元习作介绍一种事物 公开课一等奖创新教学设计 (表格式)
- 光伏项目强制性条文实施措施及计划
评论
0/150
提交评论