误差和分析数据处理优秀文档_第1页
误差和分析数据处理优秀文档_第2页
误差和分析数据处理优秀文档_第3页
误差和分析数据处理优秀文档_第4页
误差和分析数据处理优秀文档_第5页
已阅读5页,还剩93页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2-1第2章:误差和分析数据处理2.1误差的分类2.2误差的表示2.3测量值和随机误差的正态分布2.4少量数据的统计处理2.5提高分析结果准确度的方法2.6有效数字及运算规则小结

习题2-2:误差的分类

2.1.1.系统误差(Systematicerrors):由比较固定的原因引起的误差

来源:

1.方法误差:方法本身造成的

2.仪器误差:仪器本身的局限

3.试剂误差:试剂不纯

4.操作误差:操作不正确

5.主观误差:操作习惯,辨别颜色读刻度的差别

特点:重复性,单向性,可测性2-3

2.1.2.随机误差(Randomerrors):随机偶然,难以控制,不可避免

来源:偶然性因素

特点:原因.方向.

大小.

正负不定,不可测

2.1.3.错误误差:操作者的粗心大意

1.过失误差:确系发生,数据必舍.

2.系统误差:采用对照试剂,加以改正.

3.随机误差:增加平行测定次数.2-4

.公差:生产部门对分析结果允许的误差

.减少误差的方法2-5:误差的表示

2.2.1.真值与平均值(TrueandMean):

1.真值xT:表示某一物理量的客观存在的真实数值,其中包括:

(1)理论真值;

(2)计量学恒定真值;

(3)相对真值

2-6

2.2.2.准确度与误差(AccuracyandError)误差:测定值与真值之差,表征测定结果的准确度准确度:测定值与真值接近的程度

1.绝对误差:Ea=x-xT

2.相对误差:Er=(Ea/xT)·100%相对误差更能体现误差的大小,Ea相同的数据,Er可能不同2-7

[例](天平Ea=±0.0002g)_甲:x=3.3460gxT=3.3462g则:Ea甲=–

Er甲=–0.006%_乙:x=0.3460gxT则:Ea乙=–

Er乙=–0.06%甲.乙Ea(绝对误差)相同,但Er(相对误差)差10倍.说明当Ea一定时,测定值愈大,Er愈小.这就是当天平的Ea一定时为减小称量的误差,要求:m称

>0.2g的道理.2-8

2.2.3.精密度与偏差(PrecisionandDeviation)偏差:测量值与平均值之差,表征测定结果的精密度精密度:表征各测定值之间的接近程度波动性小→偏差就小,精密度就高二者均取决于随机误差.

_

1.单次偏差:di=xi-x

_2.平均偏差:d=

(1/n)∑|di|(Averagedeviation)2-96.极差:R=xmax-

xmin

(Range)

总之:表示准确度高低用E和Er

___表示精密度高低用d,d/x,S,CV或RSD

(Relativeaveragedeviation)3.相对平均偏差:4.标准偏差:(standard)5.变异系数:(Coefficientvariation)2-10

2.2.4.准确度与精密度的关系

测量值与真值之差为随机误差和系统误差之和;随机误差体现为精密度,精密度决定于系统误差与随机误差或精密度;如果随机误差减小(精密度高)则准确度主要取决于系统误差;所以精密度高是准确度高的前提。高的精密度不一定保证高的准确度。

随机误差:增加平行测定次数.对测量值和随机误差的正态分布曲线分析:当y与x无相关性时,r=0当x=μ,μ=xT(真值)图2-4μ相同σ不同时曲线形态10%0.对测量值和随机误差的正态分布曲线分析:空白试验:扣除系统误差75%|0.[例4]已知某试样中Co%的标准值为μ=1.当尾数修约数为5时,前数为偶则舍,为奇则进一成双;(6)pH=8不明确,应写正态分布概率积分表(|u|=|x-μ|/σ)[例2]用丁二酮肟重量法测铜铁矿中的Ni的质量分数,如表n=5求:单次分析结果的平均偏差,相对平均偏差,标准偏差,相对标准偏差.图2-1Sx与测量次数(n)的关系查表得概率为2×0.2-11

[例1]同一试样,四人分析结果如下:_

(注:图中的“|”表示X)

[解]

甲.|...精密度好,准确度高.

乙..|..〃好,〃差,系统误差.

丙..|..〃差,〃差,随机误差.

丁..|..〃差,〃巧合,正负抵消,

不可信.

结论:精密度是准确度的基础2-12

[例2]用丁二酮肟重量法测铜铁矿中的Ni的质量分数,如表n=5求:单次分析结果的平均偏差,相对平均偏差,标准偏差,相对标准偏差.×10-7×10-7

×10-710.43%0.00%0×10-7_x=10.43%∑|di|=0.18%∑di2×10-72-13

[解]标准偏差更能体现较大偏差的分散程度,突出大偏差对结果的影响2-14

[例3]测定莫尔盐FeSO4·7H2O中Fe%,四次分析结果为(%):,,,

[解]_

(1)n=4x=20.03%

–∑|di|

(2)d=——

=0.012%

n–

d

(3)—

=——×10000/000/00

x

2-152-162.3:测量值与随机误差的正态分布

2.3.1.基本概念

1.总体:考察对象的全体.2.样本:从总体中随机抽取的一组测量值.3.样本容量:样本所含的测量值的数目(n)4.总体平均值μ:

1当n→∞,μ=lim—∑x

n _当x=μ,μ=x

T(真值)2-176.总体的平均偏差:

σ与δ的关系:δ=0.7979σ≈0.8σ7.随机误差:x-μ

_8.偏差的自由度:f=(n-1),为了校正χ代替μ引起的误差.当n→∞时,f与n无差别,此时S→σ.5.总体的标准偏差:9.样本平均值的标准偏差:有限次测量时:2-18[例如]某试样中Al%的测定样本容量为4,xi:,,,;计算平均值的平均偏差及平均值的标准偏差.__

[解]x=1.44%,d=0.18%,S=0.20%2-19Sx

图2-1Sx与测量次数(n)的关系

-[由此可见]S(X)与n的平方根成反比,增加测定次数,可使平均值的标准偏差减小,但并不能使精密度成比例提高,通常测量4~6次足以.2-20

2.3.2.频率和概率(Frequencyandprobability)1.频率(frequency):如果n次测量中随机事件A出现了nA次,则称

F(A)=nA/n2.概率(probability):随机事件A的概率P(A)表示事件A发生的可能性大小当n无限大时,频率的极限为概率:

limF(A)=P(A)(0<P(A)<1)

P的可加性

P(A1+A2+A3+..........An)=12-21

2.3.3.测量值的概率分布:

组数

1.直方图:组距:△x=——

级差(组距)

nin·△x

对频相率图2-2相对频数分布直方图所有参差有序的矩形面积之和为12-22频数分布表---1.35570.07-

-----∑

1001

规律:测量数据既分散又集中2-232.概率密度

(当数据非常多,分得非常细时)

n→∞,折线变为平滑曲线→正态分布曲线纵坐标由相对频率→概率密度△Pdp

P定义:lim——

=——

=f(x)△Xdx2-24

3.正态分布

(NormalDistributionCurve)通过对测量值分布的抽象与概括,得到正态分布的数学模型:正态分布密度函数

以X=μ为对称轴,当X=

μ时,f(x)最大概率密度(说明测量值落在μ的领域内的概率)最大.μ决定曲线横轴的位置.2-25μ1μ2(σ相同,μ1不等于μ2)图2-3σ相同而μ不同时曲线形态2-26σσσ2σ大σ大σ1(μ相同,σ2<σ1)两个拐点到X=μ的距离均为σ.σ小精密度高,

两拐点间距2σ;σ大精密度差,

两拐点间距大,

测量值分散性大σ决定曲线形状

图2-4μ相同σ不同时曲线形态2-27

2.3.4.随机误差的分布

(DistributionofRandomErrors)

1.若以r=(x-μ)表示随机误差,以x-μ为横坐标,则曲线最高点对应的横坐标为零,此曲线成为随机误差的正态分布曲线.

2.随机误差的正态分布密度函数

3.测量值的分布与随机误差的分布,只在横轴位置不同,平移了μ个单位.2-28

4.随机误差的规律性:

(1).单峰性

(2).对称性

(3).有界性

5.对测量值和随机误差的正态分布曲线分析:_1).x=μ时P值最大,大多数测量值集中在x附近,是最可信赖值

2).曲线以x=μ为对称轴,正负误差出现概率相等

3).当x→-∞或x→+∞曲线以X轴为渐进线2-29σ2>

σ1

21μ(0)x(x-μ)说明:σ愈大,x落在μ附近的概率愈小,精密度差,σ愈小,x落在μ附近的概率愈大,精密度好图2-5精密度不同时测定值分布形态2-30

2.3.5.标准正态分布:

μ=0,σ2=1的正态分布,以符号N(0.1)表示

若测量值误差u以标准偏差σ为单位,改横坐标为因为x-μ=σu,dx=σdu

所以xx2-31-由于两个参数基本确定(μ=0,σ=1),所以对任何测量值(μ,σ都不同时)都适用,正态分是确定的,曲线的位置和形状是唯一的,即标准正态分布(u分布),横坐标以U为单位表示,U

,高尔顿(Galton)钉板生成,曲线的形态固定了。x

-μσ2-32x图2-6标准正态分布曲线(u分布曲线)2-33

f(x)dx=1:总体中所有测量值出现的总概率为1

f(u)du=1:各种大小随机误差出现的总概率为1

显然:随机变量在区间[a,b]上出现的概率等于曲线与横轴在该区间所围的面积,对应的积分为1

2.3.6.随机误差的区间概率概率概率=面积=2-34正态分布概率积分表(|u|=|x-μ|/σ)0.10.03981.10.3643

0.20.07931.20.3849

0.90.31591.90.47133.00.49872-35

[例4]已知某试样中Co%的标准值为μ=1.75%,σ=0.10%,若无系统误差存在,试求:分析结果落在[1.75±0.15]%范围内的概率.

[解]

|X-μ||X-1.75%|0.15%

|u|=———=————

=———

σ0.10%0.10%查表得概率为2×0.4332=86.6%(双边)2-36

[例5]上例求分析结果大于2.00%的概率?(大于2.00%属于单边检验问题)

[解]

|x-μ||2.00%-1.75%|0.25%

|u|=———=——————

=———

σ0.10%0.10%查表得阴影部分的概率为,整个正态分布曲线右侧的概率为1/2,即0.5000.故阴影部分以外的概率为0.5000-0.4938=0.62%

即分析结果大于2.00%的概率仅为0.62%2-37任一随机变量在某一区间出现的概率,可由求该区间的定积分制成概率积分表

U=1x=µ1σ68.3%x-u在

31.7%

σ范围内

U=1.96x=µ1.96σ95.0%x-u在

5%

1.96σ范围内

U=2x=µ2σ95.5%x-u在

4.5%

2σ范围内

U=3x=µ3σ99.7%x-u在

0.3%

3σ范围内(P)(α)2-382-39:少量数据的统计处理

2.4.1.

t分布曲线(Student`st):有限次测量得到的x带有一定的不准确性,由于σ不知道,只能用S代替σ,必然引起正态分布的偏离,所以用t代替u,应考虑n加以补偿,即t分布。_2-40

1).与u分布不同的是,曲线形状随f而变化

2).n→∞时,t分布=u分布

3).t随P和f而变化,当f=20时,t≈u

4).t:置信因子,随α减小而增大,置信区间变宽图2-7t分布曲线2-41

5).α:危险率(显著性水平),数据落在置信区间外的概率

α=(1-P)

6).P:置信度,测量值落在(μ+uσ)或(μ+ts)范围内的概率

7).f:自由度f=(n-1)

8).tα,f的下角标表示:置信度(1-α)=P,自由度f=(n-1)时的t值例如:写作为t0.05,6=tα,f2-42tα,f值表(双边)P,α2-43

2.4.2.平均值的置信区间(ConfidenceIntervaloftheMean)数学表达式:μ=x±uσ(u可查表得到)

若以样本平均值估计总体平均值可能存在的区间,数学表达式为:

对少量测量值须用t分布进行统计处理,则改写t定义式: _定义:在一定置信度下,以平均值X为中心,包括总体平均值μ的置信区间2-44 _

[例1]某学生测Cu%x=35.21%,S=0.06%,n=4求;时平均值的置信区间

[解]查t值表P=0.95f=3t

P=0.99f=3t同理:μ+0.18)%

(1)P变大,置信区间变宽,包括真值的可能性大

(2)分析中常定置信度为95%或90%

2-45

(3)对平均值置信区间的解释:在+区间包括μ的把握为95%

(4)当n很大,S→σ时,可用公式

(5)通常分析要求测量次数为n=4-62-462.4.3.显著性检验(TestingofSignifficance)

分析中经常遇到的两种情况: _

x

与μ不一致,准确度判断;__

x

1与x

2不一致,精密度判断检验同一样品在不同实验室;检验同一样品用两种方法2-47

(一)t检验法(t–test):对结果准确度的检验,对系统误差的检验

1.实验平均值与已知标准值的比较:检验新的分析方法,对标样进行n次测定,在一定置信度下改写t定义计算t计,若t计>t表说明存在显著性差异(有系统误差的存在)2-48

[例2]采用丁基罗丹明B-Ge-Mo杂多酸光度法测中草药中Ge含量(μg),结果(n=9):;;;;;;;;10.81(已知标样值μ问新方法是否有系统误差)

_

[解]P=0.95f=8X=10.79S=0.042 _

查t值表得:t表=2.31>t计说明X与μ无显著性差异,新方法无系统误差.2-49

2.两组平均值的比较:不同人员分析同一样品,同一人用不同方法分析同一样品.__

x

1与x

2

两组数据之间是否存在系统误差 _设:n1

S1

x

1

_

n2

S2

x

2

假定:S1=S2=S2-50__

x

1与x

2

之间有否差异,须两平均值之差的t值,用t检验 __假定:x

1与x

2

出自同一母体,则μ1=μ2S由于两个参数基本确定(μ=0,σ=1),所以对任何测量值(μ,σ都不同时)都适用,正态分是确定的,曲线的位置和形状是唯一的,即标准正态分布(u分布),横坐标以U为单位表示,U=,高尔顿(Galton)钉板生成,所拟合的回归曲线有意义,否则x与y不相关,__滴定管:真值xT:表示某一物理量的客观存在的真实数值,其中包括:少量数据时_各常数视为“准确数”,不考虑其位数:10%,若无系统误差存在,试求:分析结果落在[1.通过计算报告分析结果。滴定管:买菜秤10gEr%=101F(A)=nA/n2-51若:t计>t表则μ1=μ2

__两组数据不属同一母体X1与X2有显著性差异,有系统误差

2-52

(二)F检验法(F–test):分析结果精密度检验,两组数据方差S2比较,一般先进行F检验确定精密度无差异,再进行t检验(准确度检验)已知:样本的标准偏差样本的方差:2-53

F检验的步骤:

(1)先计算两个样本的方差S大2

和S小2

(2)再计算F计=S大2/S小2

(规定S大2为分子)

(3)查F值表若F计>F表

则S1与S2有显著性差异,否则无2-54置信度为95%时F值(单边)2345678910∞f大:大方差数据自由度f小:大方差数据自由度

2-55

[例3]当置信度为95%时,下列两组数据是否存在显著性差异?

A:;;;0.09896

n=4

B:;;;;0.09906

n=5

[解]属两平均值的比较,先用F检验精密度,证明无差异之后,再用t检验系统误差.2-56

_

(2)XB=0.09900SB2×10-10

S大2SB2×10-10

(3)F计=——=——=—————

S小2SA2×10-10

(4)查表F因F计<F表

故SA与SB精密度无显著性差异

2-57

(6)查t,7=2.36t计<t表

故两组数据无显著性差异2-58

2.4.4.异常值(Qutliers)的取舍(离群值的统计检验)

检验步骤

(1)去掉可疑值,求余下的值的平均值X好

1.4d法:统计学证明σ与δ之间的关系

δ=0.8σ

少量数据时_

_d≈0.8σ则4δ=3σ,故4d≈3σ超过4d的测量值概率小于0.3%要用4d法检验时,需n≥42-59__

(3)计算:|x

可疑-x

好|>4d则舍去,否则保留 __

(4)若可以值可保留,则重算x

和d[例4]测药物中的Co(μg/g)结果为:,,,.问:是否为可疑值? __

[解]去掉1.40求余下数据

X=1.28d_则:|x

可疑-x

好|=|1.40-1.28|=0.12>4×说明:为离群值应舍去2-60 _

2.格鲁布斯法(Grubbs):引入两个样本参数x

和S,方法准确但麻烦检验步骤

(1)从小到大排列数据,可以值为两端值; _

(2)计算x

和S;_

|x–xi|

(3)求统计量T计=———

S

(4)查表Tα,n(P256)若T计>T表

则该值舍去,否则保留.2-61

检验步骤:

(1)从小到大排列数据,可疑值为两个端值

3.Q检验法:(Q统计量n=3—10)

Q=│SuspectedOutlier-nearestvalue│

range=-邻差极差(3)根据n和p查表P257

Q计>Q表则可疑值要舍去,否则保留;(4)完成Q检验,才能算X和S;Q值愈大x疑愈远离群体值.2-62[例5]某学生测N%:;;;;20.50问:

(1)用Q检验是否保留___

(2)报告分析结果n,S

,x

,d/x

(3)若xT=20.56计算Er%时平均值的置信区间并说明含义

|20.60-20.55|[解](1)Q计=—————

(20.60-20.48)

Q表

=0.86>Q计

保留2-63 ___

(2)x=20.53%(d/x)×10000/000/00

S=0.035% _

x–xT

(3)Er%=——·100=————·

xT

这说明在区间中包括总体平均值μ的把握性为95%(4)Er%=(+0.空白试验:扣除系统误差(20.根据分析灵敏度要求:精密度:表征各测定值之间的接近程度(2)XB=0.样本:从总体中随机抽取的一组测量值.(4)表示含量:X%>10留四位;–96x=µ1.(3)若xT=20.31591.准确度与误差(AccuracyandError)[例4]已知某试样中Co%的标准值为μ=1.当n→∞,μ=lim—∑x设:n1S1x1称量:1/万天平mS=Ea/Er2-64Q值表测量次数(n)置信度3456789100.940.760.640.560.510.470.440.4190%(Q0.90)0.970.840.730.640.590.540.510.4995%(Q0.95)0.980.850.730.640.590.540.510.4896%(Q0.96)0.990.930.820.740.680.630.600.5799%(Q0.99)2-652.4.4误差的传递一系统误差的传递1.加减法若R为A,B,C三个测量值相减的结果R=A+B-C则绝对误差E是各测量步骤结果绝对误差的代数和ER=EA+EB-EC2-662.乘除法R是A,B,C三个测量值的结果则相对误差是各测量步骤相对误差的代数和2-673.指数关系则相对误差为测量值的相对误差的指数倍2-684.对数关系则误差传递关系为2-69二.随机误差的传递1.加减法分析结果的标准偏差的平方是各测量步骤标准偏差的平方和标准偏差的平方总和SR2为2-702.乘除法是各测量步骤相对标准偏差的平方总和3.指数关系运算时()则为2-714.对数关系运算时(),则为三.极值误差加减法是各测量值的绝对误差的绝对值累加乘除法是各测量值相对误差的绝对值累加2-722.4.5回归分析一.一元线性回归方程分析化学中经常用工作曲线来获取未知物的量,A与C的关系是否为线形相关(各实验点是否全部落在一条直线上?)用数字统计方法找出各实验点误差最小的直线→回归分析2-731.回归方程截距:斜率:2-74

和分别为x和y的平均值,当回归系数a,b确定后,回归直线就确定下来了2.回归方程的意义和用途2-75a.从一组数据出发确定这些变量间的定量关系→回归方程的建立b.评价和度量变量间的关系的密切程度→相关系数检验c.应用回归方程,从一些变量值去估计另一变量值d.对回归方程的主要参数作进一步评价和比较→回归曲线的检验2-76二.相关系数1.r值计算判断y与x之间的相关性好坏的尺度2-772.r值的物理意义当都在回归线上时,r=±1完全相关当y与x无相关性时,r=0r在0~1之间时,y与x有相关性,r愈接近1,

相关性愈好3.相关系数的显著性检验求r值在一定置信度下,当,则x和y相关,

所拟合的回归曲线有意义,否则x与y不相关,

所得回归方程不可靠2-782.5:提高分析结果准确度的方法

2.5.1.选择合适的分析方法

1.根据分析准确度要求:常量分析:重量法,滴定法的准确度高,灵敏度低.

2.根据分析灵敏度要求:微量分析:仪器法灵敏度高,准确度低.2-79

3.根据分析干扰情况:如:2-80

2.5.2.减少测量误差

1.称量:1/万天平mS=Ea/Er

2.体积:滴定管V=Ea/Er=±0.02mL/0.1%≥20mL2-81[例6]以K2Cr2O7标定的Na2S2O3要使VNa2S2O3=25mL,称m(K2Cr2O7)=?

[解]

(1)Cr2O72-+6I-+14H+=2Cr3++3I2+7H2O

I2+2S2O32-=2I-+S4O62-

11

(2)nK2Cr2O7

=—nI2=—nNa2S2O3362-82

(4)Er%=(+0.0002/0.024)×100=1>0.1

(5)为使Er<0.1%,加大称样量,扩大10倍,配制成250mL(取25mL即为的量)2-83

2.5.3.增加平行测定次数,减小随机误差:一般n=4-6 (见图2-1)

2.5.4.消除测量过程中的系统误差:

1.对照试验:检验系统误差

2.空白试验:扣除系统误差

3.校正仪器:

4.分析结果校正:2-84:有效数字及运算规则

2.6.1.有效数字(Significant

Figures): 分析结果中的有效数字是:实际测定的数值包含一位不确定数字(可疑数字)

有效位数:从数值左方非零数字算起到最后一位可疑数字,确定有效位数的位数.

可疑数字:通常理解为,它可能有±1或单位的误差(不确定性)2-85测量结果的表达:[例]:测量值,,,,10.12,平均值为,标准偏差为,显然小数点后第二位存在不确定性,为可疑值,而第一位是确定的。结果表示为:3(n=5);;4.5371×105为五位,为四位

;2×10-3

为一位

3.6×103为二位2-86

2.6.2.有效数字的记录1.几个重要物理量的测量精度:天平(1/10000):Ea滴定管:

pH计:单位光度计:单位电位计:±0.0001V(E)2.“0”的双重意义:

(1)普通数字使用是有效数字:

(2)作为定位不是有效数字:0.02030四位2-87

3.改变单位不改变有效数字的位数:0.0250g→25.0mg→2.50×104μg

4.各常数视为“准确数”,不考虑其位数:

M,e,π…

5.pH,pM,logK等对数其有效数字的位数取决于尾数部分的位数,整数部分只代表方次如:pH=11.02[H+]=9.6×10-12二位2-88

2.6.3.数字修约规则:四舍六入五成双1.当尾数修约数为5时,前数为偶则舍,为奇则进一成双;若5后有不为0的数,则视为大于5,应进.如:修成四位2.修约一次完成,不能分步:8.549→8.5【是错的】2-89

2.6.4.运算规则:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论