第二章-误差与实验数据的处理_第1页
第二章-误差与实验数据的处理_第2页
第二章-误差与实验数据的处理_第3页
第二章-误差与实验数据的处理_第4页
第二章-误差与实验数据的处理_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章误差及实验数据的处理§2.1误差的基本概念§2.2随机误差的正态分布§2.3有限测定数据的统计处理§2.4提高分析结果准确度的方法§2.5有效数字及其运算规则2023/2/51准确度:

1、测定值与真值接近的程度;

2、准确度高低常用误差大小表示,误差小,准确度高。§2.1定量分析化学中的误差一、准确度与误差2023/2/52误差:测定值xi与真实值T之差。

相对误差(RelativeError):绝对误差(AbsoluteError):

Ea

=xi-T2023/2/53例题:分析天平称量两物体的质量各为1.6380g和0.1637g,假定两者的真实质量分别为1.6381g和0.1638g,计算其误差?解:

E1=(1.6380-1.6381)=-0.0001g

E2=(0.1637-0.1638)=-0.0001g2023/2/54讨论: (1)误差的大小是衡量准确度高低的标志。(2)误差是有正负号之分。(3)实际工作中真值实际上是难以获得。

2023/2/55真值理论真值:理论组成,纯物质中元素的理论含量计量学约定真值:长度,质量,物质的量单位相对真值:标准试样,标准参考物质2023/2/56精密度的大小常用偏差表示。

1、精密度:

一组平行测定值之间相互接近的程度.二、精密度与偏差2023/2/572、偏差(Deviation):相对偏差dr:绝对偏差在平均值中所占的百分率。绝对偏差di:测定结果(xi)与平均值()之差。(有正负号之分)2023/2/58

各绝对偏差值绝对值的算术平均值,又称算术平均偏差(AverageDeviation)。平均偏差:相对平均偏差:(无正负号之分)2023/2/59例题:测定某铜合金中铜的质量分数(%),结果如下:10.3、9.8、9.6、10.2、10.1、10.4、10.0、9.7、10.2、9.710.0、10.1、9.3、10.2、9.9、9.8、10.5、9.8、10.3、9.9解:2023/2/5102-11基本概念

1.总体:考察对象的全体.2.样本:从总体中随机抽取的一组测量值.3.样本容量:样本所含的测量值的数目(n)4.总体平均值μ:

1当n→∞,μ=lim—∑x

n _当x=μ,μ=T(真值)2023/2/511极差R=xmax-xmin中位数xm数据排列由小到大,奇数时中间的数,偶数时中间两数的平均值2023/2/512数据有分散性与集中性分散性:偏差与极差集中性:平均值与中位数2023/2/5133、标准偏差(StandardDeviation)总体标准偏差(σ):

(n-1)表示n个测定值中具有独立偏差的数目,又称为自由度。样本标准偏差(s):2023/2/514相对标准偏差(sr

):又称为变异系数CV(coefficientofvariation)2023/2/515s平的相对值(s平/s)0.00.20.40.60.81.0

15101520

n4、平均值的标准偏差增加测量次数可以减小随机误差的影响,提高测定的精密度2023/2/516三、准确度与精密度的关系精密度是保证准确度的先决条件;精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。精密度准确度好好差差很差偶然性好稍差2023/2/517四、系统误差与随机误差2023/2/518(1)系统误差系统误差是定量分析误差的主要来源。是由某些固定的原因引起的重现性:同一条件下的重复测定中,结果重复出现;单向性:测定结果系统偏高或偏低;对测定结果影响固定。可测性:其大小可以测定,可对结果进行校正。性质:2023/2/519产生的原因:(2)试剂误差(ReagentError):试剂或蒸馏水纯度不够。(1)方法误差(MethodError):如反应不完全,干扰成分的影响,指示剂选择不当等。(3)仪器误差(InstrumentalError):如容量器皿刻度不准又未经校正,电子仪器“噪声”过大等造成;(4)操作误差(PersonalErrors):如观察颜色偏深或偏浅,第二次读数总是想与第一次重复等造成。2023/2/520系统误差的校正方法:标准方法、提纯试剂、校正仪器。对照试验、空白试验、使用校正值。2023/2/521(二)随机误差产生的原因:

由一些无法控制的不确定因素引起的。1、如环境温度、湿度、电压、污染情况等变化引起样品质量、组成、仪器性能等的微小变化;2、操作人员实验过程中操作上的微小差别;3、其他不确定因素等所造成。2023/2/522减免方法:无法消除。通过增加平行测定次数,取平均值报告结果,可以降低随机误差。2023/2/523三、过失误差:认真操作,可以完全避免。重做!2023/2/5242023/2/5频率分布为了研究测量数据分布的规律性,按如下步骤编制频数分布表和绘制出频数分布直方图,以便进行考察。1.算出极差

R2.确定组数和组距组数视样本容量而定。2.2:测量值与随机误差的正态分布

2023/2/525随机误差的正态分布一、频率分布w(BaCl2·2H2O):n=173,98.9~100.2%,极差(R)=100.2–98.9=1.3(%)组距(△x)

=1.3/14=0.1(%)分14组。事例:测定某试剂中BaCl2·2H2O的含量。2023/2/5262023/2/5组距:极差除以组数即得组距,此例组距为:每组数据相差0.1,如98.999.0,99.099.1。为了避免一个数据分在两个组内,将组界数据的精度定提高一位,即98.8598.95,98.9599.05。频数:落在每个组内测定值的数目。相对频数:频数与样本容量总数之比。3.统计频数和计算相对频数2023/2/527组号分组频数ni频率ni/n频率密度(ni/n÷△s)198.85~98.9510.0060.06298.95~99.0520.0120.12399.05~99.1520.0120.12499.15~99.2550.0290.29599.25~99.3590.0520.52699.35~99.45210.1211.21799.45~99.55300.1731.73899.55~99.65500.2892.89999.65~99.75260.1501.501099.75~99.85150.0870.871199.85~99.9580.0460.461299.95~100.0520.0120.1213100.05~100.1510.0060.0614100.15~100.2510.0060.06合计1731.001

频数分布表2023/2/528频率密度直方图2023/2/529频率密度直方图和频率密度多边形87%(99.6%±0.3)测量值(%)频率密度2023/2/5302-31频数分布表1.265-1.29510.011.295-1.32540.041.325-1.35570.071.355-1.385170.17

1.385-1.415240.24

1.415-1.445240.241.445-1.475150.151.475-1.50560.061.505-1.53510.011.535-1.56510.01∑

1001

规律:测量数据既分散又集中2023/2/531测量数据有明显的集中趋势这种既分散又集中的特性,就是其规律性2023/2/532随机事件以统计形式表现的规律性称为统计规律。偶然误差对测定结果的影响是否服从统计规律?2023/2/5332-34

.频率和概率(Frequencyandprobability)1.频率(frequency):如果n次测量中随机事件A出现了nA次,则称

F(A)=nA/n2.概率(probability):随机事件A的概率P(A)表示事件A发生的可能性大小当n无限大时,频率的极限为概率:

limF(A)=P(A)(0<P(A)<1)

P的可加性

P(A1+A2+A3+..........An)=12023/2/5342-352.概率密度

(当数据非常多,分得非常细时)

n→∞,折线变为平滑曲线→正态分布曲线纵坐标由相对频率→概率密度△Pdp

P定义:lim——

=——

=f(x)△X

dx2023/2/5352-36

3.正态分布

(NormalDistributionCurve)通过对测量值分布的抽象与概括,得到正态分布的数学模型:正态分布密度函数

以X=μ为对称轴,当X=

μ时,f(x)最大概率密度(说明测量值落在μ的领域内的概率)最大.μ决定曲线横轴的位置.2023/2/536

y:概率密度

x:测量值

μ:总体平均值x-μ:随机误差

σ:总体标准偏差(0.607h处半峰宽)二、正态分布曲线2023/2/5372023/2/5正态分布曲线N(,2)正态分布曲线呈钟形对称,两头小,中间大。分布曲线有最高点,通常就是总体平均值的坐标。分布曲线以值的横坐标为中心,和是正态分布的两个基本参数,这种曲线用N(,2)表示。2023/2/538正态分布曲线N(μ,σ2)特点:1.极大值在x=μ处.2.拐点在x=μ±σ处.3.于x=μ对称.4.x轴为渐近线.5.

2023/2/5392-40μ1μ2(σ相同,μ1不等于μ2)图2-3σ相同而μ不同时曲线形态2023/2/5402-41σσσ2σ大σ大σ1(μ相同,σ2<σ1)两个拐点到X=μ的距离均为σ.σ小精密度高,

两拐点间距2σ;σ大精密度差,

两拐点间距大,

测量值分散性大σ决定曲线形状

图2-4μ相同σ不同时曲线形态2023/2/5412-42σ2>

σ1

21μ(0)x(x-μ)说明:σ愈大,x落在μ附近的概率愈小,精密度差,σ愈小,x落在μ附近的概率愈大,精密度好图2-5精密度不同时测定值分布形态2023/2/5422023/2/51.测定值正态分布规律1)测量值分布的集中趋势()x=时,y值最大,此即分布曲线的最高点。大多数测量值集中在算术平均值的附近,或者说算术平均值是最可信赖值或最佳值。它能很好地反映测定的集中趋势。

x=时的概率密度乘以dx就是测量值落在dx范围内的概率。越小,y越大,测量值分布越集中。越大,y越小,测量值分布越分散。2)测量值分布的分散趋势()2023/2/5432023/2/53)绝对值相同的正误差和负误差的测定值出现的概率相等正态分布曲线以x=这一直线为其对称轴。这是因为当x趋向于-或+时,曲线以x轴为渐近线。2023/2/544标准正态分布曲线令:2023/2/545横坐标:偶然误差的值,纵坐标:误差出现的概率大小。2023/2/5462023/2/52.概率(possibility)无论和值为多少,曲线和横坐标之间的总面积为1。即各种偏差的测定值出现的概率总和为1。

测定值落在区间(a,b)的概率为曲线与a,b间所夹面积。2023/2/5472-48

4.3.5.标准正态分布:

μ=0,σ2=1的正态分布,以符号N(0.1)表示

若测量值误差u以标准偏差σ为单位,改横坐标为因为x-μ=σu

,dx=σdu

所以xx2023/2/5482-49x图2-6标准正态分布曲线(u分布曲线)2023/2/549三、随机误差的区间概率2023/2/550曲线下面积-3–2–10123Y0.20|u|S2S0.6740.25001.0000.34130.6831.6450.45001.9600.47500.9502.0000.47732.5760.49870.9903.0000.49870.997∞0.5001.000正态分布概率积分表2023/2/5512023/2/5随机误差的区间概率分析结果(个别测量值)落在此范围的概率若u=1x=

uP=2×0.3413=68.3%若u=2x=

uP=2×0.4773=95.5%若u=3x=

uP=2×0.4987=99.7%2023/2/552对称性、单峰性、有界性68.3%95.5%99.7%u

-3s

-2s-s0s2s3s

x-m

m-3s

m-2s

m-s

m

m+s

m+2s

m+3s

x

y2023/2/5532-54

f(x)dx=1:总体中所有测量值出现的总概率为1

f(u)du=1:各种大小随机误差出现的总概率为1

显然:随机变量在区间[a,b]上出现的概率等于曲线与横轴在该区间所围的面积,对应的积分为1

2.3.6.随机误差的区间概率概率=面积=2023/2/5542-55正态分布概率积分表(|u|=|x-μ|/σ)0.00.00001.00.34132.00.47730.10.03981.10.3643

2.10.48210.20.07931.20.3849

2.20.48610.30.11791.30.40322.30.48930.40.15541.40.41922.40.49180.50.19151.50.43322.50.49380.60.22581.60.44522.60.49530.70.25801.70.45542.70.49650.80.28811.80.46412.80.49740.90.31591.90.47133.00.49872023/2/555随机误差的规律:(2)正、负误差出现的概率相等。(1)小误差出现的概率大,大误差出现的概率小,特大误差概率极小;对称性、单峰性、有界性2023/2/5562-57

[例4]已知某试样中Co%的标准值为μ=1.75%,σ=0.10%,若无系统误差存在,试求:分析结果落在[1.75±0.15]%范围内的概率.

[解]

|X-μ||X-1.75%|0.15%

|u|=———=————

=———

=1.5σ0.10%0.10%查表得概率为2×0.4332=86.6%(双边)2023/2/5572-58

[例5]上例求分析结果大于2.00%的概率?(大于2.00%属于单边检验问题)

[解]

|x-μ||2.00%-1.75%|0.25%

|u|=———=——————

=———

=2.5σ0.10%0.10%查表得阴影部分的概率为0.4938,整个正态分布曲线右侧的概率为1/2,即0.5000.故阴影部分以外的概率为0.5000-0.4938=0.62%

即分析结果大于2.00%的概率仅为0.62%2023/2/558例题:测得某钢样中磷的百分含量为0.099,已知σ=0.002,问测定值落在区间0.095~0.103的概率是多少?(无系统误差)解:查表P88,得|u|=0.4773P=2×0.4773=0.9552023/2/5592023/2/5随机误差的区间概率从以上的概率的计算结果看,1)分析结果落在

3范围内的概率达99.7%,即误差超过3的分析结果是很少的,只占全部分析结果的0.3%。2)在多次重复测定中,出现特别大误差的概率是很小的,平均1000次中只有3次机会。3)一般分析化学测定次数只有几次,出现大于3的误差是不可能的。2023/2/560§2.3有限测定数据的统计处理目的:通过对随机样本的有限次数的测定,推测有关总体的情况总体样本数据抽样观测统计处理2023/2/561一、t分布曲线

t分布曲线反映了有限次测定数据及其误差的分布规律。纵坐标--概率密度横坐标--统计量t值随自由度f(f=n-1)而变,当f>20时,与正态分布曲线很近似,当f→∞时,二者一致。

2023/2/562不同点:

正态分布:u一定,相应的概率一定。

t分布:t一定,相应的概率并不一定,还与自由度有关。正态分布与t

分布:相同点:随机误差在某区间的概率,就是分布曲线下这一区间的积分面积。2023/2/563t值表一般选P=0.90,0.952023/2/564二、平均值的置信区间置信度:

在某一定范围内测定值或误差出现的概率。

置信区间:

在一定的置信度下,以测定结果为中心,估计总体平均值的取值范围,称置信区间.

2023/2/5651、已知总体标准偏差σ时测定值出现在该区间的概率由u决定由单次测定值来估计µ可能存在的范围。以平均值来估计µ可能存在的范围。2023/2/566例题:用标准方法测定钢样中磷的含量,测定4次,平均值为0.087%,且σ=

0.002%。求该钢样中磷含量的置信区间(P=0.95)解:P=0.95,u=1.96置信区间:0.085~0.0892023/2/5672、已知样本标准偏差s时t分布:置信区间:2023/2/568例题:测定SiO2的质量分数。测了6次平均值为28.56%、标准偏差为0.06%,置信度分别为90%和95%时平均值的置信区间。t0.95,5=2.571置信度↑,置信区间↑。解:t0.90,5

=2.0152023/2/569:例题:测定钢中含铬量时,先测定两次,测得的质量分数为1.12%和1.15%;再测定三次,测得的数据为1.11%,1.16%和1.12%。计算两次和五次平均值的置信区间(P=95%)t0.95,1=12.71n=2时:解:

n=5时:t0.95,4=2.782023/2/570

测定次数一定时,置信度↑,置信区间↑,其区间包括真值的可能性↑,一般将置信度定为95%或90%。置信度一定时,测定次数↑,置信区间显著↓,即可使测定的平均值与总体平均值μ接近。置信区间的宽窄与置信度、测定值的精密度和测定次数有关

。区间的大小反应了估计的准确程度,而置信度的高低说明了估计的把握程度。2023/2/5711、平均值与标准值的比较(t检验法)是对分析结果或分析方法的准确度作出评价。若t计算>t表,则与已知值有显著差别(存在系统误差)。若t计算≤t表,正常差异(偶然误差引起的)。三、显著性检验2023/2/572例题:用一种新方法来测定含量为11.70mg/kg的标准试样中铜含量,五次测定结果为:10.9,11.8,10.9,10.3,10.0判断该方法是否可行?(是否存在系统误差)。

解:计算平均值=10.78,标准偏差S=0.69t计算

>t0.95,4=2.78,说明该方法存在系统误差,结果偏低。。2023/2/5732、F

检验法(方差比检验):若F

>F表,两组数据精密度存在显著性差异,不是来自同一个总体。单边检验:一组数据的方差只能大于、等于但不能小于另一组数据的方差。双边检验:一组数据的方差可能大于、等于或小于另一组数据的方差。2023/2/574置信度95%时F值fs大:方差大的数据的自由度;fs小:方差小的数据的自由度。2023/2/575例题:甲、乙二人对同一试样进行测定,得两组测定值:

(甲)1.26,1.25,1.22(乙)1.35,1.31,1.33,1.34

问两种方法精密度是否有无显著性差异?解:n甲

=3S甲

=0.021n乙

=4S乙=0.017查表,F值为9.55,说明两组的方差无显著性差异。2023/2/5763、两组数据平均值之间的比较适用于:对两个分析人员测定相同试样所得结果进行评价;对两个单位测定相同试样所得结果进行评价;对两种方法进行比较,即是否有系统误差存在;前提:

两个平均值的精密度没有大的差别。(F

检验法;t检验法)2023/2/577t检验法:若t

>t表,则与已知值有显著差别(存在系统误差)。若t

≤t表,正常差异(偶然误差引起的)。2023/2/578例题:甲、乙二人对同一试样进行测定,得两组测定值:

(甲)1.26,1.25,1.22(乙)1.35,1.31,1.33,1.34

问两种方法是否有无显著性差异?解:n甲

=3S甲

=0.021n乙

=4S乙=0.0172023/2/5790.09–0.04=0.05的值由系统误差产生。根据t分布规律,偶然误差允许最大值为:f=3+4–

2=5,T0.95,5=2.57,二人测定结果之间存在显著性差异。2023/2/580

四、可疑测定值的取舍在测定的一组数据中,对个别偏离较大的测定数据(称为离群值)是保留?还是弃去?离群值的存在对平均值、精密度会造成相当大的影响。如:0.001、0.002、0.009.

可疑数据的取舍—过失误差的判断

2023/2/5812-82

)

检验步骤

(1)去掉可疑值,求余下的值的平均值X好

1.4d法:统计学证明σ与δ之间的关系

δ=0.8σ

少量数据时_

_d≈0.8σ则4δ=3σ,故4d≈3σ超过4d的测量值概率小于0.3%要用4d法检验时,需n≥42023/2/5822-83__

(3)计算:|x

可疑-x

好|>4d则舍去,否则保留 __

(4)若可以值可保留,则重算x

和d[例]测药物中的Co(μg/g)结果为:1.25,1.27,1.31,1.40.问:1.40是否为可疑值? __

[解]去掉1.40求余下数据

X=1.28d=0.023_则:|x

可疑-x

好|=|1.40-1.28|=0.12>4×0.023说明:1.40为离群值应舍去2023/2/5832、Q值检验法(1)数据排列x1

x2……xn(2)计算:若Q>Qx

舍弃该数据,(过失误差造成)若Q≤Qx

保留该数据,(偶然误差所致)2023/2/584Q

值表2023/2/585(1)排序:x1,x2,

x3,

x4……(2)求和标准偏差s(3)计算G值:3、Grubbs检验法(4)若G计算>G

表,弃去可疑值,反之保留。由于Grubbs检验法引入了平均值和标准偏差,故准确性比Q检验法高。2023/2/586G(p,n)值表2023/2/587例题:测定某药物中Co的含量(10-4)得到结果如下:

1.25、1.27、1.31、1.40,用Grubbs检验法和Q值检验法判断有无离群值。

查表,G0.95,4=1.46>G计算,故1.40应保留。解:Grubbs检验法:=1.31;s=0.0662023/2/588Q值检验法:

Q0.90,4=0.76Q计算<Q0.90,4故1.40应保留。2023/2/589(1)

Q值法不必计算x

及s,使用比较方便;(2)Q值法在统计上有可能保留离群较远的值。(3)Grubbs法引入s

和,判断更准确。(4)不能追求精密度而随意丢弃数据;必须进行检验。讨论:2023/2/590例题:三个测定值,40.12,40.16和40.18(P0.95)(40.07~40.23)(40.04~40.30),变大。若舍去40.12:不能刻意追求精密度而随意丢弃数据。2023/2/591§2.4提高分析结果准确度的方法一、选择合适的分析方法根据待测组分的含量、性质、试样的组成及对准确度的要求选方法。消除系统误差,减小随机误差,提高分析结果的准确度。2023/2/592二、减小分析过程中的误差1、减小测定误差

样品的质量,滴定的体积要与误差要求相匹配。2、增加平行测定次数,减小随机误差3、消除测定过程中的系统误差2023/2/593对照试验:

选择一种标准方法与所用方法作对比或选择与试样组成接近的标准试样作试验,找出校正值加以校正。系统误差的检验:回收试验:

在测定试样某组分含量(x1)的基础上,加入已知量(x2)的该组分,再次测定其组分含量(x3)。由回收试验所得数据计算出回收率。2023/2/594空白试验:

指除了不加试样外,其他试验步骤与试样试验步骤完全一样的实验,所得结果称为空白值。校正的方法系统误差的消除:

总之,选择合适的分析方法;尽量减小测定误差;适当增加平行测定次数;消除或校正系统误差;杜绝过失,就可以提高分析结果的准确度。2023/2/595三、分析化学中的质量保证

和质量控制质量保证:是指为了保证产品、生产(测定)过程及服务符合质量要求而采取的有计划和系统的活动。2023/2/596质量控制:是指为了达到规范或规定的数据及质量要求而采取的作业技术和措施。5101520测定次序统计量中心线控制线警告线辅助线2023/2/597§2.5有效数字及其运算规则一、有效数字1、非测量值:如:测定次数、倍数、系数、常数(π)、分数等。

2、测量值或计算值:如:称量质量、滴定体积、吸光度读数、计算含量等。有效数字

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论