分析化学中的误差及数据处理(精)_第1页
分析化学中的误差及数据处理(精)_第2页
分析化学中的误差及数据处理(精)_第3页
分析化学中的误差及数据处理(精)_第4页
分析化学中的误差及数据处理(精)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章分析化学中的误差及数据处理本章基本要求:1 掌握误差和偏差的基本概念、准确度与精密度的概念和衡量其大小的方式;了解误差的分类、 特点、产生的原因及其减免测定误差的措施。了解准确度与精密度之间的关系和它们在实际工作中的应用。2 掌握有效数字的概念、有效数字在分析测定中的应用规则、可疑数据的取舍和有效数字的运算规则。3 掌握平均值的置信区间的概念和计算;掌握t 检验法、 F 检验法以及Q检验法的应用; 了 解 随 机 误 差 的 分 布 特 征 正 态 分 布 。4 掌握通过选择合适的分析方法、用标准样品对照、减小测量误差和随机误差、消除系统误差等提高分析结果准确度的方法。分析人员用同一种方

2、法对同一个试样进行多次分析,即使分析人员技术相当熟练,仪器设备很先进,也不可能做到每一次分析结果完全相同,所以在分析中往往要平行测定多次,然后取平均值代表分析结果,但是平均值同真实值之间还可能存在差异,因此分析中误差是不可避免的 。一 真 值 ( xT)3.1 分析化学中的误差某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:1 理论真值(如某化合物的理论组成,例:纯NaCl 中 Cl 的含量)2 计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位如米、千克等;标 准参考物质证书上给出的数值; 有经验的人用可靠方法多次测定的平均值,确认消除了

3、系统误差。)3 相对真值 (如认定精确度高一个数量级的测定值作为低一级测量值的真值。(如标准试样(在仪器分析中常常用到)的含量)二 平 均 值(x )x1x2.xnxn强调: n 次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,是对真值的最佳估计,它表示一组测定数据的集中趋势。三 中 位数( x M)一组测量数据按大小顺序排列,中间一个数据即为中位数 ,当测量值的个数位数时, 中位数为中间相临两个测量值的平均值。例 1.小10.10, 10.20 , 10.40 , 10.46 , 10.50大x 10.33xM 10.40例 2. 10.10,10.20 ,10.40 ,10.4

4、6 ,10.50 ,10.54x 10.37xM10.43它的优点是能简单直观说明一组测量数据的结果,且不受两端具有过大误差数据的影响。例 3:当有异常值时,10.10 ,10.20 ,10.40 ,10.46 ,10.50 ,12.80xM 10.43x10.74很多情况下,用中位数表示“中心趋势”比用平均值更实际。其缺点是不能充分利用数据,因而不如平均值准确。四准确度和误差1 准确度 : 指测量值与真值之间接近的程度,其好坏用误差来衡量,用相对误差较好。2 误差( E):测定结果与真实值之间的差值( 1)绝对误差:测量值与真值间的差值,Ea x x T测量值大于真实值,误差为正误值;测量值

5、小于真实值,误差为负误值。误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。( 2)相对误差:绝对误差占真值的百分比,Er = x - xT / xT100 Ea/x T100 相对误差有大小、正负之分,它能反映误差在真实结果中所占的比例, 因此在绝对误差相同的条件下,代测组分含量越高,相对误差越小;反之,相对误差越大。例:某同学用分析天平直接称量两个物体,一为5.0000g ,一为 0.5000g,试求两个物体的相对误差。解:用分析天平称量,两物体称量的绝对误差均为0.0001g,则两个称量的相对误差分别为五精密度和偏差1 精密度 :平行测定结果相互靠近的程度,用偏差衡量2 偏差(

6、 d):测量值与平均值的差值,用d 表示(1) 绝对偏差 : 个别测得值x测得平均值x ,即 : d x xdi0偏差的大小反映了精密度的好坏,即多次测定结果相互吻合的程度。偏差有正负号,如果将各单次测定的偏差相加,其和应为0 或接近为0。(2) 相对偏差 (dr):绝对偏差与平均值的比值,即:dr = d /x100 d 1d 2. dn(3) 平均偏差(d ) :各单个偏差绝对值的平均值,即: dn(4) 相对平均偏差(d r ):平均偏差与测量平均值的比值,即: d r d / x100(5) 标准偏差:Sn( xii 1nx)21强调: 1 S是表示偏差的最好方法,数学严格性高,可靠性

7、大,能显示出较大的偏差。测定次数在3 20 次时,可用S来表示一组数据的精密度,2 式中 n-1 称为自由度,表明n 次测量中只有n-1 个独立变化的偏差。因为n个偏差之和等于零,所以只要知道n-1 个偏差就可以确定第n 个偏差了,3 S与相对平均偏差的区别在于: 第一, 偏差平方后再相加,消除了负号,再除自由度和再开根,标准偏差是数据统计上的需要,在表示测量数据不多的精密度时,更加准确和合理。4 S对单次测量偏差平方和不仅避免单次测量偏差相加时正负抵消,更重要的是大偏差能更显著地反映出来,能更好地说明数据的分散程度。例: 有二组数据,各次测量的偏差为:+0.3,-0.2,-0.4,+0.2,

8、+0.1,+0.4, 0.0,-0.3,+0.2,-0.3;0.0, +0.1,-0.7,+0.2,-0.1,-0.2,+0.5,-0.2,+0.3,+0.1;解:两组数据的平均偏差均为0.24 ,但明显看出第二组数据分散大。因 为 S1=0.28; S2=0.33 ( 注意计算S 时,若偏差d=0 时,也应算进去,不能舍去) ,可见第一组数据较好。(6)相对标准偏差(Sr 、 RSD、CV): Sr六准确度与精密度的关系s100%xABCDA.准确且精密B.不准确但精密C.准确但不精密D.不准确且不精密结论: 准确度高精密度一定高;精密度是保证准确度的前提;精密度好,准确度不一定好,可能有系

9、统误差存在;精密度不好,衡量准确度无意义;在确定消除了系统误差的前提下,精密度可表达准确度;准确度及精密度都高说明结果可靠。七 极差( R):又称全距或范围误差, 即 : R xmax xmin相对极差= R/x100八公差(阅读P45):生产部门对于分析结果允许误差表示法,超出此误差范围为超差,分析组分越复杂,公差的范围也大些。九 系统误差和随机误差1. 系统误差: 由某种固定原因造成,使测定结果系统地偏高或偏低。可用校正地方法加以消除。特点:( 1)单向性:要么偏高,要么偏低,即正负、大小有一定地规律性( 2)重复性:同一条件下,重复测定中,重复地出现;( 3)可测性:误差大小基本不变。来

10、源:( 1)方法误差选择的方法不够完善: 重量分析中沉淀的溶解损失、滴定分析中终点误差用其他方法校正( 2)仪器误差仪器本身的缺陷:天平两臂不等,滴定管,容量瓶刻度不准、砝码磨损校准 ( 绝对、相对 )( 3)操作误差 :颜色观察 ( 多实践 )( 4)试剂误差所用试剂有杂质:去离子水不合格;试剂纯度不够 (含待测组份或干扰离子)空白实验( 5)主观误差个人误差,操作人员主观因素造成:对指示剂颜色辨别偏深或偏浅;滴定管读数不准。2. 随机误差:由某些不固定偶然原因造成,使测定结果在一定范围内波动,大小、正负不 定,难以找到原因,无法测量。 不存在系统误差的情况下,测定次数越多其平均值越接近真值

11、。一般平行测定4-6 次特点:(1)不确定性;( 2)不可避免性。只能减小,不能消除。每次测定结果无规律性, 多次测量符合统计规律。3 过失: 其实质是一种错误,由粗心大意引起,可以避免的, 必须重做 ! 如: 加错指示剂、记录错误等图 1项目系统误差与随机误差的比较系统误差随机误差产生原因固定因素,有时不存在不固定因素,总是存在分类方法误差、仪器与试剂误差、主观误差环境的变化因素、主观的变化因素等性质重现性、单向性(或周期性)可测性、 服从概率统计规律、不可测性影响准确度精密度消除或减小的方法校正增加测定的次数十误差的传递 ( 自阅)1 系统误差的传递( 1) 加 减 法R =mA+nB-p

12、CER =mEA+nEB- pEC( 2)乘除法R =mAnB/ pCER/ R = EA/A+ EB/B- EC/C( 3) 指数运算nR =mA( 4) 对数运算ER/R = nEA/AR =mlgAER =0.434 mEA/A2 随机误差的传递( 1)加减法2222222R =mA+nB-pCsR =msA +n s B +p sC( 2)乘除法22222222R =mAnB/ pCsR /R= s A /A + s B /B + s C /C( 3) 指数运算nR =mA( 4) 对数运算sR/R = ns A/AR=mlgAsR =0.434 ms A/A3 极值误差:最大可能误差

13、R=A+B-CER=| EA|+| EB|+| EC|R AB/CER/R=| EA/A|+|EB/B|+|EC/C|3.2 有效数字及运算规则一 有效数字:实际能测到的数字。在有效数字中,只有最后一位数是不确定的,可疑的。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。1 零的作用:(1) 数字前“ 0”定位作用不计有效数字, 数字中、后的计入有效数字: 0.03040(四位)1.0008 (五位) 0.0382 (三位) 0.0040 (两位)(2) 数字后的0 含义不清楚时 ,有效位数不确定、含糊: 3600 (有效位数不确定、含糊, 因为可看成是4 位有效数字, 但它也可能是2

14、 位或 3 位有效数字, 分别写成指数形式表示为3333.60010,3.610 , 3.6010 ); 1000 ( 有效位数不确定、含糊,原因同上,分别写成333指数形式表示为1.010, 1.0010 , 1.00010 )32 倍数、分数、常数可看成具有无限多位有效数字:10 、1/3 、 、e3 pH ,pM, lgc ,lgK 等对数值,有效数字的位数取决于小数部分(尾数)位数,因整数部-5分代表该数的方次。例: pM 5.00 (二位)M=1.010(二位);PH 10.34 (二位);pH 0.03 (二位)4 数据的第一位数大于等于8 的, 可多计一位有效数字,如9.4510

15、4, 95.2%, 8.65(四位)5 不能因为变换单位而改变有效数字的位数,如:24.01mL24.01103 L6 误差只需保留1 2 位二有效数字的修约规则:“四舍六入五成双”1当测量值中修约的那个数字等于或小于4 时,该数字舍去。如:3.1483.1 2等于或大于6 时,进位。如:0.7360.743 等于 5 时( 5 后面无数据或是0 时),如进位后末位数为偶数则进位,舍去后末位数位偶数则舍去,如:75.576。当 5 后面还有不是0 的任何数时,进位,如:2.4512.5 、1.25131.34 修约数字时, 只允许对原测量值一次修约到所需要的位数,不能分次修约(一次修约)如:1

16、3.474813.47 (对)、如: 13.456513.45613.4613.514( 错)三运算规则1加减法:当几个数据相加减时,它们和或差的有效数字位数,应以小数点后位数最少的数据为依据,因小数点后位数最少的数据的绝对误差最大。例:0.0121 + 25.64 + 1.05782 =?绝对误差0.00010.010.00001由于在加合的结果中总的绝对误差值取决于25.64 ,所以0.0121+25.64+1.05782 0.01+25.64+1.06=26.71。又如: 50.1+1.45+0.581252.12乘除法:当几个数据相乘除时,它们积或商的有效数字位数,应以有效数字位数最少

17、的数据为依据,因有效数字位数最少的数据的相对误差最大。例:0.012125.641.05782 =?相对误差0.8%0.4%0.009%由于结果的相对误差取决于0.0121 ,因它的相对误差最大,所以0.012125.641.05782 = 0.012125.61.06 = 0.328四有效数字运算规则在分析化学中的应用1 根据分析仪器和分析方法的准确度正确读出和记录测定值,且只保留一位不确定数字。2 在计算测定结果之前,先根据运算方法(加减或乘除)确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约,后计算。3 分析化学中的计算主要有两大类( 1)一类是各种化学平衡中有关浓度的计

18、算,一般为四位, 化学平衡计算中, 结果一般为两位有效数字( 由于 K 值一般为两位有效数字) 。( 2)一类是计算测定结果,确定其有效数字位数与待测组分在试样中的相对含量有关。对于高含量组分(一般大于10%)的测定, 四位有效数字;对中含量组分 ( 1%-10%),三位有效数字;微量组分(1%,两位有效数字。( 3)常量分析法一般为4 位有效数字 ( Er 0.1%),微量分析为2 位。( 4)各种常数取值一般为两至三位。3.3 分析化学中的数据处理数理统计是一门研究随机现象统计规律的数学分支学科,它是建立在概率论基础上的。1. 事件 : 在一定条件下的试验结果中,所发生的现象。(1) 必然

19、事件 : 在每次试验结果中,一定会发生的事件。(2) 不可能事件 : 在每次试验结果中,一定不发生的事件。(3) 随机事件 : 在每次试验结果中,可能发生也可能不发生的事件。(偶然事件、概率事件)2. 概率 : 随机事件发生的可能性大小。频 率 = k/n, n大,频率接近概率,当n 相当大时,频率近似于概率。3. 总体(母体): 研究对象的全体。4. 个体(子体):组成总体的每个单元。5. 样本(子样):自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。6. 样本容量(n):样品中所包含个体的数目,用n 表示。例:分析宁德霍童溪水总硬度,依照取样规则,从霍童溪取来供分析用2000

20、ml 样品水, 这 2000ml 样品水是供分析用的总体,如果从样品水中取出20 个试样进行平行分析,得到20 个分析结果,则这组分析结果就是霍童溪样品水的一个随机样本,样本容量为 20。7. 随机变量来自同一总体的无限多个测量值都是随机出现的,叫随机变量。一 概 念1 样本平均值: x 2 总体平均值 :1xinlim 1nn( n 为有限次测量)xi ( n 为无限次测量)强调:(1)当测定次数无限增多时,所得样本平均值即为总体平均值( 2)若没有系统误差,则总体平均值就是真值n3 总体平均偏差 :x4 总体标准偏差( n 为无限次测量)n2xii 1n5 样本标准偏差S(n 为有限次测量

21、、已讲)nSi 1( xi nx)21(n 1)自由度6 相对标准偏差(已讲)相对标准偏差(变异系数)dCVs x100%相对平均偏差100%x7 总体标准偏差与总体平均偏差的关系当测定次数非常多(n 大于 20)时,0.7970.8,但是样本中d8 平均值的标准偏差: ( p58-59 )00.8S统计学可证明平均值的标准偏差与单次测量结果的标准偏差存在下列关系:xn ,xs, dsxxnn (无限次测量)dn (有限次测量)增加测定次数,可使平均值的标准偏差减少,但测定次数增加到一定程度时,这种减少作用不明显,因此在实际工作中, 一般平行测定3-4 次即可; 当要求较高时,可适当增加平行测

22、量次数总结:用标准偏差比用平均偏差更科学更准确.例:两组数据1 x: 0.11,-0.73,0.24,0.51, -0.14,0.00,0.30, -0.21n=8d1=0.281=0.382 x:0.18 , 0.26 , -0.25 , -0.37, 0.32, -0.28 , 0.31, -0.27n=8d2 =0.28 2=0.29d1=d2,12(第二组数据更准确!) 二随机误差的正态分布1 频率分布表 1某样品中镍的质量分数(%) , n = 901.601.671.671.641.581.641.671.621.571.601.591.641.741.651.641.611.65

23、1.691.641.631.651.701.631.621.701.651.681.661.691.701.701.631.671.701.701.631.571.591.621.601.531.561.581.601.581.591.611.621.551.521.491.561.571.611.611.611.501.531.531.591.661.631.541.661.641.641.641.621.621.651.601.631.621.611.651.611.641.631.541.611.601.641.651.591.581.591.601.671.681.69(1)将 n 个

24、数据从小到大依次排列。(2)算出极差( R): R = x 最大 - x 最小R = 1.74% -1.49 % = 0.25 %(3)确定组数和组距:组数视测定次数n 而定,组数必须是整数。n = 909 组组距 = 极差组数= 25.0%9=0. 03%组数第一组1.485 % + 0.03 % = 1.515 %组序分组 (% )频数概率密度 ( 相对频数)11.4851.51520.02221.5151.54560.06731.5451.57560.06741.5751.605170.18951.6051.635220.24461.6351.665200.22271.6651.6951

25、00.11181.6951.72560.06791.7251.75510.011(4)统计频数901.00表 2分组、频数和概率密度统计频数:落在某组内的数据个数。频 数 = n(5)计算概率密度(频率)概率密度 = 频数 /n,概率密度 = 1所以,以各组分区间为横坐标,概率密度为纵坐标作图就可得频率分布直方图(p54) 。图中长方条面积:面 积 = 频率组距, 它表示了测定值出现在该区间的概率。因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。(6) 频率分布直方图的特点A 离散特性:各数据是分散的,波动的,即;测定值在平均值周围波动。波动

26、的程度用总体标准偏差表示。B 集中趋势:有向平均值集中的趋势。用总体平均值表示。在确认消除了系统误差的前提下,总体平均值就是真值。2 随机误差的正态分布(无限次测量)(1) 正态分布曲线:如果以x-(随机误差)为横坐标,曲线最高点横坐标为0,这时表示的是随机误差的正态分布曲线。yf ( x)2x122e2,记为: N(,2),式中y:概率密度;x:测量值 ; x-:随机误差:总体平均值,反映测量值分布的集中趋势,决定曲 线 在 X 轴 的 位 置 。:标准偏差,反映测量值分布的分散程度;决定曲线的形状,小曲线高、陡峭,精密度好; 大曲线低、平坦,精密度差。随机误差符合正态分布:A x= 时,y

27、 值最大, 体现了测量值的集中趋势。 大多数测量值集中在算术平均值的附近, 算术平均值是最可信赖值,能很好反映测量值的集中趋势。反映测量值分布集中趋势。 B 曲线以 x=这一直线为其对称轴,说明正误差和负误差出现的概率相等。C当 x 趋于或时,曲线以轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。D 越大, 测量值落在 附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之, 越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。反映测量值分布分散程度。1E x=时的概率密度为yx2(2) 标准正态分布曲线令 ux,21u1u2则:

28、yf (x)e 2yue 222记为: N( 0, 1)此时,横坐标改为u,纵坐标为概率密度,此时曲线的形状与大小无关,不同 的曲线合为一条。3.随机误差的区间概率正态分布曲线与横坐标- 到 +之间所夹的面积,代表所有数据出现概率的总和,其值1u 2应 为1 , 即P(,)2e 2 2 dx1 。 若 要 求 变 量 在 某 区 间 出 现 的 概 率 , 则P( a, b)u 22a21b e2 dx 。由此,可得到概率积分图(如下图)图 2正态分布概率积分图| |面积| |面积|面积0.00.10.20.30.40.50.60.70.80.90.00000.03980.07930.1179

29、0.15540.19150.22580.25800.28810.35191.01.11.21.31.41.51.61.71.81.90.34130.36430.38490.40320.41920.43320.44520.45540.46410.47132.02.12.22.32.42.52.62.72.82.90.47730.48210.48610.48930.49180.49380.49530.49650.49740.4987注意:表中列出的是单侧概率,求u 间的概率,需乘以2 。 随机误差出现的区间测量值出现的区间概率u 1x10.34132 68.26 u=1.96x=1.96 95.0

30、%u2x20.47732 95.46 u=2.58x=2.58 99.0%u3x30.49872 99.74 结论: 随机误差超过3的测量值出现的概率仅占0.3% 。当实际工作中,如果重复测量中,个别数据误差的绝对值大于3,则这些测量值可舍去。例:已知某试样中Fe 的标准值为3.78% ,=0.10 ,又已知测量时没有系统误差,求(1 )分析结果落在(3.780.20 ) % 范围内的概率; ( 2 )分析结果大于4.0% 的概率。解 :( 1 ) uxu0.202.00.10查表,求得概率为2*0.4773=0.9546 =95.46%( 2 )分析结果大于4.0% 的概率,uxu4.003

31、.780.102.2 ,查表求得分析结果落在3.78-4.00% 以内的概率为0.4861,那么分析结果大于4.00%的概率为0.5000-0.4861=1.39%3.4 少量数据的统计处理一 t分布曲线(有限次测量中随机误差服从t 分布)正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t分布曲线处理。s用 t 代 替 u, 用 S 代替,t 定义为: txx标则为统计量t 。如下图:xsn。 纵坐标仍为概率密度,但横坐1 正态分布与t分布区别(1)正态分布 描述无限次测量数据;t分布 描述有限次测量数据(2 )正态分布横坐标为u, t分布横坐标为t(3)两者所包含面积均是一定范围内

32、测量值出现的概率P正态分布: P 随 u 变化; u 一定, P 一定t分布:P随 t和 f变化; t一定,概率P 与 f有关t分布曲线与正态分布曲线相似,只是t 分布曲线随自由度f 而改变。当f 趋近时,t 分布就趋近正态分布, 即: f时, t 分布正态分布。2 置信度( P):表示在某一t 值时,测定值落在( +ts ) 范围内的概率,说明估计的把握程度。当 f, t 即 为 u3 显著性水平():表示在某一t 值时,测定值落在( +ts ) 范围之外的概率,即:=1-P 。t 值与置信度及自由度有关,一般表示为t , f,见 p60,表 3 3(双边)fP=0.90 =0.10表 3-

33、6t , f 值表(双边) 置信度,显著性水准P=0.95 =0.05P=0.99 =0.0116.3112.7163.6622.924.3099232.353.1858442.132.7846052.022.5740361.942.4537171.902.3635081.862.313.3691.832.263.251012.812.233.17201.722.092.841.641.962.58例:t0 05 , 10 = 2.23 表示置信度为95% ,自由度为10 时 的 t 值 为 2.23 。t0 01 ,5 = 4.03 表示置信度为99% ,自由度为5 时 的 t 值 为 4.

34、03 。二平均值的置信区间(xtS n):一定置信度(概率)下,以平均值为中心,能够包含真值的区间(范围) ,反映估计的精密度。置信度越高,置信区间越大。(1) 由单次测量结果估计的置信区间:xu(2) 由多次测量的样本平均值估计的置信区间 :xuxxun(3) 由少量测定结果均值估计的置信区间tsxtsxxn它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。从公式可知只要选定置信度P,根据P(或)与 f 即可从表中查出t, f 值,从测定的 x , s, n 值就可以求出相应的置信区间,置信度越高,置信区间就越大,所估计的区间包括真值的可能性也就越大,置信度

35、定在95%或 90%。例 1: 分析某固体废物中铁含量得如下结果:x =15.78%, s=0.03%,n=4,求 : (1)置信度为95%时平均值的置信区间;(2)置信度为99%时平均值的置信区间解:置信度为95%,查表得 t 0.05 ,3=3.18 ,那么xtS n15.783.180.03415.780.05%置信度为99%,查表得t 0.05 ,3=5.84 ,那么xtS n15.785.840.03415.780.09%从该例可以看出,置信度越高,置信区间越大。对上例结果的理解:1. 正确的理解:在 15.780.05%的区间内,包括总体平均值的的概率为95%。2. 错误的理解:a

36、. 未来测定的实验平均值有95%落入 15.780.05%区间内b. 真值落在15.780.05%区间内的概率为95%例 2: 下列有关置信区间的定义中,正确的是:a. 以真值为中心的某一区间包括测定结果的平均值的几率;b. 在一定置信度时,以测量值的平均值为中心的包括总体平均值的范围c. 真值落在某一可靠区间的几率;d. 在一定置信度时,以真值为中心的可靠范围。例 3: 某试样含Cl - 的质量分数的平均值的置信区间为36.45%0.10%(置信区间90%),对此结果应理解为:a. 有 90%的测量结果落在36.45%0.10%范围内;b. 总体平均值落在此区间的概率为90%;c. 若再作一

37、次测定,落在此区间的概率为90%; d. 在此区间内,包括总体平均值的把握为90%3.5 显著性检验显著性检验是利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异,即:确定某种方法是否可用, 判断实验室测定结果准确性。方法有t检验法和F 检验法一 t检验法系统误差的检测1平均值与标准值的比较:为了检查分析数据是否存在较大的系统误差,可对标准试样进行若干次分析, 再利用t 检验法比较分析结果的平均值与标准试样的标准值之间是否存x在显著性差异。进行t 检验时,首先按下式计算出t 值 : tSn。若 t 计算t ,f ,存在显著性差异,存在系统误差, 被检验方法需要改进, 否则不存在显著性

38、差异, 被检验方法可以采用。通常以95%的置信度为检验标准,即显著性水准为5%。表示有显著性差异.例:采用某种新方法测定基准明矾中铝的质量分数,得到下列9 个分析结果:10.74%, 10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已知明矾中铝含量的标准值 ( 以理论值代 ) 为 10.77%。试问采用该新方法后,是否引起系统误差( 置信度 95%)?解n = 9,f = 91=8x10 .79 %,s0 .042 %x10tn. 79%10. 77%91 . 43s0 . 042%查表 ,P = 0.95,f = 8时 , t

39、0.05 ,8 = 2.31 。 t t 表,则两组平均值存在显著性差异。 tt表,则不存在显著性差异。第一法1.26%1.25%1.22%第二法1.35%1.31%1.33%例 用两种方法测定合金中铝的质量分数,所得结果如下:试问两种方法之间是否有显著性差异( 置信度 90%)?解n1=3,x1=1.24%s1=0.021% n2=4,x2=1.33%s2=0.017%f大=2f小=3F表 =955F t0 10, 5,故两种分析方法之间存在显著性差异.二 F检验法方差检验法 (两组数据间偶然误差的检测): 比较两组数据的方差s2,以确定它们的精密度是否有显著性差异的方法。统计量F 定义为两

40、组数据的方差的比值,即:s大 2统计量Fs小2。两组数据的精密度相差不大,则F 值趋近于1;若两者之间存在显著f大234表置信度595%时 F 值( 单边 )678910f小219.0019.1619.2519.3019.3319.3619.3719.3819.3919.5039.559.289.129.018.948.888.848.818.788.5346.946.596.396.266.166.096.046.005.965.6355.795.415.195.054.954.884.824.784.744.3665.144.764.534.394.284.214.154.104.063.

41、6774.744.354.123.973.873.793.733.683.633.2384.464.073.843.693.583.503.443.393.342.9394.263.863.633.483.373.293.233.183.132.71104.103.713.483.333.223.143.073.022.972.543.002.602.372.212.102.011.941.881.831.00性差异, F 值就较大。在一定的P( 置信度 95%)及 f 时, F 计算 F 表,存在显著性差异,否则, 不存在显著性差异。f 大:大方差数据的自由度;f 小:小方差数据的自由度。判

42、断两组数据的精密度是否有显著性差异时,一组数据的精密度可能大于,等于, 或小于另一组数据的精密度,显著性水平为单侧检验时的两倍,即0.10 ,此时的置信P=10.10=0.90(90%)。例:一碱灰试样, 用两种方法测得其中Na2CO3,结果如下方法1: x142.34, s10.10, n15方 法 2: x242.44, s20.12, n2422s0.12解:先用F 检验 s1 与 s 2 有无显著差异:F计算大s小220.101.44表计算表查表得 F=6.59 ,因 F F, 因此 s 1 与 s 2 无显著差异,用t 检验法检验x1与x 2x1x2n1 n242.3442.4454

43、t计算sn1n2(ss小)0.10541.49查 t 表 , f=5+4-2=7 , P=95%, 得 : t 表=2.36,则 t计算 Ta,n ,舍去,否则保留。表T , n 值表n显著性水准0.050.0250.0131.151.151.1541.461.481.4951.671.711.7561.821.891.9471.942.022.1082.032.132.2292.112.212.32102.182.292.41112.232.362.48122.292.4132.55132.332.462.61142.372.512.63152.412.552.71202.562.712.8

44、8三Q检验法步骤:( 1)数据由小到大排列:x 1, x 2 xn,其中 x1 或 xn 可能是异常值。( 2)计算统计量(QnQ计算x可疑xmaxx邻近xnxn1x2x1xx1( xn 为可疑值) Qx1xmin):xn(x1为可疑值)( 3)比较 Q计算和 Q表( QP, n),若 Q计算 Q表,舍去,过失误差造成。若 Q计算 Q 表, 保留该数据 ,偶然误差所致。表Q值表3456789100.940.760.640.560.510.470.440.410.980.850.730.640.590.540.510.480.990.930.820.740.680.630.600.57测定次数, n置90%( Q0.90)信96%( Q0.96)度99%( Q0.99)总结:1 比 较 :t检验 检验方法的系统误差F检验 检验方法的偶然误差G检验 可疑值的取舍2 检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论