

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章分析化学中的误差及数据处理本章基本要求:掌握误差和偏差的基本概念、准确度与精密度的概念和衡量其大小的方式;了解误差的分类、特点、产生的原因及其减免测定误差的措施。了解准确度与精密度之间的关系和它们在实际工作中的应用。掌握有效数字的概念、有效数字在分析测定中的应用规则、可疑数据的取舍和有效数字的运算规则。3掌握平均值的置信区间的概念和计算;掌握t检验法、F检验法以及Q检验法的应用;了解随机误差的分布特征—正态分布。4掌握通过选择合适的分析方法、用标准样品对照、减小测量误差和随机误差、消除系统误差等提高分析结果准确度的方法。分析人员用同一种方法对同一个试样进行多次分析,即使分析人员技术相当熟练,仪器设备很先进,也不可能做到每一次分析结果完全相同,所以在分析中往往要平行测定多次,然后取平均值代表分析结果,但是平均值同真实值之间还可能存在差异,因此分析中误差是不可避免的。§3.1分析化学中的误差一真值(xt)某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的:1理论真值(如某化合物的理论组成,例:纯NaCl中Cl的含量)计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位如米、千克等;标准参考物质证书上给出的数值;有经验的人用可靠方法多次测定的平均值,确认消除了系统误差。)相对真值(如认定精确度高一个数量级的测定值作为低一级测量值的真值。(如标准试样(在仪器分析中常常用到)的含量)平均值(x)_+x_+…+xX—12n强调:n次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,是对真值的最佳估计,它表示一组测定数据的集中趋势。三中位数(X)M一组测量数据按大小顺序排列,中间一个数据即为中位数X,当测量值的个数位数时,M中位数为中间相临两个测量值的平均值。例1.小10.10,10.20,10.40,10.46,10.50大x=10.33x=10.40M例2.10.10,10.20,10.40,10.46,10.50,10.54x=10.37x=10.43M它的优点是能简单直观说明一组测量数据的结果,且不受两端具有过大误差数据的影响。例3:当有异常值时,10.10,10.20,10.40,10.46,10.50,12.80x=10.43xM=10.74
很多情况下,用中位数表示“中心趋势”比用平均值更实际。其缺点是不能充分利用数据,因而不如平均值准确。四准确度和误差1准确度:指测量值与真值之间接近的程度,其好坏用误差来衡量,用相对误差较好。2误差(E):测定结果与真实值之间的差值绝对误差:测量值与真值间的差值,E=x-xaT测量值大于真实值,误差为正误值;测量值小于真实值,误差为负误值。误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。相对误差:绝对误差占真值的百分比,E=x-叶/xX100%=Ea/xxlOO%r1TT相对误差有大小、正负之分,它能反映误差在真实结果中所占的比例,因此在绝对误差相同的条件下,代测组分含量越高,相对误差越小;反之,相对误差越大。例:某同学用分析天平直接称量两个物体,一为5.0000g,—为0.5000g,试求两个物体的相对误差。解:用分析天平称量,两物体称量的绝对误差均为O.OOOlg,则两个称量的相对误差分别为±0.0-001,5.0000±0.0-001,5.0000X100%-+0.002%恥盘L山阶士皿2%五精密度和偏差1精密度:平行测定结果相互靠近的程度,用偏差衡量2偏差(d):测量值与平均值的差值,用d表示绝对偏差:个别测得值x-测得平均值X,即:d=x-X工di=0偏差的大小反映了精密度的好坏,即多次测定结果相互吻合的程度。偏差有正负号,如果将各单次测定的偏差相加,其和应为0或接近为0。相对偏差(dr):绝对偏差与平均值的比值,即:dr=d/Xx100%d\+|d」+...IdI平均偏差(d):各单个偏差绝对值的平均值,即:d二12也n相对平均偏差(dr):平均偏差与测量平均值的比值,即:dr=d/Xx100%
丫(X-x)2标准偏差:S=丫_i^Ln—1强调:1S是表示偏差的最好方法,数学严格性高,可靠性大,能显示出较大的偏差。测定次数在3—20次时,可用S来表示一组数据的精密度,2式中n-1称为自由度,表明n次测量中只有n-1个独立变化的偏差。因为n个偏差之和等于零,所以只要知道n-1个偏差就可以确定第n个偏差了,S与相对平均偏差的区别在于:第一,偏差平方后再相加,消除了负号,再除自由度和再开根,标准偏差是数据统计上的需要,在表示测量数据不多的精密度时,更加准确和合理。S对单次测量偏差平方和不仅避免单次测量偏差相加时正负抵消,更重要的是大偏差能更显著地反映出来,能更好地说明数据的分散程度。例:有二组数据,各次测量的偏差为:+0.3,-0.2,-0.4,+0.2,+0.1,+0.4,0.0,-0.3,+0.2,-0.3;0.0,+0.1,-0.7,+0.2,-0.1,-0.2,+0.5,-0.2,+0.3,+0.1;解:两组数据的平均偏差均为0.24,但明显看出第二组数据分散大。因为Si=0.28;S2=0.33(注意计算s时,若偏差d=0时,也应算进去,不能舍去),可见第一组数据较好。2(6)六相对标准偏差(S、RSD、CV)(6)六相对标准偏差(S、RSD、CV):S=三xlQQ%r准确度与精密度的关系AA.C.准确但不精密结论:准确度高精密度一定高;精密度是保证准确度的前提;精密度好,准确度不一定好,可能有系统误差存在;精密度不好,衡量准确度无意义;在确定消除了系统误差的前提下,精密度可表达准确度;准确度及精密度都高说明结果可靠。极差(R):又称全距或范围误差,即:R=x—xmaxmin相对极差=R/xx100%公差(阅读P):生产部门对于分析结果允许误差表示法,超出此误差范围为超差,分45析组分越复杂,公差的范围也大些。系统误差和随机误差系统误差:由某种固定原因造成,使测定结果系统地偏高或偏低。可用校正地方法加以消除。特点:(1)单向性:要么偏高,要么偏低,即正负、大小有一定地规律性重复性:同一条件下,重复测定中,重复地出现;可测性:误差大小基本不变。来源:(1)方法误差—选择的方法不够完善:重量分析中沉淀的溶解损失、滴定分析中终点误差—用其他方法校正仪器误差—仪器本身的缺陷:天平两臂不等,滴定管,容量瓶刻度不准、砝码磨损—校准(绝对、相对)操作误差:颜色观察(多实践)
(4)试剂误差—所用试剂有杂质:去离子水不合格;试剂纯度不够(含待测组份或干扰离子)-空白实验(5)主观误差—个人误差,操作人员主观因素造成:对指示剂颜色辨别偏深或偏浅;滴定管读数不准。随机误差:由某些不固定偶然原因造成,使测定结果在一定范围内波动,大小、正负不定,难以找到原因,无法测量。不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定4-6次特点:(1)不确定性;(2)不可避免性。只能减小,不能消除。每次测定结果无规律性多次测量符合统计规律。3.过失:其实质是一种错误,由粗心大意引起,可以避免的,必须重做!如:加错指示剂、记录错误等图1系统误差与随机误差的比较项目系统误差随机误差产生原因固定因素,有时不存在不固定因素,总是存在分类方法误差、仪器与试剂误差、主观误差环境的变化因素、主观的变化因素等性质重现性、单向性(或周期性)、可测性服从概率统计规律、不可测性影响准确度精密度消除或减小的方法校正增加测定的次数十误差的传递(自阅)1系统误差的传递1)加减法R=mA+nB-pC(2)R=mA+nB-pC(2)乘除法R=mAXnB/pC(3)指数运算R=mAn(4)对数运算R=mlgA随机误差的传递(1)加减法E=mE+nE-pERABCE/R=E/A+E/B-E/CRABCE/R=nE/ARAE=0.434mE/ARAR=mA+nB-pC2)乘除法R=mA+nB-pC2)乘除法R=mAXnB/pC3)指数运算s2=m2s2+n2s2+p2s2
RABCs2/R2=s2/A2+s2/B2+s2/C2RABCR=mAnsR/R=nsA/A(4)对数运算R=mlgAsR=0.434msA/A极值误差:最大可能误差R=A+B-CER=|EA|+|EB|+|EC|R=AB/CEr/R=|EA/A|+|EB/B|+|Ec/C|§3.2有效数字及运算规则有效数字:实际能测到的数字。在有效数字中,只有最后一位数是不确定的,可疑的。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。零的作用:(1)数字前“0”定位作用不计有效数字,数字中、后的计入有效数字:0.03040(四位)1.0008(五位)0.0382(三位)0.0040(两位)(2)数字后的0含义不清楚时,有效位数不确定、含糊:3600(有效位数不确定、含糊,因为可看成是4位有效数字,但它也可能是2位或3位有效数字,分别写成指数形式表示为3.600X103,3.6X103,3.60X103);1000(有效位数不确定、含糊,原因同上,分别写成指数形式表示为1.0X103,1.00X103,1.000X103)2倍数、分数、常数可看成具有无限多位有效数字:103、1/3、冗、epH,pM,lgc,lgK等对数值,有效数字的位数取决于小数部分(尾数)位数,因整数部分代表该数的方次。例:pM=5.00(二位)T[M]=1.0X10-5(二位);PH=10.34(二位);pH=0.03(二位)数据的第一位数大于等于8的,可多计一位有效数字,如9.45X104,95.2%,8.65(四位)5不能因为变换单位而改变有效数字的位数,如:24.01mLt24.01x10-3L6误差只需保留1〜2位有效数字的修约规则:“四舍六入五成双”当测量值中修约的那个数字等于或小于4时,该数字舍去。如:3.148—3.1等于或大于6时,进位。如:0.736—0.74等于5时(5后面无数据或是0时),如进位后末位数为偶数则进位,舍去后末位数位偶数则舍去,如:75.5—76。当5后面还有不是0的任何数时,进位,如:2.451—2.5、1.2513—1.3修约数字时,只允许对原测量值一次修约到所需要的位数,不能分次修约(一次修约)如:13.4748—13.47(对)、如:13.4565—13.456—13.46—13.5—14(错)运算规则1加减法:当几个数据相加减时,它们和或差的有效数字位数,应以小数点后位数最少的数据为依据,因小数点后位数最少的数据的绝对误差最大。例:0.0121+25.64+1.05782=?绝对误差±0.0001±0.01±0.00001由于在加合的结果中总的绝对误差值取决于25.64,所以0.0121+25.64+1.05782=0.01+25.64+1.06=26.71。又如:50.1+1.45+0.5812=52.1乘除法:当几个数据相乘除时,它们积或商的有效数字位数,应以有效数字位数最少的数据为依据,因有效数字位数最少的数据的相对误差最大。例:0.0121X25.64X1.05782=?相对误差±0.8%±0.4%±0.009%由于结果的相对误差取决于0.0121,因它的相对误差最大,所以0.0121X25.64X1.05782=0.0121X25.6X1.06=0.328有效数字运算规则在分析化学中的应用1根据分析仪器和分析方法的准确度正确读出和记录测定值,且只保留一位不确定数字。2在计算测定结果之前,先根据运算方法(加减或乘除)确定欲保留的位数,然后按照数字修约规则对各测定值进行修约,先修约,后计算。分析化学中的计算主要有两大类(1)一类是各种化学平衡中有关浓度的计算,一般为四位,化学平衡计算中,结果一般为两位有效数字(由于K值一般为两位有效数字)。(2)一类是计算测定结果,确定其有效数字位数与待测组分在试样中的相对含量有关。对于高含量组分(一般大于10%)的测定,四位有效数字;对中含量组分(1%--10%),三位有效数字;微量组分(<1%=,两位有效数字。(3)常量分析法一般为4位有效数字(Er~0.1%),微量分析为2位。(4)各种常数取值一般为两至三位。§3.3分析化学中的数据处理数理统计是一门研究随机现象统计规律的数学分支学科,它是建立在概率论基础上的。事件:在一定条件下的试验结果中,所发生的现象。(1)必然事件:在每次试验结果中,一定会发生的事件。(2)不可能事件:在每次试验结果中,一定不发生的事件。(3)随机事件:在每次试验结果中,可能发生也可能不发生的事件。(偶然事件、概率事件)概率:随机事件发生的可能性大小。频率=k/n,n-大,频率一接近概率,当n相当大时,频率近似于概率。总体(母体):研究对象的全体。个体(子体):组成总体的每个单元。样本(子样):自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。样本容量(n):样品中所包含个体的数目,用n表示。例:分析宁德霍童溪水总硬度,依照取样规则,从霍童溪取来供分析用2000ml样品水,这2000ml样品水是供分析用的总体,如果从样品水中取出20个试样进行平行分析,得到20个分析结果,则这组分析结果就是霍童溪样品水的一个随机样本,样本容量为20。7.随机变量来自同一总体的无限多个测量值都是随机出现的,叫随机变量。一概念1样本平均值:X=1工x(n为有限次测量)ni2总体平均值卩:卩二liml工X(n为无限次测量)n*ni强调:(1)当测定次数无限增多时,所得样本平均值即为总体平均值卩(2)若没有系统误差,则总体平均值卩就是真值工|x_h|3总体平均偏差5:5=匚n4总体标准偏差g(n为无限次测量)X(x-卩)2iG=\、T=1n5样本标准偏差S(n为有限次测量、已讲)S6相对标准偏差(已讲)相对标准偏差(变异系数)CV=?xlOO%xd相对平均偏差=-x100%x7总体标准偏差与总体平均偏差的关系当测定次数非常多(n大于20)时,5=0.797QQ0&,但是样本中-丰00.8S8平均值的标准偏差:(p58-59)统计学可证明平均值的标准偏差与单次测量结果的标准偏差存在下列关系:无限次测量)增加测定次数,可使平均值的标准偏差减少,但测定次数增加到一定程度时,这种减少作用不明-=皂xvn有限次测量)显,因此在实际工作中,一般平行测定3-4次即可当要求较高时,可适当增加平行测量次数总结:用标准偏差比用平均偏差更科学更准确.例:两组数据x:0.11,-0.73,n=8d=0.281x:0.18,0.26,-0.25,0.24,0.51,-0.14,0.00,0.30,S=0.381-0.37,0.32,-0.28,0.31,-0.27-0.21n=8d=0.28S=0.2922q=d2,s/s2(第二组数据更准确!)随机误差的正态分布1频率分布表1某样品中镍的质量分数(%),n=901.601.671.671.641.581.641.671.621.571.601.591.641.741.651.641.611.651.691.641.631.651.701.631.621.701.651.681.661.691.701.701.631.671.701.701.631.571.591.621.601.531.561.581.601.581.591.611.621.551.521.491.561.571.611.611.611.501.531.531.591.661.631.541.661.641.641.641.621.621.651.601.631.621.611.651.611.641.631.541.611.601.641.651.591.581.591.601.671.681.69(1)将n个数据从小到大依次排列。(2)算出极差(R):R=x-xR=1.74%-1.49%=0.25%最大最小(3)确定组数和组距:组数视测定次数n而定,组数必须是整数。n=909组组距=极差=25.0%组数9=0.03%组数第一组1.485%+0.03%=1.515%表2分组、频数和概率密度统计组序分组(%)频数概率密度(相对频数)11.485~1.51520.02221.515~1.54560.06731.545~1.57560.06741.575~1.605170.18951.605~1.635220.24461.635~1.665200.22271.665~1.695100.11181.695~1.72560.06791.725~1.75510.011工901.00(4)统计频数频数:落在某组内的数据个数。工频数=n计算概率密度(频率)概率密度=频数/n,工概率密度=1所以,以各组分区间为横坐标,概率密度为纵坐标作图就可得频率分布直方图(p54)。少细少细1.2-55■*.-1.2^5-%1O.O1-I..3125^&二O04]_3Z5畔一1■鼻亍予%7U-OT1u•j1.■乳J?0.17Ia了熬亍加一3=.1-5■&茗40—T415^*——!_.4N0.41、445%-1B"去呱2mmI或爭号%--豪.5C15%:c1.5OST&一r.sjstkU.U11・S35^»-ta«Nt.UlXiihitL.UQ图中长方条面积:面积=频率X组距,它表示了测定值出现在该区间的概率。因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多。频率分布直方图的特点A离散特性:各数据是分散的,波动的,即;测定值在平均值周围波动。波动的程度用总体标准偏差Q表示。B集中趋势:有向平均值集中的趋势。用总体平均伽表示。在确认消除了系统误差的前提下,总体平均值就是真值。2随机误差的正态分布(无限次测量)(1)正态分布曲线:如果以x-卩(随机误差)为横坐标,曲线最高点横坐标为0,这时表示的是随机误差的正态分布曲线。y=f⑷=W^e「才,记为:N/°2)式中y:概率密度;x:测量值;x-u:随机误差卩:总体平均值,反映测量值分布的集中趋势,决定曲线在X轴的位置。。:标准偏差,反映测量值分布的分散程度;决定曲线的形状,Q小T曲线高、陡峭,精密度好;Q大T曲线低、平坦,精密度差。圏两第[桶齬度不同的
的正盡符布曲缠随机误差符合正态分布:Ax=u时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。卩反映测量值分布集中趋势。B曲线以x=u这一直线为其对称轴,说明正误差和负误差出现的概率相等。C当x趋于一R或时,曲线以x轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。D。越大,测量值落在卩附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,。越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。。反映测量值分布分散程度。Ex=y时的概率密度为(2)标准正态分布曲线U21U2e—2ny=①=e—22兀贝y:y=f(x)=G72兀记为:N(0,1)此时,横坐标改为u,纵坐标为概率密度,此时曲线的形状与。大小无关,不同。的曲线合为一条。B17-4标推正态分布曲线3•随机误差的区间概率正态分布曲线与横坐标-R到+R之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即P(—g,+8)==卜2兀—^e苍dx=1。若要求变量在某区间出现的概率,则P(a,b)=Jb2兀ae~2g2dx。由此,可得到概率积分图(如下图)xx图2正态分布概率积分图随机误差出现的区间u=±随机误差出现的区间u=±lu=±1.96u=±2u=±2.58测量值出现的区间x=p±1gx二卩±1.96。x=p±2gx二卩±2.58。概率0.3413X2=68.26%95.0%0.4773X2=95.46%99.0%u=±u=±3|卩|面积I卩I面积I卩I面积0.00.00001.00.34132.00.47730.10.03981.10.36432.10.48210.20.07931.20.38492.20.48610.30.11791.30.40322.30.48930.40.15541.40.41922.40.49180.50.19151.50.43322.50.49380.60.22581.60.44522.60.49530.70.25801.70.45542.70.49650.80.28811.80.46412.80.49740.90.35191.90.47132.90.4987注意:表中列出的是单侧概率,求土u间的概率,需乘以2。结论:随机误差超过3q的测量值出现的概率仅占0.3%。当实际工作中,如果重复测量中,个别数据误差的绝对值大于36则这些测量值可舍去。例:已知某试样中Fe的标准值为3.78%,6=0.10,又已知测量时没有系统误差,求(1)分析结果落在(3.78±0.20)%范围内的概率;(2)分析结果大于4.0%的概率。解:(1)U==020=2.0查表,求得概率为2*0.4773=0.9546=95.46%60.10(2)分析结果大于4.0%的概率,皿=上旦=4.00—3.78=2.2,查表求得分析结果落在60.103.78-4.00%以内的概率为0.4861,那么分析结果大于4.00%的概率为0.5000-0.4861=1.39%§3・4少量数据的统计处理一t分布曲线(有限次测量中随机误差服从t分布)正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t分布曲线处理。用t代替U,用S代替6,t定义为:t==^—^x;n。纵坐标仍为概率密度,但横坐s标则为统计量t。如下图:87-6f分布蛾疣1正态分布与t分布区别(1)正态分布一描述无限次测量数据;t分布一描述有限次测量数据(2)正态分布横坐标为u,t分布横坐标为t(3)两者所包含面积均是一定范围内测量值出现的概率P正态分布:P随u变化;u—定,P—定t分布:P随t和f变化;t一定,概率P与f有关t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当f趋近a时,t分布就趋近正态分布,即:f—a时,t分布一正态分布。2置信度(P):表示在某一t值时,测定值落在(u+ts)范围内的概率,说明估计的把握程度。当fT8,t即为U3显著性水平(a):表示在某一t值时,测定值落在(u+ts)范围之外的概率,即:a=1-Pot值与置信度及自由度有关,一般表示为t,见p60,表3—3(双边)a表3-6ta,直表(双边)f置信度,显著性水准P=0・90a=0.10P=0・95a=0.05P=0.99a=0.0116.3112.7163.6622.924.309-9232.353.185-8442.132.784-6052.022.574-0361.942.453-7171.902.363-5081.862.313.3691.832.263.251012.812.233.17201.722.092.8481.641.962.58例:t0.05,10=2.23表示置信度为95%,自由度为10时的t值为2.23。to.01,5=4.03表示置信度为99%,自由度为5时的t值为4.03。—C平均值的置信区间(卩=x土t2)n:一定置信度(概率)下,以平均值为中心,能够包含真值的区间(范围),反映估计的精密度。置信度越高,置信区间越大。(1)由单次测量结果估计卩的置信区间:卩=X土uQ(2)由多次测量的样本平均值估计卩的置信区间:Gg=x+u•Q=X+u•x(3)由少量测定结果均值估计卩的置信区间nts卩=X+ts=X+x它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间。从公式可知只要选定置信度P,根据P(或G与f即可从表中查出t«f值,从测定的X,s,n值就可以求出相应的置信区间,置信度越高,置信区间就越大,所估计的区间包括真值的可能性也就越大,置信度定在95%或90%。例1:分析某固体废物中铁含量得如下结果:X=15.78%,s=0.03%,n=4,求:(1)置信度为95%时平均值的置信区间;(2)置信度为99%时平均值的置信区间解:置信度为95%,查表得t0.05,3=3.18,那么卩=x+/了==15.78+3.18x=15.78+0.05%置信度为99%,查表得t0.05,3=5.84,那么卩=X土t产=15.78土5.84x003=15.78土0.09%从该例可以看出,置信度越高,置信区间越大。对上例结果的理解:正确的理解:在15.78±0.05%的区间内,包括总体平均值的卩的概率为95%。错误的理解:a.未来测定的实验平均值有95%落入15.78±0.05%区间内b.真值落在15.78±0.05%区间内的概率为95%例2:下列有关置信区间的定义中,正确的是:以真值为中心的某一区间包括测定结果的平均值的几率;7b.在一定置信度时,以测量值的平均值为中心的包括总体平均值的范围c.真值落在某一可靠区间的几率;d.在一定置信度时,以真值为中心的可靠范围。例3:某试样含Cl-的质量分数的平均值的置信区间为36.45%±0.10%(置信区间90%),对此结果应理解为:a.有90%的测量结果落在36.45%±0.10%范围内;b.总体平均值卩落在此区间的概率为90%;c•若再作一次测定,落在此区间的概率为90%;7d.在此区间内,包括总体平均值g的把握为90%§3.5显著性检验显著性检验是利用统计学的方法,检验被处理的问题是否存在统计上的显著性差异即:确定某种方法是否可用,判断实验室测定结果准确性。方法有t检验法和F检验法一t检验法一系统误差的检测1平均值与标准值的比较:为了检查分析数据是否存在较大的系统误差,可对标准试样进行若干次分析,再利用t检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。进行t检验时,首先按下式计算出t值:t=旦vn。若t计算〉t,存S计算a,f在显著性差异,存在系统误差,被检验方法需要改进,否则不存在显著性差异,被检验方法可以采用。。通常以95%的置信度为检验标准,即显著性水准为5%。表示有显著性差异.例:采用某种新方法测定基准明矾中铝的质量分数,得到下列9个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已知明矾中铝含量的标准值(以理论值代)为10.77%。解n=9,f=9—1=8试问采用该新方法后9%%否弓s起至统误差(置信度%5%)?|10.79%-10.77%|0.042%=1.43查表,P=0.95,f=8时,t二2.31。t〈t,故x与卩之间不存在显著性0.05,80.05,8差异,即采用新方法后,没有弓起明显的系统误差。2两组平均值的比较((同一试样,比较7与匸):12新方法--经典方法(标准方法)两个分析人员测定的两组数据两个实验室测定的两组数据设两组分析数据为:nsx111nsx222统计量t=x一x122(n—1)S2+(n—1)S2S2=1122—n+n—212在一定置信度时,查出表值(总自由度f=n+n—2),若t〉t表,贝9两组平均值存在显12表著性差异。t〈t表,则不存在显著性差异。表例用两种方法测定合金中铝的质量分数,所得结果如下:第一法1.26%1.25%1.22%第二法1.35%1.31%1.33%试问两种方法之间是否有显著性差异(置信度90%)?n=3,x=1.24%11n=4,x=1.33%22s=0.021%1s=0.017%2f=2大F<F—表f=3F=9・55小表说明两组数据的标准偏差没有显著性差异.s="卩+工(;-手=0.019(n—1)+(n—1)nn12n+n12|1.24—1.33~~OT9=6.213+4当P=0.90,f=n+n—2=5时,t二2.02。t〉t,故两种分析方法之间120・10,50・10,5存在显著性差异.二F检验法一方差检验法(两组数据间偶然误差的检测):比较两组数据的方差s2,以确定它们的精密度是否有显著性差异的方法。统计量F定义为两组数据的方差的比值,即:统计量F=集。两组数据的精密度相差不大,则F值趋近于1;若两者之间存在显著s小2性差异,F值就较大。在一定的P(置信度95%)及f时,F计算〉F表存在显著性差异,否则,计算表不存在显著性差异。表置信度95%时F值(单边)2345678910OO219.0019.1619.2519.3019.3319.3619.3719.3819.3919.5039.559.289.129.018.948.888.848.818.788.5346.946.596.396.266.166.096.046.005.965.6355.795.415.195.054.954.884.824.784.744.3665.144.764.534.394.284.214.154.104.063.6774.744.354.123.973.873.793.733.683.633.2384.464.073.843.693.583.503.443.393.342.9394.263.863.633.483.373.293.233.183.132.71104.103.713.483.333.223.143.073.022.972.54OO3.002.602.372.212.102.011.941.881.831.00f大大方差数据的自由度;f小:小方差数据的自由度。判断两组数大据的精密度是否有显著性差小异时,一组数据的精密度可能大于,等于,或小于另一组数据的精密度,显著性水平为单侧检验时的两倍,即0.10,此时的置信P=1-0.10=0.90(90%)。例:一碱灰试样,用两种方法测得其中Na2C03,结果如下方法1:X=42.34,s=0.10,n=5方法2:x=42.44,s=0.12,n=4222解:先用F检验si与S2解:先用F检验si与S2有无显著差异:F=大==1.44计算2(0.10》小查表得F=6.59,因F〈F,因此S]与S2无显著差异,用t检验法检验x与x表计算表12t=计算nn/、1~^-(s=st=计算nn/、1~^-(s=s)=n+n120.10|42.34-42.44|=1.49查t表,f=5+4-2=7,P=95%,得:在实验中得到一组数据,t=2.36,贝yt计算〈t表,因此,无显著差异。表§3.6异常值的取舍个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。处理方法有4d法、格鲁布斯(Grubbs)法和Q检验法。4d法(简单,但误差大)
1依据:根据正态分布规律,偏差超过3。的个别测定值的概率小于0.3%,故这一测量值通常可以舍去。而5=0.800,30^46,即偏差超过45的个别测定值可以舍去。当4d法与其他检验法矛盾时,以其他法则为准。2步骤:(1)求出除异常值(Q)以外数据的平均值X和平均偏差d。u(2)将异常值与平均值进行比较,如绝对差值大于4d,则将可疑值舍去,否则保留。格鲁布斯步骤:(1)(2)(Grubbs)法:数据由小到大排列:x,xX,其中X或X可能是异常值。12n1n求出X与S。(3)求统计量T:T-(X为可疑值)T-(X为可疑值)s1sn(4)将T与表值Ta,n比较,T>Ta,n,舍去,否则保留。表T值表n显著性水准a0.050.0250.0131.151.151.1541.461.481.4951.671.711.7561.821.891.9471.942.022.1082.032.132.2292.112.212.32102.182.292.41112.232.362.48122.292.4132.55132.332.462.61142.372.512.63152.412.552.71202.562.712.88Q检验法步骤:(1)数据由小到大排列:Xi,X2……》,其中Xi或叫可能是异常值。X—X(2)计算统计量(Q计算二邻近):计算X—XmaxminQ=Xn—Xn-1(X为可疑值)Q==(X为可疑值)X—XnX—X1n1n1(3)比较Q和Q(Q),若Q>Q,舍去,过失误差造成。计算表P,n计算表若Q<Q,保留该数据,偶然误差所致。计算表表Q值表测定次数,n345678910置90%叽)0.940.760.640.560.510.470.440.41信96%(Q.96)0.980.850.730.640.590.540.510.48度99%(Q鳥9)0.990.930.820.740.680.630.600.57
总结:总结:比较:t检验一检验方法的系统误差F检验一检验方法的偶然误差G检验一可疑值的取舍检验顺序:G检验一F检验一t检验§3.7回归分析法元线性回归方程y=a+bx+eiii式中x,y分别为xy=a+bx+eiii2ny一b2na=a=Q=2(y一a一bx)2iii=1迤db一22x(y迤db一22x(yiii=1—a—bx)=0i一22(yi一a一bx)=0ii=1乙(x—x)(y—y)iib=_i=1—
工(x—x)2
i
i=1一元线性回归方程及回归直线就定了。例用吸光光度法测定合金钢中Mn的含量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年注册土木工程师(水利水电)之专业知识全真模拟考试试卷A卷含答案
- 2025年主治医师之消化内科主治306考前冲刺模拟试卷A卷含答案
- 2025-2030真皮市场市场现状供需分析及投资评估规划分析研究报告
- 2025-2030润肤霜行业风险投资态势及投融资策略指引报告
- 2025-2030汽车车轮行业发展分析及投资价值研究咨询报告
- 2025-2030毛细胞白血病的治疗行业市场现状供需分析及重点企业投资评估规划分析研究报告
- 2025-2030有机椰子水行业市场现状供需分析及投资评估规划分析研究报告
- 一年级道德与法治多媒体教学计划
- 山东省菏泽市2024-2025学年高三上学期期末考试历史试题(解析版)
- 绿化养护中化肥使用的安全措施
- 双全日培训课件
- 甲油胶行业报告
- 医务人员职业暴露与防护讲课
- 山东省莱西市2024-2025学年高一语文下学期3月月考试题含解析
- 康复科人员岗位考核制度(3篇)
- 实验动物生物样本质量控制规范
- 智能机器人配送行业现状分析及未来三至五年行业发展报告
- 炎症性肠病的外科治疗
- 复变函数与积分变换课程教案讲义
- BEC商务英语初级考试历年真题及答案6套
- 消除“艾梅乙”医疗歧视-从我做起
评论
0/150
提交评论