第3章误差及分析数据的处理_第1页
第3章误差及分析数据的处理_第2页
第3章误差及分析数据的处理_第3页
第3章误差及分析数据的处理_第4页
第3章误差及分析数据的处理_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

随机误差的正态分布第三章误差和分析数据的处理随机误差的正态分布一、频率分布

若对一样品的含量进行多次测定,因偶然误差的影响,测定值将不完全相同(见P49表)。其中,xmax=1.74%,xmin=1.49%,故R=0.25%。将所有数据由小到大排列后分为9组,则每组宽度为0.25%/9=0.03%。分组时为避免“骑墙”现象,每组界线的取值应较测定值多取一位小数。如第一组的取值本该为(1.49~1.52)%,可细调为(1.485~1.515)%。分组后的结果见P49表。2023/9/11在P49表中,频数指相应该组内测定值的数目;频率指每组内的频数占总测定次数的分数。【如第一组:频数=2频率=2/90=0.022=2.2%每一百次测定中,有2.2次结果落在此区间内。以测定值x为横坐标,测定频率为纵坐标作图,可得频率分布直方图(见P49图3-3)。由图看:测定结果偏小或偏大出现的频率(概率)均较小,而测定平均值(1.62%)附近出现的频率(概率)则较大。频率测定值1.4851.5451.6051.6651.7251.5151.5751.6351.6951.62随机误差的正态分布第三章误差和分析数据的处理2023/9/11若测定次数为无限多,组距无限小时,直方图的上沿将出现连续变化而成峰状——此曲线称为正态分布曲线,相应的函数关系可用高斯方程表示:二、正态分布y=———·eσ2π1(x-μ)2-———2σ2y——测定值出现的概率密度;x——测定值;μ——总体平均值(μ=T);σ——总体标准偏差,在曲线上为拐点的横坐标至μ的距离。yxσμ随机误差的正态分布第三章误差和分析数据的处理2023/9/11随机误差的正态分布第三章误差和分析数据的处理按高斯方程,曲线的具体形状和位置由μ、σ二参数决定决定位置决定宽度(形状)

(见P51图3-4)故不同的正态分布曲线可用函数N(μ、σ2)表示。显然,σ越大→曲线的宽度则越大→测量结果越分散→精密度越差。反之则越好。【若转换横坐标:令x’=x-μ=绝对随机误差值,用x’对y作图,得到的曲线形状完全相同——随机误差也服从正态分布,仅横坐标不同而已。yxσ0μμ-σμ+σx’σ-σ2023/9/11随机误差的正态分布第三章误差和分析数据的处理由此可知随机误差具有三个重要特性:

对称性——正、负误差出现的概率相同;

单峰性——误差小的测量占多数;

有界性——最大随机误差的绝对值不超过3σ。三、标准正态分布在高斯方程中,若令u=(x-μ)/σ,可将正态分布曲线中的二变量合并为一个变量u(标准正态变量),相应的高斯方程经微分转化后为:y=——·e2π1u2-—2对应的曲线称为“标准正态分布曲线”。2023/9/11标准正态分布曲线的特点:在曲线对应的关系式中,只有一个自变量u——故不管原始正态分布曲线形状如何,转化后的标准正态分布曲线是一样的(峰值位置由

μ变为0,拐点横坐标至μ的距离由σ变为1),即标准正态分布曲线可用函数N(0,1)

表示,从而使问题的处理更简化。yxσ0μμ-σμ+σx’σ-σ0u1-1四、随机误差的区间概率区间概率:某一测量范围(区间)所出现的几率,用“P”表示。第三章误差和分析数据的处理随机误差的正态分布2023/9/11显然,横坐标u1~u2对应的区间概率P,就是与之对应的标准正态分布曲线所包围的面积。yuu1u2P按数学关系0P=∫y·du=∫duu2u1——e2π1u2-—2u1u2此处u的取值范围为(-∞、+∞),相应的积分值可查表(见P54表3-1)。【注意1:表3-1只列出了(0→+∞)的区间概率,即“单边积分值”。另一半的积分值按对称性原则应与之相同,由此即可确定任意区域的区间概率

P。第三章误差和分析数据的处理随机误差的正态分布2023/9/11具体步骤为:⑴确定测量区间的上、下限x2和x1;⑵由x2和x1,按关系u=(x-μ)/σ算出标准正态变量的区间

u2和u1;⑶将积分变形:【注意2:表3-1列出的是标准正态变量u对应的区间概率,并非测量值x对应的区间概率。实际应用中,需将x值转化为u值,再查表即可。P=∫y·du

u2u1=∫y·du+∫y·du

0u1u20=∫y·du+∫y·du

u10u20对称原则通过查表,即可算出对应的区间概率P。第三章误差和分析数据的处理随机误差的正态分布2023/9/11【例1:在消除了系统误差的情况下,经过三十多次测定,某铁矿石中铁的含量为46.87%。若测定时σ=0.04%,问测定值落在(46.80~46.90)%区间内的概率是多少?解:测量区间的上限x2=46.90%,下限x1=46.80%;则u2=(x2-μ)/σ=(46.90-46.87)%/0.04%=0.75

u1=(x1-μ)/σ=(46.80-46.87)%/0.04%=-0.75

故P=∫y·du

0.75-1.75=∫y·du+∫y·du

0-1.750.750=∫y·du+1.750∫y·du

0.750=0.4598+0.2730=0.7328=73.28%第三章误差和分析数据的处理随机误差的正态分布2023/9/11【例2:计算±3σ范围内的测定结果出现的概率。解:确定测量区间的上、下限上限x2=μ+3σ;下限x1=μ-3σ。则u2=(x2-μ)/σ=3;

u1=(x1-μ)/σ=-3。故P=∫y·du

3-3=∫y·du+∫y·du

0-330=∫y·du+30∫y·du

30=2×0.4987=0.9974=99.74%=2∫y·du

30第三章误差和分析数据的处理随机误差的正态分布2023/9/11【例3(P54例3-4):对烧结矿试样进行150次全铁含量分析,已知测定结果符合正态分布(0.4695,0.00202)。求大于0.4735的测定值可能出现的次数。解:由题给条件知

μ=0.4695,σ=0.0020。确定测量区间:上限x2=∞,下限x1=0.4735;则u2=(x2-μ)/σ=∞;

u1=(x1-μ)/σ=(0.4735-0.4695)/0.0020=2故P=∫y·du

∞2=∫y·du

-∫y·du

∞020=0.5000-0.4773=0.0227故可能出现的次数150×0.0227=3.405≈3(次)第三章误差和分析数据的处理随机误差的正态分布2023/9/11P=∫y·du

u-u=2∫y·du=0.99u0故

∫y·du=0.99/2=0.495u0查表,知u=2.58按u=(x-μ)/σ

x-μ=绝对随机误差值=±u·σ

=±2.58σ即测定的随机误差值不能超过σ的2.58倍。【例4(P54):若要保证某一测定值出现的概率为0.99,则测定的随机误差界限为多少?解:由题意知P=0.99,设随机误差界限对应的标准正态变量为u,则由此可确定误差界限【练习:P73第17、18、19题。第三章误差和分析数据的处理随机误差的正态分布2023/9/11置信度与μ的置信区间一、基本概念

置信度:又称为可靠度,测量时通常用区间概率的百分数反映。例如P=0.95,表示其置信度为95%。μ的置信区间:按一定的置信度估计出μ可能存在的量值范围。此范围越小,估计的精密度也越高,估计越有价值。如:若置信度为P=0.90,μ的置信区间为(0.56~0.58)g。表明在(0.56~0.58)g范围内包含真值μ的概率为90%。【注意:此处不能说真值μ有90%的概率落在(0.56~0.58)g范围内!理由很简单:被测物的μ是确定且客观存在的,它没有随机性。第三章误差和分析数据的处理置信度与μ的置信区间2023/9/11二、置信区间的确定方法根据测定情况有两种不同的确定方法。1.测定次数为无限多时按u=(x-μ)/σ,真值μ的置信区间可表示为:μ=x±u·σ………

①式中的“±”考虑了u值的正负性(区间围绕μ的对称性),由此式可知:置信区间的大小除与σ有关外,还与u有关→而u的大小则取决于置信度——区间概率P:

当P=0.90时,P/2=0.45,查得u0.45=1.64,μ=x±1.64σ;当P=0.95时,P/2=0.475,查得u0.475=1.96,μ=x±1.96σ;当P=1.00时,P/2=0.50,查得u0.50=∞,μ=x±∞·σ。第三章误差和分析数据的处理置信度与μ的置信区间2023/9/11μ=x±u·σx=x±u·——………②σn由计算结果可知,置信度越大,相应的置信区间也越大;但过大的区间也无实际意义,分析化学一般取P=0.90或0.95。在此条件下,置信区间越小→测定的精密度越高→测量值x越接近于真值μ。此时,用x代替μ,其准确性也越高。按①式,当置信度一定时,置信区间将由参数x和σ所决定——x决定区间的位置(准确度),σ决定置信区间的大小(精密度)。若用x代替x,σx代替σ

,将提高置信区间的分析价值,使测定值更加接近于真实值。故置信区间常用下式表示第三章误差和分析数据的处理置信度与μ的置信区间式中的n为测量次数。显然,n越大,置信区间就越小。2023/9/11第三章误差和分析数据的处理【例5(P56例3-5):平行测定钢样中磷的质量分数30次,其平均值为0.087%。设系统误差已消除,且σ=0.003%。求钢样中磷含量的置信区间(P=0.95)。解:当P=0.95时,P/2=0.475,对应的u查表为1.96;故μ=x±u·——σn=

0.087%±1.96×————0.003%30=

0.087%±0.001%

可见,经过30次测定,区间(0.086%~0.088%)包含钢样中磷的真实含量的概率为0.95(即95%)。置信度与μ的置信区间2023/9/112.测定次数有限时此时对应的统计参数并非μ和σ,而是x

和s;相应的误差分布为非正态分布,也难以由u=(x-μ)/σ计算标准正态变量。为此,人们用另一种分布——t分布代替正态分布,用相应的变量t代替标准正态变量u。

t分布曲线见P37图3-6,曲线形状与自由度f有关→与测量次数n有关:n越大→

f越大→曲线越接近于正态分布。当n→∞时,t分布曲线与正态分布曲线完全重合。同样,变量t也与u不同——其值不仅与概率P有关,还与f(即n)有关,故常用“tP,f”表示。

不同置信度和自由度对应的tP,f

值可查表,常见值见P57表3-3。第三章误差和分析数据的处理置信度与μ的置信区间2023/9/11第三章误差和分析数据的处理有了变量tP,f以后,将u用tP,f代替,σ用s代替,可将μ的置信区间表示为:μ=x±tP,f·sx=x±tP,f·——………③sn【例6(P58例3-6):标定HCl溶液浓度,3次标定的结果为0.2001mol.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论