




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章误差和分析数据的处理
第一节误差及其产生的原因
一、系统误差:
由比较固定的原因引起的误差
来源:1.方法误差:方法本身造成的
2.仪器误差:仪器本身的局限
3.试剂误差:试剂不纯
4.操作误差:操作不正确
5.主观误差:操作习惯,辨别颜色读刻度的差别
特点:重复性,单向性,可测性
二、随机误差:
随机偶然,难以控制,不可避免
来源:偶然性因素特点:原因、方向、大小、正负不定,不可测过失:由粗心大意引起,可以避免重做!第二节测定值的准确度与精密度
一、准确度与误差1.准确度:指测量结果与真值的接近程度2.误差(1)绝对误差:测量值与真实值之差(2)相对误差:绝对误差占真实值的百分比相对误差更能体现误差的大小,Ea相同的数据,Er可能不同
例:滴定的体积误差VEaEr20.00mL0.02mL0.1%2.00mL0.02mL1%称量误差mEaEr0.2000g0.2mg0.1%0.0200g0.2mg1%滴定剂体积应为20~30mL称样质量应大于0.2g二、精密度与偏差1精密度:表示一组平行测定结果相互接近的程度
2偏差:测量值与平均值之差,表征测定结果的精密度
(1)绝对偏差:单次测量值与平均值之差(2)平均偏差:各测量值绝对偏差的算术平均值
(3)相对平均偏差:平均偏差占平均值的百分比(4)标准偏差:
当n→∞,s→
-总体标准偏差2-方差
-总体平均值
(5)相对标准偏差(变异系数)(6)平均值的标准偏差
(7)极差
(对于有限次数的测定)
平均值的标准偏差设有一样品,m
个分析工作者对其进行分析,每人测n
次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。试样总体样本1样本2……样本m平均值的总体标准偏差对有限次测量对有限次测量:1、增加测量次数可以提高精密度。2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。结论:测量次数例:A、B、C、D四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。36.0036.5037.0037.5038.00测量点平均值真值DCBA表观准确度高,精密度低准确度高,精密度高准确度低,精密度高准确度低,精密度低(不可靠)三准确度与精密度的关系1.准确度高,要求精密度一定高但精密度好,准确度不一定高2.准确度反映了测量结果的正确性精密度反映了测量结果的重现性
准确度与精密度的关系
[例]用丁二酮肟重量法测铜铁矿中的Ni的质量分数,如表n=5求:单次分析结果的平均偏差,相对平均偏差,标准偏差,相对标准偏差.
10.48%0.05%2.5×10-710.37%0.06%3.6×10-7
10.47%0.04%1.6×10-710.43%0.00%010.40%0.03%0.9×10-7_x=10.43%∑|di|=0.18%∑di2=8.6×10-7
[解]
标准偏差更能体现较大偏差的分散程度,突出大偏差对结果的影响。第三节随机误差的正态分布一、频率分布总体:考察对象的全体。样本:从总体中随机抽取的一组测量值。样本容量:样本所含的测量值的数目(n)。频数:统计测定值落在每组内的个数。频率:相对频数,频数与样本容量之比。测定值xi频率分布直方图频率频数分布表
1.485-1.51520.0221.515-1.54560.0671.545-1.57560.0671.575-1.605170.1891.605-1.635220.244
1.635-1.665200.2221.665-1.695100.1111.695-1.72560.0671.725-1.75510.011
∑
901.000
规律:测量数据既分散又集中频率分布No分组频数(ni)频率(ni/n)频率密度(ni/ns)115.8410.0050.17215.8710.0050.17315.9030.0150.51415.9380.0401.35515.96180.0913.03615.99340.1725.72716.02550.2789.26816.06400.2026.73916.09200.1013.371016.12110.0561.851116.1550.0250.841216.1820.0100.341316.2100.0000.00厦门大学的学生对海水中的卤素进行测定,得到74.24%88.38%数据集中与分散的趋势二、正态分布特点:极大值在x=μ处.拐点在x=μ±σ处.于x=μ对称.4.x轴为渐近线.
y:概率密度
x:测量值
μ:总体平均值x-μ:随机误差
σ:总体标准偏差随机误差的特点和规律1)对称性正、负误差出现的概率相等;2)单峰性小误差出现的概率大,大误差出现的概率小,特大误差概率极小;3)有界性测定值总是限制在以µ为中心的一定范围之内,并具有向µ集中的趋势。平均值三、标准正态分布因为x-μ=σu
,dx=σ
du所以68.3%95.5%99.7%u
-3s
-2s-s0s2s3s
x-m
m-3s
m-2s
m-s
m
m+s
m+2s
m+3s
x
y标准正态分布曲线N(0,1)四、随机误差的区间概率从-∞~+∞,所有测量值出现的总概率P为1,即偶然误差的区间概率P——用一定区间的积分面积表示该范围内测量值出现的概率正态分布正态分布概率积分表(|u|=|x-μ|/σ)0.00.00001.00.34132.00.47730.10.03981.10.3643
2.10.48210.20.07931.20.3849
2.20.48610.30.11791.30.40322.30.48930.40.15541.40.41922.40.49180.50.19151.50.43322.50.49380.60.22581.60.44522.60.49530.70.25801.70.45542.70.49650.80.28811.80.46412.80.49740.90.31591.90.47133.00.4987随机误差u出现的区间(以σ为单位)测量值出现的区间概率pU=±1x=μ±
1σ68.3%U=±1.96x=μ±
1.96σ95.0%U=±2x=μ±
2σ95.5%U=±2.58x=μ±
2.58σ99.0%U=±3x=μ±
3σ99.7%随机误差的区间概率
由此可见,随机误差超过±3的测量值出现的概率是很小的,仅占0.3%。因而,在实际工作中,如果多次重复测量中的个别数据的误差的绝对值大于3,则可以舍去。[例]已知某试样中Co%的标准值为μ=1.75%,σ=0.10%,若无系统误差存在,试求:分析结果落在[1.75±0.15]%范围内的概率.
[解]
|X-μ||X-1.75%|0.15%
|u|=———=————=———=1.5σ0.10%0.10%查表得概率为2×0.4332=86.6%(双边)[例]上例求分析结果大于2.00%的概率?(大于2.00%属于单边检验问题)
[解]
|x-μ||2.00%-1.75%|0.25%
|u|=———=——————=———=2.5σ0.10%0.10%查表得概率为0.4938,整个正态分布曲线右侧的概率为1/2,即0.5000.故这部分以外的概率为0.5000-0.4938=0.62%
即分析结果大于2.00%的概率仅为0.62%第四节有限测定数据的统计处理一、置信度与的置信区间对一样品分析,报告出:估计问题:在
的某个范围
内包含的概率有多大?无限次测量对有限次测量1、概率2、区间界限,多大区间置信水平置信度置信区间置信界限必然的联系这个问题涉及两个方面:总体平均值的置信区间概率区间大小例:
包含在
区间
几率相对大几率相对小几率为100%无意义置信区间的确定σ已知时:(1)由单次测量结果估计μ的置信区间(2)由多次测量的样本平均值估计μ的置信区间σ未知时:t分布曲线
有限次测量得到的x带有一定的不准确性,由于σ不知道,只能用S代替σ,必然引起正态分布的偏离,所以用t代替u,应考虑n加以补偿,即t分布。由少量测定结果均值估计μ的置信区间
1)与u分布不同的是,曲线形状随f而变化
2)n→∞时,t分布=u分布
3)f:自由度f=(n-1)
4)t随P和f而变化,当f=20
时,t≈u
5)
tP,f的下角标表示:置信度P,自由度f=(n-1)时的t值例如:写作为t0.95,6=tP,ft分布曲线
6)P:置信度,测量值落在(μ+uσ)或(μ+ts)范围内的概率
7)显著性水平α:落在此范围之外的概率t分布值表
tα
(f)f显著水平α0.50*0.10*0.050.0111.006.3112.7163.6620.822.924.309.9330.772.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.36200.691.732.092.85∞0.671.641.962.58理论上,只有当f=∞时,各置信度对应的t值才与相应的u值一致。但从t表可以看出:当f=20时,t
值与u值已充分接近了。进一步说明,n在4~6之间即可。正态分布与t分布区别
1.正态分布——描述无限次测量数据
t分布——描述有限次测量数据
2.正态分布——横坐标为u,t分布——横坐标为t3.两者所包含面积均是一定范围内测量值出现的概率P
正态分布:P随u变化;u一定,P一定
t分布:P随t和f变化;t一定,概率P与f有关,比较总体标准偏差已知与未知情况下的总体平均值的置信区间置信度为95%,t0.05,4=2.78未知置信度为95%,u0.05=1.96已知置信度越高,置信区间越大,估计区间包含真值的可能性↑置信区间——反映估计的精密度置信度——说明估计的把握程度如何理解解:
_[例]某学生测Cu%x=35.21%,S=0.06%,n=4求P=0.95;0.99时平均值的置信区间
[解]查t值表P=0.95f=3t=3.18
P=0.99f=3t=5.84
同理:μ=(35.21+0.18)%
(1)P变大,置信区间变宽,包括真值的可能性大
(2)分析中常定置信度为95%或90%
(3)对平均值置信区间的解释:在35.21+0.1区间包括μ的把握为95%
(4)当n很大,S→σ时,可用公式
(5)通常分析要求测量次数为n=4-6用u值表或t例:对某未知试样中Cl-的百分含量进行测定,4次结果为47.64%,47.69%,47.52%,47.55%,计算置信度为90%,95%和99%时的总体均值μ的置信区间解:二、可疑测定值的取舍
1.Q检验法
(1)将测量的数据按大小顺序排列。(2)计算测定值的极差R
。(3)计算可疑值与相邻值之差(应取绝对值)d。(4)计算Q值:(5)比较:舍弃,否则保留。舍弃商Q值测定次数n345678910Q0.900.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.492、格鲁布斯法(1)将测量的数据按大小顺序排列。(2)设第一个数据可疑,计算或设第n个数据可疑,计算(3)查表:G计算>G表,舍弃。例测定某溶液浓度(mol·L-1),得结果:
0.1014,0.1012,0.1016,0.1025,
问:0.1025是否应弃去?(置信度为90%)0.1025应该保留.x=0.1015~三、显著性检验显著性检验显著性差异非显著性差异系统误差校正随机误差正常显著性检验
分析中经常遇到的两种情况:
_
x
与μ不一致,准确度判断;
__
x
1与x
2不一致,精密度判断检验同一样品在不同实验室;检验同一样品用两种方法1.平均值与标准值的比较t检验法的方法1、根据算出t值;2、给出显著性水平或置信度3、将计算出的t值与表上查得的t值进行比较,若
表明有系统误差存在。t检验法
对结果准确度的检验,对系统误差的检验例题某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:问此测定有无系统误差?(给定=0.05)解查表比较:说明和T有显著差异,此测定有系统误差。假设:
=T2、两组平均值的比较两个实验室对同一标样进行分析,得到:和假设不存在系统误差,那么:是由于随机误差引起的,应满足自由度
f=(n1+n2–2)的t
分布,两组平均值的比较的方法1、F检验法检验两组实验数据的精密度S1和S2之间有无显著差异:P一定时查表2、t
检验确定两组平均值之间有无显著性差异3、查表4、判断置信度为95%时F值(单边)2345678910∞f大:大方差数据自由度f小:大方差数据自由度
显著性检验注意事项1.单侧和双侧检验
1)单侧检验
→检验某结果的精密度是否大于或小于某值
[F检验常用]2)双侧检验
→检验两结果是否存在显著性差异
[t检验常用]2.置信水平的选择
置信水平过高——以假为真置信水平过低——以真为假[例]当置信度为95%时,下列两组数据是否存在显著性差异?
A:0.09896;0.09891;0.09901;0.09896
n=4
B:0.09911;0.09896;0.09886;0.09901;
0.09906
n=5[解]属两平均值的比较,先用F检验精密度,证明无差异之后,再用t检验系统误差。
_
(2)XB=0.09900SB2=92.5×10-10
S大2
SB292.5×10-10
(3)F计=——=——=—————
=5.54
S小2SA216.7×10-10
(4)查表F=9.12因F计<F表
故SA与SB精密度无显著性差异
(6)查t0.05,7=2.36t计<t表
故两组数据无显著性差异第五节有效数字及其运算规则
有效数字——实际能测得的数据,其最后一位是可疑的。例:滴定管读数28.56mL分析天平读数0.2080g最后一位为估计值一、有效数字的意义和位数数字前的0不计,数字后的计入:0.02450(4位)“0”的双重意义:
(1)普通数字使用是有效数字:20.30mL
(2)作为定位不是有效数字:0.02030四位2.数字后的0含义不清楚时,最好用指数形式表示:1000(1.0×103
,1.00×103,1.000×103)3.结果首位为8和9时,有效数字可以多计一位例:90.0%,可示为四位有效数字4.pH,pM,pK,lgC,lgK等对数值,其有效数字的位数取决于小数部分(尾数)数字的位数,整数部分只代表该数的方次例:pH=11.20→[H+]=6.3×10-12[mol/L]两位5.自然数可看成具有无限多位数(如倍数关系、分数关系);常数亦可看成具有无限多位数,如6.改变单位不改变有效数字的位数:0.0250g→25.0mg→2.50×104μg1.0008;0.010001;4.5371×105为五位
20.00,0.02000为四位
0.002;2×10-3
为一位
3.6×103为二位二、数字修约规则
四舍六入五成双1.当尾数修约数为5时,前数为偶则舍,为奇则进一成双;若5后有不为0的数,则视为大于5,应进.如:修成四位10.2350→10.2418.0851→18.09修约一次完成,不能分步:8.549→8.5【8.549→8.55→8.6是错的】例如,要修约为四位有效数字时:
尾数≤4时舍,0.52664-------0.5266
尾数≥6时入,0.36266-------0.3627
尾数=5时,若后面数为0,舍5成双:10.2350----10.24,250.650----250.6
若5后面还有不是0的任何数皆入:18.0850001----18.09三、有效数字的运算规则1.加减法:以小数点后位数最少的数为准(即以绝对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论