误差及分析数据的统计处理_第1页
误差及分析数据的统计处理_第2页
误差及分析数据的统计处理_第3页
误差及分析数据的统计处理_第4页
误差及分析数据的统计处理_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 主要内容主要内容 n提高分析结果准确度的方法提高分析结果准确度的方法 2.1 误差与准确度误差与准确度 xi 对一对一b 物质客观存在量为物质客观存在量为 的分析对象进行分析,得到的分析对象进行分析,得到n个个 测定值测定值 x1、x2、x3、 xn,对,对n 个测定值进行平均,得到个测定值进行平均,得到 测定结果的平均值,那么:测定结果的平均值,那么: 测定的绝对误差为:测定的绝对误差为: i x i xe 测定结果的相对误差为:测定结果的相对误差为: %100 e er 2.1 误差与准确度误差与准确度 %006. 0%100 6381. 1 0001. 0 r e %06. 0%10

2、0 1638. 0 0001. 0 r e 2.2 准确度与精密度准确度与精密度 36.00 36.50 37.00 37.50 38.00 测量点测量点平均值平均值真值真值 d c b a 表观准确度高,精密度低表观准确度高,精密度低 准确度高,精密度高准确度高,精密度高 准确度低,精密度高准确度低,精密度高 准确度低,精密度低准确度低,精密度低 准确度与精密度的关系准确度与精密度的关系 1 1、精密度是保证准确度的前提。、精密度是保证准确度的前提。 2 2、精密度高,不一定准确度就高。、精密度高,不一定准确度就高。 误差与偏差误差与偏差 d 2.3 2.3 系统误差与随机误差系统误差与随机

3、误差 系统误差与随机误差的比较系统误差与随机误差的比较 系统误差的校正系统误差的校正 测量值与随机误差的正态分布测量值与随机误差的正态分布 测量值正态分布测量值正态分布n ( , 2) 的概率密度函数的概率密度函数 1=0.047 2=0.023 x 随机误差的正态分布随机误差的正态分布 测量值的正态分布测量值的正态分布 0 0 x- - 2 2 2 )( 2 1 )( x exfy 总体标准偏差总体标准偏差 相同,相同, 总体平均值总体平均值 不同不同 总体平均值总体平均值 相同,总相同,总 体标准偏差体标准偏差 不同不同 原因:原因: 1、总体不同、总体不同 2、同一总体,存在系统、同一总

4、体,存在系统 误差误差 原因:原因: 同一总体,精密度不同同一总体,精密度不同 测量值和随机误差的正态分布体现了随机误差的概率统计规律测量值和随机误差的正态分布体现了随机误差的概率统计规律 平均值平均值 2 2 2 )( 2 1 x ey x 标准正态分布曲线标准正态分布曲线 n n (0,1)(0,1) 令:令: x u 正态分布函数转换成正态分布函数转换成 标准正态分布函数:标准正态分布函数: 2 /2 ( ) 1 2 u yu e 68.3% 95.5% 99.7% u )1u du ( 随机误差的区间概率随机误差的区间概率 面积 (概率 u u due duu 0 2/ 2 2 1 )

5、 正态分布概率积分表(部分数值)正态分布概率积分表(部分数值) x u 测量值与随机误差的区间概率测量值与随机误差的区间概率 2 /2 0 1 2 u u edu 概率 0.00 0.10 0.20 0.30 0.40 -3-2-10123 u y 例题例题2 (1)解解 5 . 1 10. 0 15. 0 x u 查表查表:u=1.5 时,概率为:时,概率为:2 0.4332 = 0.866 = 86.6 % (2)解)解 5 . 2 10. 0 75. 12 u 查表查表:u 2.5 时,概率为:时,概率为: 0.5 0.4938 = 0.0062 =0.62% 一样品,标准值为一样品,标

6、准值为1.75%,测得,测得 = 0.10, 求结果落在求结果落在 1.750.15% 概率;概率;测量值大于测量值大于2 %的概率。的概率。 86.6% 0.62% p a a p + a = 1 a 显著水平显著水平 p 置信度置信度 有限数据的统计处理有限数据的统计处理 总体总体样本样本 甲甲 样本容量样本容量平均值平均值 500g500g 乙乙 平行测定平行测定 3 3 次次 1 x 平行测定平行测定 4 4 次次 2 x 丙丙平行测定平行测定 4 4 次次 3 x 有限数据的处理:有限数据的处理: ., ., 321 321 xxx xxx 计算计算 x 估计估计 显著性检验显著性检

7、验 没有系统误差,没有系统误差, = t 有系统误差,有系统误差, t 数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示 平均值平均值 average n i i x n x 1 1 中位数中位数 medianm x 有限次测量:测量值向有限次测量:测量值向平均值平均值 集中集中 无限次测量:测量值向无限次测量:测量值向总体平均值总体平均值 集中集中 xn, 数据分散程度的表示数据分散程度的表示 minmax xxr %100 x r xxd ii n xx d n i i 1 100% x d rmd 1 )( 1 2 n xx s n i i 100% x s rsd 总体标准偏差

8、与标准偏差的比较总体标准偏差与标准偏差的比较 n xi 2 ) ( 标准偏差标准偏差 1 )( 2 n xx s i 无限次测量,无限次测量, 对总体平均值的离散对总体平均值的离散 有限次测量有限次测量 对平均值的离散对平均值的离散 自由度自由度 1 nf 计算一组数据分散计算一组数据分散 度的独立偏差数度的独立偏差数 自由度的理解:例如,有三个测量值,求得平均值,也知自由度的理解:例如,有三个测量值,求得平均值,也知 道道x1和和x2与平均值的差值,那么,与平均值的差值,那么,x3与平均值的差值就是与平均值的差值就是 确定的了,不是一个独立的变数。确定的了,不是一个独立的变数。 平均值的标准

9、偏差平均值的标准偏差 设有一样品,设有一样品,m 个分析工作者对其进行分析,每人测个分析工作者对其进行分析,每人测 n 次,计次,计 算出各自的平均值,这些平均值的分布也是符合正态分布的。算出各自的平均值,这些平均值的分布也是符合正态分布的。 试样总体试样总体 样本样本1 样本样本2 样本样本m mmnmmm n n xxxxx xxxxx xxxxx ,., . ,., ,., 321 22232221 11131211 xxxxx m ., 321 n x n s sx 1=0.047 2=0.023 x 0 x- 随机误差随机误差 测量值测量值 u 随机误差随机误差 t t 分布曲线分布

10、曲线 无限次测量,得到无限次测量,得到 x u 有限次测量,得到有限次测量,得到 x s s n s x s x t x t t 分布曲线分布曲线 0.00 0.10 0.20 0.30 0.40 -3-2-10123 u y u u 分布曲线分布曲线 ,f ,f t 分布值表分布值表 p = 1 - , 置信度置信度 , 显著水平显著水平 6次测量,随机误差落次测量,随机误差落 在在2.57 范围内范围内 的概率为的概率为95%。 x s 无限次测量,随机误无限次测量,随机误 差落在差落在1.96 范围内范围内 的概率为的概率为95%。 置信区间置信区间 有限次测量有限次测量 服从自由度服从

11、自由度 f 的的 t 分布分布 fafa ttt , ,时时1p fafa tn s x t , , t 代入,得代入,得 改写为改写为 n s tx n s tx fafa, , 置信度为(置信度为(1- ) 100%的的 的置信区间为的置信区间为 ),( , n s tx n s tx fafa, n s tx fa, ,f ,f n s x t 区间概率与置信区间区间概率与置信区间 查表查表 % 0 . 95p 若用单次测量值来估计若用单次测量值来估计 的区间:的区间:96. 1 x u 这是一个在一定置信度下总体平均值的这是一个在一定置信度下总体平均值的的问题,的问题, 是说在是说在

12、区间区间有有95%的可能的可能 包含包含 。96. 1x n x 则则 n uxux x 96. 1u 这是一个这是一个的问题,是说测量值落在的问题,是说测量值落在 范围内的概率为范围内的概率为95%。 即即96. 1x u 实际分析工作中通常是以样本平均值估计总体平均值实际分析工作中通常是以样本平均值估计总体平均值 是说是说在在 区间有区间有95%的可能包含的可能包含 x xu 96. 1u u总体标准偏差未知时,总体标准偏差未知时, x s xtsxt n 例题例题3 3 解(解(1 1) 分析结果分析结果 %13. 0%,34.37, 5sxn 解(解(1) %34.37% 5 25.3

13、730.3750.3720.3745.37 x %30.37 m x %30. 0%20.37%50.37r %11. 0)%09. 016. 004. 014. 011. 0( 5 1 11 xx n d n d ii 续解(续解(1) %35. 0%100 34.37 13. 0 %100 x s cv %06. 0%058. 0 5 %13. 0 n s sx 分析结果:分析结果: %13. 0%,34.37, 5sxn %13. 0 15 )09. 0()16. 0()04. 0()14. 0()11. 0( 1 ) 1 22222 22 n xx n d s ii ( 解(解(2 2

14、) 求置信度分别为求置信度分别为95%95%和和99%99%的置信区间。的置信区间。 置信度为置信度为95%95%,即,即1- = 0.95, = 0.05,t 0.05, 4 = 2.78 的的95%95%置信区间:置信区间: ),( ),( , %50.37%18.37 5 %13.0 78.2%34.37 5 %13.0 78.2%34.37 ),( , n s tx n s tx fafa %13.0%,34.37, 5sxn(1 1)的结果)的结果 置信度为置信度为99%99%,即,即1- = 0.99, = 0.01,t 0.01,4= 4.60 的的99%99%置信区间置信区间

15、),( ( , %61.37%07.37 ), , n s tx n s tx fafa 结论结论 ,f ,f 平均值与标准值的比较平均值与标准值的比较 t t 检验法检验法假设不存在系统误差,那么假设不存在系统误差,那么t 是由随机误差引起的,测量误差应满足是由随机误差引起的,测量误差应满足t t 分布,分布,0tx x sxt/ nstx, 根据根据 计算出的计算出的t t 值应落在指定值应落在指定 的概率区间里。否则,假的概率区间里。否则,假 设不满足,表明存在着显设不满足,表明存在着显 著性差异。著性差异。 t t 检验法的方法检验法的方法 nstx, 2 2、给出显著性水平或置信度、

16、给出显著性水平或置信度 3 3、将计算出的、将计算出的t t 值与表上查得值与表上查得 的的t t 值进行比较,若值进行比较,若 表计 tt 习惯上说习惯上说 表明有系统误差存在。表明有系统误差存在。 表计 tt 表示表示 落在落在 为中心为中心 的某一指定概率之外。在一的某一指定概率之外。在一 次测定中,这样的几率是极次测定中,这样的几率是极 小的,故认为是不可能的,小的,故认为是不可能的, 拒绝接受。拒绝接受。 x 例题例题4 4 某化验室测定某化验室测定cao的质量分数为的质量分数为30.43%的某样品中的某样品中cao的含的含 量,得如下结果:量,得如下结果: %05. 0%,51.3

17、0, 6sxn 问此测定有无系统误差?问此测定有无系统误差?( (给定给定 = 0.05) 解解 9 . 3 605. 0 43.3051.30 ns x s x t x 计算 57. 2 5 ,05. 0 tt fa, 比较:比较: 表计算 tt 说明说明 和和t t 有显著差异,此有显著差异,此 测定有系统误差。测定有系统误差。 假设:假设: = t = t 异常值的检验异常值的检验 outlier rejection 异常值的检验方法:异常值的检验方法: 1. q 检验法检验法 dixons q-test (1)将测量的数据按大小顺序排列。)将测量的数据按大小顺序排列。 n xxxx.,

18、 321 (2)计算测定值的极差)计算测定值的极差r 。 (3)计算可疑值与相邻值之差(应取绝对值)计算可疑值与相邻值之差(应取绝对值)d。 (4)计算)计算q值:值: r d q 计算(5)比较:)比较: 表计算 qq舍弃。舍弃。 舍弃商舍弃商q值值 2、 d4 法法 (1)将可疑值除外,求其余数据的平均值和平均偏差)将可疑值除外,求其余数据的平均值和平均偏差 ; 1n x (2)求可疑值)求可疑值x与平均值与平均值 之间的差的绝对值之间的差的绝对值 1n x1 n xx (3)判断)判断 11 4 nn dxx 舍弃。舍弃。 统计学方法证明,当测定次数非常多(例如大于统计学方法证明,当测定

19、次数非常多(例如大于20时,总体时,总体 标准偏差与总体平均偏差标准偏差与总体平均偏差 有下列关系有下列关系 = 0.7979 0.80 4 3 ,偏差超过,偏差超过4 的测量值可以舍弃。的测量值可以舍弃。 1n d 测定碱灰总碱量(测定碱灰总碱量(%na2o)得到得到6个数据,按其大小顺序排列为个数据,按其大小顺序排列为 40.02,40.12,40.16,40.18,40.18,40.20。第一个数据可疑,。第一个数据可疑, 判断是否应舍弃?(置性度为判断是否应舍弃?(置性度为90%)。)。 解解 56. 0 02.4020.40 02.4012.40 计算 q 查表查表 n = 6 ,

20、q表 表 = 0.56 舍弃 舍弃 例题例题5: 2. d4 法法 3、格鲁布斯(格鲁布斯(grubbs)法法 3、格鲁布斯、格鲁布斯grubbs)法法 (1)将测量的数据按大小顺序排列。)将测量的数据按大小顺序排列。 (2)设第一个数据可疑,计算)设第一个数据可疑,计算 s xx t 1 计算 或或 设第设第n 个数据可疑,计算个数据可疑,计算 s xx t n 计算 (3)查表:)查表: t计算 计算 t表表, , 舍弃。舍弃。 n xxxx., 321 t t 分布曲线分布曲线 1用一种测定用一种测定ddt的方法分析未喷洒过杀虫剂的方法分析未喷洒过杀虫剂(ddt)的植物叶子试的植物叶子试

21、 样样, 测得测得ddt的含量(的含量( g/g)为)为0.2, 0.4, 0.8, 0.5, 0.2;今有一植物叶;今有一植物叶 子试样子试样, 测得测得ddt的含量(的含量( g/g)为)为0.4, 0.5, 0.8, 1.0, 0.5, 该植物是否该植物是否 喷洒过喷洒过ddt? (显著水平为显著水平为0.05, t (0.05, 8) = 2.31, t(0.10, 8) = 1.86,双边,双边t - 表表) 单边检验单边检验 例子例子 000 0.42, 0.25, 5 0.64, 0.25, 5 xsn xsn 00 0 () ()1.39 () p xxn n t snn 0.05,10cal tt 两组平均值的比较的方法两组平均值的比较的方法 1、f 检验法检验两组实验数据的精密度检验法检验两组实验数据的精密度s1和和s2之间有无之间有无 显著差异:显著差异: 2 2 小 大 计算 s s f查表查表 表计算 ff 精密度无显著差异。精密度无显著差异。 2、t 检验确定两组平均值之间有无显著性差异检验确定两组平均值之间有无显著性差异 2 ) 1() 1( 21 2 22 2 11 21 21 21 nn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论