(十二)分析第2章—误差和分析数据处理2——上课用2010-201111_第1页
(十二)分析第2章—误差和分析数据处理2——上课用2010-201111_第2页
(十二)分析第2章—误差和分析数据处理2——上课用2010-201111_第3页
(十二)分析第2章—误差和分析数据处理2——上课用2010-201111_第4页
(十二)分析第2章—误差和分析数据处理2——上课用2010-201111_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2 2 2 实验数据的统计处理实验数据的统计处理实验数据的统计处理一、几个基本概念一、几个基本概念:1、 总体标准偏差总体标准偏差 2、样本标准偏差、样本标准偏差:nxnii12112nxxSnii3、平均值的标准偏差(均方误、平均值的标准偏差(均方误,样本标准误)样本标准误)目的:为了评价不同样品的平均精密度(如:取样多与取样少的精密度)。标准差说明观察值个体的离散程度,标准误说明样本均数的离散程度,标准误小,说明样本均数与总体均数比较接近,用样本均数估计总体均数的可靠性大。为了减小标准误,需减小标准差或适当适当增加测定次数。nSSxx平均值的标准偏差与测定次数的平方跟成反比;n次测定平均值

2、的标准偏差是一次测定标准偏差的例: n=4 n=9 测量次数少时, 减小快,但多次测量,减小就不那么明显,过多次测量,并不能更多地提高精密度。 一般46次即可,(一般34次,较高要求59次)n/12/xxSS 3/xxSS xS“报酬递减”例:某样品经4次测定,标准偏差20.5ppm,平均值144ppm,求平均值的标准偏差。 ppmnSSxx2 .1045 .204、数学期望:、数学期望:如果一个随机变量 x 能够取的值是a1,a2 , ar,取p1 , p2 , pr,则把 E(x)=a1p1+a2p2+arpr称为 x 的期望。举例得到x 的期望值的清楚解释:如果对x作大量次数的观察,由于

3、偶然性的影响, x的各次取值呈现纷乱状态,但随着观测次数的增加,其平均取值的波动越来越小,最后稳定道一个值上面,此值即x的期望。二、正态分布二、正态分布正 态 分 布 最 早 由 法 国 数 学 家 德 莫 佛 ( D e Moivre,16671754)年提出,德国数学家高斯(Gauss,17771855)在研究误差理论时曾用它来刻画误差,因此也称高斯(Gauss)分布。(一)正态分布(一)正态分布若随机变量x的概率密度为22221)(xexfyx其中 ,(0)均为常数,则称x服从正态分布(Normal,distribution),记为xN( , 2)。可以证明E(x)= , D(x)= 2

4、故正态分布N( , 2)完全由其数学期望和方差 2完全决定。正态分布的分布函数为它是介于0,1之间且单调递增的连续函数,并有F(u)0.5。dxexFxx22221)(正态分布曲线的特点:正态分布曲线的特点:(1)两头小,中间大(小误差几率大,大误差几率小)(2)曲线是轴对成的(正负误差出现的概率相同)(3)值的大小,反映了测量值的分散情况 大,曲线矮且宽,即标准偏差大,数据分散,精密度差 小,曲线瘦且高,即标准偏差小,数据集中,精密度好 故对于正态分布曲线来讲,两个基本参数为、 集中趋势,无限多次测量的均值 分散趋势,各为总体的标准偏差(4)正态曲线下的总面积等于1,即dxexFx22221

5、)((二)标准正态分布(二)标准正态分布对于正态分布N( , 2),当0 , 1时,称x服从标准正态分布(Standard normal distribution),记为xN( 0 , 1),对标准正态分布,通常用 表示其密度函数,用 表示分布函数,即)(x)(x)(x)(x2221)(xexdxexxx2221)(xx若随机变量x服从一般正态分布,对于给定的 和,只要将x转化为其标准化随机变量U,这样,有关一般正态分布的概率计算问题可转化为标准正态分布问题。(三)标准正态分布的分位数(三)标准正态分布的分位数定义:对于标准正态分布随机变量x和给定的(0 -tS或-tS或1,只有在 f 时,F

6、=121,ffFF 例:两种方法测某样品的某组分 n1 = 6, S1 = 0.055,n2 = 4,S2 = 0.022,两方法精密度有无不同? 解: f1 = 61 = 5,f2 = 41 = 3 95%置信水准, F0.05, 5, 3 = 9.012 . 6022. 0055. 022F F F0.05, 5, 3 故:两方法精密度无显著性差异 例:两人用同一方法测同一试样。 A:n1 = 7, = 92.08 S12 = 0.6505 B:n2 = 9, = 93.08 S22 = 0.6354 问A、B二人分析结果分析结果有无系统误差? 解: F0.05, 6, 8 = 3.58

7、F F0.05, 6, 8 两人精密度无显著差异 1x2x02. 16354. 06505. 02221SSF 合并标准偏差:80. 021121222211nnSnSnS48. 2917180. 008.9308.92t查 = 2.145 t 有显著差异 两人操作存在某种系统误差。14,05. 0t14,05. 0t使用显著性检验的几点注意事项:1、两组数据的显著性检验,检验顺序是先F检验,后进行t检验。只有两组数据的精密度(偶然误差)接近,准确度(系统误差)的检验才有意义。2、注意单侧检验还是双测检验3、置信水平P或显著性水平的选择 平时工作中,若显著度太高,置信度就小,置信区间小,往往会

8、丢掉一些可用的方法或值(以真为假,第一类错误)。 反之,太低,1-就大,置信区间大,又会把一些不能用的方法或值作为有用的(以假为真,第二类错误)。P28 究竟应如何掌握这个尺度呢?分析化学一般把95%置信度为标准,来判断分析方法是否有差别,即为差别检验。 四四. .可疑数据的取舍:可疑数据的取舍: 在实验过程中往往会出现一些数据不太理想,但我们不能按自己的意愿去随意取舍,而要以科学的态度去仔细查找原因,若有明显原因,明显失误,可以舍弃有关数据(如人为因素:称样时掉粒在工作台,滴定时漏滴等) 其他情况若要舍弃,要通过统计检验方法确定是否可以 舍弃,目前用的较多的一种是G检验。 1、G检验 G检验

9、步骤如下: 1. 算出平均值 (包括可疑值) 2. 算出 x可疑 3. 算出 标准偏差S (包括可疑值) 4. 算出 5. 查表Gn, 临界值 若:G Gn, ,可以舍弃可疑值(例17) 注:讲课 t F G 应用 G F txxSxxG可疑2、Q检验:步骤:P36(1)排序 (2)计算舍弃商:;XXXn321,X1XXXXQn紧邻可疑计为最小值为最大值,1XnX(3)选定置信度,查Q:(4)比较:时,应保留时,可以舍弃计计PPQQQQPQPQ例:测定铁的含量,n4,结果为1.61、1.53、1.54、1.83,问结果1.83可以舍弃吗?(设P95)解:不能舍弃,故:查表,83. 1QQ05.

10、 1Q373. 053. 183. 161. 183. 1495. 0495. 0Q4 4 4 相关与回归相关与回归相关与回归 相关与回归是研究变量间关系的统计方法。 一一. .相关:相关: A与C相关,相关程度用相关系数表示 (一)相关系数:(一)相关系数: 两个变量 x、y 进行 n 次测定 (x1,y1),(x2,y2)(xn,yn) r = 1或-1 完全相关 r = 0 数据杂乱无章或曲线 niiniiniiiyyxxyyxxr12121 r 值说明了线形关系的好坏 (二)相关系数检验:(二)相关系数检验: 自由度 = n-2 与前边各差别检验类似 1.计算r 2.查表r,f 表2-8 3.比较 存在一定相关性 相关性不显著 相关系数简化计算:10 rfrr,frr,2222111ynyxnxyxnxyr 二二. .回归:回归: x自变量,y因变量,我们有感受,同一组同学做实验, 不同的同学做图,求出r总有不同(中学方法y/ x)即使 同一人,不同时间做图,求r往往也不完全一致,因此我们 由统计的角度来讨论回归方程。 若由相关系数知x、y线形相关 y* = a + bx y* 估计值 应用最小二乘法:使偏差平方和最小min2*iiyyQ2iibxay Q值反映了各点与直线上相应点y*的偏离情况

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论