(十二)分析第2章-误差和分析数据处理2-上课用2010-201111_第1页
(十二)分析第2章-误差和分析数据处理2-上课用2010-201111_第2页
(十二)分析第2章-误差和分析数据处理2-上课用2010-201111_第3页
(十二)分析第2章-误差和分析数据处理2-上课用2010-201111_第4页
(十二)分析第2章-误差和分析数据处理2-上课用2010-201111_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§2实验数据的统计处理一、几个基本概念:1、总体标准偏差2、样本标准偏差:3、平均值的标准偏差(均方误,样本标准误)目的:为了评价不同样品的平均精密度(如:取样多与取样少的精密度)。标准差说明观察值个体的离散程度,标准误说明样本均数的离散程度,标准误小,说明样本均数与总体均数比较接近,用样本均数估计总体均数的可靠性大。为了减小标准误,需减小标准差或适当增加测定次数。平均值的标准偏差与测定次数的平方跟成反比;n次测定平均值的标准偏差是一次测定标准偏差的例:

n=4

n=9

测量次数少时,减小快,但多次测量,减小就不那么明显,∴过多次测量,并不能更多地提高精密度。一般4~6次即可,(一般3~4次,较高要求5~9次)“报酬递减”例:某样品经4次测定,标准偏差20.5ppm,平均值144ppm,求平均值的标准偏差。

4、数学期望:如果一个随机变量x能够取的值是a1,a2,…

ar,取p1,

p2,…pr,则把

E(x)=a1p1+a2p2+…+arpr称为x的期望。举例得到x的期望值的清楚解释:如果对x作大量次数的观察,由于偶然性的影响,x的各次取值呈现纷乱状态,但随着观测次数的增加,其平均取值的波动越来越小,最后稳定道一个值上面,此值即x的期望。二、正态分布正态分布最早由法国数学家德莫佛(DeMoivre,1667~1754)年提出,德国数学家高斯(Gauss,1777~1855)在研究误差理论时曾用它来刻画误差,因此也称高斯(Gauss)分布。(一)正态分布若随机变量x的概率密度为其中μ,σ(>0)均为常数,则称x服从正态分布(Normal,distribution),记为x~N(μ,

σ

2)。可以证明E(x)=μ,D(x)=σ

2故正态分布N(μ,

σ

2)完全由其数学期望和方差

σ

2完全决定。正态分布的分布函数为它是介于[0,1]之间且单调递增的连续函数,并有F(u)=0.5。正态分布曲线的特点:(1)两头小,中间大(小误差几率大,大误差几率小)(2)曲线是轴对成的(正负误差出现的概率相同)(3)σ值的大小,反映了测量值的分散情况

σ大,曲线矮且宽,即标准偏差大,数据分散,精密度差

σ小,曲线瘦且高,即标准偏差小,数据集中,精密度好

故对于正态分布曲线来讲,两个基本参数为μ、σμ——集中趋势,无限多次测量的均值

σ——分散趋势,各为总体的标准偏差(4)正态曲线下的总面积等于1,即(二)标准正态分布对于正态分布N(μ,

σ

2),当μ=0,

σ=1时,称x服从标准正态分布(Standardnormaldistribution),记为x~N(0,1),对标准正态分布,通常用表示其密度函数,用表示分布函数,即若随机变量x服从一般正态分布,对于给定的μ和σ,只要将x转化为其标准化随机变量U,这样,有关一般正态分布的概率计算问题可转化为标准正态分布问题。(三)标准正态分布的分位数定义:对于标准正态分布随机变量x和给定的α(0<α<1),我们称满足

的点称为标准正态分布的上侧α分位数查表即可得到分位数的值。例如:α=0.05,则有查表中概率为0.95的分位数,得三t分布正态分布为基础得统计检验仅适用于较大量的实验数据,一般要求样本容量,对有限量的实验数据使用正态分布将可能导致错误的结论,这是爱尔兰化学家戈塞特(W.S.Gosset)首先发现的,他在1908年以”student”为笔名发表论文提出了”student”分布(学生分布),即t分布。在实际工作中。我们进行有限次测定,只能求出Sx,而不知道总体的σ与μ

——正态分布横坐标只能用S代替σ,用t代替u

即:——有限次测量横坐标

t分布曲线

t分布曲线与正态分布曲线相似,t分布曲线下面一定范围内的面积,就是该范围内测定值出现的概率

正态分布:u一定,由正态分布表可知相应的概率

而t分布:t一定时,自由度f不同,相应曲线所包含的面积也不同由t分布图:①测定次数少,数据分散,t分布曲线矮、胖②自由度f→∞时,t分布→正态分布不同f值时的该所对应的t值已由统计学方法算出列成表(下页)几个名词:

置信水平:(置信度)P,某一t值时,测定值落在μ±tS范围内的概率(双侧),落在>μ-tS或<μ+tS范围内的概率(单侧)显著水平:(显著度)落在(μ±tS)以外的概率(1—P)

为显著水平,用α表示(双侧),落在>μ-tS或<μ+tS范围以外的概率(单侧)∵

t值与α和f有关,∴使用时应注明之。即:注:①使用表2-2时,应注意题意属单侧检验还是双侧②由表2-2,f→∞时,t0.05,∞=1.96,即95%的置信度时

t=1.96;此时与正态分布|u|=1.96时的概率同,说明测定次数多时,t分布→正态分布二.平均值置信区间:

真值u是不可知的,实际工作中以算术平均值作为真值来估算,这个估计有误差,要附一个在某一个置信概率下的算术平均值的标准偏差。对于有限次测定以S代替总体σ,由t分布处理之得:+置信上限-置信下限

置信区间(双侧):置信区间(单侧):置信限:举例(见讲义)注意:①置信区间分单侧或双侧,使用时注意②在未指明求在一定置信水准,总体均值大于或小于某值外,一般置信区间求双侧。例:8-羟基喹啉法测定Al含量n=9,SX=0.042%,估计95%,99%置信水准时真值是多少?解:由题意属双侧检验α(1)P=95%,则α=1-P=0.05,f=n-1=8由表2-2,t0.05,8=2.306=10.79±0.032(%)

即:95%置信水准时,μ可能在(10.76~10.82)之间(2)P=99%,α=0.01t0.05,8=3.355

=10.79±0.047(%)99%置信水准时,μ可能在(10.74~10.84)%之间。例:单侧检验置信区间上例n=9,SX=0.042%问Al含量均值大于何值(或小于何值时)的概率为95%解:α=0.05,f=8,t0.05,8=1.860即:总体均值大于10.70%(或小于10.82%)的概率为95%结论:1.增加测定次数,在同样置信水准下,置信区间小,均值接近于真值2.增加置信度,需扩大置信区间三.显著性检验:(一)总体均值的检验——t检验(准确度检验,看是否有系统误差)(二)方差检验——F检验(精密度检验,看是否有偶然误差)

显著度:

α10%5%1%

置信度:1-α90%95%99%

如果两种方法,一种方法标准偏差

另一种方法标准偏差而,并不能说明某一方法不行,而应具较大差别时,才能说有显著增加。

(一)t检验:主要用于两组有限测量均值是否存在差异;平均值与标准值是否存在差异等等。

1.样本平均值与标准值比较:(已知真实值的t检验)考虑其t分布:检验步骤:

1.将测得、S、n代入上式求出t值2.查表2-2,tα,f值3.若

t<tα,f

说明与μ不存在显著性差异这种检验可判定分析结果是否正确,新方法是否可用等。例:p2-10.要求Fe%=4.800%,抽样测定n=5Fe%:4.744,4.790,4.790,4.798,4.822%问产品是否合格?解:

=0.028%μ=4.800%

本题属双侧检验α=0.05f=4查表:∵t<∴产品合格例:检测新方法是否可行,(原子吸收测微量Cu值)μ=11.7ppm=10.8ppms=0.7ppmn=5问95%置信水平上是否可靠?解:

查表:t0.05,4=2.776t>即:新方法不够好,可能存在某种系统误差。例:一熟练分析人员测值为6.75%(作为比较标准),一位新手用同一方法测n=6,=6.94%,S=0.28%,问新分析结果是否显著高于前者?解:单侧检验

t0.05,5=2.015t<t0.05,5

无显著差异即在95%置信水准下,新手分析结果并非明显高于熟练分析人员。2.两个样本平均值的

t检验:主要用于:两个操作者,两种分析方法,两个试样中某成分是否存在显著差异等。在此类检验时,要将进行一些代换(1)将μ换为第二组测量的平均值(2)将一组数据的标准偏差换成两种数据间的标准偏差SRn1,n2

—测定次数

S—合并标准偏差

即:——平均值t检验公式(错误)

——式中S的计算见下面,有两种算法(公用标准偏差)式中合并标准偏差可用下式计算:

f=n1+n2—2总自由度若已知两组数据的标准偏差S1,S2,合并标准偏差可用下式计算:此种t检验步骤:同前边t检验具体应用如下:

a.检验两组样本平均值的显著性:例:同一方法测两样品含Mg量样品1:1.23,1.25,1.26=1.25%,n1=3样品2:1.31,1.34,1.35=1.33%,n2=3两样品是否存在显著性差别?

解:①求合并标准偏差:

Smg=0.018%②求t:

③f=3+3—2=495%置信水平α=0.05t0.05,4=2.776t>t0.05,4两样品有显著性差异

b.检验两种分析方法的显著性例:为检验一个新的测Fe的方法,用经典的重量法比较新法:n=6,

重法:n=5,问两种方法有无显著性差异?(即新方法是否可用?)解:P27数据

③查表:t0.05,9=2.262(双侧)t<t0.05,9

无显著差异即:新测试方法可行3.配对比较

t检验(略)(二)F检验:精密度的差别检验常用于:1.用两种方法测同一样本,比较精密度2.两人用同一方法测同一样本,比较精密度F检验步骤如下:

1.分别算出

S1与

S2

2.求:(S1>S2)

3.查表2

4.比较结论:当存在显著差别两精密度不存在显著差异注:使用表时,f1为标准偏差大的自由度

f2为标准偏差小的自由度表2-495%置信水准时部分

F值

F通常>1,只有在

f∞时,F=1例:两种方法测某样品的某组分n1=6,S1=0.055,n2=4,S2=0.022,两方法精密度有无不同?解:

f1=6—1=5,f2=4—1=395%置信水准,

F0.05,5,3=9.01F<F0.05,5,3故:两方法精密度无显著性差异例:两人用同一方法测同一试样。

A:n1=7,=92.08S12=0.6505B:n2=9,=93.08S22=0.6354问A、B二人分析结果分析结果有无系统误差?解:

F0.05,6,8=3.58F<F0.05,6,8两人精密度无显著差异

②合并标准偏差:查=2.145t>有显著差异两人操作存在某种系统误差。使用显著性检验的几点注意事项:1、两组数据的显著性检验,检验顺序是先F检验,后进行t检验。只有两组数据的精密度(偶然误差)接近,准确度(系统误差)的检验才有意义。2、注意单侧检验还是双测检验3、置信水平P或显著性水平α的选择平时工作中,若显著度太高,置信度就小,置信区间小,往往会丢掉一些可用的方法或值(以真为假,第一类错误)。反之,α太低,1-α就大,置信区间大,又会把一些不能用的方法或值作为有用的(以假为真,第二类错误)。P28究竟应如何掌握这个尺度呢?分析化学一般把95%置信度为标准,来判断分析方法是否有差别,即为差别检验。四.可疑数据的取舍:在实验过程中往往会出现一些数据不太理想,但我们不能按自己的意愿去随意取舍,而要以科学的态度去仔细查找原因,若有明显原因,明显失误,可以舍弃有关数据(如人为因素:称样时掉粒在工作台,滴定时漏滴等)

其他情况若要舍弃,要通过统计检验方法确定是否可以舍弃,目前用的较多的一种是G检验。1、G检验G检验步骤如下:1.算出平均值(包括可疑值)2.算出

x可疑—

3.算出标准偏差S(包括可疑值)4.算出5.查表Gn,α临界值若:G>Gn,α,可以舍弃可疑值(例17)注:讲课

t→F→G

应用

G→F→t2、Q检验:步骤:P36(1)排序

(2)计算舍弃商:(3)选定置信度,查Q:(4)比较:例:测定铁的含量,n=4,结果为1.61%、1.53%、1.54%、1.83%,问结果1.83%可以舍弃吗?(设P=95%)解:§4相关与回归

相关与回归是研究变量间关系的统计方法。一.相关:

A与C相关,相关程度用相关系数表示(一)相关系数:两个变量

x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论