分析测试中数理统计_第1页
分析测试中数理统计_第2页
分析测试中数理统计_第3页
分析测试中数理统计_第4页
分析测试中数理统计_第5页
已阅读5页,还剩141页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分析测试中的分析测试中的数理统计数理统计臧慕文臧慕文北京有色金属研究总院分析测试技术研究所北京有色金属研究总院分析测试技术研究所国家有色金属及电子材料分析测试中心国家有色金属及电子材料分析测试中心1数理统计在分析测试中应用的必要性数理统计在分析测试中应用的必要性2数理统计中的一些基本概念数理统计中的一些基本概念3分析测试数据的基本特性分析测试数据的基本特性4分析测试数据的可靠性检验分析测试数据的可靠性检验5分析测试方法的灵敏度、检出限、定量分析测试方法的灵敏度、检出限、定量限限6回归分析校正曲线回归分析校正曲线7数值修约规则及数据运算规则数值修约规则及数据运算规则 1数理统计在数理统计在分析测

2、试中应用分析测试中应用的必要性的必要性1.1分析测试分析测试的基本特点抽样检验的基本特点抽样检验分析测试是通过实验测量以获取欲测物质的分析测试是通过实验测量以获取欲测物质的“有什么?有什么?”、“有多少?有多少?”,以及更多更全,以及更多更全面的信息。面的信息。“信息信息”通过通过“数据数据”来表述来表述。“数据”是分析测试的“产品”。(1)分析测试的对象有时是分析测试的对象有时是“大量大量”的,不可能的,不可能 进行整体检测。进行整体检测。(2) )大多数分析手段属于大多数分析手段属于“破坏性破坏性”技术,消耗技术,消耗 掉样品后才能获得数据,逐个检测无意义。掉样品后才能获得数据,逐个检测无

3、意义。分析测试的基本方式是“抽样检验”。对于对于“抽检抽检”,应该解决三个基本问题:,应该解决三个基本问题:(1)抽样和取样方法要科学合理,使所抽取的样品有足够的抽样和取样方法要科学合理,使所抽取的样品有足够的代表性,并保证必要的抽样数量和最小取样量;代表性,并保证必要的抽样数量和最小取样量;(2)在整个测试过程中要实施严格的质量控制,使测定结果在整个测试过程中要实施严格的质量控制,使测定结果准确可靠;准确可靠;(3)要通过科学的推理方法,将获得的测试样品的信息,以要通过科学的推理方法,将获得的测试样品的信息,以一定的可靠性去推断和估计样品的全体。一定的可靠性去推断和估计样品的全体。 欲很好地

4、解决这三个问题,都需要正确运用数理统欲很好地解决这三个问题,都需要正确运用数理统计理论,是计理论,是“数理统计数理统计”具有的具有的“功能功能”。本讲座主。本讲座主要讨论数理统计在解决第三个问题方面的应用。要讨论数理统计在解决第三个问题方面的应用。1.2 分析测试结果总是带有误差分析测试结果总是带有误差 人、机、料、法、环等因素造成人、机、料、法、环等因素造成 美国旧金山湾污泥分析美国旧金山湾污泥分析: :不同实验室测定结果之间存在很大不同实验室测定结果之间存在很大差异,难以判断污染真实情况,难以对污染进行有效治理。差异,难以判断污染真实情况,难以对污染进行有效治理。 误差客观存在,实际分析中

5、不能得到确切无误的真值,只能作相误差客观存在,实际分析中不能得到确切无误的真值,只能作相对准确的估计。任何一种定量分析测试的结果,都必然带有不确定度。对准确的估计。任何一种定量分析测试的结果,都必然带有不确定度。 对实验数据进行处理,判断最可能的值是多少?其可靠性如何?对实验数据进行处理,判断最可能的值是多少?其可靠性如何?数理统计方法就是一种科学方法。数理统计方法就是一种科学方法。实验室实验室污染物污染物w/%DDT(二氯二苯(二氯二苯三氯乙烷)三氯乙烷)DDE( (二氯联苯二氯联苯二氯乙烯二氯乙烯) )HgPbA0.8010-62.8010-60.8010-63.310-6B0.6810-

6、61.210-60.1010-62110-6C0.1410-60.4710-60.1010-65010-61.3分析测试协同试验中大量数据的处理分析测试协同试验中大量数据的处理标准物质标准物质/ /标准样品研制标准样品研制 均匀性检验;稳定性检验;定值均匀性检验;稳定性检验;定值标准方法制定标准方法制定 重复性限;再现性限重复性限;再现性限实验室间比对实验室间比对 能力验证能力验证 稳健统计量;统计方法;结果的判别稳健统计量;统计方法;结果的判别 1.4分析测试方法可靠性的评价分析测试方法可靠性的评价 一个分析测试方法研究建立后,需要进行评一个分析测试方法研究建立后,需要进行评价和检验,有多项

7、衡量测定结果可靠性、可比价和检验,有多项衡量测定结果可靠性、可比性的指标,如灵敏度、精密度、准确度、不确性的指标,如灵敏度、精密度、准确度、不确定度、检测能力(检出限、定量限、校准曲线定度、检测能力(检出限、定量限、校准曲线的线性范围)、多元素测定能力以及抗干扰水的线性范围)、多元素测定能力以及抗干扰水平等。各项指标的计算、比对等,都涉及到数平等。各项指标的计算、比对等,都涉及到数理统计。理统计。1.5回归分析可求得最佳校准曲线回归分析可求得最佳校准曲线分析测试方法绝大多数是相对测定法。这些方法分析测试方法绝大多数是相对测定法。这些方法测定被测组分时都需要制作校准曲线。校准曲线是测定被测组分时

8、都需要制作校准曲线。校准曲线是被测组分的质量浓度(或物质的量浓度或质量等)被测组分的质量浓度(或物质的量浓度或质量等)与相应的被测量的仪器检测器响应值之间的定量关与相应的被测量的仪器检测器响应值之间的定量关系曲线。校准曲线的制作是测定操作中的关键步骤系曲线。校准曲线的制作是测定操作中的关键步骤之一,它的正确与否关系到测定误差的大小,甚至之一,它的正确与否关系到测定误差的大小,甚至整个测定的成败。数理统计中通过回归分析求得的整个测定的成败。数理统计中通过回归分析求得的回归直线是对所有实验数据点来说偏差最小的校准回归直线是对所有实验数据点来说偏差最小的校准曲线。曲线。1.6优化实验条件的实验设计方

9、法优化实验条件的实验设计方法建立一个新的或改进已有的分析测试方法,建立一个新的或改进已有的分析测试方法,通常要做许多条件试验,以得到最佳测定步通常要做许多条件试验,以得到最佳测定步骤。合理地安排试验,以科学的实验设计指导骤。合理地安排试验,以科学的实验设计指导实验工作,优化实验条件,以不多的试验次数实验工作,优化实验条件,以不多的试验次数得到正确满意的试验结论,这也是数理统计的得到正确满意的试验结论,这也是数理统计的一个重要内容。实验设计的方法有优选法、正一个重要内容。实验设计的方法有优选法、正交法、单纯形法等。交法、单纯形法等。 1.7利用控制图管理常规分析质量利用控制图管理常规分析质量影响

10、分析测试质量的五大因素是:人、机影响分析测试质量的五大因素是:人、机 、料、法、料、法、环。正常的情况下,应该对五方面有良好的管理和控环。正常的情况下,应该对五方面有良好的管理和控制,使测试质量获得重要保证。统计分析测试数据的制,使测试质量获得重要保证。统计分析测试数据的可靠性也是测试质量的重要保证。除了精密度、准确可靠性也是测试质量的重要保证。除了精密度、准确度的计算并检验保证测试质量的度的计算并检验保证测试质量的“离线离线”的、的、“静态静态”的办法外,还可以应用的办法外,还可以应用“统计过程控制(统计过程控制(Statistical Process Control)”即即SPC概念。概念

11、。SPC是利用统计技术是利用统计技术(控制图)对生产(管理)过程中的各个阶段进行(控制图)对生产(管理)过程中的各个阶段进行“全过程的监控全过程的监控”, 科学地区分出生产过程中产品质科学地区分出生产过程中产品质量的偶然波动与异常波动。常规分析质量管理也可采量的偶然波动与异常波动。常规分析质量管理也可采用控制图,如均值极差控制图、均值标准偏差控用控制图,如均值极差控制图、均值标准偏差控制图等。制图等。 “数理统计数理统计”的重要性和必要性在于:的重要性和必要性在于:各种分析测试技术,不管是经典的还是现代的,都离不开数理统计方法。“数理统计” 充分地利用测试数据所提供的信息进行科学分析,指导测试

12、研究,是整个分析测试过程中不可分割的组成部分,是测试过程的延伸和深化。2 数理统计中的一些基本概念数理统计中的一些基本概念2.1总体(population)被研究对象的全体。 构成总体的基本单位为个体。构成总体的基本单位为个体。 对分析测试而言,总体是指对分析测试而言,总体是指“在指定条件下,作在指定条件下,作无无限次测量所得的无限多的数据的集合限次测量所得的无限多的数据的集合”。其中每个数。其中每个数据就是一个个体。据就是一个个体。2.2样本(sample)从总体所包含的全部个体中随机抽取的一部分。 对分析测试而言,样本是指对分析测试而言,样本是指“自总体中随机抽出的自总体中随机抽出的一组测

13、量值一组测量值”。2.3 误差(error)被测量值与真值之间的差。 测量值x带有误差 ,测量值x扣除误差后即等于真值0。亦即 误差有正负号,测量值大于真值时,误差为正误差有正负号,测量值大于真值时,误差为正值,反之为负值。值,反之为负值。 真值通常是不知道的,因此实际上也不可能求得真值通常是不知道的,因此实际上也不可能求得真实误差,误差是一个理想概念。真实误差,误差是一个理想概念。 0 x0 x误差还可用相对误差R.E.表示,相对误差是误差在真值中所占的比例。即根据误差的来源和性质不同,误差分为根据误差的来源和性质不同,误差分为3类:系统误差、随机误差、过失误差类:系统误差、随机误差、过失误

14、差。00. .100%xR E2.4系统误差(systematic error) 在同一条件下 多次测量同一量时,误差的绝对值和符号保 持恒定,或在条件改变时,按某一确定的规 律变化的误差。系统误差也称偏倚。 系统误差性质:在多次测定中重复出现;具有系统误差性质:在多次测定中重复出现;具有单向性,即如果测定有系统误差,则所有的测定单向性,即如果测定有系统误差,则所有的测定值或者都偏高,或者都偏低;数值基本是恒定不值或者都偏高,或者都偏低;数值基本是恒定不变的,如果误差来源于某一个固定的原因,这个变的,如果误差来源于某一个固定的原因,这个误差的数值是恒定的。误差的数值是恒定的。2.5 随机误差(

15、random error) 在实际测量条件下, 多次测量同一量时,误差的绝对值 和符号以 不可预定方式变化着的误差。旧称偶然误差。 随机误差性质:由随机因素产生,其大小与正随机误差性质:由随机因素产生,其大小与正负号都不定,是随机变量,负号都不定,是随机变量,“单次测定的随机误差单次测定的随机误差”没有什么规律,但随着测量次数的增加,导致其总没有什么规律,但随着测量次数的增加,导致其总和有正负相消的机会,当测定次数足够多时,最后和有正负相消的机会,当测定次数足够多时,最后其平均值趋近于零,因此多次测量的平均值的随机其平均值趋近于零,因此多次测量的平均值的随机误差要比单个测量值的随机误差小。误差

16、要比单个测量值的随机误差小。随机误差可用概率统计的方法来处理。如果 采用数理统计方法进行处理,就会发现随机 误差通常遵循正态分布规律:*随机误差具有几个特性:随机误差具有几个特性:* *1 单峰性:绝对值小的误差出现的概率比绝对值大单峰性:绝对值小的误差出现的概率比绝对值大的误差出现的概率大;的误差出现的概率大;2 对称性:绝对值相等的正误差和负误差,其出现对称性:绝对值相等的正误差和负误差,其出现的概率相等;的概率相等;3 有界性:绝对值很大的误差出现的概率近于零,有界性:绝对值很大的误差出现的概率近于零,亦即误差有一定的实际限度;亦即误差有一定的实际限度;4 抵偿性:在实际测量条件下对同一

17、量的测量,抵偿性:在实际测量条件下对同一量的测量,其误差的算术平均值随着测量次数增加而趋于零。其误差的算术平均值随着测量次数增加而趋于零。由此,可以通过增加测定次数减小随机误差。由此,可以通过增加测定次数减小随机误差。2.6 过失误差(mistake error)由分析人员工作 粗心大意或不按规程操作而造成,应该而 又能够避免。但如果发现,只能弃去测定 结果。2.7偏差(variance)被测量的单次测量值 与 多次测量的平均值 之间的差值。也称离 差或变差。 通常用偏差( )作为误差( )的估计量。xxdxxxx0 x2.8 总体方差(population variance)测量值对 总体均

18、值的误差平方的统计平均。 2.9 样本方差(sample variance) 测量值对样本 平均值的偏差平方的统计平均。2211()niixn()n 2211()1niisxxn方差具有加和性,当一个测定结果受到多个因素的影响时,测方差具有加和性,当一个测定结果受到多个因素的影响时,测定结果的总的方差等于各个因素产生的方差之和,此即方差加定结果的总的方差等于各个因素产生的方差之和,此即方差加和性原理,是对测定数据作统计分析时所依据的重要原理之一和性原理,是对测定数据作统计分析时所依据的重要原理之一。2.10 差方和(the sum of the squares of the deviatioh

19、s)测量值 对平均值 的偏 差的平方的加和。差方和也称离差平方和。xix21()niiQxx2.11 总体标准偏差 (population standard deviation) 总体方差平方根正值。2.12样本标准偏差 (sample standard deviation) 样本方差平方根正值。 211()niixn()n211()1niisxxn2.13自由度(degrees of freedom)方差计算中,和的项 数减去对和的限制数。或差方和中独立项的数目。 在重复性条件下,对被测量作在重复性条件下,对被测量作n次独立测量时所得的样次独立测量时所得的样本本方差为方差为 ,其中,其中i为

20、残差为残差: , , 因此,和的项数即为残差的个数因此,和的项数即为残差的个数n,而而是一个约束条件,即限制数为是一个约束条件,即限制数为1。由此可得自由度。由此可得自由度 =n-1。自由度反映了相应实验标准偏差的可靠程度。用贝塞尔自由度反映了相应实验标准偏差的可靠程度。用贝塞尔公式估计实验标准偏差公式估计实验标准偏差s时,时,s的不可靠程度为的不可靠程度为 ,n越越大,大,s的可靠程度越大。若测量次数为的可靠程度越大。若测量次数为10,则,则 =9,表明估,表明估计的计的s的不可靠程度约为的不可靠程度约为0.24,可靠程度达,可靠程度达76%。22212()/(1)nn11xx22xx0i1

21、/ 22.14 精密度(precision)在相同条件下,对被测量进行多次重复测量,测得值之间的一致 (符合)程度。 精密度仅仅依赖于随机误差。精密度高,不一定准确度高。即测得值的随机误差小,不一定其系统误差亦小。2.15 准确度(accuracy)被测量的测得值与其 “真值”的接近程度。 准确度所反映的是测得值的系统误差。准确度高,不一定精密度高。即测得值的系统误差小,不一定其随机误差亦小。精密度与准确度的关系设图中的圆心O为被测量的“真值”,黑点为其测得值,则图(a):系统误差小,而随机误差大,即准确度较高、精密度较低;图(b):系统误差大,而随机误差小,即准确度较低、精密度较高;图(c)

22、:系统误差和随机误差均小,即准确度和精密度都较高。精密度和准确度关系的示意图国家标准GB/T 6379.12004/ISO 5725-1:1994 测量方法与结果的准确度(正确度与精密度)第一部分:总则与定义中,用两个术语“正确度”(trueness)与“精密度”来描述一种测量方法的“准确度”。“正确度”指大量测试结果的(算术)平均值与真值或接受参照值之间的一致程度;“精密度”指测试结果之间的一致程度;而“准确度”是“精密度”和“正确度”的综合概念,即测试结果的随机误差和系统误差的综合反映。但是国际标准化组织但是国际标准化组织(ISO)、国际电工委员会、国际电工委员会(IEC)、国际计量局国际

23、计量局(BIPM)、国际法制计量组织、国际法制计量组织(OIML)、国际、国际临临床化学联合会床化学联合会(IFCC)、国际理论与应用化学联合会、国际理论与应用化学联合会(IUPAC)、国际理论与应用物理联合会、国际理论与应用物理联合会(IUPAP)等七个组等七个组织于织于1993年颁布的第二版年颁布的第二版国际通用计量学基本名词国际通用计量学基本名词(International Vocabulary of Basic and General Terms in Metrology)简称)简称VIM以及以及1968年第三届国际法制计年第三届国际法制计量大会通过的量大会通过的法制计量学基本名词法制

24、计量学基本名词(Vocabulary of Legal Metrology)简称简称VIML中均未将中均未将“正确度正确度”作作为一个正式术语列入;国际理论化学和应用化学联合会为一个正式术语列入;国际理论化学和应用化学联合会(IUPAC)的文件中、全国自然科学名词审定委员会公布的文件中、全国自然科学名词审定委员会公布的化学名词中的化学名词中1991年版年版(科学出版社科学出版社)和和2009年重新修订年重新修订版中也无这一术语。版中也无这一术语。2.16正态分布(normal distribution)连续性随机变量的概率分布。其随机变量其随机变量x的概率密度函数为的概率密度函数为 该函数式是

25、数学家高斯该函数式是数学家高斯(Gauss)导出的,又称高斯分布定导出的,又称高斯分布定律,是描述随机变量现象的一种最常见的分布。式中律,是描述随机变量现象的一种最常见的分布。式中x是从是从分布总体中随机抽取的样本值;分布总体中随机抽取的样本值;为正态分布的总体均值,为正态分布的总体均值,为总体标准差,是正态分布基本参数。为总体标准差,是正态分布基本参数。当随机变量当随机变量x服从均值服从均值 ,标准差,标准差 的正态分布时,记的正态分布时,记作作。 22()21( )2xf xe2( ,)xN 正态分布密度函数曲线是连续的、对称的正态分布密度函数曲线是连续的、对称的“钟形钟形”*曲线。该曲线

26、表明,曲线。该曲线表明, 在处达到最大值,在处达到最大值,越大,曲线越平缓;离中心值越远的值出现的概越大,曲线越平缓;离中心值越远的值出现的概率就越小。通过计算表明,测定值率就越小。通过计算表明,测定值x位于范围的位于范围的概率为概率为68.26%;位于;位于 范围的概率为范围的概率为95.45%;位于位于 范围的概率为范围的概率为99.73%。( )f xx123( )f x正态分布 概率密度函数曲线2(,)N x2.17置信概率(confidence probability)统计推断的可靠 把握程 度,即评价可靠性的参数。也称置信度、置 信水平。 置信概率置信概率P与显著性水平与显著性水平

27、的关系是的关系是1P。置信。置信概率通常取概率通常取95%,有时也取,有时也取90%,99%。2.18置信区间(confidence interval)以一定置信概率估 计的总体均值所在的区间。 用有限次重复测定的样本平均值来估计总体均值用有限次重复测定的样本平均值来估计总体均值的区间范围。置信区间越宽,判断失误的机会就越小,的区间范围。置信区间越宽,判断失误的机会就越小,但相对而言实用价值就越低。但相对而言实用价值就越低。3 分析测试数据的基本特性分析测试数据的基本特性在正态分布密度函数曲线中可以看到,多次测定时得到的数据有两个特性:*数据有向中心值集中的趋势,即总体数据具有统计 规律性;数

28、据又有偏离中心值的倾向离散性和波动性,即 个别测试结果具有随机性。对于数据的这两个特性在数理统计上采用特征参数来表征。 可以说,可以说,“数理统计数理统计”基本上是对这两类特征参数基本上是对这两类特征参数在在“做文章做文章”。3.1 数据集中趋势的表征 一般用两个特性参数来表示。3.1.1算术平均值( arithmetic average ) 表示式: 对于有限多次测定,测定值围绕算术平均值对于有限多次测定,测定值围绕算术平均值( (样本平样本平均值均值) )集中,平均值在不存在系统误差时接近真值。测集中,平均值在不存在系统误差时接近真值。测定值在服从正态分布情况下,算术平均值为测定结果定值在

29、服从正态分布情况下,算术平均值为测定结果的最佳值。的最佳值。12111ninixxxxxnn加权平均值( weighted average ) 在不同条件下,对同一量进行测定时,测定结果的质量不同。“权重”即是用数字表征测定结果的质量指标。 权重W与测定结果的方差成反比,即 加权平均值: 21Ws211211/1/nniiiiiiWnniiiiW xxsxWs3.1.2中位值(median)将一系列测定数据按其大小顺序排列,位于正中间的数据称为中位值。 当测定次数N为奇数时,居中者即是;而当N为偶数时,正中间的两个数的平均值为中位值。中位值的优点是求法简单,又有直观意义;不中位值的优点是求法简

30、单,又有直观意义;不受受离群值大小的影响。但是用中位值表示数据集中离群值大小的影响。但是用中位值表示数据集中趋趋势不如平均值准确。势不如平均值准确。x 3.2 数据离散性的表征3.2.1 极差 R (也称全距) 一组平行测定数据中最大者 ( )和最小者( )之差 相对极差 maxxminxmaxminRxx100%rRRxd3.2.2 平均偏差(average deviation) 各次测定值对平均值的偏差的绝对值的平均。计算平均偏差 时,先求各次测定值对于平均值的偏差 ,然后求其绝对值之和的平均值 相对平均偏差1211nniidddddnn100%rddx(1,2, )iidxx ind3.

31、2.3 标准偏差(standard deviation) s 式中,xi第i次测定值;算术平均值;n测定次数。n-1为自由度。此式即计算标准偏差的贝塞尔(Bessl)公式。 标准偏差比平均偏差更灵敏地反映出较大偏差的存在,标准偏差比平均偏差更灵敏地反映出较大偏差的存在,又比极差更充分地引用了全部数据的信息,在统计上更有又比极差更充分地引用了全部数据的信息,在统计上更有意义。因此标准偏差是最常用来描述数据分布的离散性,意义。因此标准偏差是最常用来描述数据分布的离散性,作为精密度的量度作为精密度的量度。211()1niisxxnx标准偏差的计算方法有多种,除通常情况下采用标准偏差的计算方法有多种,

32、除通常情况下采用上述的贝塞尔法外,还有两种常用的估算方法上述的贝塞尔法外,还有两种常用的估算方法 最大残差法和极差法。最大残差法和极差法。最大残差法 最大残差法系数最大残差法系数Cn表表极差法极差法系数极差法系数dn表表( )maxmaxinnis xCCxxiiin( )(maxmin)/s xxxd对于标准偏差要特别说明3点:标准偏差只取正值。标准偏差是由一系列随机变量计算而得的统计量,它本身也是随机变量,统计学上用“标准偏差的标准偏差 ”表征标准偏差的精密度: 因此,标准偏差的精密度是不高的。当n50时,标准偏差通常只取1位有效数字,最多不超过2位有效数字。当n 5000时,标准偏差的有

33、效数字才能有3位数。修约标准偏差的值时,结果通常是使准确度变得更差一些。一般采取“只入不舍”,不采用“四舍六入五留双法”。例如s=0.213,取两位有效数字时要入为0.22,而取一位有效数字时就要入为0.3。2sssn相对标准偏差(relative standard deviation) sr 相对标准偏差是标准偏差与平均值的比值,表示偏差值与平均值的相对大小,用百分数表示:相对标准偏差,又叫变异系数(coefficient of variation)但国际理论与应用化学联合会(IUPAC)主张采用“相对标准偏差”而不叫变异系数。100%rssx平均值的标准偏差一系列测定(每次作几个平行测定)

34、的平均值的波动情况也遵从正态分布。 如果用平均值的标准偏差表示平均值的分散程度,统计学已证明,平均值的标准偏差与测定次数平方根呈反比,即 增加测定次数可减小平均值的标准偏差,提高测定精密度。但增加测定次数的代价不一定能从减小偏差得到补偿。xs/xssn 平均值的标准偏差与测定次数的关系 表明,开始时, 随n增大而减小得很快,当n5时变化就较慢了,而当n10时, 随n的变化实际上已不显著。因此,分析测试中测定次数为46次已足矣。过多地增加测定次数对分析结果的可靠性并无很大效果。xsxs3.2.4 标准化四分位距 (Norm IQR) 以稳健统计技术(Robust statistical tech

35、niques)处理的用于表示数据分散程度的一个量。相当于正态分布中的标准偏差。 “稳健统计技术稳健统计技术”主要应用于主要应用于“实验室能力验证实验室能力验证”的数的数据处理。能力验证据处理。能力验证 (proficiency testing)是利用实验室间比对是利用实验室间比对以确定实验室的分析测试能力和水平以确定实验室的分析测试能力和水平 ,为实验室提供一个,为实验室提供一个评估或证明其出具分析测试数据可靠性的客观手段。评估或证明其出具分析测试数据可靠性的客观手段。“稳健统计技术稳健统计技术”有有7个统计量:结果总数、中位值、标个统计量:结果总数、中位值、标准化四分位距、稳健变异系数、极小

36、值、极大值、变动范准化四分位距、稳健变异系数、极小值、极大值、变动范围。其中围。其中 标准化四分位距和中位值是最重要的统计量。标准化四分位距和中位值是最重要的统计量。四分位值(quartile) 一组按顺序排列的数据中,其1/4处和3/4处的数据x1/4(低四分位值,Q1)和 x3/4(高四分位值,Q3) Q1和Q3可通过数据之间的内插法,或者用函数法求得,它们的位置分别以 PQ1和PQ3表示 。四分位距(IQR) 等于高四分位值Q3与低四分位值Q1之间的差,即 IQR= Q3- Q1。标准化四分位距等于四分位距(IQR , Interquartile Range)乘以一个因子(0.7413)

37、, 即Norm IQR =IQR0.7413 。利用“标准化四分位距”通过稳健Z比分数(Robust Z score)对实验室能力作出评判 :对于用单个样品进行能力验证时,则式中xi某实验室的分析结果;全部实验室分析结果的中位值;Norm IQR标准化四分位距。ZixxNormIQRx 对于用分割样品(一对样品,其化学成分的含量略有差异)进行能力验证时,则 实验室间Z比分数 实验室内Z比分数NormIQRZBxSSSNormIQRZWxDDD式中 S标准化和,一对样品A和B中某项分析结果之和除以 即 ;一组S数据的中位值; 一组S数据的标准化四分位距 ; D标准化差,一对样品A和B中某项分析结

38、果之差除以 即 (若) ; 或 (若 ) ; 一组D数据的中位值; 一组D数据的标准化四分位距。22NormIQRSxSAB()/2SxxAB()/2DxxAx Bx Ax Bx BA() /2DxxxDNormIQRD结果(能力)判别在能力验证计划报告中,依据Z比分数(ZB和ZW)评定结果(能力): Z2 为满意结果2Z3 为有问题的结果(可疑值) Z3 为不满意结果(离群值)ZB(实验室间Z比分数)的大小代表某实验室的S与 的偏离程度 ,反映实验室测定结果的系统误差。ZB3,表明结果对都太高;ZB-3,表明结果对都太低。ZW(实验室内Z比分数)的大小代表某实验室的D与的偏离程度 ,反映实验

39、室测定结果的随机误差。ZW3,表明结果间的差值太大;ZW-3,表明结果间的差值太小或者相对于中位值在“相反的方向”。xSxD3.2.5 重复性限(repeatability limit) r 在重复性条件下(同一实验室,由同一操作员使用相同的设备,按相同的测试方法,在短时间内,对同一试样进行相互独立的测定),得到的两次实验结果间的绝对值差,以95%的置信概率不超过的值。即,两次测试结果之差小于或等于r的概率为95%。 计算: m个实验室,分别在各自实验室对同一试样用同一方法进行测定,得到m组结果: ,单次测定的标准偏差为s1,平均值为 ; ,单次测定的标准偏差为s2,平均值为 ; ,单次测定的

40、标准偏差为sm,平均值为 。221222,nxxx 111121,nxxx12,mmmmnxxx1x2xmx重复性标准偏差sr 式中 si每个实验室n次重复测定的标准偏差; xij每个实验室各个测定的测定值; 每个实验室各个测定值的平均值。 若各实验室ni均等于n,则 重复性限2211111()(1)mnmijiiiiijirmmiiiixx snssnmnm22111()(1)mnmijiiijirxxssmm n2 22.83rrrssix3.2.6 再现性限(reproducibility limit) R在再现性条件下(不同实验室,由不同操作员使用不同的设备,按相同的测试方法,对同一试

41、样进行相互独立的测定), 得到的两次实验结果间的绝对值差,以95%的概率不超过的值。即,两次测试结果之差小于或等于R的概率为95%。 计算: 再现性标准偏差sR 式中sr重复性标准偏差;sl实验室间变动性标准偏差。 22Rrlsss实验室间变动性方差由于受到误差影响,当计算结果出现负值时,应将该值设置为零。 再现性限 222112(1)mmiiiirlmxxssm mn2 22.83RRRss重复性限(r)和再现性(R)限常用于标准分析方法中表示方法的精密度。意即:在置信概率95%下,可期望在同一实验室内,用该标准分析方法测定同一试样,得到的两个独立测试结果间的绝对差值不应超过重复性限(r),

42、超过重复性限(r)的情况不超过5%;在置信概率95%下,可期望在不同实验室内,用该标准分析方法测定同一试样,得到的两个独立测试结果间的绝对差值不应超过再现性限(R),超过再现性限(R)的情况不超过5%。 例:四个实验室应用同一分析方法测定某试样中铜的质量分数,每个实验室平行测定5次,测得结果如下表,计算其重复性限和再现性限。 某试样中铜的质量分数mg/g实验室实验室编号编号w1w2w3w4w5119.719.719.820.119.7220.220.320.220.020.3320.320.019.920.320.0419.919.819.919.920.0根据上表的数据计算 , , ,如下表

43、。 , , 值实验室编号实验室编号119.8392.040.030220.2408.040.015320.1404.010.035419.9396.010.005801 600.10.085iwiw2iw2iw2is2is2isiw2iw重复性标准偏差为重复性限为变动性标准偏差为210.0850.15mg /g4miirssm2 22.83 0.150.43mg/grrs22222211112114 1600.1 800.0850.17mg/g4 35 4mmmmiiiiiiiirrlmxxmwwsssm mnm mn再现性标准偏差为再现性限为该方法的重复性限为0.43mg/g,即在置信概率9

44、5%下,可期望在同一实验室内,用该方法测定同一试样,得到的任何两个单个分析结果间的绝对差值不应超过0.43mg/g。该方法的再现性限为0.66mg/g,即在置信概率95%下,可期望在不同实验室内,用该方法测定同一试样,得到的任何两个独立分析结果间的绝对差值不应超过0.66mg/g。22220.150.170.23mg/gRrlsss2 22.83 0.230.66mg/gRRs3.2.7 测量不确定度(uncertaintyofmeasurement) 测量结果含有的一个参数,用以表征合理赋予被测量值的分散性。 (JJF1059 -1999) 该分散性可由若干成分组成,一些成分由观该分散性可由

45、若干成分组成,一些成分由观测列结果统计计算,由实验标准偏差表征,称测列结果统计计算,由实验标准偏差表征,称为为A类不确定度;另一些成分是由经验或其他类不确定度;另一些成分是由经验或其他信息的概率分布估计,也用假设存在的类似于信息的概率分布估计,也用假设存在的类似于标准偏差的量表征,称为标准偏差的量表征,称为B类不确定度。类不确定度。根据所获信息,表征赋予被测量值分散性的非负参数。(JJF1059.1-2011)注:注:1. 测量不确定度包括由系统影响引起的分量,测量不确定度包括由系统影响引起的分量,诸如与修正量和测量标准所赋量值有关的分量诸如与修正量和测量标准所赋量值有关的分量及定义的不确定度

46、。有时对估计的系统影响未及定义的不确定度。有时对估计的系统影响未作修正,而是当作不确定度分量处理。作修正,而是当作不确定度分量处理。2. 此参数可以是诸如称为标准测量不确定度的此参数可以是诸如称为标准测量不确定度的标准偏差(或其特定倍数),或是说明了包含标准偏差(或其特定倍数),或是说明了包含概率的区间半宽度。概率的区间半宽度。3. 测量不确定度一般由若干分量组成。其中测量不确定度一般由若干分量组成。其中一些分量可根据一系列测量值的统计分布,一些分量可根据一系列测量值的统计分布,按测量不确定度的按测量不确定度的A类评定进行评定,并用实类评定进行评定,并用实验标准偏差表征。而另一些分量则可根据经

47、验标准偏差表征。而另一些分量则可根据经验或其它信息假设的概率分布验或其它信息假设的概率分布,按测量不确定按测量不确定度的度的B类评定进行评定,也用标准偏差表征。类评定进行评定,也用标准偏差表征。4.通常对于一组给定的信息通常对于一组给定的信息,测量不确定度是测量不确定度是相应于所赋予被测量的量值的。该值的改变相应于所赋予被测量的量值的。该值的改变将导致相应的不确定度的改变。将导致相应的不确定度的改变。3.3分析结果的正确表达因为多次测定的数据有集中趋势和离散性两个特性,因此分析结果正确的表达就应该把这两部分都包括在内。曾有几种分析测试结果的表达式:(1)样本平均值平均偏差();(2)样本平均值

48、标准偏差();(3)个别测量值统计容许限()。但是前两个式子中的 或s,到底是指个别测量值x的平均偏差或标准偏差,还是指平均值 的平均偏差或标准偏差,都是不明确的;且也未说明样本容量n是多少,而没有n或自由度f的值,就无法对测定结果作区间估计,无法进行复验。第3个表达式指的是个别测量值。xddxsxksx还有一种表达式: 式中,真值的估计量; 多次测定结果的算术平均值;置信因子,与显著性水平 和自由度 f 有关的系数; s标准偏差; n测定次数。 式中, 即平均值的标准偏差,亦即对观测列(测量值)作统计分析所评定的标准不确定度,但这种表达方式未包含用不同于观测列作统计分析所评定的标准不确定度。

49、, fsxtn, ftx最佳的表达式: 或 式中 真值的估计量; 多次测定结果的算术平均值; u标准不确定度; U扩展不确定度。 xuxUx4 分析测试数据的可靠性检验测定值的合理误差范围测定值落在1以内的概率为68.26%测定值落在2以内的概率为95.45% 测定值落在3以内的概率为99.73% 在统计学上将出现概率小于5%的事件称为小概率事件。小概率事件在一次测定中是不可能发生的。分析测试中,在无特殊说明的情况下,通常将2s定为合理的误差范围。国家标准GB4883-1985规定,一组测定值中,与平均值的偏差超过2s的测定值称为异常值,超过3s的测定值称为高度异常的异常值。 对于异常值首先应

50、从技术上寻找其出现的原因,不能轻易地弃去。如找不到原因,应进行异常值统计检验,以检验结果决定是否舍去。 异常值统计检验方法很多,就常用方法中选择2种,作简单介绍。4.1 判定异常值的方法判定异常值的方法4.1.1Grubbs法法将数据从小到大排列:。 为可疑值时,统计量计算式为; 为可疑值时,统计量计算式为 。若或 (为Grubbs检验法的临界值,随置信概率和测定次数而改变,可查表得到),则相应的值可判定为离群值而舍去,反之则保留。 121,nnx xxx1x11xxGsnxnnxxGs1GGnGGGGrubbs法检验临界值表n34567891011121314151617180.011.15

51、51.4921.7491.9442.0972.2212.3232.4102.4852.5502.6072.6592.7052.7472.7852.8210.051.1531.4631.6721.8221.9382.0322.1102.1762.2342.2852.3312.3712.4092.4432.4752.504例:某实验室报出一组某标准物质中镍的定值数据:39.99%,40.16%,40.18%,40.20%,检验39.99%是否是异常值? 平均值和标准偏差为 计算统计量值查表Grubbs法检验临界值表 , ,所以39.99% 应保留。 40.13%xxn2()0.097%1ixxsn

52、1140.13% 39.99%1.4430.097%xxGs0.95,41.463G10.95,4GG4.1.2 Dixon法法将数据由小到大的顺序排列:按下表计算和值并查出值。若,且,则判定为异常值;若,且,则判定为异常值;若及值均小于值,则所有数据保留。121,nnx xxx1nrr1(, )nrQ1rnr( , )nQ1x1nrr(, )nnrQnx1rnr(, )nQDixon 法检验临界值表(双侧)n统统 计计 量量最小值最小值x1可疑时可疑时最大值最大值xn可疑时可疑时=0.05=0.0130.9700.99440.8290.92650.7100.82160.6280.74070.

53、5690.68080.6080.71790.5640.672100.5300.635110.6190.709120.5830.660130.5570.638( , )nQ21101nxxrxx211111nxxrxx1101nnnxxrxx1112nnnxxrxx312111nxxrxx2213nnnxxrxx例:某实验室对某标准物质中铜进行定值分析,采用Dixon法进行异常值检验。其测定值: , , , , , , , , , 按Dixon法 n=10时的公式计算: 查Dixon 法检验临界值表(双侧), ,因为 , ,因此,无异常值,全部数据保留。140.07%x 240.12%x 340

54、.13%x 440.13%x 540.16%x 640.16%x 740.16%x 840.18%x 940.18%x 1040.20%x21111140.12%40.07%0.45540.18%40.07%nxxrxx111240.20%40.18%0.25040.20%40.12%nnnxxrxx(0.05,10)0.530Q1(0.05,10)rQ(0.05,10)nrQ4.2精密度检验精密度检验标准偏差或方差反映了测量结果的精密度,是衡量分析操作条件是否稳定的一个重要标志。方差比较即精密度检验其重要性在于能发现异常情况。精密度检验的类型一个方差的检验检验两个方差的检验 F 检验多个方差

55、的检验Cochran检验24.2.1一个方差的检验 检验检验适用于总体方差已知的情况。若x1,x2,.xn遵从正态分布N(,2) ,统计量:式中分子是差方和 ,反映了样本离散的程度,分母 是总体方差。比值 太大或太小,都说明方差或标准偏差有改变,所检验的样本已不属于原来的总体。22222()(1)ixxns2()iQxx222例:用ICP-AES法测定催化剂中钯。仪器进行检修,检修前,;检修后, (n=6),问检修后仪器性能是否有变化?计算统计量f=(n-1)=(6-1)=5,0.05 查表,所以,表明仪器检修前后性能没有发生显著性变化,检修后仪器处于正常的水平。220.18220.20s 2

56、2222(1)(1) 0.206.180.18nsn220.05,511.07220.05,56.1811.074.2.2两个方差的检验 F 检验总体方差未知时,可用F 检验比较两个样本的方差。统计量:式中总是固定方差值较大者为,作为分子;值较小者为,作为分母。F临界值随显著性水平和自由度 f 而变,记作。 若 表示 显著地大于 ,两者有显著性差别,若,表示两个方差没有显著性差别。2122sFs21s21s12,ffF12,ffFF21s22s12,ffFF例:A、B两位分析人员分析同一试样,结果如下:w/%A :95.60,94.93,96.20,95.12,95.81,96.34,96.0

57、3;B :93.33,95.12,94.14,95.13,95.63,94.03;问两者测定精密度没有显著性差异?(双侧检验, 0.05) , , , , ,计算统计量值因是双侧检验,查临界值表(单侧)时,应为0.05/2=0.025,说明A、B两人分析结果没有显著性差异。 A95.72%w2A0.29sA16fn B94.53%w2B0.76sB15fn 2B2A0.762.620.29sFs0.025,5,65.99F0.025,5,6FF4.2.3多个方差的检验Cochran检验 可用Cochran法检验两个以上的方差,即各样本数据间是否等精密度。 统计量: 2m ax21miisCs

58、式中 是被检验的各样本数据的方差中最大的方差,分母是 m个样本数据全部方差的加和。当计算的实验统计量值C大于约定显著性水平 时的临界值C(,m,)(=n-1),则表示 与其余的方差有显著性差异,须将该样本数据删去(为慎重起见,在实际使用时,一般把 的最大方差样本的数据弃去,而 的大方差样本的数据进行认真研究后决定取舍)。此时n 取接近于多数实验数据的测量次数。 这种方法可用于方差的连续检验。 2maxs2maxs(0.01, )mCC(0.05, , )(0.01, , )mmCCC例:由9个实验室,用同一方法对铜合金标准物质中镍进行定值,数据如下,检验各实验室数据是否等精密度?计算各实验室数

59、据的方差:测定值测定值编号编号实验室编号实验室编号1234567891234561.0651.0811.0811.0641.1071.0771.0731.0811.0771.0501.0771.0771.0801.0901.0701.0801.0901.1001.0971.1091.0731.0891.0971.0971.0531.0551.0591.0591.0531.0511.0841.0441.0841.0761.0931.0731.0611.0501.0471.1181.0571.0781.0521.0611.0731.0361.0481.0401.0231.0491.3161.118

60、1.3221.483实验室实验室编号编号123456789方差方差2.4210-41.2810-41.1010-41.4310-40.1710-42.9010-47.0710-41.8710-424810-4由各实验室数据的方差表知, (9号实验室数据的方差);9个实验室数据全部方差的加和:计算统计量值:查表3-5 Cochran检验临界值C(,m,),因 ,所以 是异常值。2max0.0248s9210.0266iis2max9210.02480.9320.0266iisCs0.01,9,5(0.932)(0.387)CC29s舍弃9号实验室数据后,作第二次Cochran检验(考察7号实验室

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论