测定次数置信度P课件_第1页
测定次数置信度P课件_第2页
测定次数置信度P课件_第3页
测定次数置信度P课件_第4页
测定次数置信度P课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一讲第三章误差和分析数据和得理11-1

3-4有限测定数据的统计处理一、置信度与m的置信区间

日常分析中测定次数是很有限的,总体平均值自然不为人所知。但是随机误差的分布规律表明,测定值总是在以m为中心的一定范围内波动,并有着向μ集中的趋势。因此,如何根据有限的测定结果来估计μ可能存在的范围(称之为置信区间)是有实际意义的。该范围愈小,说明测定值与m愈接近,即测定的准确度愈高。但由于测定次数毕竟较少,由此计算出的置信区间也不可能以百分之百的把握将m包含在内,只能以一定的概率进行判断。

1第十一讲第三章

第十一讲第三章误差和分析数据和得理11-2

(一)已知总体标准偏差σ时对于经常进行测定的某种试样,由于已经积累了大量的测定数据,可以认为σ是已知的。根据(3-14)式并考虑u的符号可得:由随机误差的区间概率可知,测定值出现的概率由u决定。例如,当u=±1.96时。x在μ-1.96σ至μ+1.96σ区间出现的概率为0.95。如果希望用单次测定值x来估计μ可能存在的范围,则可以认为区间x±1.96σ能以0.95的概率将真值包含在内。即有2第十一讲

第十一讲第三章误差和分析数据和得理11-3

由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有式(3-14b)和式(3-17)分别表示在一定的置信度时,以单次测定值x或以平均值为中心的包含真值的取值范围,即m的置信区间。在置信区间内包含m的概率称为置信度,它表明了人们对所作的判断有把握的程度,用P表示。u值可由表3-1中查到,它与一定的置信度相对应。3第十一讲

第十一讲第三章误差和分析数据和得理11-4

在对真值进行区间估计时,置信度的高低要定得恰当。一般以95%或90%的把握即可。式(3-14b)和式(3-17)还可以看出置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关。当σ一定时,置信度定得愈大,∣u∣值愈大,过大的置信区间将使其失去实用意义。若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或越接近真值,即测定的准确度越高。例题1:

4第十一讲

第十一讲第三章误差和分析数据和得理11-5

注意:m是确定且客观存在的,它没有随机性。而区间x±uσ或是具有随机性的,即它们均与一定的置信度相联系。因此我们只能说置信区间包含真值的概率是0.95,而不能认为真值落在上述区间的概率是0.95。

(二)已知样本标准偏差s时

在实际工作中,通过有限次的测定是无法得知m和σ的,只能求出和s。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用s代替s从而对m作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正。

5第十一讲

第十一讲第三章误差和分析数据和得理11-5

t分布法:t值的定义:

(3-18)

t分布是有限测定数据及其随机误差的分布规律。t分布曲线见图3-6,其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示。显然,在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分布与测定次数有关有实质。由图3-6可知,随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可以认为正态分布就是t的极限。6第十一讲

第十一讲第三章误差和分析数据和得理11-7

图3-6t分布曲线f=∞f=5f=17第十一讲

第十一讲第三章误差和分析数据和得理11-8

与正态分布曲线一样,t分布曲线下面某区间的面积也表示随机误差在此区间的概率。但t值与标准正态分布中的u值不同,它不仅与概率还与测定次数有关。不同置信度和自由度所对应的t值见表3-2中。

8第十一讲

第十一讲第三章误差和分析数据和得理11-9

表3-2tP,f值表(双边)

t值P90%95%99%99.5%f(n-1)

16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.042.75(3.01)601.672.002.66(2.87)1201.661.982.622.81∞1.641.962.582.819第十一讲

第十一讲第三章误差和分析数据和得理11-10

由表3-2中的数据可知,随着自由度的增加,t值逐渐减小并与u值接近。当f=20时,t与u已经比较接近。当f→∞时,t→u,S→σ。在引用t值时,一般取0.95置信度。根据样本的单次测定值x或平均值分别表示μ的置信区间时,根据t分布则可以得出以下的关系:

10第十一讲

第十一讲第三章误差和分析数据和得理11-11

式(3-18a)和式(3-19)的意义在于,真值虽然不为所知(σ也未知),但可以期望由有限的测定值计算出一个范围,它将以一定的置信度将真值包含在内。该范围越小,测定的准确度越高。例题2:式(3-19)是计算置信区间通常使用的关系式。由该式可知,当P一定时,置信区间的大小与tP,f、S、n均有关,而且tP,f与S实际也都受n的影响,即n值越大,置信区间越小。例3:二、可疑测定值的取舍

平行测定的数据中,有时会出现一二个与其结果相关较大的测定值,称为可疑值或异常值。对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。11第十一讲

第十一讲第三章误差和分析数据和得理11-12

对可疑值的取舍实质是区分可疑值与其它测定值之间的差异到底是由过失、还是随机误差引起的。如果已经确证测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再作出判断。根据随机误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍去,否则就予以保留。

(一)Q检验法

将测定值由小至大按顺序排列,其中可疑值为x1或xn。12第十一讲

第十一讲第三章误差和分析数据和得理11-13

求出可疑值与其最邻近值之差xn-xn-1或x2-x1,然后用它除以极差xn-x1,计算出统计量Q:或(3-20)

Q值越大,说明离群越远,远至一定程度时则应将其舍去。故Q称为舍弃商。根据测定次数n和所要求的置信度P查QP,n值表3-3。若Q>QP,n,则以一定的置信度弃去可疑值,反之则保留,分析化学中通常取0.90的置信度。13第十一讲

第十一讲第三章误差和分析数据和得理11-14

表3-3QP,n值表nP345678910Q0.90.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49

如果测定数据较少,测定的精密度也不高,因Q与QP,n值接近而对可疑值的取舍难以判断时,最好补测1-2次再进行检验就更有把握。如果没有条件再做测定,则宜用中位数代替平均值报告结果。因是否取舍可疑值对平均值的影响较大,对中位值的影响较小。14第十一讲

第十一讲第三章误差和分析数据和得理11-14

(二)格鲁布斯法

将测定值由小至大按顺序排列,其中可疑值为x1或xn。先计算该组数据的平均值和标准偏差,再计算统计量G。若x1可疑,若xn可疑,15第十一讲

第十一讲第三章误差和分析数据和得理11-16

根据事先确定的置信度和测定次数查表3-4。若G>GP,n,说明可疑值对相对平均值的偏离较大,则以一定的置信度弃去可疑值,反之则保留。在运用格鲁布斯法判断可疑值的取舍时,由于引入了t分布中最基本的两个参数己和s,故该方法的准确度较Q法高,因此得到普遍采用。16第十一讲

第十一讲第三章误差和分析数据和得理11-17

表3-4GP,n值表测定次数置信度(P)测定次数置信度(P)

n95%99%n95%99%31.151.15122.292.5541.461.49132.332.6151.671.75142.372.6661.821.94152.412.7171.942.10162.442.7582.032.22172.472.7992.112.32182.502.82102.182.41192.532.85112.232.48202.562.8817第十一讲

第十一讲第三章误差和分析数据和得理11-18

三、显著性检验用统计的方法检验测定值之间是否存在显著性差异,以此推断它们之间是否存在系统误差,从而判断测定结果或分析方法的可靠性,这一过程称为显著性检验。定量分析中常用的有t检验法和F检验法。

(一)样本平均值与真值的比较(t检验法)

t检验法用来检验样本平均值或两组数据的平均值之间是否存在显著性差异,从而对分析方法的准确度作出评价。18第十一讲

第十一讲第三章误差和分析数据和得理11-19

当检验一种分析方法的准确度时,采用该方法对某标准试样进行数次测定,再将样本平均值与标准值T进行比较。则置信区间的定义可知,经过n次测定后,如果以平均值为中心的某区间已经按指定的置信度将真值T包含在内,那么它们之间就不存在显著性差异,根据t分布,这种差异是仅由随机误差引起的。t可由下式计算:若t>tP,f,说明与T之差已超出随机误差的界限,就可以按照相应的置信度判断它们之间存在显著性差异。19第十一讲

第十一讲第三章误差和分析数据和得理11-20

进行显著性检验时,如置信度定得过低,则容易将随机误差引起的差异判断为显著性差异,如置信度定得过高,又可能将系统误差引起的不一致认同为正常差异,从而得出不合理的结论。在定量分析中,常采用0.95或0.90的置信度。

(二)两组数据平均值之间的比较(F检验法和t检验法)(自学)在显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平,用a表示,即这些测定值位于一定置信度所对应的随机误差界限之外。如置信度P=0.95,则显著水平a=0.05,即a=1-P。20第十一讲

第十一讲第三章误差和分析数据和得理11-21

例1、用标准方法平行测定钢样中磷的质量分数4次,其平均值为0.087%。设系统误差已经消除,且σ=0.002%。(1)计算平均值的标准偏差;(2)求该钢样中磷含量的置信区间。置信度为P=0.95。(2)已知P=0.95时,u=±1.96。根据解:(1)21第十一讲

第十一讲第三章误差和分析数据和得理11-22

例2、标定HCl溶液的浓度时,先标定3次,结果为0.2001mol/L、0.2005mol/L和0.2009mol/L;后来又标定2次,数据为0.2004mol/L和0.2006mol/L。试分别计算3次和5次标定结果计算总体平均值μ的置信区间,P=0.95。解:标定3次时,标定5次时,22第十一讲

第十一讲第三章误差和分析数据和得理11-23

例3、测定某试样中SiO2质量分数得s=0.05%。若测定的精密度保持不变,当P=0.95时,欲使置信区间的置信限,问至少应对试样平行测定多少次?解:根据式(3-19)和题设得:已知s=0.05%,故:查表3-2得知,当f=n-1=5时,t0.95,5=2.57,此时。即至少应平行测定6次,才能满足题中的要求。23第十一讲

第十一讲第三章误差和分析数据和得理11-1

3-4有限测定数据的统计处理一、置信度与m的置信区间

日常分析中测定次数是很有限的,总体平均值自然不为人所知。但是随机误差的分布规律表明,测定值总是在以m为中心的一定范围内波动,并有着向μ集中的趋势。因此,如何根据有限的测定结果来估计μ可能存在的范围(称之为置信区间)是有实际意义的。该范围愈小,说明测定值与m愈接近,即测定的准确度愈高。但由于测定次数毕竟较少,由此计算出的置信区间也不可能以百分之百的把握将m包含在内,只能以一定的概率进行判断。

24第十一讲第三章

第十一讲第三章误差和分析数据和得理11-2

(一)已知总体标准偏差σ时对于经常进行测定的某种试样,由于已经积累了大量的测定数据,可以认为σ是已知的。根据(3-14)式并考虑u的符号可得:由随机误差的区间概率可知,测定值出现的概率由u决定。例如,当u=±1.96时。x在μ-1.96σ至μ+1.96σ区间出现的概率为0.95。如果希望用单次测定值x来估计μ可能存在的范围,则可以认为区间x±1.96σ能以0.95的概率将真值包含在内。即有25第十一讲

第十一讲第三章误差和分析数据和得理11-3

由于平均值较单次测定值的精密度更高,因此常用样本平均值来估计真值所在的范围。此时有式(3-14b)和式(3-17)分别表示在一定的置信度时,以单次测定值x或以平均值为中心的包含真值的取值范围,即m的置信区间。在置信区间内包含m的概率称为置信度,它表明了人们对所作的判断有把握的程度,用P表示。u值可由表3-1中查到,它与一定的置信度相对应。26第十一讲

第十一讲第三章误差和分析数据和得理11-4

在对真值进行区间估计时,置信度的高低要定得恰当。一般以95%或90%的把握即可。式(3-14b)和式(3-17)还可以看出置信区间的大小取决于测定的精密度和对置信度的选择,对于平均值来说还与测定的次数有关。当σ一定时,置信度定得愈大,∣u∣值愈大,过大的置信区间将使其失去实用意义。若将置信度固定,当测定的精密度越高和测定次数越多时,置信区间越小,表明x或越接近真值,即测定的准确度越高。例题1:

27第十一讲

第十一讲第三章误差和分析数据和得理11-5

注意:m是确定且客观存在的,它没有随机性。而区间x±uσ或是具有随机性的,即它们均与一定的置信度相联系。因此我们只能说置信区间包含真值的概率是0.95,而不能认为真值落在上述区间的概率是0.95。

(二)已知样本标准偏差s时

在实际工作中,通过有限次的测定是无法得知m和σ的,只能求出和s。而且当测定次数较少时,测定值或随机误差也不呈正态分布,这就给少量测定数据的统计处理带来了困难。此时若用s代替s从而对m作出估计必然会引起偏离,而且测定次数越少,偏离就越大。如果采用另一新统计量tP,f取代u(仅与P有关),上述偏离即可得到修正。

28第十一讲

第十一讲第三章误差和分析数据和得理11-5

t分布法:t值的定义:

(3-18)

t分布是有限测定数据及其随机误差的分布规律。t分布曲线见图3-6,其中纵坐标仍然表示概率密度值,横坐标则用统计量t值来表示。显然,在置信度相同时,t分布曲线的形状随f(f=n-1)而变化,反映了t分布与测定次数有关有实质。由图3-6可知,随着测定次数增多,t分布曲线愈来愈陡峭,测定值的集中趋势亦更加明显。当f→∞时,t分布曲线就与正态分布曲线合为一体,因此可以认为正态分布就是t的极限。29第十一讲

第十一讲第三章误差和分析数据和得理11-7

图3-6t分布曲线f=∞f=5f=130第十一讲

第十一讲第三章误差和分析数据和得理11-8

与正态分布曲线一样,t分布曲线下面某区间的面积也表示随机误差在此区间的概率。但t值与标准正态分布中的u值不同,它不仅与概率还与测定次数有关。不同置信度和自由度所对应的t值见表3-2中。

31第十一讲

第十一讲第三章误差和分析数据和得理11-9

表3-2tP,f值表(双边)

t值P90%95%99%99.5%f(n-1)

16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.042.75(3.01)601.672.002.66(2.87)1201.661.982.622.81∞1.641.962.582.8132第十一讲

第十一讲第三章误差和分析数据和得理11-10

由表3-2中的数据可知,随着自由度的增加,t值逐渐减小并与u值接近。当f=20时,t与u已经比较接近。当f→∞时,t→u,S→σ。在引用t值时,一般取0.95置信度。根据样本的单次测定值x或平均值分别表示μ的置信区间时,根据t分布则可以得出以下的关系:

33第十一讲

第十一讲第三章误差和分析数据和得理11-11

式(3-18a)和式(3-19)的意义在于,真值虽然不为所知(σ也未知),但可以期望由有限的测定值计算出一个范围,它将以一定的置信度将真值包含在内。该范围越小,测定的准确度越高。例题2:式(3-19)是计算置信区间通常使用的关系式。由该式可知,当P一定时,置信区间的大小与tP,f、S、n均有关,而且tP,f与S实际也都受n的影响,即n值越大,置信区间越小。例3:二、可疑测定值的取舍

平行测定的数据中,有时会出现一二个与其结果相关较大的测定值,称为可疑值或异常值。对于为数不多的测定数据,可疑值的取舍往往对平均值和精密度造成相当显著的影响。34第十一讲

第十一讲第三章误差和分析数据和得理11-12

对可疑值的取舍实质是区分可疑值与其它测定值之间的差异到底是由过失、还是随机误差引起的。如果已经确证测定中发生过失,则无论此数据是否异常,一概都应舍去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再作出判断。根据随机误差分布规律,在为数不多的测定值中,出现大偏差的概率是极小的,因此通常就认为这样的可疑值是由过失所引起的,而应将其舍去,否则就予以保留。

(一)Q检验法

将测定值由小至大按顺序排列,其中可疑值为x1或xn。35第十一讲

第十一讲第三章误差和分析数据和得理11-13

求出可疑值与其最邻近值之差xn-xn-1或x2-x1,然后用它除以极差xn-x1,计算出统计量Q:或(3-20)

Q值越大,说明离群越远,远至一定程度时则应将其舍去。故Q称为舍弃商。根据测定次数n和所要求的置信度P查QP,n值表3-3。若Q>QP,n,则以一定的置信度弃去可疑值,反之则保留,分析化学中通常取0.90的置信度。36第十一讲

第十一讲第三章误差和分析数据和得理11-14

表3-3QP,n值表nP345678910Q0.90.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49

如果测定数据较少,测定的精密度也不高,因Q与QP,n值接近而对可疑值的取舍难以判断时,最好补测1-2次再进行检验就更有把握。如果没有条件再做测定,则宜用中位数代替平均值报告结果。因是否取舍可疑值对平均值的影响较大,对中位值的影响较小。37第十一讲

第十一讲第三章误差和分析数据和得理11-14

(二)格鲁布斯法

将测定值由小至大按顺序排列,其中可疑值为x1或xn。先计算该组数据的平均值和标准偏差,再计算统计量G。若x1可疑,若xn可疑,38第十一讲

第十一讲第三章误差和分析数据和得理11-16

根据事先确定的置信度和测定次数查表3-4。若G>GP,n,说明可疑值对相对平均值的偏离较大,则以一定的置信度弃去可疑值,反之则保留。在运用格鲁布斯法判断可疑值的取舍时,由于引入了t分布中最基本的两个参数己和s,故该方法的准确度较Q法高,因此得到普遍采用。39第十一讲

第十一讲第三章误差和分析数据和得理11-17

表3-4GP,n值表测定次数置信度(P)测定次数置信度(P)

n95%99%n95%99%31.151.15122.292.5541.461.49132.332.6151.671.75142.372.6661.821.94152.412.7171.942.10162.442.7582.032.22172.472.7992.112.32182.502.82102.182.41192.532.85112.232.48202.562.8840第十一讲

第十一讲

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论