少量次测量数据的统计处理概要课件_第1页
少量次测量数据的统计处理概要课件_第2页
少量次测量数据的统计处理概要课件_第3页
少量次测量数据的统计处理概要课件_第4页
少量次测量数据的统计处理概要课件_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.少量次测量数据的统计处理分析测试工作中,通过样本研究总体,由于测量次数有限,σ和μ无从知道,如何处理和评价少量次数测定结果的数据?而对多次测定的结果平均值又如何评价?在前面己讨论的基础上,讨论下面的问题:3.少量次测量数据的统计处理分析测试工作中,通过样本研究总1几个基本概念(1)统计量t值(2)t分布曲线(3)平均值的标准偏差(4)平均值标准偏差与测量次数的关系(5)平均值的置信区间(6)置信度与置信水平几个基本概念(1)统计量t值2(1)统计量t分析化学中通过样本研究总体,由于测量次数有限,σ和μ无从知道。英国统计学与化学家Gosset提出用t分布解决了这一问题。使不致因为用s代替σ而引起对正态分布的偏离。(1)t分布和t分布曲线,统计量t,定义为:

(1)统计量t分析化学中通过样本研究总体,由于测量次数有限,3(2)t分布曲线f=1,5,∞英国的统计学兼化学家Gosset用笔名“Student”发表论文提出t分布,故得名。

t分布曲线展示:T分布曲线随自由度f变化;当f=∞时,t分布则为正态分布,(2)t分布曲线f=1,5,∞英国的统计学兼化学家Gos4t分布曲线t分布曲线与横坐标t某区间所夹面积,与正态分布曲线一样,表示测量值落在该区间的概率。显然,若选定某一概率和一定的自由度f,则t值也就一定。由于t值与置信度及自由度有关,故其表示为:tα,f。t分布曲线t分布曲线与横坐标t某区间所夹面积,与正5t值表(双边)f=n-1置信度P,显著性水准α

f=n-1置信度P,显著性水准αP=0.90α=0.10P=0.95α=0.05P=0.99α=0.01P=0.90α=0.10P=0.95α=0.05P=0.99α=0.0116.3112.7163.6671.902.363.5022.924.309.9281.862.313.3632.353.185.8491.832.263.2542.132.784.60101.812.233.1752.022.574.03201.722.092.8461.942.453.71∞1.641.962.58t值表(双边)置信度P,显著性水准α置信度P,显著性水准αP6t值表的意义前表为最常用的t值表。表中的P称为置信度,表示随机测定值落在(μ±ts)区间内的概率,称为显著性水准,用α表示,即α=1-P。应用表时须加脚注,注明显著性水准和自由度,例如:t0.05,9是指:置信度为95%(显著性水准为0.05),自由度为9时的t值。t值表的意义前表为最常用的t值表。表中的P称为置信7称为平均值的标准偏差(平均值与总体平均值μ相符的程度),与样本容量n有关,即:-平均值的标准偏差统计量t的表达式中:(3)称为平均值的标准偏差(平均值8(4)平均值标准偏差与测量次数的关系从图中可见,当测定次数n>10时,的值降低己不明显。所以,一般的测定平行做3~4次,要求较高的5~6次,要求更高的测定做10~12次也足够了。(4)平均值标准偏差与测量次数的关系从图中可见,当测定次数n9(5)平均值与真值的关系

——平均值的置信区间用样本研究总体时,样本均值x并不等于总体均值μ,但可以肯定,只要消除了系统误差,在某一置信度下,一定存在着一个以样本均值x为中心,包括总体均值μ在内的某一范围,称为平均值的置信区间。由t的定义式得:(5)平均值与真值的关系

——平均值的置信区间用样本研究总体10置信区间式中称为置信区间,其大小取决于测定的标准偏差、测定次数和置信度的选择,置信区间愈小平均值愈接近总体平均值μ。(→

μ

)置信区间式中称为置11(6)置信度与显著水平例:对某一钢样含磷量平行测定了四次,平均值为0.0087%。己知标准误差σ=0.0022,下面有三种结果报告,第一种报告:表示的意义:有68.3%把握认为本钢样磷含量的真值落在0.0087±0.0011(%)范围内。(6)置信度与显著水平例:对某一钢样含磷量平行测定了四次,平12例:磷含量的第二种报告同理,但本式的表示的意义为:有95.5%把握认为本钢样磷含量的真值落在0.0087±0.0022(%)范围内。例:磷含量的第二种报告同理,但本式的表示的意义为:有95.513例:磷含量的第三种报告同理,但本式的表示的意义为:有99.7%把握认为本钢样磷含量的真值落在0.0087±0.0033(%)范围内。例:磷含量的第三种报告同理,但本式的表示的意义为:有99.714三种结果报告式的小结三种表达式区别在:平均值±1标准误差平均值±2标准误差平均值±3标准误差三种结果报告式的小结三种表达式区别在:152、两个概念:置信度与显著水平置信度(P):例中有68.3%把握、95.5%把握和99.7%把握)称为置信度也称置信水平;显著性水平(α):在上面三个区间外的概率称为显者性水平。2、两个概念:置信度与显著水平置信度(P):例中有68.3%16置信度(P)与显著性水平(α)的关系两者的关系为:α=1-P例:α(显著性水平)=0.05时,则p(置信度)=1-0.05=0.95即等于95%置信度的选择应合适,一般的判断若有90%或95%把握,则以为这种判断基本正确。在统计学中通常取95%置信度。处理分析测试的数据时,也取95%的置信度。当然并非绝对,根据具体的情况有时也取90%或99%。置信度(P)与显著性水平(α)的关系两者的关系为:α=1-P174、可疑数据的取舍一组数据中,可能有个别数据与其他数据差异较大,称为可疑值。除确定是由于过失所造成的可疑值可以舍弃外,可疑值是否要保留,应用统计学的方法来判断,不能任凭主观意愿决定取舍。常用的可疑值取舍方法有:4法Q检验法格鲁布斯法4、可疑数据的取舍一组数据中,可能有个别数据与其他数据差异较18若一总体服从正态分布,x-μ大于±3σ的测量值出现的概率很小,其误差往往不是随机误差所致,应舍去。当然,其条件是在校正了系统误差之后。又总体的标准偏差σ与总体平均偏差δ两者的关系是δ≈0.8σ,用样本平均偏差代替δ,则≈3σ。这样,便可将可疑值与之差是否大于

作为可疑值取舍的根据。检验法若一总体服从正态分布,x-μ大于±3σ的测量值出现的概194d检验法应用法时,可先把可疑值除外,求出余下测量值的和,若可疑值与之差的绝对值大于,可疑值舍弃,否则保留。4d检验法应用法时,可先把可疑值除外,求出余20Q检验法此法是将数据从小到大排列,如:设为可疑值,按下式求统计量Q,Q称为舍弃商。Q检验法此法是将数据从小到大排列,如:21Q检验法

值与置信度和测量次数有关,如表所示。上式的分母是极差,分子是可疑值与最临近值之差,Q与值比较,若,可疑值应舍弃,否则保留,若是可疑值,Q从下式求出:Q检验法22Q检验法Q值表测定次数n345678910置信度90%()0.940.760.640.560.510.470.440.4196%()0.980.850.730.640.590.540.510.4899%()0.990.930.820.740.680.630.600.57Q检验法Q值表测定次数345678910置信度90%023格鲁布斯法该法用到正态分布中反映测量值集中与波动的两数和S,因而可靠性较高。应用此法时,在计算了和S后,将测量值从小到大排列,同Q检验法一样,应按测量次数多少,确定检验或,若两个都做检验,设X1为可疑值,由下式求统计量T:格鲁布斯法该法用到正态分布中反映测量值集中与波动的两数24格鲁布斯法把T与表值比较,若,可疑值舍弃,否则保留,若为可疑值,T由下式求出:

值与测定次数和显著性水准有关,如表所示。格鲁布斯法把T与表值比较,若25格鲁布斯法

值表测定次数,n显著性水平α测定次数,n显著性水平α0.050.0250.010.050.0250.0131.151.151.15

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论