




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分析化学中的数据处理第一页,共48页。设样本容量为n,则其平均值为当测量次数无限多时,所得平均值即为总体平均值μ:
(2-1)若没有系统误差,则总体平均值µ就是真实值在分析化学中,广泛采用标准偏差来衡量数据的分散(离散)程度第一页第二页,共48页。①总体标准偏差当测量次数为无限多次时,各测量值对总体平均值µ的偏离,用总体标准偏差σ表示:(2-2)②样本标准偏差当测量值不多,总体平均值又不知道时,用样本的标准偏差s来衡量该组数据的分散程度。第二页第三页,共48页。当测量次数非常多时,测量次数n与自由度(n-1)的区别就很小了,此时即
同时s③平均值的标准偏差(P58)单次测定值的标准差S反映的是单次测定值之间的离散性平均值的标准差反映的是若干组平行测定,各平均值之间的离散性第三页第四页,共48页。若对某试样作若干批测定,每批又作n个平行测定则(2-4)由此可见:①平均值的精密度比单次测定的精密度更好,;平均值的标准偏差与测定次数的平方根成反比.②增加测定次数,可使平均值的标准偏差减小。作关系图如P59图3-5所示。第四页第五页,共48页。
开始时,随减少很快,n>5变化较慢,而当n>10时,变化很小,进一步增加测定次数,徒劳无益,对提高分析结果可靠性并无更多好处。实际中,一般的分析作3~5次平行测定即可,而标样、物理常数、原子量的测定则次数较多第五页第六页,共48页。随机误差是由一些偶然因素造成的误差,其大小、方向都不固定,难以预计,不能测量也无法消除。它的出现似乎很不规律,但实质上,它的出现和分布服从统计规律§2.2随机误差的正态分布(P53)第六页第七页,共48页。它在概率统计中占有特别重要的地位,因为许多随机变量都服从或近似服从正态分布,分析测定中的随机误差也是这样的,P55图3-3即为正态分布曲线,它的数学表达式为:
(2-5)式中y-为概率密度x-为测量值1.正态分布(高斯GAUSS分布)第七页第八页,共48页。µ-为总体平均值,即无限次测定数据的平均值,相应于曲线最高点的横坐标值,在没有系统误差时,它即为真值,它反映无限个测量数据分布的集中趋势σ-总体标准偏差,是µ到曲线两拐点之一的距离,它表征数据的分散程度,σ小,数据集中,曲线瘦高;σ大,数据分散,曲线矮胖。X-µ表示随机误差,若以X-µ为横坐标,则曲线最高点横坐标为0,即为随机误差的正态分布曲线第八页第九页,共48页。由图可看到随机误差有以下规律性:1)偏差大小相等、符号相反的测定值出现的概率大致相等2)偏差小的测定值比偏差较大的测定值出现的概率大,偏差很大的测定值出现的概率极小,趋近于03)大多数测定值集中在µ的附近,所以µ为最可信赖值或最佳值第九页第十页,共48页。正态分布曲线随µ、σ值不同而不同,应用起来不方便,为此,采用变量转换的方法,将其化为同一分布-标准正态分布即令代入(2-5)式得又所以第十页第十一页,共48页。即将式(2-5)转化为只有变量u的方程
(2-6)因此曲线的形状与σ大小无关,即不同σ曲线皆合为一条标准正态分布曲线见P56图3-4第十一页第十二页,共48页。第十二页第十三页,共48页。正态分布曲线与横坐标-∞到+∞之间所夹的面积代表全部数据出现概率的总和,显然应当是100%,即为1P=(2-7)随机误差或测量值在某一区间出现的概率可取不同u值对式(2-7)进行定积分,求得面积(即为概率),并制得标准正态分布概率积分表。表的形式有很多种,为了区别,在表上方一般绘图说明表中所列值是什么区间的概率,表中列出的面积与图中阴影部分相对应(P57表3-2),表示随机误差在此区间的概率,若是求区间的概率,利用正态分布的对称性,必须乘以22.随机误差的区间概率第十三页第十四页,共48页。随机误差出现的区间测量值出现的区间概率P2×0.3413=68.3%2×0.4773=95.5%2×0.4953=99.1%2×0.4987=99.7%第十四页第十五页,共48页。从计算结果可知,95%以上的测量值都会落在范围内,随机误差x-μ超过的大误差(或测量值)出现的概率<0.3%,一般化学分析是作几次测定,所以可以认为实际上是不可能出现的,如一旦出现,可认为其不是由于随机因素引起的,应弃去。例:P57例7、例8、例9第十五页第十六页,共48页。
对无限次测量而言,总体平均值µ衡量数据的集中趋势,总体标准差σ反映了数据的离散程度,但是,分析化学中常常只作有限次测定。下面将讨论如何通过有限次测定结果对µ和σ进行估计,从而合理地推断总体的特性
§2.3少量数据的统计处理第十六页第十七页,共48页。正态分布是无限次测量数据的分布规律,而实际测定只能是有限次,其分布规律不可能完全相同。英国的统计学家兼化学家戈塞特(W.S.GOSSET)提出了t分布规律
(2-8)(书P60公式3-29有误)
平均值的标准偏差一.有限次测量时的随机误差第十七页第十八页,共48页。µ-总体平均值,无系统误差时就是真值,t分布曲线如图2-2(P60图3-6)所示,纵坐标仍为概率密度,横坐标为t,t分布曲线与正态分布曲线相似,只是①t分布曲线随自由度f(f=n-1)而改变,当时,,t分布曲线即正态分布曲线。第十八页第十九页,共48页。②与正态分布曲线一样,t分布曲线下面一定范围内的面积,即是该范围内测定值出现的概率,但应注意,对于正态分布曲线,只要u值一定,相应的概率也就一定;但对于t分布曲线,当t一定时,由于f不同,相应曲线所包括的面积,即概率也就不同。为此引入置信度的概念,置信度P-人们对所作判断的把握程度,其实质为某事件出现的概率,在此表示某一t值时,平均值落在()区间内的概率。落在此范围之外的概率为(1-P)称为显著性水平,用α表示。第十九页第二十页,共48页。③不同概率P与f值所对应的t值,表示为tα,f。如t0.05,10
代表置信度95%,自由度为10时的t值。t值表见书P61表3-3,概率P都是指双边值,即虽然表中所列的t值均为正值,实际上每个t值对应的概率p是指直线t=-t表和t=t表之间所夹曲线下的面积,例如:当f=3,p=0.95时,t0.05,3
=3.18,是指在自由度f=3的那条t分布曲线下,直线t=-3.18与直线t=3.18之间所夹的面积为0.95。第二十页第二十一页,共48页。④理论上当f=∞时,各置信度对应的t值才与u值一致,但实际当f=20时,t与u已很接近。第二十一页第二十二页,共48页。
多次重复测定得到一系列测定值,在报告分析结果时,要反映出数据的集中趋势和分散性,一般采用下列三项值,①-是总体μ的最佳估计值,反映数据的集中趋势。②S-是σ的估计值,反映数据的离散程度。③测定次数n-用于求自由度f,反映数据的可靠程度二.一般分析结果的统计表示法第二十二页第二十三页,共48页。例测某铁矿样中Fe的含量,得:37.45%,37.30%,37.20%,37.50%,37.25%,报告分析结果解:=37.34%di(i=1,2…..5)分别为:+0.11,-0.04,-0.14,+0.16,-0.09(%)所以分析结果报告如下:=37.34%,s=0.13%,n=5第二十三页第二十四页,共48页。注意:1)S结果保留几位,要根据值而定,如=0.9987,则s可为0.0015,也可写为0.002,最多与可疑位“7”相齐。2)如无%,则s不带%,如=20.36%,s可写为0.04%,此时才用“%”第二十四页第二十五页,共48页。
在一定置信度上,根据(样本)估计µ(总体平均值)可能存在的区间,只有当,,显然做不到,少数测量得到的总带有一定的不确定性,所以只能在一定置信度上,根据对µ可能存在的区间作出估计由t分布(2-8)式(2-9)这表示在一定置信度下,以平均值为中心,包括总体平均值µ范围,就叫平均值的置信区间(P61)。三.平均值的置信区间(P61)第二十五页第二十六页,共48页。例1:已知=35.21%,S=0.06%,n=4,求P=0.95,0.99时,平均值的置信区间解:P=0.95,t0.05,3
=3.18
理解为:在区间中包括总体平均值µ的把握(概率)有95%。P=0.99t0.01,3
=5.84µ参P62例10第二十六页第二十七页,共48页。置信度越高,t曲线下面积越大,置信区间就越大,即所估计的区间包括真值的可能性也就越大。P=100%,则意味着区间无限大,肯定会包括真值,这样的区间毫无意义;置信度定得太低则不能保证判断的可靠性。分析中通常将P定在95%或90%第二十七页第二十八页,共48页。(一)显著性检验在分析工作中常遇到这样的情况,某人对标样进行分析,得到的平均值()与标准值(
µ
)不一致;或采用两种不同的分析方法分析同一试样,得到的两组测定数据的平均值不一致;或两个不同分析人员对同一试样进行分析时,两组数据的平均值不一致。如这种差异是由随机误差引起,则是不可避免的(正常的),可以认为差异不显著;如这种差异是由系统误差引起,则认为它们之间存在“显著性”差异四测定数据的评价第二十八页第二十九页,共48页。1.平均值()与标准值(µ)的显著性检验-t检验为检查某一新分析方法或某操作过程是否存在系统误差,可用标样或基准物质作几次测定,然后用t检验法检验与µ
之间是否存在显著性差异将、µ代入(2-8)式得
(2-10)第二十九页第三十页,共48页。步骤:1)计算2)选定P(一般取95%),查表3),处于以µ为中心的95%概率区间之外,这种数据出现的机会是极少的,则与µ存在显著性差异,说明有系统误差存在;,则无显著性差异,与µ的差异是由随机误差引起的第三十页第三十一页,共48页。例(P63例11)采用某种新方法测定基准明矾中Al2O3的含量,得:=10.79%,S=0.04%,n=9,已知明矾中ω(Al2O3
)的理论值为10.77%,问该新方法是否有系统误差?解:=1.5
t0.05,8
=2.314,所以
与µ无显著性差异第三十一页第三十二页,共48页。2.两组平均值的显著性检验-F检验+t检验不同分析人员、或同一分析人员采用不同方法分析同一试样所得两组数据平均值往往是不一致的,要判断这两组数据之间是否存在系统误差(显著性差异),通常按如下步骤进行:设两组数据为:第三十二页第三十三页,共48页。(1)F检验-检验两组数据的精密度s1、s2
有无显著差异(s1,s2是否来自同一总体)a.S2
-方差(2-11)因(方差较大,标准偏差较大)作分子,所以>1b.然后查F表(P64表3-4)c.若,说明s1与s2差异不显著,进而用t检验法检验两组数据之间是否存在系统误差,即是否有显著性差异。若,说明s1与s2差异显著。第三十三页第三十四页,共48页。2)t检验-检验两组数据平均值有无显著性差异(是否来自同一总体)a
其中S称为合并标准偏差S=总自由度f=n1+n2-2为了简化起见,有时不计算合并标准偏差S,若S1=S2,则S=S1=S2;若S1≠S2,则S=S小第三十四页第三十五页,共48页。b.然后在选定的P下,根据f=n1+n2-2,查t表(t
.f),若t计算>t表
.则说明两组平均值有显著差异(可认为µ1≠µ2,而两组数据不属于同一总体)例:P65例12,例13第三十五页第三十六页,共48页。(二)异常值(离群值)的取舍在一组平行测定数据中,有时会出现个别离群值(异常值、可疑值)。首先,要仔细回顾和检查产生离群值的实验过程,如系过失所引起(溶液溅失,加错试剂等),此数据应弃去。否则,就要根据随机误差与分布规律决定取舍,若把有一定偏离仍属随机误差范畴的数据舍去,表面上得到了精密度较好的结果,但这是不科学的、不严肃的。确定了离群值的取舍后,才能计算该组数据的、s以及进行其他有关数理统计处理。用统计学方法处理离群值的方法有好几种,下面着重介绍Q检验法和格鲁不斯(Grubbs)法第三十六页第三十七页,共48页。1.Q检验法步骤:1)
(取正值)2)根据测定次数n和置信度P查Q值表(P68表3-6),若Q计算≥Q表,该值应弃去,否则应予保留。3)Q检验适于测定次数n≤10第三十七页第三十八页,共48页。2.格鲁布斯(Grubbs)法1).将测定值从小到大排列x1,x2,x3…….Xn2)计算统计量T,若x1为可疑值,;若xn为可疑值,对于一定的p和n(数据个数),查(P67表3-5),若则该可疑数据应弃去。如可疑值有两个,则弃去一个(如x1)后,检验另一个异常值(如xn)时,测定次数应少算一次(n-1),、S要重新算。第三十八页第三十九页,共48页。由于Grubbs法将正态分布中的两个最重要的样本参数及s引入进来,所以准确性可靠性较好,缺点是要计算及s,手续稍麻烦。例:P67例163.4法1)求出除异常值外其余数据和(平均偏差)2)如,则舍去。优点:不用查表。缺点:可靠性较低
第三十九页第四十页,共48页。在实际工作中,对分析结果的准确度的要求是各不相同的。例如:原子量的测定允许误差小于10-4—10-5;在地球化学研究中,勘探测定岩石和土壤中的重金属,50%的准确度即可满足要求。另外,待测组分的含量较高,一般要求分析准确度较高(误差较小),对于低含量组分,允许有较大的误差。§2.5提高分析结果准确度的方法一.选择合适的分析方法(根据被测物含量、共存元素的干扰情况)第四十页第四十一页,共48页。各种分析方法的灵敏度和准确度是不同的,重量法与滴定法的准确度较高(Er≤0.2%),但灵敏度低,适合于常量(>1%)组分的测定;仪器分析法灵敏度高,但准确度较差,适合于微量(<1%)组分的测定;
第四十一页第四十二页,共48页。例如:ω(Fe)=40.00%分析方法
ErE结果滴定法0.2%0.08%39.92%-40.08%光度法5%2%38%-42%(准确度太差)ω
(Fe)=0.02%时用光度法测定,E为0.001%,结果为0.019%~0.021%,可满足分析要求。而用重量法与滴定法测不出来(灵敏度达不到)。第四十二页第四十三页,共48页。用光谱法测纯硅(Si)中的硼(B),得结果为2×10-6%,其Er允许
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 陕西省宝鸡一中学2025届初三毕业班调研测试语文试题含解析
- 宁波卫生职业技术学院《应用开发框架技术》2023-2024学年第二学期期末试卷
- 新疆石河子职业技术学院《嵌入式系统及安全》2023-2024学年第二学期期末试卷
- 模电 第23讲 正弦波振荡电路学习资料
- 山东青岛市2024-2025学年下学期高三模拟物理试题含解析
- 江西冶金职业技术学院《西南版画拓展之多媒体版画》2023-2024学年第二学期期末试卷
- 二零二五佣金结算协议书
- 二零二五版离婚诉讼起诉
- 二零二五版办公用品购买合同书
- 铸就研究明星
- 《PBR次世代游戏建模技术》(微课版)课件 0课程导引
- 后所村城中村改造建设项目节能评估报告
- 中小学班主任工作指南
- DB35∕T 2174-2024 改良酸性土壤专用有机肥料通 用技术要求
- 北师大版数学五年级下册《确定位置》课件教学课件
- 辽宁葫芦岛协作校2025届高三第二次联考生物试卷含解析
- NB-T32042-2018光伏发电工程建设监理规范
- 2024年纪检监察综合业务知识考试题库及参考答案(完整版)
- DL-T5181-2017水电水利工程锚喷支护施工规范
- LY∕T 2580-2016 森林防火通信车通.用技术要求
- 医院专项资金使用方案
评论
0/150
提交评论