QAC_Chapter02_LiminShao_分析化学_第1页
QAC_Chapter02_LiminShao_分析化学_第2页
QAC_Chapter02_LiminShao_分析化学_第3页
QAC_Chapter02_LiminShao_分析化学_第4页
QAC_Chapter02_LiminShao_分析化学_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章第二章 分析化学中的误差和数据处理分析化学中的误差和数据处理 Limin Shao USTC. All rights reserved.第一节第一节 分析化学中的误差分析化学中的误差第二章一、误差概念第二章第一节系统误差由测量系统(包括仪器,实验方案以及实验者)的缺陷引起;系统误差具有再现性,数值具有单向性;可采用适当方法减小甚至消除。随机误差由测量过程中的不确定因素引起;影响具有随机性,但服从一定的统计分布;随机误差可以被减小,但不能被消除。二、准确度和精密度第二章第一节tmxx 绝对误差%100ttmxxx相对误差n 个测量值:x1, x2, , xn(同一被测对象)偏差 xxdii

2、%100 xd相对平均偏差平均偏差nddi样本标准偏差12nxxsi样本方差 s2三、有效数字及计算规则第二章第一节有效数字表示有物理意义的数值;包含所有准确数字加一位可疑数字(估计数值)。因此从分析仪器读取数据时要估计一位;而仪器读数的最后一位是估计的。“四舍六入五成双”修约标准偏差时,只进不舍仅对最终结果修约三、有效数字及计算规则第二章第一节6.45035.620.071+12.1413加减法以小数点位数最少的数为基准。乘除法以有效数字位数最少的数为基准。对数和反对数运算根据尾数确定。6.45035.620.0712.6log(0.001237) =- 2.908log-1(3.42) =

3、2.6103第二节第二节 误差的传递误差的传递第二章一、误差传递基本概念第二章第二节最终分析结果通常由不同的测量值通过特定算式计算得到。各测量值的误差会通过该等式影响最终分析结果。,.),(BAfR R 为分析结果;A, B, 为测量值。.BBfAAfRddd二、误差传递的计算第二章第二节.BBfAAfR 表示系统误差,即测量值与真值之差。.22222BARsBfsAfss 为样本标准偏差,表征随机误差。三、误差传递的例题第二章第二节例 1 欲配制浓度约为0.5 gL-1的某溶液。具体方法是称量一定量的溶质,溶解后并定容到一定体积。试分析,质量测量误差和体积测量误差对该溶液浓度的影响。例 2

4、某随机信号的标准偏差为s,对其进行 n 次测量后取平均值,计算此平均值的标准偏差。四、通过随机误差传递理解噪声抑制第二章第二节10000 次平均4 次平均25 次平均单次测量第三节第三节 数据处理的统计学方法数据处理的统计学方法第二章 引 言第二章第三节某种现象某个事件人力可为:探索原因,改进仪器,完善方案,暂缓研究,人类能力范围之外:接受确定性因素非确定性因素(随机因素)问题:如何区分确定性因素和随机因素?责任归属答曰:借助统计学方法。 理解随机因素的研究策略第二章第三节日常生活中,对于只有发生后才能知道确切结果的事件,如何处理?经验!策略 通过统计学方法研究随机因素确定性因素:遵循特定规律

5、;事件结果可以预知随机因素:单次事件的结果不可预知特点统计学方法源于解决实际问题,与人类日常活动有着密切的联系,是朴素思维活动的系统化理解随机因素服从统计规律,即多个实例表现出的规律性 随机变量的频数分布第二章第三节对真实长度为1的物体进行了200次测量,并且假设不存在任何系统误差(尺子没有问题,测量者能够客观地读取数据等)。 基础概念第二章第三节随机变量:取值随机、而在确定范围内取值具有确定概率的变量 随机变量的分布:随机变量的大量取值所表现出的统计规律性概率密度函数(PDF):函数化的随机变量分布,通常以 p 表示。 累积分布函数(CDF):PDF的积分,通常以 P 表示 正态分布一、正态

6、分布第二章第三节22221xxpexp)(正态分布 (normal distribution) 的概率密度函数 (PDF) 为高斯函数 。N(, 2)服从正态分布的数值处于区间 x1的概率二、正态分布的 PDF 和 CDF第二章第三节PDF, p(x)CDF, P(x)xttpxPd)()(三、不同参数的正态分布第二章第三节四、标准正态分布第二章第三节均值为 0 方差为 1 的正态分布称为标准正态分布,N(0, 1)xu以 p(u) 和 p(x)分别表示 N(0, 1) 和 N(, 2) 的PDF,那么存在以下关系 p(u) = p(x)xu以 P(u) 和 P(x)分别表示 N(0, 1)

7、和 N(, 2) 的CDF,那么存在以下关系 P(u) = P(x)方便数值计算!五、正态分布例题第二章第三节例 1 分析仪器在没有样品时的连续输出称为基线。某仪器开机预热一段时间后基线平稳,设基线数据服从正态分布 N(0, 0.01),计算基线数据中出现大于 0.3 的值的概率。例 2 一分析化学实验测量明矾中的铝含量。根据长期分析经验,该试样的铝含量服从正态分布N(5.72,0.042)。某学生测得结果 5.85,声称实验操作规范,结果太大完全源自随机因素,不应该得低分。你的观点?六、小结第二章第三节统计学应用的关键在于随机变量的分布,以及通过随机分布获得所需的概率和相应临界值。 已知 x

8、,计算 P:累积分布函数CDF 已知 P,计算 x:逆累积分布函数累积概率 P(阴影面积)临界值 x或者借助统计数值表抽样分布一、研究抽样分布的目的第二章第三节 解决从“局部”到“整体”的问题分析取自某湖泊的水样,得出结论“该湖泊的污染情况如何. ” 解决从“整体”到“局部”的问题多个实际测量值,x1, x2, , xn,研究对象却是平均值。如何从 xi 的分布得到的分布?xx二、抽样分布简介第二章第三节研究对象的所有可能取值构成了一个集合,称为“总体”(population),这些取值称为个体(individual)。测定矿石中的铁含量,所有可能的测量值构成“总体”。从总体抽取有限数量的个体

9、,构成的集合称为样本(sample),其中个体数量称为样本容量。对铁矿石进行了 n 次测量,得到 x1, x2, , xn。个体 x1, x2, , xn 构成了一个样本,样本容量为 n。二、抽样分布简介第二章第三节抽样分布适用于少量实验数据的统计分析(这些少量实验数据构成了一个样本)2分布,t 分布,F 分布称为三大抽样分布与实际的联系:x1, x2, , xn 可以视为 n 个测量值, 为真实值。 二、抽样分布之 t 分布第二章第三节来自正态总体 N( , 2) 的一个样本:x1, x2, , xn;隐为样本均值,s 为样本标准偏差,那么,随机变量 t 服从自由度为f (f = n 1)的

10、 t 分布。nsxtx样本容量 n 无限大时,t 分布为正态分布。二、应用层面上的 t 分布第二章第三节t,f fPt 分布曲线 (f = 10)t 分布临界值表临界值自由度,f = n - 1显著性水平(Significance level) ,绿色部分面积置信度(Confidence) ,红色部分面积,P = 1 绿色部分(红色部分)的面积是数值处于相应区间的概率抽样分布的应用实例一、置信区间第二章第三节n 个测量值:x1, x2, , xnnstxf,表示该区间包含总体平均值的可能性为 P (=1 )。总体平均值落入该区间的可能性为 P。二、显著性检验(假设检验)第二章第三节某结果在统计

11、意义上是显著的(statistically significant)意味着该结果不是完全随机产生的。分析结果间的差异如果在统计意义上不显著,说明这些差异几乎完全由随机因素导致。分析结果间的差异如果在统计意义上是显著的,说明这些差异不完全由随机因素导致,存在非随机因素(如系统误差,过失等)。二、平均值与标准值比较第二章第三节利用 t 分布,在一定的置信度下,如果平均值的置信区间包含标准值,二者无显著差异。否则存在显著性差异。二、两个平均值的比较第二章第三节分析某样品,同一分析人员使用两种不同方法,或两位分析人员使用同一方法。检验两个平均值是否存在显著性差异。212121nnnnsxxt21121

12、222211nnsnsns)()(其中,称为合并标准偏差。如果 t t表(总自由度 f = n1 + n2 - 2),两个平均值存在显著性差异。二、比较平均值的例题第二章第三节解法似有误二、配对数据的比较第二章第三节分析若干样品,使用两种不同方法,或在两个实验室分析,获得若干组配对数据。检验分析结果是否存在显著性差异。思路:配对数据间的差值,di,统计上是否显著。di 的标准值,即总体平均值 d ,为?进一步,平均值 d 与标准值,即总体平均值 d ,是否存在显著性差异。平均值 d 的置信区间,是否包含d 。nstddf,二、比较配对数据的例题第二章第三节二、比较配对数据的例题第二章第三节?二

13、、方差的比较第二章第三节F 检验法,检验分析两组测量数据的精密度是否存在显著性差异。22小大ssF 如果 F F表(双侧),精密度存在显著性差异;如果 F F表(单侧),一组数据的精密度显著优于另一组数据。为了方便计算,F 检验无此要求二、少量数据的统计处理第二章第三节单侧检验:参数的取值只会偏向一边,如“平均值显著大于标准值”、“该组数据的精密度显著优于另一组数据”等。双侧检验:参数的取值可能偏大,也可能偏小,如“平均值与标准值存在显著性差异”、“两组数据的精密度存在显著性差异”等。二、少量数据的统计处理第二章第三节双侧检验P双(绿色区域面积) 双(红色区域面积)单侧检验P单(绿色区域面积)

14、= P双 + 双 / 2 单(红色区域面积)= 双 / 2 二、少量数据的统计处理第二章第三节u 如果结论是“统计意义上显著”,那么该结论的可靠性等于置信度 P,或者说,该结论错误的可能性等于显著性水平 (P + = 1)u 如果结论是“统计意义上不显著”,那么一般无法获得该结论的可靠性(或者该结论错误的可能性)二、少量数据的统计处理第二章第三节u “统计意义上不显著” “不能认为统计意义上显著”。尽管两种表述都在使用,后者在概念上更准确。u 在不同的显著性水平下进行检验,结论可能不同 二、少量数据的统计处理第二章第三节 If the data point is in error, it sh

15、ould be corrected if possible and deleted if it is not possible. If there is no reason to believe that the outlying point is in error, it should not be deleted without careful consideration. (Information Technology Laboratory, NIST)4d 法,Q 检验法(R. B. Dean, W. J. Dixon, 1951),T 检验法(F. Grubbs, 1969)注意这种处理仅基于统计学,没有涉及具体实验情况。科研中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论