数据处理基础知识_第1页
数据处理基础知识_第2页
数据处理基础知识_第3页
数据处理基础知识_第4页
数据处理基础知识_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

检测数据处理基础知识 来源:czyxyq 时间:2009-02-04 字体:大 中 小 收藏 我要投稿 误差及相关概念 真实值与标准值 误差是测量值与真实结果之间的差异,要想知道误差的大小,必须知道真实的 结果,这个真实的值,我们称之“真值”。 1.真实值 从理论上说,样品中某一组分的含量必然有一个客观存在的真实数值,称 之为“真实值”或“真值”。用“”表示。但实际上,对于客观存在的真值, 人们不可能精确的知道,只能随着测量技术的不断进步而逐渐接近真值。实际 工作中,往往用“标准值”代替“真值”。 2.标准值 采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复多次测定 得出的结果平均值,是一个比较准确的结果。 实际工作中一般用标准值代替真值。例如原子量、物理化学常数:阿佛伽 得罗常数为6.0210等。 与我们实验相关的是将纯物质中元素的理论含量作为真实值。 1.准确度 准确度是测定值与真实值接近的程度。 为了获得可靠的结果,在实际工作中人们总是在相同条件下,多测定几次, 然后求平均值,作为测定值。一般把这几次在相同条件下的测定叫平行测定。 如果这几个数据相互比较接近,就说明分析的精密度高。 2.精密度 精密度是几次平行测定结果相互接近的程度。 3.精密度和准确度的关系 (1)精密度是保证准确度的先决条件。 (2)高精密度不一定保证高准确度。 1.误差 (1) 定义:个别测定结果 X、X X 与真实值 之差称为个别测定的误 差,简称误差。 (2) 表示:各次测定结果误差分别表示为 X -、X -X -。 (3)计算方法: 绝对误差 相对误差 对于绝对误差 测定值大于真值,误差为正值;测定值小于真值,误差 为负值。 对于相对误差 反映误差在测定结果中所占百分率,更具实际意义。 2.偏差 偏差是衡量精密度的大小。 误差的分类 系统误差 1.定义 由某种固定的原因造成的误差,若能找出原因,设法加以测定,就可以消 除,所以也叫可测误差。 2.特点 具有单向性、可测性、重复性。即:正负、大小都有一定的规律性,重复 测定时会重复出现。 3.产生原因 (1)方法误差:分析方法本身所造成的误差。方法误差是由于某一分析方 法本身不够完善造成的。如分析过程中,干扰离子的影响没有消除。 (2)操作误差:由于操作人员的主观原因造成的。如滴定分析时,每个人 对滴定终点颜色变化的敏感程度不同,不同的人对终点的判断不同。 (3)仪器和试剂误差:仪器误差来源于仪器本身不够精确。例如天平两臂 不等长,砝码长期使用后质量改变。试剂误差来源于试剂不纯。 注意:系统误差是重复地以固定形式出现的,增加平行测定次数不能消除。 误差的分类 随机误差 随机误差由某些难以控制、无法避免的偶然因素造成。也称偶然误差。 1.特点 大小、正负都不固定,不能通过校正来减小或消除,可以通过增加测定次 数予以减小。 2.产生原因 操作中温度变化、湿度变化、甚至灰尘等都会引起测定结果波动。 系统误差和随机误差划分不是绝对的,对滴定终点判断的不同有个人的主 观原因,也有偶然性。随机误差比系统误差更具偶然性。分析工作中的“过失” 不同于这两种误差。它是由于分析人员操作时粗心大意或违反操作规程所产生 的错误。 随机误差的正态分布 1.分布曲线 y:概率密度,表示测量值在此处出现的概率。y 越大,出现的可能性越大。 x:测量值。 总体平均值:无限次数据的平均值,相应于曲线最高点的横坐标值,表示 无限个数据集中趋势。在没有系统误差时,它就是真值。 总体标准偏差:总体平均值到曲线两转折点之一的距离,表征数据分散程 度。 小,数据集中,曲线又高又瘦, 大,数据分散,曲线比较矮比较胖。 x-:随机误差。若以 x- 为横坐标,则曲线最高点对应横坐标为0。 对于一条曲线来说, 和 是这条曲线的两个参数,所以用 N(,)表 示这条曲线。这条曲线可以用一个函数式表示。 2.概率密度函数 3.随机误差规律性 (1)小误差出现的概率比大误差多,特别大的误差出现的概率极少。 (2)正误差和负误差出现的概率是相等的。 4.标准正态分布: 横坐标用 u 表示,其定义式为: 即:以 为单位 来表示随机误差。 函数表达式为: 因此曲线的形状与 大小无关, 不同的曲线都合并为一条。 记作 N(0,1) 随机误差的区间概率 1.定义 随机误差在某一区间出现的概率以某段正态分布曲线下所包含的面 积表示。 一条完整的正态分布曲线所包含的面积,表示所有测量值出现的概率 的总和,即是100%,等于1。用算式表示为: 一般以 为单位,计算不同 值曲线所包含的面积,制成概率积分表供直接查阅。 2.计算公式 概率面积 有限数据的统计处理 随机误差分布的规律给数据处理提供了理论基础,但它是对无限多次测量而言。 实际工作中我们只做有限次测量,并把它看作是从无限总体中随机抽出的一部分, 称之为样本。样本中包含的个数叫样本容量,用 n 表示。 数据的趋势 数据集中趋势的表示 1.算术平均值 n 次测定数据的平均值。 是总体平均值的最佳估计。对于有限次测定,测量值总朝算术平均值 集 中,即数值出现在算术平均值周围;对于无限次测定,即 n 时, 。 2.中位数 M 将数据按大小顺序排列,位于正中间的数据称为中位数 M。 n 为奇数时,居中者即是;n 为偶数时,正中间两个数据的平均值即是。 数据的趋势 数据分散程度的表示 1.极差 R(或称全距):指一组平行测定数据中最大者(Xmax)和最小者 (Xmin)之差。 R Xmax - Xmin 2.平均偏差:各次测量值与平均值的偏差的绝对值的平均。 绝对偏差 di Xi - (i =1,2,n ) 平均偏差 相对平均偏差 3.标准偏差 S:计算方法 标准偏差 S 相对标准偏差,也叫变异系数,用 CV 表示,一般计算百分率。 相对标准偏差 RSD 100 % 自由度 f:f n-1 平均值的置信度区间 定 义 1.置信度 置信度表示对所做判断有把握的程度。 表示符号:P。 有时我们对某一件事会说“我对这个事有八成的把握”。这里的“八成把 握”就是置信度,实际是指某事件出现的概率。 常用置信度:P=0.90,P=0.95;或 P=90%,P=95%。 2.置信度区间 按照 t 分布计算,在某一置信度下以个别测量值为中心的包含有真值的范 围,叫个别测量值的置信度区间。 1. t 的定义 ,与 对比。 2. t 分布曲线 (1) t 分布曲线:t 分布曲线的纵坐标是概率密度,横坐标是 t,这时随机误差不按正态分布,而是按 t 分布。 (2)与正态分布关系:t 分布 曲线随自由度 f 变化,当 n时,t 分布曲线即是正态分布。 t 分布曲线 【 t 分布值表】 由表可知,当 f时,S,t 即是 u。 实际上, 当 f=20时,t 与 u 已十分接近。 3.平均值的置信度区间: (1)表示方法: (2)含义:在一定置信度下, 以平均值为中心,包括总体平均值的置信度区间。 (3)计算方法: 求出测量值的 ,S,n。 根据要求的置信度与 f 值,从 t 分布值表中查 出 t 值。 代入公式计算。 显著性检验 平均值与标准值比较 常用的方法有两种:t 检验法和 F 检验法。 分析工作中常遇到两种情况: 样品测定平均值和样品标准值不一致;两组测定数据的平均值不一致。需要分别进 行平均值与标准值比较和两组平均值的比较。 1.比较方法 用标准试样做几次测定,然后用 t 检验法检验测定结果的平均值与标准试 样的标准值之间是否存在差异。 2.计算方法 求 t。 t = 根据置信度(通常取置信度95%)和自由度 f,查 t 分布表中 t 值。 比较 t 和 t,若 tt,说明测定的平均值出现在以真值为中心的95%概率 区间之外,平均值与真实值有显著差异,我们认为有系统误差存在。 t = 例:某化验室测定标样中 CaO 含量得如下结果:CaO 含量 =30.51%,S=0.05,n=6,标样中 CaO 含量标准值是30.43%,此操作是否有系统误差? (置信度为95%) 解:t = = 3.92 查表:置信度95%,f=5时,t =2.57。比较可知 tt。 说明:此操作存在系统误差。 显著性检验 两组平均值的比较 常用的方法有两种:t 检验法和 F 检验法。 分析工作中常遇到两种情况: 样品测定平均值和样品标准值不一致;两组测定数据的平均值不一致。需要分别进 行平均值与标准值比较和两组平均值的比较。 1.比较方法 用两种方法进行测定,结果分别为 ,S,n; ,S,n。然后分别用 F 检验法 及 t 检验法计算后,比较两组数据是否存在显著差异。 2.计算方法 (1)精密度的比较 F 检验法: 求 F 计算: F 1 由 F 表根据两种测定方法的自由度,查相应 F 值进行比较。 【表2-2 95%置信水平(a=0.05)时单侧检验 F 值(部分)】 若 FF,说明 S 和 S 差异不显著,进而用 t 检验平均值间有无显著差异。 若 FF,S 和 S 差异显著。 (2)平均值的比较: 求 t :t 若 S 与 S 无显著差异,取 S 作为 S。 查 t 值表,自由度 fnn2。 若 tt,说明两组平均值有显著差异。 例:Na CO 试样用两种方法测定结果如下: 方法1: 42.34,S0.10,n5。 方法2: 42.44,S0.12,n4。 比较两结果有无显著差异。 离群值的取舍 1.定义 在一组平行测定数据中,有时会出现个别值与其他值相差较远,这 种值叫离群值。 判断一个测定值是否是离群值,不是把数据摆在一块看一看,那个离得远, 那个是离群值,而是要经过计算、比较才能确定,我们用的方法就叫 Q 检验法。 2.检验方法 (1)求 Q:Q = 即:求出离群值与其最邻近的一个数值的差,再将它与极 差相比就得 Q 值。 (2)比较:根据测定次数 n 和置信度查 Q,若 QQ,则离群值应舍去,反之 则保留离群值。 表2-3 90%置信水平的 Q 临界值表 数据数(n) 3 4 5 6 7 8 9 10 90% 0.90 0.76 0.64 0.56 0.51 0.47 0.44 0.41 0.00 例:测定某溶液物质的量浓度,得如下结果:0.1014 ,0.1012 ,0.1016 ,0.1025 ,问0.1025是否应该舍弃(置信度90%)? 方法的选择 方法的选择要根据分析试样的组成确定分析方法。 常量组分测定:重量 法、滴定法。准确度高,灵敏度低。 微量组分测定:仪器分析测定。准确度 高,灵敏度较差。 准确度的提高 1.减少测量误差 测定过程中要进行重量、体积的测定,为保证分析结果的 准确度,就必须减少测量误差。 例:在重量分析中,称重是关键一步,应设法 减少称量误差。 要求:称量相对误差0.1%。 一般分析天平的称量误差为 0.0001克,试样重量必须等于或大于0.2克,才能保证称量相对误差在0.1%以内。 2.增加平行测定次数,减少随机误差 增加平行测定次数,可以减少随机误 差,但测定次数过多,没有太大的意义,反而增加工作量,一般分析测定时,平行 测定4-6次即可。 3.消除测定过程中的系统误差 3.1检查方法:对照法 (1)对照试验:选 用组成与试样相近的标准试样进行测定,测定结果与标准值作统计处理,判断有无 系统误差。 (2)比较试验:用标准方法和所选方法同时测定某一试样,测定结 果做统计检验,判断有无系统误差。 (3)加入法:称取等量试样两份,在其中 一份试样中加入已知量的待测组分,平行进行两份试样测定,由加入被测组分量是 否定量回收,判断有无系统误差。又叫回收实验。 3.2消除方法 (1)做空白 实验:在不加试样的情况下,按试样分析步骤和条件进行分析实验,所得结果为空 白值,从试样测定结果中扣除。可以消除试剂、蒸馏水和容器引入的杂质。 (2)校准仪器:对砝码、移液管等进行校准,消除仪器引起的系统误差。 (3)引 用其它方法校正。 有效数字 1.定义 有效数字就是实际能测到的数字。有效数字的位数和分析过程所用 的分析方法、测量方法、测量仪器的准确度有关。我们可以把有效数字这样表示。 有效数字所有的可靠的数字+一位可疑数字 有效数字准确的数+一位欠准的 数(1) 表示含义:如果有一个结果表示有效数字的位数不同,说明用的称 量仪器的准确度不同。 例:7.5克 用的是粗天平 7.52克 用的是扭力天平 7.5187克 用的是分析天平 2. “0”的双重意义 作为普通数字使用或作为定位的标志。 例:滴定管读数为20.30毫升。两个0都 是测量出的值,算做普通数字,都是有效数字,这个数据有效数字位数是四位。 改用“升”为单位,数据表示为0.02030升,前两个0是起定位作用的,不是有效数 字,此数据是四位有效数字。 3.规定 (1)改变单位并不改变有效数字的 位数。 (2)在数字末尾加0作定位时,要用科学计数法表示。 (3)在分 析化学计算中遇到倍数、分数关系时,视为无限多位有效数字。 (4)对数数 值的有效数字位数由该数值的尾数部分决定。 注意:首位为8或9的数字,有效 数字可多计一位 有效数字的修约规则 规定:当尾数4时则舍,尾数6时则入;尾数等于5而后面的数都为0时,5 前面为偶数则舍,5前面为奇数则入;尾数等于5而后面还有不为0的任何数字,无 论5前面是奇或是偶都入。 例:将下列数字修约为4位有效数字。 修约前 修约后 0.526647-0.5266 0.36266112-0.3627 10.23500-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论