版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一、数理统计方法(一)名词解释1.随机事件:在一定的条件下,可能发生也有可能不发生的事件。其特点呈现不确定性,而在大量重复试验中又呈现出统计规律性的一类现象。2.试验:在研究随机事件时所进行的观察或实验第一节数理统计方法在分析化学中的应用3.随机变量
:表示试验结果的变量(通过实验所得的带有随机误差的随机数据)。随机变量的特性:(1)在同样条件下测得的数据参差不齐,具有波动性;(2)在大量重复试验中得到的数据又具有统计规律。4.总体(母体p13):所研究对象的某特性值的全体(统计学中把一个随机变量称为总体,这个随机变量称为总体变量),又叫母体。对分析化学来说,在指定条件下,做无限多次测量所得无限多次数据的集合,就为总体。
总体的三种特性:大量性、同质性和变异性
大量性,指总体必须由许多个体所组成。同质性,指总体中各个个体在某个或某些方面具有共同的性质(构成总体的必要条件)。变异性,指总体中各个体间在某个方面或某些方面有差异(差异是统计研究的前提)。
5.个体(子样):组成总体的每一个单元称为个体或子样,即每个数据。6.总体容量:总体中所含个体的数目,称为总体容量,用N来表示。7.样本和样本容量:从总体中随机抽取一些个体进行观察得到的总体变量值称为样本(抽样须保证“质”和“量”的要求)(Sample,“
随机”表示每个个体被抽取的机会相同)。从总体中随机抽取的个体的数目(样本中所含个体的数目),称为样本容量。
(二)数理统计方法由概率论可知,通过样本(随机抽取的有限次试验)研究和揭示随机事件总体规律的数学方法,称之为数理统计方法。
随机抽样试验模型:总体样本数据(样本值-随机变量)
观察
数理统计方法
假定从总体X中随机抽取n个个体,对应总体变量值(未被观察前
):X1,X2,X3···,Xn(即总体的一个容量为n的样本,称为简单随机样本,其中X1,X2,X3···,Xn相互独立且与X同分布)。当样本被实际观察时,其观察值就是一组实际的数据χ1,χ2,···χn,它称为样本值或样本点。
用样本推断总体的方法就是数理统计的任务二、数理统计方法在分析化学中的应用分析测试可以看作是获取有关物质系统化学组成与结构信息的过程。
分析测试合理抽样,试验优化设计,质量控制,试验误差的消除与校正,分析方法的比较与评价数据处理则是提取与利用信息的过程
数据处理数据可靠性的检验与评价,因素效应及其相关性研究,试验结果的正确表达等一个好的试验应包括三方面:试验设计-----明确目的,确定考察因素,制定方案;试验的实施-----进行试验,获得数据结果试验结果的分析----考察因素的主次,找出误差及来源。(一)选择最佳分析条件,通过较少的试验获得全面可靠的结论―――最优化法(正交试验设计、单纯形优化法等)例如:三元配合物的光度分析,有5个因素的影响,每个因素安排5个水平,若全面试验需进行55
次测定,若采用正交试验设计安排试验,可极大地减少工作量,并获得可靠的信息和结论。
因素
水平显色剂浓度12345配位离子浓度12345显色酸度12345表面活性剂浓度12345显色温度12345全面试验需做55=3125次
(二)判断和考察诸因素中各因素对试验结果影响的程度―――方差分析分析过程---各因素的单独作用、因素之间的联合作用(即交互作用),试验结果是诸因素影响的综合表现。通过方差分析评价和判断各因素是否有影响及影响的程度。(三)研究考察对象与响应值之间的内在联系―回归分析
回归分析和相关分析就是研究随机现象中变量之间的关系的数理统计方法,包括以下内容:评价和量度自变量和因变量之间线性相关的程度―相关性检验;建立一条最好的校正曲线―回归方程;
对回归方程的主要参数(a,b)作进一步的评价,以得到稳定的回归方程;利用回归方程准确地从响应信号去估计被测物质的含量。(四)对分析结果进行统计检验
分析测试目的是通过试验求得被测量的真值,但由于试验中存在各种各样的误差(方法、人员和仪器),使测量数据参差不齐
。对离群值的检验
对测量数据的精密度的检验数据的精密度可以说明:操作者的熟练程度、仪器的精密度、方法的精密度平均值的一致性检验―――准确度检验检验平均值与真值接近的程度(分析测试只能得到真值的近似值,究竟近似到何种程度,就需要对其精密度、准确度可信程度进行恰当估计)。
(五)分析结果的表达
科学地简练地表达分析结果、描述分析结果(包括对总体参数μ、σ的估计,区间估计)。(六)质量控制利用数理统计方法,可以控制产品质量、控制生产质量、控制例行分析中分析结果的精密度和准确度,以保证测定结果的可靠性。
第二节误差及其表示方法一、误差(一)真值
真值是指某一时刻、某一状态下,某物理量客观存在的实际大小,测定值并不等于真值
1.理论真值----物理量的真值如平面三角形三内角之和为180o,一个圆的圆心角为360o等
2.约定真值----真值的最佳估计值
由以下方法获得:(1)计量单位制中的约定真值,由国际计量大会定义的国际单位制单位基本单位(SI制):7个长度(m-米)质量(kg-千克)时间(s-秒)电流(A-安培)热力学温度(K-开尔文)物质的量(mol-摩尔)光强度(Cd-坎德拉)。导出单位:
mol/dm3国际制冠词
因数词冠代号103
千k(kilo)10-1
分d(deci)10-2
厘c(centi)10-3
毫m(milli)10-6
微μ(micro)10-9
纳n(ndno)10-12
皮p(pico)10-15
飞f(femto)Notice:国际单位制冠词不能重叠,如nm不能mμm;mg/kg不能g/t
与国际单位制单位并用的单位
分(min)小时(h)升(L)1L=1dm3
(2)标准器相对真值p43.标准物质的相对真值(1)标准物质(StandardReferenceMaterials
)常指由公认的权威机构发售的,带有证书的物质。定义:按规定的精密度和准确度确定了某些物理特性或组分的含量值,在相当长的时间内具有可被接受的均匀性和稳定性,并在组成和性质上接近样品的物质。名称:标准参考物质SKM(美国国家标准局)
有证参考物质CRM(国际标准化组织)标准物质BW(中国国家标准局)
(2)标准物质某组分含量的给定值(推荐值)-相对真值。即标准物质某组分含量的推荐值。(相对于所测定结果是真值)
(二)误差问题的提出:分析测试中,由于各种不可控制的偶然因素的随机和综合的影响,使得测定结果有不同的值,测定值是一个随概率取值的随机变量。
两个特征的第一个:波动性---数据参差不齐误差有哪些类型?它们如何表示?又如何减免呢?1.定义测定值与真值之差
δ=χ-a(E=χ-μ)2.误差的分类
(1)系统误差
在一定的试验条件下由某个或某些因素按照某一确定的规律起作用而造成的误差(引起多次测定平均值与真值的偏离),又称可定误差。
特点:单向性、重复性。用来表征测定结果的准确度,不影响测定结果的精密度。产生原因:方法误差;试剂误差;仪器误差;操作误差等。
消除办法:找出产生误差的原因,按照它的规律对之进行校正或设法消除。(2)随机误差
由于测试过程中许多不可控制或未加控制的因素的微小波动而形成的,具有相互低偿性的误差。特点:具有有界性、单峰性、对称性、抵偿性产生的原因:各种因素的偶然变动而引起的单次测定值对平均值的偏差。包括仪器、试剂、环境及操作。减小的方法:严格控制试验条件,正确操作;增加平行测定的试验次数,用平均值表示分析结果。(根据正态分布规律)
(3)过失误差(粗差)由于测量过程中犯了不该犯的错误而导致的误差。
综上所述,要获得好的分析结果,必须:杜绝过失误差;减小随机误差;消除系统误差3.误差的表示方法(1)误差
绝对误差=测定值-真值(E=)(1-1)
相对误差=(RE=)(1-2)Notice:a.误差有正负之分(±),报结果要有正负号
b.相对误差更能有效地表示分析结果的准确度(2)偏差
个别测量值与平均值之差,表示一组数据相互的离散程度,是精密度的量度指标
绝对偏差:(1--3)
相对偏差:(1--4)
平均偏差:(1--5)
相对平均偏差:(1--6)
极差
:(1--7)
(3)样本的方差(s2
)和标准差(s)
方差是测量值在样本平均值周围分布状况的一种量度,定义为:
测量值对样本平均值的偏差的平方的平均,用自由度作为分母即:
(1--8)
:差方和(偏差或离差的平方和),测量值对平均值的偏差的平方的加和。
(1--9)
f:自由度
n:样本容量(有限次)
标准差
s:方差的平方根的正值
(1--10)
相对标准差(RSD):标准差在平均值中所占的百分率
(1--11)标准差对一组测量中的特大或特小误差反映非常灵敏,所以标准差能够很好地反映出测量的精密度。
(4)总体的方差(σ2)和总体标准差(σ)
σ2:测量值对总体均值μ的误差的平方的统计平均。(1--12)(N→∞)总体标准差σ:
(N→∞)(1—13)(5)或然误差p9(6)极限误差p9
二、有效数字1.有效数字的含义在测量中能得到有实际意义的表示测量结果的数字。由可靠数字和1位可疑数字组成。2.零和有效数字(1)起定位作用(2)有效数字:在数字中间或数字后的零是有效数字
3.00,3.01,0.05030,0.00503
(3)科学计数法:小数点前只有一位非零的数字
5000→5.0×103,两位5.00×103
三位5.000×103
四位;0.005030→5.030×10-3
四位3.数字的修约规则“四舍六入五留双”
在拟舍去的数字中:小于5的舍去;大于5的进1;等于5的看:其后的数并非全为0则进1;如0.50325486,保留4位:0.5033
其后的数全为0或无数字:若前一位数字是奇数进1;若前一位数字是偶数舍去。如0.50325、0.50335保留4位:0.5032、0.5034不得连续修约例如:15.456,保留2位:15
不得:15.456→15.46→15.5→16
4.记数规则(1)记录测量数据时,只保留一位可疑数字;(2)表示精密度时,标准偏差S取一位有效数字(最多两位),且S只进不舍,如S=0.1217得S=0.13或S=0.2(3)测量结果的有效数字所能达到的位数不能多于方法检出限所能达到的位数。(4)不同含量的测定结果有效数字的位数不同:含量:>10%,4位;1~10%3位;<1%2位;痕量分析2位。
第三节测量数据的特征及分布置信概率
:
由样本推断总体,统计推断的可靠性需用概率来衡量,衡量统计推断可靠性程度的概率,称为置信概率。
等精度测量:在一组测量中,如果测量的全部条件都相同,那么各个测量结果都是可信、可取的,各个值相互之间是等价的,即是说,它们的权是相同的,这样的测量为等精度测量。凡标准误差相同的测量都称为等精度测量。
正态分布
由概率统计理论可知,若随机变量是由为数众多的相互独立的随机因素的微小影响叠加而成(如果没有系统误差),则这个随机变量的分布表现为正态分布。分析化学中的等精度测量值、平均值和测量误差的分布都可用正态分布来描述。正态分布的概率密度函数----高斯分布函数。一、高斯分布函数(测量值的分布)p11
假设在一定条件下,对某个量
进行无限次重复的等精度的测量,得到一系列数据各测量值的频数分布如图,各测量值出现的概率密度分布可由下列正态分布概率密度函数来表达(C.F.Gauss,1809)
(2--1)
式中:σ-总体标准差;
π-圆周率;μ-总体均值;-随机变量。F-指某一区间(随机变量的取值范围)的概率。当
正态分布的特点:(1)曲线关于对称;(2)在处,有极大值
(即当=0);
(3)在处有两个拐点;
(4)μ决定分布曲线的中心位置,表示概率的集中,μ的变化只导致分布曲线平移,而不改变曲线的形状,称为位置参数;σ决定分布曲线的形状,σ的变化只导致曲线的形状改变,而不改变曲线的中心位置,称为形状参数。因此,测量值的正态分布可用N(μ,σ2)表示。二、随机误差的正态分布N(0,σ2)
()三、标准正态分布(p12)
1.标准正态分布
对横座标进行变换,以标准差σ作为误差值的单位,引入变量z-标准正态变量
∴
(2--2)
即以z为变量,以σ为单位(即σ为1,故σ可在此式相约)的标准正态分布。
均值为0,标准差为1的标准正态分布:N(0,1)
对于样本值落在任意区间(a,b)的概率F():
2.标准正态分布的积累分布函数p12
对于一个给定的正态分布N(μ,σ2),描述测量值出现在-∞到一个给定值之间的区间内概率密度的函数,称积累分布函数。
(2--3)
标准正态分布的积累分布函数(p12公式2-4)
(2--4)
将上式变换,由正态分布对称性可得:
对于任何正态分布,样本值落在任意区间(a,b)的概率F()相应由下列标准正态分布给出:
四、高斯分布的概率计算
通过变换,任何正态分布的概率值即可由标准正态分布概率表查得。
(1)给出z值,可直接查表求Φ;(2)给出x值,则由和
计算
例1
正态分布的概率密度函数
求由-1到+4之间的概率。
解:
∵σ=4μ=2∴
∴
例2已知x~N(2,42),求F(4)
(p12例2.1)
解:∵σ=4μ=2x=4
∴
(3)关于
的计算(p12)
若当
则
还可以证明:
例3已知样本值遵从正态分布,求样本值落在下列区间内的概率:(μ-σ,μ+σ)、(μ-2σ,μ+2σ)、(μ-3σ,μ+3σ)解:F(μ-σ≤x≤μ+σ)=φ(1)-φ(-1)=φ(1)+φ(1)-1=0.8413+0.8413-1=0.6828同理ν(μ-2σ≤x≤μ+2σ)=φ(2)-φ(-2)=φ(2)+φ(2)-1
=0.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度高空作业安全生产施工合同集2篇
- 二零二五年度绿色环保木工支模项目合同4篇
- 2025版木箱纸箱包装设计创新与市场推广合同4篇
- 2025年度个人购房合同产权转移登记流程4篇
- 危险品运输车辆驾驶员岗前培训考核试卷
- 2025版二零二五年度现代木工清工分包合同模板4篇
- 【新课标Ⅲ卷】高三第二次全国大联考语文试卷(含答案)
- 爱学习有自信幼儿舞蹈创编15课件讲解
- 2025年专业期刊发行协议
- 2025年合伙劳动分工协议
- 2024公路沥青路面结构内部状况三维探地雷达快速检测规程
- 2024年高考真题-地理(河北卷) 含答案
- 中国高血压防治指南(2024年修订版)解读课件
- 食材配送服务方案投标方案(技术方案)
- 足疗店营销策划方案
- 封条(标准A4打印封条)
- 2024年北京控股集团有限公司招聘笔试参考题库含答案解析
- 延迟交稿申请英文
- 运动技能学习与控制课件第十章动作技能的指导与示范
- 石油天然气建设工程交工技术文件编制规范(SYT68822023年)交工技术文件表格仪表自动化安装工程
- 中医治疗“湿疹”医案72例
评论
0/150
提交评论