试验设计与数据处理11_第1页
试验设计与数据处理11_第2页
试验设计与数据处理11_第3页
试验设计与数据处理11_第4页
试验设计与数据处理11_第5页
已阅读5页,还剩391页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试验设计与数据处理韩京龙试验设计与数据处理参考资料1,实验设计与数据处理(第二版)

李云雁胡传荣编著

化学工业出版社

2,实验设计与数据处理

罗传义时景荣编著

吉林人民出版社

0.1试验设计与数据处理的发展概况20世纪20年代,英国生物统计学家及数学家费歇(R.A.Fisher)提出了方差分析

20世纪50年代,日本统计学家田口玄一将试验设计中应用最广的正交设计表格化数学家华罗庚教授也在国内积极倡导和普及的“优选法”我国数学家王元和方开泰于1978年首先提出了均匀设计

0.2试验设计与数据处理的意义0.2.1试验设计的目的:合理地安排试验,力求用较少的试验次数获得较好结果例:某试验研究了3个影响因素:

A:A1,A2,A3

B:B1,B2,B3

C:C1,C2,C3

全面试验:27次正交试验:9次0.2.2数据处理的目的通过误差分析,评判试验数据的可靠性;确定影响试验结果的因素主次,抓住主要矛盾,提高试验效率;确定试验因素与试验结果之间存在的近似函数关系,并能对试验结果进行预测和优化;试验因素对试验结果的影响规律,为控制试验提供思路;确定最优试验方案或配方。实验设计与数据处理应用对象毕业论文设计毕业论文写作科研工作者企业管理人员工程技术人员大学生硕士研究生博士研究生试验设计是根据试验目的所定试验目的单因素试验设计多因素试验设计随机试验设计正交试验设计确定科技论文・科研报告・毕业论文试验目的试验设计取得数据数据处理得出结论完成论文写作全过程数据处理形式数据处理方法统计分析图像处理音像处理表图图像音像数据处理用途科研论文学术发表开发新技术行政部门提供依据学术研讨会(举例说明)热量1234567反应速度0.50.70.91.11.21.20.9学术研讨会(举例说明1)学术研讨会(举例说明2)日期6/56/106/156/206/256/307/57/10降雨量20532003010020硝态氮

280

180

降雨量与硝态氮流失情况调查科技论文・科研报告・毕业论文写作流程题目目的实验材料与分析方法结果与考查结论第一章误差理论

误差:由于受主客观因素的影响,实验中测得的值与真实值并不完全一致。这种差异在数值上的表现即为误差。研究误差的目的:1.正确处理实验数据。得到更接近真实值的最佳结果。2.合理选取所得结果的误差。减小主观因素的影响,以免对生产造成危害。也不能算得过份大,以免造成人力物力的浪费。3.合理选择实验仪器、条件和方法,以便降低系统误差。确保实验的准确度和精密度。真值与试验数据的位置特征参数真值:理论上说,真值是指测定次数无限多时求得的平均值叫真值。真值1.理论真值:理论设计和理论公式表达值等。2.计量学约定真值:国际会议或国际组织上公认的量值。3.相对真值:国家标准样品的标准值或用标准仪器

测定的值。真值与试验数据的位置特征参数2.试验数据的位置特征参数

2.1算数平均值(arithmeticmean)试验数据的位置特征参数是表示试验数据的集中性的指标

算数平均值的一个重要性质,就是若测定值的分布服从正态分布,则算数平均值即为一组等精度测量中的最佳值,或称为最可信赖值。

等精度试验值适合:

试验值服从正态分布2.2加权算数平均值(weightedmean)

真值与试验数据的位置特征参数权可以理解为测定值Xj在很大的测量总数N中出现的频率nj/N,如代之以概率Pj来表示,则加全算数平均数可改写为wi——权重加权和适合不同试验值的精度或可靠性不一致时2.3对数平均值(logarithmicmean)在化学反应,热量传递及质量传递中,其分布曲线多具有对数的特性。在这中情况下表征平均值的量就应该用对数平均值来表示。真值与试验数据的位置特征参数设两个数:x1>0,x2

>0,则说明:若数据的分布具有对数特性,则宜使用对数平均值对数平均值≤算术平均值如果1/2≤x1/x2≤2时,可用算术平均值代替,误差不超过4%2.4几何平均数几何平均值是将n个测定值相乘后在开n次方所得的值。●当一组试验值取对数后所得数据的分布曲线更加对称时,宜采用几何平均值。●几何平均值≤算术平均值设有n个正试验值:x1,x2,…,xn,则2.5调和平均值(harmonicmean)●常用在涉及到与一些量的倒数有关的场合●调和平均值≤几何平均值≤算术平均值设有n个正试验值:x1,x2,…,xn,则:误差的表示方法1.绝对误差(absoluteerror)误差的绝对值愈小,则测定值与真值愈接近,测定值的准确度愈高,

反之相反。绝对误差是反应测定值偏离真值的大小。(1)定义

绝对误差=试验值-真值或(2)说明真值未知,绝对误差也未知

可以估计出绝对误差的范围:绝对误差限或绝对误差上界或例:用标准仪器测得某物理量为1.728(g)(可看作是真值A),而一台

普通仪器测得该物理量为1.730(g),则测量值的绝对误差为

Δx=1.730-1.728=0.002(g)若另一次测量值为1.725(g),其绝对误差为

Δx=1.725-1.728=-0.003(g)

我们经常用的分析天平等都有本身的仪器所允许的最大误差范围。

如分析天平的允许误差范围是±0.0001(g),我们把这个误差范围又

称最大绝对误差。最大绝对误差的量值前面一般都加“±”号,这是与

绝对误差的定义是不同的。1.绝对误差(absoluteerror)

误差的表示方法2.相对误差(relativeerror)是指绝对误差在真值中所占的百分率,既误差的表示方法误差较小时,测定值x与真值A接近,用绝对误差与测定值之比作为相对误差。最大相对误差:最大绝对误差计算出的相对误差。真值未知,常将Δx与试验值或平均值之比作为相对误差:或例:用分析天平测得土壤样品为4.1854(g),而半微量天平测得的量为4.18544(g)(可看作是真值A),求相对误差和最大相对误差?解:相对误差:Ex=(Δx/A)*100%Δx=x-A=4.1854-4.18544=-0.00004(g)Ex=(-0.00004/4.18544)*100%=-0.001%当x接近于A时,用x代替真值A

Ex=(-0.00004/4.1854)*100%=-0.001%最大相对误差:分析天平的最大误差范围为±0.0001(g)最大相对误差=(±0.0001/4.1854)*100%=±0.0025%2.相对误差(relativeerror)

误差的表示方法2.相对误差(relativeerror)

**同一仪器的被测量的最大绝对误差是相同的。但是,被测量的相对误差是不同的。例:测得一物理量分别为102(g)和5(g),天平的最大绝对误差为±1(g),而相对误差分别为

E102={(±1)/102}*100%=±1%E5={(±1)/5}*100%=±20%为了获得更准确的结果,在相同条件下需要进行多次重复测定。这叫平衡测定或等精度测定。误差的表示方法3.极差(range)

一组测定值中最高值和最低值之差,叫极差。误差的表示方法R↓,精密度↑虽然用极差反映随机误差的精度不高,但由于它是计算方便,在快速检验中仍然得到广泛的应用4.算术平均误差(averagediscrepancy)算术平均误差(或称为平均偏差)简称为平均误差。其定义为误差的表示方法试验值与算术平均值之间的偏差——●可以反映一组试验数据的误差大小误差的表示方法5.标准差(standarderror)标准差是标准误差的简称,又称为标准偏差。当测定值的次数无穷时,其定义为■

当试验次数n无穷大时,总体标准差:■试验次数为有限次时,样本标准差:●表示试验值的精密度,标准差↓,试验数据精密度↑误差的表示方法标准偏差与所测定值中的每一个数据有关,而且对其中较大误差或较小误差敏感性很强。能明显反映出较大的个别误差。实验愈精确标准误差愈小。反映相对于平均值的离散程度。一般统计分析中经常用到标准差S。5.标准差(standarderror)误差的来源及分类我们在做科学研究的时候,得到准确数据是非常重要的一个科研环节。实验工作始终不能做到没有误差,测定值永远是真值的近似值。误差根据其性质可分为系统误差、随机误差和过失误差。1,.随机误差(偶然误差)

:由于很多无法估计的,各种各样的随机原因所引起的误差。随机误差量值的大小,往往用标准差S来表示。2,过失误差:实验工作中粗枝大叶,操作不正确所引起的误差。误差的来源及分类系统误差方法误差(理论误差`):这是由于测量方法本身形成的误差,或者由于测量所依据的理论本身不完善等原因而导致的误差。

例:土壤有效磷的测定有两种方法第一种方法为0.5MNaHCO3浸提-钼锑抗比色法,第二种方法为0.3NNH4F-0.025NHCl浸提-钼锑抗比色法两种浸提剂测得的土壤有效磷指标

有效磷指标0.3NNH4F-0.025NHCl法0.5MNaHCO3法低0-150-5中16-300-6高>30>10仪器误差:仪器本身不够准确或未经校准所引起的误差。(仪器的零点不准,精密度不高,磨损等原因引起的误差)操作误差:由于操作人员的主观原因所造成的误差。

3,系统误差:由于实验过程中某些经常发生的原因造成的。在同一条件下重复测定时,它会重复出现。误差的来源及分类(1)定义:以不可预知的规律变化着的误差,绝对误差时正时负,时大时小(2)产生的原因:偶然因素(3)特点:具有统计规律小误差比大误差出现机会多正、负误差出现的次数近似相等当试验次数足够多时,误差的平均值趋向于零可以通过增加试验次数减小随机误差随机误差不可完全避免的

1随机误差(randomerror)误差的来源及分类2系统误差(systematicerror)

(1)定义:一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差(2)产生的原因:多方面(3)特点:系统误差大小及其符号在同一试验中是恒定的它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小只要对系统误差产生的原因有了充分的认识,才能对它进行校正,或设法消除。

3过失误差(mistake)(1)定义:

一种显然与事实不符的误差(2)产生的原因:

实验人员粗心大意造成

(3)特点:可以完全避免没有一定的规律

误差的来源及分类实验数据的精准度1.精密度(precision)

:表示在等精度的重复测定中,各测定值与其平均值接近的程度,或者说各测定值相互接近的程度。精密度通常用标准差S和相对标准差C・V=S/

(变异系数)来量度。精密度一般用来表示随机误差的大小。(1)含义:在一定的试验条件下,多次试验值的彼此符合程度

例:甲:11.45,11.46,11.45,11.44

乙:11.39,11.45,11.48,11.50(2)说明:可以通过增加试验次数而达到提高数据精密度的目的试验数据的精密度是建立在数据用途基础之上的试验过程足够精密,则只需少量几次试验就能满足要求(3)精密度判断

①极差(range)②标准差(standarderror)R↓,精密度↑标准差↓,精密度↑实验数据的精准度1.精密度(precision)③方差(variance)

标准差的平方:样本方差(s2

)总体方差(σ2

)(3)精密度判断

实验数据的精准度1.精密度(precision)方差↓,精密度↑2正确度(correctness)

(1)含义:大量测试结果的(算术)平均值与真值或参照值之间的一致程度。它反映系统误差的大小。(2)正确度与精密度的关系:

精密度不好,但当试验次数相当多时,有时也会得到好的正确度

精密度高并不意味着正确度也高

(a)(b)(c)实验数据的精准度表示所得测定结果与真值或标准值接近的程度。在多次等精度测定中,测定结果一般用平均值来表示。这时准确度就表示平均值与真值的接近程度。准确度一般用绝对误差或相对误差来表示。实验数据的精准度3准确度(accuracy)三者关系●无系统误差的试验

精密度:A>B>C正确度:A=B=C准确度:A>B>C精密度:A'>B'>C'准确度:A'>B'>C',A>B,C三者关系●有系统误差的试验

实验数据的精准度

准确度与精密度的关系准确度与精密度是不同的。准确度指测定值与真值接近的程度。精密度指测定值与平均值接近的程度。测定的精密度不好,就不可能有良好的准确度。精密度好的测定,即使准确度不高,但能找到系统误差产生的原因并加以校正,就能得到准确的结果。实验数据的精准度随机误差的统计分布1.频数分布随机误差是具有统计规律的,服从一定的统计分布规律。表频数分布表

分组73747474757576767677其他频数033122538253301

例:通过实验测得113个数据,经整理得以下频数分布表。2.随机误差的特性若测定中不存在系统误差,则测定的平均值可作为被测量的真值的估计值。同样条件,同样方法进行很多次的测定时,随机误差有以下特性:

随机误差的统计分布(1)对称性:绝对值相等的正误差和负误差出现的次数大致相等。(2)单峰性:绝对值大的误差出现的次数少,而绝对值小的误差出现的次数多。(3)有界性:在一定试验条件下的有限测定中,其误差的绝对值不会超过一定的界限。(4)抵偿性:在同一条件下对同一个量进行测定,其误差的算术平均值随着测定次数的无限增加而趋于零,既误差平均值极限为零。3.1随机误差的正态分布随机误差的出现是遵循正态分布规律的。各个测得值出现的概率密度分布可以用正态分布函数来表达。随机误差的统计分布x:表示测量值μ:总体均值,既无限次测定数据的平均值σ:正态分布的总体标准差σ2:正态分布的方差f(x)σ=1σ=2正态分布密度函数随机误差的统计分布3.2正态分布曲线的特性

(一)正态分布曲线是以算数平均数μ为原点,向左右两側作对称分布,所以它是一个对称曲线。(二)从原点μ=0所竖立的纵轴是最大值(y0)。

(三)正态分布的多数测定值集中于算术平均数μ附近,离平均数越远,其相应的次数越少;且在相等处具有相等次数;在以上其次数极少。

(四)正态分布曲线在处有“拐点”曲线两尾向左右伸展,永不接触横轴,所以当x→±∞时,分布曲线以x轴为渐进线,因之曲线全距从-∞到+∞

。fN(x)μμ-1σμ+1σ68.26%μ-2σμ+2σμ-3σμ+3σ95.46%3.2正态分布曲线的特性(五)正态分布曲线是以参数μ和σ的不同而表现为一系列曲线,所以它是一个曲线系统而不仅仅是一个曲线。μ确定它在x轴上的位置,而σ确定它的变异度,不同μ和σ的正态总体具有不同的曲线位置和变异度,所以任何一个特定正态曲线必须在其μ和σ确定后才能确定。随机误差的统计分布0-1-2-312345μ=0、μ=1、μ=2的正态分布0σ=1σ=2σ=3σ=1、σ=2、σ=3的正态分布(六)正态分布曲线与x轴之间的总面积等于1,因此在曲线下x轴的任何定值,例如从x=x1到x=x2之间的面积,等于x落在这个区间内的概率。4.随机误差的区间概率正态分布曲线和横轴所夹的面积表示全部数据出现概率的总和显然应当是100%,既为1。记为随机误差的统计分布(4.1)测定值x出现在区间[a,b]的概率P(a≦x≦b)就等于直线x=a,x=b与正态分布曲线,坐标横轴所包围的面积,即(4.2)ab上式公式中的横坐标x改用u表示,u定义为(4.3)这便是均值为μ,标准差为σ的正态分布变成了均值为0,标准差为1的标准正态分布,其分布密度涵数变为(4.4)随机误差的统计分布

4.随机误差的区间概率随机误差的统计分布在本书附录B-1列有正态分布表,计算出不同u值的f(u)曲线所包围的面积的值。表中给出的积分值为(4.5)例:某测定值的误差服从正态分布,以知测定标准差σ=2.5,求测定值的误差位于区间(-3,3)的概率。

解:由题意,xa-μ=-3,xb-μ=3。按式进行变换随机误差的统计分布于是原题化为求u处于区间(-1.2,1.2)的表准正态分布的概率。1.2-1.2σ=1由附录B-1查得ka=1.2的概率α,P(u≧1.2)=α=0.1151由于正态分布的对称性P(u≧1.2)和P(u≦-1.2)的概率是相同的。所以,u处于区间(-1.2,1.2)的标准正态分布的概率是:1-2*0.1151=0.7698随机误差的统计分布于是原题化为求u处于区间(-1,1)的标准正态分布的概率。由附录B-1查得ka=1的概率α,P(u≧1)=α=0.1587所以,u处于区间(-1,1)的标准正态分布的概率是:1-2*0.1587=0.6828同样,误差位于区间(-2σ,2σ),(-3σ,3σ)的概率分别为

P(|u|≦2)=1-2

P(u≧2)=1-2*0.0228=0.9544P(|u|≦2)=1-2

P(u≧3)=1-2*0.00135=0.9973例:求测定值的误差位于区间(-σ,σ)的概率。解:由题意,|x-μ|=σ。

|u|=(|x-μ|)/σ=1随机误差的统计分布

从以上的结果可以看出,测定值的误差落在区间(-3σ,3σ)的概率是很大的,接近于1。而落在这个区间以外的概率是1-0.9973=0.0027,就是说1000次测定中,出现误差的绝对值大于三倍标准差的机会不超过三次。所以,把误差的绝对值等于三倍表准差称为最大误差。例:假设x乃一随机变数具有正态分布,平均数μ=30,标准差σ=5,试计算X小于26,小于40的概率,区间(26,40)的概率以及大于40概率。解:1.首先计算小于26的概率。随机误差的统计分布-0.8μ=00.8μ=0必须先将x转换为u值,把本例的正态分布转换成标准正态分布。由公式(4.3)u=(x-μ)/σ得

u=(x-30)/5=(26-30)/5=-0.8;这样原题化为求u处于区间(-∞,-0.8)的概率。因为正态分布的对称性,

P(u≦-0.8)的概率等于P(u≧0.8)的概率。查附录B-1正态分布表0.8可得P(x≦26)=0.2119解:2.小于40的概率,同样u=(x-30)/5=(40-30)/5=2.0。

P(u≦2.0)=1-P(u≧2.0)查附录B-1,u=2.0时P(u≧2.0)=0.0228

P(u≦2.0)=1-P(u≧2.0)=0.9772,所以小于40的概率

P(x≦40)=0.9772。随机误差的统计分布μ=02.03.处于区间(26,40)的概率P(26<x<40)=P(-0.8<u<2.0)=0.9772-0.2119=0.76544.大于40的概率P(x>40)=1-P(x<40)=1-0.9772=0.0228μ=02.0-0.8μ=02.0有效数字可靠的几位数字再加上可疑的一位数字統称为有效数字。有效数字是指一个近似结果具有实际意义的数字。在图中三角形所指的长度为1.28cm,其中1.2cm为至可靠的数字,0.08cm为估计值也就是可疑数字。把长度写成1.286cm是错误的。因为,0.006cm是没有什么实际意义的数字。0123∇cm用台称称量某一物体时重量为12.0(g),该称量的最大绝对误差为±0.1(g),因此这个量的记录结果应当是

12.0(g)或写成12.0±0.1,

12.0的最后一位是有误差的,其真实重量在11.9~12.1(g)之间。若将这个测量结果写为12.01或11.99等都是没有意义。2.50有三位有效数字2.5有二位有效数字0.025有二位有效数字0.0250有三位有效数字1.00有三位有效数字54000取三位有效数字时写成5.40×104有效数字

当一个近似值的有效数字的位数确定后,其余数字应按照“四舍六入五单双”的原则。有效数字大于五,前进1。小于五,舍下去。恰好是五要考虑,五后非零前进一;若是五后全为零,要看五前是偶奇;五前为偶则舍弃,五前为奇前加一。例:下面数字取三位有效数28.748→28.728.381→28.428.750→28.828.650→28.6在多数情况下,表示误差的有效数字最多可取两位。在计算平均值时,若为4个或多于4个数取平均数,则平均数的有效数字位数可增加1位。有效数字

1、加减运算时,其结果小数点后的位数,应与参与运算的近似值小数点后位数最少的项相同。

2、乘除运算时,其结果的有效数字应与近似值中有效数字位数最少者相同。有效数字

3、乘方、开方运算中,原近似值有几位有效数字,计算结果就保留几位有效数字。

4、在对数计算中,所得结果小数点后位数与真数的有效数字的位数应相同。

5、在计算平均值时,若为4个或多于4个数取平均数,则平均数的有效数字位数可增加1位。

6、常数的有效数字位数可以认为是无限的,实际运算中需要几位就取几位。7、一般在工程计算中,取2~3位有效数字。有效数字间接测定的误差估计对测量精密度较高,且容易测量的量我们可以进行直接测量。而对于那些不能直接测量或不太容易测量的量,就借助于已知的函授关系来计算。这样,从测得数据到计算结果,就存在着误差传递问题。

这个式表示,当x1,x2,・・・・・・,xm有微小改变量dx1,dx2,・・・dxm时,函授y的改变量为dy。若把dx1,dx2,・・・dxm看做各直接测定量的误差,其中叫做误差传递系数。总误差的大小取决于每个测量误差的大小,还取决于误差传递系数。・・・・・・・・・・・・・・・・・・・・・・・(1)误差传递的基本公式1.误差传递的基本公式如果间接测定量y是各直接测定量x1,x2,・・・・・,xm的函授,即且各直接测定量相互独立,则对上式求全微分得间接测定的误差估计

2.误差的方和根合成公式当各直接测定量的误差为纯粹的误差,且标准差为已知是,我们可以推导出误差的方和根公式。设为了求间接测定量的结果,对各直接测定量分别进行了N次等精度测定。由误差传递的基本公式(1)可知,第j次测量得间接测定量的误差为・・・・(2)两边平方,得・・・(3)如果x1,x2,・・・・・・,xm是相互独立的量,当n→∞时,右边的非平方项的加和为零。于是间接测定的误差估计上式两边除N,再结合标准差的定义有・・・・・・(4)这就是误差的方和根公式,又称随机误差传递公式。函授y求全微分,然后d

改为σ、右边各项分别平方再加和并开平方,这就是求一个函授的方和根合成公式的全过程。间接测定的误差估计例1.求对数函授y=lnx的随即误差传递公式。d改为σ所以得

解:例2.求函授y=x/w的随即误差传递公式。(方和根合成公式)d改为σ得求微分得两边平方得解:两边取对数lny=lnx-lnw,求全微分两边平方得间接测定的误差估计当直接测定量的误差主要是系统误差,

而其正负号又不可能确定,或假定随即误差在极端的条件下合成时,可将误差传递基本公式3.

误差的算数合成公式中的记号“d”改为“Δ”,并将右端各项取绝对值相加,即可得到误差的算数合成公式:间接测量中,有两个问题是经常碰到:第一,已知直接测定量的测定值及其误差,计算间接测定量的误差。第二,预先给定间接测定量所允许的误差,计算各直接测定量所允许的误差。4.误差估计的应用

1)求间接测定量的误差例1.用流体重力称衡法测固体密度的公式为

已知:m=27.06±0.02(g)m1=17.03±0.02(g)

ρ0=0.9997±0.0003(g/cm3)求:ρ及σρ

解:

间接测定的误差估计两边求对数lnρ=lnm–

ln(m–m1)+lnρ0求全微分整理得间接测定的误差估计4.误差估计的应用

所以有代入已知数据已知数据代入原公式得4.误差估计的应用例2:间接测量一圆柱的体积V,测得直径和高分别为求间接测定量体积V及按误差方和根合成公式计算的误差σv按算数合成公式计算的ΔV。解:

间接测定的误差估计D=0.80±0.01(cm)H=1.02±0.01(cm)圆柱体体积的计算公式为取对数求全微分所以有484.误差估计的应用

间接测定的误差估计代入已知数据用误差算术合成公式计算,得49间接测定的误差估计例3:实验测得盐溶液中盐的浓度C=172.4±0.3(kg/m3),容积V=0.825±0.005(m3),试求溶液中盐的重量W及误差σw。解:W=C×V=172.4×0.825=142两边取对数lnW=lnC+lnV求全微分所以50间接测定的误差估计例4:已知间接测定量由实验测得求N的结果及其误差σN。解:两边取对数求全微分所以上面例子中的σV和ΔV都是表示间接测定量的误差的。由计算的结果可以看出,由于采用误差合成公式的不同,得到误差的结果也不同。当直接测定量仅有一个时,用误差的方和根合成和算术合成公式计算,所得到的间接测定量误差的大小是相同的。当直接测定量是两个或两个以上时,算术合成得到的误差偏大,而方和根合成得到的误差则小一些。间接测定的误差估计4.误差估计的应用直接测定量的误差主要是系统误差,其正负号不能确定,或在要求不太严格的情况下,可用误差的算术合成来估计总误差。若直接测定量的误差主要是随即误差,特别是在直接测定量较多时,最好采用误差方和根合成来估计总误差。4.误差估计的应用间接测定的误差估计2)直接测定量所允许的测定误差按一定的研究方案进行实验时,怎样选取仪器的精密度。就是求直接测定量所允许的测定误差的问题。很多时,常用等效法。这一方法假定各个直接测定量对间接测定量的误差贡献均相等,即假定各分误差项相等。4.误差估计的应用间接测定的误差估计间接测定的误差估计4.误差估计的应用

根据常用等效法,把随机误差传递(误差的方和根)公式

中右边各分误差项,可以用来代替,得由各分误差相等的假设,可以得计算出各直接测定量所允许的误差间接测定的误差估计

4.误差估计的应用例1:在用图解积分法作吸收塔计算时,三角形的面积S要用两边及其所夹的角来计算。这些量的近似值分别为a=12cm,b=10cm,A=38°若要求间接测定量三角形的面积准确到0.5(cm3),试计算各直接测定量所允许的误差。(求σa,σb,σA)Aab解:以题意三角形的面积函授取对数求全微分,得4.误差估计的应用间接测定的误差估计所以有采用等效法,令代入已知数据得间接测定的误差估计4.误差估计的应用结果表明,当边长a,b及其夹角A的测定误差分别不大于0.094(cm),0.078(cm),和0.35°时,可保证所得面积S的误差不超过0.5(cm2)。在实际测定中,对各测定量的实际误差还可以进行调整。对于技术上困难大,经济上耗费大的测定项目,其测定精度的要求可降低一些。而对于容易测定的量,其测定精度可以适当高一些,即要求其误差小一些。只要满足间接测定量的误差不大于所给定的误差就可以了。间接测定的误差估计4.误差估计的应用例2:在用图解积分作吸收塔计算时,三角形的面积S要用两边及其所夹的角来计算。这些量的近似值分别为a=12±0.01(cm),b=10±0.01(cm),A=38°若要求间接测定量三角形的面积准确到0.5(cm3),试计算间接测定量角度A所允许的误差。(求σA)解:由的随即误差传递公式知:间接测定的误差估计4.误差估计的应用所以有要使减小总误差,必需减小各项分误差,即提高各项测定量的精度。单个项分误差精度再高也不能减小总误差。实验数据整理

1.数据处理中常用的几个概念

总体:研究对象的全体,即具有共同性质的个体所组成的集团。

个体:研究对象的一个单体称为个体。在实际研究工作当中对某一量进行测量时,一般只做有限的几次测量。即在总体中抽取部分个体,用以研究总体的性质。抽选的个体的集合体,在数理统计中称为子样(或样本)。每个字样所包含的个体数目,通常称为容量。字样中的个体称为元素。实验数据整理2.子样的均值与标准差我们可以用从总体抽取的子样去研究该总体,利用子样的信息来作出关于总体的推断。一般来说,通过子样来要推断总体。①首先要有较好的抽样方法,使抽得的一些个体,能很好地反映总体的情况。这就要贯彻随即抽样的原则,即各次抽取应该是彼此独立的,总体中的每个个体被抽到的机会是均等的。同时,子样的容量也不能太少。②其次,要计算出子样的特征数,用它们去推断总体的特征数。常用的特征数有两类,一类是表示数据集中性的特征数,常用的有算术平均值。另一类是表示数据离散性的特征数.常用的有方差。即子样元素值与子样平均值之偏差的平方和的平均值。算术平均值子样方差实验数据整理2.子样的均值与标准差子样方差的开平方为子样标准差,为了得到总体方差的无偏估计量,必须对子样方差作点修改,即n-1来代替子样方差中的n,并记为S2,S2称为子样修正方差。相应地有子样修正标准差。即经常把S2和S分别叫做子样方差和子样标准差(或简称标准差)实验数据整理3.均值与方差的点估计在实际问题中,根据子样的数据,计算出的子样特征数与S2,通常用来作为相应总体特征数的估计量。对于服从正态分布的总体而言,均值为μ,方差为σ2

。当子样是从一正态分布的总体中随即抽出的一部分时,可用子样平均值去估计该总体的均值μ,而用于子样方差S2去估计总体方差σ2,这在数理统计中称为点估计,即,其中“^”为估计量的符号。当我们用作为总体估计量μ或用S2作为总体估计量σ2时,子样特征数应满足这样的要求,即它的数学期望(统计平均)应当等于它所估计的参数本身,即这个要求称为无偏性。实验数据整理实验数据整理所谓无偏估计,当然不是说用无偏估计量来估计不产生偏离,只是说由于子样数据算出的估计值离被估计值很近,由不同子样得到的估计值在被估计值附近波动,大量估计值的平均值能够消除估计值对被估计值的偏离。正是根据子样平均值是总体均值的无偏估计值这一观点,如测定值的分布服从正态分布,则算术平均值即为一组等精度测量中的最佳值或最可信赖值。换句话说,算术平均值很接近真值μ(总体均值)。3.均值与方差的点估计解:由左边得证明算术平均值与测定值偏差的平方和最小。即设有一不等于算术平均值的任一数A,则必有实验数据整理3.均值与方差的点估计3.均值与方差的点估计实验数据整理实验数据整理3.均值与方差的点估计移项得3.均值与方差的点估计因A≠,又n是正整数,则必有即所以已得证算术平均值与测定值偏差的平方和最小。实验数据整理3.均值与方差的点估计介绍平均值的标准差。算术平均值的标准差常用下式表示,即这个公式表明了平均值的标准差与子样标准差S的关系。当标准S不变时,n增大,算术平均值的标准差减小,亦即用作为估计的精度高。在分析测定时,测定次数n(子样容量)不能太小,否则算术平均值的误差将增大。S不变时,n>5以后,子样均值的标准差随n的增大而减小得很慢。这就是说,单靠增加观测次数来提高实验的精密度是不够的。这就意味着,要把更多的精力用来改进测试技术,往往比重复老一套的测试精度不高的测量更有意义。因此,在实际测定某一量时,由于多方面条件的限制,重复测定的次数n很少超过50次,一般在3~20次左右。实验数据整理4.平均值与标准差的基本性质性质1.对子样的每一个值同乘以一常数a,由此得到的平均值或标准差要相应地除以这个常数a,才是原子样的平均值或标准差。对性质1的证明如下:设,证明,证明:因为所以实验数据整理4.平均值与标准差的基本性质证明因为所以实验数据整理4.平均值与标准差的基本性质性质2.对子样的每一个值同加一个常数b,由此得到的标准差与原子样的标准差相同,而得到的平均值要减去这个常数b,才是原子样的平均值。对性质2的证明如下:设

,证明

,

证明:因为所以实验数据整理4.平均值与标准差的基本性质证明S=S`证明:因为所以实验数据整理根据子样平均值与标准差的上述性质,我们对一些太大,太小或有小数的测定值进行有关变换,可使子样平均值与标准差的计算简化。常用的变换公式为:相应地有实验数据整理5.平均值与标准差的算法由于算术平均值与标准差在数据处理中占有特殊的地位,所以在实际运算中碰到计算算术平均值与标准差的机会特别多。介绍几种算法1)直接公式法按算术平均值的原始定义式和标准差的原始定义式计算的方法。例:分析容渣中二氧化硅的含量,4次测定值分别为28.5,28.6,28.2,28.3。求测定结果的平均值与标准差。解:5.平均值与标准差的算法2)计算标准差的导出公式法为了提高计算精度和简化计算其间,我们可以导出以下公式或者写成实验数据整理代入5.平均值与标准差的算法例:分析容渣中而氧化硅的含量,4次测定值分别为28.5,28.6,28.2,28.3。求测定结果的标准差。解:利用公式实验数据整理5.平均值与标准差的算法3)平均值与标准差的简易算法当原始数据有效数字位数很多时,一种简便的计算方法是将原始数据按进行变换,计算出变换后数据的平均值和标准差,最后按比例和分别将平均值和标准差还原。

选择b的原则是测定量的数据中出现频率最多的数或是接近平均值的一个任意数。选择a的原则是使变换后的数据为有效数字最少的整数。实验数据整理例:测得某污水样的pH值如下表所示。求这组数据的平均值与标准差。5.平均值与标准差的算法3)平均值与标准差的简易算法

12.71-52522.760032.793942.782452.760062.8263672.782482.74-2492.7600102.74-24Σ

486序号实验数据整理解:b=2.76,a=100,即6.

均值的置信区间用相同的方法重复测定某一量,在消除系统误差的情况下,测定值的算术平均值,可作为这个量的真值μ的估计值。测定次数愈多,即子样容量n愈大,平均值与真值就越接近。当测定次数无穷时,平均值就是这个量的真值。当然,实际上测定无穷多次是做不到的。我们可以根据有限次测定数据的平均值去估计真值μ。但毕竟是

。那么子样平均值与总体平均值到底相差多少呢?这就需要估计其误差。我们令均值μ的估计量的误差的绝对值为我们给出一个置信概率(或称置信度),求总体均值在这个置信概率下的所在范围(区间),这个范围称为置信区间。可以用下式表示μ的估计量或等价地写成这个公式表示估计量的误差落在区间(-ε,ε)中的概率为(1-α)。再进一步写成公式表示在置信概率为(1-α)时的均值μ的置信区间是实验数据整理置信区间表示估计结果的精确程度,置信概率则表示结果的可靠程度。6.

均值的置信区间为了确定均值μ在某一置信概率下的置信区间,需要计算中的ε。这里需要引入一个新的变量。随机变量t有如下的概率密度函授这个分布叫做具有自由度为f=n-1的t分布。t分布对于t=0是对称的,t分布的概率密度取决于子样的容量n和t的值。利用t

分布可以导出实验数据整理6.

均值的置信区间即式中所以结合算术平均值的标准差的计算式所以上式可写成将式代入下式得对应置信概率(1-α)的均值μ的置信区间如下:常把置信区间表示为利用附录B-2,可以查到对应已给的置信概率(1-α),自由度f=n-1的ta,f的值,从而求得均值μ的置信区间。实验数据整理6.

均值的置信区间求得均值μ的置信区间的最体做法如下:(1)问题的给出:原始数据,子样容量n,置信概率(1-a)。(2)由a,f=(n-1)查附录B-2,得ta,f(3)有原始数据计算平均值和标准差S

(4)计算ε(5)写出置信区间,或者写成,并表示置信概率。

例1.在指定条件下,对某物理量测定得数据:11,12,12,8,8,13,13,

14,14,15,试分别求出置信概率为0.90和0.99时均值的置信区。解:已知n=10,1-α1=0.90、1-α2=0.99,则f=n-1=9,

α1=1-0.90=0.10,α2=1-0.99=0.01查附录B-2得,实验数据整理6.

均值的置信区间由原始数据,得当置信概率分别为90%和99%时,该物理量的置信区间分别为实验数据整理6.

均值的置信区间例:为检验某一河流中鱼被汞污染的情况,从一些鱼中随机抽取一些鱼样,测定鱼组织中的汞含量,得到测定结果如下(ppm):2.06,1.93,2.12,2.16,1.89,1.95,试从测定数据估计这批鱼汞含量在置信概率为0.95的范围()。解:已知条件1-a=0.95,a=0.05,f=n-1=6-1=5查附录B-2得由原始数据得实验数据整理所以,这批鱼的汞含量范围位为我们可以说“根据这次试验,有95%的把握说,这批鱼的汞含量在1.89~2.15ppm之内”。79实验数据整理7.

异常数据的取舍当我们着手整理实验数据时,必须先解决一个重要问题,那就是异常数据取舍的问题。整理实验数据时往往会遇到这种情况,即在一组实验数据里发现少数几个偏差特别大的数据,如果这些数据是因为读错,记错,算错,仪器震动等等因素影响而造成的坏值可以有充分的理由将其舍弃。但是,如果为了得到精度更高的结果,而人为地舍掉一些偏差大一点,但不是属于坏值的值,这是错误的。那么这样处理这些数据呢?一般要用统计判别法。统计判别法是建立在测定值遵从正态分布与随机抽样理论基础之上的。统计判别法要舍弃的坏值的数目,相对于子样的容量是极少数。如果需舍弃的异常数据较多时,那就要对测定的正确性提出怀疑。下面介绍几种统计判别法的准则。1)拉依达准则拉依达准则又可称为3S准则。根据拉依达准则,在一组等精度独立测定值中,若某个值xd的偏差的绝对值大于三倍标准差,即则可以认为xd是坏值,需舍弃之。在实际判断中,只要可疑数据xd是在区间以外,则舍弃xd。实验数据整理7.

异常数据的取舍1)拉依达准则解:

由标准差的公式例:测量某溶液中某一物理量,整理测量数据如下102,98,99,97,100,140,95,100,98,96,102,101,101,102,102,99试用拉依达准则检验测定值140是否为坏值?。即140是否在以外。根据原始数据计算得实验数据整理7.

异常数据的取舍1)拉依达准则由于测定值140在区间(70.9,133.1)以外,故应舍弃之。拉依达准则使用方便,当测定次数较多,即子样容量较大时,或对检验的精度要求不高时,可以用它。但当测定次数较少时,如n≦10,一组测定值中即使有坏值也无法剔除。当精度要求较高时,可用2S准则。证明n≦10时,用拉依达准则是无法剔除坏值。证明:当n≦10时实验数据整理7.

异常数据的取舍1)拉依达准则因为所以根据拉依达准则,测定值中,若某个值xd的偏差的绝对值大于三倍标准差,即则可以认为xd是坏值,需舍弃之。所以n≦10时,用拉依达准则是无法剔除坏值。实验数据整理实验数据整理7.

异常数据的取舍2)肖维特(Chauvent)准则在一组等精度测定数据中,若可疑数据xd的偏差满足下面的不等式,即

或等价地有,当xd在区间以外,则可认为xd是坏值,应舍弃之。Wn的值取决于子样容量n。

nWnnWnnWn31.38132.07232.3041.53142.10242.3151.65152.13252.3361.73162.15262.3971.80172.17272.4981.86182.20282.5891.92192.22292.71101.96202.24302.81112.00212.26313.02122.03222.28323.20表1.肖维特系数表7.

异常数据的取舍2)肖维特(Chauvent)准则实验数据整理例:测得某品位的矿石中铁含量的数据如下1.52,1.46,1.61,1.55,1.49,1.68,1.46,1.83,1.50,1.54试用肖维特准则判断1.83是否应当舍弃。解:查肖维特系数表n=10时,W10=1.96,由原始数据计算得由于1.83在区间(1.329,1.799)以外,故测定值1.83是坏值,应当舍弃。实验数据整理7.

异常数据的取舍3)格拉布斯(Grubbs)准则考虑到置信概率(置信度),格拉布斯严格地推导出,当或等价地有,当xd落在区间以外,则可认为xd是坏值,应当舍弃之。取决于子容量n和小概率事件的概率。在用格拉布斯准则时,通常取。

n0.010.05n0.010.05n0.010.0531.151.15122.552.29212.912.5841.491.46132.612.33222.942.6051.751.67142.662.37232.962.6261.941.82152.702.41242.992.6472.11.94162.742.44253.012.6682.222.03172.782.47263.102.7492.322.11182.822.50273.182.81102.412.18192.852.53283.242.87112.482.24202.882.56293.342.96aaa格拉布斯数值表实验数据整理7.

异常数据的取舍3)格拉布斯(Grubbs)准则对某一物理量进行15次等精度测定,其结果如下:0.60,1.56,1.70,1.76,1.78,1.87,1.95,2.06,2.10,2.18,2.20,2.39,2.48,2.63,3.01使用格拉布斯准则判断其中有无坏值,3.01是不是坏值。解:选定α=0.05,查格拉布斯数值表得:由于测定值0.60落在区间(0.692,3.344)以外,故根据格拉布斯准则,可将0.60舍弃。实验数据整理7.

异常数据的取舍3)格拉布斯(Grubbs)准则求x15=3.01是不是坏值。解:剔除0.60以后,则子样容量变为n=15-1=14,查格拉布斯数值表得实验数据整理7.

异常数据的取舍3)格拉布斯(Grubbs)准则由于可疑数据3.01在区间(1.171,3.067)以内,故不能作为坏值剔除。8.

整理实验数据测定某一热交换器里水垢中的Fe2O3的含量,在相同条件下测定6次的数据如下:79.58,79.45,79.47,79.50,79.62,79.38,写报告实验结果解:在这组数据中没有异常数据,直接对原始数据进行处理。计算得对实验数据按有效数字计算规则记录,并对其中的可疑数据进行恰当的取舍后,还需要进一步整理。首先要求出子样的平均值和标准差,然后用数值表示对总体均值的估计结果。有两种表示形式,一种是另一种是另一种置信概率为95%2.1列表法将试验数据列成表格,将各变量的数值依照一定的形式和顺序一一对应起来(1)试验数据表①记录表试验记录和试验数据初步整理的表格表中数据可分为三类:原始数据中间数据最终计算结果数据试验数据的表图表示法原始数据番号試料名アンモニア態

硝酸態窒素無機態窒素1吹込1年0~20cm22.4364.9387.32吹込1年20~40cm20.3239.4259.73吹込1年40~60cm19.3129.0148.34無吹込1年0~20cm37.8300.2338.15無吹込1年20~40cm29.8177.7207.56無吹込1年40~60cm25.8110.5136.37吹込2年0~20cm25.7326.8352.58吹込2年20~40cm20.2220.1240.39吹込2年40~60cm20.8165.0185.810無吹込2年0~20cm33.0289.0322.111無吹込2年20~40cm23.2140.7163.912無吹込2年40~60cm22.494.8117.213吹込3年0~20cm23.9256.7280.614吹込3年20~40cm23.5238.8262.315吹込3年40~60cm21.5219.3240.716無吹込3年0~20cm33.7247.4281.117無吹込3年20~40cm24.6165.1189.718無吹込3年40~60cm22.1128.0150.1深度(cm)深层吹入法对照2025.733.04020.223.26020.822.4中间数据最终计算结果数据SampleNoHorizonParticledensityBulkdensityPorositypHOrganicmatterTotalNAvailabilityP(Mg/m3)(Mg/m3)(%)(g/kg)(g/kg)(mg/kg)M1Ap2.581.4543.88.014.31.187.7B2.571.4643.27.212.91.032.3C2.581.4842.66.317.11.526.6M2Ap7.023.11.284.7B7.513.10.823.6Table2.PhysicochemicalPropertyofSalinesoils.(2)说明:三部分:表名、表头、数据资料

必要时,在表格的下方加上表外附加

表名应放在表的上方,主要用于说明表的主要内容,为了引用的方便,还应包含表号

表头常放在第一行或第一列,也称为行标题或列标题,它主要是表示所研究问题的类别名称和指标名称数据资料:表格的主要部分,应根据表头按一定的规律排列表外附加通常放在表格的下方,主要是一些不便列在表内的内容,如指标注释、资料来源、不变的试验数据等试验数据的表图表示法SampleNoHorizonParticledensityBulkdensityPorositypHOrganicmatterTotalNAvailabilityP(Mg/m3)(Mg/m3)(%)(g/kg)(g/kg)(mg/kg)M1Ap2.581.4543.88.014.31.187.7B2.571.4643.27.212.91.032.3C2.581.4842.66.317.11.526.6M2Ap7.023.11.284.7B7.513.10.823.6Table2.PhysicochemicalPropertyofSalinesoils.(表名)表头数据资料注:Ap深度为15cm,B深度为8cm,C深度为20cm。表外附加Fig.1.SamplingsitesinNortheasternPartofChina①SampleM3~M5,M8,M10~M12wascollected②SampleM7andM9wascollected③SampleM1andM2wascollected④SampleM6wascollected②结果表示表表达试验结论应简明扼要试验数据的表图表示法(3)注意:表格设计应简明合理、层次清晰,以便阅读和使用;数据表的表头要列出变量的名称、符号和单位;要注意有效数字位数;试验数据较大或较小时,要用科学记数法来表示,并记入表头,注意表头中的与表中的数据应服从下式:数据的实际值×10±n=表中数据;数据表格记录要正规,原始数据要书写得清楚整齐,要记录各种试验条件,并妥为保管。试验数据的表图表示法2.2.1常用数据图(1)线图(linegraph/chart)表示因变量随自变量的变化情况

线图分类:单式线图:表示某一种事物或现象的动态复式线图:在同一图中表示两种或两种以上事物或现象的动态,可用于不同事物或现象的比较2.2图示法试验数据的表图表示法图1高吸水性树脂保水率与时间和温度的关系试验数据的表图表示法图2某离心泵特性曲线试验数据的表图表示法(2)XY散点图(scatterdiagram)表示两个变量间的相互关系散点图可以看出变量关系的统计规律图3散点图试验数据的表图表示法(3)条形图和柱形图用等宽长条的长短或高低来表示数据的大小,以反映各数据点的差异两个坐标轴的性质不同数值轴:表示数量性因素或变量分类轴:表示的是属性因素或非数量性变量

图4不同提取方法提取率比较试验数据的表图表示法分类:单式:只涉及一个事物或现象复式:涉及到两个或两个以上的事物或现象

图5不同提取方法对两种原料有效成分提取率效果比较试验数据的表图表示法(4)圆形图和环形图①圆形图(circlechart)也称为饼图(piegraph)表示总体中各组成部分所占的比例只适合于包含一个数据系列的情况饼图的总面积看成100%,每3.6°圆心角所对应的面积为1%,以扇形面积的大小来分别表示各项的比例图6全球天然维生素E消费比例试验数据的表图表示法②环形图(circulardiagram)每一部分的比例用环中的一段表示

可显示多个总体各部分所占的相应比例,有利于比较图7全球合成、天然维生素E消费比例比较试验数据的表图表示法(5)三角形图(ternary)

常用于表示三元混合物各组分含量或浓度之间的关系

三角形:等腰Rt△、等边△、不等腰Rt△等顶点:纯物质边:二元混合物三角形内:三元混合物MABS●xAxSxB=1-xA-xS●图8等腰直角三角形坐标图试验数据的表图表示法ABCxCxBxA●xAxAxCxCxBxBMEF图9等边三角形坐标图试验数据的表图表示法(6)三维表面图(3Dsurfacegraph)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论