版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、直线回归分析及其测量不确定度评定 第 14 页 共 14 页直线回归分析及其测量不确定度评定第一节 一元线性回归分析当输入量Xi的估计值xi是由实验数据用最小二乘法拟合的曲线上得到时,曲线上任何一点和表征曲线拟合参数的标准不确定度,可以用有关的统计程序评定。例如有两个估计值x,y有线性关系y=a+bx,对其独立测得若干对数据(x1,y1),(x2,y2),¼,(xn,yn),n>2,欲求取参数a,b及其标准不确定度,以及预期估计值及其标准不确定度,则需要应用最小二乘法。最小二乘法是以“残差平方和最小”为条件求得最佳值并拟合成最佳直线、最佳曲线。图13.1给出了直线拟合的最小二乘
2、法示意图。图中,xi,yi是观测数据,vi是残差,a是拟合直线的截距,b是拟合直线的斜率。yiyixixvia拟合直线测量数据图13.1 最小二乘法示意图呈直线的标准曲线用下式表示: (13.1)式中b是直线的斜率(回归系数),a是截距。各实验数据点可表示为(xi,yi)i=1,2,n。 误差方程可用残差vi表示为: 需要使残差平方和最小 因此须同时对a和b求偏导数并使其为零,得到联立方程 式中, 首先用联立方程求解b 式中,以上各式中,是x值的平均值,是y值的平均值。利用试验数据应用上式求解b会增加比较大的工作量,通常将上式变换为更易于数据处理的形式。注意到,上式的分子可变换成 类似地可将上
3、式的分母可变换成 最后将lxx和lxy代入可以求解出b 用已经求得的b和,求得截距a。 同样可以计算相关系数r。现归纳整理得到如下的斜率b、截距a和相关系数r计算公式1.1 斜率 (13.2)1.2 截距 (13.3)1.3 相关系数 (13.4)1.4 y对x的回归直线用计算得到的斜率b和截距a绘制的直线就是拟合得到的最佳直线,称为y对x的回归直线。显然,实验中测得的各实验点(xi,yi)并不完全落在该回归直线上,除非相关系数r1。y对x的回归直线方程可表示为 (13.5)式中,表示是从回归直线上取得的与xi对应的yi计算值。【例13.1】 现以中国合格评定国家认可委员会CNAS-GL06:
4、2006化学分析中不确定度的评估指南例A5中,测定镉浓度为例,求回归直线方程和相关系数r。实验室采用浓度为(500±0.5)mgL-1镉标准溶液,配置浓度分别为0.1)mgL-1,0.3 mgL-1,0.5 mgL-1,0.7 mgL-1和0.9 mgL-1的5种校准标准溶液。用原子吸收光谱仪对5种校准溶液的每一个分别进行3次平行测量,被测物品浓度和吸收值如表13.1中第2栏和第3栏所示。求回归直线方程和相关系数r。【解】 为便于计算,将有关中间计算结果列于表13.1中。用式(13.2)和表13.1的数据计算斜率b (13.6) 用式(13.3)和表13.1的数据计算截距a (13.
5、7) 用式(13.6)、式(13.7)和表13.1的数据就可给出校准曲线(回归直线)方程 (13.8)用式(13.4)和表13.1的数据计算相关系数r (13.9)相关系数r是一个纯数,在理化试验中,其绝对值通常大于0.99而很少小于0.90。相关系数r接近于1和1时,一般应给出三位以上的有效数字。r绝对值越接近1,相关性越好,直线的拟合程度越好,数据离直线越近。当x增加y也增加时,我们称x和y(之间)为正相关,r为正值。当x增加y反而减小时,x和y(之间)为负相关,r为负值。表13.1 原子吸收法测定镉浓度的实验数据和回归直线中间计算结果xy(´10-6)10.10.028-0.4
6、0.16-0.10120.010241440.0404823.0420.10.029-0.40.16-0.10020.010040040.0400814.4430.10.029-0.40.16-0.1.0020.010040040.0400814.4440.30.084-0.20.04-0.0.4050.002043040.00904950.30.083-0.20.04-0.04620.002134440.00924460.30.081-0.20.04-0.04820.002323240.00964070.50.135000.00580.00003346033.4680.50.131000.0
7、0180.0000034203.2490.50.133000.00380.00001444014.44100.70.1800.20.040.05080.002580640.010166.76110.70.1810.20.040.05180.002683240.0103612.96120.70.1830.20.040.05380.002894440.0107631.36130.90.2150.40.160.08580.007361640.03432112.36140.90.2300.40.160.10080.010160640.0403219.36150.90.2160.40.160.08680
8、.007534240.0347292.16S7.51.93801.200.070088400.2892391.2【注】设计确定回归直线的中间计算结果表,在使用Excel电子表格时将节省大量运算时间,并减少计算差错。第二节 回归直线的方差分析及显著性检验 因为对任意两个变量x和y的一组观测数据(xi,yi)(i=1,2,n),都可以用最小二乘法拟合出一条直线。所以,回归直线方程式(13.5)是否实用,首先需要确定该直线是否基本符合x和y之间的实际关系。也就是说需要对式(13.5)进行显著性检验。其次,由于变量x和y之间是相关关系,那么是否可以应用回归直线方程式(13.5),依据自变量x的值来预报
9、因变量y的值?也就是说,回归直线的预报是否准确?因此需要分析评定回归直线的方差或不确定度。一、 回归直线的方差分析分析可知,观测值y1,y2,yn之间的差异(或变差),是由两方面的原因引起的。一是自变量x的取值不同,二是测量误差等其他因素的影响。为了对观测数据(xi,yi)线性回归的效果进行检验必须将上述两个因素造成的结果分离出来。图13.2 回归直线方差分析平均数回归直线0yx 如图13.2所示,将变量y的观测值yi(i=1,2,n)与其平均值的偏差,分解为由变量x的不同取值引起的回归偏差,以及由于测量误差等其他因素引起的残余误差。并进一步用n个取值的偏离平方和来描述它们,分别记为S,U和Q
10、。总偏差平方和S为 (13.10) 参看图13.2,有 (13.11)可以证明上式中的交叉项为零,即 (13.12)因此总偏差平方和S可以分解为两部分: (13.13)上式第一项 (13.14)称作回归平方和。U反应了在y的总偏差中因为x和y的线性关系而引起的y的变化的大小。式(13.13)中的第二项 (13.15)称作残余平方和。Q反应了在y的总偏差中除了x对y的线性影响之外的其他因素而引起的y的变化的大小。这些因素包括测量误差,x和y不能用直线关系描述的因素,以及其他未加控制的因素等。正如本章第一节所述,回归分析要求“残差平方和最小”,即Q越小,回归效果越好。 为了利用本章第一节回归分析中
11、的一些结果,U和Q并不是按照它们的定义式(13.13)和式(13.14)进行计算,而是按照呈直线的标准曲线方程进行计算 (13.16) (13.17) 对每一个平方和都有一个称作为自由度的数值与之相联系,自由度是指独立观测值的个数。因S中的n个观测值受平均值的约束,从而有一个观测值不是独立的,即失去一个自由度,故总偏差平方和S的自由度为nS=n-1。U中只有b是独立变化的,故回归平方和U的的自由度为nU=1。如果一个平方和是由几个相互独立的平方和组成,则总的自由度等于各平方和的自由度之和。所以,残余平方和Q的自由度nQ为 (13.18)二、 残余方差及残余标准差 残余平方和Q除以它的自由度nQ
12、所得商称作残余方差 (13.19)它的意义可以看作是在排除了x对y的线性影响后(或当x值固定时),衡量随机变动大小的一个估计量。 残余方差的s2正平方根称作残余标准差s (13.20)残余标准差s可用于评价所有随机因素对y的单次观测的平均差的大小,s越小,回归直线的准确度越好。当回归方程的稳定性较好时,残余标准差s可作为应用回归方程时的不确定度评定参数。式(13.20)中yi是相对于xi的测得值;是当x = xi时用式(13.5)计算得到的值,即从回归直线上取得的与xi对应的y值;n为数据对(x,y)的数目。式(13.10)中的是测得值y对拟合的回归直线上相应值之间的偏差平方和,与计算一组重复
13、测量数据的标准偏差公式相似,所以有些参考书又称其为回归的标准偏差。但是,应当注意不要与回归平方和U相混淆。三、 回归显著性检验回归方程的显著性检验方法有t检验法、F检验法、相关系数r检验法等。现讨论F检验法。由回归平方和U与残余平方和Q的意义可知,一个回归方程是否显著,也就是y与x的关系是否密切,取决于U和Q的大小,U越大Q越小说明x与y的关系越密切。为此构造统计量F (13.21)对一元线性回归, (13.22)再查F分布表。F分布表中的两个自由度分别对应于式(13.21)中的nU和nQ。对一元线性回归,分别是1和n-2。通常需要查出F分布表中对三种不同显著性水平a的临界值Fa(1,n-2)
14、。将这3个临界值与式(13.22)计算得到的统计量F值进行比较,若F³F0.01(1,n-2),则认为回归高度显著(或称在0.01水平上显著);若F0.05(1,n-2)£F£F0.01(1,n-2),则认为回归显著(或称在0.05水平上显著);若F0.10(1,n-2)£F£F0.05(1,n-2),则认为回归在0.1水平上显著;若F<F0.10(1,n-2),则认为回归不显著。此时, y对x的关系不密切。 通过上述分析,可以将归纳出方差分析表13.2。表13.2 方差分析表偏差平方和自由度标准偏差统计量F置信限Fa(1,n-2)0.1
15、0.050.01回归1残余n-2总和n-1显著性显著性显著性第三节 对X的直线回归的斜率b和截距a的不确定度评定 由第一节计算得到的校准曲线(工作曲线)可用于分析被测试样中的未知物含量,因此必须对其斜率b和截距a的不确定度进行评定。2.1 斜率b的标准偏差s(b)及其扩展不确定度Up(b)(a) 斜率b的标准偏差s(b) (13.23)式中是所有xi的平均值,s是式(13.20)给出的残余标准差(或称为回归的标准偏差)。 (b) 斜率b的扩展不确定度Up(b) (13.24)式中tp是选定置信水准p(或显著性水平a=1-p)时,根据自由度n=n-2查t-分布表所得到的t值。2.2 截距a的标准
16、偏差s(a)及其扩展不确定度Up(a) (a) 截距a的标准偏差s(a) (13.25) (b) 截距a的扩展不确定度Up(a) (13.26)式中tp是选定置信水准p(或显著性水平a=1-p)时,根据自由度n=N-2查t-分布表所得到的t值。【例13.2】 试评定例13.1中标准曲线斜率b和截距a的扩展不确定度。【解】 (a) 由表13.1的数据和式(13.20)计算回归的标准偏差s 对5种校准溶液的每一个分布进行3次平行测量,测量次数n15 (13.27)(b) 由表13.1的数据和式(13.23)计算斜率b的标准偏差s(b) 由表13.1的数据和式计算斜率b扩展不确定度Up(b)通常选取
17、置信水准p=95(显著性水平a=0.05),查t-分布表,自由度n=n-2=13,得到t95(13)=2.16,用式(13.24)计算斜率b的扩展不确定度Up(b) (c) 由表13.1的数据和式(13.25)计算截距a的标准偏差s(a) 截距a的扩展不确定度Up(a)同(b)查得t95(13)=2.16,用式(13.26)计算截距a的扩展不确定度Up(a): 第四节 由标准曲线求得的分析结果的不确定度评定 如果用已知xi(例如已知含量的标准物质)已求得标准曲线的斜率b和截距a,则可由实验测得的y0值用式(13.5)计算相应的被测值x0(例如被测物的含量)。现对被测物含量x0进行测量不确定度评
18、定。3.1 计算被测物含量x0的标准偏差估计值s(x0) (13.28)式中s是式(13.20)给出的残余标准差(或称为回归的标准偏差),是绘制标准曲线所用全部y值的平均值;是全部x值的平均值。 式(13.28)是对被测物含量x0进行一次测量,得到一个对应的y0值的标准偏差估计值s(x0)的表示式。如果对同一被测物品平行测量m次,得到m个对应的y0值和x0值,然后再取y0的平均值,并将值代入式(13.5)计算相应的被测物含量x0。此时被测物含量x0的标准偏差估计值s(x0)用下式计算: (13.29)3.2 测量x0值的扩展不确定度U(x0) (13.30)式中tp是选定置信水准p(或显著性水
19、平a=1-p)时,根据自由度n=n-2查t-分布表所得到的t值。 考察式(13.28)可知,测得值愈接近y的平均值,则计算得到的标准偏差估计值s(x0)愈小,因而按式(13.30)计算得到的测量x0值的扩展不确定度U(x0)愈小,亦即分析结果愈可靠。所以在分析测试中,被测物含量应尽可能接近标准曲线中所对应的标准物质含量(x值),即应使仪器响应值尽可能接近标准曲线的中心部分所对应的y值。由式(13.28)还可知,为减小测量x0值的标准偏差估计值s(x0)或扩展不确定度U(x0),还可以增大n值,即增加绘制标准曲线的实验点(x,y)。通常,n至少取5或6。考察式(13.29)可知,为减小测量x0值
20、的标准偏差估计值s(x0)或扩展不确定度U(x0),还可以增大m值,即最好对被测物平行多测量几次,取相应的仪器响应y0的平均值计算被测物含量x0值。然而,在式(13.29)中,m和s(x0)之间并不是一个简单的反比关系,即m增加太大时,扩展不确定度U(x0)的改善并不显著,而且要花费较多的人力物力。通常m取35次。【例13.3】 在【例13.1】的镉浓度测量中,在作校准曲线后,试求对被测样品测定一次和平行测定2次的镉浓度x0的扩展不确定度U(x0)。两次测量的仪器响应均为y0=0.071。【解】 (a) 只对被测样品进行一次测量的镉浓度x0的扩展不确定度U(x0)评定 由表13.1的数据和式(
21、13.6)、式(13.27)的数据,应用式(13.28)计算镉浓度x0的标准偏差估计值 选取置信水准p=95(显著性水平a=0.05),查t-分布表,自由度n=n-2=13,得到t95(13)=2.16,用式(13.30)计算被测物含量x0的扩展不确定度U(x0): (b) 对被测样品进行2次测量的镉浓度x0的扩展不确定度U(x0)评定 由表13.1的数据和式(13.6)、式(13.27)的数据,应用式(13.29)计算镉浓度x0的标准偏差估计值 选取置信水准p=95(显著性水平a=0.05),查t-分布表,自由度n=n-2=13,得到t95(13)=2.16,用式(13.30)计算被测物含量
22、x0的扩展不确定度U(x0): 第五节 对Y的直线回归方程和不确定度评定以上讨论了在X轴上对变量X的直线回归,也即以X为自变量,以Y为因变量的直线回归。例如在理化分析测试中,以被测物含量X为自变量,以仪器响应Y为因变量。有时,需要以仪器响应Y为自变量,以被测物含量X为因变量进行直线回归。实际上就是在进行直线回归时,将变量X和Y互换。现建立与式(13.1)不同的标准曲线方程 (13.31)用下列各式计算斜率b、截距a和相关系数r 4.1 斜率 (13.32)4.2 截距 (13.33)4.3 相关系数 (13.34)4.4 x对y的回归直线用计算得到的斜率b1和截距a1绘制的直线就是拟合得到的最
23、佳直线,称为x对y的回归直线。显然,实验中测得的各实验点(yi,xi)并不完全落在该回归直线上,除非相关系数r1。x对y的回归直线可表示为 (13.35)式中,表示是从回归直线上取得的与yi对应的x计算值。4.6 用下式计算回归的标准偏差估计值s1 (13.36)4.6 计算被测物含量x0的标准偏差估计值s(x0) 如果对同一被测物品平行测量m次, (13.37)式中是全部yi的平均值;m是对被测物品的平行测量次数;n是确定校准曲线时的测量数据组数。【例13.4】 为测定镉浓度,实验室获得一系列如表13.3第2栏和第3栏所示数据。(1) 试求直线回归方程.(2) 对被测样品平行测定2次的镉浓度
24、x0的标准偏差s(x0)。两次平行测量的仪器响应平均值为y0=0.071。【解】 将测量数据进行整理并列出在表13.3中。表13.3 以仪器响应为自变量的实验数据和回归直线中间计算结果yx(´10-6)10.0280.1-0.10120.01024144-0.40.160.04048308.81920.0290.1-0.10020.01004004-0.40.160.04008180.82230.0290.1-0.1.0020.01004004-0.40.160.04008180.82240.0840.3-0.0.4050.00204304-0.20.040.00904182.114
25、50.0830.3-0.04620.00213444-0.20.040.0092487.77360.0810.3-0.04820.00232324-0.20.040.009641.24670.1350.50.00580.00003346000572.77480.1310.50.00180.0000034200055.16390.1330.50.00380.00001444000245.851100.1800.70.05080.002580640.20.040.0101692.388110.1810.70.05180.002683240.20.040.01036188.735120.1830.7
26、0.05380.002894440.20.040.01076485.583130.2150.90.08580.007361640.40.160.034323113.288140.2300.90.10080.010160640.40.160.04032253.534150.2160.90.08680.007534240.40.160.034721750.945S1.9387.500.0700884001.20.28926699.857(1) 依据式(13.32)和式(13.33)计算斜率b1和截距a1 斜率 截距 x对y的回归直线可表示为根据仪器响应值求镉浓度 (2) 计算回归的标准偏差估计值s
27、1 将表13.3的相关数据和上述数据,用式(13.37)计算标准偏差 这是与【例13.3】的计算结果相一致的。第六节 不确定度评定应用实例【例13.5】某比色测定,得到表13.4所示的结果。试用统计方法绘制标准曲线,并评定标准曲线斜率和截距的扩展不确定度。表13.4 某比色测定的测量结果浓度值 x(mg/ml)00.51.01.52.0仪器响应值 y0.019; 0.0240.021; 0.0230.020; 0.0210.498; 0.5210.511; 0.5130.5150.980; 1.0141.002; 1.0051.498; 1.4911.4821.972; 2.0251.998【
28、解】 本题对同一浓度值x值平行测定了多个数目不等的仪器响应值y。采取用全部y值进行计算 的方法。(1) 求标准曲线 (a) 用全部实验点求 (b) 计算各平方和 (c) 用式(13.4)计算相关系数r 由求得的相关系数r值可看出,x和y是显著的线性相关。(d) 用式(13.2)计算回归直线的斜率b (e) 用式(13.3)计算回归直线的截距a (f) 求回归直线(标准曲线) (2) 标准曲线斜率和截距扩展不确定度评定为了便于计算,将测量值的计算值列出于表13.5。 (a) 回归的标准偏差s 用式(13.20)计算回归的标准偏差s (b) 斜率b的标准偏差s(b)用式(13.23)计算斜率b的标
29、准偏差s(b) (c) 斜率b的扩展不确定度Up(b)通常选取置信水准p=95(显著性水平a=0.05),查t-分布表,自由度n=n-2=19,得到t95(19)=2.093,用式(13.24)计算斜率b的扩展不确定度Up(b) 斜率b的置信区间为 或 0.9775 0.9737(d) 截距a的标准偏差s(a)用式(13.25)计算截距a的标准偏差s(a) (e) 截距a的扩展不确定度Up(a)同(c)查得t95(19)=2.093,用式(13.26)计算截距a的扩展不确定度Up(a) 截距a的置信区间为: 或 0.0102 0.0276表13.5 xi0000000.5yi0.0190.02
30、40.0210.0230.0200.0210.4980.01890.01890.01890.01890.01890.01890.5 1170.00010.00510.00210.00410.00110.0021-0.0137xi0.50.50.50.51.01.01.0yi0.5210.5110.5130.5150.9801.0141.0020.51170.5 1170.5 1170.5 1171.00451.00451.00450.0093-0.00070.00130.0033-0.02450.0095-0.0025xi1.01.51.51.52.02.02.0yi1.0051.4981.4
31、811.4821.9722.0251.9981.00451.49731.49731.49731.99011.99011.99010.00050.0007-0.0063-0.0153-0.01810.03490.0079表13.6仪器响应值 y0被测物含量x0(mg/ml)0.770=0.7700.7620.7700.7780.7610.7650.7770.77720.7620.7700.7780.7610.7650.7770.7730.7720.7680.7730.7630.762【例13.6】 在【例13.5】的比色测量中,在作标准曲线的同时,也测定被测样品的仪器读数。表13.6分别给出了样
32、品测定一次、平行测定五次和十次的仪器读数值。求样品中被测物含量及其测量不确定度。如果【例13.5】的标准曲线是由五个实验点获得,且回归的标准偏差s不变,对样品被测物含量x0值,只测定一个y0值(0.770),试求用该标准曲线计算得到的被测物含量x0的扩展不确定度U(x0)。【解】 根据【例13.5】的解,实验点n=21,绘制得到的标准曲线为: (13.38)(1) 仪器测定一次,得到响应y0=0.770(a) 将y0=0.770代入式(13.38),得到样品被测物含量x0=0.762。(b) 用式(13.28)计算被测物含量x0的标准偏差估计值s(x0) (c) 被测物含量x0的扩展不确定度U(x0) 选取置信水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年度国际市场推广合同2篇
- 二零二四年度环保工程合同标的及服务内容详细描述2篇
- 装修材料销售合同范例
- 保密协议合同的续签合同的解除条件
- 二零二四年度物联网解决方案实施合同9篇
- 分宜县政府采购合同的法律框架
- 2024年度专利实施许可合同适用于高新技术产业2篇
- 2024年度多功能商业广场商铺租赁合同范本3篇
- 2024年度医疗器械采购合同标的描述2篇
- 二零二四年度户外LED广告屏租赁合同3篇
- 现代的全面预算管理.ppt
- 道路交通安全法律法规(PPT 90页)
- (完整word版)气缸结构设计
- 土木工程常用术语英文
- MSDS(T-09)快干水2x3
- 《常用正颌外科手术》ppt课件
- 王虎应老师股市预测分析精彩卦例
- 金融租赁公司联合租赁合作规范
- (完整版)数独题目100题
- 【原创】仁爱英语 七年级上册情景交际+看图写话(有答案)
- 危重新生儿的病情观察及护理要点
评论
0/150
提交评论