多元线性回归方程建立课件_第1页
多元线性回归方程建立课件_第2页
多元线性回归方程建立课件_第3页
多元线性回归方程建立课件_第4页
多元线性回归方程建立课件_第5页
已阅读5页,还剩138页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、优化试验设计与数据分析第五章 回归分析方法本章主要内容 一元线性回归方程度建立、显著性检验、预报和控制。非线性回归方程的线性化。 多元线性回归方程建立、显著性检验、偏回归平方和。 回归分析法在试验设计中的作用和地位。 正交多项式回归设计及回归方程的建立。优化试验设计与数据分析第五章 回归分析方法本章主要内容5.1 一元线性回归5.1.1 引言变量之间的关系确定关系相关关系确定性关系身高和体重相关关系相关关系的特征是: 变量之间的关系很难用一种精确的方法表示出来.5.1 一元线性回归5.1.1 引言变量之间的关系确定关系相 十九世纪,英国生物学家兼统计学家高尔顿研究发现: 其中x表示父亲身高,

2、y 表示成年儿子的身高(单位:英寸,1英寸=2.54厘米)。这表明子代的平均高度有向中心回归的意思,使得一段时间内人的身高相对稳定。之后回归分析的思想渗透到了数理统计的其它分支中。 十九世纪,英国生物学家兼统计学家高尔顿研究发现: 回归分析便是研究变量间相关关系的一门学科。它通过对客观事物中变量的大量观察或试验获得的数据,去寻找隐藏在数据背后的相关关系,给出它们的表达形式回归函数的估计。 变量间的相关关系不能用完全确切的函数形式表示,但在平均意义下有一定的定量关系表达式,寻找这种定量关系表达式就是回归分析的主要任务。 回归分析处理的是变量与变量间的关系。变量间常见的关系有两类:确定性关系与相关

3、关系。 回归分析便是研究变量间相关关系的一门学科。它通过对客观事物根据相关关系的程度划分 1、不相关。如果变量间彼此的数量变化互相独立,则其关系为不相关。自变量x变动时,因变量y的数值不随之相应变动。例如,产品税额的多少与工人的出勤率、家庭收入多少与孩子的多少之间都不存在相关关系。 2、完全相关。如果一个变量的变化是由其他变量的数量变化所唯一确定,此时变量间的关系称为完全相关。即因变量y的数值完全随自变量x的变动而变动,它在相关图上表现为所有的观察点都落在同一条直线上,这种情况下,相关关系实际上是函数关系。所以,函数关系是相关关系的一种特殊情况。3、不完全相关。如果变量间的关系介于不相关和完全

4、相关之间,则称为不完全相关。如妇女的结婚年龄与受教育程度之间的一种关系。 大多数相关关系属于不完全相关,是统计研究的主要对象根据相关关系的程度划分 回归分析所能解决的问题回归分析主要解决以下几方面的问题:(1)确定几个特定变量之间是否存在相关关系,如果存在的话,找出她们之间合适的数学表达式(2)根据一个或几个变量的值,预报或控制另一个变量的取值,并且要知道这种预报或控制的精确度(3)进行因素分析,确定因素的主次以及因素之间的相互关系等等回归分析所能解决的问题一元线性回归分析,只要解决:(1)求变量x与y之间的回归直线方程(2)判断变量x和y之间是否确为线性关系(3)根据一个变量的值,预测或控制

5、另一变量的取值一元线性回归分析,只要解决:案例某钢厂生产的某种合金钢有两个重要的质量指标:抗拉强度(kg/mm2)和延伸率(%)。该合金钢的质量标准要求:抗拉强度应大于32kg/mm2;延伸率应大于33%。根据冶金学的专业知识和实践经验,该合金钢的含碳量是影响抗拉强度和延伸率的主要因素。其中含碳量高,则抗拉强度也就会相应提高,但与此同时延伸率则会降低。为降低生产成本,提高产品质量和竞争能力,该厂质量控制部门要求该种合金钢产品的上述两项质量指标的合格率都应达到99%以上。 案例某钢厂生产的某种合金钢有两个重要的质量指标:抗拉强度(k如何制订含碳量的控制标准?为达到以上质量控制要求,就需要制定该合

6、金钢冶炼中含碳量的工艺控制标准,也即要确定在冶炼中应将含碳量控制在什么范围内,可以有99%的把握使抗拉强度和延伸率这两项指标都达到要求。这是一个典型的产品质量控制问题,可以使用回归分析方法求解。 如何制订含碳量的控制标准?为达到以上质量控制要求,就需要制定5.1.2 一元线性回归方程的确定5.1.2 一元线性回归方程的确定 例1 合金的强度y (107Pa) 与合金中碳的含量x (%) 有关。为研究两个变量间的关系。首先是收集数据,我们把收集到的数据记为(xi,yi),i=1,2,n。本例中,我们收集到12组数据,列于表中 进行回归分析首先是回归函数形式的选择。当只有一个自变量时,通常可采用画

7、散点图 的方法进行选择。0.1420.11430.12450.13450.14450.1547.50.16490.17530.18500.2550.21550.2360 例1 合金的强度y (107Pa) 与合金中碳的含表1 合金钢强度y与碳含量x的数据 序号x(%)y (107Pa)序号x(%)y (107Pa)10.1042.070.1649.020.1143.080.1753.030.1245.090.1850.040.1345.0100.2055.050.1445.0110.2155.060.1547.5120.2360.0表1 合金钢强度y与碳含量x的数据 序号x(%)y (10 为

8、找出两个量间存在的回归函数的形式,可以画一张图:把每一对数(xi,yi)看成直角坐标系中的一个点,在图上画出n个点,称这张图为散点图,见图。 为找出两个量间存在的回归函数的形式,可以画一张图: 从散点图我们发现12个点基本在一条直线附近,这说明两个变量之间有一个线性相关关系,这个相关关系可以表示为 y = 0+ 1x + (1) 这便是y关于x的一元线性回归的数据结构式。通常假定 E() =0, Var() = 2 (2) 在对未知参数作区间估计或假设检验时,还需要假定误差服从正态分布,即 y N(0+ 1x, 2 ) (3) 显然,假定(3) 比 (2) 要强。 从散点图我们发现12个点基本

9、在一条直线附近,这说明 由于0, 1均未知,需要我们从收集到的数据(xi,yi),i=1,2,n,出发进行估计。在收集数据时,我们一般要求观察独立地进行,即假定y1, y2, yn,相互独立。综合上述诸项假定,我们可以给出最简单、常用的一元线性回归的数学模型: (4) 由于0, 1均未知,需要我们从收集到的数据(xi 由数据(xi,yi),i=1,2,n,可以获得0, 1的估计 ,称 (5) 为y关于x的经验回归函数,简称为回归方程,其图形称为回归直线。给定x=x0后,称 为回归值(在不同场合也称其为拟合值、预测值)。 由数据(xi,yi),i=1,2,n,可以获得回归系数的最小二乘估计 回归

10、系数的最小二乘估计 多元线性回归方程建立课件多元线性回归方程建立课件 一般采用最小二乘方法估计模型中的0, 1 :令: 应该满足 称这样得到的 称为0, 1的最小二乘估计,记为LSE (Least Squares Estimation)。 一般采用最小二乘方法估计模型中的0, 1 :令: 最小二乘估计可以通过求偏导数并命其为0而得到: (6) 这组方程称为正规方程组,经过整理,可得 (7) 最小二乘估计可以通过求偏导数并命其为0而得到:解(7)可得 (8)这就是参数的最小二乘估计,其中 解(7)可得xi=1.90n=12yi=590.5xi2=0.3194xi yi =95.9250yi2=2

11、9392.75lxx=0.0186lxy=2.4292lyy=335.2292由此给出回归方程为: 使用例中合金钢强度和碳含量数据,我们可求得回归方程,见下表xi=1.90n=12yi=590.5xi2=0.31说明 分别是0,1的无偏估计; 是E(y0)=0+ 1 x0的无偏估计; 除 外, 与 是相关的; 要提高 的估计精度(即降低它们的方 差)就要求n大,lxx大(即要求x1, x2, xn较 分散)。 说明 分别是0,1的无偏估计; 多元线性回归方程建立课件Regression Analysis: y versus xThe regression equation isy = 28.1

12、 + 133 xPredictor Coef SE Coef T PConstant 28.083 1.567 17.92 0.000 x 132.899 9.606 13.83 0.000S = 1.309 R-Sq = 95.0% R-Sq(adj) = 94.5%Analysis of VarianceSource DF SS MS F PRegression 1 327.93 327.93 191.40 0.000Residual Error 10 17.13 1.71Total 11 345.06Regression Analysis: y versus 多元线性回归方程建立课件多元

13、线性回归方程建立课件多元线性回归方程建立课件回归方程是否有意义的判断三种等价的检验方法F 检验T检验r检验 在使用回归方程作进一步的分析以前,首先应对回归方程是否有意义进行判断。回归方程是否有意义的判断三种等价的检验方法 在使用回归方程一、F 检验一、F 检验多元线性回归方程建立课件图示离差平方和的分解xy离差分解图图示离差平方和的分解xy离差分解图多元线性回归方程建立课件多元线性回归方程建立课件来源平方和自由度均方和F比回归SR =317.2589fA=1MSA=317.2589176.55残差Se =17.9703fe=10MSe= 1.79703总和ST =335.2292fT=11在合

14、金钢强度的例中,我们已求出了回归方程,这里我们考虑关于回归方程的显著性检验。经计算有 若取=0.01,则F0.99(1,10) =103.1698,因此,在显著性水平0.01下回归方程是显著的。 注意到t2=F,因此,t检验与F检验是等同的。三、相关系数检验一元线性回归方程是反映两个随机变量x与y间的线性相关关系,它的显著性检验还可通过对二维总体相关系数的检验进行。它的一对假设是 H0:=0 vs H1: 0 所用的检验统计量为样本相关系数拒绝域为W=rc,其中临界值c应是H0: =0成立下r的分布的1 分位数,故记为c=r1-(n2). 三、相关系数检验一元线性回归方程是反映两个随机变量x与

15、y多元线性回归方程建立课件多元线性回归方程建立课件 由样本相关系数的定义可以得到 r与F统计量之间的关系 这表明, r是F的严格单调增函数,故可以从F分布的1 分位数 F1-(1, n2) 得到 r 的1 分位数为 由样本相关系数的定义可以得到 r与F统计量之间的关系 譬如,对 =0.01,n=12, F0.99(1,10)=10.04 ,于是 。 为实际使用方便,人们已对r1- (n-2)编制了专门的表,见P151页表7-1。 以例中数据为例,可以计算得到 若取 =0.01,查P182页表7-1知 r0.99(10)=0.708, 由于0.97280.708,因此,在显著性水平0.01下回归

16、方程是显著的。 譬如,对 =0.01,n=12, F0.99(1,n-2123456789100.05 0.010.9970.9500.8780.8110.7540.7070.6660.6320.6020.5761.0000.9900.9590.9170.8740.8340.7980.7650.7350.708n-2111213141516171819200.05 0.010.5530.5320.5140.4790.4820.4680.4560.4440.4330.4130.6840.6610.6410.6230.6060.5900.5750.5610.5490.537n-2212223242

17、526272829300.05 0.010.4130.4040.3960.3880.3810.3740.3670.3640.3550.3490.5260.5150.5050.4960.4870.4780.4700.4630.4560.449相关系数临界值表n-210.05 0.010.9971.000n-2 在一元线性回归场合,三种检验方法是等价的:在相同的显著性水平下,要么都拒绝原假设,要么都接受原假设,不会产生矛盾。 F 检验可以很容易推广到多元回归分析场合,而其他二个则无法完成,所以,F检验是最常用的关于回归方程显著性检验的检验方法。三种检验方法具有等价特性 在一元线性回归场合,三种检验

18、方法是等价的:在相同的显预报与控制问题当我们求得变量x、y之间的回归方程后,往往通过方程回答这样两方面的问题:(1)对任何一个给定的观测点x0,推断y0大致落的范围(2)若要求观测值y在一定的范围y1yy2内取值,应将变量控制在什么地方前者就是所谓的预报问题,后者称为控制问题预报与控制问题当我们求得变量x、y之间的回归方程后,往往通过多元线性回归方程建立课件多元线性回归方程建立课件E(y0)的置信区间于是E(y0)的1 的置信区间(CI)是 其中 E(y0)的置信区间y0的预测区间 实用中往往更关心x=x0时对应的因变量y0的取值范围。y0的最可能取值为 ,于是,我们可以使用以 为中心的一个区

19、间 作为y0的取值范围。经推导, 的表达式为 上述预测区间(PI)与E(y0)的置信区间的差别就在于根号里多个1。 y0的预测区间在例中,如果x0=0.16,则得预测值为 若取 =0.05,则t0.975(10)=2.2281, 又 , 故x0=0.16对应因变量y0的均值E(y0)的0.95置信区间为(49.4328-1.0480, 49.4328+1.0480)=(48.3488, 50.5168)在例中,如果x0=0.16,则得预测值为 可以计算得到, 从而y0的概率为0.95的预测区间为 E(y0)的0.95置信区间比y0的概率为0.95的预测区间窄很多,这是因为随机变量的均值相对于随

20、机变量本身而言要更容易估计出来。 可以计算得到,minitab软件求解置信区间与预测区间minitab软件求解置信区间与预测区间多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方程建立课件非线性回归方程的线性化在实际问题中,有时两个变量间的关系不是线性相关关系,而是某种曲线相关关系,这时如果仍作线性回归,就不能反映出两个变量之间的内在联系,而必须作非线性回归。在许多情况下,可通过对变量作适当的代换,化为线性回归问题处理,求出它的回归方程。非线性回归方程的线性化在实际问题中,有时两个变量间的关系不是 例 炼钢厂出钢水时用的钢包,在使用过程中由于钢水及炉渣对耐火

21、材料的浸蚀,其容积不断增大。现在钢包的容积用盛满钢水时的重量y (kg)表示,相应的试验次数用x表示。数据见表,要找出y 与x的定量关系表达式。 例 炼钢厂出钢水时用的钢包,在使用过程中由于钢水及炉渣对钢包的重量y与试验次数x数据 序号xy序号xy12106.42811110.5923108.20914110.6034109.581015110.9045109.501116110.7657110.001218111.0068109.931319111.20710110.49下面我们分三步进行。 钢包的重量y与试验次数x数据 序号xy序号xy12106.4 1 确定可能的函数形式 为对数据进行分

22、析,首先描出数据的散点图,判断两个变量之间可能的函数关系,图是本例的散点图。 观测这13个点构成的散点图,我们可以看到它们并不接近一条直线,用曲线拟合这些点应该是更恰当的,这里就涉及如何选择曲线函数形式的问题。 1 确定可能的函数形式多元线性回归方程建立课件 首先,如果可由专业知识确定回归函数形式,则应尽可能利用专业知识。当若不能有专业知识加以确定函数形式,则可将散点图与一些常见的函数关系的图形进行比较,选择几个可能的函数形式,然后使用统计方法在这些函数形式之间进行比较,最后确定合适的曲线回归方程。为此,必须了解常见的曲线函数的图形。 首先,如果可由专业知识确定回归函数形式,则应尽可能利用 本

23、例中,散点图呈现呈现一个明显的向上且上凸的趋势,可能选择的函数关系有很多,我们可以给出如下四个曲线函数: 1) 1/y=a+b/x 2) y=a+blnx 3) 4) 在初步选出可能的函数关系(即方程)后,我们必须解决两个问题:如何估计所选方程中的参数?如何评价所选不同方程的优劣? 本例中,散点图呈现呈现一个明显的向上且上凸的趋势,可2 参数估计 对上述非线性函数,参数估计最常用的方法是“线性化”方法。 以1/y=a+b/x为例,为了能采用一元线性回归分析方法,我们作如下变换u=1/x,v=1/y 则曲线函数就化为如下的直线v=a+bu 这是理论回归函数。对数据而言,回归方程为 vi=a+ b

24、ui + i 于是可用一元线性回归的方法估计出a,b。 2 参数估计参数估计计算表 1/y = 0.00897 +0.000829 1/x参数估计计算表 1/y = 0.00897 +0.00082 用类似的方法可以得出其它两个曲线回归方程,它们分别是: 用类似的方法可以得出其它两个曲线回归方程,它们分别是第一种情况的minitab求解第一种情况的minitab求解多元线性回归方程建立课件多元线性回归方程建立课件Regression Analysis: 1/y versus 1/xThe regression equation is1/y = 0.00897 +0.000829 1/xPred

25、ictor Coef SE Coef T PConstant 0.00896663 0.00000837 1071.14 0.0001/x 0.00082917 0.00004118 20.14 0.000S = 0.00001903 R-Sq = 97.4% R-Sq(adj) = 97.1%Analysis of VarianceSource DF SS MS F PRegression 1 1.46905E-07 1.46905E-07 405.44 0.000Residual Error 11 3.98564E-09 3.62331E-10Total 12 1.50891E-07Reg

26、ression Analysis: 1/y versuUnusual ObservationsObs 1/x 1/y Fit SE Fit Residual St Resid 1 0.500 0.009397 0.009381 0.000015 0.000016 1.33 X 3 0.250 0.009126 0.009174 0.000007 -0.000048 -2.69R R denotes an observation with a large standardized residualX denotes an observation whose X value gives it la

27、rge influence.异常观测值 标准化观测值 1/x 1/y 拟合值 拟合值标准误 残差 残差 1 0.500 0.009397 0.009381 0.000015 0.000016 1.33 X 3 0.250 0.009126 0.009174 0.000006 -0.000048 -2.69RR 表示此观测值含有大的标准化残差X 表示受 X 值影响很大的观测值。多元线性回归方程建立课件第二种情况的minitab求解第二种情况的minitab求解多元线性回归方程建立课件回归方程为y = 106 + 1.71 lnx自变量 系数 系数标准误 T P常量 106.315 0.430 2

28、47.22 0.000lnx 1.7140 0.1933 8.87 0.000S = 0.486379 R-Sq = 87.7% R-Sq(调整) = 86.6%方差分析来源 自由度 SS MS F P回归 1 18.608 18.608 78.66 0.000残差误差 11 2.602 0.237合计 12 21.211回归方程为第三种情况的minitab求解第三种情况的minitab求解多元线性回归方程建立课件Regression Analysis: y versus x1/2The regression equation isy = 106 + 1.19 x1/2Predictor Co

29、ef SE Coef T PConstant 106.301 0.600 177.03 0.000 x1/2 1.1947 0.1884 6.34 0.000S = 0.6437 R-Sq = 78.5% R-Sq(adj) = 76.6%Analysis of VarianceSource DF SS MS F PRegression 1 16.653 16.653 40.20 0.000Residual Error 11 4.557 0.414Total 12 21.211Regression Analysis: y versus 第四种情况第四种情况第四种情况的minitab求解第四种情

30、况的minitab求解多元线性回归方程建立课件多元线性回归方程建立课件回归分析:ln(y-100) 与 1/x 回归方程为ln(y-100) = 2.46 - 1.13 1/x自变量 系数 系数标准误 T P常量 2.46391 0.01314 187.50 0.0001/x -1.12564 0.06464 -17.41 0.000S = 0.0298812 R-Sq = 96.5% R-Sq(调整) = 96.2%方差分析来源 自由度 SS MS F P回归 1 0.27073 0.27073 303.21 0.000残差误差 11 0.00982 0.00089合计 12 0.28055

31、回归分析:ln(y-100) 与 1/x 多元线性回归方程建立课件回归方程为ln(y-100) = 2.46 - 1.13 1/x自变量 系数 系数标准误 T P常量 2.46391 0.01314 187.50 0.0001/x -1.12564 0.06464 -17.41 0.000回归方程为多元线性回归方程建立课件3 曲线回归方程的比较 我们上面得到了四个曲线回归方程,通常可采用如下二个指标进行选择。 (1)决定系数R2:类似于一元线性回归方程中相关系数,决定系数定义为: R2越大,说明残差越小,回归曲线拟合越好, R2从总体上给出一个拟合好坏程度的度量。残差平方和总变差平方和3 曲线

32、回归方程的比较残差平方和总变差平方和(2)剩余标准差s:类似于一元线性回归中标准差的估计公式,此剩余标准差可用残差平方和来获得,即s为诸观测点yi与由曲线给出的拟合值 间的平均偏离程度的度量,s越小,方程越好。 (2)剩余标准差s:类似于一元线性回归中标准差的估计公式,此 在观测数据给定后,不同的曲线选择不会影响 的取值,但会影响到残差平方和 的取值。因此,对选择的曲线而言,决定系数和剩余标准差都取决于残差平方和 ,从而,两种选择准则是一致的,只是从两个不同侧面作出评价。 在观测数据给定后,不同的曲线选择不会影响 表给出第一个曲线回归方程的残差平方和的计算过程, 由于n=13, ,故其决定系数

33、及剩余标准差分别为:其它三个方程的决定系数及剩余标准差可同样计算,我们将它们列在表中。 表给出第一个曲线回归方程的残差平方和的计算过程, 由于n=1四种曲线回归的决定系数及剩余标准差 模型编号 1)2)3)4)R20.97290.87730.78510.9623s1.9E-50.48640.64370.0298从表中可以看出,第一个曲线方程的决定系数最大,剩余标准差最小,在这四个曲线回归方程中,不论用哪个标准,都是第一个方程拟合得最好。因此,近似得比较好的定量关系式就是1/y = 0.00897 +0.000829 1/x四种曲线回归的决定系数及剩余标准差 模型编号 1)2)3)45-2 多元

34、回归分析方法在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回归问题为多元回归分析。例如,影响用电量的因素就有,国民收入、经济增长率、工业发展速度,居民用电水平等。如果这些因素与用电量之间的关系都具有线性关系时,这就是多因素线性相关关系问题,则可以用多元线性回归模型来解决。5-2 多元回归分析方法在大多数的实际问题中,影响因变量的解决多元线性回归模型的原理与解决一元线性回归模型的原理完全相同,也是用最小二乘法确定多元线性回归模型的常数项和回归系数。(1)模型设因变量 y 与自变量 x1,x2,xk,有关系:Y = b0 + b1x1 + + bkxk + 其中 是随机项解决多

35、元线性回归模型的原理与解决一元线性回归模型的原理完全相现有几组数据:( y1;x11,x21,xk1)( y2;x12,x22,xk2) (yn;x1n,x2n,xkn)其中:xij是自变量xi的第 j 个值,yj 是 Y 的第 j 个观测值。现有几组数据:显然,多元线性统计模型是: 多元线性回归分析原理,与一元线性回归分析原理完全相同只是计算上复杂得多。但是用计算机来进行计算工作量与一元线性回归相比,复杂程度并不大。根据最小二乘法,应使残差:试验值回归值最小显然,多元线性统计模型是: 多元线性回归分析原多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方程建

36、立课件多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方程建立课件多元线性回归方差分析表多元线性回归方差分析表回归方程中因素主次判断1、偏回归系数的标准化偏回归系数b1,b2,.,bk表示xi对y的具体效应,但其自身大小并不能直接反应自变量的相对重要性。主要是bj取值受到对应因素的单位和取值的影响。标准化后可以解决这一问题回归方程中因素主次判断1、偏回归系数的标准化偏回归系数b1,偏回归系数bj标准化回归系数Pj标准化回归系数Pj越大,因素越重要。偏回归系数bj标准化回归系数Pj标准化回归系数Pj越大,因2、偏回归系数的显著性检验计算每个偏回归系数的偏回归平

37、方和SSj2、偏回归系数的显著性检验计算每个偏回归系数的偏回归平方和S应用举例例 7-3 某种水泥在凝固时放出的热量 Y(卡/克)与水泥中下列 4 种化学成分有关:x1t:3CaOAl2O3 的成份(%);x2t:3CaOSiO2 的成份(%);x3t:4CaOAl2O3Fe2O3 的成份(%);x4t:2CaOSiO2 的成份(%)。作 Y 对 x1,x2,x3,x4的线性回归分析应用举例例 7-3 某种水泥在凝固时放出的热量 Y(卡/克编号x1tx2tx3tx4tx5t = yt172666078.52129155274.331159820104.34113184787.557526339

38、5.961155922109.27321176102.78131224472.59254182293.1102147426115.911140233483.8121166912113.3131068812109.4表7-5 试验观测数据编号x1tx2tx3tx4tx5t = yt17266607(a)原始数据:是水泥在凝固时放出的热量 Y 与 4种成份关系的数据;(b)每个变量的总和及平均数(以下为方便起见有时记 y为 x5t)。(a)原始数据:是水泥在凝固时放出的热量 Y 与 4种成份关(c)各变量的交叉乘积和 (见表 7-6)。多元线性回归方程建立课件x1tx2tx3tx4tx5t = y

39、tx1t11394922769262010032.0 x2t3305072011573962027.8x3t2293462813981.5x4t1506234733.5x5t = yt121088. 9表7-6 变量的交叉乘积及求和值x1tx2tx3tx4tx5t = ytx1t1139492(d)正规方程的系数及常数项 li j及 y 的总平方和 ly y= l55(Y的总平方和)li j123451415.23251.08-372.62-290.00775.9622905.69-166.54-3041.002292.953492.3138.00-618.2343362.00-2481.70

40、52715.76表7-7 正规方程的系数及常数项(d)正规方程的系数及常数项 li j及 y 的总平方和 l(e)解正规方程并求其系数矩阵 L=(lij)kk,的逆矩阵 C=(Ci j),正规方程(矩阵方程表达式为)(e)解正规方程并求其系数矩阵 L=(lij)kk,的逆矩 解之:b1= 1. 5511,b2= 0. 5101,b3= 0. 1019,b4= - 0.1441回归方程为: = 62. 4052 + 1. 5511x1 + 0. 5101 x2 + 0. 1019 x3 - 0. 1441 x4 解之:按线性代数的矩阵求逆法,系数正规方程矩阵 L= ( l ) 的逆矩阵为:按线性

41、代数的矩阵求逆法,系数正规方程矩阵 L= ( l ) (f)方差分析变 差来 源平 方 和自 由 度均 方F回归2667.9044111*剩余47.8688总计2715.7612表7-8 方差分析表(f)方差分析变 差来 源平 方 和自 由 度均 方F回归2(g)偏回归平方和及其显著性检验(g)偏回归平方和及其显著性检验经检验,除了 P1 在= 0. 10的水平上显著外,其余的三个因素都不显著,这个结论似乎与总回归的高度显著性有矛盾,实则不然,这是由于自变量之间有密切的相关而造成的。经检验,除了 P1 在= 0. 10的水平上显著外,其余的(h)从回归方程中剔除一个自变量由于偏回归平方和中有不

42、显著的因素,剔除其中最小者 x3,此时 Y 对 x1,x2,x4的回归系数如下:故新的回归方程为: = 71. 6482 + 1. 4519x1 + 0. 4161 x2 + 0. 2365 x4(h)从回归方程中剔除一个自变量故新的回归方程为:虽然剩余标准差S没有太大的变化,但是统计量F的值明显增大,因此新的回归模型更好一些。minitab求解虽然剩余标准差S没有太大的变化,但是统计量F的值明显增大,因SPSS多元非线性回归分析研究12寸晶圆切割过程中喷涂工艺设备参数对保护性薄膜厚度的影响,提高设备调整效率和工艺质量,采用均匀设计的实验方法,以薄膜在测试量块上的厚度为目标,对影响厚度的主要因

43、素:涂料压力(X1)、微调阀(X2)和雾化压力(X3)进行研究。本试验共3个因素,每个因素9个水平,因素水平表见表1。SPSS多元非线性回归分析研究12寸晶圆切割过程中喷涂工艺设水平数X1/10-5mX2/psiX3/psi133171523418163351917436201853721196382220739232184024229412523表1 试验因素水平表水平数X1/10-5mX2/psiX3/psi1331715试验次数X1/10-5mX2/psiX3/psiW11(33)5(21)7(21)106.3922(34)10(26)3(17)150.6833(35)4(20)10(24)93.4944(36)9(25)6(20)136.9655(37)3(19)2(16)112.1566(38)8(24)9(23)123.6477(39)2(18)5(19)97.5488(40)7(23)1(15)143.8399(41)1(17)8(22)83.52表2 U10*(108)均匀设计实验方案及试验数据表试验次数X1/10-5mX2/psiX3/psiW11(33其中W(Y/K)为薄膜重量均值,可由表3得到。而薄膜厚度Y值可根据Y=KW得到。以薄膜厚度为目标的非线性回归方程模型为其中W(Y/K)为薄膜重量均值,可由表3得到。而薄膜厚度Y值X1X2X3X11X12X

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论