版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、学习文档 仅供参考学习文档 仅供参考选择的程序选择的程序适合的条件响应类型评估方法回归执行简单或多元回归分析:选择合适的关系模型、存贮回归统计量、检验残差分析、产生点估计、产生预测和LACK-FIT 最小二乘法连续型逐步回归分析为了识别预测因素中有用的子集,执连续型最小二乘法最正确子集R2 为基础的预测因子最正确子集。连续型最小二乘法拟合线性图使用单个预测因子执行线性和多项回归,并且用数据绘制回归线。以实际和 log10 为基础。连续型最小二乘法如何使用 MINTAB 进行回归分析回归分析用来检验并建立一个响应变量与多个预测变量之间的关系模形。MINITAB 提供了多种最小二乘法和推理回归程序
2、。当响应变量为连续的量值时使用最小二乘法当响应变量为分类值时使用推理回归。最小二乘法和推理回归方法都是评估关系模型中的参数并使模型的按按拟合值到达最优化。最小二乘法是使误差平方和以获得参数估计值但是MINITAB的推理回归命令是获得参数最大概率估计参考2-29页推理回归概要以获得更多关天推理回归分析信息使用下表来帮助选择适当的程序。残差图残差图产生一组残差图用来进行残差分析。score 图以及残差和拟合图。连续型最小二乘法进行响应可能只有两个值的回归分二元推理分析析,例如:存在或不存在。分类最大概率顺序推理对响应可能有三个或更多的值的响应进行回归分析,该响应值有自然的顺序,例如:无影响、中等影
3、响、严重影响。分类最大概率名义推理对响应可有三个或更多的值的响应进例如:甜、咸 、酸分类最大概率回归lack-of-fit 检验。 多元回归关系模型,您将会发现使用拟合线性图更好。数据察值的测量结果。在回归方程计算和方差分析表中,MINITAB 忽略了响应或预测因子中所有包含丧失值的观测值列。线性回归分析统计回归回归响应(Y)的列。(X)变量的列。如果需要的话,可以使用下面显示的选项,然后单击“确立”选项图形子对话框为正常、标准、已删除残差图画5个不同的残差图。参考2-5 页选择残差图类型。有效的残差图包括: 柱状图正态概率图残差图及拟合值残差图及数据顺序。每个数据点的行号都显示在图中 X 轴
4、上。(例如:1 2 3 4 5n)2-6 结果子对话框在对话窗口中显示以下内容: 不输出估计的回归关系方程,系数表、S,R2,以及方差分析表。fits and residuals of unusual observations选项子对话框学习文档 仅供参考学习文档 仅供参考学习文档 仅供参考执行加权回归分析参考2-6 页加权回归分析exclude the intercept term from the regression by unchecking Fit InterceptseeRegression through the origin on 7显示varianceinflation 因子
5、(VIF共线性影响度量值)与每个预测因子相关参考2-7 页Varianceinflationfactor显示杜宾-瓦特森统计,它是用来检测残差的自相关2-7 PRESS 。lack-of-fit 2-8 lack-of-fit用数据子子集 lack-of-fit 测试来检验关系模型的适合性参考 2-8 页检验 lack-of-fit预测响应结果、置信区间以及新观测值的区间参考2-9页新的观测值的预测存储子对话框存储系数、拟合值、以及正常、标准、已删除残差图参考 2-5 页选择残差类型。n store the leverages, Cooks distances, and DFITS, for
6、identifying outliers seeIdentifying outliers on 9.存储store the mean square error, the (X X)-1 matrix, and the R matrix of the QRor Cholesky decomposition. (The variance-covariance matrix of the coefficients is MSE*(XX)-1.) See Help for information on these matrices.残差分析及回归推断残差图是否是随机和正态分布。MINITAB 通过图形
7、子对话图提供许多残差图,做为选择,关系模型及残差被存储以后,您可以使用统计回归残差图命令可以在同一图形窗口获得四个残差图。MINITAB 2-9 页OUTLIERS,您可检验一下这些异常数据看它们是否正确。假设这样的话,您可以确定它们为什 OUTLIERS时,回归结果的敏感程度。Outliers 可以暗示关系模型不充分或者需要另外的信息。选择残差类型您可以计算三各残差类型,使用下表可以帮助您选择哪种图形。常规标准选择您需要列examine residuals in the original scale of the datarule of thumb 来识别与关系模型关表示。计算方法respo
8、nsefit(残差)/(残差的标准差)Studentized识别与关系模型关联关系不十分密切Studentized 残差绝对值说明关系模型中包含该观测值将会增大误差变化或者它对参数的估计残差图(残差)/(残差的标准差)I studentized I 个被删除的观测值计算出来的。MINITAB图:残差正态分布图统计 统计正态检验(1-43)。残差柱状图:0(钟形)之外的因子可能影响了您的结果。残差及拟合度:本图应该显示的是残差应是随机的分布在 0 周围。在残差图内应该没有任何recognizable patterns,以下的几点可以说明残差图是非随机的:几点连续上升或下降绝大部分的点是正残差,或
9、绝大部的点是负残差。patterns such as increasing residuals with increasing fits是与时间相关的影响。MINITAB Brushing的章节。加权回归分析量那么:带有大变量的观测值应相应地加上较小的权重。一般情况的权重是响应中纯误差变量相反值。The usual choice of weights is the inverse of pure error variance in the response.加权回归分析选择统计回归回归选项0,在每个对话框中单击“确定”n个观测值,MINITABnnWMINITAB使用(XWX)-1(XWY)来
10、计回归系数,这样就等于将加权平方和误差最小化。,式中 wi为权重。通过原点的回归一般的情况下, y 截矩(也叫常数项)被包含在等式,因此 minitab 选用下面关系模型:学习文档 仅供参考x=0 0 在选项子对话框中,不选截矩项,并且 0项就会被忽略,minitab 选用下面的关系模型:R2带有截矩项关系模型的拟合度,可以进行平均值平方误差及验证残差图。变量 inflation factorThe variance inflation factor (VIF) 用来检测一个预测因子和剩下的预测因子是否有很强的线性关系(预测因子中存在多重共线性)。如果您的预测因子是相关的(或多重线性相关)时,
11、VIF 测量的是估计的回归因子增加程序。VIF=1 VIF 是用来作为多重共线性的指示。Montgomery and Peck 21VIF 5-10 时,回归系数估计得毫无结果。你应该考虑使用选项中的方法来分散预测因子间的多重共线性:加的信息请参考3,21.。检验残差的自相关在线性回归分析中,我们总是假设残差都是彼此相互独立的(即它们之间不存大自相关)。t 值。选定一个模型后检验关系模型的假设是回归分析的一个很重要的部分。Minitab 提供了两种方法也检验这个假设:残差与数据顺序(1234以提供很直观的方法来检验残差的自关性。杜宾0来 样在计算时这些数据就会忽略了,仅仅使用没有丧失的数据。D
12、上限,没有相关; D F (.50,p,np), where F is value from anF-distribution.nDFITS, like Cooks distance, combines the leverage and the Studentizedresidual into one overall measure of how unusual an observation is. DFITS (also called DFFITS) is the difference between the fitted values calculated with and without
13、 the ith observation, and scaled by stdev ( i). Belseley, Kuh,and Welsch 3 suggest that observations with DFITS 2 shouldbeconsidered as unusual. See Help for more details on thesemeasures.Example of performing a simple linear regression简单线性回归实例 看是否可由容易获得数据来预测想要的数据。您也可以利用观测值 SCORE1 8.2 的预测区间。EXH_REGR
14、.MTW选择统计回归回归在响应Score2,在预测因子Score1.单击“选项”按钮。8.2,然后单击每个对话框的“确定”按钮。The regression equation isScore2 = 1.12Predictor+ 0.218 Score1CoefSECoefTPConstant1.11770.109310.230.000Score10.217670.0174012.510.000S=0.1274R-Sq=95.7%R-Sq(adj) =95.1%Analysis of VarianceSourceDFSSMSFRegression12.54192.5419156.56Residu
15、alError70.11360.0162Total82.6556Unusual ObservationsObsScore1Score2FitSEFitResidualStResid97.502.50002.75020.0519-0.2502-2.15RR denotes an observation with a large standardizedresidualPredicted Values for New ObservationsNewObsFitSEFit95.0%CI95.0%PI12.90260.0597(2.7614,3.0439)(2.5697,3.2356)Values o
16、f Predictors for NewObservations NewObsScore118.20结果说明回归程序选择模型是其中 Y 是响应,X 是预测因子,0 和1 是回归系数,是误差项,它是服从平均为零,标准偏为正态分布,MINITAB 通过 b0 估计0, b1 估计1,S 估计。选择的方程拟合方程即为:其中叫做被预测或被拟合值。本例中b0 是1.12b1 是0.218。学习文档 仅供参考,以及它们的标准误差。另外 p0.000MINITAB( levels)水平下,系数不等于零,S = 0.1274,这是的估计值, 回归线标准偏差的估计值。注意:R-Sq=95.7%.这就是2,也叫做
17、决定系数,注意2 =Correlation(Y,)22值是是由预测因子(本例中Score1)而导致Y 变量(本例中Score2)的可变比例。The R2 value is the proportion of variability in the Y variable (in this example, Score2) accounted for by the predictors (in this example, Score1).R-Sq(adj)=95.1%2将要MINITABR-Sq(adj),该值是总体2 的无偏估计,它是根据以下公式计算出来的:将其转换为百分比,其中 P 是回归方程中
18、的系数数量(本例,P=2),在相同的符号,通常 R2 为:(SS(回归|b0)SSSS残差,SSERSSMSE。总平方和(SSTotal) H0:所有回归系数(除0)=0 进行检验。异常观测值:如果预测因子异常,用X 来标识该异常观测值;如果响应值异常,那么用R (大标准化残差)2-5 页以及2-9 页识别outlie.sY 值或。SE Fit 是拟合值的标准误差(估计的)。St Resid 是标准化残差。学习文档 仅供参考学习文档 仅供参考学习文档 仅供参考95%算出来的(Score18.2)95%Score18.2 时的预测区间。置信区间适用于回归中使用的数据。如果您有想知道新观测值,使用
19、预测区间,参考2-9 新观测值的预测。 关系回归分析的信息。多元回归分析实例:南、北各方向焦点的位置来预测。数据是从21,4862-23页的最EXH_REGR.MTW选择统计回归回归在“响应”栏中Heatflux.在预测因子栏中NorthSouthEast,OK 按钮。4 In Predictors, enter North South East. Click OK.回归分析 :HeatFlux VS East, South, North回归方程:HeatFlux = 389 + 2.12 East + 5.32 South - 24.1 North预测因子CoefSECoefTPConsta
20、nt389.1766.095.890.000East2.1251.2141.750.092South5.31850.96295.520.000North-24.1321.869-12.920.000S=8.598R-Sq=87.4%R-Sq(adj) =85.9%方差分析SourceDFSSMSFPRegression312833.94278.057.870.000Residual Error251848.173.9Total2814681.9SourceDFSeq SSEast1153.8South1349.5North112330.6异常观测值ObsEastHeatFluxFitSEFit
21、ResidualStResid433.1230.70210.205.0320.502.94R2237.8254.50237.164.2417.342.32RR denotes an observation with a large standardized residualDurbin-Watson statistic = 1.48解释结果MINITAB 选择了以下回归模型:Y X2, X3 12and 3 是服从均值为零标准差为为.正态分布的误差项。t-T NORTH(10578.7)NORTH 的平方和。South 的值(2028.9) 是South 惟一的平方和假设North 平方和存在以及East 的值(2028.9) 是East North South 平方和存在b0,SS(b1 | b0),,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 钢筋工程钢筋班组劳务分包
- 国内个人房屋买卖合同范本模板
- 签证申请英文保证信模板
- 个人有担保贷款抵押合同样本
- 住宅改商业的保证
- 购销合同修改策略
- 志愿者权利与义务
- 土豆购销合同范本
- 中文版和英文版采购合同全文翻译
- 土木修建劳务分包协议
- 宝钢股份发行绿色债券融资案例研究
- 职业卫生及防护智慧树知到答案2024年中南大学
- 青岛版五年级上册数学计算题专项练习1000道带答案
- 陶瓷材料在体育健身领域的应用
- 2024-2030年六方氮化硼行业营销策略及前景运行状况监测分析研究报告
- 理论联系实际谈一谈你对中国式现代化的中国特色的理解15篇
- PLC控制系统合同
- 2024数据中心浸没式液冷系统单相冷却液技术指标和测试方法
- 国有企业采购管理规范 T/CFLP 0027-2020
- 人才培养与团队建设计划三篇
- 互联网与营销创新智慧树知到期末考试答案章节答案2024年华东师范大学
评论
0/150
提交评论