论文知识回归分析_第1页
论文知识回归分析_第2页
论文知识回归分析_第3页
论文知识回归分析_第4页
论文知识回归分析_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SPSS如何进行线性回归分析操作浏览:3113更新:2014-03-1310:11本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。一、一元线性回归分析用SPSS进行回归分析,实例操作如下:1.单击主菜单Analyze/Regression/Linear...,进入设置对话框如图7-9所示。从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method—项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:2.请单击Statistics...按钮可以选择需要输出的一些统计量。如RegressionCoefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Modelfit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。用户在进行回归分析时,还可以选择是否输出方程常数。单击Options...按钮,打开它的对话框,可以看到中间有一项Includeconstantinequation可选项。选中该项可输出对常数的检验。在Options对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置/如图7-11所示。设置完成后点击Continue返回主对话框。在主对话框点击OK得到程序运行结果。如题。我选择的是线性回归,得出了一堆表格和图标。我做的是生物学方面的统计。我的目标是得出模拟方程,再根据已有的自变量来计算因变量。我是SPSS新手,而且我对逐步回归也不了解。但由于工作原因,必须得到模拟方程。请高手告诉我我的这个统计符不符合线性关系,如果符合,怎么写模拟方程,谢谢!以下是部分截图分享到:2013-11-1619:52提问者米纳x1,x2...x5是5个自变量,1个y因变量。系数a图中是将x1与y建立一个线性回归模型,常量为1.956E-6,sig.也即P值=1>0.05,无统计学意义,x1的斜率为-0.504,P=0.000v0.05,具有显著意义,常量和斜率看非标准化系数,得方程为y=-0.504x1+1.956E-6,这其实是个一元线性回归方程;然后逐渐的加入x2,x3,x4,x5进行二元线性回归,三元线性回归等。一旦有一个变量,如x3的P值〉0.05也就说明这个变量对模型的建立无统计学意义,在多元线性回归中也就可以无情的剔除掉。而由系数a图可知,x1,x2,x3,x4,x5的斜率P值都是0.000<0.05,也就是说都有意义,5个变量一个也不能剔除,全保留,也即要5个变量都有的模型6了。由模型汇总图也可知,模型1到6的调整R方是越来越大的,也即拟合的越来越好了。那么最终的线性方程就看模型6啦,常量0.002,x1斜率-0.860,x2斜率-0.713...后面看不到了。也即y=0.002-0.860x1-0.713x2…常量P值=0.974>0.05无显著性意义,说明拟合的线过原点,也即常量值应为0,但是否能改为0这个我也不确定,但0或0.002差别不会太大的。追问厉害,一看就是高手。不好意思,系数那个表里缺一块,我现在补上,再把另外几个表补上还有点问题想请指教。1.你说的那个常量为1.965E-6,这个E是什么意思?2•自变量一共有6个,从x1到x6,可能是我那个表缺一块的原因吧,抱歉了。系数表缺的部分:其它表能否将最终的模拟方程式写出来,不胜感激!回答1.965E-6是指1.965乘10的-6次方。已排除的变量表对应系数a表,模型1对应模型1,也即前一个表是进入,相对的后一个就排除。模型1进入了x1,排除的x2,x3,x4,x5,x6中的x2的P值<0.05还不能排除,还要进入分析,模型2,3等依次类推,一个也排除不掉。全部进入回归方程。另,如果两变量间存在共线性的话,是不能都进入回归方程的。判断依据为膨胀因子VIFV10,倒数即容差〉0.1,已排除变量图上可知各变量间不存在共线性,都不用排除。常量P值〉0.05可以去掉,各变量的斜率选用模型6的标准系数。因而最终回归方程为:y=-0.860x1-0.713x2-0.567x3-0.414x4-0.254x5-0.130x6回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。第一节Linear过程主要功能调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。实例操作[例8.1]某医师测得10名3岁儿童的身高(cm)、体重<kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号体表面积(Y)身高(X)1体重(X)212345675.3825.2995.3585.2925.6026.0145.83088.087.688.589.087.789.588.811.011.812.012.313.113.714.486.10290.414.996.07590.615.2106.41191.216.0数据准备激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数;身高、体重分别为X1、X2,1位小数。输入原始数据,结果如图8.1所示。图8.1原始数据的输入统计分析激活Statistics菜单选Regression中的Linear...项,弹出LinearRegression对话框(如图8.2示)。从对话框左侧的变量列表中选y点击A钮使之进入Dependent框,选xl、x2,点击A钮使之进入Indepentdent(s)框;在Method处下拉菜单,共有5个选项:Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。本例选用Enter法。点击OK钮即完成分析。用户还可点击Statistics...钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;点击Plots.••钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图);点击Save...钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正Y预测值和标准化Y预测值作保存);点击Options...钮选择变量入选与剔除的a、B值和缺失值的处理方法。结果解释在结果输出窗口中将看到如下统计数据

2..X1MultipleR.94964RSquare.90181AdjustedRSquare.87376StandardError.14335AnalysisofVarianceDFSumofSquaresMeanSquareRegression21.32104.66052Residual7.14384.02055F=32.14499SignifF=.0003-VariablesintheEquation-VariableBSEBBetaTSigTXI.068701.074768.215256.919.3887X2.183756.056816.7576603.234.0144(Constant)-2.8564766.017776-.475.6495EndBlockNumber1Allrequestedvariablesentered.结果显示,本例以XI、X2为自变量,Y为应变量,采用全部入选法建立回归方程。回归方程的复相关系数为0.94964,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。回归方程为Y=0.0687101X1+0.183756X2-2.856476。本例要求按所建立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将根据回归方程求得的Y预测值转化成按均数为0、标准差为1的标准正态分布的Y值)并将计算结果保存入原数据库。系统将原始的X1、X2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值(即库中zpr_1栏),详见图8.3。图8.3计算结果的保存本例还要求对标准化Y预测值作变量分布图,系统将绘制的统计图送向ChartCarousel窗口,双击该窗口可见下图显示结果。图8.4对标准化Y预测值所作的正态分布图第二节CurveEstimation过程主要功能调用此过程可完成下列有关曲线拟合的功能:1、Linear:拟合直线方程(实际上与Linear过程的二元直线回归相同,即Y=b0+b1X);2、Quadratic:拟合二次方程(Y=b0+b1X+b2X2);3、Compound:拟合复合曲线模型(Y=b0Xb1X);4、Growth:拟合等比级数曲线模型(Y=e(b0+b1X));5、Logarithmic:拟合对数方程(Y=b0+b1lnX)6、Cubic:拟合三次方程(Y=b0+b1X+b2X2+b3X3);7、S:拟合S形曲线(Y=e(b0+b1/X));8、Exponential:拟合指数方程(Y=b0eb1X);9、Inverse:数据按Y=b0+b1/X进行变换;10、Power:拟合乘幕曲线模型(Y=b0Xb1);11、Logistic:拟合Logistic曲线模型(Y=1/(1/u+b0Xb1X)。实例操作[例8.2]某地1963年调查得儿童年龄(岁)X与锡克试验阴性率(%)Y的资料如下,试拟合对数曲线。年龄(岁)锡克试验阴性率(%)657.176.090.993.096.795.696.2数据准备激活数据管理窗口,定义变量名:锡克试验阴性率为Y,年龄为X,输入原始数据。统计分析激活Statistics菜单选Regression中的CurveEstimation...项,弹出CurveEstimation对话框(如图8.5示)。从对话框左侧的变量列表中选y,点击A钮使之进入Dependent框,选x,点击A钮使之进入Indepentdent(s)框;在Model框内选择所需的曲线模型,本例选择Logarithmic模型(即对数曲线);选Plotmodels项要求绘制曲线拟合图;点击Save...钮,弹出CurveEstimation:Save对话框,选择Predictedvalue项,要求在原始数据库中保存根据对数方程求出的Y预测值,点击Continue钮返回CurveEstimation对话框,再点击OK钮即可。8.2.2.3结果解释在结果输出窗口中将看到如下统计数据在以X为自变量、Y为应变量,采用对数曲线拟合方法建立的方程,决定系数R2=0.913(接近于1),作拟合优度检验,方差分析表明:F=52.32,P=0.001,拟合度很好,对数方程为:Y=61.3259+20.6704lnX。本例要求绘制曲线拟合图,结果如图8.6所示。图8.6对数曲线拟合情形根据方程Y=61.3259+20.6704lnX,将原始数据X值代入,求得Y预测值(变量名为fit_l)存入数据库中,参见图8.7。图8.7计算结果的保存第三节Logistic过程主要功能调用此过程可完成Logistic回归的运算。所谓Logistic回归,是指应变量为二级计分或二类评定的回归分析,这在医学研究中经常遇到,如:死亡与否(即生、死二类评定)的概率跟病人自身生理状况和所患疾病的严重程度有关;对某种疾病的易感性的概率(患病、不患病二类评定)与个体性别、年龄、免疫水平等有关。此类问题的解决均可借助逻辑回归来完成。特别指出,本节介绍的Logistic过程,应与日常所说的Logistic曲线模型(即S或倒S形曲线)相区别。用户如果要拟合Logistic曲线模型,可调用本章第二节CurveEstimation过程,系统提供11种曲线模型,其中含有Logistic曲线模型(参见上节)。在一般的多元回归中,若以P(概率)为应变量,则方程为P=bO+b1X1+b2X2+…+bkXk,但用该方程计算时,常会出现P〉1或P〈0的不合理情形。为此,对P作对数单位转换,即logitP=ln(P/1-P),于是,可得到Logistic回归方程为:

ebO+blXl+b2X2+…+bkXk1+eb°+blXl+b2X2+…+bkXk8.3.2实例操作[例8.3]某医师研究男性胃癌患者发生术后院内感染的影响因素,资料如下表,请通过Logistic回归统计方法对主要影响因素进行分析。无5911有6.04无6422无9.16无3611有&48无4231有5.36无4842有4.65无5012有12.848.3.2.1数据准备激活数据管理窗口,定义变量名:术后感染为Y(字符变量,有输入Y、无输入N),年龄为XI,手术创伤程度为X2,营养状态为X3,术前预防性抗菌为X4(字符变量,有输入Y、无输入N),白细胞数为X5,癌肿病理分度为X6。按要求输入原始数据。统计分析激活Statistics菜单选Regression中的Logistic...项,弹出LogisticRegression对话框(如图8.8示)。从对话框左侧的变量列表中选y,点击A钮使之进入Dependent框,选xl、x2、x3、x4、x5和x6,点击A钮使之进入Covariates框;点击Method处的下拉按钮,系统提供7种方法:1、Enter:所有自变量强制进入回归方程;2、Forward:Conditional:以假定参数为基础作似然比概率检验,向前逐步选择自变量;3、Forward:LR:以最大局部似然为基础作似然比概率检验,向前逐步选择自变量;4、Forward:Wald:作Wald概率统计法,向前逐步选择自变量;5、Backward:Conditional:以假定参数为基础作似然比概率检验,向后逐步选择自变量;6、Backward:LR:以最大局部似然为基础作似然比概率检验,向后逐步选择自变量;7、Backward:Wald:作Wald概率统计法,向后逐步选择自变量。本例选用Forward:Conditional法,以便选择有主要作用的影响因素;点击Options...钮,弹出LogisticRegression:Options对话框,在Display框中选取Atlaststep项,要求只显示最终计算结果,点击Continue钮返回LogisticRegression对话框,再点击OK钮即可。8.3.2.3结果解释在结果输出窗口中将看到如下统计数据

系统先对字符变量进行重新赋值,对于应变量Y,回答是(Y)的赋值为0,回答否(X)的赋值为1;对于应变量X4,回答是(Y)的赋值为-1,回答否(X)的赋值为1。

EndBlockNumber1PIN=.0500Limitsreached.EndBlockNumber1PIN=.0500Limitsreached.FinalEquationforBlock1Estimationterminatedatiterationnumber12becauseLogLikelihooddecreasedbylessthan.01percent.-2LogLikelihood3.819GoodnessofFit3.000Overall93.33%Overall93.33%canceChi-SquaredfSignifiModelChi-Square15.2762.0005Improvement6.7661.0093ClassificationTableforYPredictedynPercentCorrectyInObserved++——+yy14I1I80.00%+——+——+nnI0I10I100.00%+——+——+VariablesintheEquation结果表明,第一步自变量X3入选,方程分类能力达80.00%;第二步自变量X6入选,方程分类能力达93.33%(参见结果中的分类分析表);方程有效性经x2检验,x2=15.276,P=0.0005。Logistic回归的分类概率方程为:e123.4053-30.5171X3-10.2797X6P=——————————————1+e123.4053-30.5171X3-10.2797X6根据该方程,若一胃癌患者营养状态评分(X3)为3,癌肿病理分度(X6)为9,则其P=4.5X10-2廷0,这意味着术后将发生院内感染;另一胃癌患者营养状态评分(X3)为1,癌肿病理分度(X6)为4,则其P=0.98105~l,这意味着术后将不会发生院内感染。第四节Probit过程主要功能调用此过程可完成剂量-效应关系的分析。通过概率单位使剂量-效应的S型曲线关系转化成直线,从而利用回归方程推算各效应水平的相应剂量值。实例操作[例8.4]研究抗疟药环氯胍对小白鼠的毒性,试验结果如下表所示。试计算环氯胍的半数致死剂量。数据准备激活数据管理窗口,定义变量名:剂量为DOSE、试验动物数为OBSERVE、死亡动物数为DEATH。然后输入原始数据。统计分析激活Statistics菜单选Regression中的Probit...项,弹出ProbitAnalysis对话框(如图8.9示)。从对话框左侧的变量列表中选death,点击A钮使之进入ResponseFrequency框;选observe,点击A钮使之进入TotalObserved框;选dose,点击A钮使之进入Covariate(s)框,并下拉Transform菜单,选Logbase10项(即要求对剂量进行以10为底的对数转换)。系统在Model栏中提供两种模型,一是概率单位模型(Probit),另一是比数比自然对数模型(Logit)。本例选用概率单位模型。点击Options...钮,弹出ProbitAnalysis:Options对话框,在NaturalResponseRate栏选Calculatefromdata项,要求计算各剂量组的实际反应率。之后点击Continue钮返回ProbitAnalysis对话框,再点击OK钮即可。结果解释在结果输出窗口中将看到如下统计数据:系统首先显示,共有7组原始数据采概率单位模型进行分析。回归方程的各参数在经过14次叠代运算后确定,即PROBIT=5.95215-4.66313X。该方程拟合优度X2检验结果,X2=0.833,P=0.934,拟合良好。

MODELInformationONLYNormalSigmoidisrequested.NaturalResponseratetobeestimatedCONTROLgroupisnotprovided.Parameterestimatesconvergedafter14iterations.Optimalsolutionfound.ParameterEstimates(PROBITmodel:(PROBIT(p))=Intercept+BX):ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.39832ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.398322.481802.48180InterceptStandardInterceptStandardErrorIntercept/S.E.ErrorIntercept/S.E.-2.12017-4.663132.19942-2.12017-4.663132.19942EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4P=.934接着,系统显示剂量对数值(DOSE)、实际观察例数(NumberofSubjects)、试验动物反应数(ObservedResponses)、预期反应数(ExpectedResponses)、残差(Residual)和效应的概率(Prob)。之后,显示各效应概率水平的剂量值及其95%可信区间值,按本例要求,环氯胍的半数致死剂量(即Prob=0.50时)为6.07347,其95%可信区间为1.86305—7.54282。

.427.48745.7038.012.011.688.312.30757.6012.02.01.682.318.14016.485.0.0.171-.171.03413ConfidenceLimitsforEffectiveDOSE95%ConfidenceLimitsProbDOSELowerUpper.012.46942.027524.27407.022.74406.045344.54351.032.93394.062234.72430.043.08539.078954.86574.053.21433.095804.98445.063.32832.112945.08821.073.43158.130475.18134.083.52676.148455.26651.093.61561.166945.34550.103.69937.185975.41954.154.06733.290605.74092.204.38570.413956.01572.254.67862.560216.26792

.304.95831.734366.51010.355.23239.942616.75084.405.506461.192866.99754.455.785281.495297.25814.506.073471.863057.54282.556.376002.312997.86673.606.698862.865878.25522.657.049743.544388.75565.707.439434.363949.46545.757.884165.3068810.59748.80&410756.2906912.60617.859.069107.2151416.40564.909.97116&0941224.20725.9110.202168.2776026.73478.9210.459198.4689229.82525.9310.74928&6717733.68627.9411.082788.8912838.64769.9511.475809.1351145.27000.9611.955389.4157254.59759.9712.572529.7559068.85554.9813.4425010.2057793.92908.9914.9375110.92195153.73112最后,系统输出以剂量对数值为自变量X、以概率单位为应变量Y的回归直线散点图,从图中各点的分布状态亦可看出,回归直线的拟合程度是很好的。图8.10剂量-效应关系回归直线散点图第五节Nonlinear过程主要功能调用此过程可完成非线性回归的运算。所谓非线性回归,即为曲线型的回归分析一些曲线模型我们已在本章第二节中述及。但在医学研究中经,还经常会遇到除本章第二节中述及的曲线模型,对此,SPSS提供Nonlinear过程让用户根据实际需要,建立各种曲线模型以用于研究变量间的相互关系。在医学中,如细菌繁殖与培养时间关系的研究即可借助Nonlinear过程完成。下面一些曲线模型是在论文中较常见的,提供给用户应用时作参考:模型名称模型表达式Asympt.Regression1Y=bl+b2Xexp(b3x)Asympt.Regression2Y=bl-(b2X(b3x))DensityY=(bl+b2XX)(-l/b3)

DensityGaussexp(-b2XXGaussexp(-b2XX2))Gompertzexp(-b3XX))Johnson-SchumacherLogModifiedLog-LogisticMetcherlichLawofDim.Ret.Y=MichaelisMentenMorgan-Mercer-FlorinPeal-ReedXX+b4XX2+b5XX3)))RatioofCubicsXX3)/(b5XX3)RatioofQuadraticsRichardsX))(1/b4))VerhulstVonBertalanffyXX))(1/(1-b4))WeibullXb4)YieldDensityY=b1Xexp(-b2XY=b1Xexp(-b2/(X+b3))Y=(b1+b3XX)b2Y=b1-ln(1+b2Xexp(-b3XX))b1+b2Xexp(-b3XX)Y=b1XX/(X+b2)Y=(b1Xb2+b3XXb4)/(b2+Xb4)=b1/(1+b2Xexp(-(b3Y=(b1+b2XX+b3XX2+b4Y=(b1+b2XX+b3XX2)/(b4XX2)Y=b1/((1+b3Xexp(-b2XY=b1/(1+b3Xexp(-b2XX))Y=(b1(1-b4)-b2Xexp(-b3=b1-b2Xexp(-b3XY=(b1+b2XX+b3XX2)(-1)8.5.2实例操作[例8.5]选取某地某年寿命表中40-80岁各年龄组的尚存人数资料如下表请就该资料试拟合Gompertz曲线(Y=blXb2©3x))。

年龄组(岁)年龄简化值(X)尚存人数(Y)404550556065707580012345678812777925876532728506756859911508003932528074数据准备激活数据管理窗口,定义变量名:年龄简化值为X,尚存人数为Y。输入原始数据。统计分析激活Statistics菜单选Regression中的Nonlinear...项,弹出NonlinearRegression对话框(如图8.11示)。从对话框左侧的变量列表中选y,点击钮使之进入Dependent框。由于SPSS系统尚无法智能地自动拟合用户所需的曲线,故一方面要求用户估计方程中常数项和各系数项进行叠代运算的起始值,另一方面要求用户列出方程模型。对此,可首先点击NonlinearRegression对话框的Parameters...钮,弹出NonlinearRegression:Parameters对话框(图8.12),在Name处定义系数名,在StartValue处输入起始值(这项工作是十分重要的,否则系统可能无法运算,甚至会因叠代次数过大导致SPSS系统的崩溃),本例定义bl=8500、b2=l、b3=1.5,每定义一个系数,即点击Add钮加以确定;若在后面的运算中出错,则还可修改系数项的起始值,修改后点击Change钮加以确定;然后点击Continue钮返回NonlinearRegression对话框。在ModelExpression处写出曲线方程表达式,用户可借助系统提供的数码盘和函数列表写出方程。本例要求计算根据回归方程求出的预测值,可点击Save钮,在NonlinearRegression:SaveNewVariables对话框中选Predictedvalue项。最后点击OK钮即可。8.12系数项定义对话框结果解释在结果输出窗口中将看到如下统计数据

SSB1B2B31283271934638500.000001.000000001.500000001.11433343480080175.3427.7392405511.5000000021433343480080175.3427.7392405511.500000002.13.8505E+11194572.013.006502086-.216290772.2800135019.683185.8046.8429947971.198524303800135019.683185.8046.8429947971.198524303.11285737878881201.83221.015792671.429277913.2550558275.185774.2528.8504931971.214331274550558275.185774.2528.8504931971.214331274.1205793117.690637.3496.8594292121.252769325205793117.690637.3496.8594292121.252769325.149937888.6592251.6832.9059927001.33942536649937888.6592251.6832.9059927001.339425366.1438492814.383503.5809.9664210431.463656026.214165723.6591420.4568.9091126941.36083115714165723.6591420.4568.9091126941.360831157.18227661.24889440.0706.9234633151.3889894088227661.24889440.0706.9234633151.38898940&117416856.8685916.5498.9482999861.45005498&24600297.86688467.6768.9302963971.4079772494600297.86688467.6768.9302963971.407977249.12761649.68586538.9357.9437367071.44419408102761649.68586538.9357.9437367071.4441940810.1644830.076585633.9620.9497149171.4689666011644830.076585633.9620.9497149171.4689666011.1475140.368485680.9561.9493255671.4689804412475140.368485680.9561.9493255671.4689804412.1475135.426585679.2273.9493387131.46903683131.46903683475135.426585679.2273.94933871313.1475135.426285679.2477.9493385901.46903640Runstoppedafter30modelevaluationsand13derivativeevaluations.IterationshavebeenstoppedbecausetherelativereductionbetweensuccessiveresidualsumsofsquaresisatmostSSCON=1.000E—08NonlinearRegressionSummaryStatisticsDependentVariableYSourceSquareDFSumofSquaresMeanRegression09.2337121583327.6123738611Residual9.237716475135.426247918UncorrectedTotal937122058463.0(CorrectedTotal)82823635793.56Rsquared=1—ResidualSS/CorrectedSS=.99983Asymptotic95%AsymptoticConfidenceIntervalParameterEstimateStd.

经30次叠代运算后,相邻两次的方程剩余均方差值不大于规定的1X10-8,满足要求;回归方程的决定系数R2=0.99983,Gompertz曲线方程为:Y=85679.247671X0.94933859(1.469036403X)本例要求计算预测值,系统将结果存入原始数据库中(图8.13),系统以pred_作为预测值的变量名。由结果可见,预测值与实际值十分接近。图8.13原始数据及其预测值多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。可以建立变量y与各自变量xj(j=1,2,3,...,n)之间的多元线性回归模型:其中:b0是回归常数;bk(k=1,2,3,…,n)是回归参数;e是随机误差。多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。分级别数值列成表2-1。预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。预报因子:x1诱蛾量0~300头为I级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,151~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为级,3~4天为2级,5天为3级,6天或6天以上为4级。表2-1X1x2x3x4y年蛾量级别卵量级别降水量级别雨日级别幼虫密度级别19601022411214.31211011961300144030.111141196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171

197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112数据保存在“DATA6-5SAV〃文件中。1)准备分析数据在SPSS数据编辑窗口中,创建''年份〃、''蛾量〃、“卵量〃、“降水量〃、“雨日〃和''幼虫密度〃变量,并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量'x1〃、“x2”、“x3〃、“x4”和“y〃,它们对应的分级数可以在SPSS数据编辑窗口中通过计算产生。编辑后的数据显示如图2-1。图2-1或者打开已存在的数据文件“DATA6-5.SAV〃。2)启动线性回归过程单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图2-2所示的线性回归过程窗口。图2-2线性回归对话窗口设置分析变量设置因变量:用鼠标选中左边变量列表中的''幼虫密度[y]〃变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就移至『'Dependent”因变量显示栏里。设置自变量:将左边变量列表中的“蛾量[x1]〃、“卵量[x2]〃、“降水量[x3]〃、“雨日[x4]〃变量,选移到“Independent(S)"自变量显示栏里。设置控制变量:本例子中不使用控制变量,所以不选择任何变量。选择标签变量:选择“年份〃为标签变量。选择加权变量:本例子没有加权变量,因此不作任何设置。回归方式本例子中的4个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选。因此在'Method〃框中选中“Enter〃选项,建立全回归模型。5)设置输出统计量单击“Statistics〃按钮,将打开如图2-3所示的对话框。该对话框用于设置相关参数。其中各项的意义分别为图2-3“Statistics"对话框①“RegressionCoefficients”回归系数选项:“Estimates”输出回归系数和相关统计量“Confideneeinterval"回归系数的95%置信区间“Covariancematrix”回归系数的方差-协方差矩阵本例子选择“Estimates〃输出回归系数和相关统计量。②“Residuals”残差选项:“Durbin-Watson"Durbin-Watson检验“CasewisediagnoStic”输出满足选择条件的观测量的相关信息。选择该项,下面两项处于可选状态:“Outliersoutsidestandarddeviations"选择标准化残差的绝对值大于输入值的观测量;“Allcases〃选择所有观测量本例子都不选。③其它输入选项“Modelfit〃输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。“Rsquaredchange”输出由于加入和剔除变量而引起的复相关系数平方的变化。“Descriptives”输出变量矩阵、标准差和相关系数单侧显著水平矩阵。“Partandpartialcorrelation”相关系数和偏相关系数“Collinearitydiagnosties"显示单个变量和共线性分析的公差。本例子选择“Modelfit〃项。6)绘图选项在主对话框单击“Plots〃按钮,将打开如图2-4所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X〃和“Y”框用于选择X轴和Y轴相应的变量。图2-4“Plots”绘图对话框窗口左上框中各项的意义分别为:“DEPENDNT”因变量。“ZPRED〃标准化预测值。“ZRESID〃标准化残差。“DRESID〃删除残差。“ADJPRED〃调节预测值。“SRESID”学生氏化残差。“SDRESID”学生氏化删除残差。“StandardizedResidualPlots”设置各变量的标准化残差图形输出。其中共包含两个选项:“Histogram”用直方图显示标准化残差。“Normalprobabilityplots”比较标准化残差与正态残差的分布示意图。“Produceallpartialplot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。本例子不作绘图,不选择。7)保存分析数据的选项在主对话框里单击“Save!”钮,将打开如图2-5所示的对话框。图2-5“Save”对话框①“PredictedValudS”测值栏选项:Unstandardized非标准化预测值。就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量,存放根据回归模型拟合的预测值。Standardized标准化预测值Adjusted调整后预测值S.E.ofmeanpredictions预测值的标准误。本例选中“Unstandardize非标准化预测值。②“Distance距?离栏选项:Mahalanobis:距离。Cook's”:Cc距离。Leveragevalues:杠杆值。③“PredictionInterva预测区间选项:Mean:区间的中心位置。Individual:观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符“LICI_”头命名的变量,存放预测区间下限值;以字符“UICI_”开头命名的变量,存放预测区间上限值。ConfidenceInterval:置信度。本例不选。“SavetoNewFile”保存为新文件:选中"Coefficientstatistics”项将回归系数保存到指定的文件中。本例不选。“ExportmodelinformationtoXMLfile”导出统计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论