逐步回归解析总结计划实例_第1页
逐步回归解析总结计划实例_第2页
逐步回归解析总结计划实例_第3页
逐步回归解析总结计划实例_第4页
逐步回归解析总结计划实例_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精选文档精选文档PAGE17精选文档v1.0可编写可更正

逐渐回归剖析

在自变量很多时,此中有的要素可能对应变量的影响不是很大,并且x之间可能不完

全互相独立的,可能有各样互作关系。在这类状况下可用逐渐回归剖析,进行x因子的筛

选,这样建立的多元回归模型展望见效会更较好。

逐渐回归剖析,第一要建立因变量y与自变量x之间的总回归方程,再对总的方程及

每—个自变量进行假设检验。当总的方程不明显时,表示该多元回归方程线性关系不能够立;

而当某—个自变量对y影响不明显时,应该把它剔除,重新建立不包括该因子的多元回归

方程。精选出有明显影响的因子作为自变量,并建立“最优”回归方程。

回归方程包括的自变量越多,回归平方和越大,节余的平方和越小,节余均方也随之

较小,展望值的偏差也愈小,模拟的见效愈好。但是方程中的变量过多,预告工作量就会

越大,此中有些相关性不明显的预告因子会影响展望的见效。所以在多元回归模型中,选择

适合的变量数量特别重要。

逐渐回归在病虫预告中的应用实例:

以陕西省长武地区1984~1995年的烟蚜传毒病情资料、相关虫情平易象资料为例(数

据见),建立蚜传病毒病情指数的逐渐回归模型,说明逐渐回归剖析的详尽步骤。影响蚜传

病毒病情指数的虫情因子平易象因子一共有21个,经过逐渐回归,从中选出对病情指数影

响明显的因子,从而建立相应的模型。对1984~1995年的病情指数进行回检,此后对

1996~1998年的病情进行预告,再检验预告的见效。

变量说明以下:

x11:5月份均温

y:历年病情指数

1v1.0可编写可更正

x1:前年冬天油菜越冬时的蚜量

x2:前年冬天极端气温

x3:5月份最高气温

x4:5月份最低气温

x5:3~5月份降水量

x6:4~6月份降水量

x7:3~5月份均温

x8:4~6月份均温

x9:4月份降水量

x10:4月份均温

1)准备剖析数据

(头/株)x12:5月份降水量

x13:6月份均温

x14:6月份降水量

x15:第一次蚜迁巅峰期百株烟草

有翅蚜量

x16:5月份油菜百株蚜量

x17:7月份降水量

x18:8月份降水量

x19:7月份均温

x20:8月份均温

x21:元月均温

在SPSS数据编写窗口中,用“File→Open→Data”命令,打开“”数据文件。数据工作区以以以以下图3-1显示。

2v1.0可编写可更正

图3-1

2)启动线性回归过程

单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图3-2

所示的线性回归过程窗口。

图3-2线性回归对话窗口

3v1.0可编写可更正

设置剖析变量

设置因变量:将左侧变量列表中的“y”变量,选入到“Dependent”因变量显示栏里。

设置自变量:将左侧变量列表中的“x1”~“x21”变量,所有选移到

“Independent(S)”自变量栏里。

设置控制变量:本例子中不使用控制变量,所以不选择任何变量。

选择标签变量:选择“年份”为标签变量。

选择加权变量:本例子没有加权变量,所以不作任何设置。

4)回归方式

在“Method”剖析方法框中选中“Stepwise”逐渐剖析方法。该方法是依据

“Options”选择对话框中明显性检验(F)的设置,在方程中进入或剔除单个变量,直到所

建立的方程中不再含有可加入或可剔除的变量为止。设置后的对话窗口如图3-3。

4v1.0可编写可更正

图3-3

设置变量检验水平

在图6-15主对话框里单击“Options”按钮,将打开如图3-4所示的对话框。

图3-4

5v1.0可编写可更正

“SteppingMethodCriteria”框里的设置用于逐渐回归剖析的选择标准。

此中“UseprobabilityofF”选项,供给设置明显性F检验的概率。假如一个变量

的F检验概率小于或等于进入“Entry”栏里设置的值,那么这个变量将被选入回归方程中;当回归方程中变量的F值检验概率大于剔除“Removal”栏里设置的值,则该变量将从回归

方程中被剔除。所以可知,设置F检验概率时,应使进入值小于剔除值。

“UesFvalue”选项,供给设置明显性F检验的分布值。假如一个变量的F值大于

所设置的进入值(Entry),那么这个变量将被选入回归方程中;当回归方程中变量的F值

小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。同时,设置F分布值时,

应该使进入值大于剔除值。

本例子使用明显性F检验的概率,在进入“Entry”栏里设置为“”,在剔除

“Removal”栏里设置为“”(剔除的概率值应比进入的值大),如图6-17所示。

图6-17窗口中的其他设置参照一元回归设置。

6)设置输出统计量

在主对话图3-2窗口中,单击“Statistics”按钮,将打开如图6-18所示的对话框。

该对话框用于设置相关参数。此中各项的意义分别为:

6v1.0可编写可更正

图3-5“Statistics”对话框

“RegressionCoefficients”回归系数选项:“Estimates”输出回归系数和相关统计量。

“Confidenceinterval”回归系数的95%置信区间。

“Covariancematrix”回归系数的方差-协方差矩阵。

本例子选择“Estimates”输出回归系数和相关统计量。

②“Residuals”残差选项:

“Durbin-Watson”Durbin-Watson检验。

“Casewisediagnostic”输出满足选择条件的观察量的相关信息。选择该项,下边两项处于可选状态:

“Outliersoutsidestandarddeviations”选择标准化残差

的绝对值大于输入值的观察量;

“Allcases”选择所有观察量。

7v1.0可编写可更正

本例子都不选。

③其他输当选项

“Modelfit”输出相关系数、相关系数平方、调整系数、预计标准误、ANOVA表。

“Rsquaredchange”输出因为加入和剔除变量而引起的复相关系数平方

的变化。

“Descriptives”输出变量矩阵、标准差和相关系数单侧明显性水平矩

阵。

“Partandpartialcorrelation”相关系数和偏相关系数。

“Collinearitydiagnostics”显示单个变量和共线性剖析的公差。本例子选择“Modelfit”项。

7)绘图选项

在主对话框单击“Plots”按钮,将打开如图3-6所示的对话框窗口。该对话框用于设

置要绘制的图形的参数。图中的“X”和“Y”框用于选择X轴和Y轴相应的变量。

8v1.0可编写可更正

图3-6“Plots”绘图对话框窗口

左上框中各项的意义分别为:

“DEPENDNT”因变量。“ZPRED”标准化展望值。“ZRESID”标准化残差。“DRESID”删除残差。

“ADJPRED”调理展望值。“SRESID”学生氏化残差。

“SDRESID”学生氏化删除残差。

“StandardizedResidualPlots”设置各变量的标准化残差图形输出。此中共包括两个选项:

“Histogram”用直方图显示标准化残差。

“Normalprobabilityplots”比较标准化残差与正态残差的分布示

企图。

“Produceallpartialplot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。

本例子不作绘图,不选择。

保存剖析数据的选项

在主对话框里单击“Save”按钮,将打开如图3-7所示的对话框。

9v1.0可编写可更正

图3-7“Save”对话框

①“PredictedValues”展望值栏选项:

Unstandardized非标准化展望值。就会在当前数据文件中新增加一个以字符

“PRE”开头命名的变量,存放依据回

归模型拟合的展望值。

Standardized标准化展望值。

Adjusted调整后展望值。

.ofmeanpredictions展望值的标准误。

本例选中“Unstandardized”非标准化展望值。

②“Distances”距离栏选项:

10v1.0可编写可更正

Mahalanobis:距离。

Cook’s”:Cook距离。

Leveragevalues:杠杆值。

③“PredictionIntervals”展望区间选项:

Mean:区间的中心地点。

Individual:观察量上限和下限的展望区间。在当前数据文件中新添

加一个以字符“LICI_”开头命名的变量,存放

展望区间下限值;以字符“UICI_”开

头命名的变量,存放展望区间上限值。

ConfidenceInterval:置信度。

本例不选。

④“SavetoNewFile”保存为新文件:

选中“Coefficientstatistics”项将回归系数保存到指定的文件中。本例不选。

⑤“ExportmodelinformationtoXMLfile”导出统计过程中的回归模型信息到

指定文件。本例不选。

⑥“Residuals”保存残差选项:

“Unstandardized”非标准化残差。

“Standardized”标准化残差。“Studentized”学生氏化残差。11v1.0可编写可更正

“Deleted”删除残差。

“Studentizeddeleted”学生氏化删除残差。

本例不选。

⑦“InfluenceStatistics”统计量的影响。

“DfBeta(s)”删除一个特定的观察值所引起的回归系数的变化。

“StandardizedDfBeta(s)”标准化的DfBeta值。

“DiFit”删除一个特定的观察值所引起的展望值的变化。

“StandardizedDiFit”标准化的DiFit值。

“Covarianceratio”删除一个观察值后的协方差矩隈的行列式和带有所有观察值的协方差矩阵的行列式的比率。

本例子不保存任何剖析变量,不选择。

9)提交执行

在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。主要结果见表6-10

至表6-13。

结果剖析

主要结果:

12v1.0可编写可更正

表6-10是逐渐回归每一步进入或剔除回归模型中的变量状况。

表6-11是逐渐回归每一步的回归模型的统计量:R是相关系数;RSquare相关系数

的平方,又称判断系数,判断线性回归的拟合程度:用来说明用自变量解说因变量变异的程

度(所占比率);AdjustedRSquare调整后的判断系数;Std.ErroroftheEstimate估

计标准偏差。

13v1.0可编写可更正

表6-12是逐渐回归每一步的回归模型的方差剖析,F值为,明显性概率是,表示回归

极明显。

14v1.0可编写可更正

表6-13是逐渐回归每一步的回归方程系数表。剖析:

建立回归模型:

依据多元回归模型:

从6-13中看出,过程一共运转了四步,最后一步以就是表中的第4步的计算结果得知:

21个变量中只进入了4个变量x15、x4、x7和x5。

把表6-13中“非标准化回归系数”栏目中的“B”列数据代入多元回归模型获得预告

方程:

展望值的标准差可用节余标准差预计:

回归方程的明显性检验:

从表6-12方差剖析表第4模型中得知:F统计量为,系统自动检验的明显性水平为(非

常小)。

F,4,7)值为。所以回归方程相关特别特别明显。

由回归方程式能够看出,在陕西长武烟草蚜传病毒病8月份的病情指数(y)与x4(5月x(第一次蚜迁巅峰期百株烟草有翅蚜量)呈明显正相关,而与x5(3~5月份份最低气温)、15降水量)和x7(3~5月份均温)呈明显负相关。

经过大田检查结果表示,烟草蚜传病毒病发生与蚜虫的迁飞有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论