SPSS多元回归分析实例_第1页
SPSS多元回归分析实例_第2页
SPSS多元回归分析实例_第3页
SPSS多元回归分析实例_第4页
SPSS多元回归分析实例_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多元回归分析在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。可以建立因变量y与各自变量xj(j=1,2,3,n)之间的多元线性回归模型:其中:b0是回归常数;bk(k=1,2,3,n)是回归参数;e是随机误差。多元回归在病虫预报中的应用实例:某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报一代粘虫幼虫发生量y(头/m2)。分级别数值列成表2-1。 预报量y:每平方米幼虫010头为1级,1120头为2级,2140

2、头为3级,40头以上为4级。 预报因子:x1诱蛾量0300头为l级,301600头为2级,6011000头为3级,1000头以上为4级;x2卵量0150块为1级,15l300块为2级,301550块为3级,550块以上为4级;x3降水量010.0毫米为1级,10.113.2毫米为2级,13.317.0毫米为3级,17.0毫米以上为4级;x4雨日02天为1级,34天为2级,5天为3级,6天或6天以上为4级。 表2-1 x1 x2 x3 x4 y年 蛾量 级别 卵量 级别 降水量 级别 雨日 级别 幼虫密度 级别 19601022411214.31211011961300144030.111141

3、196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112数据保存在“DAT

4、A6-5.SAV”文件中。1)准备分析数据 在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”,它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。编辑后的数据显示如图2-1。图2-1或者打开已存在的数据文件“DATA6-5.SAV”。2)启动线性回归过程单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开如图2-2所示的线性回归过程窗口。图2-2 线性回归对话窗口3) 设置分析变量设置因

5、变量:用鼠标选中左边变量列表中的“幼虫密度y”变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就移到“Dependent”因变量显示栏里。设置自变量:将左边变量列表中的“蛾量x1”、“卵量x2”、“降水量x3”、“雨日x4”变量,选移到“Independent(S)”自变量显示栏里。 设置控制变量: 本例子中不使用控制变量,所以不选择任何变量。选择标签变量: 选择“年份”为标签变量。选择加权变量: 本例子没有加权变量,因此不作任何设置。4)回归方式本例子中的4个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选。因此在“Method”框中选中“Enter”选项,建立全回

6、归模型。 5)设置输出统计量单击“Statistics”按钮,将打开如图2-3所示的对话框。该对话框用于设置相关参数。其中各项的意义分别为:图2-3 “Statistics”对话框“Regression Coefficients”回归系数选项:“Estimates”输出回归系数和相关统计量。“Confidence interval”回归系数的95%置信区间。“Covariance matrix”回归系数的方差-协方差矩阵。本例子选择“Estimates”输出回归系数和相关统计量。“Residuals”残差选项:“Durbin-Watson”Durbin-Watson检验。“Casewise d

7、iagnostic”输出满足选择条件的观测量的相关信息。选择该项,下面两项处于可选状态:“Outliers outside standard deviations”选择标准化残差的绝对值大于输入值的观测量;“All cases”选择所有观测量。本例子都不选。 其它输入选项“Model fit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。“R squared change”输出由于加入和剔除变量而引起的复相关系数平方的变化。“Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。“Part and partial correlation”相关系数和偏相关

8、系数。“Collinearity diagnostics”显示单个变量和共线性分析的公差。本例子选择“Model fit”项。 6)绘图选项在主对话框单击“Plots”按钮,将打开如图2-4所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X”和“Y”框用于选择X轴和Y轴相应的变量。图2-4“Plots”绘图对话框窗口左上框中各项的意义分别为:· “DEPENDNT”因变量。 · “ZPRED”标准化预测值。 · “ZRESID”标准化残差。 · “DRESID”删除残差。 · “ADJPRED”调节预测值。 · “SRE

9、SID”学生氏化残差。 · “SDRESID”学生氏化删除残差。 “Standardized Residual Plots”设置各变量的标准化残差图形输出。其中共包含两个选项:“Histogram”用直方图显示标准化残差。“Normal probability plots”比较标准化残差与正态残差的分布示意图。“Produce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。本例子不作绘图,不选择。7) 保存分析数据的选项在主对话框里单击“Save”按钮,将打开如图2-5所示的对话框。图2-5 “Save”对话框“Predicted Valu

10、es”预测值栏选项:Unstandardized 非标准化预测值。就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量,存放根据回归模型拟合的预测值。Standardized 标准化预测值。Adjusted 调整后预测值。S.E. of mean predictions 预测值的标准误。本例选中“Unstandardized”非标准化预测值。 “Distances”距离栏选项:Mahalanobis: 距离。Cooks”: Cook距离。Leverage values: 杠杆值。“Prediction Intervals”预测区间选项:Mean: 区间的中心位置。Individual

11、: 观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符“LICI_”开头命名的变量,存放预测区间下限值;以字符“UICI_”开头命名的变量,存放预测区间上限值。Confidence Interval:置信度。本例不选。“Save to New File”保存为新文件:选中“Coefficient statistics”项将回归系数保存到指定的文件中。本例不选。 “Export model information to XML file” 导出统计过程中的回归模型信息到指定文件。本例不选。“Residuals” 保存残差选项:“Unstandardized”非标准化残差。“Standa

12、rdized”标准化残差。“Studentized”学生氏化残差。“Deleted”删除残差。“Studentized deleted”学生氏化删除残差。本例不选。“Influence Statistics” 统计量的影响。“DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。“Standardized DfBeta(s)”标准化的DfBeta值。“DiFit” 删除一个特定的观测值所引起的预测值的变化。“Standardized DiFit”标准化的DiFit值。“Covariance ratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。本

13、例子不保存任何分析变量,不选择。8)其它选项在主对话框里单击“Options”按钮,将打开如图2-6所示的对话框。图2-6 “Options”设置对话框“Stepping Method Criteria”框用于进行逐步回归时内部数值的设定。其中各项为:“Use probability of F”如果一个变量的F值的概率小于所设置的进入值(Entry),那么这个变量将被选入回归方程中;当变量的F值的概率大于设置的剔除值(Removal),则该变量将从回归方程中被剔除。由此可见,设置“Use probability of F”时,应使进入值小于剔除值。“Ues F value”如果一个变量的F值大

14、于所设置的进入值(Entry),那么这个变量将被选入回归方程中;当变量的F值小于设置的剔除值(Removal),则该变量将从回归方程中被剔除。同时,设置“Use F value”时,应使进入值大于剔除值。本例是全回归不设置。“Include constant in equation”选择此项表示在回归方程中有常数项。本例选中“Include constant in equation”选项在回归方程中保留常数项。“Missing Values”框用于设置对缺失值的处理方法。其中各项为:“Exclude cases listwise”剔除所有含有缺失值的观测值。“Exchude cases pai

15、rwise”仅剔除参与统计分析计算的变量中含有缺失值的观测量。“Replace with mean”用变量的均值取代缺失值。本例选中“Exclude cases listwise”。9)提交执行在主对话框里单击“OK”,提交执行,结果将显示在输出窗口中。主要结果见表2-2至表2-4。10) 结果分析 主要结果:表2-2表2-2 是回归模型统计量:R 是相关系数;R Square 相关系数的平方,又称判定系数,判定线性回归的拟合程度:用来说明用自变量解释因变量变异的程度(所占比例);Adjusted R Square 调整后的判定系数;Std. Error of the Estimate 估计标

16、准误差。表2-3表2-3 回归模型的方差分析表,F值为10.930,显著性概率是0.001,表明回归极显著。表2-4分析:建立回归模型:根据多元回归模型:把表6-9中“非标准化回归系数”栏目中的“B”列系数代入上式得预报方程:预测值的标准差可用剩余均方估计:回归方程的显著性检验:从表6-8方差分析表中得知:F统计量为10.93,系统自动检验的显著性水平为0.001。F(0.05,4,11)值为3.36,F(0.01,4,11) 值为5.67,F(0.001,4,11) 值为10.35。因此回归方程相关非常显著。(F值可在Excel中用FINV( )函数获得)。回代检验需要作预报效果的验证时,在主对话框(图6-8)里单击“Save”按钮,在打开如图3-6所示对话框里,选中“Predicted Values”预测值选项栏中的“Unstandardized”非标准化预测值选项。这样在过程运算时,就会在当前文件中新添加一个“PRE_1”命名的变量,该变量存放根据回归模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论