版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023/8/151回归分析
2023/8/11回归分析12023/8/152回归分析◆回归分析概述
●功能:回归分析是研究一个变量(即因变量)(或多个变量)对于一个或多个其他变量(即解释变量)的依存关系,并用数学模型加以模拟,目的在于根据已知的或在多次重复抽样中固定的解释变量之值,估计、预测因变量的总体平均值
◆涵义:一般地,把在研究回归模型时所采用的估计、计算方法,检验、分析理论统称为回归分析。回归分析方法又称因素分析方法、经济计量模型方法。属于多元统计分析方法之一。2023/8/12回归分析◆回归分析概述22023/8/153回归分析回归分析◆回归分析的研究思路和步骤
●根据研究问题的性质、要求建立回归模型。
●根据样本观测值对回归模型参数进行估计,求得回归方程。对回归方程、参数估计值进行显著性检验。并从影响因变量的自变量中判断哪些显著,哪些不显著。
●利用回归方程进行预测。2023/8/13回归分析回归分析32023/8/154回归分析
◆回归分析包括:一元回归、多元回归以及线性回归和非线性回归:一元回归:Y(因变量)取值:y1y2y3…X(自变量)取值:x1x2x3…建立一元线性回归方程:Y=BX+C(方程中的B为回归系数,C为常数)或者是非线性回归方程:Y=f(X)2023/8/14回归分析◆回归分析包括:一元回归42023/8/155回归分析回归分析
◆多元回归:Y(因变量)取值:y1y2y3…X1(自变量1)取值:x11x12x13…X2(自变量2)取值:x21x22x23…
……Xn(自变量n)取值:xn1xn2xn3…
建立多元线性回归方程:Y=B1X1+B2X2…+BnXn+B0(方程中的Bi为回归系数)或者是非线性回归方程:Y=f(X1X2…Xn)2023/8/15回归分析回归分析5在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们称这类回问题为多元回归分析。可以建立因变量y与各自变量xj(j=1,2,3,…,n)之间的多元线性回归模型:其中:b0是回归常数;bk(k=1,2,3,…,n)是回归参数;e是随机误差。在大多数的实际问题中,影响因变量的因素不是一个而是多个,我们62023/8/157回归分析线性回归分析◆执行菜单命令[Analyze][Regression][Linear]●选择因变量到:“Dependent”因变量框内●选择若干个自变量移动到:“Independent(s)”自变量框内2023/8/17回归分析线性回归分析72023/8/158回归分析线性回归分析◆回归方法●“Method”下拉菜单提供了五种回归方法供选择:强行介入法Enter正向进入Forward反向剔除Backward逐步进入Stepwise强行剔除Remove2023/8/18回归分析线性回归分析82023/8/159回归分析回归分析◆自变量纳入回归方程的方式●强行介入法Enter(一次性进入)这是一种不检验F和Tolerance,一次将全部自变量无条件地纳入回归方程。●强行剔除Remove(一次性剔除)指定某些变量不能进入方程。这种方法通常同别的方法联合使用,而不能首先或单独使用,因为第一次使用或单独使用将意味着没有哪个变量进入方程。2023/8/19回归分析回归分析92023/8/1510回归分析回归分析
◆自变量纳入回归方程的方式●逐步进入Stepwise每次选择符合进入条件的自变量进入方程,进入后立即检验,不合格者剔除,直到全部合格自变量进入方程●反向剔除Backward先强行介入,再逐个剔除不合格变量,直到全合格●正向进入Forward每次选择符合进入条件的自变量进入方程,逐个选择,逐个进入,直到全部合格自变量进入方程2023/8/110回归分析回归分析10线性回归分析中的共线性检测(一)共线性带来的主要问题高度的多重共线性会使回归系数的标准差随自变量相关性的增大而不断增大,以至使回归系数的置信区间不断增大,造成估计值精度减低.回归方程检验显著但所有偏回归系数均检验不显著偏回归系数估计值大小或符号与常识不符定性分析对因变量肯定有显著影响的因素,在多元分析中检验不显著,不能纳入方程去除一个变量,偏回归系数估计值发生巨大变化线性回归分析中的共线性检测(一)共线性带来的主要问题11线性回归分析中的共线性检测(二)共线性诊断自变量的容忍度(tolerance)和方差膨胀因子容忍度:Toli=1-Ri2.其中:Ri2是自变量xi与方程中其他自变量间的复相关系数的平方.容忍度越大则与方程中其他自变量的共线性越低,应进入方程.(具有太小容忍度的变量不应进入方程,spss会给出警告)(据经验T<0.1一般认为具有多重共线性)方差膨胀因子(VIF):容忍度的倒数SPSS在回归方程建立过程中不断计算待进入方程自变量的容忍度,并显示目前的最小容忍度线性回归分析中的共线性检测(二)共线性诊断12多重共线性的对策增大样本量(不太可能)多种自变量筛选方法结合(选择最优方程)人为去除次要变量(定性分析为较次要,或无需分析)主成分回归分析(提取因子作为影响因素)多重共线性的对策增大样本量(不太可能)13多元回归应用实例某地区病虫测报站用相关系数法选取了以下4个预报因子;x1为最多连续10天诱蛾量(头);x2为4月上、中旬百束小谷草把累计落卵量(块);x3为4月中旬降水量(毫米),x4为4月中旬雨日(天);预报粘虫幼虫发生量y(头/m2)。分级别数值列成表2-1。多元回归应用实例某地区病虫测报站用相关系数法选取了以下4个预14回归分析之理解和实例ppt课件15分析预报量y:每平方米幼虫0~10头为1级,11~20头为2级,21~40头为3级,40头以上为4级。
预报因子:x1诱蛾量0~300头为l级,301~600头为2级,601~1000头为3级,1000头以上为4级;x2卵量0~150块为1级,15l~300块为2级,301~550块为3级,550块以上为4级;x3降水量0~10.0毫米为1级,10.1~13.2毫米为2级,13.3~17.0毫米为3级,17.0毫米以上为4级;x4雨日0~2天为1级,3~4天为2级,5天为3级,6天或6天以上为4级。
分析161)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量,并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”,它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。1)准备分析数据在SPSS数据编辑窗口中,创建“年份”、“17回归分析之理解和实例ppt课件18单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项,将打开线性回归过程窗口。单击SPSS主菜单的“Analyze”下的“Regressi193)设置分析变量设置因变量:用鼠标选中左边变量列表中的“幼虫密度[y]”变量,然后点击“Dependent”栏左边的向右拉按钮,该变量就移到“Dependent”因变量显示栏里。设置自变量:将左边变量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”变量,选移到“Independent(S)”自变量显示栏里。设置控制变量:本例子中不使用控制变量,所以不选择任何变量。选择标签变量:选择“年份”为标签变量。选择加权变量:本例子没有加权变量,因此不作任何设置。3)设置分析变量204)回归方式本例子中的4个预报因子变量是经过相关系数法选取出来的,在回归分析时不做筛选。因此在“Method”框中选中“Enter”选项,建立全回归模型。4)回归方式215)设置输出统计量
单击“Statistics”按钮,将打开如图对话框。该对话框用于设置相关参数。其中各项的意义分别为:
5)设置输出统计量
单击“Statistics”按钮,将打开22①“RegressionCoefficients”回归系数选项:
“Estimates”输出回归系数和相关统计量。
“Confidenceinterval”回归系数的95%置信区间。
“Covariancematrix”回归系数的方差-协方差矩阵。本例子选择“Estimates”输出回归系数和相关统计量。①“RegressionCoefficients”回归系数23②“Residuals”残差选项:“Durbin-Watson”Durbin-Watson检验。
“Casewisediagnostic”输出满足选择条件的观测量的相关信息。选择该项,下面两项处于可选状态:
“Outliersoutsidestandarddeviations”选择标准化残差的绝对值大于输入值的观测量;
“Allcases”选择所有观测量。本例子都不选。②“Residuals”残差选项:“Durbin-Watso24③
其它输入选项“Modelfit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。
“Rsquaredchange”输出由于加入和剔除变量而引起的复相关系数平方的变化。
“Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。
“Partandpartialcorrelation”相关系数和偏相关系数。
“Collinearitydiagnostics”显示单个变量和共线性分析的公差。本例子选择“Modelfit”项。③其它输入选项“Modelfit”输出相关系数、相关系数256)绘图选项在主对话框单击“Plots”按钮,将打开如图所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X”和“Y”框用于选择X轴和Y轴相应的变量。6)绘图选项在主对话框单击“Plots”按钮,将打开如图所示26左上框中各项的意义分别为:“DEPENDNT”因变量。“ZPRED”标准化预测值。“ZRESID”标准化残差。“DRESID”删除残差。“ADJPRED”调节预测值。“SRESID”学生氏化残差。“SDRESID”学生氏化删除残差。“StandardizedResidualPlots”设置各变量的标准化残差图形输出。其中共包含两个选项:“Histogram”用直方图显示标准化残差。
“Normalprobabilityplots”比较标准化残差与正态残差的分布示意图。“Produceallpartialplot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。本例子不作绘图,不选择。左上框中各项的意义分别为:277)保存分析数据的选项在主对话框里单击“Save”按钮,将打开如图所示的对话框。7)保存分析数据的选项在主对话框里单击“Save”按钮,将28①“PredictedValues”预测值栏选项:Unstandardized非标准化预测值。就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量,存放根据回
归模型拟合的预测值。
Standardized标准化预测值。
Adjusted调整后预测值。
S.E.ofmeanpredictions预测值的标准误。本例选中“Unstandardized”非标准化预测值。②“Distances”距离栏选项:Mahalanobis:距离。
Cook’s”:Cook距离。
Leveragevalues:杠杆值。①“PredictedValues”预测值栏选项:29③“PredictionIntervals”预测区间选项:Mean:区间的中心位置。
Individual:观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符“LICI_”开头命名的变量,存放
预测区间下限值;以字符“UICI_”开头命名的变量,存放预测区间上限值。
ConfidenceInterval:置信度。本例不选。④“SavetoNewFile”保存为新文件:选中“Coefficientstatistics”项将回归系数保存到指定的文件中。本例不选。⑤“ExportmodelinformationtoXMLfile”
导出统计过程中的回归模型信息到指定文件。本例不选。③“PredictionIntervals”预测区间选项:30⑥“Residuals”保存残差选项:“Unstandardized”非标准化残差。
“Standardized”标准化残差。
“Studentized”学生氏化残差。
“Deleted”删除残差。
“Studentizeddeleted”学生氏化删除残差。本例不选。⑦“InfluenceStatistics”统计量的影响。“DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。
“StandardizedDfBeta(s)”标准化的DfBeta值。
“DiFit”删除一个特定的观测值所引起的预测值的变化。
“StandardizedDiFit”标准化的DiFit值。
“Covarianceratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。本例子不保存任何分析变量,不选择。⑥“Residuals”保存残差选项:318)其它选项
在主对话框里单击“Options”按钮,将打开如图所示的对话框。
8)其它选项
在主对话框里单击“Options”按钮,将打开32①“SteppingMethodCriteria”
框用于进行逐步回归时内部数值的设定。其中各项为:“Useproba
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生会新学期个人工作计划
- 幼儿园教学计划模板
- 2024年乡畜牧兽医站春防工作的计划
- 物理学科教研工作计划
- 2024-2024学年第二学期班务计划
- 湖南省邵阳市隆回县2024-2025学年高一数学上学期期末考试试卷
- 统考版2025届高考地理二轮专项分层特训卷第一篇微考点增分专练微考点42湿地
- 上半年继续教育办公室工作计划
- 2024新学期班主任工作计划范文
- 老高考旧教材适用2025版高考地理二轮复习专题6人口与城市核心考点练2人口迁移及其影响
- 中建主墩筑岛围堰专项施工方案
- 居家护理压力性损伤防控制度
- 上门延伸医疗护理服务
- 老年营养示范化病房创建方案
- 第七单元 课题1 燃料的燃烧(第一课时)九年级化学上册课件(人教版2024)
- 2024年物业管理师(中级四级)考试题库大全-下(判断、简答题)
- 《一桥飞架连天堑》课件 2024-2025学年岭南美版 (2024)初中美术七年级上册
- 学校食堂供货商合同的退出机制
- GB/T 6974.3-2024起重机术语第3部分:塔式起重机
- 期末检测卷(试题)-2024-2025学年北师大版五年级上册数学
- 当代国际政治与经济 期末复习课件高中政治统编版选择性必修一
评论
0/150
提交评论