回归分析ppt课件_第1页
回归分析ppt课件_第2页
回归分析ppt课件_第3页
回归分析ppt课件_第4页
回归分析ppt课件_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 第9章 回归分析 回归分析侧重于分析变量之间的数量变化规律,并通过回归 方程描述和反映这种关系,帮助人们准确把握因变量受一个 或多个自变量影响的程度,进而进行预测。 回归分析的一般步骤: 1、确定回归方程的因变量(被解释变量)和自变量(解释变量 ); 2、确定回归模型,通常利用散点图; 3、建立回归方程,估计参数; 4、对回归方程进行检验,主要有:模型检验,参数检验等; 5、利用回归方程进行预测。 按线性相关与否:线性回归分析和非线性回归分析; 按自变量的多少:一元回归分析和多元回归分析。 2 在 SPSS 中 , 实现回归分析的功能在 :AnalyzeRegression Regression 命令菜单有如下九个过程。 Linear: 线性回归分析 ; Curve Estimation: 曲线估计分析 ; Binary logistic : 二维逻辑分析 ; Multinormal logistic 多维逻辑分析 ; Ordinal 顺序分析 ; Probit 概率分析 ; Nonlinear: 非线性回归分析 ; Weight Estimation 加权估计分析 ; 2-Stage Least Squares : 两阶最小二乘分析。 3 9.1 Linear 线性回归分析 其中0为回归常数,其中 1,n 为回归系数 ,为随机误差。 基本要求:自变量和因变量都为数值型,且线 性相关程度较高。随机误差要求无自相关 性, y服从正态分布 。 4 【设置界面】 因变量,一个 自变量, 可多个 自变量筛选法 条件筛选法 散点图标 志变量 异方差时,对选入变量用加权 最小二乘法估计模型参数 5 【statistics按钮】 回归系数相关量 95%置信区间 回归系数协方差阵 拟合优度相关量 多重共线性分析 自变量进入回归方 程引起R变化量 自相关的DW 检验,即检 验H0:=0 异常值分析 6 【plots按钮】通过图形用于对残差序列进行分析 因变量 标准化预测值 标准化残差 剔除残差 调整的预测值 学生化残差 剔除学生化残差 绘制散点图坐标 依次绘制因变量与各 自变量的散点图 7 8 9 【结果形式】 可决系数-自变量可解释 因变量的比例 模型的方差分析 H0: b1=bn=0 10 模型中常数项与回归系数的检验 回归方程为time=-1.955+3.457diam H0:a=0 H0:bi=0 11 【实例】为研究某公司职工当前工资水平(salary), 收集了影响因素6个,即开始工资(salbegin $)、受 教育时间(educ)、来公司工作时间(jobtime)、工 种(jobcat)、来前工作经验(prevexp)及是否少数 民族(minority),试用多元线性回归对该公司当前工 资水平建立恰当回归模型。 【数据准备】见下页 12 13 6个影响因素变量 自变量逐步筛选 【设置界面】 14 【statistics按钮】 15 【Save按钮】 16 【结果形式】 先后选入自变量, minority未选入 剔除变量 17 复相关系数,随自变量的加入而增大,较大,线性相关高 可决系数 D-W统计量值:在1.52.5 间无显著自相关性 18 随自变量的加入,线性 模型都有显著效果 H0:b1=b5=0 H0:b1=b2=b3=0 19 随自变量的加入,因变量与 自变量都显著线性相关 H0:a=0,bi=0 (j=1,.,5) 标准化回归系数(无量纲),用 于比较各变量重要程度大小 20 可见,第5个回归方程为 salary=-15038.574+1.365salbegin+5859.585jobcat- 19.553prevexp+154.698jobtime+539.642educ 复相关系数R=0.917,可决系数R2=0.84,经检验,回 归模型、回归系数及D-W检验都有显著统计学意义。 对工资水平影响较大的因素依次为 开始工资、工种、来前工作经验、来公司工作时间、受教 育时间。 21 9.2 Curve Estimation: 曲线估计分析 曲线回归(估计、拟合):选定一种用函数表达曲线 ,使理论数据与实际数据间的差异尽可能小。 解决问题:(1)曲线模型的选择;(2)模型参数的确定。 基本思路:通过散点图及专业、经验等确定函数类型 ,再利用SPSS解决。 可以经变量变换转化为线性关系, SPSS中Curve Estimation解决。 不能经变换转化为线性关系,用迭代或分段平 均值等方法处理, SPSS中Nonlinear解决 22 Curve Estimation中提供了11种本质线性模型: 23 【实例】某产品零售商已知产品的广告投入和销售 额的数据,试找出适当的回归方程。 【作散点图预分析】 Graphs-scatter/dot 重叠散点图,用 于多对变量 三维散点图,用于 三个相关变量 简单散点图,用 于一对变量 矩阵散点图,用 于多对变量 单点散点图,用 于单个变量 24 设置散点标识 ,颜色 设置散点标签 设置栅格,行 列分类分组 【散点图设置】 25 可见,不是非常明确,可以近似拟合直线、二 次曲线及三次曲线。 【注意】若不能明确判定函数类型时,可选几种可能 曲线,再利用SPSS的结果分析、判定。 26 【设置界面】 若选用time,则因变量数据作 为时间均匀的时间序列 27 【结果形式】 由表中可决系数R2 可见,二次或三次曲线拟合较好 ,且模型检验也有统计学意义。 二次曲线方程:sales=3.903+2.854advert-0.245advert2 三次曲线方程: sales=3.283+3.471advert-0.422advert2+0.015advert3 28 拟合曲线: 29 9.3 Nonlinear: 非线性回归分析 该种模型不能经变换转化为线性模型,用迭 代或分段平均值等方法处理。 基本要求:自变量和因变量都为数值型。 非线性回归分析的关键 :(1)曲线模型的选择及 参数确定;(2)迭代算法的初始值。 30 Nonlinear中提供了19种非本质线性模型: 31 【设置界面】选定的函数表达式(19种之1 ) 模型中参数初始值 的设定 设置目标损失函数, 使其最小化 设置参数约束条件 32 【parameter按钮 】 【option按钮】 迭代方法: 连续二次规划法 阻尼最小二乘法(默认 ) 33 设置参数约束条件 【constraint按钮 】 34 【结果形式】 迭代过程表 经15次迭代,相邻两次迭代残差平方和几乎 为0,即得到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论