基础多元回归分析_第1页
基础多元回归分析_第2页
基础多元回归分析_第3页
基础多元回归分析_第4页
基础多元回归分析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基础多元回归分析第1页,课件共32页,创作于2023年2月多元线性回归模型第2页,课件共32页,创作于2023年2月多元线性回归模型

(概念要点)一个因变量与两个及两个以上自变量之间的回归描述因变量y如何依赖于自变量x1

,x2

,…,

xp

和误差项

的方程称为多元线性回归模型涉及p个自变量的多元线性回归模型可表示为

b0

,b1,b2

,,bp是参数

是被称为误差项的随机变量

y是x1,,x2

,,xp

的线性函数加上误差项

说明了包含在y里面但不能被p个自变量的线性关系所解释的变异性第3页,课件共32页,创作于2023年2月多元线性回归模型

(概念要点)对于n组实际观察数据(yi;xi1,,xi2

,,xip),(i=1,2,…,n),多元线性回归模型可表示为y1

=b0+b1x11+b2x12

++

bpx1p

+e1y2=b0+b1x21

+b2x22

++

bpx2p

+e2

yn=b0+b1xn1

+b2xn2

++

bpxnp

+en{……第4页,课件共32页,创作于2023年2月多元线性回归模型

(基本假定)自变量x1,x2,…,xp是确定性变量,不是随机变量随机误差项ε的期望值为0,且方差σ2都相同误差项ε是一个服从正态分布的随机变量,即ε~N(0,σ2),且相互独立第5页,课件共32页,创作于2023年2月多元线性回归方程

(概念要点)描述y的平均值或期望值如何依赖于x1,x1

,…,xp的方程称为多元线性回归方程多元线性回归方程的形式为

E(y)=0+1x1

+2x2

+…+

pxp

b1,b2,,bp称为偏回归系数

bi

表示假定其他变量不变,当xi

每变动一个单位时,y的平均平均变动值第6页,课件共32页,创作于2023年2月多元线性回归方方程的直观解释二元线性回归模型(观察到的y)回归面0ix1yx2(x1,x2)}第7页,课件共32页,创作于2023年2月多元线性回归的估计(经验)方程总体回归参数是未知的,利用样本数据去估计用样本统计量代替回归方程中的未知参数

即得到估计的回归方程是估计值是y

的估计值第8页,课件共32页,创作于2023年2月参数的最小二乘估计第9页,课件共32页,创作于2023年2月参数的最小二乘法

(要点)根据最小二乘法的要求,可得求解各回归参数的标准方程如下使因变量的观察值与估计值之间的离差平方和达到最小来求得

。即第10页,课件共32页,创作于2023年2月回归方程的显著性检验第11页,课件共32页,创作于2023年2月多重样本决定系数

(多重判定系数R2

)回归平方和占总离差平方和的比例反映回归直线的拟合程度取值范围在[0,1]之间

R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差等于多重相关系数的平方,即R2=(R)2第12页,课件共32页,创作于2023年2月修正的多重样本决定系数

(修正的多重判定系数R2

)由于增加自变量将影响到因变量中被估计的回归方程所解释的变异性的数量,为避免高估这一影响,需要用自变量的数目去修正R2的值用n表示观察值的数目,p表示自变量的数目,修正的多元判定系数的计算公式可表示为第13页,课件共32页,创作于2023年2月回归方程的显著性检验

(线性关系的检验

)检验因变量与所有的自变量和之间的是否存在一个显著的线性关系,也被称为总体的显著性检验检验方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著如果是显著的,因变量与自变量之间存在线性关系如果不显著,因变量与自变量之间不存在线性关系第14页,课件共32页,创作于2023年2月回归方程的显著性检验

(步骤)提出假设H0:12p=0线性关系不显著H1:1,2,,p至少有一个不等于02.计算检验统计量F3.确定显著性水平和分子自由度p、分母自由度n-p-1找出临界值F4.作出决策:若FF,拒绝H0;若F<F,接受H0第15页,课件共32页,创作于2023年2月回归系数的显著性检验

(要点)如果F检验已经表明了回归模型总体上是显著的,那么回归系数的检验就是用来确定每一个单个的自变量xi

对因变量y的影响是否显著对每一个自变量都要单独进行检验应用t

检验在多元线性回归中,回归方程的显著性检验不再等价于回归系数的显著性检验第16页,课件共32页,创作于2023年2月回归系数的显著性检验

(步骤)提出假设H0:bi=0(自变量xi与

因变量y没有线性关系)H1:bi

0(自变量xi与

因变量y有线性关系)计算检验的统计量t确定显著性水平,并进行决策tt,拒绝H0;t<t,接受H0第17页,课件共32页,创作于2023年2月一个二元线性回归的例子销售额、人口数和年人均收入数据地区编号销售额(万元)y人口数(万人)x1年人均收入(元)x21234567891033.335.527.630.431.953.135.629.035.134.532.429.126.331.229.240.729.823.028.226.91250165014501310131015801490152016201570【例】一家百货公司在10个地区设有经销分公司。公司认为商品销售额与该地区的人口数和年人均收入有关,并希望建立它们之间的数量关系式,以预测销售额。有关数据如下表。试确定销售额对人口数和年人均收入的线性回归方程,并分析回归方程的拟合程度,对线性关系和回归系数进行显著性检验(=0.05)。第18页,课件共32页,创作于2023年2月一个二元线性回归的例子

(Excel输出的结果)第19页,课件共32页,创作于2023年2月一个二元线性回归的例子

(计算机输出结果解释)销售额与人口数和年人均收入的二元回归方程为多重判定系数R2=0.9373;调整后的R2=0.9194

回归方程的显著性检验F=52.3498F>F0.05(2,7)=4.74,回归方程显著回归系数的显著性检验t=9.3548>t=0.3646,;t2=4.7962>t=2.3646;两个回归系数均显著一个含有四个变量的回归第20页,课件共32页,创作于2023年2月第三节可化为线性回归的

曲线回归基本概念非线性模型及其线性化方法第21页,课件共32页,创作于2023年2月非线性回归1. 因变量y与x之间不是线性关系2. 可通过变量代换转换成线性关系用最小二乘法求出参数的估计值并非所有的非线性模型都可以化为线性模型第22页,课件共32页,创作于2023年2月几种常见的非线性模型指数函数线性化方法两端取对数得:lny

=ln+x令:y'=lny,则有y'

=ln+x基本形式:图像第23页,课件共32页,创作于2023年2月几种常见的非线性模型幂函数线性化方法两端取对数得:lgy=lg+lgx令:y'=lgy,x'=lgx,则y'

=lg+x'基本形式:图像0<<11=1-1<<0<-1=-1第24页,课件共32页,创作于2023年2月几种常见的非线性模型双曲线函数线性化方法令:y'=1/y,x'=1/x,则有y'

=+x'基本形式:图像<0>0第25页,课件共32页,创作于2023年2月几种常见的非线性模型对数函数线性化方法x'=lgx,则有y'

=+x'基本形式:图像0<0第26页,课件共32页,创作于2023年2月几种常见的非线性模型S型曲线线性化方法令:y'=1/y,x'=e-x,则有y'

=+x'基本形式:图像第27页,课件共32页,创作于2023年2月非线性回归

(实例)

【例】为研究生产率与废品率之间的关系,记录数据如下表。试拟合适当的模型。废品率与生产率的关系生产率(周/单位)x1000200030003500400045005000废品率(%)y5.26.56.88.110.210.313.0第28页,课件共32页,创作于2023年2月非线性回归

(实例)生产率与废品率的散点图第29页,课件共32页,创作于2023年2月非线性回归

(实例)用线性模型:y

=01x+,有

y=2.671+0.0018x用指数模型:y=x

,有

y

=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论