版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、回归分析变变量量间间的的关关系系确定性关系或函数关系y =f (x)人的身高和体重人的身高和体重家庭的收入和消费家庭的收入和消费商品的广告费和销售额商品的广告费和销售额粮食的施肥量和产量粮食的施肥量和产量非确定性关系().xY相关关系第一章第一章 一元线性回归模型一元线性回归模型 以下设 x 为自变量(普通变量普通变量) Y 为因变量(随机变随机变量量) .现给定 x 的 n 个值 x1, xn, 观察 Y 得到相应的 n 个值 y1,yn, (xi ,yi) i=1,2, n 称为样本点样本点. 以以 (xi ,yi) 为坐标在平面直角坐标系中描点,所得到的这张图便称之为散点图散点图.北京市
2、城市居民家庭生活抽样调查图表0 02 24 46 68 810100 02 24 46 68 810101212 14141616 1818x:人均生活费收入Y:人均食品支出1.1 1.1 模型的建立及其假定条件模型的建立及其假定条件例如:研究某市可支配收入例如:研究某市可支配收入X对人均消费支出对人均消费支出Y 的影响。建立如下的影响。建立如下理论回归模型理论回归模型: Yi = 0 + 1 Xi + i其中:其中: Yi被解释变量;被解释变量; Xi解释变量;解释变量; I 随机误差项;随机误差项; 0, 1回归系数回归系数随机变量随机变量 i包含:包含: 回归模型中省略的变量回归模型中省
3、略的变量; 确定数学模型的误差;确定数学模型的误差; 测量误差测量误差 一、一元线性回归模型一、一元线性回归模型 XY8010012014016018020022024026055657980102110120135137150607084931071151361371451526574909511012014014015517570809410311613014415216517875859810811813514515717518088113125140160189185115162191户数户数5657665765总支出总支出3254624457076787506851043966121
4、1 假设调查了某社区所有居民,他们的人均可支假设调查了某社区所有居民,他们的人均可支配收入和消费支出数据如下:配收入和消费支出数据如下:YX55100 120140 16080 描出散点图发现:随着收入的增加,消费描出散点图发现:随着收入的增加,消费“平均地说平均地说”也在增加,且也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线总体回归线。二、随机误差项二、随机误差项i i的假定条件的假定条件为了估计总体回归模型中的参数,需对随机误差项作出如下假定:为了估计总体回归模型中的参数,需对随机误差项作出如下假定:假定假定1:零期
5、望假定零期望假定:E(i) = 0。假定假定2:同方差性假定同方差性假定:Var(i) = 2。假定假定4: i 服从正态分布服从正态分布,即即i N (0, 2 )。假定假定3:无序列相关假定无序列相关假定:Cov(i, j) = 0, (i j )。前三个条件称为前三个条件称为G-M条件条件1.2 1.2 一元线性回归模型的参数估计一元线性回归模型的参数估计普通最小二乘法(普通最小二乘法(Ordinary Least SquaresOrdinary Least Squares)OLSOLS回归直线的性质回归直线的性质OLSEOLSE的性质的性质一、普通最小二乘法一、普通最小二乘法对于所研究
6、的问题,通常真实的回归直线对于所研究的问题,通常真实的回归直线 E(Yi|Xi) = 0 + 1Xi 是观是观测不到的。可以通过收集样本来对真实的回归直线做出估计。测不到的。可以通过收集样本来对真实的回归直线做出估计。 经验回归直线:经验回归直线: iiXY10其中:其中: 为为Yi的估计值(拟合值);的估计值(拟合值);iY10,为为 0 , 1 的估计值;的估计值;如果观测值到这条直线的纵向距离(真实值与估计值的偏差)用如果观测值到这条直线的纵向距离(真实值与估计值的偏差)用ei表示(称为残差),则表示(称为残差),则经验回归模型经验回归模型为:为: iiieXY10(ei为为i的估计值)
7、的估计值)注意:分清注意:分清4个式子的关系个式子的关系 (4)经验(估计的)回归直线:)经验(估计的)回归直线:(1)理论(真实的)回归模型:)理论(真实的)回归模型: (3)经验(估计的)回归模型:)经验(估计的)回归模型: (2)理论(真实的)回归直线:)理论(真实的)回归直线: 01iiiYXiiX)X|Y(E10iiieXY10iiXY10对于参数的估计采用最小二乘估计法、最小二乘法的原则是以对于参数的估计采用最小二乘估计法、最小二乘法的原则是以“残差平方和最小残差平方和最小” 确定直线位置(即估计参数)。(确定直线位置(即估计参数)。(Q为残差平方为残差平方和)和)Q = niie
8、12niiiYY12)(=niii)XY(1210则通过则通过Q最小确定这条直线,即确定最小确定这条直线,即确定 ,以,以 为变量,为变量,把它们看作是把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求的函数,就变成了一个求极值的问题,可以通过求导数得到。导数得到。10,10,求求QQ对对 两个待估参数两个待估参数 的偏导数:的偏导数:0Q= ) 1( )(2110niiiXY= 01Q= )( )(2110iniiiXXY= 0正规方程组正规方程组00iiiXee即即12()()()iiiXX YYXXXY10根据以上两个偏导方程得以下正规方程正规方程(Normal equation
9、) :iiXnY10210iiiiXXXY, XYXY其中和 分别为 、 的均值011xyxxYXLL若记21()nxxiiLXX21()nyyiiLYY1() ()nxyiiiLXXYY则 二、二、OLS回归直线的性质回归直线的性质(1)估计的回归直线)估计的回归直线 过点过点 .iiXY10),(YX (3) Yi 的拟合值的平均数等于其样本观测值的平均数的拟合值的平均数等于其样本观测值的平均数 . YY niiXn110)(111niiYYn= X10= Y= 00iiiXee(2)统计性质统计性质l 线性线性l 无偏性无偏性l 有效性有效性 2 2 的估计的估计三、三、OLSE回归直线
10、的性质回归直线的性质1 1、线性、线性10,这里指这里指 都是都是Yi的线性函数。的线性函数。证明:证明:1= 2()()()iiiXXYYXX= 2()()()iiiiXX Y YXXXX2()()iiiXX YXX令令22()()iiiiiXXxkXXx代入上式,得:代入上式,得:iiYk1同理可证:同理可证: 0也具有线性特性也具有线性特性 。= 2、无偏性、无偏性 证明:证明:)(1E = = =)(iiYkE01 (iiiEkX01iiiiiEkk Xk=)( )(1iiiiukEXXkE=)(1iiuEk=122(-)(-)iiiiiXXxkXXx0()E0类似可证3、有效性、有效
11、性 0 , 1 的的OLS估计量的方差比其他线性无偏估计量的方差都小。估计量的方差比其他线性无偏估计量的方差都小。2221()ixxVarkL221()xxXnL0()Var总体(随机误差项)真实方差总体(随机误差项)真实方差 2的无偏估计量:的无偏估计量:201( )()( )iiiiVar YVarXVar三、三、 2 的估计的估计22222iienn1.3 1.3 回归方程的显著性检验回归方程的显著性检验一、回归参数的显著性检验(一、回归参数的显著性检验(t t 检验检验) 首先,提出原假设和备择假设:首先,提出原假设和备择假设: H0: 01H1: 01其次,确定并计算统计量:其次,确
12、定并计算统计量: 111St1xxL如果如果 不能拒绝不能拒绝H0: ,认为,认为X X对对Y Y没有显著影响。没有显著影响。 01)2(2/ntt如果如果 拒绝拒绝H0 : ,认为,认为X X对对Y Y有显著影响。有显著影响。 )2(2/ntt同理同理, ,可对可对 进行显著性检验。进行显著性检验。 001二、回归方程的显著性检验(二、回归方程的显著性检验(F F检验检验) 222()()()iiiiYYYYYY 总离差平方和总离差平方和 回归平方和回归平方和 残差平方和残差平方和SST = SSR + SSESST = SSR + SSE/1(1,2)/(2)SSRFFnSSEnH0: 0
13、1H1: 01拒绝域F F F F (1,n-2)三、三、 用样本可决系数检验回归方程的拟合优度用样本可决系数检验回归方程的拟合优度 R2 = SSRSSTR2 2=0=0时时 表明解释变量表明解释变量X X与被解释变量与被解释变量Y Y之间不存在线性关系;之间不存在线性关系;R2 2=1=1时时 表明样本回归线与样本值重合,这种情况极少发生;表明样本回归线与样本值重合,这种情况极少发生;一般情况下,一般情况下,R2 2越接近越接近1 1表示拟合程度越好,表示拟合程度越好,X X对对Y Y的解释能力越强。的解释能力越强。四四. 相关系数检验法相关系数检验法1. 提出原假设2. 选择统计量3.
14、对给定的显著性水平, 查临界值 r (n-2), 得否定域为 |R R | r (n-2);yyxxxylllR 011.41.4 回归系数估计值的置信区间回归系数估计值的置信区间 -t /2 (n-2) 0 t /2 (n-2) 由于:由于:111s由大括号内不等式表示的由大括号内不等式表示的 1 1的的1-的的置信区间为:置信区间为:1)2()2(2/112/111ntSntSP得:得:1/21/2(2),(2)xxxxtntnLLP t /2 (n-2) = 1- 同理同理, ,可,并求得可,并求得 的置信区间为:的置信区间为: 0220/20/211(2),(2)xxxxXXtntnn
15、LnL1. 5 1. 5 一元线性回归方程的预测和控制一元线性回归方程的预测和控制 点预测点预测Yi区间预测区间预测 (1)单个值单个值Yi的区间预测的区间预测 (2)均值均值E(Yi)的区间预测的区间预测控制控制如果经过检验,样本回归方程的拟合优度好,且回归系数的估计值显如果经过检验,样本回归方程的拟合优度好,且回归系数的估计值显著不为著不为0,则可以用回归方程进行预测和控制。,则可以用回归方程进行预测和控制。1 1、点预测、点预测 假设假设X0为解释变量的一个已知点,则带入样本回归方程为解释变量的一个已知点,则带入样本回归方程即可得到即可得到Y Y0 0的估计值的估计值: :itXY100100XY2 2、区间预测、区间预测 估计值估计值 是一个点预测值,它可以是(是一个点预测值,它可以是(1 1)总体真值)总体真值Y0的预测值;的预测值;也可以是(也可以是(2)总体回归线)总体回归线E(Y 0 )的预测值。现在根据的预测值。现在根据 来对(来对(1)(2)进行区间预测。)进行区间预测。 0Y0Y(1)Y0的预测区间的预测区间 00
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中考物理复习主题单元10第24课时电路识别、连接与设计课件
- 第三章第二节节分子和原子(教案)
- 洛阳市城乡居民基本医疗保险
- 电力行业运维队伍管理办法
- 环保企业法定代表人聘用协议
- 农村公路建设施工安全规范
- 生态环境治理招投标资料清单
- 家庭舞蹈室施工协议
- 企业内部口腔科护士招聘合同
- KTV服务员录用协议书
- 部编版五年级上册《我的长生果》公开课一等奖优秀课件
- 人民调解培训课件(共32张PPT)
- 小学部编版五年级语文上册教案(全)
- 绿化养护报价表
- 《工业革命与工厂制度》
- 课程领导力-资料教学课件
- 老人租房免责协议书
- 特灵中央空调机组RTHD详细介绍
- 2023人民教育出版社在职人员招聘笔试模拟试题及答案解析
- 大学生心理健康教育论文范文3000字(8篇)
- 消费者心理学PPT完整全套教学课件
评论
0/150
提交评论