第8章相关与回归分析(新)_第1页
第8章相关与回归分析(新)_第2页
第8章相关与回归分析(新)_第3页
第8章相关与回归分析(新)_第4页
第8章相关与回归分析(新)_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 据世界卫生组织统计,全球肥胖症患者达据世界卫生组织统计,全球肥胖症患者达3 3亿人,亿人,其中儿童占其中儿童占22002200万人,万人,1111亿人体重过重。肥胖症和体重亿人体重过重。肥胖症和体重超常早已不是发达国家的超常早已不是发达国家的“专利专利”,已遍及五大洲。目,已遍及五大洲。目前,全球因前,全球因”吃吃”致病乃至死亡的人数已高于因饥饿死致病乃至死亡的人数已高于因饥饿死亡的人数。亡的人数。 (引自引自光明日报光明日报刘军刘军/文)文)问题问题: : 肥胖症和体重超常与死亡人数真有显著的数量关肥胖症和体重超常与死亡人数真有显著的数量关系吗系吗? ?这些类型的问题可以运用相关分析与回归

2、分析的方法去这些类型的问题可以运用相关分析与回归分析的方法去解决。解决。实例实例2:2:全球吃死的人比饿死的人多全球吃死的人比饿死的人多? ?一、变量间的相互关系一、变量间的相互关系二、相关关系的类型二、相关关系的类型三、简单线性相关系数及其检验三、简单线性相关系数及其检验 不良贷款与贷款余额的散点图不良贷款与贷款余额的散点图024681012140100200300400贷款余额不良贷款 不良贷款与累计应收贷款不良贷款与累计应收贷款的散点图的散点图02468101214051015202530累计应收贷款不良贷款 不良贷款与贷款项目个数 不良贷款与贷款项目个数的散点图的散点图0 02 24

3、46 68 81010121214140 020204040贷款项目个数贷款项目个数不良贷款不良贷款 不良贷款与固定资产投资额不良贷款与固定资产投资额的散点图的散点图02468101214050100150200固定资产投资额不良贷款)var()var(),cov(YXYXXYrXYr_22()()()()iiXYiiXX YYrXXYYr221(2)tr nrtn2. 构造相关系数统计量221rntr3.取定显著性水平和自由度n-2,查t分布临界表得t/2(n-2),4. 作出统计决策:若|t| t/2(n-2),则认为x与y之间线性相关关系显著,否则,不显著446.97x 446.97x

4、446.97x312.757411.32yxy,210830.67x 25191.73y 222222()()20 7411.32446.97 312.7520 10830.67446.9720 5191.73 312.750.838nxyxyrnxxnyy 2220.83820 26.515511 0.838ntrr0.050.05/2(20 2) 2.101t 0.025(18)tt一、回归分析的概念一、回归分析的概念二、回归分析与相关分析的关系二、回归分析与相关分析的关系三、回归系数的估计三、回归系数的估计四、拟合优度的度量四、拟合优度的度量估计因变估计因变量平均值量平均值线 性 回 归

5、非 线 性 回 归一 元 回 归线 性 回 归非 线 性 回 归多 元 回 归回 归 模 型()Yf X()Yf X注意:注意: 随机项随机项 来自以下几个方面:来自以下几个方面:(1)自变量的省略)自变量的省略 (2) 统计误差统计误差 (3) 模型的设定误差模型的设定误差 (4) 随机误差随机误差 01YXn给定x,y的n次观测值 ,i=1,2,n, 01iiiyx( ,)iix y(/)0iiEX(/)0iiEX222var( /)( /)( )iiiiiiXEEXE(/)0iiEX222var( /)( /)( )iiiiiiXEEXEov( , )( )( )( , ) 0ijiij

6、jijCEEEE (/)0iiEX222var( /)( /)( )iiiiiiXEEXEov( , )( )( )( , ) 0ijiijjijCEEEE ( ,)( )()0iiiiiCovXEEXE Xi(/)0iiEX222var( /)( /)( )iiiiiiXEEXEov( , )( )( )( , ) 0ijiijjijCEEEE ( ,)( )()0iiiiiCovXEEXE X2(0,)iNi2(0,)iN2. 用用样本统计量样本统计量 和和 代替回归方程中的未知参代替回归方程中的未知参数数 和和 ,就得到了估计的回归方程,就得到了估计的回归方程1. 总体总体回归参数回归参

7、数 和和 是未知的,必须利用样本数是未知的,必须利用样本数据去估计据去估计(四)估计的回归方程(四)估计的回归方程 具体做法:使因变量的观察值与估计值之间的离差具体做法:使因变量的观察值与估计值之间的离差平方和达到最小来求得平方和达到最小来求得 和和 的方法。即的方法。即iyiy0122()tttQeyy201()tQyx01012()02()0ttyxyx x010 和和 的估计公式如下:的估计公式如下:100()E11()E0100()E11()E12()iVarx12()iSEx202()iiXVarNx202()iiXSENx2112(,)iNx2002(,)iiXNNx n因变量因变

8、量 y 的取值是不同的,的取值是不同的,y 取值的这种波动称为取值的这种波动称为变差。变差来源于两个方面:变差。变差来源于两个方面:n (1)由于自变量)由于自变量 x 的取值不同造成的的取值不同造成的n (2)除)除 x 以外的其他因素以外的其他因素(如如x对对y的非线性影响、测量的非线性影响、测量误差等误差等)的影响的影响对一个具体的观测值来说,因变量变差的大小可以对一个具体的观测值来说,因变量变差的大小可以通过该实际观测值与其均值之差通过该实际观测值与其均值之差 来表示来表示y_222()()()iiiiyyyyyy注:注:K为回归系数的个数为回归系数的个数对于样本对于样本n个观察值看,

9、因变量的变差可分解为:个观察值看,因变量的变差可分解为:22Rr222ien 222ien222ienn比比 容易解释,实际使用起来较为方便容易解释,实际使用起来较为方便2()22iieyySSEsMSEnn2(三)样本统计量(三)样本统计量 的分布的分布1. 是根据最小二乘法求出的样本统计量,它有自是根据最小二乘法求出的样本统计量,它有自己的分布己的分布2. 的的分布具有如下性质分布具有如下性质分布形式:正态分布分布形式:正态分布数学期望:数学期望:标准差标准差:n由于 未知,需用其估计量 来代替得到 的估计的标准差2S样本统计量样本统计量 的分布的分布2在小样在小样本时本时, 服从服从t分

10、布。分布。() (2)tt nS013. 确定显著性水平确定显著性水平 ,并进行决策,并进行决策 t t,拒绝,拒绝H0; t F ,拒绝拒绝H0;若若FF ,不不能拒绝能拒绝H0121211121212221111270561868045382821177379030721400iiiiiiiiiiinxyxx yy,1012 11773790 7056 186802.02887312 4538282 7056 7056111868 07056 363.68911212 故广告投入与销售量故广告投入与销售量之间的回归方程为:之间的回归方程为: 363.6891 2.028873xy2222(

11、)1642866.7()1602708.6()4015.8070.987SSTyySSRyySSEyySSRRSST2()4015.80763.3704212 2yy ysn01111:0,:02.02919.8820.102( )HHs1第二步,构造t统计量 t=1(10)1.812,19.8821.812,0.t0.05/2第三步,给定的显著性水平=0.05,查t分布临界值t拒绝原假设,回归系数显著不为0111:0,:01602709399.14015.807HHMSRFMSE第二步,构造F统计量 0.05(1,10)6.94,399.16.94,F0.05/2第三步,给定的显著性水平,查

12、F分布临界值F拒绝原假设,总体线性回归模型显著。2. 点预测值有ny 的个别值的点预测ny 的平均值的点预测3. 在点预测条件下,平均值的点预测和个别值的的点预测是一样的,但在区间预测中则不同1. 对于自变量 x 的一个给定值x0 ,根据回归方程得到因变量 y 的一个估计值n利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E(y0) ,就是平均值的点预测式中:sy为估计标准误差_FXX_2()FXX_X_2()FXXY越大,预测区间越宽越大,预测区间越宽当当=0,,表表 8 . 3 . 1 某地某地1978年年2003年年的 国 内 生的 国 内

13、生产总值产总值GDP与货与货运 周 转 量运 周 转 量的数据的数据 R2)6.7511935+0.5952747yx 回归方程: 检验Significance F=1.395E-21;P-value=1.395E-21F ,拒绝H03. 确定显著性水平,并进行决策 tt,拒绝H0; tt,不能拒绝H0 (1)iitt nkS)6991. 1)29(,0452. 2)29(05. 0025. 0tt)33. 3)29, 2(,20. 4)29, 2(05. 0025. 0FF试在显著性水平为试在显著性水平为=0.05下,对回归系数和回归方下,对回归系数和回归方程进行检验。程进行检验。)000.

14、 0(919.126,894. 0,901. 0)000. 0()000. 0()001. 0()961. 3()337.12()754. 3(116.21066. 0491.3692232pFRRptxxy例:例:中国各省财政中国各省财政收入(收入(y)与各省)与各省GDP(x2)及第一)及第一产业就业比重(产业就业比重(x3)额关系如下:额关系如下:2k012ky=+.+xxx2k01 122ky=+.+kxxx21122,kkkzx zx zx01 122.kkyzzz原模型可化为线性形式: 011YX令1ZX 原模型可化为线性函数形式:01YZ01lnlnyx*lnlnyyxx*01yx01ln yx*11(ln )/dyydxydyy yxdxx 表示变动一个单位,将变动%的百分比 lnyx11*(ln)/ dydyydxxxdxxyx表示变动1%,将变动个单位的绝对量 120 12yx x e1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论