一元线性回归结果的显著性检验课件_第1页
一元线性回归结果的显著性检验课件_第2页
一元线性回归结果的显著性检验课件_第3页
一元线性回归结果的显著性检验课件_第4页
一元线性回归结果的显著性检验课件_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、回归结果的显著性检验1.线性关系的检验①检验自变量与因变量之间的线性关系是否显著②将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数)残差均方(MSE)

:残差平方和SSE除以相应的自由度(n-2).一、回归结果的显著性检验1.线性关系的检验①检验自变量与因变线性关系的检验的步骤提出假设H0:1=0线性关系不显著2.计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F

作出决策:若F>F

,拒绝H0;若F<F

,不能拒绝H0线性关系的检验的步骤提出假设2.计算检验统计量F确定例题分析

(以前面资料)提出假设H0:1=0不良贷款与贷款余额之间的线性关系不显著计算检验统计量F确定显著性水平=0.05,并根据分子自由度1和分母自由度25-2找出临界值F

=4.28作出决策:若F>F,拒绝H0,线性关系显著例题分析(以前面资料)提出假设确定显著性水平=0.05,方差分析表Excel输出的方差分析表方差分析表Excel输出的方差分析表2.回归系数的检验在一元线性回归中,等价于线性关系的显著性检验检验x与y之间是否具有线性关系,或者说,检验自变量x对因变量y的影响是否显著理论基础是回归系数

的抽样分布2.回归系数的检验在一元线性回归中,等价于线性关系的显著性检样本统计量的分布

是根据最小二乘法求出的样本统计量,它有自己的分布的分布具有如下性质分布形式:正态分布数学期望:标准差:由于未知,需用其估计量sy来代替得到的估计的标准差样本统计量的分布是根据最小二乘法求出的样本统计量回归系数的检验检验步骤

提出假设H0:b1=0(没有线性关系)H1:b1

0(有线性关系)计算检验的统计量

确定显著性水平,并进行决策t>t,拒绝H0;t<t,不能拒绝H0回归系数的检验检验步骤提出假设确定显著性水平,并进行决例题分析对例题的回归系数进行显著性检验(=0.05)提出假设H0:b1=0H1:b1

0计算检验的统计量

t=7.533515>t=2.201,拒绝H0,表明不良贷款与贷款余额之间有线性关系例题分析对例题的回归系数进行显著性检验(=0.05)t回归系数的检验例题分析表P值的应用P=0.000000<=0.05,拒绝原假设,不良贷款与贷款余额之间有线性关系回归系数的检验例题分析表P值的应用P=0.000000<3、三种检验的关系在一元线性回归分析中,回归系数显著性的t检验、回归方程显著性的F检验,相关系数显著性t检验,三者等价的,检验结果是完全一致的。对一元线性回归,只做其中的一种检验即可。3、三种检验的关系在一元线性回归分析中,回归系数显著性的t检二、回归分析结果的评价建立的模型是否合适?或者说,这个拟合的模型有多“好”?要回答这些问题,可以从以下几个方面入手所估计的回归系数

的符号是否与理论或事先预期相一致在不良贷款与贷款余额的回归中,可以预期贷款余额越多不良贷款也可能会越多,也就是说,回归系数的值应该是正的,在上面建立的回归方程中,我们得到的回归系数为正值如果理论上认为x与y之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此在不良贷款与贷款余额的回归中,二者之间为正的线性关系,而且,对回归系数的t检验结果表明二者之间的线性关系是统计上显著的二、回归分析结果的评价建立的模型是否合适?或者说,这个拟回归模型在多大程度上解释了因变量y取值的差异?可以用判定系数R2来回答这一问题在不良贷款与贷款余额的回归中,得到的R2=71.16%,解释了不良贷款变差的2/3以上,说明拟合的效果还算不错考察关于误差项的正态性假定是否成立。因为我们在对线性关系进行F检验和回归系数进行t检验时,都要求误差项服从正态分布,否则,我们所用的检验程序将是无效的。正态性的简单方法是画出残差的直方图或正态概率图计量单位的讨论,因果模型的特征回归模型在多大程度上解释了因变量y取值的差异?可以用判定系数Excel输出的部分回归结果R2)Excel输出的部分回归结果R2)

残差分析1用残差证实模型的假定2用残差检测异常值和有影响的观测值残差分析1用残差证实模型的假定残差图(residualplot)表示残差的图形关于x的残差图关于y的残差图标准化残差图用于判断误差的假定是否成立检测有影响的观测值残差图(residualplot)表示残差的图形残差图(形态及判别)残差图(形态及判别)残差图(例题分析)残差图(例题分析)标准化残差(standardizedresidual)残差除以它的标准差后得到的数值。计算公式为

sei是第i个残差的标准差,其计算公式为

标准化残差(standardizedresidual)标准化残差图用以直观地判断误差项服从正态分布这一假定是否成立若假定成立,标准化残差的分布也应服从正态分布在标准化残差图中,大约有95%的标准化残差在-2到+2之间标准化残差图用以直观地判断误差项服从正态分布这一假定是否标准化残差图

(例题分析)标准化残差图

(例题分析)异常值如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可能是异常点,或称为野点.如果异常值是一个错误的数据,比如记录错误造成的,应该修正该数据,以便改善回归的效果如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑采用其他形式的模型,比如非线性模型如果完全是由于随机因素而造成的异常值,则应该保留该数据在处理异常值时,若一个异常值是一个有效的观测值,不应轻易地将其从数据集中予以剔除.异常值如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可异常值识别异常值也可以通过标准化残差来识别如果某一个观测值所对应的标准化残差较大,就可以识别为异常值一般情况下,当一个观测值所对应的标准化残差小于-2或大于+2时,就可以将其视为异常值异常值识别异常值也可以通过标准化残差来识别有影响的观测值如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的观测值一个有影响的观测值可能是一个异常值,即有一个值远远偏离了散点图中的趋势线对应一个远离自变量平均值的观测值或者是这二者组合而形成的观测值

有影响的观测值如果某一个或某一些观测值对回归的结果有强烈的影有影响的观测值图示不存在影响值的趋势有影响的观测值存在影响值的趋势有影响的观测值图示不存在影响值的趋势有影响的观测值存在影响值

小结

一、变量间关系的种类二、相关系数的计算、评价及检验三、回归模型、回归方程、估计回归方程的概念,回归方程参数的最小二乘估计四、判定系数、估计标准误差的计算,及线性关系检验及回归系数的检验五、回归分析结果的评价小结一、变量间关26利用回归方程进行估计和预测根据自变量x

的取值估计或预测因变量y的取值估计或预测的类型点估计y的平均值的点估计y的个别值的点估计区间估计y的平均值的置信区间估计y的个别值的预测区间估计26利用回归方程进行估计和预测根据自变量x的取值估计或预27利用回归方程进行估计和预测

(点估计)2.点估计值有y的平均值的点估计y的个别值的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同对于自变量x的一个给定值x0

,根据回归方程得到因变量y的一个估计值27利用回归方程进行估计和预测

(点估计)2.点估计值有对28

y的平均值的点估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的平均值的一个估计值E(y0),就是平均值的点估计在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得28y的平均值的点估计29

y的个别值的点估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的一个个别值的估计值,就是个别值的点估计2.比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得29y的个别值的点估计利用估计的回归方程,对于自变30点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计对于自变量x的一个给定值x0,根据回归方程得到因变量y的一个估计区间区间估计有两种类型置信区间估计预测区间估计30点估计不能给出估计的精度,点估计值与实际值之间是有误差的31

y的平均值的置信区间估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的平均值E(y0)的估计区间,这一估计区间称为置信区间

E(y0)

在1-置信水平下的置信区间为式中:Sy为估计标准误差31y的平均值的置信区间估计式中:Sy为估计标准32【例】根据前例,求出人均国民收入为1250.7元时,人均消费金额95%的置信区间

解:根据前面的计算结果=712.57,Sy=14.95,

t(13-2)=2.201,n=13置信区间为:712.5710.265人均消费金额95%的置信区间为702.305元~722.835元之间32【例】根据前例,求出人均国民收入为1250.7元时,人均33

y的个别值的预测区间估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的一个个别值的估计区间,这一区间称为预测区间

y0在1-置信水平下的预测区间为注意!33y的个别值的预测区间估计注意!34

【例】根据前例,求出1990年人均国民收入为1250.7元时,人均消费金额的95%的预测区间解:根据前面的计算结果有=712.57,Sy=14.95,t(13-2)=2.201,n=13

的置信区间为712.5734.469人均消费金额95%的预测区间为678.101元~747.039元之间34【例】根据前例,求出1990年人均国民收入为135影响区间宽度的因素1. 置信水平(1-)区间宽度随置信水平的增大而增大2. 数据的离散程度(s)区间宽度随离散程度的增大而增大3. 样本容量区间宽度随样本容量的增大而减小4. 用于预测的xp与x的差异程度区间宽度随xp与x的差异程度的增大而增大35影响区间宽度的因素1. 置信水平(1-)36置信区间、预测区间、回归方程xpyxx预测上限置信上限预测下限置信下限36置信区间、预测区间、回归方程xpyxx预测上限置信上限37为你的难过而快乐的是敌人,为你的快乐而快乐的是朋友,为你的难过而难过的就是那些该放进心里的人。37为你的难过而快乐的

谢谢!38谢谢!38一、回归结果的显著性检验1.线性关系的检验①检验自变量与因变量之间的线性关系是否显著②将回归均方(MSR)同残差均方(MSE)加以比较,应用F检验来分析二者之间的差别是否显著回归均方:回归平方和SSR除以相应的自由度(自变量的个数)残差均方(MSE)

:残差平方和SSE除以相应的自由度(n-2).一、回归结果的显著性检验1.线性关系的检验①检验自变量与因变线性关系的检验的步骤提出假设H0:1=0线性关系不显著2.计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F

作出决策:若F>F

,拒绝H0;若F<F

,不能拒绝H0线性关系的检验的步骤提出假设2.计算检验统计量F确定例题分析

(以前面资料)提出假设H0:1=0不良贷款与贷款余额之间的线性关系不显著计算检验统计量F确定显著性水平=0.05,并根据分子自由度1和分母自由度25-2找出临界值F

=4.28作出决策:若F>F,拒绝H0,线性关系显著例题分析(以前面资料)提出假设确定显著性水平=0.05,方差分析表Excel输出的方差分析表方差分析表Excel输出的方差分析表2.回归系数的检验在一元线性回归中,等价于线性关系的显著性检验检验x与y之间是否具有线性关系,或者说,检验自变量x对因变量y的影响是否显著理论基础是回归系数

的抽样分布2.回归系数的检验在一元线性回归中,等价于线性关系的显著性检样本统计量的分布

是根据最小二乘法求出的样本统计量,它有自己的分布的分布具有如下性质分布形式:正态分布数学期望:标准差:由于未知,需用其估计量sy来代替得到的估计的标准差样本统计量的分布是根据最小二乘法求出的样本统计量回归系数的检验检验步骤

提出假设H0:b1=0(没有线性关系)H1:b1

0(有线性关系)计算检验的统计量

确定显著性水平,并进行决策t>t,拒绝H0;t<t,不能拒绝H0回归系数的检验检验步骤提出假设确定显著性水平,并进行决例题分析对例题的回归系数进行显著性检验(=0.05)提出假设H0:b1=0H1:b1

0计算检验的统计量

t=7.533515>t=2.201,拒绝H0,表明不良贷款与贷款余额之间有线性关系例题分析对例题的回归系数进行显著性检验(=0.05)t回归系数的检验例题分析表P值的应用P=0.000000<=0.05,拒绝原假设,不良贷款与贷款余额之间有线性关系回归系数的检验例题分析表P值的应用P=0.000000<3、三种检验的关系在一元线性回归分析中,回归系数显著性的t检验、回归方程显著性的F检验,相关系数显著性t检验,三者等价的,检验结果是完全一致的。对一元线性回归,只做其中的一种检验即可。3、三种检验的关系在一元线性回归分析中,回归系数显著性的t检二、回归分析结果的评价建立的模型是否合适?或者说,这个拟合的模型有多“好”?要回答这些问题,可以从以下几个方面入手所估计的回归系数

的符号是否与理论或事先预期相一致在不良贷款与贷款余额的回归中,可以预期贷款余额越多不良贷款也可能会越多,也就是说,回归系数的值应该是正的,在上面建立的回归方程中,我们得到的回归系数为正值如果理论上认为x与y之间的关系不仅是正的,而且是统计上显著的,那么所建立的回归方程也应该如此在不良贷款与贷款余额的回归中,二者之间为正的线性关系,而且,对回归系数的t检验结果表明二者之间的线性关系是统计上显著的二、回归分析结果的评价建立的模型是否合适?或者说,这个拟回归模型在多大程度上解释了因变量y取值的差异?可以用判定系数R2来回答这一问题在不良贷款与贷款余额的回归中,得到的R2=71.16%,解释了不良贷款变差的2/3以上,说明拟合的效果还算不错考察关于误差项的正态性假定是否成立。因为我们在对线性关系进行F检验和回归系数进行t检验时,都要求误差项服从正态分布,否则,我们所用的检验程序将是无效的。正态性的简单方法是画出残差的直方图或正态概率图计量单位的讨论,因果模型的特征回归模型在多大程度上解释了因变量y取值的差异?可以用判定系数Excel输出的部分回归结果R2)Excel输出的部分回归结果R2)

残差分析1用残差证实模型的假定2用残差检测异常值和有影响的观测值残差分析1用残差证实模型的假定残差图(residualplot)表示残差的图形关于x的残差图关于y的残差图标准化残差图用于判断误差的假定是否成立检测有影响的观测值残差图(residualplot)表示残差的图形残差图(形态及判别)残差图(形态及判别)残差图(例题分析)残差图(例题分析)标准化残差(standardizedresidual)残差除以它的标准差后得到的数值。计算公式为

sei是第i个残差的标准差,其计算公式为

标准化残差(standardizedresidual)标准化残差图用以直观地判断误差项服从正态分布这一假定是否成立若假定成立,标准化残差的分布也应服从正态分布在标准化残差图中,大约有95%的标准化残差在-2到+2之间标准化残差图用以直观地判断误差项服从正态分布这一假定是否标准化残差图

(例题分析)标准化残差图

(例题分析)异常值如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可能是异常点,或称为野点.如果异常值是一个错误的数据,比如记录错误造成的,应该修正该数据,以便改善回归的效果如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑采用其他形式的模型,比如非线性模型如果完全是由于随机因素而造成的异常值,则应该保留该数据在处理异常值时,若一个异常值是一个有效的观测值,不应轻易地将其从数据集中予以剔除.异常值如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可异常值识别异常值也可以通过标准化残差来识别如果某一个观测值所对应的标准化残差较大,就可以识别为异常值一般情况下,当一个观测值所对应的标准化残差小于-2或大于+2时,就可以将其视为异常值异常值识别异常值也可以通过标准化残差来识别有影响的观测值如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的观测值一个有影响的观测值可能是一个异常值,即有一个值远远偏离了散点图中的趋势线对应一个远离自变量平均值的观测值或者是这二者组合而形成的观测值

有影响的观测值如果某一个或某一些观测值对回归的结果有强烈的影有影响的观测值图示不存在影响值的趋势有影响的观测值存在影响值的趋势有影响的观测值图示不存在影响值的趋势有影响的观测值存在影响值

小结

一、变量间关系的种类二、相关系数的计算、评价及检验三、回归模型、回归方程、估计回归方程的概念,回归方程参数的最小二乘估计四、判定系数、估计标准误差的计算,及线性关系检验及回归系数的检验五、回归分析结果的评价小结一、变量间关64利用回归方程进行估计和预测根据自变量x

的取值估计或预测因变量y的取值估计或预测的类型点估计y的平均值的点估计y的个别值的点估计区间估计y的平均值的置信区间估计y的个别值的预测区间估计26利用回归方程进行估计和预测根据自变量x的取值估计或预65利用回归方程进行估计和预测

(点估计)2.点估计值有y的平均值的点估计y的个别值的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同对于自变量x的一个给定值x0

,根据回归方程得到因变量y的一个估计值27利用回归方程进行估计和预测

(点估计)2.点估计值有对66

y的平均值的点估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的平均值的一个估计值E(y0),就是平均值的点估计在前面的例子中,假如我们要估计人均国民收入为2000元时,所有年份人均消费金额的的平均值,就是平均值的点估计。根据估计的回归方程得28y的平均值的点估计67

y的个别值的点估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的一个个别值的估计值,就是个别值的点估计2.比如,如果我们只是想知道1990年人均国民收入为1250.7元时的人均消费金额是多少,则属于个别值的点估计。根据估计的回归方程得29y的个别值的点估计利用估计的回归方程,对于自变68点估计不能给出估计的精度,点估计值与实际值之间是有误差的,因此需要进行区间估计对于自变量x的一个给定值x0,根据回归方程得到因变量y的一个估计区间区间估计有两种类型置信区间估计预测区间估计30点估计不能给出估计的精度,点估计值与实际值之间是有误差的69

y的平均值的置信区间估计利用估计的回归方程,对于自变量x的一个给定值x0

,求出因变量y

的平均值E(y0)的估计区间,这一估计区间称为置信区间

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论