古典线性回归模型的基本假设_第1页
古典线性回归模型的基本假设_第2页
古典线性回归模型的基本假设_第3页
古典线性回归模型的基本假设_第4页
古典线性回归模型的基本假设_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1古典线性回归模型的基本假设2学习目标古典线性回归模型(ClassicalLinearRegressionModel)的基本假设普通最小平方法估计式的抽样分配(samplingdistribution)普通最小平方法估计式的统计性质假说检定(hypothesistesting)回归模型的配适度与预测3古典线性回归模型(1/4)古典线性回归模型的基本假设母体条件期望值为参数的线性函数误差项的条件期望值为零同质变异(homoscedasticity):误差项的变异数相同无自我相关(noautocorrelation):误差项彼此之间

不相关自变数X和误差项不相关模型设定正确(theregressionmodeliscorrectly

specified)4古典线性回归模型(2/4)假设2:误差项的条件期望值为零5古典线性回归模型(3/4)图:同质变异(homoscedasticity,equalvariance);图:异质变异(heteroscedasticity,unequalvariance)6古典线性回归模型(4/4)(a)图:误差项无自我相关(noautocorrelation);(b)图:误差项正自我相关(positiveautocorrelation);(c)图:误差项负自我相关(negativeautocorrelation)7估计式的抽样分配

(1/6)根据OLS估计方法所得到的估计值会随着样本(抽样)不同而改变,故OLS估计式为随机变量,必须知道估计式的抽样分配,也就是要知道估计式的机率分配、期望值和变异数,方才能够进行检定。OLS估计式的期望值

在古典线性回归模型的假设下,

故OLS估计式是不偏估计式(unbiasedestimator)。

8估计式的抽样分配

(2/6)

OLS估计式的变异数与标准误(varianceandstandarderrors)OLS估计式的变异数系用来衡量估计式抽样分配的变异程度OLS估计式的变异数与标准误(se)

9估计式的抽样分配

(3/6)

其中是误差项的变异数,倘若已知,根据公式可计算出估计式变异数的数值,但因为母体真实的变异数未知,故也必须估计。10估计式的抽样分配

(4/6)

:的估计式,开根号称为回归的估计标准误(standarderroroftheregression,SER)

11估计式的抽样分配

(5/6)

残差

残差平方4.81818223.21488-10.3636107.4054.45454519.84298-0.727270.5289264.09090916.73554-1.090911.190083-6.2727339.347113.54545512.570258.36363669.95041-6.8181846.4876(SSR/n-2)42.159096.49300312

13估计式的抽样分配

(6/6)虽然已经得到OLS估计式抽样分配的期望值和变异数,但是还不知道估计式属于何种机率分配,因此在古典线性回归模型再加上一个假设:

误差项遵循常态分配

由于常态分配随机变量的线性函数仍为常态分配,因此OLS估计式也为常态分配随机变量。

14OLS估计式的统计性质

Gauss-Markovtheorem:在古典线性回归模型的假设下,OLS估计式具有BLUE(bestlinearunbiasedestimator)的良好性质,换言之,OLS估计式是所有线性不偏估计式中变异数最小的。

估计式是观察值Y的线性函数。

估计式不偏。在重复抽样之下,平均来看,估计式的期望值会等于真实母体参数值(

同样满足不偏)。

在所有线性不偏估计式,OLS估计式最有效率。

15假说检定(1/9)回归分析的第二个目标是检定,判断自变数和应变数之间是否具有显著的关系,是正向或是负向关系。

虚无假设

对立假设

双尾检定

右尾检定

左尾检定16假说检定(2/9)假说检定必须仰赖估计式的抽样分配,已知OLS估计式遵循常态分配,故

为标准常态分配。

17假说检定(3/9)由于母体变异数未知,以回归标准误

取代,

根据t分配建立信赖区间进行检定,或是计算t值进行显著性检定。

18假说检定(4/9)信赖区间法(confidenceintervalapproach)

以简单回归讲义的数值例子来讨论,假设进行双尾检定,并令显著水平(significantlevelortheprobabilityofcommittingatypeIerror)为5%,则由t分配表可知(样本数10,故自由度为8):

19假说检定(5/9)

上式为母体参数的95%信赖区间,重覆抽样下,平均来说,100次当中有95次这个区间会包含母体真值信赖区间为接受域(theregionofacceptance),信赖区间之外为拒绝域(therejectionregion),若虚无假设的值落于信赖区间,无法拒绝虚无假设;若落于信赖区间以外,拒绝虚无假设(因为有5%的机率这个区间不包含母体真值,故错误地拒绝为真之虚无假设的机率为5%)

下限95%上限95%9.66425639.244830.4266680.5915142021假说检定(6/9)显著性检定法(Thetestofsignificanceapproach)

根据估计式的抽样分配建立虚无假设成立之下的检定量(teststatistic),计算于样本资料下该检定量的数值(称为检定值),再比较检定值和临界值进行显著性检定。

虚无假设成立下()的检定量(teststatistic)

22假说检定(7/9)双尾检定时,若样本资料所计算出之t值落于

临界值之外,表示样本检定结果为:母体参数值显著异于虚无假设的数值,故拒绝虚无假设;若计算出之

t值落于两临界值之间,则无法拒绝虚无假设。

系数标准误t统计P-值截距24.454556.4138173.8127910.005142X变量10.5090910.03574314.243175.75E-072324假说检定(8/9)单尾检定(one-tailedtest)

右尾:if,拒绝虚无假设左尾:if,拒绝虚无假设p-value:theexactlevelofsignificance(rejectnullhypothesisifpvalueissufficientlylow)25假说检定(9/9)单尾

t

检定:(a)右尾

(b)左尾26配适度(goodnessoffit)(1/3)

判定系数(coefficientofdetermination):衡量应变数Y的变异当中能够被自变数X解释的部分,定义为

SST(总变异)、SSE(被解释变异)与SSR(残差变异)的定义与计算:

自由度SS回归18552.727残差8337.2727总和98890残差残差平方4.81818223.21488-10.3636107.4054.45454519.84298-0.727270.5289264.09090916.73554-1.090911.190083-6.2727339.347113.54545512.570258.36363669.95041-6.8181846.4876337.2727(SSR)2728配适度(goodnessoffit)(2/3)应变数Y之变异的分解29配适度(goodnessoffit)(3/3)在简单回归模型,应变数与自变数之相关系数(thecoefficientofcorrelation)和判定系数具有如下的关系:

应变数与自变数的样本相关系数会等于判定系数开根号,而相关系数的正负号则由的正负号所决定。30

预测(1/4)点预测:样本回归估计出来后,可以根据估计结果作点预测:在任一给定的X值,预测Y值是多少?即given

,根据样本回归预测

预测误差为

预测的信赖区间(individualprediction)

因为

故Y0预测的信赖区间为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论