双变量模型假设检验_第1页
双变量模型假设检验_第2页
双变量模型假设检验_第3页
双变量模型假设检验_第4页
双变量模型假设检验_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

双变量模型假设检验第一页,共七十八页,编辑于2023年,星期五第一部分线性回归模型经济计量学的基础工具第2章线性回归的基本思想——双变量模型第3章双变量模型:假设检验第二页,共七十八页,编辑于2023年,星期五X(收入)Y(博彩支出)1501752002252502753003253503750总体回归线(PRL)第三页,共七十八页,编辑于2023年,星期五X(收入)Y(博彩支出)1501752002252502753003253503750总体回归线(PRL)样本回归线(SRL)第四页,共七十八页,编辑于2023年,星期五X(收入)Y(博彩支出)对某个Xi,有一个观测值Yi。总体与样本回归线第五页,共七十八页,编辑于2023年,星期五PRF随机或统计总体回归函数(StochasticorstatisticalPRF)非随机或确定总体回归函数(deterministicornonstochasticPRF)

SRF均值形式的样本回归函数随机形式的样本回归函数第六页,共七十八页,编辑于2023年,星期五估计????总体回归线/函数样本回归线/函数

PRL/PRFSRL/SRF怎样构造SRL/SRF,使这个估计做得尽量好?(b1、

b2尽可能地接近B1、B2)估计第七页,共七十八页,编辑于2023年,星期五X(收入)Y(博彩支出)最小二乘准则第八页,共七十八页,编辑于2023年,星期五B1、B2的估计对于上式,给定一组X、Y的数据,b1、b2选得不同,残差平方和的值就不同。用微分法解该问题。第九页,共七十八页,编辑于2023年,星期五注:小写的x和y代表X和Y的离差形式,即样本值减去样本均值。b1和b2分别为B1和B2的OLS估计量第十页,共七十八页,编辑于2023年,星期五例1:博彩支出YX18150241752620023225302502727534300353253335040375表2-2回归结果:第三章之后Eviews演示第十一页,共七十八页,编辑于2023年,星期五回归分析的第一阶段:参数估计

回归分析的第二阶段:统计检验第3章完成第十二页,共七十八页,编辑于2023年,星期五第3章

双变量模型:假设检验第十三页,共七十八页,编辑于2023年,星期五X(收入)Y(博彩支出)1501752002252502753003253503750总体回归线(PRL)样本回归线(SRL)第十四页,共七十八页,编辑于2023年,星期五双变量模型:假设检验问题:——估计的回归直线的“优度”如何?也就是说,怎样判别它确实是真实的总体回归函数的一个好的估计量呢?可是总体未知哦……需要总体函数的更多信息……第十五页,共七十八页,编辑于2023年,星期五双变量模型:假设检验X是非随机的随机误差项u是随机的Y由于Y的生成是在随机误差项(u)上加上一个非随机项(X),因而Y也就变成了随机变量。于是必须对yi的分布做一番讨论。所有这些意味着:只有假定随机误差项是如何生成的,才能判定样本回归函数对真实回归函数拟合的好坏。第十六页,共七十八页,编辑于2023年,星期五3.1

古典线性回归模型的基本假定

(ClassicalLinearRegressionModel,CLRM)

第十七页,共七十八页,编辑于2023年,星期五关于函数基本形式的假定:1.参数线性假定:回归模型是参数线性的,但不一定是变量线性的。(一元线性)(多元线性)第十八页,共七十八页,编辑于2023年,星期五解释变量X与扰动项u不相关假定当X是非随机变量,即确定性变量时,该条件自动满足;当X是随机变量时,该假定要求X与u不相关。第十九页,共七十八页,编辑于2023年,星期五关于随机误差项(扰动项)的假定:

3.零均值假定:给定解释变量的值,随机误差项的期望值为0。即:结合假定2,该条件等价于:

P42:图3-1第二十页,共七十八页,编辑于2023年,星期五4.同方差(homoscedasticity)假定:不同的扰动项具有相同的方差。即:

否则称为异方差。结合假定2,同方差假定等价于:

P43:图3-2第二十一页,共七十八页,编辑于2023年,星期五5.无自相关或序列相关(noautocorrelation)假定:不同扰动项之间的协方差为零,即:该假定等价于:

P43:图3-3第二十二页,共七十八页,编辑于2023年,星期五

6.回归模型的设定是正确的,即模型不存在设定偏差(Specificationbias)或设定误差(specificationerror)。(正确设定?第7章:判定标准)

7.扰动项服从正态分布。结合3和4即为:第二十三页,共七十八页,编辑于2023年,星期五假定

3:对给定的X值,随机干扰项u的条件均值为零:假定

1:线性模型。回归模型对参数而言是线性的。如:假定2:解释变量X与扰动误差项u不相关。(X是非随机的比这一假定更强)最小二乘法的基本假定

——古典线性回归模型(CLRM)第二十四页,共七十八页,编辑于2023年,星期五假定

4:同方差性。给定X值,对所有的观测,ui的方差都是相同的。即ui的条件方差是一常数:假定

5:各个干扰之间无自相关。给定任意两个X值:Xi和Xj,ui和uj之间的相关为零:i和j为两次不同的观测,而cov表示协方差。第二十五页,共七十八页,编辑于2023年,星期五假定

6:回归模型是正确设定的。即在实证分析中所使用的模型不存在设定偏误。不难看出,上述6大假定全是针对解释变量X及误差项u所作的,实际上是对总体回归函数PRF的假定。为什么假定?现实意义?如不满足会怎样?如何知道这些假定是否满足?——第二部分对任何一门学科的探求,都需要做一些假定

有助于逐步明确问题

×

这些假定是现实所必需第二十六页,共七十八页,编辑于2023年,星期五3.1

古典线性回归模型的基本假定

(ClassicalLinearRegressionModel,CLRM)

第二十七页,共七十八页,编辑于2023年,星期五3.3

OLS估计量的性质第二十八页,共七十八页,编辑于2023年,星期五3.3OLS估计量的性质P46高斯—马尔柯夫定理:在满足古典线性回归模型(CLRM)假定的条件下,OLS估计量是BLUE。(BestLinearUnbiasedEstimator)三层含义:首先,OLS估计量是线性的。即是关于的线性组合。

第二十九页,共七十八页,编辑于2023年,星期五其次,OLS估计量是无偏的。重复抽样,做很多次OLS估计,估计量的均值可以十分逼近真实值(即SRF十分接近PRF)。最后,在所有线性无偏估计量中,OLS估计量的方差最小(最优,精度最高,最有效率)第三十页,共七十八页,编辑于2023年,星期五3.2OLS估计的精度——估计量的方差与标准误第三十一页,共七十八页,编辑于2023年,星期五3.2OLS估计的精度

——估计量的方差与标准误由于Y是随机变量,而b1和b2是它的函数,因此b1和b2也是随机变量。当数据从一个样本变到另一个样本时,它们的值会出现摆动。因此,需要找一个量来度量这种摆动的大小,即衡量估计量b1和b2的精度/可靠性。——这个量就是估计量的方差及标准误。第三十二页,共七十八页,编辑于2023年,星期五通过计算,双变量线性回归OLS估计量的

标准误(P351)为:其中,σ2为常数,是假定4中ui的共同方差。第三十三页,共七十八页,编辑于2023年,星期五上述表达式中,除了σ之外,其他量的值均可从样本数据直接得到,σ需要通过样本来估计:其中,分子为回归的残差平方和(RSS),分母为回归的自由度(d.f.)。被称为回归的标准误(区别于前面回归估计量b1和b2的标准误)。第三十四页,共七十八页,编辑于2023年,星期五双变量模型:假设检验同方差,由下式来估计:是残差平方和(RSS);(n-2)称为自由度。回归标准误(Standarderroroftheregression,SER)第三十五页,共七十八页,编辑于2023年,星期五例:博彩支出一例的方差和标准误第三十六页,共七十八页,编辑于2023年,星期五用OLS法估计出b1,b2(得到了SRF)在一定的假设前提下,OLS估计量的性质用方差和标准误,衡量了OLS估计的精度

回归分析的第一阶段:参数估计

回归分析的第二阶段:统计检验

完成第三十七页,共七十八页,编辑于2023年,星期五双变量模型的统计检验在博彩支出一例中,

疑问:可以认为总体回归函数中真实的B2就等于0.08,或据此认定B2不为0吗?若采用表2-3的抽样结果进行OLS估计:表2-3YX23150181752420025225282502727531300293253335034375第三十八页,共七十八页,编辑于2023年,星期五虽然OLS法得到的b2最大程度地拟合了样本点,并且如果重复足够多次抽样,多个b2的均值就等于B2

;但是b2毕竟不是B2

,由于抽样波动性,b2的数值会随样本的变化而不同。因此,对于总体回归函数中的参数是否等于0(或某个假设值),需要用一个正式的检验过程来验证—假设检验第三十九页,共七十八页,编辑于2023年,星期五1、假设检验:显著性检验法(1)零假设与备择假设零假设,假设检验中首先要提出一个有待根据样本信息来检验的、关于总体的某种说法或论断,称之为原假设或“0假设”,记为H0(它一般是研究者想收集证据予以反对的假设)例如H0:

B2=0,H0:

B1=0备择假设,与原假设对立的假设,也称“研究假设”,即为预备在拒绝原假设时所选择的假设,记为H1

第四十页,共七十八页,编辑于2023年,星期五总体参数假设的三种形式H0:m=m0;H1:m≠m0

H0:m=m0;H1:m<m0(或H0:m≥m0;H1:m<m0)H0:m=m0;H1:m>m0(或H0:m≤m0;H1:m>m0)上述三种类型的假设检验依次称为双侧检验(或双尾检验)、左侧检验(或左尾检验)和右侧检验(或右尾检验),左侧检验和右侧检验通称为单侧检验(或单尾检验)。第四十一页,共七十八页,编辑于2023年,星期五(2)检验的基本思想合理构造一定的统计量,利用该统计量在零假设下的抽样分布,结合样本数据算出该统计量的值,并在事先确定的显著性水平下(能容忍的犯错误概率),决定是否接受零假设。第四十二页,共七十八页,编辑于2023年,星期五CLRM假设7:扰动项服从正态分布。结合3和4即为:系数b1,b2,是ui的线性函数,所以:第四十三页,共七十八页,编辑于2023年,星期五双变量模型:假设检验在假设“总体回归函数Yi=B1+B2Xi+ui中,误差项ui服从均值为零,方差为的正态分布,即,ui~N(0,)”之下:第四十四页,共七十八页,编辑于2023年,星期五标准化:用估计量代替方差:第四十五页,共七十八页,编辑于2023年,星期五(3)检验回归系数是否为零——t检验用得最多的是:检验斜率系数是否为零。这样一个“

0”零假设(“Zero”nullhypothesis),也称之为稻草人假设(strawmanhypothesis)。选择这样一个假设,是为了看Y究竟是否与X有关。如果X与Y就无关,那么再检验假设,B2=-2或B2为其他任何值就没有意义了。当然,如果零假设为真,则就没有必要把X包括到模型之中。因此,如果X确实属于这个模型,那么,我们就期望拒绝“0”零假设H0而接受备择假设H1,比如说,B2≠0。用于这一检验的统计量为:通常称为t统计量,可由OLS估计结果算得。(EViews软件在报告回归结果时自动给出)第四十六页,共七十八页,编辑于2023年,星期五双变量模型:假设检验假设检验正态分布第四十七页,共七十八页,编辑于2023年,星期五例:博彩支出一例的t统计量第四十八页,共七十八页,编辑于2023年,星期五统计学术语的运用(非常重要!!!)在t检验的基础上,如果决定“不能拒绝H0

”,不是说它毫无疑问是真的,而是根据样本提供的信息,我们没有理由去拒绝它。类似的例子:法庭宣布嫌疑犯无罪≠清白不能拒绝H0第四十九页,共七十八页,编辑于2023年,星期五(4)第一、二类错误与p值H0:B2=B2*拒绝H0接受H0H0为真弃真错误第一类错误判断正确H0不为真判断正确取伪错误第二类错误第五十页,共七十八页,编辑于2023年,星期五在假设检验中,理想的做法是把这两种错误发生的概率都尽量降低。但不幸的是,在样本容量一定的条件下,无法做到!(严一点,取伪少,但弃真多;松一点,弃真少,但取伪多)。为解决该问题,在古典方法中,假定第一类错误(弃真)更严重,因而首先关注犯弃真错误的概率——用α表示,称为显著性水平(levelofsignificance)最常用的显著性水平值为1%,5%和10%(越来越容易拒绝H0)第五十一页,共七十八页,编辑于2023年,星期五关于回归中报告的p值

p值,又称“精确显著性水平”,它表示的是一个零假设H0可被拒绝的最低显著性水平,换句话说,它直接给出了拒绝H0所犯一类(弃真)错误的概率(p值越低,拒绝H0的证据越充分)决策原则当p值小于给定的显著性水平α拒绝H0第五十二页,共七十八页,编辑于2023年,星期五博彩支出一例拒绝H0犯一类(弃真)错误的概率为0.0001,即0.01%,小于5%的显著性水平,因此拒绝H0,认为B2在统计上显著异于零,X对Y有显著影响。p值第五十三页,共七十八页,编辑于2023年,星期五假设检验在博彩例中,t=7.262>2,由此拒绝B2=0的零假设,认为B2显著(显著异于0),即从统计的角度,每周可支配收入X所对每周博彩支出Y具有显著的影响。第五十四页,共七十八页,编辑于2023年,星期五3.6:拟合回归直线的优度度量:判定系数r2t值都是统计显著的,样本回归函数很好的拟合了样本数据。并非每个Y值都准确落在估计的PRF上估计的回归线拟合真实Y值的优劣程度如何?拟合优度如何?第五十五页,共七十八页,编辑于2023年,星期五2、判定系数r2

:拟合优度的度量P53拟合优度:样本回归线对数据拟合得多好(1)Yi变异的分解XYYi的总变异未被回归解释由回归解释SRF(OLS回归得到)第五十六页,共七十八页,编辑于2023年,星期五TSS(thesumofsquares)—总平方和ESS(explainedsumofsquares)——解释平方和RSS(residualsumofsquares)——残差平方和

Y的总变异当中,由回归解释的部分所占的百分比越大,样本回归线对样本点的拟合就越好推导见P53第五十七页,共七十八页,编辑于2023年,星期五(2)判定系数r2

coefficientofdetermination

r2↗,SRF对数据拟合得越好,拟合优度↗r2:在Y的总变异当中,由回归解释的部分(可由X的变异来解释的部分)所占的百分比因此r2还可用于度量模型的解释力。第五十八页,共七十八页,编辑于2023年,星期五r2的性质它是一个非负量它的界限为[0,1]。

r2=1,完美拟合;

r2=0,选错了解释变量,对于y的变动,回归模型没有任何解释力。第五十九页,共七十八页,编辑于2023年,星期五双变量模型:假设检验样本相关系数(samplecoefficientofcorrelation)r,它是度量两变量X与Y之间线性相关程度的指标相关系数也能够根据判定系数r2来计算:第六十页,共七十八页,编辑于2023年,星期五3.9正态性检验:误差项ui服从正态分布吗?假设ui是同分布的,是吗?ei作为ui的样本,可以进行检验。具体方法参照教材:P58第六十一页,共七十八页,编辑于2023年,星期五1残差直方图检验法(基于直观)第六十二页,共七十八页,编辑于2023年,星期五2正态概率图检验法正态概率图(NormaProbabilityPlot,NPP)(在专用的正态概率纸上作图)。在横轴上(X轴),标出所关注变量的值,在纵轴上(Y轴),标出该变量服从正态分布所对应的均值。因此,若该变量的确来自正态总体,则正态概率图将近似为一直线。第六十三页,共七十八页,编辑于2023年,星期五利用MINTAB软件作出Widget一例的正态概率图(残差)第六十四页,共七十八页,编辑于2023年,星期五3Jarque-Bera检验第六十五页,共七十八页,编辑于2023年,星期五偏度系数S:对概率密度函数对称性的度量如果偏度S的值为正,则其概率密度为正偏或右偏;如果S的值为负,则其概率密度为负偏或左偏。第六十六页,共七十八页,编辑于2023年,星期五峰度系数K:对概率密度函数的“胖瘦”的度量概率密度函数的峰度K小于3时,成为低峰态的(胖的或短尾的),峰度K大于3时,称为尖峰态的(瘦的或长尾的)。正态分布的峰度K为3,这样的概率密度函数称为常峰态的。第六十七页,共七十八页,编辑于2023年,星期

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论