多元回归分析推断_第1页
多元回归分析推断_第2页
多元回归分析推断_第3页
多元回归分析推断_第4页
多元回归分析推断_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元回归分析推断第一页,共五十页,2022年,8月28日受教育年限与每小时工资如果受教育年限的单位为月如果受教育年限的单位为日第二页,共五十页,2022年,8月28日OLS估计量的抽样分布高斯-马尔科夫假定假定1:关于参数线性

y=0

+1

x1+2

x2

+…+k

xk

+u假定2:随机抽样假定3:不存在完全共线性假定4:零条件均值

E(u|x1,x2,…,xk

)=0假定5:同方差性 Var(u|x1,…,xk

)=2OLS估计量是BULUE

线性性、无偏性、最小方差性第三页,共五十页,2022年,8月28日CLM假定高斯-马尔科夫假定假定6:正态性

u~N(0,2)CLM假定下,y的条件分布:y=0+1x1+2x2+…+kxk+u

y|x

~N(0+1x1+2x2+…+kxk,2)在CLM假定下,OLS估计量的抽样分布是什么?第四页,共五十页,2022年,8月28日线性性服从正态分布无偏性的期望为j方差定理4.1:CLM假定下,以自变量x为条件,有第五页,共五十页,2022年,8月28日检验单参数假设:t检验H0:1=0H1:10零假设与备择假设构造统计量0受教育年限与每小时工资

Z检验第六页,共五十页,2022年,8月28日

Z检验与t检验定理4.2:标准化估计量的t分布CLM假定下,以自变量x为条件,有第七页,共五十页,2022年,8月28日

显著性检验(t检验)原假设(nullhypothesis):例子:原假设(H0:b3=0)意味着,教育水平和工作经验相同时,男性和女性的工资没有差异。

log(wage)=b0+b1educ+b2exper+b3female+u对于一元回归,斜率系数的显著性检验:

y=0+1x+u原假设(H0:b1=0)意味着什么?H0:j=0第八页,共五十页,2022年,8月28日原假设与备择假设(alternativehypothesis)

如原假设不成立,该如何:双侧备择假设:

相应的检验为双侧检验(two-tailedtest)单侧备择假设:

或者

相应的检验为单侧检验(one-tailedtest)H0:j=0H1:j0H0:j=0H1:j>0H0:j=0H1:j<0第九页,共五十页,2022年,8月28日若原假设成立:备择假设双侧:

两侧都是拒绝域。

双侧检验j=0H1:j0第十页,共五十页,2022年,8月28日双侧检验的步骤:原假设和备择假设:计算t统计量的值:给定显著水平(通常为0.05),确定临界值H0:j=0H1:j0y=0+1x1+2x2+…+kxk+u若,拒绝H0,xj对y的影响是统计显著的。若,不能拒绝H0,xj对y的影响统计上不显著。第十一页,共五十页,2022年,8月28日大学GPA的决定因素其中,括号内为对应系数的标准差。查临界值时,t分布的自由度是多少?哪些变量是显著的?哪些是不显著的?

第十二页,共五十页,2022年,8月28日若原假设成立:备择假设:

右侧是拒绝域。

单侧检验j=0H1:j>0第十三页,共五十页,2022年,8月28日备择假设:

左侧是拒绝域。H1:j<0第十四页,共五十页,2022年,8月28日检验步骤:原假设和备择假设:计算t统计量的值:给定显著水平(通常为0.05),确定临界值H0:j=0H1:j>0y=0+1x1+2x2+…+kxk+u若,拒绝H0,xj对y的影响是统计显著的。若,不能拒绝H0,xj对y的影响统计上不显著。第十五页,共五十页,2022年,8月28日若原假设和备择假设为:统计量的计算相同,判定规则不同:单侧检验和双侧检验的比较:t统计量的计算及其数值完全相同,临界值不同;查临界值时,t分布自由度相同,但如果显著水平为,

双侧检验使用/2,单侧检验使用;同样的显著水平下,单侧检验更容易拒绝原假设,得出

自变量统计显著的结论。H0:j=0H1:j<0若,拒绝H0,xj对y的影响是统计显著的。若,不能拒绝H0,xj对y的影响统计上不显著。第十六页,共五十页,2022年,8月28日小时工资方程

1%显著水平下,使用单侧检验,exper统计上显著吗?1%显著水平下,使用双侧检验,exper统计上显著吗?学生成绩与学校规模enroll符号与预期相符吗,统计上显著吗?

第十七页,共五十页,2022年,8月28日若原假设不是

而是

应如何检验?

具体的判断准则,与显著性检验完全相同

其他假设的t检验H0:j=0H0:j=1第十八页,共五十页,2022年,8月28日校园犯罪与注册人数模型估计结果:b1统计上显著大于1吗?

log(crime)=b0+b1log(eroll)+u第十九页,共五十页,2022年,8月28日

t检验的p值t(n-k-1)-t0.025t0.025p/20tp值>0.05,接受原假设t(n-k-1)-t0.025t0.025p/20tp值<0.05,拒绝原假设双侧检验给定t统计量的值,能拒绝原假设的最小显著水平是多少?第二十页,共五十页,2022年,8月28日t(n-k-1)t0.05p0tp值>0.05,接受原假设t(n-k-1)t0.05p0tp值<0.05,拒绝原假设单侧检验H0:j=0H1:j>0若对于(H0:j=0H1:j<0),应如何计算?第二十一页,共五十页,2022年,8月28日将给定的显著性水平与p值比较:若p值<

,则在显著性水平下拒绝原假设若p值

,则在显著性水平下不能拒绝原假设这一准则对于所有的检验都适用第二十二页,共五十页,2022年,8月28日用语的提醒不能拒绝=接受?经济或实际显著性与统计显著性经济或实际显著性取决于参数估计值的大小(及符号)统计显著性取决于t统计量的值样本很大的情况下,标准差很小,此时容易出现统计显

著而经济意义上不显著的情况——使用较小的显著水平样本较小时,标准差较大,容易出现不显著的情况——使用较大的显著水平养老金计划的参与率

其他问题第二十三页,共五十页,2022年,8月28日培训津贴对企业废品率的影响hrsemp显著吗?需要多大的显著水平?第二十四页,共五十页,2022年,8月28日

多重共线性与统计显著性回归参数估计量的方差变大多重共线性使得t

统计量的值()变小接受H0:β=0(不显著)的概率增大

重要的解释变量被舍去,检验失去意义第二十五页,共五十页,2022年,8月28日置信区间第二十六页,共五十页,2022年,8月28日由于:由大括号内不等式表示置信水平为1-α时j的置信区间:得:P{t/2

}=1-

-t/2

0

t/2

第二十七页,共五十页,2022年,8月28日研发支出模型log(sales)系数的置信区间:第二十八页,共五十页,2022年,8月28日案例1:规模报酬是不变的吗?考虑柯布—道格拉斯生产函数模型:

Q=AKL对数化处理后,建立相应的计量模型为:

lnQ=lnA+lnK+lnL+u关于规模报酬不变的原假设可以表示为:

H0:+=1H1:

+1

如何通过模型变换,利用t检验对上述假设进行检验?检验关于参数的单个线性组合假设第二十九页,共五十页,2022年,8月28日定义参数:原假设变换为:t统计量:其中=+H0:=1H1:1第三十页,共五十页,2022年,8月28日能否直接将作为模型参数进行估计?原模型变换为: lnQ=lnA+lnK+(-)lnL+u

即:

=+=-

lnQ=lnA+ln(K/L)+lnL+u若定义参数:原假设变为标准的显著性检验:应如何对模型进行变换?=+-1H0:=0H1:1第三十一页,共五十页,2022年,8月28日任意关于参数单个线性组合的检验都可以同样处理!多受一年专科教育的回报比得上多一年本科教育吗?将“待检验的理论”转化为关于参数的假设:定义参数1=1-2

,原假设为变换后的模型:

ln(wage)=0+1jc+2univ+3exper+uH0:

1

=2

H1:

1

<2H0:1

=0H1:1

<0

ln(wage)=0+1jc+2totcoll+3exper+utotcoll=jc+univ案例2:专科和本科的教育回报相同吗?第三十二页,共五十页,2022年,8月28日估计结果:5%显著水平下,能认为专科和本科的教育回报相同吗?若令2=2

-1:原假设和备择假设是什么?给出变换后的模型形式。能直接给出模型的估计结果吗?结论会发生变化吗?第三十三页,共五十页,2022年,8月28日对于多元回归模型:

y=0+1

x1+2

x2+…+k

xk

+u若自变量x1、

x2、…

xk都无助于解释y,意味着什么?原假设和备择假设:如何检验?

若原假设成立,SSE相对于SSR将很小?

多个线性约束的检验:F检验方程(回归整体)的显著性检验(P143)H0:

1=

2=…=

k=0(或R2=0)

H1:

j(j=1,2,…,k)不全为零SST=SSE+SSR第三十四页,共五十页,2022年,8月28日计算F统计量:或者给定显著性水平α,查找临界值进行判断:若:F<Fα,不能拒绝原假设H0

认为没有自变量有助于解释y。

F>Fα,拒绝原假设H0

认为至少有某些自变量能够解释y。第三十五页,共五十页,2022年,8月28日第三十六页,共五十页,2022年,8月28日

多重共线性的典型表现

当模型的拟合优度(R2)很高,F值很高,但某些重要变量不显著或符号与预期相反(方差很大,t值很低),说明解释变量间可能存在多重共线性。例如:中国电信业务总量变化的影响因素是邮政业务总量、中国人口数、市镇人口占总人口的比重、人均GDP、全国居民人均消费水平。

y=24.94+2.16x1–3.03x2+33.7x3+1.29x4-2.03x5+et(0.7)(1.6)(-0.8)

(1.0)

(1.5)(-1.2)

R2=0.99,F=106.3第三十七页,共五十页,2022年,8月28日棒球运动员薪水模型:若控制加入联盟的年份和每年参加比赛次数,运动员的

表现影响薪水吗?原假设和备择假设:排除性约束:

若原假设为真,控制其他变量的情况下,其对被解释变

量没有影响,应该从模型排除!一般的排除性约束检验

ln(salary)=0+1years+2gamesyr+3bavg+4hrunsyr+5rbisyr+uH0:

3=

4=

5=0

H1:

3、

4和

5不全为零第三十八页,共五十页,2022年,8月28日如何检验?不能通过单个系数的显著性检验实现!模型中某些变量不显著可能是多重共线性造成的,其中某个变量排除后,消除了共线性,其他不显著的变量可能会变得显著。第三十九页,共五十页,2022年,8月28日考虑两种模型:不受约束模型:受约束模型,即认为原假设成立时的模型:若原假设真的成立,即,不受约束模

型和受约束模型的估计结果应该差异不大,两者的残差平方和(SSR)应该比较接近若原假设不成立,受约束回归模型设定错误,两者的SSR差距较大受约束模型的残差平方(SSRr

)和一定不小于不受约束

模型的残差平方和(SSRur),即SSRr

SSRur,为什么?

ln(salary)=0+1years+2gamesyr+3bavg+4hrunsyr+5rbisyr+u

ln(salary)=0+1years+2gamesyr+u

3=

4=

5=0

第四十页,共五十页,2022年,8月28日一般情形:

y=0+1

x1+2

x2+…+k

xk

+u原假设和备择假设:受约束模型:y=0+1

x1+2

x2+…+k-q

xk-q

+uF统计量:H0:

k-q+1=…=

k=0

H1:

j(j=k-q+1,…,k)不全为零分子自由度q:原假设中约束条件个数分母自由度n-k-1:无约束模型的自由度第四十一页,共五十页,2022年,8月28日F统计量的另一种形式给定显著性水平α,查找临界值进行判断:若:F<Fα,不能拒绝原假设H0

xk-q+1、…、xk是联合不显著。

F>Fα,拒绝原假设H0

xk-q+1、…、xk是联合显著的。第四十二页,共五十页,2022年,8月28日不受约束模型受约束模型运动员的表现影响薪水吗?第四十三页,共五十页,2022年,8月28日F统计量和t统计量若原假设是单个参数约束,如F检验和t检验的结论会一致吗?完全一致,因为:区别:

t检验可用于检验单侧对立假设,F检验不行

对于单个参数约束,建议使用t检验问题4.5(p143)H0:j=0H1:j0第四十四页,共五十页,2022年,8月28日对于模型:

y=0+1

x1+2

x2+…+k

xk

+u原假设和备择假设:受约束模型:

将约束条件施加到模型参数中不受约束模型:原始模型F统计量:H0:

参数满足q个约束条件

H1:q个约束条件不全部成立更一般的线性约束检验第四十五页,共五十页,2022年,8月28日住房价格的决定方程:若住房评估理性,则住房出售价格完全决定于其评估价值,评估价值既定时,建筑面积、使用面积和房间数应

该对住房价格没有影响。住房评估理性吗?原假设和备择假设:

ln(price

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论