版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3章双变量模型:假设检验第3章·3.1古典线性回归模型·3.2普通最小二乘估计量的方差和标准差·3.3OLS估计量的性质·3.4OLS估计量的抽样分布或概率分布·3.5假设检验·3.6拟合优度检验:判定系数·3.7回归分析结果的报告·3.8数学S.A.T一例的计算机输出结果·3.9正态性检验·3.10综合实例:美国商业部门工资和生产率的关系·3.11预测·3.12小结2第3章3.1
古典线性回归模型(CLRM)满足如下基本假定的线性回归模型称为古典线性回归模型(Classical
Linear
Regression
Model,CLRM)。基本假定:假定3.1
回归模型是参数线性的,但不一定是变量线性的。模型形式如下:假定3.2
解释变量X与随机扰动项u不相关。(X是确定性变量时自然成立。)假定3.3给定Xi,随机扰动项的期望为零。即图3-1扰动项的条件分布3第3章假定3.4同方差假定,即图3-2a同方差和异方差的对比假定3.5
无自相关假定,即图3-3自相关假定3.6
回归模型是正确设定的。即实证分析的模型不存在设定误差或设定错误。4第3章图3-15扰动项的条件分布第3章图3-2
同方差和异方差的对比6第3章图3-3
自相关uiuiuiujujuja)
b)c)..
.........
...
....
...........
..
......
.无自相关假定表明随机扰动项ui是纯随机的。7第3章3.2
普通最小二乘估计量的方差和标准差在第2章我们已经知道:利用最小二乘原理可以得到双变量模型参数的OLS估计量如下:因为上面的估计量是随机变量,它们的值随样本的变化而变化,我们有必要讨论它们的性质。在讨论这些最小二乘估计量的性质之前,先来看它们的方差。8第3章方差及标准差:(3-4)(3-5)(3-6)(3-7)(3-8)(3-9)回归标准差:我们不加证明地给出上面两个估计量的方差如下:9第3章3.2.1
数学S.A.T一例中的方差和标准差10我们可以根据前面给出的公式计算数学S.A.T一例中估计量的方差与标准差,以及回归标准差。见表3-1。(具体计算见Excel文件)3.2.2数学S.A.T一例小结估计的数学S.A.T函数如下:(3-16)第3章0.00024511第3章Dependent
Variable:
YIMethod:
Least
SquaresSample:
1
10Included
observations:
10VariableCoefficientStd.
Error t-StatisticProb.C432.413816.90607
25.577420.0000XI0.0013320.000245
5.4353960.0006R-squared0.786914Mean
dependent
var507Adjusted
R-squared0.760278S.D.
dependent
var63.77913S.E.of
regression31.22715Akaike
info
criterion9.897309Sum
squared
resid7801.078Schwarz
criterion9.957826Log
likelihood-47.4866F-statistic29.54353Durbin-Watson
stat0.842054Prob(F-statistic)0.000619假设检验12第3章3.3
OLS估计量的性质OLS方法能够得到如此广泛的使用是有原因的。高斯-马尔柯夫定理:若满足古典线性回归模型的基本假定,则在所有线性无偏估计量中,OLS估计量具有最小方差性,即:OLS估计量b1、b2是最优线性无偏估计量.13第3章(3)最小方差性:即b1的方差小于其他任何一个B1的无偏估计量的方差;
b2的方差小于其他任何一个B2的无偏估计量的方差。(1)线性:即b1和
b2是随机变量Y的线性函数。(2)无偏性:即14第3章蒙特卡洛试验(略)在理论上,OLS估计量是无偏估计量,在实际中,我们可以进行蒙特卡洛试验来验证其无偏性。假定已知如下信息:ui服从N(0,4)分布假定X有10个观察值:1,2,3,4,5,6,7,8,9,10试验及试验结果见表3-2蒙特卡洛试验
(书47页),具体操作见Excel文件。15第3章3.4
OLS估计量的抽样分布或概率分布为了求得OLS估计量b1和b2的抽样分布,我们需要在古典线性回归模型的基本假定上再增加一条假定,即:假定3.7
在总体回归函数中,误差项ui
服从均值为0,方差为
的正态分布,即这个假定的理论基础是中心极限定理:大量独立同分布的随机变量的和的分布近似服从正态分布。16第3章图3-4估计量分布的几何图形因为
所以Y服从正态分布,而OLS估计量b1和b2又是正态变量Y的线性函数,所以b1和b2也服从正态分布。有:17第3章18图3-4
估计量分布的几何图形B1a)B2b)b1b2第3章3.5
假设检验在数学S.A.T一例中,1.
零假设、备择假设及其含义假定家庭年收入对学生的数学成绩没有影响,即零假设和备择假设为:置信区间检验目的是想考察自变量X对应变量Y是否有显著影响。尽管估计得到的参数为0.0013,但由于抽样波动性,这一数字到底与0是否有显著性差异,还有待于检验。19第3章可以选择两种方法对参数b1和b2进行假设检验:置信区间法。显著性检验法。202.检验方法第3章3.检验所用统计量及其分布因为:若随机误差的方差已知,即可利用Z统计量来进行假设检验。如果随机误差的方差未知,用其估计值来代替,我们可以利用下面统计量:或21第3章3.5.1
置信区间法接上面例子,假定显著水平α为5%,由于是双尾检验查表可得(注意自由度,自由度=10-2=8):得到B2的95%置信区间为22第3章即,将数学S.A.T一例中的数字代入,得到B2的95%置信区间为[0.00074,0.00187]因为零假设值落入拒绝域,所以拒绝零假设,认为家庭年收入对学生的数学成绩有影响。23因为B2的95%置信区间为第3章3-5图
给出95%置信区间几何图形同理,截距的95%的置信区间为:(3-28)[b2
-2.306se(b2
)]b2[b2
+
2.306se(b2
)]a)0.000740.00187b2
b)24第3章3.5.2
假设检验的显著性检验法已知:在零假设
下,有:(3-29)利用t统计量对模型参数做显著性假设检验的过程称为t检验。25第3章在具体应用t检验时,需要知道:对于双变量模型,自由度总为(n-2)虽然在经验分析中常用的显著水平α有1%,5%,10%,但显著性水平是由个人任意选取。可用于单边或双边检验。26第3章3.5.3
继续学生数学S.A.T一例显著水平0.010.050.10t临界值±3.355±
2.306±
1.86027(1)双边检验零假设:计算得到t值为:根据t分布表,求得t的临界值(双边,自由度为8)为:
(见图3-6)图
3-6
t分布图第3章5%2.5%0.5%图3-6
t分布图-3.355
-2.306
–1.860
0
1.860
2.306
3.355
t
(8
d.f根据上面的表和图,我们可以得到拒绝零假设的结论,也可以利用计算得到的t值所对应的P值更好地看出这一点。5%2.5%0.5%t=5.435428第3章(2)单边检验29图
3-7(a)
t单边检验在学生数学S.A.T一例中,在零假设下计算得到t=5.4354。由于预期模型中的家庭年收入系数为正,因此可利用如下假设:显著水平0.010.050.10t的t
临界值(右边2,.8拒96绝域在1右.8尾60)为:
1.397第3章图3-7单边t检验10%10%5%1%0
1.397
1.860
2.896a)-2.896
–1.860
–1.397
0b)t=
5.43545%1%t(根据上面的表和图,我们可以得到拒绝零假设、接受备择假设的结论。也就是说,可以认为家庭年收入对学生的数学S.A.T有正向影响。30第3章3.6
拟和优度的检验:判定系数本节我们考察估计得到的样本回归直线对真实Y值拟合的优劣程度。总离差平方和(TSS)回归平方和(ESS)
残差平方和(RSS)相关系数31第3章(
图3-8 总变动的分解)(3-37)(3-38)称R2为判定系数,它度量了回归模型对Y的变动解释的程度。判定系数的性质:非负性,若
R2=1
,表示线性模型完全解释的变动,若
R2
=0,表示
Y与X之间无任何关系。平方和分解式:32第3章图3-8
Yi中总变动的分解YX..33第3章3.6.1判定系数的计算公式(3-39)(3-40)34第3章3.6.2学生数学S.A.T一例中的判定系数利用表2-4中的数据和上面计算判定系数的公式,可以计算得到:因为此时的r2较大,可以认为,样本回归函数较好地拟合了总体回归函数。35第3章3.6.3
相关系数样本相关系数是度量两变量X和Y之间线性相关程度的指标,可以利用下面的计算公式得到:(3-42)(3-43)(3-44)(3-45)在回归分析中,判定系数比相关系数更有意义。36第3章在学生的数学S.A.T中,回归分析的结果为:3.7
回归分析结果的报告(3-46)其中,se
对应参数的标准差,t
对应参数在零假设(真实值为0)下计算得到的t值,p对应计算得到的t值的P值。37第3章3.8
博彩支出一例的计算机输出结果38常用软件:EVIEWS,LIMDEP,SHAZAM,TSP,SAS,SPSS,MINTAB有关参考书:计量经济分析方法与建模:Eviews应用及实例,高铁梅主编,清华大学出版社,2006年1月数据分析与Eviews应用,易丹辉,中国统计出版社,2005年12月计量经济学软件Eviews使用指南,张晓峒主编,南开大学出版社,2004年12月。第3章Eviews回归分析简单操作39打开新文件选择序列形式建立数据文件:
data
y
x
或主菜单Quick——Empty
Group;画图:数据框View——Graph或主菜单Quick——Graph;OLS估计:编辑框ls
y
c
x或主菜单Quick——Estimate
Equation;第3章VariableCoefficientStd.
Errort-StatisticProb.C2841.466417.56746.8048070.0000X0.9139580.02781732.856450.0000R-squared0.990822Mean
dependent
var16512.75Adjusted
R-squared0.989904S.D.
dependent
var1209.380S.E.
of
regression121.5168Akaike
info
criterion12.58899Sum
squared
resid147663.3Schwarz
criterion12.66981Log
likelihood-73.53396F-statistic1079.546Durbin-Watson
stat2.347404Prob(F-statistic)0.000000406.在输出结果中考察模型的拟合程度n=12分别是:R2、调整的R2、回归标准差、残差平方和、对数似然函数值、DW统计量、应变量的均值、应变量的标准差、AIC值、SIC值、F统计量及对应P值。第3章学Dep生end数ent学VaSr.iaAb.lTeT:一YI例的计算机输出结果41Method:
Least
SquaresSample:
1
10Included
observations:
10VariableCoefficientStd.
Error t-StatisticProb.C432.413816.90607
25.577420.0000XI0.0013320.000245
5.4353960.0006R-squared0.786914Mean
dependent
var507Adjusted
R-squared0.760278S.D.
dependent
var63.77913S.E.of
regression31.22715Akaike
info
criterion9.897309Sum
squared
resid7801.078Schwarz
criterion9.957826Log
likelihood-47.4866F-statistic29.54353Durbin-Watson
stat0.842054Prob(F-statistic)0.000619第3章3.9
正态性检验正态性检验是用于检验误差项ui是否服从正态分布。在实际应用中,我们是对ui的估计值残差ei作正态性检验。3.9.1
残差直方图这里我们主要利用残差的直方图来考察残差的分布。具体操作如下:将残差按顺序从小到大排列,再将其划分为若干适当的区间,计算残差落入每个区间的频数(或频率),将频数(或频率)做成直方图,观察直方图的图形是否与钟型正态曲线近似,以此说明残差的正态性。42第3章43频
数1
-2
-0.5
1.0
1.5-------2.0
-1.5
-1.0-
-0.5
0.0残差-直方图JB检验第3章3.9.2
正态概率图44在正态概率纸上作图。正态概率纸是一种特殊刻度的坐标纸,将残差画在正态概率纸上可以帮助我们直观地判断它是否属于正态分布。可以自己做出正态概率图(可参看《概率论与数理统计》,茆诗松等编著,中国统计出版社,
2002.5),也可利用Minitab软件得到。见Minitab具体操作。第3章.999
–.990
–.950
–.800
–.500
–-----1.0.........200
–.050
–
..010
–.001
---0.5回归方程的残差45率Average:-0.0000000StDev:0.4716440.0
0.5A-Squared:0.250P-Value:0.664N:10第3章3.9.3
Jarque-Bera检验另一种常用的正态性检验是Jarque-Bera(JB)检验,它是依据OLS残差,对大样本的一种检验方法。首先计算残差的偏度系数S和峰度系数K(对于正态分布变量,偏度为0,峰度为3),利用如下检验统计量进行假设检验。检验统计量:
(3-47)正态假定下,
(3-48)46第3章如果变量服从正态分布,则S为0,K为3,因而统计量的值为零。47如果计算得到:偏度系数为-0.410553,表明残差是负偏的,峰度系数为1.2918,表明残差的分布比正态分布略胖。由此计算得到的JB统计量的值为1.4968,对应p值为0.4731,说明我们不能拒绝零假设,即可认为残差是服从正态分布的。但这个结论并不准确,如果只有10个观察值,小样本情形下,JB检验是无效的。第3章3.10
综合实例:美国商业部门工资和生产率的关系表3-3给出了1959~2006年间美国商业部门劳动生产率和工资数据。设Y表示实际工资,X表示劳动生产率,模型为:对X、Y作散点图,可以看出Y与X有较强的正相关。各种分析见Eviews文件。48第3章3.11
预测给定自变量X的值,可以利用已经得到的样本回归方程对相应应变量Y的均值(E(Y|X))进行点预测和区间预测。对给定的Xi,利用样本回归方程计算得到的称为E(Y
|
Xi)的点估计值(点预测值)。49第3章在CLRM假定下,可以证明估计量
服从正态分布,其均值和方差分别为:(3-51)继续学生数学S.A.T一例,假定变量X(收入)取某一值X0,(比如X0
=78000美元),现在估计这类家庭学生数学S.A.T的平均成绩,即E(Y|X0
),
因为=E(Y|X0)的估计量在CLRM假定下,
=432.4138+0.0013*78000=533.8138
(3-50)区间预测:50第3章当随机扰动项方差未知时,我们可用其无偏估计量残差方差代替,所以我们可用t分布对E(Y
|
Xi)建
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 纸制品行业品牌价值评估与市场推广考核试卷
- 医疗设备的智能监测与预测性维护技术考核试卷
- 新能源汽车电驱动系统效率分析考核试卷
- 通信设备在智能社区建设中的作用考核试卷
- 消费级机器人行业市场细分与竞争格局考核试卷
- 年金保险合同纠纷案例分析考核试卷
- 矿山放射性职业健康与安全管理考核试卷
- 环境保护与绿色选矿考核试卷
- 通信设备专业级物联网设备互操作性考核试卷
- 石油化工实验课程设计
- 读懂诗家语省公开课金奖全国赛课一等奖微课获奖课件
- 分包质量管理协议
- 小学思政课活动实施方案
- 多发骨折的应急预案
- 《液压爬升模板工程技术标准 JGJT+195-2018》详细解读
- 幼儿园小班语言绘本《藏在哪里了》课件(修改版)
- 人教版八年级英语上册U1-A-(GF-3c)-教学课件
- 阿尔茨海默病的认知训练
- 政府机关餐饮服务食堂餐饮服务方案
- 细菌性肺炎的护理措施
- 金融消费权益保护培训课件
评论
0/150
提交评论