![伍德里奇计量经济学中文答案汇编_第1页](http://file4.renrendoc.com/view12/M03/04/3C/wKhkGWbWw9aAUanxAAFxTCSMwf4604.jpg)
![伍德里奇计量经济学中文答案汇编_第2页](http://file4.renrendoc.com/view12/M03/04/3C/wKhkGWbWw9aAUanxAAFxTCSMwf46042.jpg)
![伍德里奇计量经济学中文答案汇编_第3页](http://file4.renrendoc.com/view12/M03/04/3C/wKhkGWbWw9aAUanxAAFxTCSMwf46043.jpg)
![伍德里奇计量经济学中文答案汇编_第4页](http://file4.renrendoc.com/view12/M03/04/3C/wKhkGWbWw9aAUanxAAFxTCSMwf46044.jpg)
![伍德里奇计量经济学中文答案汇编_第5页](http://file4.renrendoc.com/view12/M03/04/3C/wKhkGWbWw9aAUanxAAFxTCSMwf46045.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学习-----好资料第1章计量经济学的性质与经济数据2.经济模型变成计量模型学习-----好资料(2)时间序列数据的特征4.面板或纵列数据(2)面板数据与横截面数据的比较数据),比得到混合横截面数据更加困难。2.其他条件不变学习-----好资料更多精品文档学习-----好资料些?吗?请解释。更多精品文档学习-----好资料第1篇横截面数据的回归分析第2章简单回归模型y=βo+βx+u2.回归术语yx因变量响应变量回归子自变量预测变量回归元(2)零条件均值假定的意义更多精品文档得到和整理后便得到根据求和运算的基本性质,有一旦确定了OLS截距和斜率估计值,就能够建立OLS回归线:1.拟合值和残差2.OLS统计量的代数性质(1)OLS残差和及其样本均值都为零。数学表述为:(2)回归元和OLS残差的样本协方差为零。3.定义总平方和(SST)、解释平方和(SSE)和残差平方和(SSR)更多精品文档学习-----好资料度量了u,的样本变异。y的总变异总能表示成解释了的变异和未解释的变异SSR之和。因此,4.拟合优度拟合优度R²,有时又称为判定系数,被定义为R²是解释变异与总变异之比,因此被解释成y的样本变异中被x解释的部分。因为SSE不可能大于SST,所以R²的值总介于0和1之间。回归方程中的R²过低是很正常的,对于横截面分析来说,一个看似很低的R²值,并不意味着OLS回归方程没有用。(1)当因变量的度量单位改变时,很容易计算出截距和斜率估计值的变化。若因变量乘以一个常数c(意味着样本中的每个数据都乘以c),则OLS截距和斜率的估计值都扩大为原来的c倍。(2)若自变量被除以或乘以一个非零常数c,则OLS斜率系数也会分别被乘以或者除以c。(3)仅改变自变量的度量单位,不会影响截距估计值。(4)模型的拟合优度不依赖于变量的度量单位。利用R²的定义可知,R²事实上不因y或x的单位变化而改2.在简单回归中加入非线性因素一个给出百分比影响(近似)为常数的模型是:定义因变量为y=logy,自变量为x=logx,这个模型就变成了简单回归模型。3.对数函数的几种形式表2-2含对数的函数形式总览模型水平值一对数对数一对数因变量自变量对A的解释一般性模型同样允许非线性关系的存在。关键是,方程中的参数β和β₁是线性的,至于被解释变量和解释变量有何联系,并没有限制。1.OLS的无偏性(1)相关假定假定SLR.1(线性于参数)其中,β和β₁分别表示总体的截距和斜率参数。假定SLR.2(随机抽样)假定SLR.3(解释变量的样本有变异)假定SLR.4(零条件均值)给定解释变量的任何值,误差的期望值都为零,E(ulx)=0。斜率估计量为可转换为(3)定理2.1:0LS的无偏性更多精品文档2.OLS估计量的方差(1)相关假定假定SLR.5(同方差性)(2)定理2.2:OLS估计量的抽样方差3.误差方差的估计(1)误差与残差的区分更多精品文档一方面,残差则出现在使用β和β的估计方程中。误差是无法观测的,但残差却可以从数据中计算出来。把残差写成误差的函数:ù,=y₁-βo-βx₁=(βo+βx₁+u,)-或者(2)σ²的无偏估计量(3)定理2.3:σ²的无偏估计更多精品文档 使用普通最小二乘法,此时最小化的残差平方和为新的截距项为α₀+β,斜率不变为β1。2.下表包含了8个学生的ACT分数和GPA(平均成绩)。平均成绩以四分制计算,且保留一位小数。12345678(I)利用OLS估计GPA和ACT的关系;也就是说,求出如下方程中的截距和斜率估计值评价这个关系的方向。这里的截距有没有一个有用的解释?请说明。如果ACT分数提高5分,预期GPA会提高多少?(Ⅱ)计算每次观测的拟合值和残差,并验证残差和(近似)为零。(IV)对这8个学生来说,GPA的变异中,有多少能由ACT解释?试说明。更多精品文档(Ⅱ)每次观测的拟合值和残差表如表2-3所示:表2-3û12345678根据表可知,残差和为-0.002,忽略固有的舍入误差,残差和近似为零。R²=1-SSR/SST=1-0.4377/1.0GPA的变异中,有57.7%能由ACT解释。更多精品文档学习-----好资料答:(I)构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响SAT的因素是独立的。然后收集实验中每个学生SAT的数据,建立样本{(sat,,hour):i=1,…,n},n表示试验中所包括的学(Ⅱ)误差项还可能包含以下三个因素:天赋能力、家庭收入以及考试当天的健康状况。如果学生拥有天赋能力,那么他们不需要为考试花费太多时间,能力与时间是负相关的。家庭收入与学习时间呈正相关关系,因为家庭收入越高,就能负担去越多的课时费用。排除慢性的健康问题,考试当天的健康状况与为准备考试花费的时(Ⅲ)如果备考课程有效,β₁的符号应该为正,在(IV)截距有一个有用的解释:因为E(U)=0,β。表示备考时间为0时学生获得的平均sat总分。其中,e是一个随机变量,且有E(e)=0和Var(e)=σ²,假设e独立于inc。(I)证明:若E(ulinc)=0,则满足零条件均值的关键假设(假定SLR.4)。[提示:若e独立于inc,则E(ulinc)=E(e)](Ⅱ)证明:若Var(ulinc)=σ²inc,则不满足同方差假定SLR.5。特别地,sav的方差随着inc而增加。[提(Ⅱ)利用(I)及(IV)利用(Ⅱ)和(Ⅲ)证明:更多精品文档公式右边等于0。从(I)可知,7.利用KielandMcClain(1995)有关1988年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋价格(price)和距离一个新修垃圾焚化炉的距离(dist)之间的关系:弹性是0.312,即距离远1%,价格上升0.312%。(Ⅲ)房屋的面积、洗手间的数量、占地面积大小、房龄社区质量(包括学校质量)都会影响房屋的售价。这些与距离焚化炉的远近是有关的。更多精品文档(Ⅲ)因为1og(c₁v.)=log(c₁)+log(y.),令Gq代替log(c₁),y.更多精品文档其是收入处于较低的水平上时)是薄弱的。从年同比角度而言,124.84美元与0美元的差距并没有那么大。(Ⅱ)将30000美元代入方程:预计消费=-124.84+0.853×30000=25465(美元)。(Ⅲ)MPC和APC如图2-1所示。即使截距是负的,样本中最小个mc图2-1不等。]因此更多精品文档学习-----好资料,bwght=119.77-0.514cigs更多精品文档学习-----好资料第3章多元回归分析:估计(1)多元回归分析(2)多元回归分析的假定(1)多元回归模型y=βo+βx₁+β₂x₂+β₃x₃+1.如何得到OLS估计值(1)包含两个自变量模型的估计(2)含有k个自变量模型的估计学习-----好资料x的系数度量的是,在所有其他条件不变的情况下,因提高一个单位的x₁而导致y的变化。即在保持(1)拟合值和残差更多精品文档8.拟合优度(1)总平方和(SST)、解释平方和(SSE)和剩余平方和或残差平方和(SSR)可以证明将方程两边同时除以SST得到:(2)拟合优度③有关R²的一个重要事实在回归中多增加一个自变量后,它绝对不会减小,而且通常会增大。因为在模型中多增加一个回归元时,按照定义,残差平方和绝对不会增加。回归中增加任何一个变量都不会使R²减小的事实,使得用R²作为判断是否应该在模型中增加一个或几个变量的工具很不适当。判断一个解释变量是否应放入模型的因素是,这个解释变量在总体中对y的偏效应是否非零。9.过原点的回归(1)过原点回归的定义具体方程如下:(2)过原点回归的特点①0LS残差的样本平均不再是零。②如果R²被定义为R²=1-SSR/SST,而SSR现在是R²实际上可能为负。这意味着样本平均y比解释变量更多地“解释”了y,的变异。要么应该在回归中包含一个截距项,要么断定解释变量对三、0LS估计量的期望值以下假定都是对简单回归模型假定的直接推广,而且在这些假定之下,OLS估计量是总体参数的无偏估计。更多精品文档学习-----好资料(1)假定MLR.1(线性于参数)其中βo,β,…,β是未知参数(常数),而u则是无法观测的随机误差或随机干扰。(2)假定MLR.2(随机抽样)借助模型y=β+βx+β₂x₂+β₃x₃+…+βkxk+u,从y对x₁,x,…,x.的回归中得到的OLS估计量β,食,β,…,β,现在被看作是β,β,…,β的估计量。(3)假定MLR.3(不存在完全共线性)(4)假定MLR.4(条件均值为零)(5)定理3.1:0LS的无偏性学习-----好资料2.在回归模型中包含了无关变量(1)遗漏变量偏误Bias(R)=E(R)-β=β₂δ(2)β₁无偏的两种情况偏误为正偏误为负偏误为负偏误为正(4)与偏误有关的术语学习-----好资料4.遗漏变量的偏误:更一般的情形很难得到β和β偏误的方向,因为x,x₂和x₂可能会两两相关。(1)假定MLR.5(同方差性)这个假定不成立,那么模型就像在两变量情形中一样表现出异方差性。假定MLR.1~MLR.5一起被称为(横截面回归的)高斯-马尔可夫假定。(2)定理3.2:OLS斜率估计量的抽样方差在假定MLR.1~MLR.5之下,以自变量的样本值为条件,对所有的J=1,2,…,k,都有:2.OLS方差的成分:多重共线性(1)误差方差σ²σ²越大意味着OLS估计量的方差就越大。方程中的“噪音”越多(σ²越大),使得估计任何一个自变量对y的偏效应都越困难,这将通过OLS斜率估计量的较大方差反映出来。由于σ²是总体的一个特征,所以它与样对于一个给定的因变量y,确实只有一个办法减少误差方差,即在方程中增加更多的解释变量(将某些因素从误差项中剔除出来)。更多精品文档学习-----好资料var(r)=o²/[SSr(1-r²)],其中R²是x,对x₂(含截距)进行简单回归所得到的R²由于R²度量了拟合优合。个或多个自变量之间高度(但不完全)相关被称为多重共线性。(4)多重共线性的界定和解决方法在R²“接近”于1的情况下估计β,可能会导致多重共线性时,把“接近”一学习-----好资料3.误设模型中的方差(2)当β₂=0时,官和食都是无偏的,而且Var(R)<var(R)。c.方差公式取决于样本中x,和x₂的值,这就为p,提(1)残差和自由度(2)定理3.3:σ²的无偏估计(3)β,的标准差更多精品文档学习-----好资料由于σ未知,所以用其估计量合来取代,则:五、0LS的有效性:高斯-马尔可夫定理1.最优线性无偏估计量(4)“最优”:最优被定义为最小方差。2.定理3.4:高斯-马尔可夫定理(1)主要内容假定MLR.1~MLR.5被称为(横截面数据分析的)高斯-马尔可夫假定。(2)高斯-马尔可夫定理的重要性当这个标准假定集成立时,不需要再去寻找其他无偏估计量:没有一个会比OLS更好。如果高斯-马尔可夫假定中的任何一个不成立,那么这个定理也就不再成立。零条件均值的假定(假定MLR.4)不成立会导致OLS产生偏误,异方差性(假定MLR.5不成立)虽不致使OLS有偏,但它在线性无偏估计量中不再具有最小方差。3.2课后习题详解1.用WAGE2.RAW中有关男工人educ=10.36-0.094sibs+0.131meduc(i)sibs是否具有预期的影响?请给出解释。保持meduc、feduc不变,为了使预测的受教育程度减少一年,需要sibs增加多少?(这里不要求答案为整数。)(ii)假设一个男工人A没有兄弟姐妹,其父母都接受了12年的教育。另一个男工人B也没有兄弟姐妹,但其父母都接受了16年的教育。预计B和A所接受教育的年数差别为多少?答:(i)sibs具有预期的影响。家庭中兄弟姐妹的数量越多,每一个小孩受教育的年数都会减少。为了使预更多精品文档colgpa=1.392-0.0135hsper其中,colgpa以四分制度量,hsper上前5%之列),而sat是在学生能力测验中数学和语言的综合成绩。样本中相当于一倍的标准差),那么,预计这两个学生的大学GPA相差多少?这个差距大吗?colgpa=1.392-0.0135×20+0.014log(salary)=βo+βLSAT+β₂GPA+β₃log(libvol)+β₄l更多精品文档排名相差20位的价值为:100×0.0033×20=6.6%。4.下面这个模型是BiddleandHamermesh(1990)所用多元回归模型的一个简化版本,原模型研究睡眠时间和工作时间之间的取舍,并考察影响睡眠的其他因素:sleep=βo+βtotwrk+β₂educ+β₃ag其中,sleep和totwrk都以分钟/周为单位,而educ和age则以年为单位。(也可参见计算机习题C2.3。)(i)如果成年人为工作而放弃睡眠,β₁的符号是什么?(ii)你认为β₂和β₃的符号应该是什么?(iii)利用SLEEP75.RAW中的数据,估计出来的方程是sleep=3638.25-0.148totwrk-1如果有人一周多工作5个小时,预计sleep会减少多少分钟?这是一个很大的舍弃吗?(iv)讨论educ的估计系数的符号和大小。(v)你能说totwrk,educ和age解释了sleep的大部分变异吗?还有什么其他因素可能影响花在睡眠上的时(ii)β₂的符号不明确。一些人认为更高教育水平的人想获得更多,其他条件相同的情况下,他们休息的较少,此时β₂<0。睡眠与年龄之间的关系比模型描述的更为复杂,经济学家不能很好的判断这件事情。(iii)因为totwrk都以分钟/周为单位,因此将时转化为分可得,△totwrk=5×60=300。预计睡眠将会下降0.148×300=44.4(分)。对一周而言,这并不是一个很大的舍弃。(iv)受教育年限educ越多暗示着预计睡眠时间越少,但是这种影响是很小的。假设在其他条件不变的情况下,大学和高中的区别是四年间大学学生每周睡眠时间少休息45分钟。(v)不能,totwrk、educ和age只解释了11.3%的sleep的变异。一个包含在误差项中的重要因素是总体健康状况。另一个重要因素是婚姻状况,以及是否有孩子。健康、婚姻状况、孩子的数量和年龄与totwrk是相关的。5.考虑含有三个自变量的多元回归模型,并满足假定MLR.1~MLR.4,你对估计x₁和x₂的参数之和感兴趣;把这个和记为θ₁=β₁+β₂。(ii)求出用Var()、Var()和6.在一项调查大学GPA与在各种活动中折耗费时间之关系的研究中,你对几个学生分发了调查问卷。学生被问到,他们每周在学习、睡觉、工作和闲暇这四种活动中各花多少小时。任何活动都被列为这四种活动之一,所以对每个学生来说,这四个活动的小时数之和都是168。中,保持sleep,work和leisure不变而改变study是否有意义?(ii)解释为什么这个模型违背了假定MLR.3。(iii)你如何才能将这个模型重新表述,使得它的参数具有一个有用的解释,而又不违背假定MLR.3。答:(i)没有意义。因为四种活动的总时间固定为168小时,其他三种不变,则study时间也不会改变。一个观测值都成立,因此违背了MLR.3。(iii)应该去掉一个解释变量leisure,模型变为:更多精品文档学习-----好资料avgprod=βo+βavgtrain+β同?请解释。哪个更小?请解释。,,,由于随机误差项的均值为0,因此这不完全是z和x样本协方差,因为并没有除以n-1。但为了简化计算而使(ii)因为每一种税收分担一个比例(最大为1,此时其他税收所占份额为0),因此增加1单位的财产税收更多精品文档学习-----好资料第4章多元回归分析:推断4.1复习笔记一、0LS估计量的抽样分布1.假定MLR.6(正态性)2.经典线性模型就横截面回归中的应用而言,从假定MLR.1~MLR.6这六个假定被称为经典线性模型假定。将这六个假定下的模型称为经典线性模型(CLM)。总结CLM总体假定的一种简洁方法是:误差项的正态性导致OLS估计量的正态抽样分布:3.中性极限定理的缺陷(1)u中的众多因素可能各有极为不同的总体分布,但中心极限定理(CLT)在这些情形下仍成立,这种正态近似可能不那么好。(2)更严重的问题是,它假定所有不可观测因素都以独立而又可加的方式影响着Y。如果u是不可观测因素的一个复杂函数,那么CLT论证并不真正适用。4.误差项的正态性导致OLS估计量的正态抽样分布定理4.1:正态抽样分布在CLM假定MLR.1~MLR.6下,以自变量的样本值为条件,有:更多精品文档1.总体回归函数3.检验虚拟假设H₀:β;=0(1)单侧对立假设检验更多精品文档H₀:β=0H₁:β;≠0(5)对经典假设检验用语的提醒更多精品文档③在处理大样本时,除了看t统计量外,对系数的大小加以解释也特别重要。对于大样本容量,参数可以估(7)检验变量在多元回归模型中的经济和统计显著性的准则②如果一个变量在通常的显著性水平(10%、5%或1%)上不是统计显著的,但如果这个变量对y具有很大四、检验关于参数的一个线性组合假设原虚拟假设与对立假设为:H₀:β₁=β₂:H₁:β<β₂将虚拟假设和对立假设分别重新写成:Ho:β₁-β₂=0;H:β-β₂<0t统计量表示为:接下来进行t检验步骤即可。1.对排除性约束的检验检验一组自变量是否对因变量都没有影响。更准确地说,虚拟假设是,在控制了一些变量之后,余下的那些变量对y没有任何影响。对多重约束进行的检验被称为多重假设检验或联合假设检验。一个特定的t统计量只能检验一个对其他参数没有限制的假设,因此必须导出一个对多重约束的检验。2.推导F检验统计量将具有k个自变量的不受约束模型写成:不受约束模型中的参数有k+1个。假设有q个排除性约束要检验:即虚拟假设表示,有q个变量的系数为零。假定这q个变量是自变量中的最更多精品文档当从不受约束模型变为受约束模型时,SSR的相对增加对检验假设而言应该是有意义的。定义F统计量为q=分子自由度=df-df,表明q是受约束模型与不受约束模型的自由度之差。(df=观测次数-被估计参数的个数。)由于受约束模型参数较少,而每个模型都使用同样的n次观测,所以df总是大于d。3.F统计量和t统计量之间的关系(1)检验单个变量之排除性的F统计量,等于对应t统计量的平方。(2)F统计量和t统计量适用与单侧检验和双侧检验的情况①因为t--具有F,n--分布,所以在双侧对立假设下,这两种方法得到完全一样的结果。②由于t统计量可用来检验单侧对立假设,所以它对于检验单个参数假设就更灵活。还因为t统计量比F统计量更容易获得,所以实在没有理由使用F统计量对单个参数假设进行检验。(3)F统计量和t统计量适用与单个检验和联合检验的情况两(或多)个各自具有不显著t统计量的变量,合起来可能十分显著。还有一种可能,在一组解释变量中,一个变量具有显著的t统计量,但在常用的显著性水平上,这组变量却不是联合显著的。虽然规定F统计量用于侦查一组系数是否异于零,但它绝不是判断单个系数是否异于零的最佳检验。t检验最适合检验单个假设。当一个变量十分显著时,将它与其他某组变量联合检验,结果便是联合显著的。在这种情形中,同时拒绝这两个虚拟假设并不存在逻辑上的不一致。4.F统计量的R²型(1)使用受约束模型和不受约束模型的R²来计算F统计量更方便的原因①R²必定介于0和1之间,而SSR则在很大程度上依赖于度量单位,使得基于SSR的计算繁冗。②R²在几乎所有的回归中都会报告,而SSR则不然,使用R²来检验变量的排除就较容易。5.计算F检验的p值p值对报告F检验的结果特别有用。由于F分布取决于分子和分母的自由度,所以只是看一下F统计量的值或一两个临界值,对拒绝虚拟假设之证据的强弱很难有直观感觉。在F检验的背景下,p值被定义为p值=P(f>F)p值的解释:给定虚拟假设是正确的,观察到的F值至少和所得到的F值一样大的概率。6.回归整体显著性的F统计量更多精品文档学习-----好资料在含有k个自变量的模型中,可以把虚拟假设写成用参数表示,这个虚拟假设就是所有的斜率参数都是零:H₀:β₁=β₂=…=βk=0在式中有k个约束,得到受约束模型该估计式的R²为零。因为没有解释变量,所以y中的变异一点都没有得到解释。F统计量可写成7.检验一般的线性约束检验排除性约束仍是F统计量最重要的应用。但有时候,一种理念所蕴涵的约束,比仅仅排除某些自变量更为复杂,仍可以直接使用F统计量进行检验。因变量不同的模型,不能使用F统计量的R²型。1.所估计的OLS系数估计值总应该报告对于分析中的关键变量,对所估计的系数做出解释。2.标准误标准误总是应该与所估计的系数一起包括进来,原因在于:(1)标准误有助于判断被检验的虚拟假设,虚拟假设并非总是总体参数为0;(2)有助于计算置信区间。更多精品文档学习-----好资料3.回归的R²也总应该包括进来(2)简化排除性约束F统计量的计算。1.考虑一个用企业年销售额、股本回报率(roe,以百分数表示)和企业股票log(salary)=β₀+β₁log(sallog(salary)=4.32+0.280log(sales)+0.0174(iv)你最后会在一个用企业业绩表示CEO报酬的模大的影响。小于临界值,因此在10%的显著水平上不能拒绝虚拟假设,即ros对salary没有影响。了假定MLR.3。(ii)CLM假定除了排除相关系数等于1的情况外,并没有涉及自变量之间的相关性。(i)例4.7中待估计的总体模型可写成利用1987年的43个观测,所估计的方程是log(scrap)=11.73-0.042hrsemp-0.951log(sales)+0.(4.57)(0.019)将这个方程与仅用样本中29个非工会企业估计出来的结果进行对比。更多精品文档log(scrap)=11.74-0.042hrsemp-0.951log(saleslemploy)+0.041log(emp 因变量:log(salary)自变量—第二个结论看起来令人惊讶,但它正是反映了“明星”效应:企业从公司外部聘用CEO都倾向于一小群被高度评价的候选人,因此这些人的工资被哄抬起来,而非CEO职员的聘用不大可能像CEO一样。5.在4.5节,我们使用了一个检验住房价格定价理性的例子。在那里,我们使用了price和as-sess的一个对数一对数模型[参见方程(4.47)]。这里,我们采用一个水平值一水平值的表述。price=β+β₁assess+u若β₁=1和βo=0,则评价是理性的。所估计的方程是price=-14.47+0.976assessn=88,SSR=165644.51,R²=什么?更多精品文档(ii)现在检验模型price=βo+βassess+β₂lotsize+β₃sqft+β₄bdrms+u。假设H₀:β=0,β₃=0和β₄=0。利用同样88个住房数据估计这个模型的R²是0.829。答:(i)自由度为88-2=86,在5%的显著性水平下,双侧检验的临界值是1.987。Ho:βo=0的t统计量为0.89,因此不能拒绝虚拟假设。Ho:β₁=1的t统计量为(0.976-1)/0.049≈-0.49,同样是查表可得,1%显著水平上,自由度分别为2和90的临界值为4.85,因此拒绝虚拟假设。(iii)采用R²型的F统计量,无约束模型中的自由度为88-5=83。F统计量为:在10%的显著性水平上,临界值为2.15,因此不能拒绝原假设。此时p值为0.23。(iv)如果存在异方差性,则违背了MLR.5,在零假设条件下,F统计量服从F分布。因此,将F统计量6.回归分析还可以用来检验市场是否在评价股票时有效地使用了市场信息。为简单起见,令return为持有一个企业的股票在从1990年末到1994年末的四年时间内得到的总回报。有效市场假设认为,这些回报不应该与1990年知道的信息存在系统相关性。如果在期初知道的企业特征有助于预测股票回报,那我们在选择股票时就则表示CEO的总报酬。 return=-36.30+0.327dkr+0.069eps-4.741og(netinc)+7.245%的显著性水平,分子自由度为4,分母自由度为137的临界值为2.45,大于F统计量,因此不能拒绝虚变量dkh的t统计量最大,为1.6,小于临界值1.96,因此在5%的显著性水平下,不存在个别显著的解释变更多精品文档7.考虑例4.3中的估计方程,这个方程可以被用来研究缺课对大学平均成绩的影响:colGPA=1.39+0.412hsGPA+0.015ACT-(ii)不能。因为0.4位于置信区间内。(iii)能。因为1在置信区间以外。8.在习题3.4中,我们估计了方程sleep=3638.25-0.148totwrk-11.13educ+2.20a其中的标准误是我们现在才同估计值一并给出的。sleep=3586.38-0.151totwrk在5%的显著性水平上,educ和age在原方程中是联合显著的吗?说明你所给答案的理由。(iii)在模型中包括educ和age,是否显著影响所估计的睡眠和工作之间的替换关系?答:(i)自由度为:706-2=704;在双侧检验中,5%的显著性水平上,标准临界值为1.96,educ的t统计为0.019,因此变量在2%的显著性水平上联合显著。log(rent)=β₀+β₁log(pop)+β₂log(avgi更多精品文档ty=βo+(θ₁+3β₂)X₁+β₂X是一个很大的影响吗?(1)证明过程plimβ=β₁+Cov(x,u)/Var(假定MLR.4′与假定MLR.4的比较:①假定MLR.4′是一个更自然的假定,因为它直接得到普通最小二乘估计值。②使用假定MLR.4的原因总结为:如果误差与任何一个自变量相关,那么OLS就是有偏而又不一致的估计。它就意味着,随着样本容量的增加,偏误将继续存在。plimβ-β=Cov(x,u)/Var1.定理5.2:OLS的渐近正态性在高斯-马尔可夫假定MLR.1~MLR.5下,;(3)对每个j,都有:se(β,)就是通常的OLS标准误。定理5.2的重要之处在于,它去掉了正态性假定MLR.6。对误差分布唯一的限制是,它具有有限方差。还对u假定了零条件均值(MLR.4)和同方差性(MLR.5)。标准正态分布在式中出现的方式与t_-1分布不同。这是因为这个分布只是一个近似。实际上,由于随着自2.其他大样本检验:拉格朗日乘数统计量(1)包含k个自变量的多元回归模型检验这些变量中最后q个变量是否都具有零总体参数对立假设:这些参数中至少有一个异于零。LM统计量仅要求估计约束模型。于是,假定进行了如下回归更多精品文档1.简单回归模型plimβ₁=β₁+Cov(z,u)/Cov(z3.定理5.3:OLS的渐近有效性5.2课后习题详解更多精品文档pctstck=βo+βfunds+β₂risktol+u律。更多精品文档y₁-y=β₁(x₁-x₁)+β₂(x₁₂-x)+…+β1.对数式模型(1)一般估计模型举例及解释更多精品文档(2)使用自然对数的优势(或极端)观测不是那么敏感。(3)使用对数的劣势2.含二次式的模型更多精品文档那么就有如下近似:转折点为x的系数和x²系数的两倍之比:3.含有交互作用项的模型考虑包含两个解释变量和一个交互项的模型:将模型重新参数化为:y=α₀+δ₁x+δ₂x₂+β₃(x-H)(效应。三、拟合优度和回归元选择的进一步探讨经典线性模型假定中没有要求R²必须大于某个特定值。R²无非就是Y的变异中有多少能用总体中的x,x₂,…x,解释。零条件均值假定MLR.4只是确定是否得到了自变量其他条件不变之影响的无偏估计量,而R²的大小与此则没有直接关系。更多精品文档能抵消较大的误差方差:如果有足够的数据,即便没有控制许多无法观测的因素,也可能精确地估计偏效应。在方程中增加变量时,R²的相对变化则十分有用:检验联合显著性的F统计量,关键取决于无约束模型和约束模型的R²之差。p²=1-o²1o²故可以得到调整R²: 3.利用调整R²在两个非嵌套模型中进行选择在两个非嵌套模型之间进行选择时,利用R²有一个重要的局限性:不能用它在因变量的不同函数形式之间4.回归分析中控制了过多的因素如果过分强调拟合优度,就会在回归模型中无所顾忌地控制一些不应该控制的因素。在多元回归中所谓控制因素过多,通常是担心遗漏一个重要变量可能带来潜在偏误。但重要的是记得多元回归的其他条件不变的性质。在有些情形中,某些因素应该随着一个政策变量的改变而有所变化,保持这些因素不变就没有意义。5.增加回归元以减少误差方差有些自变量尽管与因变量相关,但也不应该包括在回归模型中。在回归中增加一个新的自变量会加剧多重共线性的问题。另一方面,由于从误差项中取出了一些因素作为解释变量,所以总可以减少误差方差。对于那些既影响Y而又与所有所关心的自变量都无关的自变量,总是应该把它们包含进来。增加这样一个变量,不会导致总体出现多重共线性,但却可以减小误差方差。在大样本容量的情况下,所有OLS估计量的标准误都将减小。1.预测的置信区间令c₁,c₂,…,c分别表示k个自变量中每一个自变量的具体值,对参数更多精品文档logy=βo+βx+β₂x₂+…+βxk其中,6.2课后习题详解1.在例4.2中,因变量是学生通过十年级数学考试(math10)的百分比,将scill(十一年级学生通过科学考试的百分比)作为另一个解释变量讲得通吗?答:这样是没有意义的。在数学上和科学上的表现都是对教育过程产出的衡量,本题想了解的是不同的教育投入和学校特性是怎样影响数学和科学成绩的。例如,如果全体员工与学生的比率对两种考试的成绩均有影响,为什么要将科学成绩保持不变,同时研究全体员工与学生的比率对数学通过率的影响。这是一个在回归方程中控制太多变量的例子。在类似的回归方程中,变量scill可以作为一个因变量。个95%预测区间就是(i)对于合的哪些取值,这个点预测会位于上述95%置信区间中?在绝大多数应用中,这个条件看起来有可能成立吗?更多精品文档学习-----好资料exp(ô²12)≤exp(-1.960),或者引入自然对数,则ô²12≤-1.960,即σ²≤2(1.96o)=3.92σ。因此在95%的置信(ii)在CEO薪水的例子中,ô=0.505,小于3.92,因此第(i)部分中的条件成立。3.如下模型使得受教育回报还取决于父母双方受教育程度的总和pareduc:log(wage)=βo+βeduc+β₂educ·pareduc(i)在这个模型中,证明多受一年教育对wage的△log(wage)/△educ=₁+β₂pareduc你认为β₂的符号是正还是负?为什么?△log(wage)=β△educ+β₂△edu或者说0.62%。更多精品文档Patooto)(ii)应该包含SAT和hsGPA作为解释变量吗?请解释。(ii)应该包含SAT和hsGPA作为解释变量,因为他们衡量了学生的能力和动机。大学中的饮酒行为是与一个人在高中时期以及标准化测试时的表现相关的。其他变量如家庭背景等也可以作为控制变量加入模型中。5.使用RDCHEM.RAW中的数据,通过0LS得到如下方程rdintens=2.613+0.00030sales-0.0000000070s(ii)你会在模型中保留二次项吗?请解释。计方程。务必报告标准误和R²。[提示:注意salesbil²=sales²/(1000)²。](iv)为了报告结果,你更偏好哪个方程?(ii)可能会保留二次项。t统计量为-1.89,在单侧检验下,虚拟假设为H₀:β₁<0,在5%的显著性水平上,更多精品文档rdintens=2.613+0.3salesbil-0.070salesbif的规模,其方程解释的内涵还是相同的。因此更偏好第2个方程。6.如下三个方程是使用401K.RAW中的1534个观测估计出来的:prate=80.29+5.44mrate+0.269age-0.00013totemp你更偏好这三个模型中的哪一个?为什么?解。]更多精品文档和和8.当我们把atndrte²和ACT·atndrte都增加到式(6.19)的估计方程中时,R²就变成0.232。这些添加项在10%的显著性水平上是联合显著的吗?你会将它们包括在模型中吗?答:扩展模型的自由度为680-9=671,并检验两个限制条件,因此F统计量为:在10%的显著性水平上,自由度为2和无穷大的F统计量的临界值为2.30,大于计算的F统计量。因此该把这些变量加入模型中去。9.利用CEOSAL1.RAW中的数据估答:这种一般性不是必然的。roe²系数的t统计值为-0.30,这表明roe²在统计上非常不显著。另外,加入平方项只是对roe过大的系数起到调低的作用。本题中,roe的系数近似等于0.0215-2×0.00008,当roe=25,即样本平均值以上一个标准差时,斜率为0.0211,与0.0215相比,近似相等。更多精品文档δ₀=E(wagelfemale=1,educ)-E(wagelfemale=0,educ)δ₀=E(wagelfemale,educ)-E(wagelmale,educ)更多精品文档很容易解释:δ₁为信用等级为1级的城市和信用等级为0级的城市之间在MBR上的差异(保持其他因素不变);2.容许出现不同的斜率(1)不含交互项的模型log(wage)=(βo+δ₀female)+((2)含有交互项的模型log(wage)=βo+δ₀female+βeduc+δ₁femaleteduc+u更多精品文档3.检验不同组之间回归函数上的差别在含有k个解释变量和1个截距项的一般模型中,假设有两组,称为g=1和g=2。为了检验这两组的截距和所有斜率都相同,对g=1和g=2将模型写成:y=βg,o+βg,Ixi+βg,2x₂+…其中,n为总观测次数。在计量经济学中,通常将这个特定的F统计量称为邹至庄统计量。由于邹至庄检验无非就是一个F检验,所以只有在同方差条件下才是有效的。特别地,在虚拟假设下,两组的误差方差必须相等。和通常一样,渐近分析仍不需要正态性条件。五、二值因变量:线性概率模型1.线性概率模型更多精品文档这个多元回归模型(其中y是一个二值变量)的含义:如果假定零条件均值假定MLR.4成立,即E(ulx,…,x.)=0,那么得到:方程是二值响应模型的一个例子,而P(y=11x)又被称为响应概率。由于概率和必须等于1,所以P(y=0Ix)=1-P(y=1lx)也是x,的一个线性函数。因为这个响应概率是参数β的线性函数,所以这种带有二值因变量的多元线性回归模型又被称为线性概率模量了因X,的变化导致成功概率的变化:2.OLS估计更多精品文档学习-----好资料log(bwght)=4.66-0.0044cigs+0.0093log(famin和log(bwght)=4.65-0.0052cigs+0.011答:(i)如果变量cigs每增加10根,即每天多抽10根烟,则:更多精品文档(ii)如果母亲的教育年限每增加1年,孩子的出生体重将增加0.3%,这个影响是很小的,其thu=1,sat=1028.10+19.30hsize-2.19hsize²-45.09fema变量,而black是一个种族虚拟变量(黑人取值1,其他人则取值0)。(ii)非黑人男性和黑人男性之间SAT分数的估计差异是多少?检验其分数没有差异的虚拟假设,对立假设么做?据支持模型中应该包括hsize²。另外,为了得到最优的高中规模,需要找到一个转折点。在其他变量不变的情形下,当变量hsize=19.3/(2×2.19)≈4.41时,变量sat的值达到最大。又因为变量hsize是以百人为计量单位的,故最优的高中规模应该为441人。(ii)由题知,变量black=0,因此非黑人女性和非黑人男性之间SAT分数的估计差异是由变量female前的系数决定的。非黑人女性的SAT分数大约平均比非黑人男性的SAT分数少45分。变量female的t统计量的值大约为-10.51,因此这个估计差异在统计上是显著的。(大(iii)由题知,变量female=0,因此由变量black的回归系数可知,黑人男性的SAT分数平均比非黑人男性的SAT分数少170分。变量black的t统计量的绝对值大约为13,因此在统计上是显著的,很容易拒绝其SAT分(iv)令black=1,female=1表示黑人女性;black=0,female=1表示非黑人女性。这个差异是-169.81+62.31=-107.50。因为这个估计取决于两个变量的系数,因此不能从所给的信息中构造一个t统计量的更多精品文档学习-----好资料4.一个解释了CEO薪水的工资方程是:log(salary)=4.59+0.2571og(sales)+0.011ro(0.30)(0.032)所用数据在CEOSAL1.RAW中给出,其中finance,consprod和utility分别是表示金融业、消费品行业和公(i)保持sales和roe不变,计算公用事业和交通运输业CEO薪水估计值的近似百分比差异。在1%的显著(ii)利用方程(7.10)求解公用事业和交通运输业估计薪水的精确百分比差异,并与第(i)部分中的回答答:(i)公用事业和交通运输业CEO薪水估计值的近似百分比差异大约为-28.3%。其t统计量的值为-0.283/0.099≈-2.86,因此在1%的显著性水平上,这个差异是统计显著的。更多精品文档学习-----好资料log(salary)=βo+β₁log(sales)+β₂roe+δ,consprod5.在例7.2中,令noPC表示一个虚拟变量:没有个人计算机的学生取值1,否则取值0。(i)如果用noPC取代方程(7.6)中的PC,所估计方程的截距会怎么样?noPC的系数是多少?(提示:写出PC=1-noPC,并代入方程colGPA=β+δ。PC+β(ii)如果用noPC取代PC,R²会有什么变化?在方程7.6中的具体估计值为:βo=1.26,δ₀=0.157,因此,新方程的截距项为1.26+0.157=1.417,其中,(ii)如果用noPC取代PC,R²不会发生变化。因为用noPC取代PC,只是是否拥有计算机的一种简单形log(wage)=βo+βtrain+更多精品文档工人能力越低被选派去参加这个项目的机会就越大,而且你使用了一个OLS分析,那么你可能有什么样的偏误?(提示:参考第3章。)答:在3.3节中,表3.2给出了在估计方程的过程中遗漏重要变量时的偏误情况。表3.2只是给出了缺失一果忽略模型的变量educ和exper,或者至少假定变量educ和exper的系数为正的情形下,虚拟变量train与随机误差项u是负相关的,然后利用表3.2可知β₁的偏误为负。因为通常情况下认为A≥0,因此不太可能认为工作培7.在方程(7.29)的例子中,假设我们定义outlf在妇女不属于劳动力范围时等于1,否则等于0。将它代入总体方程inf=βo+βnwifeinc+β₂educ+…并重新整理。)inlf=βo+β₁nwifeinc+β₂educ+β令inlf=1-outlf,则:更多精品文档1-outf=βo+βnwifeinc+β₂新的误差项为-u,与误差项u有相同的性质。从式7.29的回归结果可以看出,若用outlf对所有的自变量做回归,则新的截距项为:1-0.585=0.415,式更多精品文档(iii)假设你认为最好按大麻使用量将人分为四类:不用者、浅尝者(每月1~5次)、适度者(每月6~10次)和重用者(每个月10次以上)。写出一个模型,使你能估计出使用大麻对工资的影响。(iii)设不用者为基组,则需要三个虚拟变量分别为:浅尝者(每月1~5次)、适度者(每月6~10次)和log(wage)=β₀+δ₁1ghtuser+δ₂moduser+δ₃hvyuser+β₂educ+β₃ex+β₅female+u(iv)虚拟假设为:H₀:δ₁=0,δ₂=0,δ₃=0,即有3个限制条件。如果样本容量为n,则F统计量的自由更多精品文档(v)误差项中可能包含一些影响因素,比如家庭背影,该因素直接影响工资,并且与大麻使用是相关的。为了研究一个人的大麻使用对其工资的影响,就需要控制其他的变量不变。因此需要收集一些与家庭背景信息相关的数据进行分析。y=βo+δ₀d+β₁z+δd·z+uscore=βo+βvoucher+u8.1复习笔记一、异方差性对OLS所造成的影响1.异方差性对无偏性的影响多元线性回归模型2.异方差性对拟合优度的影响对拟合优度指标R²和R²的解释不受异方差性的影响。通常的R²和调整R²都是估计总体R²的不同方法,而总体R²无非就是1-σ²1o²,其中σ²是总体误差方差,σ²则是y的总体方差。关键是,由于总体R²中这两个方差都是无条件方差,所以总体R²不受Var(ulx,…,x.)中出现异方差性的影响。无论Var(ulx₁,…,x.)是否为常数,SSR/n都一致地估计了σ²,SSR/n也一致地估计了o²。当使用自由度调整时,依然如此。因此,无论同方差假定是否成立,R²和R²都一致地估计了总体R²。在没有同方差假定的情况下,估计量的方差是有偏的。由于0LS标准误直接以这些方差为基础,所以它们都不能用来构造置信区间和t统计量。4.对统计检验的影响在出现异方差性的情况下,在高斯-马尔可夫假定下用来检验假设的统计量都不再成立。(1)在出现异方差性时,通常普通最小二乘法的t统计量就不具有t分布,使用大样本容量也不能解决这个问题。(2)F统计量也不再是F分布。(3)LM统计量也不服从渐近x²分布。1.单个自变量模型的OLS估计量假定前4个高斯-马尔可夫假定成立。如果误差包含异方差性,那么在假定MLR.1~MLR.4下(仅没有同方差假定),并以样本中x,的值为条件,方差为:2.怀特证明更多精品文档令û,表示原来y对x做回归所得到的OLS残差。那么,对于任何形式的异方差(包括同方差),Mβ,)的最终,这就是用标准误构造3.异方差-稳健的标准误4.异方差-稳健t统计量t=(估计值-假设值)/标准误(2)通常OLS的t统计量和异方差-稳健t统计量之间的比较②异方差-稳健标准误比通常的OLS标准误适用的情况a.如果同方差假定成立,而且误差又服从正态分布,那么,无论样本容量的大小如何,通常的t统计量都服从精确的t分布。而稳健标准误和稳健t统计量只有在样本容量越来越大时才能使用。在小样本容量的情况下,稳健t统计量的分布可能不是那么接近于t分布,从而推断可能犯错误。更多精品文档b.还有可能得到对任意一个未知形式的异方差性都保持稳健的F和LM统计量。异方差-稳健的F统计量又被称为异方差-稳健的瓦德统计量。5.计算异方差-稳健的LM检验y=β+βx+β₂x₂+β₃x₃+β₄x虚拟假设为:H:β₄=0,β₅=0(1)从约束模型中得到ü;三、对异方差性的检验1.F检验更多精品文档H₀:δ₁=δ₂=..=δ=02.布罗施-帕甘异方差检验同方差的LM统计量为:LM=n·R²这个LM形式的检验通常被称为布罗施-帕甘异方差检验。布罗施和帕甘提出了一个假定误差正态分布的检验形式。凯恩克也提出了LM统计量的检验形式,由于其更大的适用性,所以一般更受欢迎。的δ,都为0的LM统计量。因而在这个情形下,要检验9个约束。对于这个假设,也可以使用F检验;这两个(2)怀特检验与布罗施-帕甘检验之间的区别一种建议是,在异方差检验中使用0LS拟合值。对于每次观测i,拟合值都被定义为对于虚拟假设Ho:δj=0,δ₂=0,可以使用F或LM统(3)怀特异方差检验的特例①用OLS估计模型y=βo+βx+β₂x₂+…+βkxk+u。得到OLS残差û和拟合值y。计算OLS残差的平方û²②做方程û²=8₀+δ₁y+δ₂y²+误(1)模型的异方差(2)β,的估计0。而且,由于Var(u,Ix)=E(u²lx,)=σ²h,,所以u₁I√h,的方差(以x,为条件)为σ²:或(3)广义最小二乘(GLS)估计量(4)加权最小二乘(WLS)估计量加权最小二乘(WLS)估计量是指纠正异方差性的GLS估计量,它最小化了残差平方的加权和,其中每个从数学上讲,WLS估计量便是使下式尽可能小的b,值:2.必须估计异方差函数:可行GLS⑤以1/h为权数,用WLS估计方程更多精品文档学习-----好资料(4)帕克检验存在的问题②利用0LS残差û取代log(ũ²)对x,x₂,…,x的回归式中的u,即便在大样本容量的情况下,也可能导致F(5)豪斯曼检验更多精品文档(2)对数-水平模型的预测①预测值假设模型为ulx,x₂,…,x~Normal[0,exp(8₀+δ₁x+…+δ₂x)]E(ylx)=exp[β₀+xβ+o²对每个i,都能得到一个拟合值:②预测区间因为误差方差远大于估计误差,即使忽略所有参数的估计误差,也只可能犯小小的错误。因此一个近似95%的预测区间(在样本容量很大时)就是:当因变量Y是一个二值变量时,除非所有斜率参数都为零,否则模型就一定包含异方差性。1.线性概率模型中异方差性问题的处理最简单方法就是继续使用0LS估计,但也要计算检验统计量的稳健标准误。这就忽略了LPM的异方差形式。LPM的OLS估计值很简单,而且常常能得到令人满意的结果。一般而言,OLS估计量在LPM中都不是有效的。更多精品文档(2)调整那些小于0或大于1的拟合值,然后用于WLS。(4)以1/h为权数用WLS估计方程更多精品文档1.下面哪种情况是异方差性造成的结果?(ii)通常的F检验不再服从F分布。答:(ii)和(ii)都是样本条件下,异方差性会导致基于t检验和F检验的统计推断失效。因为异方差性违背了高斯-马尔科夫假定,因此OLS估计量不再是BLUE。2.考虑如下解释每月啤酒消费量的线性模型:beer=βo+βinc+β₂price+β3eVar(ulinc,price,educ,female)=o²inc²在方程两边除以inc,可得:beer/inc=β₀(1/inc)+βinc+β₂(pricelinc)+β₃(educlinc)+β₄(female/inc)+(u/inc)更多精品文档学习-----好资料数形式所导致的结果。3.判断正误:当模型中遗漏了重要变量时,WLS优于会被违背。当MLR.4不再成立,WLS和OLS都是有偏的。在没有专门的信息说明遗漏的变量与其他解释变量的关系时,此时难以判断哪种回归方式的偏差更小,WLS估计的偏差可能大于也可能小于OL能使用WLS去解决OLS估计所带来的偏差。4.利用GPA3.RAW中的数据,对秋季第二学期的学生估计如下方程trmgpa=-2.12+0.900crsfpa+0.193cumgpa+0这里trmgpa表示本学期的GPA,crsgpa表示所修全部课程加权平均的GPA,crsgpa表示本学期前的GPA,tothrs表示此学期前总学分,sat表示SAT分数,hsperc表示拟变量,而season也是一个虚拟变量,并在该学生在秋季参加学生运动赛事时取值1。通常的标准误和异方差-稳健的标准误分别报告于圆括号和方括号中。(i)变量crsgpa、cumgpa和tothrs都有预期的估计效应吗?这些变量中有哪些在5%的显著性水平上是统计显著的?使用不同的标准误是否有什么影响?(ii)为什么虚拟假设H₀:Pespa=1有意义?利用这两种标准误,在5%的显著性水平上针对双侧对立假设检验这个虚拟假设。描述你的结论。更多精品文档学习-----好资料答:(i)变量crsgpa、cumgpa和tothrs都有预期的估计效应。如果一个学生本学期的GPA较高,那么他她的trmgpa就更高;如果本学期前的GPA越高,学生的tmgpa也会越高;to量为2.61,两者在5%的显著性水平上是统计显著的。使用两种标准误差的情况下,tothrs的t统计量都为1.17,采用常用标准误差的t统计量是:t=(0.900-1)/0种情况下,在合理(包括5%)的显著性水平上,都不能拒绝虚拟假设。方差-稳健的标准误的t统计量在5%的显著性水平上是统计显著的;使用常用标准误差的t统计量在10%的更多精品文档学习-----好资料据,我们估计了smokes的如下线性概率方程:smokes=0.656-0.0691og(cigpric)+0.012log(income)-0.029e(0.855)(0.204)(0.026)+0.020age-0.00026age²-0.101restaun-0其中,white在调查对象是白人时取值1,否则取值0;其他自变量都与例8.7中的定义相同。我们同时给出(i)这两组标准误存在重要差别吗?(ii)保持其他因素不变,如果受教育年数增加4年,估计的抽烟概率有何变化?(iii)从什么年龄开始,随着年龄的增长抽烟的概率逐渐下降?(iv)解释二值变量restaurn(它也是一个虚拟变量,如果一个人所居住的州有禁止在餐馆抽烟的制度,它就取值为1,否则取值为0)的系数。(v)数据集中第206个人具有如下特征:cigpric=67.44,income=6500,educ=16,age=77,restaurn=0,white=0和smokes=0。计算此人抽烟的预测概率,并对结果加以评论。答:(i)不存在重要差别。每个系数的两组标准误差是非常接近的。(ii)受教育年数增加四年,抽烟概率变化-0.29×4=-0.116,即下降11.6%。(iii)估算二次项的转折点为:0.02/(2×0.00026)≈38.46,因此从38岁半开始,随着年龄的增长抽烟的概(iv)保持其他变量不变,一个人所居住的州有禁止在餐馆抽烟的制度使得抽烟的概率下降0.101,这与多接受四年教育对抽烟概率的影响是相近的。更多精品文档学习-----好资料smokes=0.656-0.069log(67.44)+0.012+0.020×77-0.00026×77答:(i)此时存在k+1个回归元,包由度为n-k-2。更多精品文档定哪一种检验的P值最小。(iv)这个主意不好。因为OLS拟合值是原方程变量的线性组合,因为这些回归元出现在混合检验中,增yi,e=βo+β₁x,e,1+β₂xi,e,2+.+βxi,e,独具的。诸如方程(8.28)中的综合误差就是w₁,。=f+u,。(iv)讨论第(ii)部分对于利用企业层次的平均数据进行WLS估计的意义,其中第i次观测所用的权数就更多精品文档学习-----好资料第9章模型设定和数据问题的深入探讨y=βo+βx+.+βkx+u(a)更多精品文档(2)RESET检验的缺陷①当模型被拒绝后,不能为下一步提供现实的方向;②只要被遗漏变量的期望值是模型中所包含自变量的线性函数,RESET就无法侦查出变量遗漏问题。4.非嵌套模型的检验对非嵌套模型的检验试图对函数形式误设的其他类型(比如,试图决定某一自变量究竟应以水平值形式还是对数形式出现)做出检验,使之离开经典假设检验的辖域。有可能要相对模型y=βo+βlog(x)+β₂log(x₂)+u(c)来检验模型或者把这两个模型反过来。然而,它们是非嵌套模型,所以不能仅使用标准的F检验。(1)米宗和理查德检验构造一个综合模型,将每个模型都作为一个特殊情形而包含其中,然后检验导致每个模型的约束。在目前的例子中,综合模型为:(2)戴维森-麦金农检验若式(d)正确,则从另一个模型(c)得到的拟合值在式(d)中应该是不显著的。因此,为了检验式(d),首先用OLS估计模型(c)以得到拟合值,并记之为多。然后,该检验则基于方程y=βo+βx+β₂x₂+βy+误差项中y的t统计量。显著的t统计量则是拒绝式(d)的证据。类似地,如果y表示估计式(d)所得到的拟合值,那么下式即为对式(c)的检验:更多精品文档学习-----好资料(2)戴维森-麦金农检验若式(d)正确,则从另一个模型(c)得到的拟合值在式(d)中应该是不显著的。因此,为了检验式(d),中y的t统计量。显著的t统计量则是拒绝式(d)的证据。类似地,如果y表示估计式(d)所得到的拟合值,那么下式即为对式(c)的检验:显著的t统计量便是拒绝式(c)的证据。(3)非嵌套检验存在的问题②用戴维森-麦金农检验拒绝了式(d),这并不意味着式(c)就是正确的模型。模型(d)可能会因多种误③在比较因变量不同的模型时,如何进行非嵌套检验。典型的情况就是,一个因变量是Y,一个因变量是(1)遗漏变量问题的植入解y=βo+βx+β₂x₂+β₃x³+u学习-----好资料3.对多元回归的不同看法上式中的模型有时被称为随机系数模型或随机斜率模型,因为无法观测的斜率系数b,被看成与观测数据2.平均偏效应使用一个容量为n的随机样本,同时抽取n个a,值(以及对x和y的观测数据)和n个b值。不能对每个i更多精品文档都估计一个斜率—或一个截距。但有希望估计平均斜率(和平均截距),其中平均是对总体而言。因此,定义可观测的解释变量x,的乘积。3.保证OLS无偏(一致性)的条件(1)对简单回归结论:如果容许斜率是有异的,只要它们的均值独立于解释变量,那么,OLS就能够一致地估计这些斜率的总体平均值。(2)对多元回归的处理y=a+b₁x₁+b₂x₂+…+bxk其中u,=c₁+d₁x₁+…+dxk。更多精品文档如果斜率独立于或至少均值独立于解释变量,那么,容许随机斜率还是相当简单的。此外,就能把斜率模型化为解释变量的函数,这样得到的模型就包含解释变量的平方或乘积项。四、有测量误差时OLS的性质在一个回归模型中使用经济变量不精确的度量时,模型就包含了测量误差。虽然OLS在一些特定的假定之下是无偏的,但在其他情况下它又是有偏误的。1.代理变量与测量误差的差别(1)概念是不同的。在代理变量情形中,是在寻找一个与无法观测变量多少有些联系的变量。在测量误差情形中,没有观测到的变量具有定义完好的定量含义,但模型对它测量的记录可能包含了误差。(2)在测量误差问题中,被误测的自变量通常是主要的焦点之一;而在代理变量情形中,被遗漏变量的偏效应很少成为关注的核心,其他自变量的影响是研究关注的焦点。2.因变量中的测量误差(1)因变量存在测量误差时的估计首先从只有因变量存在测量误差的情况开始。令y"表示欲加以解释的变量。回归模型具有通常的形式假定它满足高斯-马尔可夫假定。令y表示对y"的可观测度量。(总体中的)测量误差被定义为观测值和实际更多精品文档学习-----好资料值之差:对于总体中随机抽取的某个i,可以写出e₀=y;-yi,把它改写成y"=y-e。,并代入上式,整理得到:忽略了y是y”的一个不完美度量,就可以用OLS来估计这个模型。②假定y的测量误差在统计上独立于每个解释变量,则OLS估计量就是无偏和一致的。通常的OLS推断程序(t,F和LM统计量)也都有效。因变量的测量误差导致误差方差比没有测量误差时更大;这当然也导致基本要点是,若测量误差与自变量不相关,那OLS估计就具有良好的性质。(3)对数形式的因变量这种形式来自y的倍乘测量误差:y=ya。。就会导致OLS的偏误。如果测量误差是一个与解释变量无关的3.解释变量中的测量误差(1)简单的回归模型计量。问题是,xi观测不到。但有对x₁的一个测量值x。总更多精品文档1.数据缺失数据缺失(missingdata)问题可能会以多种形式出现。如果一个观测缺失了其因变量或一个自变量的数据,那么这个观测就不能用于多元回归分析。(1)减小回归可用的样本容量。实际上,如果正确地标志了缺失的数据,那么所有现代回归软件包都会跟踪缺失的数据,并在回归计算时简单地把相应观测忽略掉。(2)其他统计影响取决于数据缺失的原因。如果数据是随机缺失的,那么就使来自总体的可用随机样本的容量减小了。这使得估计量没那么准确,但也不会引入任何偏误:随机抽样假定MLR.2仍然成立。2.非随机样本非随机抽样的某些特定类型,也并不会导致OLS的偏误和不一致性。(1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乡镇单位解聘合同范本
- 农民在工地打工合同范本
- 公厕施工范围合同范本
- 京西印玥合同范本
- 2025年度历史文化名城保护工程个人劳务分包合同
- 公司渔业船舶买卖合同范例
- 会议家具采购合同范本
- 临时住宿合同范本
- 借住公租房合同范例
- 修补围网合同范本
- 三年内无重大违法记录声明
- 星级酒店项目招标文件
- 个人工作总结目标计划
- 2025届浙江省杭州七县高三第一次调研测试生物试卷含解析
- 跨学科实践活动5 基于碳中和理念设计低碳行动方案-2024-2025学年九年级化学人教版(2024)上册
- 2022版义务教育(历史)课程标准(附课标解读)
- 第四单元整体教学设计【大单元教学】2024-2025学年八年级语文上册备课系列(统编版)
- 2024年通信安全员ABC证考试题库及解析(1000题)
- 中考数学计算题练习100道(2024年中考真题)
- 中国慢性肾脏病早期评价与管理指南2023
- 阴囊常见疾病的超声诊断
评论
0/150
提交评论