版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
#如果匚2i未知(通常情况下,c2i都是未知的,此时用1进行估计,用丄进行加权)禺|广1 、禹丄记。= r^l对角阵 名21注:(1)由于j仅仅是COV(;j)的估计,因此用 进行加权,可能加权后依然存丨叨在异方差,此时继续做二次加权;2(2)对于界面数据频发的异方差,且 var(;"=;「i已知时同方差:ols等价于WLS异方差:WLS好于OLS故可以直接用WLS(但是不推荐)最好先用OLS估计,计算如果存在异方差,再用 WLS佩若存槿犁:i;=耳-爲血-气中有在下列側式的审T差:中60=⑴兰,弼吐计鬆對禹.虽门呦〉解;对了樓型牡在下歹強式的异莒差:也心】"吹:,审何以在⑴二咗左两端冋H流、折L5樓苴匚]耳冲存在耐割式炽万墓:¥*3=亍卫,瞬咆茨脚吗.员"站〕莒秦:便jnai握呂4_第堪估计横型口孑.噬?“;,g在樫型站=巩+曳丄;亠込携边司时脱汰屈\期甫:寸黑比価瞅割可;號示抽F^r■汛}=Far{F^r■汛}=Far{工;-同舸肓的權5H门的噫机误蚤取诉足丽巒庇,司以像用OLS(駙岀JL,(二)自相关问题残差相关问题定义:经典回归假设中;i是一个白噪声,即残差时零均值、同方差和无序列相关的。如果cov(”,;j)=0,即残差相关。产生原因线性回归模型中随机误差项存在序列相关的原因很多, 但主要是经济变量自身特点、据特点、变量选择及模型函数形式选择引起的。(1) 经济变量惯性的作用引起随机误差项自相关(2) 经济行为的滞后性引起随机误差项自相关(3) —些随机因素的干扰或影响引起随机误差项自相关(4) 模型设定误差引起随机误差项自相关(5) 观测数据处理引起随机误差项序列相关产生的影响(与异方差相似)(1) 最小二乘估计不再是有效估计量,最小二乘法做出的估计量是无偏、线性但不是有效估计量;(2)相关参数的方差失真,导致相关参数的 t检验失效;残差相关的生成机制(时序数据)时序数据的自相关 (结果)受到上一期;((原因)的影响建立P阶自回归模型;t-「;t4‘22‘3;td………--「p—'et时序数据有顺序,用时序刻画因果自相关的识别(1)DW检验德斌沃森检验-2二(訂-;t4)构造一个DW统计量: 匚古 2(仁r..)样本的相关系数、;t 2DW值在0-4之间刻画自相关的程度德斌沃森用穷举法计算了不同的 N与解释变量X下DW统计量的两个临界值(Dl和Du)细节见附录表格DW检验法的缺陷:(1)DW只刻画了;t和;t-i之间的关系,仅适用于一阶自相关,忽视了离和&t-2这种跳跃式的结构;(2)DW对模型形式本身有要求,要求原始方程必须含有截距项,模型中不能含有之后被解释变量 Yt-1(因变量之后刻画刚性,例如投资;工具变量经常引入因变量的滞后变量;政策分期效应)DW的优点:在小样本情况下, DW检验比较可靠。(2)LM检验拉格朗日乘数检验(针对DW的缺点提出)重点思想:①用OLS估计原模型的参数,得到~用;t做一个辅助回归假定-t存在P阶自相关,;t =X ;t4 *「2 ;t2亠 亠>p ;p」代入原模型中得到-^0■-iXt-(?1 ‘22亠……亠':p;p」)•et假设Ho:"l= = =-p=0TR2服从(2)的分布其中T代表样本容量R2是辅助回归的拟合优度进行显著性检验问题:P的确定,制定的阶数P只需要比真实的阶数高就可以了小样本(500以内)P=4大样本(大于500)P=6关于LM检验有点:适用于各种自相关(高阶),对模型无限制; LM本质上是一个大样本检验, n绩效的时候,LM检验的势偏高。此时用 DW。自相关的修正GLS广义最小二乘法思想:原回归模型:YJ;0」xt」假设存在一阶自相关;t=匚2(1)Yt「°」Xt;t(2) Y厂—Mt「2(1)- (2)得Yt-讦厂(1-〉0「1(Xt「X2)Xtj;t」;2变换为Y*「0*」Xt*(满足经典假设—i* _用OLS估计一:0="0 +0 1—P1注:1.自相关阶数P的确定(推荐试错法)用试错法,先做一个一阶差分,判断拟差分后的方程是否存在自相关,若存在自相关,
做二姐拟差分,再验证是否存在自相关”2.系相关系数T的确定(迭代的思想)(1)用OLS估计原模型参数,进而得到 /;(2)做一个P阶自回归,=Pr虽」+P2引工++PEp/+et=p(3) 用OLS做估计得到(4) 用P做GLS估计GLS后的方程,得到B代入原方程,计算尹(5)重复(2)—(4),直到前后两次得到 高度接近,|Mk)_7k」)I:::0.005、定性相应模型(LPM模型Logit模型Probit模型)定性响应模型是虚拟变量做被解释变量的情形。(这一块理论性挺强,觉得掌握基本原理、概率的含义、如何将概率方程还原为 y关于x的方程就行)这类模型处理的问题是因变量是离散数据,例如家庭买房的决策,是否买房。于x的方程就行)这类模型处理的问题是因变量是离散数据,例如家庭买房的决策,是否买房。1.线性概率模型(LPM模型的形式如下,yi=:-+:Xi+Ui其中Ui为随机误差项,Xi为定量解释变量。-1(若是第一种选择)yi= 7-0(若是第二种选择)对yi取期望,E(yi)=:+:Xi下面研究yi的分布。因为比只能取两个值,即二元选择数据(因变量不是取1就是取0)。(1)yi为二元选择变量。(2)0和1,所以yi服从两点分布。把yi的分布记为:P(yi记为:P(yi=1)=PiP(yi=0)-=1-piE(yi)=1(Pi)+0(1-pi)=pi由(2)和(3)式有pi=:+■-为(yi的样本值是0或1,而预测值是概率。)则回归系数[的含义为x增加一个单位,采用第一种选择的概率增加⑶⑷■o假设用这个模型进行预测,当预测值落在[0,假设用这个模型进行预测,当预测值落在[0,1]区间之内时,则没有什么问题;但当预测值落在[0,1]区间之外时,则会暴露出该模型的严重缺点。 因为概率的取值范围是 [0,1],所以此时必须强令预测值(概率值)相应等于0或1。线性概率模型常写成如下形式。{1, :-+!■■'■Xi_10<:+加Xi<1 (5)0,:-+!::iXi_0然而这样做是有问题的。假设预测某个事件发生的概率等于 1,但是实际中该事件可能根本不会发生。反之,预测某个事件发生的概率等于 0,但是实际中该事件却可能发生了。虽然估计过程是无偏的,但是由估计过程得出的预测结果却是有偏的。线性概率模型的估计:使用 OLS估计;检验:当n极大的时候,残差服从标准正态分布 系数也服从标准正态 用T检验当n不好的时候,残差服从两点分布 系数服从韦氏分布用Z检验由于线性概率模型的上述缺点,希望能找到一种变换方法:(1)使解释变量Xi所对应的所有预测值(概率值)都落在( 0,1)之间;(2)同时对于所有的Xi,当Xi增加时,希望Yi也单调增加或单调减少。显然累积概率分布函数F(zi)能满足这样的要求。采用累积正态概率分布函数的模型称作 Probit模型。用正态分布的累积概率作为 Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函数的模型称作logit模型。2.Probit(概率单位)模型仍假定yi=二+:Xi,_t2(6)0、小于1。显然Probit模型比Tobit模型而Pi=F(y(6)0、小于1。显然Probit模型比Tobit模型v'2n旦对应yi在实轴上的值,相应概率值永远大于更合理。Probit模型需要假定yi服从正态分布。3.logit模型其形式是(7)Probit曲线和logit曲线很相似。两条Pi=F(yi)=F(>+-Xi(7)Probit曲线和logit曲线很相似。两条对于给定的xi,pi表示相应个体做出某种选择的概率。曲线都是在pi=0.5处有拐点,但logit曲线在两个尾部要比 Probit曲线厚。logit曲线计算上也比较方便,所以 Logit模型比Probit模型更常用。对上式作如下变换,(8)Pi(1+e_yi)=1
(8)对上式除以Pi,并减1得TOC\o"1-5"\h\z-yi 1 1-Pie= 1=-Pi Pi取倒数后,再取对数,./Pi、yi=iog( )1—PiP.所以log( - )=yi=J.+F*Xi (9)1—Pi由上式知回归方程的因变量是对数的某个具体选择的机会比。 logit模型的一个重要优点是把在[0,1]区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。logit累积概率分布函数的斜率在 Pi=0.5时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于Pi=0.5附近的解释变量Xi的变化对概率的变化影响较大,而相对于 Pi接近0和1附近的Xi值的变化对概率的变化影响较小。对于Logit模型使用极大似然法估计参数是一个很好的选择。 首先分析含有两个参数(:-和"的随机试验。假设被估计的模型如下1Pi1Pi=?^茹=(10)在样本中口是观测不到的。相对于Xi的值,只能得到因变量yi取值为0或1的信息。极大似然估计的出发点就是寻找样本观测值最有可能发生条件下的 「和一:的估计值。从样本看,如果第一种选择发生了 n次,第二种选择发生了N-n次。设采取第一种选择的概率是 口。采取第二种选择的概率是(1-Pi)。重新将样本数据排列,使前 n个观测值为第一种选择,后N-n个观测值为第二种选择,则似然函数是L(:, :)=P(y1, y2,…y”)=P (y1)P (y2)…P(yz)=P1 …pn (1 -pn+1)…(1 Pn)对数似然函数是nlogL(:,■)='JiA对数似然函数是nlogL(:,■)='JiAn N=丨丨Pi丨丨(1-Pi)i=1 i=n1Nlogpi+'log(1-Pi)i=n1分别求上式对:•和啲偏导数,并令其为0,即dogL.:logL(11)(12)(13)(14)便可求到:•和:的极大似然估计值。:•和:的极大似然估计量具有一致性和渐近有效性,且都是渐近正态的。四、标准化回归标准化变量的回归
因为量纲与系数大小有直接的关系, 排在多元回归中存在解释变量系数不可比的问题,除量纲影响后,系数可比。因为量纲与系数大小有直接的关系, 排例如柯布道格拉斯函数Y=AK:In •+1nK•-21nLj想要比较劳动和资本对产出的影响大小。对于多元线性回归需要对各个自变量进行标准化,排除单位的影响。标准化方法:即将原始数据减去相应变量的均数后再除以该变量的标准差, 而标准化得到的回归方程称为标准化回归方程,相应得回归系数为标准化回归系数。在Y对X的回归中,把变量重新定义为标准化变量:Sy*Sy*XiXj-X
Sx标准化变量的特征是均值为0,标准差总是1,标准化使所有变量都处于同一标准之下。对于双变量线性回归来说,我们对标准化变量做回归:Y- =1*JXi5=2*XjUj因为对标准化的被解释变量和解释变量做回归,所以截距项为 0.Wald检验(此处不甚理解 见谅按照潘老师将的内容整理)例如柯布道格拉斯函数Y=AK:L:Y=〉0*iXj*2Zj■;i想要比较劳动和资本对产出的影响大小。原假设:Ho:>1—2(约束条件)若约束条件成立:Y八o*i(XjZj)•;jRSS受若约束条件不成立:Y"o乜区叫乙Xrss无k是无约束代入参数的个数构造统计量(RSSc-RS&)/约束条件的个数k是无约束代入参数的个数RSS无/n—k该统计量服从F分布进行显著性检验接受原假设时,二者相等拒绝原假设时,二者不等,可以根据 和〉2的估计值判断其对Y的贡献大小。五、建模问题给定经济现象,请选择解释变量,设定模型。(15分)主要考点:(1) 被解释变量(注意被解释变量的测量问题);(2) 解释变量有哪些;(3) 为什么引入这些变量;(4) 解释变量如何度量?(虚拟or数值);(5) 写出具体的模型形式;(6) 判断经济显著性,即预期符号。举例子:博学楼6:00-9:00自习室上座率。变量选取和数据获得被解释变量:y:博学楼6:00-9:00自习室上座率y=上自习人数/座位数*100%测度方法:调查取得;Xi:在校研究生人数(博士+硕士)%=在校博士生人数+在校硕士生人数选取理由:因为博学楼主要是研究生的学习场所测度方法:根据入学注册人数-毕业人数-辍学人数;%:居住地离博学楼距离选取理由:在校研究生分为住校和不住校, 原则上居住地离学校过远, 则一般情况不会选择来博学楼上自习X2=具体里程数测度方法:调查取得;D:是否假期选取理由:与学期相比,假期在校的学生人数明显减少;1「 正常学期D仁[0 寒暑假%—根据学校校历选取理由:临近考试,自习室上座率会增加1「每学期16周-19周D2= 0[其他根据学校校历模型构建丫「0+必「2X2mI4D2(5D1」D2)X1(5D1「602)X27判断经济显著性,即预期符号:X1:预期符号为正,理论上在校研究生人数越多,上座率越高;X2:预期符号为负,理论上居住地离博学楼距离越远,上座率越低;D1:预期符号为正,理论上正常学期与假期相比,上座率高;D2:预期符号为正,理论上越是临近考试,上座率越高。根据下面例子练习一下:试指出在目前建立中国宏观计量经济模型时, 下列内生变量应由哪些变量来解释, 简单说明理由,并拟定关于每个解释变量的待估参数的正负号。(1)轻工业增加值;(2)衣着类商品价格指数;(3)农业生产资料进口额答:(1)轻工业增加值应该由反映需求的变量解释。包括居民收入(反映居民对轻工业的消费需求,参数符号为正)、国际市场轻工业品交易总额(反映国际市场对轻工业的需求,参数符号为正)等。(2) 衣着类商品价格指数应该由反映需求和反映成本的两类变量解释。主要包括居民收入(反映居民对衣着类商品的消费需求,参数符号为正)、 国际市场衣着类商品交易总额(反映国际市场对衣着类商品的需求,参数符号为正)、 棉花的收购价格指数(反映成本对价格的影响,参数符号为正)等。(3)农业生产资料进口额应该由国内第一产业增加值 (反映国内需求,参数符号为正)国内农业生产资料生产部门增加值(反映国内供给,参数符号为负)、国际市场价格(参数符号为负)、出口额(反映外汇支付能力,参数符号为正)等变量解释。六、简答题(一)工具变量在模型估计过程中被作为工具使用,以替代模型中与误差项相关的随机解释变量的变量,称为工具变量。作为工具变量,必须满足下述四个条件:(1) 与所替的随机解释变量高度相关;(2) 与随机误差项不相关;(3) 与模型中其他解释变量不相关;(4) 同一模型中需要引入多个工具变量时,这些工具变量之间不相关。工具变量在解决内生性问题、多重共线性问题方面都有应用。在时间序列模型中,经常使用滞后一期的因变量作为工具变量, 这也会导自相关问题中使用DW(德斌沃森)检验时因为模型形式不符合而使 DW检验存在缺陷。工具变量的选择只要掌握一个关键点就行: 找一个和内生性变量有数据相关的, 但是和残差没有关系的东西,这就是你的 IV了。例如贸易量如果是内生的,那么你找地理距离作为IV。北京到纽约的距离,那是自然形成的,你会发现贸易量和地理距离在数据上具有相关性。这就很好。这种数据相关性越强, IV的效果就越好。(二)共线性问题定义多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。产生原因(1)经济变量之间的内在联系是多重共线性产生的根本原因,例如许多经济变量变现为同向化的趋势(消费、收入、储蓄、投资、就业都随着经济的增长或衰退产生同向化的变化)、在时间序列模型中回归元之间也经常存在着相同的时间趋势;(2)模型设定时将滞后变量作为解释变量,易产生多重共线性;(3)模型中解释变量的个数大于观测次数,例如在医药研究中从少数的病人身上搜集大量的信息,易产生共线性问题。不良后果(1)完全共线性下参数估计量不存在;(2) 近似共线性下OLS估计量方差变大,非有效(方差膨胀);(3)变量的显著性检验失去意义(由于估计量的方差膨胀,导致其标准差增大,从而T检验的T值降低,估计值不显著的概率上升,进而导致关键变量不显著,使假设检验失去意义。)识别方法(1)经验识别:对模型估计后,R2极高,多个变量不显著,出现与理论预期相悖的情况,有理由怀疑存在多重共线性。(2)相关系数法:计算解释变量间两两相关系数。只要其中一个大等于 0.65-0.7,则表明可能存在严重的共线性。注意:不要计算简单相关系数,目前推荐使用佩尔森相关系数。不足之处是只能证有,不能证无。(3) 膨胀因子法:计算每个解释变量的VIF,若某一个VIF>10,则表明存在严重的共线性。(4)Klein法则:每个解释变量对其余所有解释变量做辅助回归,如 Max(R辅)>R原,则共线性严重到要处理。5、 修正方法[(※※海)共线性的修正方法有很多,按照优劣程度排序,主要有五种方法:方法1:扩充样本以减弱共线性。主要通过增加自由度来提高精度,如将时序数据或截面数据变为面板数据,从而将一维数据变为二维。评价:这种方法最理想,但存在的缺点是:①效果不定;②不可行(一般情况下,研究者在研究时已经找到能够着的样本,扩大样本通常不是可行办法。)。方法2:工具变量法(IV+2SLS)。主要通过工具变量,运用两阶段最小二乘完成。评价:这种方法目前最受欢迎,高质量的期刊论文通常都采用该方法。缺点是:①由于相关关系具有传导性,工具变量S很难找;②用S替代X,有时经济正当性不足。方法3:变量变换法。可以通过对数变换、绝对转相对和方程变换(差分)进行变量变换。评价:这种方法最简单易行,但存在的缺点是:①简单相关系数描述的是线性关系, 而对数是非线性化过程;②功效不足;③不是所有变量都能用来做变换, 必须有明确的经济学指代。方法4:逐步回归法。主要是通过降维减少变量来减弱共线性。评价:这种方法要慎用,最大的缺点是:虽然能很好地解决共线性问题, 但是却引发了更严重的内生性问题。方法5:主成份分析法或因子分析法。 具有降维的作用,主要用于多指标评价。评价:该方法很好地消除了共线性。但这种方法要慎用,最大的缺点是: 经济含义伤害过大。(三)回归模型中,如果遗漏了重要解释变量,其后果是什么?模型设定偏误的后果有:(1)如果遗漏了重要的解释变量,会造成 OLS估计量在小样本下有偏,在大样本下非一致;对随机干扰项的方差估计也是有偏的。( 2)如果包含了无关的解释变量,尽管OLS估计量具有无偏性与一致性,但不具有最小方差性。( 3)如果选择了错误的函数形式,则后果是全方位的,不但会造成估计的参数具有完全不同的经济意义,而且估计结果也不同。补充:内生性问题内生性是指:模型中的解释变量与扰动项相关。通常我们做古典假设①为白噪声,E(;)=0,var(;i)=;',cov(;i;j)=0•,②X是非随机变量(微观可以通过固定抽样得到解决,宏观则不可),则 cov(X,;)=0成立。但是当cov(X,;)工0时上述假设便不再成立,我们称之为内生性,进而导致 OLS失效,是非一致性的。内生性产生的原因:(1)X与Y存在双向因果,即X影响Y的同时,Y也影响X;如金融发展与经济增长;外商直接投资FDI与经济增长;犯罪率与警备投入。(2)模型遗漏重要解释变量。 无论是缺失重要解释变量导致, 还是无法获取数据导致,被遗漏的重要变量进入了残差项,如果与其他解释变量相关,就会出现 cov(Ut,Xt)丰0,也就是内生性问题。(3) 度量误差:由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差的一部分,从而导致内生性问题。解决方法:针对
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2022年甘肃省甘南自治州公开招聘警务辅助人员笔试自考题2卷含答案
- 2022年四川省雅安市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 2022年浙江省湖州市公开招聘警务辅助人员辅警笔试自考题1卷含答案
- 晨会主持发言稿
- 广西梧州市(2024年-2025年小学六年级语文)统编版随堂测试(下学期)试卷及答案
- 2024年姿态控制推力器、推进剂贮箱项目资金需求报告代可行性研究报告
- 《应收款项新》课件
- 《称赞教学》课件
- 2025年毛纺织、染整加工产品项目立项申请报告模范
- 2025年水乳型涂料项目提案报告模范
- 教育理念和教育方法
- 九小场所安全检查表
- 第四代住宅百科知识讲座
- 2022-2023学年佛山市禅城区六年级数学第一学期期末达标测试试题含解析
- 《广联达培训教程》课件
- 扬州育才小学2023-2024六年级数学上册期末复习试卷(一)及答案
- 蔚蓝时代有限公司员工培训现状分析及改进措施研究
- 浙江省温州市2022-2023学年五年级上学期语文期末试卷(含答案)3
- 软件系统实施与质量保障方案
- 2023-2024学年度第一学期四年级数学寒假作业
- UV激光切割机市场需求分析报告
评论
0/150
提交评论