多元回归分析其他问题详解演示文稿_第1页
多元回归分析其他问题详解演示文稿_第2页
多元回归分析其他问题详解演示文稿_第3页
多元回归分析其他问题详解演示文稿_第4页
多元回归分析其他问题详解演示文稿_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元回归分析其他问题详解演示文稿当前第1页\共有28页\编于星期三\2点优选多元回归分析其他问题当前第2页\共有28页\编于星期三\2点6.1测度单位对OLS估计量的影响进行标准化后的回归为:标准化系数与原系数的关系为:解释为xj增加一个标准差,因变量增加的标准差个数。标准化系数不受变量测度单位的影响,可以用来判断解释变量的重要性。例6.1中利用标准化系数可说明,污染比犯罪对房价产生更大的影响。标准化系数存在使用不方便的缺点。当前第3页\共有28页\编于星期三\2点6.2函数形式的进一步讨论对数函数形式:对以下模型的系数进行解释:Rooms前面的系数常解释为,多增加一个房间,结果会提高30.6%,但这种解释是近似的,精确应该是:以上的调整对小的百分数变化而言不那么重要。在应用研究中广泛应用对数形式的原因:使用对数对系数的解释具有吸引力,且不受测度单位影响使用对数比使用水平的因变量更接近CLM假定,如缓和异方差和偏态性。取对数可缩小变量取值范围,减弱对异常值的敏感度。

当前第4页\共有28页\编于星期三\2点6.2函数形式的进一步讨论使用对数形式的经验法则:对金额表示的变量通常可以取对数。对人数、雇员总数和学校注册人数等变量可取对数。以年度量的变量(受教育年限、工作经历、任职年限和年龄等)通常用原形。比例或百分比变量(如失业率、参与率、拘捕率和通过率等)既可使用原形,也可使用对数,但要区分百分点的变化与百分比的变化。当前第5页\共有28页\编于星期三\2点6.2函数形式的进一步讨论使用对数形式的局限:变量不能取零或负值,有时可用:使用对数形式的因变量,难以预测原变量的值。以y作为因变量的模型与以log(y)作为因变量的模型,不能比较R2,没有直接方法比较两种模型优劣含二次型的模型:为了描述递减或递增的边际效应,常使用二次型:当前第6页\共有28页\编于星期三\2点6.2函数形式的进一步讨论边际效应的形式为:可代入样本中的x的平均值、中位数或上下四分位数。在多数应用中,常为正,而为负,此时具有抛物线形态,存在一个转折点:当模型中因变量为对数形式,而自变量以二次形式出现时,解释需要小心,如例6.2。对数形式的二次型可说明弹性是非参数的。当前第7页\共有28页\编于星期三\2点6.2函数形式的进一步讨论含有交互作用项的模型:因变量对一个解释变量的偏效应、弹性或半弹性可能受另一解释变量的影响,这就需要交互项的使用。如:Bdrms对price的偏效应为:例6.3解释

当前第8页\共有28页\编于星期三\2点6.3拟合优度和回归元选择的进一步讨论初学者往往倾向于过度强调R-平方,有些情况下R-平方可能人为地偏高,低R-平方只是说明仍有一些影响y的因素没有被解释,但并不意味着u中的因素与现有的自变量相关,零条件均值假定决定了,我们可以对现有自变量的偏效应进行良好的估计,这是回归模型的核心,而R-平方的大小与此无直接关系。调整的R-平方:为了克服模型只要增加新的自变量,R-平方不会变小,且对增加自变量所带来的自由度的损失进行惩罚,调整的R-平方被采用:

当前第9页\共有28页\编于星期三\2点6.3拟合优度和回归元选择的进一步讨论当且仅当新的自变量的t统计量的绝对值大于1时,调整的R-平方才会增加(对此推广是,在回归中增加一组变量时,当且仅当这些新变量的联合显著性检验的F统计量大于1时,调整R-平方才会增加)。由此,使用调整的R-平方来决定一变量(或一组变量)是否属于模型,与标准的t或F检验是不同的。利用调整的R-平方在非嵌套模型中选择:F统计量只能让我们检验嵌套模型(nestedmodels):一个模型(受约束模型)是另一个模型(不受约束模型)的一种特殊情况。当前第10页\共有28页\编于星期三\2点6.3拟合优度和回归元选择的进一步讨论非嵌套模型:对于非嵌套模型(nonnestedmodels)的选择是一个很困难的问题。因变量相同模型的一种可能的方法是,创造一个包含原来二个模型中所有解释变量的复合模型,然后采用F检验将原来的每个模型针对复合模型进行检验。此方法的问题是,两个模型既可能同时被拒绝,也可能同时均不被拒绝。利用调整的R-平方可以对非嵌套模型进行选择,但不能用于因变量不同的模型之间进行选择。如水平模型和对数模型之间的选择。例6.4当前第11页\共有28页\编于星期三\2点6.3拟合优度和回归元选择的进一步讨论回归分析中控制了过多的因素:在担心模型中漏掉一个可能与自变量相关的重要因素的同时,还有另一种可能性:回归分析中控制过多的变量。对多元回归模型中其他条件不变的解释有时能帮助我们避免此类错误,以评价州啤酒税对交通死亡率影响的模型为例:关键是是否要加入啤酒消费量这个控制变量?加入后如何解释啤酒税前的系数。对某些特定因素该不该进行控制,并不总是清楚的,Betts(1995)对高中学校的质量对今后收入影响的研究中,是否要控制受教育程度并没有明确的答案。当前第12页\共有28页\编于星期三\2点6.3拟合优度和回归元选择的进一步讨论增加回归元以减少误差方差:从回归误差项中取出一些因素作为新的自变量加入模型中会增加多重共线性,但可以减少误差的方差。一般而言,哪方面的影响对系数估计量的方差占主导作用是不明确。如果增加的自变量与原有的自变量无关,增加自变量可减少误差方差而不会导致多重共线性。但这种情形在社会科学很少出现。当前第13页\共有28页\编于星期三\2点6.4多重共线性(multicollinearity)当前第14页\共有28页\编于星期三\2点6.4多重共线性(multicollinearity)当前第15页\共有28页\编于星期三\2点6.4多重共线性(multicollinearity)当前第16页\共有28页\编于星期三\2点6.4多重共线性(multicollinearity)当前第17页\共有28页\编于星期三\2点6.4多重共线性(multicollinearity)当前第18页\共有28页\编于星期三\2点6.4预测和残差分析预测的置信区间:假设估计方程如下:给定解释变量的具体值:想要预测的对象是:预测值为:为了得到一个置信区间,需要获得标准误:直接的计算比较复杂,一个简便的方法是进行模型变换:将代入原模型,变换后可得:估计以上模型,截距的估计值及标准误就是所需的预测值及其标准误,在此基础上可构造置信区间。在自由度较大情况下,经验法则为:当前第19页\共有28页\编于星期三\2点6.4预测和残差分析

以上是对y的期望值进行预测,有时需对y的新的值进行预测:预测值与期望的预测值是相同的,不同的是预测误差增加了一项:预测区间的构造方法是完全相同的。残差分析:对个别观测值的残差进行分析,称为残差分析(residualanalysis)。将实际值与回归模型的估计值进行比较,可能具有不同的经济意义如房屋价格、法学院排名、司法决策当前第20页\共有28页\编于星期三\2点6.4预测和残差分析当因变量为对数时对水平值的预测:讨论当因变量为对数形式log(y)时,如何预测水平值y。通常的作法是将log(y)的预测值转换成指数函数值:实际上,此方法将系统地低估了y的预测值,因为在CLM的六个假定下有:因此y的预测值应调整为:此公式是基于误差项为正态分布,为得到更一般的情形,假定误差项u独立于解释变量,则

当前第21页\共有28页\编于星期三\2点6.4预测和残差分析以下步骤是计算从logy对的回归中得到拟合值:对每个观测值,求出在不设截距下,求y对的回归,得到的系数估计值就是能够正确计算出因变量为logy的模型中水平y的估计值后,可以计算y的实际值与y的估计值之间的相关系数,将其平方与因变量为y的模型中拟合优度R-平方进行比较,因此提供了一个比较对数模型与水平模型优劣的简单方法。当前第22页\共有28页\编于星期三\2点AFurtherExample:

DeterminantsofSovereignCreditRatings

CantorandPacker(1996)

Financialbackground:Whataresovereigncreditratingsandwhyareweinterestedinthem?Tworatingsagencies(Moody’sandStandardandPoor’s)providecreditratingsformanygovernments.Eachpossibleratingisdenotedbyagrading:

Moody’s

StandardandPoor’s Aaa AAA

……

….. B3 B-当前第23页\共有28页\编于星期三\2点

PurposesofthePaper

-toattempttoexplainandmodelhowtheratingsagenciesarrivedat theirratings. -tousethesamefactorstoexplainthespreadsofsovereignyields abovearisk-freeproxy -todeterminewhatfactorsaffecthowthesovereignyieldsreactto ratingsannouncements当前第24页\共有28页\编于星期三\2点

DeterminantsofSovereignRatings

Data Quantifyingtheratings(dependentvariable):Aaa/AAA=16,...,B3/B-=1Explanatoryvariables(unitsofmeasurement): -Percapitaincomein1994(thousandsofdollars) -AverageannualGDPgrowth1991-1994(%) -Averageannualinflation1992-1994(%) -Fiscalbalance:AverageannualgovernmentbudgetsurplusasaproportionofGDP1992-1994(%) -Externalbalance:AverageannualcurrentaccountsurplusasaproportionofGDP1992-1994(%) -ExternaldebtForeigncurrencydebtasaproportionofexports1994(%) -Dummyforeconomicdevelopment -Dummyfordefaulthistory Incomeandinflationaretransformedtotheirlogarithms.当前第25页\共有28页\编于星期三\2点

Themodel:LinearandestimatedusingOLS

当前第26页\共有28页\编于星期三\2点InterpretingtheModel

FromastatisticalperspectiveVirtuallynodiagnosticsAdjustedR2ishighLookattheresiduals:actualrating-fittedrating FromafinancialperspectiveDothecoefficientshavetheirexpectedsig

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论