




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章 经典单方程计量经济学模型:经典单方程计量经济学模型:多元线性回归模型多元线性回归模型 多元线性回归模型多元线性回归模型 多元线性回归模型的参数估计多元线性回归模型的参数估计 多元线性回归模型的统计检验多元线性回归模型的统计检验 多元线性回归模型的预测多元线性回归模型的预测 多元回归模型的其他形式多元回归模型的其他形式 回归模型的参数约束回归模型的参数约束3.1 3.1 多元线性回归模型多元线性回归模型 一、一、多元线性回归模型多元线性回归模型 二、二、多元线性回归模型的基本假定多元线性回归模型的基本假定 一、多元线性回归模型一、多元线性回归模型 多元线性回归模型多元线性回归模型
2、回归模型的矩阵表达式回归模型的矩阵表达式1、多元线性回归模型、多元线性回归模型多元线性回归模型多元线性回归模型: :表现在线性回归模型中的解释变量有多表现在线性回归模型中的解释变量有多 个。一般表现形式为:个。一般表现形式为: i=1,2,n其中其中: :k为解释变量的数目,为解释变量的数目, i称为称为回归参数(回归参数(regression regression coefficientcoefficient)。而习惯上:把)。而习惯上:把常数项常数项看成为一看成为一虚变量虚变量的系的系数,该虚变量的样本观测值始终取数,该虚变量的样本观测值始终取1 1。于是:。于是:模型中解释变模型中解释变
3、量的数目为(量的数目为(k k+1+1)。)。所以,上式也被称为所以,上式也被称为总体回归函数总体回归函数的的随机表达形式随机表达形式。它的它的非随机表达式即:非随机表达式即:总体回归函数总体回归函数为:为:表示:表示:各变量各变量Xi值固定时值固定时Y的平均响应。的平均响应。 i也被称为也被称为偏回归系数偏回归系数,表示在其他解释变量保持不变的情,表示在其他解释变量保持不变的情况下,况下,Xi每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的变化;的变化;或者说或者说 i给出了给出了Xi的单位变化对的单位变化对Y均值的均值的“直接直接”或或“净净”(不含其他变量)影响。(不含其他变量
4、)影响。ikikiiiXXXY 22110kikiikiiiiXXXXXXYE 2211021),|(2、矩阵表达式、矩阵表达式用来估计总体回归函数的用来估计总体回归函数的样本回归函数样本回归函数为为:其其随机表示式随机表示式: : ei称为称为残差残差或或剩余项剩余项(residuals)(residuals),可看成是总体回归函数,可看成是总体回归函数中随机扰动项中随机扰动项 i i的近似替代。的近似替代。总体回归模型总体回归模型n个随机方程的个随机方程的矩阵表达式矩阵表达式为为: :样本回归函数(模型)样本回归函数(模型)的的矩阵表达式矩阵表达式: :kikiiiiXXXY22110ik
5、ikiiiieXXXY22110XY)1(212221212111111knknnnkkXXXXXXXXXX1)1(210kk121nnXYeXYk10neee21e二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定 随机项假定随机项假定 解释变量假定解释变量假定 其他假定其他假定1、随机假定(、随机假定(是针对随机误差项的假定是针对随机误差项的假定)零均值:零均值:同方差:同方差:序列不相关性假定:序列不相关性假定:正态分布假定:正态分布假定:向量向量 有一多维正态分布,即:有一多维正态分布,即: 0)(iEnjiji, 2 , 1,22)()(iiEVar0)(),(jijiEC
6、ov),0(2Ni0)()()(11nnEEEEnnEE11)( 21121nnnEI22211100)var(),cov(),cov()var(nnn),(2I0N2、解释变量假定、解释变量假定解释变量是非随机的或固定的,且各解释变量是非随机的或固定的,且各X之间互不相关之间互不相关(无多重共线性)。(无多重共线性)。即:即:n ( (k+1)+1)矩阵矩阵X是非随机的,是非随机的,且且X的秩的秩 = =k+1+1,即,即X满秩。满秩。解释变量与随机项不相关解释变量与随机项不相关 E( E(X )=0)=0,即:,即:0),(ijiXCovkj,2 , 1 0)()()(11iKiiiiiK
7、iiiiEXEXEXXE3 3、其他假定、其他假定同一元回归一样,多元回归还具有如下两个重要假设:同一元回归一样,多元回归还具有如下两个重要假设:样本容量趋于无穷时,各解释变量的方差趋于有界常数样本容量趋于无穷时,各解释变量的方差趋于有界常数(该假定是为了避免产生伪回归问题),即(该假定是为了避免产生伪回归问题),即n时,有:时,有:其中:其中:Q为一非奇异固定矩阵,矩阵为一非奇异固定矩阵,矩阵X是由各解释变量的离是由各解释变量的离差为元素组成的差为元素组成的n k阶矩阵:阶矩阵:假定回归模型的设定是正确的。假定回归模型的设定是正确的。jjjijiQXXnxn22)(11Qxx n1knnkx
8、xxx1111x3.2 3.2 多元线性回归模型的估计多元线性回归模型的估计 一、一、普通最小二乘估计普通最小二乘估计 * *二、二、最大或然估计最大或然估计 * *三、三、矩估计矩估计 四、四、参数估计量的性质参数估计量的性质 五、五、样本容量问题样本容量问题 六、六、案例分析案例分析 说说 明明估计方法主要有三大类方法:估计方法主要有三大类方法:OLS、ML或者或者MM在经典模型中多应用在经典模型中多应用OLS在非经典模型中多应用在非经典模型中多应用ML或者或者MM在本节中,在本节中, ML与与MM为选学内容为选学内容一、普通最小二乘估计一、普通最小二乘估计 普通最小二乘估计普通最小二乘估
9、计 普通最小二乘估计的矩阵表达式普通最小二乘估计的矩阵表达式 参数估计的矩阵表达式参数估计的矩阵表达式 案例分析案例分析 离差形式的普通最小二乘估计离差形式的普通最小二乘估计 随机误差项随机误差项 的方差的方差 的无偏估计的无偏估计1 1、普通最小二乘估计、普通最小二乘估计对于随机抽取的对于随机抽取的n组观测值:组观测值:如果如果样本函数样本函数的参数估计值已经得到,则有:的参数估计值已经得到,则有: i=1,2n根据根据最小二乘原理最小二乘原理,参数估计值应该是一阶条件正规方程,参数估计值应该是一阶条件正规方程组的解组的解,即:,即:其中:其中:kjniXYjii, 2 , 1 , 0, 2
10、 , 1),(KikiiiiXXXY221100000210QQQQk2112)(niiiniiYYeQ2122110)(nikikiiiXXXY2 2、普通最小二乘估计的矩阵表达式、普通最小二乘估计的矩阵表达式待估参数估计值的待估参数估计值的正规方程组为正规方程组为:解该方程组,即解该方程组,即可得到可得到 k+1个待估参数的估计值。个待估参数的估计值。正规方程组正规方程组的的矩阵形式矩阵形式:kiikikikiiiiikikiiiiiikikiiikikiiXYXXXXXYXXXXXYXXXXYXXX)()()()(221102222110112211022110nknkknkkiikik
11、ikiiiikiiYYYXXXXXXXXXXXXXXXXn2121112111021121111113 3、参数估计的矩阵表达式、参数估计的矩阵表达式正规方程组正规方程组的的矩阵形式,矩阵形式,即:即: 由于由于XX满秩,故有:满秩,故有:将将上述过程用上述过程用矩阵形式表示为矩阵形式表示为:即求解方程组:即求解方程组:得到:得到:于是有:于是有:YXX)X(YXXX 1)(0)()(XYXY0)(XXXYYXYY0)2(XXXYYY0XXYXXXYXYXXX1)(4 4、案例分析、案例分析案例案例3.2.13.2.1:在在例例2.1.12.1.1的的家庭收入家庭收入- -消费支出消费支出中,
12、中,可求得:可求得:于是得到参数估计值:于是得到参数估计值:53650000215002150010111111)(22121iiinnXXXnXXXXXXXX39468400156741112121iiinnYXYYYYXXXYX0735. 10003. 00003. 07226. 0)(1EXX7770.0172.10339648400156740735.10003.00003.07226.021E5 5、离差形式的普通最小二乘估计、离差形式的普通最小二乘估计对于对于正规方程组正规方程组于是有:于是有: (*) ,或者:或者: (*)( (* *) )或(或(* * *)是多元线性回归模型
13、)是多元线性回归模型正规方程组正规方程组的另一种写法的另一种写法样本回归模型的离差形式:样本回归模型的离差形式: i=1,2n其其矩阵形式矩阵形式为为:其中其中 :在离差形式下,参数的最小二乘估计结果为在离差形式下,参数的最小二乘估计结果为 XXYXXXeXXX0eX 0ie0iijieXikikiiiexxxy2211exynyyy21yknnnkkxxxxxxxxx212221212111xk21Yxxx1)(kkXXY1106 6、随机误差项、随机误差项 的方差的方差 的无偏估计的无偏估计可以证明,随机误差项可以证明,随机误差项 的方差的无偏估计量为:的方差的无偏估计量为:1122knk
14、neiee*二、最大或然估计(二、最大或然估计(ML)对于多元线性回归模型对于多元线性回归模型易知易知 ,Y Y随机抽取的随机抽取的n组样本观测值的联合概率组样本观测值的联合概率上市就是变量上市就是变量Y Y的的或然函数,其对数或然函数为:或然函数,其对数或然函数为:对对数或然函数求极大值,也就是对对对数或然函数求极大值,也就是对 求极小值。因此,参数的求极小值。因此,参数的最大或然估计最大或然估计为:为:结果与参数的普通最小二乘估计相同结果与参数的普通最小二乘估计相同ikikiiiXXXY 22110),(2XiNYi)()(21)(212122222211022)2(1)2(1),(),(
15、XYXYeeYYYPLnXXXYnnnkikiiin)()(21)2()( 2*XYXYnLnLLnL)()(XYXYYXXX1)(*三、矩估计(三、矩估计(Moment Method, MM) 参数的参数的MM(矩估计)估计量(矩估计)估计量 广义矩估计方法广义矩估计方法1 1、参数的、参数的MM(矩估计法)估计量(矩估计法)估计量 OLS估计是通过得到一个关于参数估计值的估计是通过得到一个关于参数估计值的正规方程组:正规方程组: 并对它进行求解而完成的。并对它进行求解而完成的。该该正规方程组正规方程组 可以从另外一种思路来导可以从另外一种思路来导: : = = = =称其期望表达式:称其期
16、望表达式: 为原总体回归方程的一为原总体回归方程的一组组矩条件矩条件,表明了原总体回归方程所具有的内在特征。,表明了原总体回归方程所具有的内在特征。由此得到由此得到正规方程组的解:正规方程组的解:该正规方程组的解即是参数的该正规方程组的解即是参数的MM估计量。估计量。这种估计样本回归方程的方法称为矩估计法这种估计样本回归方程的方法称为矩估计法MM。易知易知MMMM估计量与估计量与OLS、ML估计量等价。估计量等价。YXX)X(XYXXXYXXX(YX)0XYX)(E0)1X(YXnYXXX1)(2 2、广义矩估计方法、广义矩估计方法矩估计方法矩估计方法是是工具变量方法工具变量方法(Instru
17、mental Variables,IV)和和广义矩估计方法广义矩估计方法(Generalized Moment Method, GMM)的基础的基础在在矩估计方法矩估计方法中利用了关键基本假设:中利用了关键基本假设:E(X )=0如果某个解释变量与随机扰动项相关,只要能找到如果某个解释变量与随机扰动项相关,只要能找到1个个工具变量,仍然可以构成一组矩条件,这就是工具变量,仍然可以构成一组矩条件,这就是工具变量工具变量方法方法( IV )。如果存在大于如果存在大于k+1个变量与随机扰动项不相关,则可以个变量与随机扰动项不相关,则可以构成一组包含大于构成一组包含大于k+1方程的矩条件。这就是方程的
18、矩条件。这就是广义矩估广义矩估计方法计方法( G MM )。后面的课程中会给予介绍后面的课程中会给予介绍四、参数估计量的性质四、参数估计量的性质在满足基本假设的情况下,其结构参数在满足基本假设的情况下,其结构参数 的的普通最小二乘估计、最大或然估计及矩估计普通最小二乘估计、最大或然估计及矩估计仍具有:仍具有:线性性线性性、无偏性无偏性、有效性有效性。同时,随着样本容量增加,参数估计量还具同时,随着样本容量增加,参数估计量还具有:有:渐近无偏性、渐近有效性、一致性渐近无偏性、渐近有效性、一致性。 线性性和无偏性线性性和无偏性 最小方差特性(有效性)最小方差特性(有效性)1 1、线性性和无偏性、线
19、性性和无偏性 线性性:线性性:是指参数估计量是被解释变量是指参数估计量是被解释变量Y Y的线性组合。的线性组合。即:即: 其中其中,C=(,C=(X X) )-1-1X 为一仅与固定的为一仅与固定的X X有关。有关。无偏性:无偏性:是指参数估计量的期望值与其真实值相等。即:是指参数估计量的期望值与其真实值相等。即: 这里利用了这里利用了X与与 互不相关的基本互不相关的基本假设假设: E(: E(X )=0)=0CYYXXX1)(XXXXXXXYXXX11)()()()()()(1EEEE2 2、有效性(最小方差性)、有效性(最小方差性) 其中利用了:其中利用了: =(XX)-1X(X + )=
20、 +(XX)-1X 和和YXXX1)(I2)(E五、样本容量问题五、样本容量问题1 1、最小样本容量、最小样本容量所谓所谓“最小样本容量最小样本容量”,即从最小二乘原理和最大或然原,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。样本容量的下限。样本最小容量必须不少于模型中解释变样本最小容量必须不少于模型中解释变量的数目(包括常数项),量的数目(包括常数项),即即n k+1。因为,因为,无多重共线无多重共线性的要求是:满秩性的要求是:满秩(X)=(X)=k+12 2、满足基本要求的样本容量、满足基本
21、要求的样本容量 从统计检验的角度:从统计检验的角度: n 30 时,时,Z Z检验才能应用;检验才能应用;n-k8 8时时, , t分布较为稳定分布较为稳定一般经验认为一般经验认为: :当当n30或者至少或者至少n3(k+1)时,才能说满足模时,才能说满足模型估计的基本要求。型估计的基本要求。 模型的良好性质只有在大样本下才能得到理论上的证明。模型的良好性质只有在大样本下才能得到理论上的证明。 六、案例分析六、案例分析-参数估计参数估计案例案例3.2.23.2.2。在例在例2.5.12.5.1中,已建立了中,已建立了中国居民人均消费中国居民人均消费一元线性一元线性模型。这里我们再考虑建立多元线
22、性模型。模型。这里我们再考虑建立多元线性模型。增加一个解释变量:增加一个解释变量:前期消费前期消费CONSP(-1)CONSP(-1),估计区间:,估计区间:19792000年,年,EviewsEviews估计结果估计结果LS / Dependent Variable is CONS Sample(adjusted): 1979 2000 Included observations: 22 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C 120.7000 36.51036 3.30591
23、2 0.0037 GDPP 0.221327 0.060969 3.630145 0.0018 CONSP(-1) 0.451507 0.170308 2.651125 0.0158 R-squared 0.995403 Mean dependent var 928.4946 Adjusted R-squared 0.994920 S.D. dependent var 372.6424 S.E. of regression 26.56078 Akaike info criterion 6.684995 Sum squared resid 13404.02 Schwarz criterion 6
24、.833774 Log likelihood -101.7516 F-statistic 2057.271 Durbin-Watson stat 1.278500 Prob(F-statistic) 0.000000 3.3 3.3 多元线性回归模型多元线性回归模型的统计检验的统计检验 一、一、拟合优度检验拟合优度检验 二、二、方程的显著性检验方程的显著性检验(F(F检验检验) ) 三、三、变量的显著性检验(变量的显著性检验(t t检验)检验) 四、四、参数的置信区间参数的置信区间 一、拟合优度检验一、拟合优度检验 在一元或多元回归模型中,可决系数是用来衡在一元或多元回归模型中,可决系数是用来
25、衡量样本回归线对样本观测值的拟合程度。量样本回归线对样本观测值的拟合程度。可决系数可决系数调整的可决系数调整的可决系数(adjusted coefficient of determination)赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则1 1、可决系数、可决系数总离差平方和的分解:总离差平方和的分解:则有:则有: 由于由于: : =0 =0 所以有:所以有:2222)()(2)()()()(YYYYYYYYYYYYYYTSSiiiiiiiiii)()(YYeYYYYiiiiikiikiiieYXeXee110ESSRSSYYYYTSSiii22)()(注意:注意:一个有趣的现象一个有趣
26、的现象可决系数可决系数该统计量越接近于该统计量越接近于1 1,模型的拟合优度越高。,模型的拟合优度越高。在应用过程中发现,如果在模型中增加一个解释变量,在应用过程中发现,如果在模型中增加一个解释变量, R2往往增大(往往增大(Why?Why?这是因为残差平方和往往随着解释变量个这是因为残差平方和往往随着解释变量个数的增加而相对减小数的增加而相对减小) )这就给人这就给人一个错觉一个错觉:要使得模型拟合得好,只要增加解释:要使得模型拟合得好,只要增加解释变量即可。但是,现实情况往往是,由增加解释变量个数变量即可。但是,现实情况往往是,由增加解释变量个数引起的引起的R R2 2的增大与拟合好坏无关
27、。因此,的增大与拟合好坏无关。因此, R2不是一个合适不是一个合适的指标,需要调整。的指标,需要调整。222222YYYYYYYYYYYYYYYYYYiiiiiiiiiiiiTSSRSSTSSESSR122 2、调整的可决系数、调整的可决系数在样本容量一定的情况下,增加解释变量必定使得自由度在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以减少,所以调整的思路是:调整的思路是:将残差平方和与总离差平方和将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影分别除以各自的自由度,以剔除变量个数对拟合优度的影响:响:调整的可决系数:调整的可决系数: 其中:其中:n-
28、k-1为残差平方和的自由度,为残差平方和的自由度,n-1为总体平方和的自为总体平方和的自由度。由度。) 1/() 1/(12nTSSknRSSR11)1 (122knnRR3 3、赤池信息准则和施瓦茨准则、赤池信息准则和施瓦茨准则为了比较所含解释变量个数不同的多元回归模型的拟合优为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:度,常用的标准还有:、赤池信息准则赤池信息准则(Akaike information criterion, AIC)、施瓦茨准则施瓦茨准则(Schwarz criterion,SC):):这两个准则均要求:这两个准则均要求:仅当所增加的解释变量能够减
29、少仅当所增加的解释变量能够减少AICAIC值值或或SCSC值时,才可以在原模型中增加该解释变量。值时,才可以在原模型中增加该解释变量。在案例在案例3.2.23.2.2中,中,中国居民消费二元模型中:中国居民消费二元模型中:AIC=6.68AIC=6.68,SC=6.83SC=6.83 。 在案例在案例2.5.12.5.1中,中国居民消费一元模型中:中,中国居民消费一元模型中:AIC=7.09AIC=7.09,SC=7.19SC=7.19。从这点看,可以说前期人均居民消费。从这点看,可以说前期人均居民消费CONSP(-1)CONSP(-1)应包括在模型中。应包括在模型中。 nknAIC)1(2l
30、neennknAClnlnee二、方程的显著性检验二、方程的显著性检验(F检验检验) 方程的显著性检验,旨在对模型中被解释变量方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系与解释变量之间的线性关系在总体上在总体上是否显著是否显著成立作出推断。成立作出推断。方程显著性的方程显著性的F F检验检验拟合优度检验与方程显著性检验的关系拟合优度检验与方程显著性检验的关系1 1、方程显著性的、方程显著性的F检验检验 方程显著性的方程显著性的F检验,即检验多元回归模型:检验,即检验多元回归模型: Yi= 0+ 1X1i+ 2X2i+ + kXki + i i=1,2, ,n 中的参数中的参
31、数 j是否显著不为是否显著不为0 0。 可提出原假设可提出原假设H0: 0= 1= k=0;备择假设备择假设H1: j不全为不全为0 F F检验的思想检验的思想来自于总离差平方和的分解式:来自于总离差平方和的分解式:TSS=ESS+RSSTSS=ESS+RSS如果这个比值较大,则如果这个比值较大,则X的联合体对的联合体对Y的解释程度高,可认的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。为总体存在线性关系,反之总体上可能不存在线性关系。因此因此, ,可通过该比值的大小对总体线性关系进行推断可通过该比值的大小对总体线性关系进行推断。由于回归平方和2iyESS是解释变量X的联合
32、体对被解释变量 Y 的线性作用的结果,考虑比值 22/iieyRSSESS 根据数理统计学中的知识,在原假设根据数理统计学中的知识,在原假设H0成立的条件下,统成立的条件下,统计量:计量: 服从自由度为服从自由度为( (k , n-k-1)1)的的F分布。分布。给定显著性水平给定显著性水平 ,可得到临界值,可得到临界值F ( (k,n-k-1) ),由样本求出,由样本求出统计量统计量F的数值,通过:的数值,通过:F F F ( (k,n-k-1) ) 或或 F FF ( (k,n-k-1) )来拒绝或接受原假设来拒绝或接受原假设H0,以判定原方程,以判定原方程总体上总体上的线性关系的线性关系是
33、否显著成立。是否显著成立。对于中国居民人均消费支出的例子:一元模型:对于中国居民人均消费支出的例子:一元模型:F=285.92;二元模型:二元模型:F=2057.3 给定显著性水平给定显著性水平 =0.05,查分布表,得到临界值:一元例:,查分布表,得到临界值:一元例:F (1(1,21)=)=4.32;二元例二元例: F (2(2,19)=)=3.52。 显然有显然有 F F F ( (k,n-k-1) ) ,即二个模型的线性关系在即二个模型的线性关系在95%的的水平下显著成立。水平下显著成立。) 1/(/knRSSkESSF2 2、拟合优度检验与方程显著性检验的关系、拟合优度检验与方程显著
34、性检验的关系由:由: 与:与:可推出:可推出:或:或: 在在中国居民人均收入中国居民人均收入消费消费一元模型和二元模型一元模型和二元模型中,有:中,有: 如果我们先得到如果我们先得到R R2 2=0.1935=0.1935,则肯定认为模型拟合质量不高,但,则肯定认为模型拟合质量不高,但它的总体线性关系的显著性水平达到了它的总体线性关系的显著性水平达到了95%95%。这样,在应用中不。这样,在应用中不必对必对R R2 2过分苛求,重要的是需要考察模型的经济关系是否合理。过分苛求,重要的是需要考察模型的经济关系是否合理。) 1/() 1/(12nTSSknRSSR)1/(/knRSSkESSFkF
35、knnR1112) 1/()1 (/22knRkRF三、变量的显著性检验(三、变量的显著性检验(t检验)检验) 方程的方程的总体线性总体线性关系显著关系显著 每个解释变量每个解释变量对被对被解释变量的影响都是显著的。因此,必须对每解释变量的影响都是显著的。因此,必须对每个解释变量进行显著性检验,以决定是否作为个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。解释变量被保留在模型中。这一检验是由对变这一检验是由对变量的量的 t t 检验完成的。检验完成的。 t 统计量统计量 t 检验检验 案例分析案例分析 1 1、t 统计量统计量 由于:由于: 以以cii表示矩阵表示矩阵(XX)-
36、1 主对角线上的第主对角线上的第i个元素,于是参数估个元素,于是参数估计量的方差为:计量的方差为: 其中其中 2为随机误差项的方差,在实际计算时,用它的估计量为随机误差项的方差,在实际计算时,用它的估计量代替代替: : 因此,可构造如下因此,可构造如下t统计量统计量12)()(XXCoviiicVar2)(1122knkneiee),(2iiiicN) 1(1kntkncStiiiiiiiee2 2、t 检验检验 设计原假设与备择假设:设计原假设与备择假设:H0: i=0(i=1,2k),),H1: i 0 给定显著性水平给定显著性水平 ,可得到临界值,可得到临界值t /2( (n-k-1)
37、),由样本求出,由样本求出统计量统计量t的数值,通过:的数值,通过:| |t| | t /2( (n-k-1) )或或| |t| |t /2( (n-k-1) ) 来拒绝或接受原假设来拒绝或接受原假设H0,从而,从而判定对应的解释变量是否应判定对应的解释变量是否应包括在模型中。包括在模型中。一方面一方面,t检验与检验与F检验都是对相同的原假设检验都是对相同的原假设H0: 1=0=0 进行进行检验检验; ;另一方面另一方面,两个统计量之间有如下关系:,两个统计量之间有如下关系: 注意:注意:在一元线性回归中,在一元线性回归中,t检验检验与与F F检验检验一致一致22221222122212221
38、2212)2()2()2()2(txnexnexnenexneyFiiiiiiiiii3 3、案例分析、案例分析 在在中国居民人均收入中国居民人均收入-消费支出消费支出二元模型二元模型例中,由应用软件例中,由应用软件计算出参数的计算出参数的t值:值: 给定显著性水平给定显著性水平 =0.05,查得相应临界值:,查得相应临界值: t0.025( (19) ) =2.093。可见,可见,计算的所有计算的所有t值都大于该临界值值都大于该临界值,所以拒绝原假设。,所以拒绝原假设。即即:包括常数项在内的包括常数项在内的3个解释变量都在个解释变量都在95%的水平下显著,的水平下显著,都通过了变量显著性检验
39、。都通过了变量显著性检验。 在实际应用中,各变量的在实际应用中,各变量的t值相差较大,且分别在不同的置值相差较大,且分别在不同的置信水平下显著,如何判断?这里没有绝对的显著水平。关信水平下显著,如何判断?这里没有绝对的显著水平。关键仍然是要考察变量的经济关系解释,显著性检验仅是起键仍然是要考察变量的经济关系解释,显著性检验仅是起到验证的作用,不要轻易地剔除变量。到验证的作用,不要轻易地剔除变量。651. 2630. 3306. 3210ttt四、参数的置信区间四、参数的置信区间 参数的置信区间主要是参数的置信区间主要是用来考察:用来考察:在一次抽样中所估计的在一次抽样中所估计的参数值离参数的真
40、实值有多参数值离参数的真实值有多“近近”。 在变量的显著性检验中已经知道:在变量的显著性检验中已经知道: 容易推出:在容易推出:在(1-(1- ) )的置信水平下的置信水平下 i的置信区间是的置信区间是 其中,其中,t /2为显著性水平为为显著性水平为 、自由度为、自由度为n-k-1的临界值。的临界值。) 1(1kntkncStiiiiiiiee(,)iitstsii22在在中国居民人均收入消费支出中国居民人均收入消费支出二元模型二元模型例中例中,给定给定 =0.05,查表得临界值:查表得临界值:t0.025( (19) )=2.093 从回归计算中已得到:从回归计算中已得到: 计算得参数的置
41、信区间:计算得参数的置信区间: 0:(44.284, 197.116); 1:(0.0937, 0.3489 ); 2:(0.0951, 0.8080) 如何才能缩小置信区间?如何才能缩小置信区间? 增大样本容量增大样本容量n,因为在同样的样本容量下,因为在同样的样本容量下,n越大,越大,t分布表分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;量的标准差减小; 提高模型的拟合优度提高模型的拟合优度,因为样本参数估计量的标准差与残差平,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。方
42、和呈正比,模型优度越高,残差平方和应越小。 提高样本观测值的分散度提高样本观测值的分散度, ,一般情况下,样本观测值越分散,一般情况下,样本观测值越分散,( (X XX X)-1)-1的分母的的分母的|X|XX|X|的值越大,致使区间缩小。的值越大,致使区间缩小。170. 04515. 0061. 02213. 051.3670.120210210sss3.4 3.4 多元线性回归模型的预测多元线性回归模型的预测 对于模型:对于模型: 给定样本以外的解释变量的观测值给定样本以外的解释变量的观测值X0=(1,X10,X20,Xk0),可以得到被解释变量的预测值:,可以得到被解释变量的预测值: 它
43、可以是总体均值它可以是总体均值E(Y0)或个值或个值Y0的预测。的预测。 但严格地说,但严格地说,这只是被解释变量的预测值的估计值,而这只是被解释变量的预测值的估计值,而不是预测值。不是预测值。为了进行科学预测,还需求出预测值的置信区为了进行科学预测,还需求出预测值的置信区间,包括间,包括E(Y0)和和Y0的的置信区间置信区间。 一、一、E(Y0)的置信区间的置信区间 二、二、Y0的置信区间的置信区间 三、三、案例分析案例分析XYX00Y一、一、E(Y0)的置信区间的置信区间从参数估计的统计性质易知从参数估计的统计性质易知 :容易证明:容易证明:于是,得到于是,得到(1-(1- ) )的置信水
44、平下的置信水平下E(Y0)的的置信区间。置信区间。其中,其中,t /2/2为为(1-(1- ) )的置信水平下的的置信水平下的临界值。临界值。)()()()(00YEEEYEXXX000)()()(20()X(XXX0000EEYVar0102000)()()(XXXXX)(XX)(X00EEYVar),(020XX)X(XX100NY) 1(knt)E(YY00010XX)X(X010000100)()()(22XXXXXXXXtYYEtY二、二、Y0的置信区间的置信区间如果已知实际的预测值如果已知实际的预测值Y0,那么预测误差为:,那么预测误差为:容易证明:容易证明: e0服从正态分布,即
45、:服从正态分布,即:构造构造t统统计量:计量:可得给定可得给定(1-(1- ) )的置信水平下的置信水平下Y0的的置信区间置信区间:000YYe0)()()()(100000000XXXXXXXEEEeE)(1 ()()()(01022100200XXXXXXXXEeEeVar)(1 (, 0(01020XXXXNe)(1 (010220XXXXe)1(000kntYYte010000100)(1)(122XXXXXXXXtYYtY三、案例分析三、案例分析中国居民人均收入中国居民人均收入- -消费支出消费支出二元模型二元模型例中:例中:2001年人均年人均GDP:4033.1元,于是元,于是人
46、均居民消费的预测值人均居民消费的预测值为为 : 2001=120.7+0.22134033.1+0.45151690.8=1776.8(元)(元) 实测值实测值(90年价)年价)= =1782.2元,元,相对误差:相对误差:-0.31%预测的置信区间预测的置信区间 :于是于是E(E(2001)的的95%的置信区间为的置信区间为: :(1741.8,1811.7),即:),即:同样,同样,2001的的95%的置信区间为:(的置信区间为:(1711.1, 1842.4),即:),即:00004. 000001. 000828. 000001. 000001. 000285. 000828. 000
47、285. 088952. 1)(1XX3938. 0010XX)X(X3938.05.705093.28.17763938.15 .705093.28 .17763.5 3.5 回归模型的其他函数形式回归模型的其他函数形式 在实际经济活动中,经济变量的关系是复杂的,直接表现在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。如著名的为线性关系的情况并不多见。如著名的恩格尔曲线恩格尔曲线(Engle curves)表现为表现为幂函数曲线幂函数曲线形式、宏观经济学中的形式、宏观经济学中的菲利普斯菲利普斯曲线曲线(Pillips cuves)表现为)表现为双曲线双曲线形式等。
48、形式等。 但是,大部分非线性关系又可以通过一些简单的数学处理,但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法进行模型和参数估计。的理论方法进行模型和参数估计。 一、一、模型的类型与变换模型的类型与变换 二、二、非线性回归实例分析非线性回归实例分析一、模型的类型与变换一、模型的类型与变换1 1、倒数模型、多项式模型与变量的直接置换法、倒数模型、多项式模型与变量的直接置换法例如,例如,描述税收与税率关系的描述税收与税率关系的拉弗曲线为拉弗曲线为抛物线,即:抛物线,即: s = a +
49、 b r + c r2 c0 其中:其中:s:税收;:税收; r:税率:税率 设设X1 = r,X2 = r2, 则原方程变换为线性形式:则原方程变换为线性形式: s = a + b X1 + c X2 ck。如果出现。如果出现n2F(n2, n1-k-1) ,则拒绝原假设,认为,则拒绝原假设,认为预测期发生了结构变化。预测期发生了结构变化。 4 4、案例分析、案例分析例例3.6.23.6.2 中国城镇居民食品人均消费需求的邹氏检验。中国城镇居民食品人均消费需求的邹氏检验。 、参数稳定性检验、参数稳定性检验1981198119941994: RSSRSS1 1=0.003240 =0.0032
50、40 1995199520012001: (9.96) (7.14) (-5.13) (1.81)(9.96) (7.14) (-5.13) (1.81)198119812001:2001: (14.83) (27.26) (-3.24) (-11.17) (14.83) (27.26) (-3.24) (-11.17) 给定给定 =5%=5%,查表得临界值,查表得临界值F0.05(4, 13)=3.18F0.05(4, 13)=3.18结论:结论:F F值值 临界值,拒绝参数稳定的原假设,表明中国城镇居民食品临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在人均消费需求在199
51、41994年前后发生了显著变化。年前后发生了显著变化。 、邹氏预测检验、邹氏预测检验给定给定 =5%=5%,查表得临界值,查表得临界值F F0.050.05(7, 10)=3.18(7, 10)=3.18结论:结论:F F值值 临界值,拒绝参数稳定的原假设临界值,拒绝参数稳定的原假设)ln(92. 0)ln(08. 0)ln(05. 163. 3)ln(01PPXQ01ln71. 0ln06. 3ln55. 078.13lnPPXQ01ln39. 1ln14. 0ln21. 100. 5lnPPXQ34.10)821/()000058. 0003240. 0(4/)0000580. 00032
52、40. 0(013789. 0F65. 4) 1314/(003240. 07/)003240. 0013789. 0(F*四、非线性约束四、非线性约束 也可对模型参数施加也可对模型参数施加非线性约束非线性约束, ,如对模型如对模型 施加非线性约束施加非线性约束 1 1 2 2=1,=1,得到得到受约束回归模型受约束回归模型: : 该模型必须采用非线性最小二乘法(该模型必须采用非线性最小二乘法(nonlinear least nonlinear least squaressquares)进行估计。非线性约束检验是建立在最大似然原理)进行估计。非线性约束检验是建立在最大似然原理基础上的基础上的,
53、 ,有最大似然比检验、沃尔德检验与拉格朗日乘数检有最大似然比检验、沃尔德检验与拉格朗日乘数检验验. . 最大似然比检验最大似然比检验LRLR 沃尔德检验沃尔德检验WDWD 拉格朗日乘数检验拉格朗日乘数检验LMLMkkXXXY22110*211101kkXXXY1 1、最大似然比检验、最大似然比检验 (likelihood ratio test, LR)估计估计: :无约束回归模型与受约束回归模型,无约束回归模型与受约束回归模型,方法方法: :最大似然最大似然法,法,检验检验: :两个似然函数的值的差异是否两个似然函数的值的差异是否“足够足够”大。大。记记L L( ( , , 2 2) )为一似
54、然函数为一似然函数: : 无约束回归无约束回归 : Max: Max: 受约束回归受约束回归 :Max: Max: 约束约束:g(g( ) )= =0 0 或或求极值:求极值: 其中:其中:g(g( ):):以各约束条件为元素的列向量以各约束条件为元素的列向量, , :以相应拉格朗日乘数为元素的行向量:以相应拉格朗日乘数为元素的行向量受约束受约束的函数值不会超过的函数值不会超过无约束无约束的函数值,但如果约束条的函数值,但如果约束条件为真,则两个函数值就非常件为真,则两个函数值就非常“接近接近”。由此,定义由此,定义似然比似然比(likelihood ratiolikelihood ratio): : LR= LR=
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 文物安全的宣传
- 施工员2025年度工作方案报告
- 酒管管理培训课件
- 2025年临床护理下半年工作方案
- 新员工培训及考核方案
- 市场数据分析与未来工作计划
- 幼儿园老师培训方案2025年
- 《核电电气仪表安装与调试》全套教学课件
- 配电箱线路知识培训课件
- 半月板损伤围手术期护理
- 安徽省合肥市2025届高三下学期3月二模试题 语文 含解析
- 命案防控讲座课件内容
- 2024年广西职业院校技能大赛中职组《大数据应用与服务》赛项竞赛样题
- 2025年郑州黄河护理职业学院单招职业适应性考试题库带答案
- 9.1日益完善和法律体系课件-2024-2025学年统编版道德与法治七年级下册
- 2024年全国统一高考英语试卷(新课标Ⅰ卷)含答案
- 快板 绕口令 《玲珑塔》
- 学校国有资产流失的成因及对策
- 报联商——有效沟通PPT课件
- 台湾民法典目录
- 8.8级螺栓上海红本价
评论
0/150
提交评论