计量经济学Stata软件应用2---【Stata软件之回归分析】--2次课_第1页
计量经济学Stata软件应用2---【Stata软件之回归分析】--2次课_第2页
计量经济学Stata软件应用2---【Stata软件之回归分析】--2次课_第3页
计量经济学Stata软件应用2---【Stata软件之回归分析】--2次课_第4页
计量经济学Stata软件应用2---【Stata软件之回归分析】--2次课_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量经济软件应用计量经济软件应用 Stata软件实验之一元、软件实验之一元、 多元回归分析多元回归分析 内容概要内容概要 一、实验目的一、实验目的 二、简单回归分析的二、简单回归分析的Stata基本命令基本命令 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 四、多元回归分析的四、多元回归分析的Stata基本命令基本命令 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例 一、实验目的:一、实验目的: 掌握运用掌握运用Stata软件进行简单回归分析以及软件进行简单回归分析以及 多元回归分析的操作方法和步骤,并能看懂多元回归分析的操作方法和步骤,并能看

2、懂 Stata软件运行结果。软件运行结果。 二、简单回归分析的二、简单回归分析的Stata基本命令基本命令 u简单线性回归模型简单线性回归模型 ( simple linear regression model ) 指指 只有一个解释变量的回归模型。如:只有一个解释变量的回归模型。如: 其中,其中,y 为被解释变量,为被解释变量,x 为解释变量,为解释变量,u 为随机误差项,为随机误差项, 表示除表示除 x 之外影响之外影响 y 的因素;的因素; 称为斜率参数或斜率系称为斜率参数或斜率系 数,数, 称为截距参数或截距系数,也称为截距项或常数项。称为截距参数或截距系数,也称为截距项或常数项。 简单

3、线性回归模型的一种特殊情况:简单线性回归模型的一种特殊情况: 即假定截距系数即假定截距系数 时,该模型被称为过原点回归;过时,该模型被称为过原点回归;过 原点回归在实际中有一定的应用,但除非有非常明确的理原点回归在实际中有一定的应用,但除非有非常明确的理 论分析表明论分析表明 ,否则不宜轻易使用过原点回归模型。,否则不宜轻易使用过原点回归模型。 01 yxu 1 0 1 yxu 0 0 0 0 二、简单回归分析的二、简单回归分析的Stata基本命令基本命令 regress y x 以以 y 为被解释变量,为被解释变量,x 为解释变量进行普通最小二乘为解释变量进行普通最小二乘 (OLS)回归。回

4、归。regress命令可简写为横线上方的三个字命令可简写为横线上方的三个字 母母reg。 regress y x, noconstant y 对对 x 的回归,不包含截距项的回归,不包含截距项 (constant),即过原点回归。,即过原点回归。 predict z 根据最近的回归生成一个新变量根据最近的回归生成一个新变量 z,其值等于每一个观测,其值等于每一个观测 的拟合值(即的拟合值(即 )。)。 predict u, residual 根据最近的回归生成一个根据最近的回归生成一个新变量新变量 u,其值等于每一个观测,其值等于每一个观测 的残差(即的残差(即 )。)。 iy iii eyy

5、 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 实验实验 1 简单回归分析:教育对工资的影响简单回归分析:教育对工资的影响 劳动经济学中经常讨论的一个问题是劳动者工资的决定。不劳动经济学中经常讨论的一个问题是劳动者工资的决定。不 难想象,决定工资的因素有很多,例如能力、性别、工作经验、难想象,决定工资的因素有很多,例如能力、性别、工作经验、 教育水平、行业、职业等。在这里仅考虑其中一种因素:教育教育水平、行业、职业等。在这里仅考虑其中一种因素:教育 水平,建立如下计量模型:水平,建立如下计量模型: 其中,其中,wage 为被解释变量,表示小时工资,单位为元;为被解释变

6、量,表示小时工资,单位为元;edu 为解释变量,表示受教育年限,即个人接受教育的年数,单为解释变量,表示受教育年限,即个人接受教育的年数,单 位为年;位为年;u为随机误差项。假定模型为随机误差项。假定模型(3.1)满足简单回归模型的满足简单回归模型的 全部全部5条基本假定,这样条基本假定,这样 的的OLS估计量估计量 将是最佳线性将是最佳线性 无偏估计量。请根据无偏估计量。请根据表表S-2中给出的数据采用中给出的数据采用Stata软件完成上软件完成上 述模型的估计等工作。述模型的估计等工作。 01 ,(, 3.1)wageedu u 01 , 01 , 三、简单回归分析的三、简单回归分析的St

7、ata软件操作实例软件操作实例 1、打开数据文件。、打开数据文件。直接双击直接双击“工资方程工资方程1.dta”文件;或者点文件;或者点 击击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择“工资方程工资方程 1.dta”即可;或者先复制即可;或者先复制Excel表表S-2中的数据,再点击中的数据,再点击Stata 窗口工具栏右起第窗口工具栏右起第4个个Data Editor键,将数据粘贴到打开的键,将数据粘贴到打开的 数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左 起第二个起第二个Save键保存数据,保存

8、时需要给数据文件命名。键保存数据,保存时需要给数据文件命名。 2、给出数据的简要描述。、给出数据的简要描述。使用使用describe命令,简写为:命令,简写为: des 得到以下运行结果;得到以下运行结果; 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 结果显示结果显示“工资方程工资方程1.dta”数据文件包含数据文件包含1225个样本和个样本和11个个 变变 量;量;11个变量的定义及说明见第个变量的定义及说明见第3列。列。 more w wa ag ge e float %9.0g h ho ou ur rl ly y w wa ag ge e m mi ig g

9、r ra an nt t float %9.0g 1 1: :m mi ig gr ra an nt t w wo or rk ke er r; ; 0 0: :l lo oc ca al l w wo or rk ke er r h he ea al lt th h float %9.0g 1 1: :b ba ad d; ; 2 2: :g go oo od d; ; 3 3: :v ve er ry y g go oo od d e ex xp ps sq q float %9.0g e ex xp p 2 2 a ag ge e- -e ed du u- -6 6 e ex xp p

10、float %9.0g y ye ea ar rs s o of f w wo or rk k e ex xp pe er ri ie en nc ce e: : e ed du u float %9.0g y ye ea ar rs s o of f e ed du uc ca at ti io on n 4 4: :c co ol ll le eg ge e e ed du ul le ev ve el l float %9.0g 1 1: :p pr ri im ma ar ry y; ; 2 2: :j ju un ni io or r; ; 3 3: :s se en ni io o

11、r r; ; m ma ar rr ri ie ed d float %9.0g 1 1: :m ma ar rr ri ie ed d; ; 0 0: :u un nm ma ar rr ri ie ed d f fe em ma al le e float %9.0g 1 1: :f fe em ma al le e; ; 0 0: :m ma al le e a ag ge e float %9.0g a ag ge e i in n y ye ea ar rs s variable name type format label variable label storage displa

12、y value size: 5 58 8, ,8 80 00 0 (99.4% of memory free) vars: 1 11 1 2 25 5 A Au ug g 2 20 00 09 9 0 08 8: :3 38 8 obs: 1 1, ,2 22 25 5 1 10 06 64 49 92 28 89 9 s st ta at ta a1 10 0 1 1. .d dt ta a Contains data from D D: : 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 3、变量的描述性统计分析。、变量的描述性统计分析。对于定量变量,使用对于定量变

13、量,使用summarize 命令:命令:su age edu exp expsq wage lnwage,得到以下运行结得到以下运行结 果,保存该运行结果;果,保存该运行结果; 第第1列:变量名;列:变量名; 第第2列:观测数;列:观测数; 第第3列:均值;列:均值; 第第4列:标准差;列:标准差; 第第5列:最小值;列:最小值; 第第6列:最大值。列:最大值。 lnwage 1 12 22 25 5 1 1. .8 80 08 83 35 52 2 . .5 53 30 07 73 39 99 9 . .2 22 23 31 14 43 35 5 3 3. .6 62 24 43 34 41

14、 1 wage 1 12 22 25 5 7 7. .1 12 25 55 5 4 4. .7 76 66 68 82 28 8 1 1. .2 25 5 3 37 7. .5 5 expsq 1 12 22 25 5 6 61 13 3. .9 97 77 76 6 5 54 48 8. .3 30 07 72 2 0 0 2 25 50 00 0 exp 1 12 22 25 5 2 21 1. .8 80 04 49 9 1 11 1. .7 77 74 44 43 3 0 0 5 50 0 edu 1 12 22 25 5 8 8. .9 99 92 26 65 53 3 2 2. .

15、7 71 19 90 06 68 8 0 0 1 19 9 age 1 12 22 25 5 3 36 6. .7 79 97 75 55 5 1 10 0. .6 67 76 63 31 1 1 16 6 6 60 0 Variable Obs Mean Std. Dev. Min Max 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 4、wage对对edu的的OLS回归。回归。使用使用regress命令:命令: reg wage edu,得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果; (1) 表下方区域为基本的回归结果。第表下方区域为基本的回

16、归结果。第1列依次为被解释变量列依次为被解释变量wage,解释,解释 变量变量edu,截距项,截距项constant;第;第2列回归系数的列回归系数的OLS估计值;第估计值;第3列回归系列回归系 数的标准误;第数的标准误;第4列回归系数的列回归系数的 t 统计量值;统计量值; 写出样本回归方程为:写出样本回归方程为: 即如果受教育年限增加即如果受教育年限增加1年,平均来说小时工资会增加年,平均来说小时工资会增加0.39元。元。 _cons 3 3. .5 58 84 46 69 95 5 . .4 45 58 89 90 08 88 8 7 7. .8 81 1 0 0. .0 00 00 0

17、 2 2. .6 68 84 43 35 59 9 4 4. .4 48 85 50 03 31 1 edu . .3 39 93 37 74 44 42 2 . .0 04 48 88 84 49 91 1 8 8. .0 06 6 0 0. .0 00 00 0 . .2 29 97 79 90 06 69 9 . .4 48 89 95 58 81 15 5 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 27 78 81 12 2. .5 51 19 91 1 1 12 22 24 4 2 22 2. .7 72 22 26

18、 64 46 63 3 Root MSE = 4 4. .6 64 46 69 9 Adj R-squared = 0 0. .0 04 49 97 7 Residual 2 26 64 40 09 9. .5 54 44 45 5 1 12 22 23 3 2 21 1. .5 59 94 40 06 67 75 5 R-squared = 0 0. .0 05 50 04 4 Model 1 14 40 02 2. .9 97 74 46 61 1 1 1 1 14 40 02 2. .9 97 74 46 61 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 12

19、23) = 6 64 4. .9 97 7 Source SS df MS Number of obs = 1 12 22 25 5 3.58470.3937 (0.4589) (0.0488) wageedu 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 (2) 表左上方区域为方差分析表。第表左上方区域为方差分析表。第2列从上到下依次为回归平方和列从上到下依次为回归平方和(SSE)、 残差平方和残差平方和(SSR)和总离差平方和和总离差平方和(SST);第;第3列为自由度,分别为列为自由度,分别为k=1, n-k-1=1225-1-1=1223,n-1=1225-1

20、=1224;第第4列为均方和列为均方和(MSS),由各项,由各项 平方和除以相应的自由度得到。平方和除以相应的自由度得到。 (3) 表右上方区域给出了样本数表右上方区域给出了样本数(Number of obs)、判定系数、判定系数(R-squared)、 调整的判定系数调整的判定系数(Adj R-squared)、F统计量的值、回归方程标准误或均方统计量的值、回归方程标准误或均方 根误根误(Root MSE, 或或 S.E.) 以及其他一些统计量的信息。以及其他一些统计量的信息。 u上述回归分析的菜单操作实现:上述回归分析的菜单操作实现:StatisticsLinear models and

21、related Linear regression弹出对话框,在弹出对话框,在Dependent Variable选项框中选择或键选项框中选择或键 入入wage,在,在Independent Variables选项框中选择或键入选项框中选择或键入edu点击点击OK即可即可 _cons 3 3. .5 58 84 46 69 95 5 . .4 45 58 89 90 08 88 8 7 7. .8 81 1 0 0. .0 00 00 0 2 2. .6 68 84 43 35 59 9 4 4. .4 48 85 50 03 31 1 edu . .3 39 93 37 74 44 42 2

22、 . .0 04 48 88 84 49 91 1 8 8. .0 06 6 0 0. .0 00 00 0 . .2 29 97 79 90 06 69 9 . .4 48 89 95 58 81 15 5 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 27 78 81 12 2. .5 51 19 91 1 1 12 22 24 4 2 22 2. .7 72 22 26 64 46 63 3 Root MSE = 4 4. .6 64 46 69 9 Adj R-squared = 0 0. .0 04 49 97 7 Re

23、sidual 2 26 64 40 09 9. .5 54 44 45 5 1 12 22 23 3 2 21 1. .5 59 94 40 06 67 75 5 R-squared = 0 0. .0 05 50 04 4 Model 1 14 40 02 2. .9 97 74 46 61 1 1 1 1 14 40 02 2. .9 97 74 46 61 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 6 64 4. .9 97 7 Source SS df MS Number of obs = 1 12 22 25 5 三、简单回归分析的三、简

24、单回归分析的Stata软件操作实例软件操作实例 5、生成新变量、生成新变量 z 为上一个回归的拟合值,生成新变量为上一个回归的拟合值,生成新变量 u 为为 上一个回归的残差;上一个回归的残差;然后根据然后根据 u 对数据进行从小到大的排对数据进行从小到大的排 序,并列出序,并列出 u 最小的最小的5个观测。个观测。 命令如下:命令如下: predict z (生成拟合值生成拟合值) predict u, residual ( 生成残差生成残差 ) sort u (根据根据 u 对数据从小到大排序对数据从小到大排序) list wage z u in 1/5 (列出列出 u 最小的最小的5个观测

25、值以及对应的实个观测值以及对应的实 际样本观测值和拟合值际样本观测值和拟合值) 即对于观测即对于观测 1,小时工资的实际观测值,小时工资的实际观测值(wage)为为2.46,拟合值,拟合值(z)为为 9.10,残差,残差(u)为为-6.64。 5. 1 1. .2 25 5 9 9 7 7. .1 12 28 83 39 93 3 - -5 5. .8 87 78 83 39 93 3 4. 2 2. .3 38 80 09 95 52 2 1 12 2 8 8. .3 30 09 96 62 26 6 - -5 5. .9 92 28 86 67 73 3 3. 3 3 1 14 4 9 9

26、. .0 09 97 71 11 15 5 - -6 6. .0 09 97 71 11 14 4 2. 1 1. .7 78 85 57 71 14 4 1 11 1 7 7. .9 91 15 58 88 82 2 - -6 6. .1 13 30 01 16 67 7 1. 2 2. .4 45 55 53 35 57 7 1 14 4 9 9. .0 09 97 71 11 15 5 - -6 6. .6 64 41 17 75 57 7 w wa ag ge e e ed du u z z u u 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 6、画出以、画

27、出以wage为纵轴,以为纵轴,以edu为横轴的散点图,并加入样本为横轴的散点图,并加入样本 回归线。回归线。命令如下:命令如下: graph twoway lfit wage edu | scatter wage edu 得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果; 010203040 05101520 years of education Fitted valueshourly wage 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 7、wage对对edu的的OLS回归,只使用年龄小于或等于回归,只使用年龄小于或等于30岁的样岁的样 本。本。

28、命令如下:命令如下: reg wage edu if age|t| 95% Conf. Interval Total 7 71 15 56 6. .3 34 43 37 78 8 3 36 64 4 1 19 9. .6 66 60 02 28 85 51 1 Root MSE = 4 4. .3 32 23 39 9 Adj R-squared = 0 0. .0 04 49 90 0 Residual 6 67 78 86 6. .6 63 30 09 95 5 3 36 63 3 1 18 8. .6 69 95 59 95 53 3 R-squared = 0 0. .0 05 51

29、17 7 Model 3 36 69 9. .7 71 12 28 82 27 7 1 1 3 36 69 9. .7 71 12 28 82 27 7 Prob F = 0 0. .0 00 00 00 0 F( 1, 363) = 1 19 9. .7 78 8 Source SS df MS Number of obs = 3 36 65 5 2.76070.4146 (0.9688) (0.0932) wageedu 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 8、 wage对对edu的的OLS回归,不包含截距项,即过原点回归。回归,不包含截距项,即过原点回

30、归。 命令如下:命令如下: reg wage edu, noconstant 得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果; edu . .7 75 59 90 00 02 26 6 . .0 01 14 44 47 75 52 2 5 52 2. .4 43 3 0 0. .0 00 00 0 . .7 73 30 06 60 03 37 7 . .7 78 87 74 40 01 16 6 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 9 90 00 00 09 9. .1 14 42 29 9 1 12 2

31、2 25 5 7 73 3. .4 47 76 68 85 51 14 4 Root MSE = 4 4. .7 75 59 95 5 Adj R-squared = 0 0. .6 69 91 17 7 Residual 2 27 77 72 27 7. .1 15 51 19 9 1 12 22 24 4 2 22 2. .6 65 52 29 90 01 19 9 R-squared = 0 0. .6 69 92 20 0 Model 6 62 22 28 81 1. .9 99 91 11 1 1 1 6 62 22 28 81 1. .9 99 91 11 1 Prob F = 0

32、 0. .0 00 00 00 0 F( 1, 1224) = 2 27 74 49 9. .4 40 0 Source SS df MS Number of obs = 1 12 22 25 5 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 9、取半对数模型。、取半对数模型。模型模型 (3.1) 假定增加假定增加 1 年受教育年限带来年受教育年限带来 相同数量的工资增长;但美国经济学家明瑟相同数量的工资增长;但美国经济学家明瑟(J. Mincer)等人等人 的研究表明,的研究表明,更合理的情况是增加更合理的情况是增加 1 年受教育年限导致相同年受教育年限导致相同 百

33、分比的工资增长百分比的工资增长。这就需要使用。这就需要使用半对数模型半对数模型(对数对数-水平模水平模 型型),即:,即: 其中其中lnwage是小时工资的自然对数;是小时工资的自然对数;斜率系数的经济含义是:斜率系数的经济含义是: 增加增加 1 年受教育年限导致收入增长年受教育年限导致收入增长 ,该百分比值一,该百分比值一 般称为般称为教育收益率或教育回报率教育收益率或教育回报率(the rate of return to education) u做做lnwage对对edu的回归,命令如下:的回归,命令如下: reg lnwage edu 得到以下运行结果,保存该运行结果得到以下运行结果,保

34、存该运行结果(见下页见下页); 01 ,ln(, 3.2)wageeduu 1 100% 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 写出样本回归方程为:写出样本回归方程为: 结果表明结果表明教育收益率教育收益率的估计值为的估计值为5.03%,即平均而言,增加,即平均而言,增加 1 年受教育年限使得工资增长年受教育年限使得工资增长5.03% 。 _cons 1 1. .3 35 55 56 61 19 9 . .0 05 50 06 66 60 05 5 2 26 6. .7 76 6 0 0. .0 00 00 0 1 1. .2 25 56 62 22 28 8

35、 1 1. .4 45 55 50 01 1 edu . .0 05 50 03 34 44 48 8 . .0 00 05 53 39 92 26 6 9 9. .3 34 4 0 0. .0 00 00 0 . .0 03 39 97 76 65 5 . .0 06 60 09 92 24 46 6 lnwage Coef. Std. Err. t P|t| 95% Conf. Interval Total 3 34 44 4. .7 78 82 22 21 1 1 12 22 24 4 . .2 28 81 16 68 84 48 81 12 2 Root MSE = . .5 51 1

36、2 29 99 9 Adj R-squared = 0 0. .0 06 65 58 8 Residual 3 32 21 1. .8 84 45 55 55 58 8 1 12 22 23 3 . .2 26 63 31 16 60 07 71 18 8 R-squared = 0 0. .0 06 66 65 5 Model 2 22 2. .9 93 36 66 65 52 21 1 1 1 2 22 2. .9 93 36 66 65 52 21 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 8 87 7. .1 16 6 Source SS

37、df MS Number of obs = 1 12 22 25 5 ln1.35560.0503 (0.0507) (0.0054) wageedu 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 10、最后可建立、最后可建立 do 文件把前面所执行过的命令保存下来。文件把前面所执行过的命令保存下来。 在在do文件的编辑窗口中(点击文件的编辑窗口中(点击Stata窗口工具栏右起第窗口工具栏右起第5个个 New Do-file Editor键即打开键即打开Stata的的do文件编辑窗口)键入如文件编辑窗口)键入如 下命令和注释,并保存为下命令和注释,并保存为“工资方程工

38、资方程1.do”文件。该文件的内文件。该文件的内 容为:容为: use “D:讲课资料周蓓的上课资料数据【重要】【计量经济学软件应用 课件】10649289stata10工资方程1.dta“, clear/打开数据文件 des/数据的简要描述 su age edu exp expsq wage lnwage/定量变量的描述性统计 reg wage edu/简单线性模型的OLS估计 graph twoway lfit wage edu | scatter wage edu/作图 reg wage edu if age|t| 95% Conf. Interval Total 4 44 48 81

39、17 7. .1 18 80 05 5 4 40 07 7 1 11 10 0. .1 11 15 59 92 23 3 Root MSE = 1 10 0. .3 33 32 2 Adj R-squared = 0 0. .0 03 30 06 6 Residual 4 43 33 33 39 9. .9 98 83 38 8 4 40 06 6 1 10 06 6. .7 74 48 87 72 29 9 R-squared = 0 0. .0 03 33 30 0 Model 1 14 47 77 7. .1 19 96 66 67 7 1 1 1 14 47 77 7. .1 19 9

40、6 66 67 7 Prob F = 0 0. .0 00 00 02 2 F( 1, 406) = 1 13 3. .8 84 4 Source SS df MS Number of obs = 4 40 08 8 . reg math expend 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 u水平水平-对数模型的命令及运行结果如下:对数模型的命令及运行结果如下: reg math lnexpend 估计结果:估计结果: 即学校生均支出增加即学校生均支出增加1%,使得学生数学平均成绩将提高,使得学生数学平均成绩将提高 0.11分;分; _cons 7 7. .7

41、 77 79 97 79 99 9 4 4. .6 66 62 26 66 68 8 1 1. .6 67 7 0 0. .0 09 96 6 - -1 1. .3 38 86 61 18 85 5 1 16 6. .9 94 45 57 78 8 lnexpend 1 11 1. .1 16 64 44 4 3 3. .1 16 69 90 01 11 1 3 3. .5 52 2 0 0. .0 00 00 0 4 4. .9 93 34 46 68 85 5 1 17 7. .3 39 94 41 12 2 math Coef. Std. Err. t P|t| 95% Conf. In

42、terval Total 4 44 48 81 17 7. .1 18 80 05 5 4 40 07 7 1 11 10 0. .1 11 15 59 92 23 3 Root MSE = 1 10 0. .3 35 5 Adj R-squared = 0 0. .0 02 27 73 3 Residual 4 43 34 48 87 7. .7 75 53 34 4 4 40 06 6 1 10 07 7. .1 11 12 26 69 93 3 R-squared = 0 0. .0 02 29 97 7 Model 1 13 32 29 9. .4 42 27 70 07 7 1 1

43、1 13 32 29 9. .4 42 27 70 07 7 Prob F = 0 0. .0 00 00 05 5 F( 1, 406) = 1 12 2. .4 41 1 Source SS df MS Number of obs = 4 40 08 8 . reg math lnexpend 7.78 11.16lnmathexpend 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 u对数对数-水平模型的命令及运行结果如下:水平模型的命令及运行结果如下: reg lnmath expend 估计结果:估计结果: 即学校生均支出增加即学校生均支出增加1千元,使得学

44、生数学平均成绩将提高千元,使得学生数学平均成绩将提高 7%; _cons 2 2. .7 76 61 11 16 61 1 . .1 14 40 09 94 44 49 9 1 19 9. .5 59 9 0 0. .0 00 00 0 2 2. .4 48 84 40 08 88 8 3 3. .0 03 38 82 23 33 3 expend . .0 07 71 18 83 34 49 9 . .0 03 31 17 71 11 12 2 2 2. .2 27 7 0 0. .0 02 24 4 . .0 00 09 94 49 96 62 2 . .1 13 34 41 17 73

45、36 6 lnmath Coef. Std. Err. t P|t| 95% Conf. Interval Total 1 10 01 1. .2 27 71 18 88 84 4 4 40 07 7 . .2 24 48 88 82 25 52 26 67 7 Root MSE = . .4 49 96 63 31 1 Adj R-squared = 0 0. .0 01 10 00 0 Residual 1 10 00 0. .0 00 07 78 86 66 6 4 40 06 6 . .2 24 46 63 32 24 47 79 92 2 R-squared = 0 0. .0 01

46、 12 25 5 Model 1 1. .2 26 64 40 01 18 83 3 1 1 1 1. .2 26 64 40 01 18 83 3 Prob F = 0 0. .0 02 24 40 0 F( 1, 406) = 5 5. .1 13 3 Source SS df MS Number of obs = 4 40 08 8 . reg lnmath expend ln2.760.07mathexpend 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例 u对数对数-对数模型的命令及运行结果如下:对数模型的命令及运行结果如下: reg lnmath lnex

47、pend 估计结果:估计结果: 即学校生均支出增加即学校生均支出增加1%,使得学生数学平均成绩将提高,使得学生数学平均成绩将提高 0.32%; _cons 2 2. .6 61 13 36 66 63 3 . .2 22 23 38 82 21 16 6 1 11 1. .6 68 8 0 0. .0 00 00 0 2 2. .1 17 73 36 66 69 9 3 3. .0 05 53 36 65 57 7 lnexpend . .3 31 15 58 83 38 83 3 . .1 15 52 21 12 21 17 7 2 2. .0 08 8 0 0. .0 03 39 9 .

48、.0 01 16 67 79 93 38 8 . .6 61 14 48 88 82 29 9 lnmath Coef. Std. Err. t P|t| 95% Conf. Interval Total 1 10 01 1. .2 27 71 18 88 84 4 4 40 07 7 . .2 24 48 88 82 25 52 26 67 7 Root MSE = . .4 49 96 68 81 1 Adj R-squared = 0 0. .0 00 08 81 1 Residual 1 10 00 0. .2 20 07 79 92 29 9 4 40 06 6 . .2 24 46

49、 68 81 17 75 55 59 9 R-squared = 0 0. .0 01 10 05 5 Model 1 1. .0 06 63 39 95 55 5 1 1 1 1. .0 06 63 39 95 55 5 Prob F = 0 0. .0 03 38 85 5 F( 1, 406) = 4 4. .3 31 1 Source SS df MS Number of obs = 4 40 08 8 . reg lnmath lnexpend ln2.61 0.32lnmathexpend 四、多元回归分析的四、多元回归分析的Stata基本命令基本命令 u对于多元线性回归模型:对于

50、多元线性回归模型: regress y x1 x2xk 以以 y 为被解释变量,为被解释变量, x1, x2,xk 为解释变量进行普通最为解释变量进行普通最 小二乘小二乘(OLS)回归。回归。regress命令可简写为命令可简写为reg; regress y x1 x2xk, noconstant y对对x1, x2,xk的回归,不包含截距项,即过原点回归;的回归,不包含截距项,即过原点回归; test x1 x2 x3 根据最近的回归进行根据最近的回归进行 F 检验,原假设为:检验,原假设为: test 根据最近的回归进行根据最近的回归进行F检验,原假设为:检验,原假设为: 01 122kk

51、 yxxxu 123 0,0,0 11 ()x 22 ()x 33 ()x 112233 , 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例 实验实验 1 多元回归分析:工资方程多元回归分析:工资方程 利用数据文件利用数据文件“工资方程工资方程1.dta”建立工资方程考察影响小时建立工资方程考察影响小时 工资工资(wage)的因素,重点关注受教育年限的因素,重点关注受教育年限(edu)的系数,即教的系数,即教 育收益率育收益率(即对数即对数-水平模型的斜率系数水平模型的斜率系数)。 1、打开数据文件。、打开数据文件。直接双击直接双击“工资方程工资方程1.dta”文件;或

52、者点文件;或者点 击击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择“工资方程工资方程 1.dta”即可;即可; 2、简单回归分析。、简单回归分析。首先建立简单回归模型首先建立简单回归模型(对数对数-水平模型水平模型): 命令及运行结果如下:命令及运行结果如下: reg lnwage edu 01 lnwageedu u 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例 回归结果表明:如果不考虑其他因素的影响,回归结果表明:如果不考虑其他因素的影响,教育收益率教育收益率 的估计值为的估计值为5.03%,即平均而言,增加,即平均而言,增加 1

53、年受教育年限使年受教育年限使 得工资增长得工资增长5.03% 。 _cons 1 1. .3 35 55 56 61 19 9 . .0 05 50 06 66 60 05 5 2 26 6. .7 76 6 0 0. .0 00 00 0 1 1. .2 25 56 62 22 28 8 1 1. .4 45 55 50 01 1 edu . .0 05 50 03 34 44 48 8 . .0 00 05 53 39 92 26 6 9 9. .3 34 4 0 0. .0 00 00 0 . .0 03 39 97 76 65 5 . .0 06 60 09 92 24 46 6 ln

54、wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 3 34 44 4. .7 78 82 22 21 1 1 12 22 24 4 . .2 28 81 16 68 84 48 81 12 2 Root MSE = . .5 51 12 29 99 9 Adj R-squared = 0 0. .0 06 65 58 8 Residual 3 32 21 1. .8 84 45 55 55 58 8 1 12 22 23 3 . .2 26 63 31 16 60 07 71 18 8 R-squared = 0 0. .0 06 66

55、65 5 Model 2 22 2. .9 93 36 66 65 52 21 1 1 1 2 22 2. .9 93 36 66 65 52 21 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 8 87 7. .1 16 6 Source SS df MS Number of obs = 1 12 22 25 5 . reg lnwage edu 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例 3、多元回归分析。、多元回归分析。除了除了受教育年限受教育年限 (edu) 之外,之外,工作经验工作经验 (exp) 也是影响也是影响

56、小时工资小时工资 (wage) 的重要因素。从理论上分的重要因素。从理论上分 析,其他条件不变,工作经验越长表明劳动者的工作经验越析,其他条件不变,工作经验越长表明劳动者的工作经验越 丰富,劳动生产率也越高,从而工资水平较高。如果丰富,劳动生产率也越高,从而工资水平较高。如果工作经工作经 验验(exp)与与受教育年限受教育年限(edu)不相关或相关程度很低,那么在工不相关或相关程度很低,那么在工 资方程中是否加入工作经验资方程中是否加入工作经验(exp)对对教育收益率教育收益率的估计几乎没的估计几乎没 有影响;但如果有影响;但如果工作经验工作经验(exp)与与受教育年限受教育年限(edu)显著

57、相关,显著相关, 那么在工资方程中不加入工作经验那么在工资方程中不加入工作经验(exp)会使得会使得教育收益率教育收益率的的 估计有偏误。为此,需要首先考察样本中估计有偏误。为此,需要首先考察样本中工作经验工作经验(exp)与与受受 教育年限教育年限(edu)是否显著相关,方法是计算二者之间的样本相是否显著相关,方法是计算二者之间的样本相 关系数并进行显著性检验,使用的命令如下:关系数并进行显著性检验,使用的命令如下: pwcorr edu exp, sig (pwcorr求样本相关系数命令,选项求样本相关系数命令,选项sig表示列出原假设表示列出原假设H0为相关为相关 系数等于系数等于0的假

58、设检验的精确显著性水平,即统计量的相伴概率值的假设检验的精确显著性水平,即统计量的相伴概率值) 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例 得到以下运行结果:得到以下运行结果: 可见,可见,edu与与exp的样本相关系数为的样本相关系数为-0.5005,显著性水平即假显著性水平即假 设检验统计量的相伴概率值为设检验统计量的相伴概率值为0.0000,即拒绝相关系数等于,即拒绝相关系数等于 0的原假设,的原假设,edu与与exp之间存在显著负相关之间存在显著负相关;因此,如果理;因此,如果理 论上论上exp对工资对工资(wage)的影响为正,那么在回归方程中遗漏了的影响

59、为正,那么在回归方程中遗漏了 exp 会使得会使得 edu 的系数估计产生负的偏误,即估计值偏低。的系数估计产生负的偏误,即估计值偏低。 为此,考虑使用多元回归模型:为此,考虑使用多元回归模型: 使用的命令及运行结果如下:使用的命令及运行结果如下: 0 0. .0 00 00 00 0 exp - -0 0. .5 50 00 05 5 1 1. .0 00 00 00 0 edu 1 1. .0 00 00 00 0 edu exp . pwcorr edu exp, sig 012 ln wageeduexpu 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例 reg

60、 lnwage edu exp (1) 表下方区域为回归分析的主要结果表下方区域为回归分析的主要结果。第。第1列分别为被解释变量列分别为被解释变量 Lnwage,解释变量,解释变量edu,解释变量,解释变量exp以及截距项;第以及截距项;第2列显示回列显示回 归系数的归系数的OLS估计值;第估计值;第3列显示回归系数的标准误;第列显示回归系数的标准误;第4列显示列显示 回归系数的回归系数的 t 统计量;第统计量;第5列显示列显示 t 检验的精确的显著性水平检验的精确的显著性水平(即即 t 统计量的相伴概率统计量的相伴概率P值值);最后两列显示置信水平为;最后两列显示置信水平为95%的回归系的回

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论