研究生计量经济学课件第二章2011.3.11_第1页
研究生计量经济学课件第二章2011.3.11_第2页
研究生计量经济学课件第二章2011.3.11_第3页
研究生计量经济学课件第二章2011.3.11_第4页
研究生计量经济学课件第二章2011.3.11_第5页
已阅读5页,还剩153页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量经济模型化过程分析 理论的计量经济模型 不 合 格 模型的检验 估计模型的参数 收集适当的资料(数据) 合格 政策评价预测 第二章第二章 简单回归模型简单回归模型 Chapter Outline 本章大纲 Definition of the Simple Regression Model 简单回归模型的定义简单回归模型的定义 Deriving the Ordinary Least Squares Estimates 普通最小二乘法的推导普通最小二乘法的推导 Mechanics of OLS OLS的操作技巧的操作技巧 Units of Measurement and Functional

2、Form 测量单位和函数形式测量单位和函数形式 Expected Values and Variances of the OLS estimators OLS估计量的期望值和方差估计量的期望值和方差 Regression through the Origin 过原点回归过原点回归 回归分析回归分析(regression analysis)是研究一是研究一 个变量关于另一个(些)变量的具体依赖关系个变量关于另一个(些)变量的具体依赖关系 的计算方法和理论的计算方法和理论。 其用意其用意:在于通过后者的已知或设定值,在于通过后者的已知或设定值, 去估计和(或)预测前者的(总体)均值去估计和(或)预

3、测前者的(总体)均值。 回归分析的基本概念回归分析的基本概念 回归分析构成计量经济学的方法论基础,其主要内回归分析构成计量经济学的方法论基础,其主要内 容包括:容包括: (1)根据样本观察值对经济计量模型参数进行估计, 求得回归方程;回归方程; (2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。 简单回归模型:简单回归模型: y = b b0 + b b1x + u 等式只有一个非常数解释变量。等式只有一个非常数解释变量。 我们称之为我们称之为简单回归模型,一元线性回归模简单回归模型,一元线性回归模 型型. Some Terminology 术语注解术语注解

4、 Some Terminology 术语注解术语注解 简单回归模型:简单回归模型: y = b b0 + b b1x + u y通常被称为通常被称为 -因变量因变量(Dependent Variable) -左边变量左边变量(Left-Hand Side Variable) -被解释变量被解释变量(Explained Variable) -回归子回归子(Regressand) -响应变量(响应变量(response variable) -被预测变量(被预测变量(predicted variable) 术语注解术语注解 简单回归模型:简单回归模型: y = b b0 + b b1x + u x通

5、常被称为通常被称为 -自变量自变量(independent Variable) -右边变量右边变量(right-Hand Side Variable) -解释变量解释变量(explanatory Variable) -回归元回归元(regressor) -控制变量(控制变量(control variable) -预测变量(预测变量(predictor variable) 术语注解术语注解 在简单回归模型:在简单回归模型: y = b b0 + b b1x + u b b0 , b b1被称为被称为回归系数回归系数(regression coefficients )。)。 b b0也被称为也被称

6、为常数项或截矩项常数项或截矩项(intercept term),或,或 截矩参数截矩参数(intercept parameter )。 b b1代表了解释变量代表了解释变量x的边际效果,也被成为斜率参的边际效果,也被成为斜率参 数(数(slope parameter )。)。 术语注解术语注解 在简单回归模型:在简单回归模型: y = b b0 + b b1x + u u 为误差项为误差项(error term)或扰动或扰动(disturbance) 它代表了除了它代表了除了x之外可以影响之外可以影响y的因素。的因素。 随机误差项主要包括下列因素的影响:随机误差项主要包括下列因素的影响: 1)

7、在解释变量中被忽略的因素的影响; 2)变量观测值的观测误差的影响; 3)模型关系的设定误差的影响; 4)其它随机因素的影响。 产生并设计随机误差项的主要原因:产生并设计随机误差项的主要原因: 1)理论的含糊性; 2)数据的欠缺; 3)节省原则。 术语注解术语注解 线性回归的含义(线性回归的含义(P45):): y 和和x 之间并不一定之间并不一定 存在线性关系,但是,只要通过转换可以使存在线性关系,但是,只要通过转换可以使y的的 转换形式和转换形式和x的转换形式存在的转换形式存在相对于参数的线性相对于参数的线性 关系关系,该模型即称为线性模型。,该模型即称为线性模型。 For example,

8、 y=eb0+b1x+u . 转化为:log(y)=b0+b1x+u For example, 01 yxubb For example, 01 1 yu xbb 简单回归模型例子(例简单回归模型例子(例2.2) A simple wage equation wage= b b0 + b b1educ+ u 上述简单工资函数描述了受教育年限和工资之间上述简单工资函数描述了受教育年限和工资之间 的关系,的关系,educ用受教育的年限来度量用受教育的年限来度量 u : 包含了其他非观测因素,如劳动经验、天生素包含了其他非观测因素,如劳动经验、天生素 质、任现职时间等。质、任现职时间等。 b b1

9、:衡量了在其他条件不变的情况下,多接受一年衡量了在其他条件不变的情况下,多接受一年 教育,工资可以增加多少教育,工资可以增加多少. A Simple Assumption 关于关于u的假定的假定 我们假定总体中误差项我们假定总体中误差项u的平均值为零的平均值为零.: E(u) = 0(2.5) 思考:该假定是否具有很大的限制性思考:该假定是否具有很大的限制性 (restrictive)呢)呢? A Simple Assumption 关于关于u的假定的假定 If for example, E(u)=5. Then y = (b b0 +5)+ b b1x + (u-5), therefore,

10、 E(u)=E(u-5)=0. 上述推导说明我们总可以通过调整上述推导说明我们总可以通过调整常数项常数项来实现来实现 误差项的均值为零误差项的均值为零, 因此该假定的限制性不大因此该假定的限制性不大. Zero Conditional Mean Assumption 条件期望零值假定(条件期望零值假定() y = b b0 + b b1x + u 我们需要对我们需要对u和和 x之间的关系做一个关键假之间的关系做一个关键假 定。理想状况是对定。理想状况是对x的了解并不增加对的了解并不增加对u的的 任何信息。换句话说,我们需要任何信息。换句话说,我们需要u和和 x相互相互 独立。独立。 E(u|x

11、) = E(u)=0 条件期望条件期望 令(X,Y)代表一个工人总体,X是受教育程度, Y为小时工资。则: E(Y|x=12):是总体中所有受了12年教育的工 人的平均小时工资。 E(Y|x=16):是总体中所有受了16年教育的工 人的平均小时工资。 那么E(Y|X)可能=f(X) Zero Conditional Mean Assumption 条件期望零值假定条件期望零值假定 由于我们已经假定了由于我们已经假定了E(u) = 0,因此有,因此有: E(u|x) = E(u) = 0. (2.6) 思考:该假定是何含义?思考:该假定是何含义? 思考:为什么有这种条件期望的假定,而思考:为什么

12、有这种条件期望的假定,而 不直接给出不直接给出cov(x,u)=0的形式?的形式? 思考:为什么有这种条件期望的假定,而思考:为什么有这种条件期望的假定,而 不直接给出不直接给出cov(x,u)=0的形式?的形式? cov(x,u)=0表示不相关,但在统计学中其表示不相关,但在统计学中其 含义是无线性相关,不能保证无非线性相含义是无线性相关,不能保证无非线性相 关。关。 Zero Conditional Mean Assumption 条件期望零值假定条件期望零值假定 简单回归模型:简单回归模型: y = b b0 + b b1x + u E(u|x) = E(u) = 0. (2.6) (2

13、.6)说明总体回归函数应满足说明总体回归函数应满足 E(y|x) = b b0 + b b1x. E(y|x)是是x的线性函数,的线性函数,y的分布以它为中心。的分布以它为中心。 . . x1=5x2 =10 E(y|x) = b0 + b1x y f(y) 给定x时y的 条件分布 下标的使用惯例: 横截面数据 i 时间序列数据 t 例例2:一个假想的社区有100户家庭组成,要研究 该社区每月家庭消费支出家庭消费支出Y与每月家庭可支配收入家庭可支配收入X 的关系。 Population Regression Function,PRF 总体回归函数总体回归函数 为达到此目的,将该100户家庭划分

14、为组内收入差 不多的10组,以分析每一收入组的家庭消费支出。 表表 2.1.1 某某社社区区家家庭庭每每月月收收入入与与消消费费支支出出统统计计表表 每月家庭可支配收入X(元) 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 561 638 869 1023 1254 1408 1650 1969 2090 2299 594 748 913 1100 1309 1452 1738 1991 2134 2321 627 814 924 1144 1364 1551 1749 2046 2178 2530 638 847 979 1155 1397

15、 1595 1804 2068 2266 2629 935 1012 1210 1408 1650 1848 2101 2354 2860 968 1045 1243 1474 1672 1881 2189 2486 2871 1078 1254 1496 1683 1925 2233 2552 1122 1298 1496 1716 1969 2244 2585 1155 1331 1562 1749 2013 2299 2640 1188 1364 1573 1771 2035 2310 1210 1408 1606 1804 2101 1430 1650 1870 2112 1485 1

16、716 1947 2200 每 月 家 庭 消 费 支 出 Y (元) 2002 共计 2420 4950 11495 16445 19305 23870 25025 21450 21285 15510 (1)由于不确定因素的影响,对同一收入水平 X,不同家庭的消费支出不完全相同; (2)但由于调查的完备性,给定收入水平X的 消费支出Y的分布是确定的,即以X的给定值为条件 的Y的条件分布条件分布(Conditional distribution)是已 知的, 如: P(Y=561|X=800)=1/4。 因此,给定收入X的值Xi,可得消费支出Y的条件条件 期望期望(conditional ex

17、pectation): E(Y|X=Xi) 该例中:E(Y | X=800)=605 分析:分析: (,) (|) () ji ji i P YyXx P YyXx P Xx 描出散点图发现:随着收入的增加,消费 “平均地说平均地说”也在增加,且Y的条件均值均落在 一根正斜率的直线上。这条直线称为总体回归线总体回归线。 0 500 1000 1500 2000 2500 3000 3500 5001000150020002500300035004000 每月可支配收入X(元) 每 月 消 费 支 出 Y (元) 概念概念: 在给定解释变量Xi条件下被解释变量Yi的期望 轨迹称为总体回归线总体回

18、归线(population regression line), 或更一般地称为总体回归曲线总体回归曲线(population regression curve)。 称为(双变量)总体回归函数总体回归函数(population regression function, PRF)。 相应的函数: 01 ( | )E y xxbb 例2中,个别家庭的消费支出为: (*)式称为总体回归函数总体回归函数(方程)(方程)PRFPRF的随机设定形式。的随机设定形式。 表明被解释变量除了受解释变量的系统性影响外,还受其他表明被解释变量除了受解释变量的系统性影响外,还受其他 因素的随机性影响因素的随机性影响。又

19、称为。又称为总体回归模型总体回归模型。 (1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为 系统性(系统性(systematic)或确定性确定性(deterministic) )部分部分。 (2)其他随机随机或非确定性非确定性(nonsystematic)部分部分ui。 即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和: (*) 01 (|) iiiii YE Y XuXubb Sample Regression Function,SRF 样本回归函数样本回归函数 问题:问题:能从一次抽样中获得总体的近似的信息吗? 如果可以,如何从抽样中获得总体的近似信息? 问:能否从该样本

20、估计总体回归函数PRF? 回答:能 例例2.2:在例2.1的总体中有如下一个样本, 表表 2.1.3 家家庭庭消消费费支支出出与与可可支支配配收收入入的的一一个个随随机机样样本本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530 总体的信息往往无法掌握,现实的情况只能是在 一次观测中得到总体的一个样本。 核样本的散点图散点图(scatter diagram): 样本散点图近似于一条直线,画一条直线以尽好地拟合该 散点图,由于样本取自总体,可以该

21、线近似地代表总体回归线。 该线称为样本回归线样本回归线(sample regression lines)。)。 记样本回归线的函数形式为: iii XXfY 10 )( bb 称为样本回归函数样本回归函数(sample regression function,SRF)。 这里将样本回归线样本回归线看成总体回归线总体回归线的近似替代 注意:注意: 01 ( |) iiiii YEY XuXubb 样本回归函数的随机形式样本回归函数的随机形式/样本回归模型样本回归模型: 同样地,样本回归函数也有如下的随机形式: 由于方程中引入了随机项,称为由于方程中引入了随机项,称为样本回归样本回归 模型模型(s

22、ample regression model)。 01 y iiiii i yyuxu u bb i 式中, 称为(样本)(residual), 代表了其他影响 的随机因素的集合,可以看成是u的 残差 估计量。 回归分析的主要目的回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数 PRF。 注意:注意:这里PRF可能永 远无法知道。 即,根据 估计 01 (|)YE Y XuXubb 01 iiiii yyuxubb 四个概念 总体回归模型 总体回归函数 样本回归模型 样本回归函数 四个概念 总体回归模型 总体回归函数 样本回归模型 样本回归函数 01 iiiii yyuxubb 0

23、1 YXubb 01 ( | )E y xxbb 估计 Deriving the Ordinary Least Squares Estimates 普通最小二乘法的推导普通最小二乘法的推导 回归的基本思想是从样本去估计总体参数。回归的基本思想是从样本去估计总体参数。 我们用我们用(xi,yi): i=1, ,n 来表示一个随机样本,并来表示一个随机样本,并 假定每一观测值满足假定每一观测值满足 yi = b b0 + b b1xi + ui。 。 。 估计方法估计方法有多种,其种最广泛使用的是普通普通 最小二乘法最小二乘法(ordinary least squares, OLS)。 . . .

24、 . y4 y1 y2 y3 x1x2x3x4 u1 u2 u3 u4 x y Population regression line, sample data points and the associated error terms 总体回归线,样本观察点和相应误差 E(y|x) = b b0 + b b1x Deriving OLS Estimates 普通最小二乘法的推导普通最小二乘法的推导 假定:假定: E(u|x) = E(u) = 0 可以得到:可以得到: Cov(x,u) = E(xu) = 0 since u = y b b0 b b1x,所以有:所以有: E(y b b0 b

25、 b1x) = 0 Ex(y b b0 b b1x) = 0 These are called moment (矩)(矩)restrictions Deriving OLS using M.O.M. 使用矩方法使用矩方法推导普通最小二乘法推导普通最小二乘法 矩方法是将总体的矩限制应用于样本中。目标是矩方法是将总体的矩限制应用于样本中。目标是 通过选择参数值,使得在样本中矩条件也可以成通过选择参数值,使得在样本中矩条件也可以成 立。立。 The sample versions are as follows: 0 0 1 10 1 1 10 1 n i iii n i ii xyxn xyn bb

26、 bb Derivation of OLS 普通最小二乘法的推导普通最小二乘法的推导 根据样本均值的定义以及加总的性质,可将第一根据样本均值的定义以及加总的性质,可将第一 个条件写为个条件写为 xy xy 10 10 or , bb bb Derivation of OLS 普通最小二乘法的推导普通最小二乘法的推导 n i ii n i i n i ii n i ii n i iii xxyyxx xxxyyx xxyyx 1 2 1 1 1 1 1 1 11 0 b b bb 第二个条件:第二个条件: So the OLS estimated slope is 因此因此OLS估计出的斜率为估

27、计出的斜率为 1 1 2 2 1 1 provided th0 at n ii i n n i i i i xxyy x xx x b 思考:条件说明什么?思考:条件说明什么? 斜率估计量等 于样本中x 和 y 的协方差除以x 的方差。若x 和 y 正相关则斜率 为正,反之为 负。 Alternate approach to derivation 推导方法二推导方法二 n i ii n i i xyu 1 2 10 1 2 bb 给定一组样本观测值(Xi, Yi)(i=1,2,n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法普通最小二乘法(Ordinary least square

28、s, OLS) 给出的判断标准是:二者之差的平方和最小 n iii n i XYYYQ 1 2 10 2 1 ) () (bb 方程组(*)称为正规方程组正规方程组(normal equations) 为什么不是残差的其他某个函数的最小化? Using Eviews for OLS regressions 使用 Eviews 进行OLS回归 我们已经推导出公式计算参数的OLS估计值,所 幸的是我们不必亲手去计算它们。 在Eviews中进行回归非常简单, 例2.4 工资和受教育程度 526个样本的OLS估计 结果: 0.930.54wageeduc 例2.5 投票结果和竞选支出 1988年美国众

29、议院173次两党竞选的选举结果: voteA为候选人A所得票数的百分比; shareA为候选人A在竞选支出中所占百分比 26.810.464voteAshareA Example2.3: CEO Salary and Return on Equity 例:首席执行官的薪水和例:首席执行官的薪水和资本权益报酬率资本权益报酬率 Example: CEO Salary and Return on Equity 例:CEO的薪水和资本权益报酬率 变量salary衡量了以1000美元为单位的年薪,其最小值, 均值和最大值分别如下: (min, mean, max)=(223, 1281, 14822).

30、 Roe净收入/所有者权益,为三年平均值。其最小值,均 值和最大值分别为: (0.5, 17.18,56.3) salary 对roe的回归方程为: 963.191 18.501salaryroe Example: CEO Salary and Return on Equity 例:CEO的薪水和资本权益报酬率 对估计量的解释: 963.19: 常数项的估计值衡量了当roe为零时 CEO的薪水。 18.5: b1 的估计值反应了ROE若增加一个百 分点工资将平均增加18500美元。 If roe=30, what is the estimated salary? 思考思考:两条线分别代表什么意

31、思?两条线分别代表什么意思? 拟合值和残差 Salaryhat是拟合值,uhat是残差 第二章第二章 简单回归模型(简单回归模型(2) Chapter Outline 本章大纲本章大纲 Definition of the Simple Regression Model 简单回归模型的定义简单回归模型的定义 Deriving the Ordinary Least Squares Estimates 推导普通最小二乘法的估计量推导普通最小二乘法的估计量 Mechanics of OLS OLS的操作技巧的操作技巧 Unites of Measurement and Functional Form

32、测量单位和回归方程形式测量单位和回归方程形式 Expected Values and Variances of the OLS estimators OLS估计量的期望值和方差估计量的期望值和方差 Algebraic Properties of OLS OLS的代数性质 (1)OLS 残差和为零残差和为零 (一阶条件(一阶条件) 因此因此 OLS 的样本残差平均值也为零的样本残差平均值也为零. Algebraic Properties of OLS OLS的代数性质 (2)回归元(解释变量)和)回归元(解释变量)和OLS残差之间的样本协残差之间的样本协 方差为零方差为零 (一阶条件一阶条件)

33、(3)OLS回归线总是通过样本的均值。回归线总是通过样本的均值。 Algebraic Properties of OLS OLS的代数性质 我们可把每一次观测看作由被解释部分和 未解释部分构成. (4)预测值和残差在样本中是不相关的(自 己推导) iii uyy 0),cov( ii uy Algebraic Properties of OLS OLS的代数性质 0 )( )( ) ( )()( )( )()(),cov( 10 10 iii ii iii iii iiiiii uxEuE uxE uEyuyE uyEyE uEuyEyEuy bb bb 常用的推导条件 i 01 10 2x0

34、 30 4 5 i i ii iii u u yu yyu yxbb 拟合优度拟合优度 (Goodness of fit ) More Terminology 更多术语 定义总平方和(定义总平方和(total sum of squares,SST) 为为 2 1 () n i i SSTyy 总平方和是对总平方和是对y在样本中所有变动的度量,即它度在样本中所有变动的度量,即它度 量了量了y在样本中的分散程度。将总平方和除以在样本中的分散程度。将总平方和除以n-1, 我们得到我们得到y的样本方差。的样本方差。 More Terminology 更多术语 解释平方和解释平方和( Explained

35、 Sum of Squares, SSE)定义为定义为 它度量了它度量了y的预测值的在样本中的变动的预测值的在样本中的变动 2 1 () n i i SSEyy More Terminology 更多术语 残差平方和(残差平方和(Residual Sum of Squares,SSR) 定义为定义为 残差平方和度量了残差的样本变异残差平方和度量了残差的样本变异 注意:注意:SSR、SSE没有统一的定义。没有统一的定义。 SST, SSR and SSE y 的总变动可以表示为已解释的变动SSE和 未解释的变动SSR之和,即 SST=SSE+SSR 证明 SST = SSE + SSR 22 2

36、 2 2 0101 2 SSR 2 SSE ()0 iiii ii iiii ii iiiiiii iiiii yyyyyy uyy uuyyyy uyy uyyu yyuu y uxuu xbbbb Goodness-of-Fit 拟合优度 我们如何衡量样本回归线是否很好地拟合了样本 数据呢? 2 1 S S ES S R R S S TS S T 称 R2 为(样本)(样本)判定系数判定系数(coefficient of determination)。被看作是y的样本变动中被可以 被x解释的部分 判定系数判定系数的取值范围取值范围:0,1 R2 2越接近越接近1 1,说明实际观测点离样本线

37、越近,拟,说明实际观测点离样本线越近,拟 合优度越高合优度越高。 Goodness-of-Fit 拟合优度拟合优度 注意:注意: 在社会科学中,特别是在截面数据分析中在社会科学中,特别是在截面数据分析中, 回归方程得到低回归方程得到低的的R2并不罕见。并不罕见。 值得强调的是表面上低的值得强调的是表面上低的R2不一定说明不一定说明 OLS回归方程是没有价值的回归方程是没有价值的 Goodness-of-Fit 拟合优度 Example 2.8 CEO薪水和股本回报 Example 2.9 Voting outcomes and Campaign Expenditures 竞选结果和选举活动开支

38、 2 0.0132R 说明,股本回报率仅解释了薪水变异的约1.3。 意味着薪水变异中还有98.7悬而未决。 2 0.856R 963.191 18.501salaryroe 2.4 度量单位和函数形式 Units of Measurement 度量单位 例例2.3:首席执行官的薪水和资本权益报酬率:首席执行官的薪水和资本权益报酬率 其中,其中, salary衡量了以衡量了以1000美元为单位的年薪;美元为单位的年薪; 假定薪水的单位是美元,而不是千美元,在假定薪水的单位是美元,而不是千美元,在 Salarys对对roe进行回归时进行回归时OLS截距和斜率的估计截距和斜率的估计 值是多少?值是多

39、少? 963.191 18.501salaryroe Units of Measurement 度量单位 新的回归方程:新的回归方程: 一般而言,当因变量乘上常数一般而言,当因变量乘上常数c,而自变量不改,而自变量不改 变时,变时,OLS的截距和斜率估计量也要乘上的截距和斜率估计量也要乘上c。 963191 18501salaryroe Units of Measurement 测量单位 如果定义如果定义 roedec = roe/100,那么新的回归线变,那么新的回归线变 为:为: 一般而言,如果自变量一般而言,如果自变量除以或乘上除以或乘上某个非零常数某个非零常数c, 那么那么 OLS斜率

40、将斜率将乘以或除以乘以或除以c,而截距则不改变。,而截距则不改变。 R2呢?呢? 963.191 1850.1salaryroedec Units of Measurement 测量单位 结论:结论: 改变因变量的度量单位,会以同等倍数改改变因变量的度量单位,会以同等倍数改 变斜率和截距;变斜率和截距; 改变自变量的度量单位,截距不变,斜率改变自变量的度量单位,截距不变,斜率 会以相反的方式改变;会以相反的方式改变; R2不依赖于度量单位。不依赖于度量单位。 在简单回归中加入非线性 线性关系并不适合所有的经济学运用线性关系并不适合所有的经济学运用 然而,通过对因变量和自变量进行恰当的 定义,

41、我们可以在简单回归分析中非常容易 地处理许多y和x之间的非线性关系. The Natural Logarithm 自然对数 log( )yx 1212 1212 log()log()log() log(/)log()log() log()log( ) c x xxx xxxx xcx log(1)xx0forx 101000 log()log()()/xxxxxx x 0 100*log%100(x) x xx x 的百分比变化 Log-log 形式,弹性 01 1 1 1 1 loglog loglog 100log100log % xy /log /log yxu yx yx yx y x

42、y yy x yx xx bb b b b b 的百分比变化引起的 的百分比的改变 经济:弹性 Log-level形式,半弹性 01 1 1 1 1 log log 100log100 %(100) xy % 100 yxu yx yx yx y x bb b b b b 的改变一个单位引起的 的百分比的改变 经济:半弹性 Level-log 形式 01 1 11 1 log log 100100log% % 100 xy yxu yx yxx yx bb b bb b () () 的百分比变化引起的 的单位改变 变量的原始形式和其自然对数的不同组合变量的原始形式和其自然对数的不同组合 Mod

43、el Dependent variable Independent variable Interpretation of 1 b Level-level y x 1 yxb Level-log y log( ) x 1 (/100)%yxb Log-level log( ) y x 1 %(100)yxb Log-log log( ) y log( ) x 1 %yxb 在工资-教育的例子中, wage= b b0 + b b1educ+ u 估计得到:估计得到: 即每增加一年的教育,工资的增长都是相同的,即 0.54美元。合理性? 假定每增加一年的教育,工资增长的百分比都是相 同的。能够给出

44、不变的百分比效果的模型是 If , we have 01 log()wageeducubb 1 %(100).wageeducb 0u 0.90.54wageedu Example 2.10 A log Wage Equation 将对数工资方程 Compared to 和原方程相比和原方程相比 log()0.5840.083wageeduc 526n 2 0.186R 0.900.54wageeduc 2 0.165R 每多接受一年的教育,工资会有每多接受一年的教育,工资会有8.3的提高。的提高。 递增的教育回报:当受教育程度提高时,工资的变化递增的教育回报:当受教育程度提高时,工资的变化

45、量也随之增加。量也随之增加。 自然对数的另一个重要用途是用于获得弹性为常自然对数的另一个重要用途是用于获得弹性为常 数的模型数的模型 在在CEO的薪水和企业销售额的例子中,常数弹性的薪水和企业销售额的例子中,常数弹性 模型是:模型是: 01 log()log()salarysalesubb 209,n log()4.8220.257log()salarysales 2 0.211R 1是是y对对x的弹性。这里薪水对销售额的弹性估计的弹性。这里薪水对销售额的弹性估计 量为量为0.257 2.5 OLS估计量的期望值和方差估计量的期望值和方差 补充:补充: 抽样与抽样分布抽样与抽样分布 参数估计参

46、数估计假设检验假设检验 统计方法统计方法 描述统计描述统计推断统计推断统计 什么是推断统计?什么是推断统计? The purpose of Statistics inference(统计推断统计推断) is to obtain information about a population from information contained in sample. 例例1 一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。 120个个 样本样本 测试 平均里程: 36,500公里 推断 新轮胎新轮胎 平均寿命平均寿命: 36,500公里 400个 样本 支持人数: 160 推断 支持该候选人的选

47、民支持该候选人的选民 占全部选民的比例:占全部选民的比例: 160/400=40% 例例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众 占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财力的限制: 主要用在下列两种情况主要用在下列两种情况: 主要内容:主要内容: 1、抽样估计(estimation) 2、假设检验(hypothesis testing) 注意:注意: 抽样估计只得到对总体特征的近似测度,因此, 抽样估计还必须同时考察所得结果的“可能范围可能范围” 与“可靠程度可靠程度”。 1、对所考

48、查的总体不可能进行全部测度; 2、从理论上理论上说可以对所考查的总体进行全部测 度,但实践上实践上由于人力、财力、时间等方面的原因, 无法(不划算)进行全部测度。 第一节第一节 抽样抽样 随机样本随机样本 第二节第二节 点估计与抽样分布点估计与抽样分布 例例 某大公司人事部经理整理其2500个中层干部的档案。其 中一项内容是考察这些中层干部的平均年薪平均年薪及参加过公参加过公 司培训计划的比例司培训计划的比例。 总体:总体:2500名中层干部(population ), 如果:如果:上述上述情况可由每个人的个人档案中得知,可容易 地测出这2500名中层干部的平均年薪及标准差。 假如有假如有15

49、00人参加了公司培训人参加了公司培训,得到了如下的结果: 总体均值总体均值(population mean):): =51800 总体标准差总体标准差(Population standard deviation):): =400 参加公司培训计划的参加公司培训计划的比例比例为:为:P =1500/2500=0.60 参数是总体的数值特征参数是总体的数值特征 A parameter is a numerical characteristic of a population 一、点估计 假如随机抽取了一个容量为30的样本: Annual Salary Management Training Pro

50、gram? 49094.3 Yes 53263.9 Yes 49643.5 Yes 根据该样本求得的年薪样本年薪样本平均数平均数、标准差标准差及参加过培参加过培 训计划人数的训计划人数的比例比例分别为: 00.5181430/1554420/nxx i 72.334729/325009260) 1/()( 2 nxxs i 63. 030/19p (一)点估计(一)点估计 上述估计总体参数的过程被称为点估计点估计(point estimation); 由于点估计量是由样本测算的,因此也称为样本样本 统计量。统计量。 估计量和估计值估计量和估计值 样本的(不包含未知总体参数的)函数称 为统计量;

51、 由于一个统计量对于不同的样本取值不同, 所以,估计量也是随机变量,并有其分布。 如果样本已经得到,把数据带入之后,估 计量就有了一个数值,称为该估计量的一 个实现实现(realization),也称为一个估计值估计值 (estimate)。 二、抽样分布 在上述某公司30个中层干部的简单随机抽样中,如果再 一次抽样的样本与前一次的不同,则可得到另外的平均年 薪样本均值、标准差以及受训干部的比例。 同样地,如果多次抽样,则可得到多个不同的结果。 下表是一个假设的经过500次抽样后的情况表。 500个 的频数分布频数分布与相对频数分布相对频数分布,x 图图 500个个 的相对频数分布的相对频数分

52、布 0.3 相 对 0.2 频 数 0.1 x 这里,这里, 的相对频数分布,就称为的相对频数分布,就称为 的的抽样分布抽样分布。xx 1. 样本统计量的概率分布,是一种理论分布 在重复选取容量为n的样本时,由该统计量 的所有可能取值形成的相对频数分布 2. 随机变量是 样本统计量样本统计量 样本均值, 样本比例,样本方差等 3. 结果来自容量相同容量相同的所有所有可能样本 抽样分布 (sampling distribution) 抽样分布的形成过程 (sampling distribution) 总体 样 本 1、样本均值的抽样分布 x 1、样本均值的抽样分布(、样本均值的抽样分布(Samp

53、ling Distribution of ) 样本均值的抽样分布 样本均值的抽样分布 3,33,23,13 2,42,32,22,12 4,44,34,24,14 1,4 4 1,3 321 1,21,11 第二个观察值第二个观察值第一个第一个 观察值观察值 所有可能的所有可能的n = 2 的样本(共的样本(共16个)个) 3,4 样本均值的抽样分布 3.53.02.52.03 3.02.52.01.52 4.03.53.02.54 2.5 4 2.0 321 1.51.01 第二个观察值第二个观察值第一个第一个 观察值观察值 16个样本的均值(个样本的均值(x) 样本均值的分布与总体分布的比

54、较 考察样本均值的概率分布形式样本均值的概率分布形式。分两种况: 1)总体分布已知且为正态分布总体分布已知且为正态分布; 2)总体分布未知;总体分布未知; (1)当总体分布已知且为正态分布或接近正态 分布时,则无论样本容量大小如何,样本均值则无论样本容量大小如何,样本均值 都为正态分布都为正态分布。 样本均值的抽样分布 x (2)当总体分布未知时,需要用到 Central limit Theorem) 对容量为对容量为n 的简单随机样本,样本均值的分布的简单随机样本,样本均值的分布 随样本容量的增大而趋于随样本容量的增大而趋于正态分布正态分布。 经验上验证经验上验证,当样本容量等于或大于30时

55、,无 论总体的分布如何,样本均值的分布则非常接近正 态分布。 因此统计上常称容量在30(含30)以上的样本 为大样本大样本(large-sample-size)。 中心极限定理 (central limit theorem) 中心极限定理 (central limit theorem) 三、点估计量的性质:估计量优 劣的衡量 用样本统计量样本统计量(sample statistics)可以作为其 对应的总体的点估计量点估计量(point estimator)。 但要估计总体的某一指标,并非只能用一个样本 指标,而可能有多个指标可供选择,即对同一总体 参数,可能会有不同的估计量。 点估计量的性质

56、:估计量优劣的衡量点估计量的性质:估计量优劣的衡量 作为一个好的点估计量好的点估计量,统计量必须具有如下性质: 无偏性、有效性、一致性无偏性、有效性、一致性 无偏性 (unbiasedness) 无偏性:无偏性:估计量抽样分布的数学期望等于 被估计的总体参数 有效性 (efficiency) 一致性 (consistency) 一致性:一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数 为什么要研究最小二乘估计量的性质?为什么要研究最小二乘估计量的性质? 当模型参数估计出后,需考虑参数估计值的 精度,即是否能代表总体参数的真值,或者说需 考察参数估计量的统计性质。 一个用于考察

57、总体的估计量,可从如下几个方 面考察其优劣性: (1)线性性)线性性,即它是否是另一随机变量的线性 函数; (2)无偏性)无偏性,即它的均值或期望值是否等于总 体的真实值; (3)有效性)有效性,即它是否在所有线性无偏估计量 中具有最小方差。 (4)渐近无偏性)渐近无偏性,即样本容量趋于无穷大时,是 否它的均值序列趋于总体真值; (5)一致性)一致性,即样本容量趋于无穷大时,它是否 依概率收敛于总体的真值; (6)渐近有效性)渐近有效性,即样本容量趋于无穷大时,是 否它在所有的一致估计量中具有最小的渐近方差。 这三个准则也称作估计量的小样本性质。小样本性质。 拥有这类性质的估计量称为最佳线性无

58、偏估计最佳线性无偏估计 量量(best liner unbiased estimator, BLUE)。 当不满足小样本性质时,需进一步考察估计量的 大样本大样本或或渐近性质渐近性质: Expected Values and Variances of the OLS Estimators OLS估计量的期望值和方差 从总体中抽取的不同的随机样本可得到不同的从总体中抽取的不同的随机样本可得到不同的 OLS估计量,我们将研究这些估计量,我们将研究这些OLS估计量的分布。估计量的分布。 首先,我们在一些假定下证明首先,我们在一些假定下证明OLS的无偏性。的无偏性。 Assumption SLR.1

59、(Linear in Parameters): 假定SLR.1 (关于参数是线性的) 在总体模型中,因变量在总体模型中,因变量 y 和自变量和自变量 x 和误和误 差差 u 的关系可写作的关系可写作 y = b b0 + b b1x + u , 其中其中 b b0 和和 b b1 分别是总体的截距参数和斜分别是总体的截距参数和斜 率参数率参数 Assumption SLR.2 (Random Sampling): 假定SLR.2 (随机抽样): 假定我们从总体模型随机抽取容量为假定我们从总体模型随机抽取容量为n 的样本的样本, (xi, yi): i=1, 2, , n, 那么可那么可 以写出

60、样本模型为以写出样本模型为 yi = b b0 + b b1xi + ui Assumptions SLR.3 and SLR.4 假定 SLR.3 和 SLR.4 假定假定SLR.3 :解释变量的样本有变异:解释变量的样本有变异 在样本中,自变量在样本中,自变量 x 并不等于一个不变常数。并不等于一个不变常数。 假定假定SLR.4:零条件期望:零条件期望: 假定假定 E(u|x) = 0 . 那么在随机样本中我们有那么在随机样本中我们有 E(ui|xi) = 0 ( | )0E u x Theorem 2.1 (Unbiasedness of OLS) 定理2.1 ( OLS的无偏性) 使用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论