




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、计量经济学一元线性回归模型第1页,共163页,2022年,5月20日,16点38分,星期三第二章 一元线性回归模型 学习目的 理解回归模型的概念,学会对一元线性回归模型进行参数估计、检验和预测,为多元线性回归模型的学习打下基础。第2页,共163页,2022年,5月20日,16点38分,星期三 基本要求1) 理解样本回归模型、总体回归模型的概念; 2) 掌握一元线性回归模型的普通最小二乘参数估计方法,了解一元线性回归模型的基本假设、一元线性回归模型的最大似然参数估计方法、一元线性回归模型的普通最小二乘参数估计量与样本回归线的性质、一元线性回归模型随机误差项方差的估计; 3) 学会对一元线性回归模
2、型进行拟合优度检验,对一元线性回归模型的参数进行区间估计和假设检验; 4) 学会进行一元线性回归模型被解释变量的总体均值和个别值预测; 第二章 一元线性回归模型第3页,共163页,2022年,5月20日,16点38分,星期三 第二章 一元线性回归模型回归模型概述 一元线性回归模型的参数估计 一元线性回归模型的拟合优度检验 一元线性回归模型的统计推断 一元线性回归模型的预测 案例分析第4页,共163页,2022年,5月20日,16点38分,星期三 相关分析与回归分析第一节 回归模型概述 随机误差项 总体回归模型 样本回归模型第5页,共163页,2022年,5月20日,16点38分,星期三 1.
3、经济变量之间的关系 计量经济研究是对经济变量之间关系的研究,针对某一具体经济问题展开研究时,首先需要考察的就是相关经济变量之间有没有关系、有什么样的关系。 确定的函数关系 不确定的相关关系 经济变量之间的关系 一、相关分析与回归分析第6页,共163页,2022年,5月20日,16点38分,星期三函数关系 指某一经济变量可直接表示为其他经济变量的确定的函数,函数表达式中没有未知参数,不存在参数估计的问题。 1) 某一商品的销售收入Y与单价P、销售数量Q之间的关系Y = PQ 2) 某一农作物的产量Q与单位面积产量q 、种植面积S之间的关系Q = q S例如: 一、相关分析与回归分析第7页,共16
4、3页,2022年,5月20日,16点38分,星期三相关关系 指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。 居民消费C与可支配收入Y之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,0 C Y ,遵循边际消费倾向递减的规律。居民消费C与可支配收入Y之间的关系可表示为C = + Y, 、为待估参数。例如: 相关关系的表达式一般表示为含有未知参数的函数形式,需要进行参数估计。 一、相关分析与回归分析第8页,共163页,2022年,5月20日,16点38分,星期
5、三相关关系的分类 a)按照涉及的变量的数量 单相关(一元相关)复相关(多元相关)- 指两个经济变量之间存在的相关关系 - 指多个经济变量之间存在的相关关系,可能是几个经济变量的某种综合效果与一个经济变量有趋势方面的联系。 一、相关分析与回归分析第9页,共163页,2022年,5月20日,16点38分,星期三相关关系的分类 b)按照相关的程度 完全相关不完全相关不相关介于完全相关与不相关之间的情况。 极强的相关关系 ,指某一或某几个经济变量的取值确定后,对应的另一经济变量的取值能唯一确定,实际上是确定的函数关系,所以函数关系可看作是相关关系的特例。 极弱的相关关系,指某一或某几个经济变量的取值确
6、定后,对应的另一经济变量不仅取值不能唯一确定,而且取值范围也不能确定。 一、相关分析与回归分析第10页,共163页,2022年,5月20日,16点38分,星期三相关关系的分类 c)按照相关的性质正相关负相关指不同经济变量的变化趋势一致,即一个经济变量的取值由小变大时,另一经济变量的取值也由小变大; 指不同经济变量的变化趋势相反,即一个经济变量的取值由小变大时,另一经济变量的取值由大变小。 一、相关分析与回归分析第11页,共163页,2022年,5月20日,16点38分,星期三相关关系的分类 c)按照相关的性质线性相关非线性相关指相关变量之间的关系可由线性函数近似表示,即由相关变量的取值绘制的散
7、点图趋向于直线形式; 指相关变量之间的关系可由某种非线性函数近似表示,即由相关变量的取值绘制的散点图趋向于某种曲线形式。一、相关分析与回归分析第12页,共163页,2022年,5月20日,16点38分,星期三函数关系与相关关系的区别 确定的函数关系可以直接用于经济活动,无需分析。 不确定的相关关系,隐含着某种经济规律,是有关研究的重点 一、相关分析与回归分析第13页,共163页,2022年,5月20日,16点38分,星期三 2. 相关分析 研究变量之间的相关关系的形式和程度的一种统计分析方法,主要通过绘制变量之间关系的散点图和计算变量之间的相关系数进行。 绘制变量之间关系的散点图例如: 判断相
8、关关系是线性相关还是非线性相关、正相关还是负相关;计算变量之间的相关系数度量变量之间的线性相关的程度、判断线性相关关系是正相关还是负相关 一、相关分析与回归分析第14页,共163页,2022年,5月20日,16点38分,星期三相关系数 十九世纪末英国著名统计学家卡尔皮尔逊(Karl Pearson)度量两个变量之间的线性相关程度的简单相关系数(简称相关系数)两个变量X和Y的总体相关系数为其中,是变量X、Y的协方差,、分别是变量X、Y的方差。(2-1)一、相关分析与回归分析第15页,共163页,2022年,5月20日,16点38分,星期三(2-2) (2-3) 如果给定变量X、Y 的一组样本 ,
9、则总体相关系数的估计样本相关系数为n , 或相关系数的取值介于11之间, 取值为负表示两变量之间存在负相关关系; 取值为正表示两变量之间存在正相关关系; 取值为1表示两变量之间存在完全负相关关系; 取值为0表示两变量不相关; 取值为1表示两变量之间存在完全正相关关系。一、相关分析与回归分析第16页,共163页,2022年,5月20日,16点38分,星期三对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的:例如: 函数关系:统计依赖关系/统计相关关系:第17页,共163页,2022年,5月20日,1
10、6点38分,星期三 3. 回归分析 研究不仅存在相关关系而且存在因果关系的变量之间的依存关系的一种分析理论与方法,是计量经济学的方法论基础, 主要内容 1)设定理论模型,描述变量之间的因果关系;2)根据样本观察数据利用适当方法对模型参数进行估计, 得到回归方程; 3)对回归方程中的变量、方程进行显著性检验,推求参数 的置信区间、模型的预测置信区间;4)利用回归模型解决实际经济问题。一、相关分析与回归分析第18页,共163页,2022年,5月20日,16点38分,星期三 4. 相关分析与回归分析之间的关系联系: 1)都是对存在相关关系的变量的统计相关关系的研究;2)都能测度线性相关程度的大小;3
11、)都能判断线性相关关系是正相关还是负相关。 第19页,共163页,2022年,5月20日,16点38分,星期三 4. 相关分析与回归分析之间的关系区别: 1)相关分析仅仅是从统计数据上测度变量之间的相关程度, 不考虑两者之间是否存在因果关系,因而变量的地位在相 关分析中是对等的; 回归分析是对变量之间的因果关系的分析,变量的地位是 不对等的,有被解释变量和解释变量之分。 2)相关分析主要关注变量之间的相关程度和性质,不关注变 量之间的具体依赖关系。 回归分析在关注变量之间的相关程度和性质的同时,更关注变量 之间的具体依赖关系,因而可以深入分析变量间的依存关系,有 可能达到掌握其内在规律的目的,
12、具有更重要的实践意义。第20页,共163页,2022年,5月20日,16点38分,星期三习 题下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正的、负的、还是无法确定?并说明理由。 因变量自变量GNP利率个人储蓄利率小麦产出降雨量美国国防开支前苏联国防开支棒球明星本垒打的次数其年薪总统声誉任职时间学生计量经济学成绩其统计学成绩日本汽车的进口量美国人均国民收入第21页,共163页,2022年,5月20日,16点38分,星期三含有随机误差项是计量经济学模型与数理经济模型的一大区别。 例如: 对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一
13、般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。 数理经济模型用确定性的函数描述经济变量之间的理论关系,对这一经济活动,笼统地描述为或具体地用某一种生产函数描述为其中, Q表示产出,T表示技术,K表示资本,L表示劳动, A、是未知参数。 二、随机误差项第22页,共163页,2022年,5月20日,16点38分,星期三例如: 对于供给不足下的生产活动,可以认为产出是由资本、劳动、技术等投入要素决定的,并且,一般情况下,产出随着投入要素的增加而增加,但要素的边际产出递减。 计量经济学模型用随机方程揭示经济变量之间的因果关系,对于这一经济活动,与上述数理经济模型相对应,描述为或描述为对
14、数线性函数形式其中, 是随机误差项。二、随机误差项第23页,共163页,2022年,5月20日,16点38分,星期三随机误差项称为随机扰动项或随机干扰项(stochastic disturbance) 一般用希腊字母或表示存在原因 第一,人类的经济行为本身带有随机性; 第二,通常一个变量总是受众多因素的影响; 第三,任何函数反映经济变量之间的关系都只是一种简化反映; 第四,经济数据来源于调查统计,而非严格的控制实验; 二、随机误差项第24页,共163页,2022年,5月20日,16点38分,星期三结论 一个经济变量通常不能被另一个经济变量完全精确地决定,需要引入随机误差项来反映各种误差的综合影
15、响,主要包括: 1)变量的内在随机性的影响;2)解释变量中被忽略的因素的影响; 3)模型关系设定误差的影响; 4)变量观察值的观察误差的影响;5)其他随机因素的影响。 二、随机误差项第25页,共163页,2022年,5月20日,16点38分,星期三有何特性?众多因素对被解释变量Y的影响代表的综合体对Y的影响方向有正有负由于是次要因素代表,对Y的总平均影响可能是0对Y的影响是非趋势性的,而是随机扰动。二、随机误差项第26页,共163页,2022年,5月20日,16点38分,星期三习 题例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为
16、(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。第27页,共163页,2022年,5月20日,16点38分,星期三习题答案(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情
17、形,基本假设4不满足。第28页,共163页,2022年,5月20日,16点38分,星期三1总体回归曲线与总体回归函数 给定解释变量条件下被解释变量的期望轨迹称为总体回归曲线(population regression curve),或总体回归线(population regression line)。 描述总体回归曲线的函数称为总体回归函数(population regression function)。三、总体回归模型第29页,共163页,2022年,5月20日,16点38分,星期三对于只有一个解释变量X的情形,总体回归函数为(2-4)与之对应,是X的函数。,都有被解释变量Y的条件期望表示对
18、于解释变量X的每一个取值 对于含有多个解释变量 、 、 、 的情形,总体回归函数为(2-5)表示对于解释变量的每一组取值,都有被解释变量Y的条件期望与之对应,是的函数。 、 、 、 、 、 、三、总体回归模型第30页,共163页,2022年,5月20日,16点38分,星期三例2-1 假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、3800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关
19、系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消费支出平均水平。第31页,共163页,2022年,5月20日,16点38分,星期三可支配收入X1300180023002800330038004300480053005800消费支出Y10331126120711201208125613271439158411281167123112881371143914521533159716761793145515011635172817891835188619432033217822942351241017881835187219031965206121572206228923142390242
20、62458247825431966204821222213231523572369239824522501253425682610265927232197228623152386246725812623267727102985300430823119310224362588267227362801289329023027315532602765285329003021306531463278330534233022315634013669表2-1 100个家庭的月可支配收入与消费数据 单位:元 第32页,共163页,2022年,5月20日,16点38分,星期三 家庭消费支出主要取决于家庭可支配
21、收入,但不是唯一取决于家庭可支配收入,还会受到其他各种不确定性因素的影响,因而可支配收入相同的不同家庭的消费支出各不相同。 由于是对总体的考察,由表2-1可求得家庭可支配收入X为某一特定数值时家庭消费支出Y的条件分布(conditional distribution)例如,X=2300条件下,Y=1371的条件概率等于1/11,即 由此可求得对应于家庭可支配收入X的各个水平的家庭消费支出Y的条件 均值(conditional mean)或称为条件期望(conditional expectation), 如表2-2所示。析: 第33页,共163页,2022年,5月20日,16点38分,星期三表2
22、-2 100个家庭的月可支配收入与消费数据 单位:元 可支配收入X1300180023002800330038004300480053005800E(Y/Xi)1122132414251926217923892681284730843312 由表2-1、表2-2中的数据绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的总体回归曲线,如图2-1所示。 第34页,共163页,2022年,5月20日,16点38分,星期三 从散点图可以清晰地看出,不同家庭的消费支出虽然存在差异,但总体趋势随可支配收入的增加而增加,总体回归曲线反映了这一趋势。第35页,共163页,2022年,5月2
23、0日,16点38分,星期三 回归函数(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。含义: 函数形式: 可以是线性或非线性的。 将居民消费支出看成是其可支配收入的线性函数时: 为一线性函数。其中,0,1是未知参数,称为回归系数(regression coefficients)。三、总体回归模型第36页,共163页,2022年,5月20日,16点38分,星期三 事实上,经济活动中的总体包含的个体的数量往往非常多,一般不大可能像例2-1假设的那样得到总体中所有个体的观察数据,因此也就不大可能依据总体的所有观察数据计算得到被解释变量Y的条件期望,无法画出精确的总体回归曲线
24、,相应地,总体回归函数的具体形式也无法精确确定。 所以,对于总体回归函数,通常只能根据经济理论或实践经验进行设定,也就是说,通常需要对总体回归函数作出合理的假设。 三、总体回归模型第37页,共163页,2022年,5月20日,16点38分,星期三2总体回归模型 可由其期望值 和随机误差项 表示为 对于只有一个解释变量X的情形,第i个个体的被解释变量的观察值 (2-6)(2-7) 可由其期望值 和随机误差项 表示为 对于含有多个解释变量 的情形,第i个个体的被解释变量的观察值 、 、 、(2-6)或式(2-7)是总体回归函数的个别值表示方式,因为引入了随机误差项,称为总体回归函数的随机设定形式,
25、也是因为引入了随机误差项,成为计量经济学模型,称为总体回归模型(population regression model)。三、总体回归模型第38页,共163页,2022年,5月20日,16点38分,星期三 或 ,是 或 对应的的平均状态,反映解释变量对被解释变量的影响,称为系统性(systematic) 部分或确定性(deterministic)部分;另一部分是随机误差项 ,是观察值 围绕它的期望值 或反映解释变量之外的诸多随机因素对被解释变量的影响,称为非系统性(nonsystematic)部分或随机(stochastic)部分。 总体回归模型中,观察值 是两部分之和,一部分是 的期望值的离
26、差(deviation),三、总体回归模型第39页,共163页,2022年,5月20日,16点38分,星期三例:个别家庭的消费支出为: (*)式称为总体回归函数(方程)PRF的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。 (1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性(systematic)或确定性(deterministic)部分。 (2)其他随机或非确定性(nonsystematic)部分i。即,给定收入水平Xi ,个别家庭的支出可表示为两部分之和:(*) 由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。三、总
27、体回归模型第40页,共163页,2022年,5月20日,16点38分,星期三3线性总体回归模型确定性部分为线性函数的总体回归模型称为线性总体回归模型。 线性总体回归模型是计量经济学中最常见的总体回归模型。 只含有一个解释变量的线性总体回归模型称为一元线性总体回归模型,简称一元线性回归模型或简单线性回归模型(simple linear regression model),其一般形式是(2-8) 其中,Y为被解释变量,X为解释变量,、为待估参数,为随机误差项,为观测值下标,为样本容量。称为回归系数(regression coefficients),三、总体回归模型第41页,共163页,2022年,
28、5月20日,16点38分,星期三3线性总体回归模型 含有多个解释变量的线性总体回归模型称为多元线性总体回归模型,简称多元线性回归模型(multiple linear regression model),其一般形式是 (2-9)其中,Y为被解释变量,为解释变量,为待估参数,即回归系数,、为随机误差项,为观测值下标,为样本容量。三、总体回归模型第42页,共163页,2022年,5月20日,16点38分,星期三 注意: 这里所说的线性函数和通常意义下的线性函数不同,这里的线性函数指参数是线性的,即待估参数都只以一次方出现,解释变量可以是线性的,也可以不是线性的。 例如: 都是线性回归模型。三、总体回
29、归模型第43页,共163页,2022年,5月20日,16点38分,星期三 注意: 例如: 都不是线性回归模型。三、总体回归模型第44页,共163页,2022年,5月20日,16点38分,星期三 对于参数线性、解释变量非线性的回归模型,只要稍作变换,就可化为线性回归模型的一般形式。 例如: 模型 令,可将模型化为 三、总体回归模型第45页,共163页,2022年,5月20日,16点38分,星期三4线性回归模型的普遍性例如,著名的Cobb-Dauglas生产函数表现为幂函数形式, 著名的菲利普斯曲线(Phillips curves)表现为双曲线形式。 一般情况下,对于只含有乘、除、指数、幂运算的非
30、线性关系,可通过对数变化化为线性关系,以Cobb-Dauglas生产函数为例,方程两边取对数,可化为线性形式三、总体回归模型第46页,共163页,2022年,5月20日,16点38分,星期三对于其他复杂的函数形式,可通过级数展开化为线性形式 ,然后在点 可先根据所掌握的信息确定参数 、的一组初始值 、( ),处对模型作泰勒级数展开,并取一阶近似值,得 例如,对于模型 余项整理得+余项三、总体回归模型第47页,共163页,2022年,5月20日,16点38分,星期三+余项令,余项原模型可化为三、总体回归模型第48页,共163页,2022年,5月20日,16点38分,星期三 总体的信息往往无法掌握
31、,现实的情况只能是在一次观测中得到总体的一个样本。 问题1:能从一次抽样中获得总体的近似的信息吗?回答:能四、样本回归模型问题2:如果可以,如何从抽样中获得总体的近似信息?第49页,共163页,2022年,5月20日,16点38分,星期三1样本回归函数与样本回归曲线根据样本数据对总体回归函数作出的估计称为样本回归函数。 由样本回归函数绘制的曲线称为样本回归曲线(样本回归线)。四、样本回归模型第50页,共163页,2022年,5月20日,16点38分,星期三例2-2 假设没有取得总体中所有家庭的可支配收入与消费支出数据,而是按可支配收入水平的不同水平调查取得了一组有代表性的样本,如表2-3所示。
32、 表2-3 家庭月可支配收入与消费支出的一个样本 单位:元 可支配收入X1300180023002800330038004300480053005800消费支出Y1126132714391886220623982677289330653401 以例2-1为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可
33、支配收入水平测算该总体的家庭月消费支出平均水平。)第51页,共163页,2022年,5月20日,16点38分,星期三 若将家庭月可支配收入X与消费支出Y的总体回归函数设定为一元线性回归函数的形式,从而得到样本回归函数可采用适当方法根据表2-3中的数据得到参数、的估计、四、样本回归模型第52页,共163页,2022年,5月20日,16点38分,星期三 根据样本数据和样本回归方程可绘制不同可支配收入家庭的消费支出散点图、家庭消费支出与可支配收入关系的样本回归线,如图2-2所示。 从图中可以清晰地看出,样本回归线是通过对样本数据的较好的拟合对总体回归线作出的一种估计。第53页,共163页,2022年
34、,5月20日,16点38分,星期三 这里将样本回归线看成总体回归线的近似替代则 注意:第54页,共163页,2022年,5月20日,16点38分,星期三 回归分析的主要目的:根据样本回归函数SRF,估计总体回归函数PRF。注意:这里PRF可能永远无法知道。即,根据 估计第55页,共163页,2022年,5月20日,16点38分,星期三2样本回归模型 引入样本回归函数中的代表各种随机因素影响的随机变量,称为样本残差项、回归残差项或样本剩余项、回归剩余项,简称残差项或剩余项(residual),通常用表示。 在样本回归函数中引入残差项后,得到的是随机方程,成为了计量经济学模型,称为样本回归模型。对
35、于例2-2中的样本回归函数 引入残差项可得样本回归模型例如:四、样本回归模型第56页,共163页,2022年,5月20日,16点38分,星期三3线性样本回归模型确定性部分+ 随机部分 = 样本回归模型确定性部分是线性函数的样本回归模型称为线性样本回归模型。 只含有一个解释变量的线性样本回归模型称为一元线性样本回归模型,其一般形式是 (2-10) 其中,Y为被解释变量,X为解释变量,、的估计,是参数为观测值下标,为样本容量。为残差项, 四、样本回归模型第57页,共163页,2022年,5月20日,16点38分,星期三3线性样本回归模型 含有多个解释变量的线性样本回归模型称为多元线性样本回归模型,
36、其一般形式是(2-11)为观测值下标,为样本容量。为残差项, 其中,Y为被解释变量, 为解释变量,、 、的估计,是参数、四、样本回归模型第58页,共163页,2022年,5月20日,16点38分,星期三习 题判断正误并说明理由:1、随机误差项ui和残差项ei是一回事2、总体回归函数给出了对应于每一个自变量的因变量的值3、线性回归模型意味着变量是线性的4、在线性回归模型中,解释变量是原因,被解释变量是结果回答下列问题:随机误差项ui和残差项ei的区别与联系。第59页,共163页,2022年,5月20日,16点38分,星期三习 题下列方程哪些是正确的?哪些是错误的?为什么? 第60页,共163页,
37、2022年,5月20日,16点38分,星期三 一元线性回归模型的基本假设第二节 一元线性回归模型的参数估计 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计第61页,共163页,2022年,5月20日,16点38分,星期三 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计讲课内容第62页,共163页,2022年,5月20日,16点38分,星期三一、一元线性回归模型的基本假设 一元线性回归模型的基本假设包括对解释变
38、量的假设、对随机误差项的假设、对模型设定的假设几个方面,主要如下:1)解释变量是确定性变量,不是随机变量。 2)随机误差项具有0均值、同方差,且在不同样本点之间是独立的,不存在序列相关,即3)随机误差项与解释变量不相关。即4)随机误差项服从正态分布,即5)回归模型是正确设定的。第63页,共163页,2022年,5月20日,16点38分,星期三假设:线性回归模型就参数而言是线性的 对变量为线性: 对参数为线性:E(Y|Xi)=+xiE(Y|Xi)=+x2iE(Y|Xi)=+x2iE(Y|Xi)=xi变量非线性函数有多种形式,其中一些可以通过适当的方式变换为参数线性函数一、一元线性回归模型的基本假
39、设第64页,共163页,2022年,5月20日,16点38分,星期三 这5条假设中的前4条是线性回归模型的古典假设,也称为高斯假设,满足古典假设的线性回归模型称为古典线性回归模型(classical linear regression model)。在这5条假设中,若前两条假设满足,第3条自然满足,因为前两条假设成立时有且由第2条假设有 因为第65页,共163页,2022年,5月20日,16点38分,星期三习 题例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简
40、单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。第66页,共163页,2022年,5月20日,16点38分,星期三习题答案(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。第67页,共163页,2022年,5月20日,16
41、点38分,星期三 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计讲课内容第68页,共163页,2022年,5月20日,16点38分,星期三二、参数的普通最小二乘估计 普通最小二乘法(ordinary least squares,OLS)的基本思想使样本回归函数尽可能好地拟合样本数据,表现在图上就是要使样本散点偏离样本回归线的距离最小最小二乘法以(2-12) 表示被解释变量的估计值与实际观察值的偏差总体上最小,称为最小二乘准则。 第69页,共163页,2022年,5月20日,16点38分,
42、星期三对于一元线性回归模型 最小二乘参数估计就是要求使(2-13)达到最小的参数的估计。第70页,共163页,2022年,5月20日,16点38分,星期三根据微积分中求极限的原理,要使式(2-13)达到最小,式(2-13)对 的一阶偏导数应等于0,即(2-14)整理得 (2-15) 解得(2-16)这就是参数的普通最小二乘估计量(ordinary least squares estimators)方程组(2-14)或(2-15)称为正规方程组。 第71页,共163页,2022年,5月20日,16点38分,星期三记、,由于式(2-16)可改写为 (2-17)称为参数的普通最小二乘估计量的离差形式
43、(deviation form)第72页,共163页,2022年,5月20日,16点38分,星期三若一元线性回归模型中没有常数项,即模型为 可得普通最小二乘参数估计量为 (2-18) 这里需要明确两个概念估计量(estimator)、估计值(estimate)。估计量指以公式表示的参数的估计,是随机变量,其随机性源于被解释变量。因为等于其条件均值与随机误差项之和,是一个随机变量。估计值指把样本数据代入参数估计公式得到的参数估计的具体数值,是确定的数字。 第73页,共163页,2022年,5月20日,16点38分,星期三 例:在上述家庭可支配收入-消费支出例中,对于所抽出的一组样本数,参数估计的
44、计算可通过下面的表2.2.1进行。 第74页,共163页,2022年,5月20日,16点38分,星期三因此,由该样本估计的回归方程为: 第75页,共163页,2022年,5月20日,16点38分,星期三例2-3 以例2-2为例(假设一个由100个家庭构成的总体,并假设这100个家庭的月可支配收入水平只限于1300元、1800元、2300元、2800元、3300元、800元、4300元、4800元、5300元、5800元10种情况,每个家庭的月可支配收入与消费数据如表2-1所示,要研究这一总体的家庭月消费支出Y与家庭月可支配收入X之间的关系,以便根据已知的家庭月可支配收入水平测算该总体的家庭月消
45、费支出平均水平。)求关于家庭消费支出与可支配收入的关系的一元线性回归模型的参数的普通最小二乘估计值,写出样本回归函数。注意小数点取值,大样本时影响较大第76页,共163页,2022年,5月20日,16点38分,星期三答 疑为什么要设定古典假定?回归分析的目的不仅是获得 ,而且要对真实值做出推断。 即用样本对总体进行推断,统计学中称为统计推断。要想利用样本对总体做出推断,不仅要知道代表总体的对应函数形式,还需要对Yi的产生方式做出某些假定。如果不知道Xi和 是怎样产生的,即不对它们做出某些假定,就无法得出Yi的统计推断。也无法根据 对其真实值做出推断。 (2-8) 第77页,共163页,2022
46、年,5月20日,16点38分,星期三习 题线性回归模型 随机误差项的0均值假设是否可以表示为 ?为什么?第78页,共163页,2022年,5月20日,16点38分,星期三 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计讲课内容第79页,共163页,2022年,5月20日,16点38分,星期三三、参数的最大似然估计 最大或然法(Maximum Likelihood,简称ML),也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。 基本原
47、理: 对于最大或然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。第80页,共163页,2022年,5月20日,16点38分,星期三三、参数的最大似然估计对于一元线性回归模型若满足基本假设,则且X为确定性变量,有且第81页,共163页,2022年,5月20日,16点38分,星期三 那么Yi服从如下的正态分布:于是,Y的概率密度函数为(i=1,2,n) 假如模型的参数估计量已经求得,为第82页,共163页,2022年,5月20日,16点38分,星期三正态分布:概率密度函数回 顾f(x) = 随机变量 X 的频数 = 总体方差 =3.14
48、159; e = 2.71828x = 随机变量的取值 (- x ) = 总体均值第83页,共163页,2022年,5月20日,16点38分,星期三的联合概率密度函数是(2-19) 对一组确定的样本, 的联合概率密度函数是关于的函数,称为似然函数。 参数 的估计结果要使得到的模型能以最大概率产生样本数据, (2-20) 就是要使似然函数极大化,即第84页,共163页,2022年,5月20日,16点38分,星期三由于似然函数极大化等价于似然函数的对数 (2-21)的极大化。第85页,共163页,2022年,5月20日,16点38分,星期三所以,根据微积分中求极限的原理,分别求式(2-21)对的一
49、阶偏导数,并令求偏导的结果等于0,可得正规方程组(2-22)解得 (2-23) 这就是参数的最大似然估计量(maximum likelihood estimators)第86页,共163页,2022年,5月20日,16点38分,星期三 可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。 习题:P72.15第87页,共163页,2022年,5月20日,16点38分,星期三 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计讲课内容第88页,共163页
50、,2022年,5月20日,16点38分,星期三 当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。四、普通最小二乘参数估计量的性质渐近无偏性估计量优劣性渐近有效性一致性无偏性有效性线性性第89页,共163页,2022年,5月20日,16点38分,星期三线性性无偏性有效性(最小方差性)渐近无偏性一致性渐近有效性小样本性质大样本性质(渐进性质)指参数估计量可以表示为被解释变量的线性组合 指参数估计量的数学期望等于参数的真实值 指在所有的线性、无偏估计量中该参数估计量的方差最小 指样本容量趋于无穷大时,参数估计量的数学期望 趋于参数的真实值 样
51、本容量趋于无穷大时,参数估计量依概率收敛于 参数的真实值 指样本容量趋于无穷大时,在所有的一致估计量中 该参数估计量具有最小的渐近方差。四、普通最小二乘参数估计量的性质第90页,共163页,2022年,5月20日,16点38分,星期三1.线性性 - 估计参数 和 均是样本观测值(Xi和Yi)的 线性函数。OLS四、普通最小二乘参数估计量的性质第91页,共163页,2022年,5月20日,16点38分,星期三证: 令 则 同理 四、普通最小二乘参数估计量的性质第92页,共163页,2022年,5月20日,16点38分,星期三2.无偏性 - 估计参数 和 的均值等于总体参数真值证:易知故同样地,容
52、易得出 ?四、普通最小二乘参数估计量的性质第93页,共163页,2022年,5月20日,16点38分,星期三四、普通最小二乘参数估计量的性质第94页,共163页,2022年,5月20日,16点38分,星期三3.有效性:利用OLS估计的参数 和 的方差最小四、普通最小二乘参数估计量的性质第95页,共163页,2022年,5月20日,16点38分,星期三3.有效性(2)证明最小方差性其中,ci=vi+di,di为不全为零的常数则容易证明四、普通最小二乘参数估计量的性质第96页,共163页,2022年,5月20日,16点38分,星期三1)满足线性性、无偏性、有效性三个小样本性质的参数估计量称为最佳
53、线性无偏估计量(best linear unbiased estimator,BLUE)。 2)满足小样本性质的参数估计量自然也满足大样本性质。 3)在小样本性质不满足的情况下,应扩大样本容量,考察大样本性质。 4)在满足基本假设情况下,一元线性回归模型的普通最小二乘参数估计 量是最佳线性无偏估计量。(why?)几点说明:四、普通最小二乘参数估计量的性质第97页,共163页,2022年,5月20日,16点38分,星期三4.一致性 由于最小二乘估计量拥有一个“好”的估计量所应具备的小样本特性,它自然也拥有大样本特性。 四、普通最小二乘参数估计量的性质P41(2-29)第98页,共163页,202
54、2年,5月20日,16点38分,星期三习 题 假定有如下的回归结果: ,其中,Y表示美国的咖啡的消费量(每天每人消费的杯数),X表示咖啡的零售价格(美元/杯),t表示时间。要求:(1)这是一个时间序列回归还是横截面序列回归?(2)如何解释截距的意义,它有经济含义吗?如何解释斜率?(3)能否求出真实的总体回归函数?(4)根据需求的价格弹性定义:弹性=斜率(X/Y),依据上述回归结果,你能求出对咖啡需求的价格弹性吗?如果不能,计算此弹性还需要其他什么信息?第99页,共163页,2022年,5月20日,16点38分,星期三习 题 答 案截距2.6911表示咖啡零售价在时刻为每磅0美元时,美国平均消费
55、量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在时刻t,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯;不能;不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的值及与之对应的值。第100页,共163页,2022年,5月20日,16点38分,星期三习 题 令 和 分别为Y对X回归和X对Y回归中的斜率,试证明: 其中r为X和Y之间的线性相关系数 p24 (2-2)第101页,共163页,2022年,5月20日,16点38分,星期三 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参
56、数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计讲课内容第102页,共163页,2022年,5月20日,16点38分,星期三五、普通最小二乘样本回归函数的性质 1样本回归线过样本均值点, 满足样本回归函数即点 2被解释变量的估计的均值等于实际值的均值,即 3残差和为零,即4解释变量与残差的乘积之和为零,即 5被解释变量的估计与残差的乘积之和为零,即第103页,共163页,2022年,5月20日,16点38分,星期三习 题对于经济计量模型: ,其OLS估计参数的特性在下列情况下会受到什么影响:(1)观测值数目n增加;(2)Xi各观测值差额增加;(3)Xi各观测值近似相等第10
57、4页,共163页,2022年,5月20日,16点38分,星期三答 案(1)根据大样本特性,更接近真实值(2)更接近真实值(3)使得 变得不稳定,甚至无法计算第105页,共163页,2022年,5月20日,16点38分,星期三 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计讲课内容第106页,共163页,2022年,5月20日,16点38分,星期三 六、参数估计量的概率分布及随机干扰项方差的估计 第107页,共163页,2022年,5月20日,16点38分,星期三 六、参数估计量的概率分布
58、及随机干扰项方差的估计 第108页,共163页,2022年,5月20日,16点38分,星期三2、随机误差项的方差2的估计 由于随机项i不可观测,只能从i的估计残差ei出发,对总体方差进行估计。 2又称为总体方差。 可以证明,2的最小二乘估计量为它是关于2的无偏估计量。 第109页,共163页,2022年,5月20日,16点38分,星期三2的最大似然估计量随机误差项的方差的最大似然估计量可通过对数似然函数求得。即 按照最大似然法的基本思想,要求 使对数似然函数极大化,求对数似然函数对 的偏导数,并令求偏导的结果等于0,得 由此可解得 (2-36) 2、随机误差项的方差2的估计第110页,共163
59、页,2022年,5月20日,16点38分,星期三2的最大或然估计量不具无偏性,但却具有一致性。 由此可解得 (2-36) 第111页,共163页,2022年,5月20日,16点38分,星期三最大似然法与最小二乘法结构参数估计结果随机误差项的方差的估计结果应用范围第112页,共163页,2022年,5月20日,16点38分,星期三习 题1 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计?习 题2 p18第113页,共163页,2022年,5月20日,16点38分,星期三习 题 线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确定性变量,而且解释变
60、量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。 违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。第114页,共163页,2022年,5月20日,16点38分,星期三第二节 结束 一元线性回归模型的基本假设 参数的普通最小二乘估计 参数的最大似然估计 普通最小二乘参数估计量的性质 普通最小二乘样本回归函数的性质 随机误差项方差的估计内容回顾第115页,共163页,2022年,5月20日,16点38分,星期三回归分析是要通过样本所估计的参数来代
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025书店员工聘用合同
- 2025签订合同缴纳社保即为劳动合同关系确立
- 2025食品冷链物流合同
- 2025娱乐公司员工劳动合同模板
- 2025建筑设备租赁合同书
- 2025公寓建筑合同模板
- 2025财务分析咨询合同
- 2025租赁及服务合同
- 2025汽车租赁合同(范本x格式)
- 2025版项目合同范本下载
- 2024企业咨询服务与战略规划合同
- TCUWA40055-2023排水管道工程自密实回填材料应用技术规程
- 糖尿病病人的麻醉管理
- 大型活动策划与管理第九章 大型活动知识产权保护
- 2024年新课标培训2022年小学英语新课标学习培训课件
- 精神科患者便秘护理
- 煤矿反三违认定培训课件
- 超高清视频技术
- 2024年安全标志标识标准图册
- 航空航天知识讲座学习课件
- 浙江省嘉兴市2024-2025学年高一化学下学期期末考试试题含解析
评论
0/150
提交评论