




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章第三章一元回归分析预测法一元回归分析预测法Page 2基础补充:关于计量经济学模型基础补充:关于计量经济学模型一、什么是计量经济学一、什么是计量经济学二、理论模型的设计步骤二、理论模型的设计步骤三、样本数据的收集三、样本数据的收集四、模型参数的估计四、模型参数的估计五、模型的检验五、模型的检验Page 3 费里希在费里希在EconometricaEconometrica的创刊辞中这样指出:的创刊辞中这样指出:“用数学方法处理经济学可以有多种形式,其中任用数学方法处理经济学可以有多种形式,其中任何单独的一种都不等同于计量经济学,计量经济学何单独的一种都不等同于计量经济学,计量经济学不等同于
2、统计学,计量经济学也不等同于我们称之不等同于统计学,计量经济学也不等同于我们称之为的一般经济理论(即使这种理论的大部分具有定为的一般经济理论(即使这种理论的大部分具有定量的特点),当然,计量经济学也不是数学在经济量的特点),当然,计量经济学也不是数学在经济学中的应用的同义词。不用说,学中的应用的同义词。不用说,统计学、经济理论统计学、经济理论和数学是理解现代经济生活中的数量关系所不可缺和数学是理解现代经济生活中的数量关系所不可缺少的必要条件,但是作为充分条件的是这三者的结少的必要条件,但是作为充分条件的是这三者的结合,这三者的结合就构成了计量经济学。合,这三者的结合就构成了计量经济学。”一、什
3、么是计量经济学一、什么是计量经济学Page 4美国现代经济词典美国现代经济词典:“计量经济学是用数计量经济学是用数学语言来表达经济理论,以便通过统计方法学语言来表达经济理论,以便通过统计方法来论述这些理论的一门经济学分支。来论述这些理论的一门经济学分支。”萨缪尔森萨缪尔森:“根据理论和观测的事实,运根据理论和观测的事实,运用合适的推理方法,对实际经济现象进行的用合适的推理方法,对实际经济现象进行的数量分析。数量分析。”Page 5二、理论模型的设计步骤二、理论模型的设计步骤q选择变量;选择变量;q确定变量之间的数学关系;确定变量之间的数学关系;q拟定模型中待估计参数的数值范围。拟定模型中待估计
4、参数的数值范围。Page 6n作为作为“原因原因”的变量;的变量;n例如生产函数中的资本、劳动、技术,是模型中的解释例如生产函数中的资本、劳动、技术,是模型中的解释变量。变量。n作为研究对象的变量,也就是因果关系中的作为研究对象的变量,也就是因果关系中的“果果”;n例如生产函数中的产出量,是模型中的被解释变量。例如生产函数中的产出量,是模型中的被解释变量。1.1.确定模型所包含的变量确定模型所包含的变量Page 7n由模型系统决定其取值。由模型系统决定其取值。n受模型中其他变量影响,也可能影响其它内生变量。受模型中其他变量影响,也可能影响其它内生变量。n在单方程模型中,内生变量就是被解释变量。
5、在单方程模型中,内生变量就是被解释变量。n一般受随机项影响,是随机变量,与随机项之间不独立。一般受随机项影响,是随机变量,与随机项之间不独立。n确定性变量,由模型系统以外的因素决定其取值。确定性变量,由模型系统以外的因素决定其取值。n只影响模型中的其他变量,而不受其他变量的影响。只影响模型中的其他变量,而不受其他变量的影响。n在单方程模型中,外生变量就是解释变量。在单方程模型中,外生变量就是解释变量。n不受模型系统内的随机项影响,它与模型系统内的随机项不受模型系统内的随机项影响,它与模型系统内的随机项之间是独立的。之间是独立的。Page 8n内生变量的滞后值称为滞后内生变量。内生变量的滞后值称
6、为滞后内生变量。n取值虽然由模型系统内所决定,但它不受现期的模型取值虽然由模型系统内所决定,但它不受现期的模型系统内的随机项影响,二者之间是独立的。系统内的随机项影响,二者之间是独立的。n外生变量和滞后内生变量的合称,表明在模型确定之外生变量和滞后内生变量的合称,表明在模型确定之前已经给定。前已经给定。n影响现期模型系统中的其他变量,但不受它们的影响。影响现期模型系统中的其他变量,但不受它们的影响。n只能作解释变量。只能作解释变量。n与随机项独立。与随机项独立。Page 9n(1)指出模型中的解释与被解释变量。)指出模型中的解释与被解释变量。n(2)指出模型中的内生变量与外生变量。)指出模型中
7、的内生变量与外生变量。n(3)指出模型中的滞后内生变量与先决变量。)指出模型中的滞后内生变量与先决变量。 NXG tt212101131210ttttttttttttICYYYIuPCYC例例3.13.1:有下列联立方程模型,其中:有下列联立方程模型,其中:C是消费支是消费支出,出,Y是收入,是收入,P是价格,是价格,I是投资,是投资,NX是进出口。是进出口。Page 102.2.确定模型的数学形式确定模型的数学形式依据经济行为理论;依据经济行为理论;根据样本数据作出的变量关系图;根据样本数据作出的变量关系图;选择可能的形式试模拟;选择可能的形式试模拟;Page 113.3.拟定模型中待估计参
8、数的理论期望值拟定模型中待估计参数的理论期望值 理论模型中的待估参数一般都具有特定理论模型中的待估参数一般都具有特定的经济含义,它们的数值,要待模型估计、的经济含义,它们的数值,要待模型估计、检验后,即经济数学模型完成后才能确定,检验后,即经济数学模型完成后才能确定,但对于它们的数值范围,即理论期望值,可但对于它们的数值范围,即理论期望值,可以根据它们的经济含义在开始时拟定(包括以根据它们的经济含义在开始时拟定(包括符号、大小、关系)。这一理论期望值可以符号、大小、关系)。这一理论期望值可以用来检验模型的估计结果。用来检验模型的估计结果。Page 12同一统计指标,由同一统计单同一统计指标,由
9、同一统计单位位按按顺序记录顺序记录形成的数据列;形成的数据列;同一统计同一统计指标指标,在同一时间(时期,在同一时间(时期或时点或时点)按不同统计单位记录按不同统计单位记录形成的数据列;形成的数据列;既有时序数据,又有截面数据既有时序数据,又有截面数据;反映定性因素变化,取值反映定性因素变化,取值1或或0的的人工变量。人工变量。三、样本数据的收集三、样本数据的收集Page 13中国中国19931993年年19981998年的年的GDPGDP增长率增长率 (% %)1993 1994 1995 1996 1997 199814.213.510.59.68.87.819921992年实际年实际GD
10、PGDP增长增长16.314.22.7-1.73.612.30.9GDP日本日本香港香港中国中国美国美国秘鲁秘鲁墨西哥墨西哥智利智利加拿大加拿大国家国家/地地区区Page 14国家和国家和地区地区 实际实际GDP增长率增长率 1992年年1993年年1994年年1995年年1996年年1997年年1998年年加拿大加拿大0.92.53.92.21.24.03.1智利智利12.37.05.710.67.47.13.4墨西哥墨西哥3.62.04.4-6.25.27.04.8秘鲁秘鲁-1.76.413.17.42.56.90.3美国美国2.72.33.52.02.83.93.9中国中国14.213.
11、512.610.59.68.87.8香港香港6.36.15.43.94.65.3-5.1日本日本1.00.30.61.53.91.4-2.8Page 15 考虑如下回归模型:考虑如下回归模型:Y Yi i=b=b0 0+b+b1 1D D1i1i+b+b2 2X Xi i+u+ui i 其中,其中,Y=Y=大学教师的年收入;大学教师的年收入;X=X=教学年份;教学年份;女性 0男性 1D1Page 16四、模型参数的估计四、模型参数的估计模型参数的估计方法,是计量经济学的核心内容。模型参数的估计方法,是计量经济学的核心内容。q建立了理论模型并收集整理了符合模型要求的样本数据之后,建立了理论模型
12、并收集整理了符合模型要求的样本数据之后,就可以选择适当的方法估计模型,得到模型参数的估计量。就可以选择适当的方法估计模型,得到模型参数的估计量。模型参数的估计是一个纯技术的过程,包括:模型参数的估计是一个纯技术的过程,包括:q对模型进行识别(对联立方程模型而言);对模型进行识别(对联立方程模型而言);q估计方法的选择;估计方法的选择;q软件的应用:如软件的应用:如Eviews 。Page 17五、模型的检验五、模型的检验计量经济学模型必须通过四级检验:计量经济学模型必须通过四级检验:v经济意义检验;经济意义检验;v统计学检验;统计学检验;v计量经济学检验;计量经济学检验;v模型预测检验。模型预
13、测检验。Page 181.1.经济意义检验经济意义检验 目的:目的:检验模型参数估计量在经济意义上的合理性。检验模型参数估计量在经济意义上的合理性。 方法:方法:将模型参数的估计量与预先拟定的理论期望值将模型参数的估计量与预先拟定的理论期望值进行比较,包括参数估计量的符号、大小、相互之进行比较,包括参数估计量的符号、大小、相互之间的关系,以判断其合理性。间的关系,以判断其合理性。 注意:注意:只有当模型中的参数估计量通过所有经济意义只有当模型中的参数估计量通过所有经济意义的检验,方可进行下一步检验。模型参数估计量的的检验,方可进行下一步检验。模型参数估计量的经济意义检验是一项最基本的检验,经济
14、意义不合经济意义检验是一项最基本的检验,经济意义不合理,不管其它方面的质量多么高,模型也是没有实理,不管其它方面的质量多么高,模型也是没有实际价值的。际价值的。 Page 19 在该模型中,电力消耗量前的参数估计量为负,在该模型中,电力消耗量前的参数估计量为负,意味着电力消耗越多,煤炭产量越低,从经济行为意味着电力消耗越多,煤炭产量越低,从经济行为上无法解释。模型不能通过检验。上无法解释。模型不能通过检验。例例3.23.2:有下列煤炭行业生产模型:有下列煤炭行业生产模型:煤炭产量煤炭产量= =108.5427108.54270.000670.00067固定资产原值固定资产原值0.015270.
15、01527职工人数职工人数0.006810.00681电力消耗量电力消耗量0.002560.00256木材消耗量木材消耗量Page 20 该模型是一个对数线性模型,固定资产原值前的该模型是一个对数线性模型,固定资产原值前的参数是固定资产原值的产出弹性,根据产出弹性的概参数是固定资产原值的产出弹性,根据产出弹性的概念,该参数估计量应该是念,该参数估计量应该是0 0与与1 1之间的一个数,该例数之间的一个数,该例数值与理论期望值不符,不能通过检验。值与理论期望值不符,不能通过检验。 例例3.33.3:有下列煤炭企业生产函数模型:有下列煤炭企业生产函数模型:LnLn(煤炭产量)(煤炭产量)=2.69
16、=2.691.85Ln1.85Ln(固定资产原值)(固定资产原值)0.51Ln0.51Ln(职工人数)(职工人数)Page 21SRtt1120012.StRttSRtt144320030.St11t例例3.4:3.4:下列假想模型是否属于揭示因果关系的计下列假想模型是否属于揭示因果关系的计量经济学模型?为什么?量经济学模型?为什么? 其中其中 为第为第 年农村居民储年农村居民储蓄增加额(亿元)、蓄增加额(亿元)、 为第为第 年城镇居民可支配年城镇居民可支配收入总额(亿元)。收入总额(亿元)。 其中其中 为第为第 年底农年底农村居民储蓄余额(亿元)、村居民储蓄余额(亿元)、 为第为第 年农村居
17、民年农村居民纯收入总额(亿元)。纯收入总额(亿元)。tRttPage 22例例3.5:3.5:指出下列假想模型中的错误,并说明理由:指出下列假想模型中的错误,并说明理由: 其中,其中, 为第为第 年社会消费品零售总额(亿年社会消费品零售总额(亿元),元), 为第为第 年居民收入总额(亿元)(城镇居年居民收入总额(亿元)(城镇居民可支配收入总额与农村居民纯收入总额之和),民可支配收入总额与农村居民纯收入总额之和), 为第为第 年全社会固定资产投资总额(亿元)。年全社会固定资产投资总额(亿元)。RSRIIVttt83000024112.RStRItIVttttPage 232.2.统计检验统计检验
18、目的:目的:检验模型的统计学性质。检验模型的统计学性质。最广泛应用的统计检验准则:最广泛应用的统计检验准则:q拟合优度检验;拟合优度检验;q变量的显著性检验;变量的显著性检验;q方程的显著性检验;方程的显著性检验;Page 243.3.计量经济学检验计量经济学检验目的目的:检验模型的计量经济学性质。检验模型的计量经济学性质。最主要的检验准则:最主要的检验准则:q随机误差项的序列相关检验;随机误差项的序列相关检验;q随机误差项的异方差性检验;随机误差项的异方差性检验;q解释变量的多重共线性检验。解释变量的多重共线性检验。Page 254.4.模型预测检验模型预测检验目的:目的:q检验模型参数估计
19、量的稳定性以及相对样本容量变检验模型参数估计量的稳定性以及相对样本容量变化时的灵敏度;化时的灵敏度;q确定所建立的模型是否可以用于样本观测值以外的确定所建立的模型是否可以用于样本观测值以外的范围。范围。检验方法:检验方法:q稳定性检验:稳定性检验:扩大样本重新估计。扩大样本重新估计。q预测性能检验:预测性能检验:对样本外一点进行实际预测。对样本外一点进行实际预测。理论研究或经验总结收集统计资料设计理论模型模型的参数估计,建立具体模型检验估计的模型,验证理论是否符合标准修改模型或重新选择估计方法应用模型否否是是结构分析经济预测政策评价图图3.1 计计量量模模型型建建立立与与应应用用过过程程图图P
20、age 27第一节第一节 模型的建立及假定条件模型的建立及假定条件第二节第二节 参数估计参数估计第三节第三节 最小二乘估计量的统计性质最小二乘估计量的统计性质第四节第四节 拟合优度检验拟合优度检验第五节第五节 显著性检验与置信区间显著性检验与置信区间第六节第六节 预测预测第七节第七节 案例分析案例分析第一节第一节 模型的建立及假定条件模型的建立及假定条件Page 29一、经济变量关系的类型一、经济变量关系的类型定义:定义:如果一个变量y的取值可以通过另一个变量x或另一组变量(x1,x2,xk),以某种形式唯一地、精确唯一地、精确地确定地确定,则y与这个x之间或y与这组(x1,x2,xk)之间的
21、关系就是确定的函数关系。代数表示式:代数表示式: y=(x) 或:或: y= (x1,x2,xk)例:例:Y=PQY=PQ;I=U/RI=U/R;圆面积;圆面积= = (半径)(半径)=半径半径2 21.1.确定的函数关系确定的函数关系Page 30 y=b0+b1xxy图图3.2 3.2 确定型函数关系确定型函数关系Page 312.2.非确定的函数关系非确定的函数关系定义:定义:如果一个变量y的取值受另一个变量x或另一组变量(x1,x2,xk)的影响,但给定这一个x或一组(x1,x2,xk)值的时候,y的取值并不是唯一确定的的取值并不是唯一确定的。则变量y与这一个x之间或一组(x1,x2,
22、xk)之间的关系就是非确定的函数关系。代数表示式:代数表示式: y=(x,u)或:或: y= (x1,x2,xk,u)例:例:Y Yi i= = (x xi i)+u+ui i ;其中:;其中:Y Yi i体重,体重,x xi i身高。身高。 Y Yi i= = (x xi i)+u+ui i ;其中:;其中:Y Yi i家庭消费支出家庭消费支出,x xi i家庭收入家庭收入。Page 32 y=b0+b1x+uxy图图3.3 3.3 非确定型函数关系非确定型函数关系Page 33二、一元线性回归模型二、一元线性回归模型1.1.一元线性回归模型一元线性回归模型 Yi = 0 + 1 Xi +u
23、i i=1,2, ,n其中:其中:Yi被解释变量(因变量);被解释变量(因变量);Xi解释变量(自变量);解释变量(自变量);ui随机误差项(随机扰动项、随机项随机误差项(随机扰动项、随机项);); 0、 1回归系数(待定参数、待定系数)回归系数(待定参数、待定系数)(通常未知)。(通常未知)。Page 34一元线性回归模型的含义:一元线性回归模型的含义:n(1)“(1)“一元一元”:指只有一个自变量指只有一个自变量X X,这个自变量,这个自变量X X可以可以解释解释Y Y变化的部分原因。变化的部分原因。n(2)“(2)“线性线性”两层含义:两层含义:qA.A.对变量为线性:对变量为线性:被解
24、释变量Y与解释变量X之间为线性关系;qB.B.对参数为线性:对参数为线性:被解释变量Y与待定参数0, 1之间为线性关系;注:注:在计量经济学中,从回归理论的发展、参数的估计方在计量经济学中,从回归理论的发展、参数的估计方法来说,主要考虑的是模型就法来说,主要考虑的是模型就参数参数而言是线性的情形。而言是线性的情形。Page 35模型对参数为线性?模型对参数为线性? 模型对变量为线性?模型对变量为线性? 是是不是不是是是LRM LRM LRM LRM 不是不是NLRM NLRM NLRM NLRM LRM=LRM=线性回归模型;线性回归模型; NLRM =NLRM =非线性回归模型非线性回归模型
25、Y=Y= 0 0+ + 1 1X+uX+uY=Y= 0 0+ + 1 1X X2 2+u +u ueeYXX2211210ueLAKY例:例:Page 36(3)“(3)“回归回归”“回归回归”一词的古典意义一词的古典意义 1919世纪英国生物学家世纪英国生物学家F.F.高尔顿(高尔顿(Francis GaltonFrancis Galton)和其学)和其学生生PearsonPearson研究父母身高与其子女身高的遗传问题,观察了研究父母身高与其子女身高的遗传问题,观察了10781078对父母,以每对父母身高为对父母,以每对父母身高为x x,取他们一个成年儿子的身高为,取他们一个成年儿子的身高
26、为y y,将结果绘成散点图,发现趋势近乎一条直线(父母平均身高将结果绘成散点图,发现趋势近乎一条直线(父母平均身高6868吋,吋,成年儿子平均身高成年儿子平均身高6969吋):吋): y=33.73+0.516xy=33.73+0.516x可以发现:可以发现: x=72x=72吋,吋,y=70.89y=70.89吋;吋; x=64x=64吋,吋,y=66.75y=66.75吋;吋; Page 37 “回归回归”一词的现代意义一词的现代意义 “回归回归”是关于一个被解释变量(或因变量)对一个或是关于一个被解释变量(或因变量)对一个或多个解释变量(或自变量)多个解释变量(或自变量)依存关系依存关系
27、的研究,找出变量之间的研究,找出变量之间在数量变化方面的统计规律。这种统计规律就反映了变量之在数量变化方面的统计规律。这种统计规律就反映了变量之间的回归关系。表示这种统计规律的数学方程就称为回归方间的回归关系。表示这种统计规律的数学方程就称为回归方程。变量之间回归关系的研究就称为程。变量之间回归关系的研究就称为回归分析回归分析。 作用:作用:根据已知的或固定的解释变量的值,去估计或预根据已知的或固定的解释变量的值,去估计或预测被解释变量的总体均值。测被解释变量的总体均值。Page 38例:例:居民家庭可支配收入和消费支出相互关系的回归分析居民家庭可支配收入和消费支出相互关系的回归分析 对应于不
28、同的可支配收入水平,居民家庭的对应于不同的可支配收入水平,居民家庭的消费支出虽并不确定,但总在一定的范围内波动。消费支出虽并不确定,但总在一定的范围内波动。对于每一种可支配收入水平,消费支出呈现出一对于每一种可支配收入水平,消费支出呈现出一定的分布,但平均而言,消费支出总是随着收入定的分布,但平均而言,消费支出总是随着收入水平的增加而增加的。通过建立回归方程,我们水平的增加而增加的。通过建立回归方程,我们可以可以对每一种确定的可支配收入水平,估计或预对每一种确定的可支配收入水平,估计或预测其对应的消费支出的平均水平。测其对应的消费支出的平均水平。 Page 39Page 402.2.随机误差项
29、的性质随机误差项的性质 (1 1)模型中被忽略掉的影响因素造成的误差;)模型中被忽略掉的影响因素造成的误差; (2 2)模型关系的设定不准确造成的误差;)模型关系的设定不准确造成的误差; (3 3)变量观测值的观测和测量误差的影响;)变量观测值的观测和测量误差的影响; (4 4)随机误差。)随机误差。 总之,总之,u ui i的存在是计量经济模型与确定的函数关系的的存在是计量经济模型与确定的函数关系的主要区别,计量经济学中遇到的各种问题几乎都是由于主要区别,计量经济学中遇到的各种问题几乎都是由于u u的存在造成的,计量中的各种估计、检验、预测等分析的存在造成的,计量中的各种估计、检验、预测等分
30、析方法,也是针对不同性质的误差项方法,也是针对不同性质的误差项u u引入的。引入的。Page 41u1Y2YnY1Y1三、随机误差项的假定条件三、随机误差项的假定条件YiiiiXYXYE10)/(0unYnY2u2XX1X2Xn0一元线性回归模型:一元线性回归模型:Y Yi i = = 0 0 + + 1 1 X Xi i + + u ui iu ui i=Y=Yi i-E(Y-E(Yi i/X/Xi i) )图图3.4 3.4 一元线性回归模型中的随机干扰一元线性回归模型中的随机干扰项项Page 42基本假设基本假设1 1基本假设基本假设2 2基本假设基本假设3 3基本假设基本假设4 4基本
31、假设基本假设5 5Page 43基本假设1:零均值随机误差项具有随机误差项具有0 0均值。即均值。即E(E(u ui i) ) =0 i=1,2, =0 i=1,2, 则,则,Y Yii的期望值或平均值为:的期望值或平均值为:E(YE(Yii)=E()=E( 0 0+ + 1 1X Xi i + +u ui i) =) = 0 0+ + 1 1X Xi i i=1,2, i=1,2, Page 44图图3.5 3.5 随机干扰项的零均值随机干扰项的零均值Page 45随机误差项具有同方差:随机误差项具有同方差:即每个即每个X Xi i对应的对应的随机误差项随机误差项u uii具有相同的方差具有
32、相同的方差。VarVar( (u uii)=)=EEu uii-E(-E( ii) ) 2 2= =E(uE(uii) )2 2= = u u2 2 i=1,2, i=1,2, 基本假设2:同方差则,则,Y Yii与与u uii具有相同的方差:具有相同的方差:VarVar( (Y Yii)=)=VarVar( ( 0 0+ + 1 1X Xi i+ +u uii) )=Var=Var( ( 0 0+ + 1 1X Xi i)+)+ Var Var(u(uii) )=Var=Var(u(uii) )= = u u2 2 i=1,2, i=1,2, Page 46异方差异方差同方差同方差图图3.6
33、 3.6 随机干扰项的方差分布随机干扰项的方差分布Page 47基本假设3:无序列相关无序列相关:无序列相关:即任意两个即任意两个X Xii和和X Xj j所对应的随机误差所对应的随机误差项项u u i i,u uj j是不相关的。是不相关的。即即 CovCov( (u uii, ,u uj j)=)=EEu uii-E(u-E(uii) ) u uj j-E(u-E(uj j) )=E(=E(u ui iu uj j)=)=0 0 ij iij i,j=1,2, j=1,2, u u是完全是完全随机的,随机的,互互不相关的不相关的则,则,CovCov( (Y Yi, i,Y Yj j)=)=
34、EEY Yii-E(Y-E(Yii) ) Y Yj j-E(Y-E(Yj j) )=E(=E(u ui iu uj j)=)=0 0Page 48 u u 无序列相关无序列相关图图3.7 3.7 随机干扰项的关系分布随机干扰项的关系分布Page 49 u u u u 负相关负相关正相关正相关序列相关序列相关续图续图3.7 3.7 随机干扰项的关系分布随机干扰项的关系分布Page 50基本假设4:解释变量X是确定性变量, 与随机误差项不相关 解释变量解释变量X X1 1,X X2 2,X Xk k是确定性变量,不是是确定性变量,不是随机变量;并且解释变量与随机误差项之间不相随机变量;并且解释变量
35、与随机误差项之间不相关。即关。即 CovCov( (u uii,X,Xii)=)=EEu uii-E(u-E(uii) ) X Xii-E(X-E(Xii) )= = E = Eu uiiX Xii- u- uiiE(XE(Xii) )=E(=E(u uiiX Xi i)=)=0 0Page 51基本假设5 : I服从正态分布 随机误差项服从随机误差项服从0 0均值、同方差的正态分布。即均值、同方差的正态分布。即 u ui iN(0, N(0, u u2 2 ) i=1,2, ) i=1,2, 则则Y Yi iN(N( 0 0+ + 1 1X Xii, , u u2 2 ) i=1,2, )
36、i=1,2, Page 52 以上假设也称为线性回归模型以上假设也称为线性回归模型的的古典假设古典假设或或高斯高斯(Gauss)假设,)假设,满足该假设的线性回归模型,也称满足该假设的线性回归模型,也称为为古典线性回归模型古典线性回归模型(Classical Linear Regression Model, CLRM)。)。 Page 53例例3.6:3.6:educkids10 令令kidskids表示一名妇女生育孩子的数目,表示一名妇女生育孩子的数目,educeduc表表示该妇女接受过教育的年数。生育率对教育年数的示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为:简单回归模型为:
37、 (1 1)随机扰动项)随机扰动项 包含什么样的因素?它们可能包含什么样的因素?它们可能与教育水平相关吗?与教育水平相关吗? (2 2)上述简单回归分析能够揭示教育对生育率)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。在其他条件不变下的影响吗?请解释。Page 54例例3.7:3.7:NE 已知回归模型已知回归模型 ,式中,式中E E为某类公为某类公司一名新员工的起始薪金(元),司一名新员工的起始薪金(元),N N为所受教育水为所受教育水平(年)。随机扰动项平(年)。随机扰动项 的分布未知,其他所有的分布未知,其他所有假设都满足。假设都满足。(1 1)从直观及经济角度
38、解释)从直观及经济角度解释 和和 。(2 2)能满足)能满足OLSOLS估计的假设要求吗?估计的假设要求吗?(3 3)对参数的假设检验还能进行吗?)对参数的假设检验还能进行吗?第二节第二节 参数估计参数估计Page 56以研究家庭收入以研究家庭收入X X影响家庭消费支出影响家庭消费支出Y Y为例:为例: 1.1.Y Yi i= = 0 0+ + 1 1X Xi i+ + i i总体回归模型总体回归模型(依据全体的(依据全体的全部观测资料建立起来,代表了总体变量间的真全部观测资料建立起来,代表了总体变量间的真实关系实关系)一、回归分析的四个关系式一、回归分析的四个关系式Page 57 2.E(Y
39、2.E(Yi i)=)= 0 0+ + 1 1X Xi i总体回归线(方程)总体回归线(方程)(依据(依据全体的全部观测资料建立起来,是总体回归模型全体的全部观测资料建立起来,是总体回归模型的条件数学期望,代表了总体变量间的依存规律)的条件数学期望,代表了总体变量间的依存规律) 在给定解释变量在给定解释变量X Xi i条件下被解释变量条件下被解释变量Y Yi i的期望的期望轨迹称为轨迹称为总体回归线总体回归线(population regression population regression lineline),或更一般地称为),或更一般地称为总体回归曲线总体回归曲线(population
40、 regression curvepopulation regression curve)。)。Page 58条件均值条件均值 80 140 220 XE(Y|Xi)Y14910165图图3.8 3.8 总体回归方程总体回归方程Page 59总体样本样本样本 在回归分析实践中,由于要在回归分析实践中,由于要获得总体的全部观测资料往往不获得总体的全部观测资料往往不可能,可能,现实的情况只能是在一次现实的情况只能是在一次观测中得到总体的一个样本。观测中得到总体的一个样本。 所以一般是根据样本数据建所以一般是根据样本数据建立样本回归模型和样本回归方程,立样本回归模型和样本回归方程,用它们作为总体回归
41、模型和总体用它们作为总体回归模型和总体回归方程的估计式并以此描述总回归方程的估计式并以此描述总体变量间的依存规律和实际关系。体变量间的依存规律和实际关系。Page 60问题:问题:能从一次抽样中获得总体的近似的信息吗?如果可以,能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?如何从抽样中获得总体的近似信息?回答:回答:能能例:例:在总体中有如下一个样本。在总体中有如下一个样本。 问:问:能否从该样本估计总体回归函数?能否从该样本估计总体回归函数?Page 61该样本的该样本的散点图散点图(scatter diagram)scatter diagram): 样本散
42、点图近似于一条直线,画一条直线以尽好地拟样本散点图近似于一条直线,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该线近似地代表总合该散点图,由于样本取自总体,可以该线近似地代表总体回归线。体回归线。Page 62的估计值。残差项,拟合误差,是的估计值或估计量;i101010,iiiieeXY3.3.样本回归模型样本回归模型(依据样本观测资料建立起来,(依据样本观测资料建立起来,代表了样本显示的变量关系代表了样本显示的变量关系) 估计量(估计量(EstimatorEstimator):):一个估计量又称统计量,一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的是指一个
43、规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。在应用中,由估计量算出的数值信息去估计总体参数。在应用中,由估计量算出的数值称为估计值。称为估计值。 Page 63 样本回归线(方程)样本回归线(方程)(依据样本观测资料建(依据样本观测资料建立起来,代表了样本显示的变量依存规律)立起来,代表了样本显示的变量依存规律)的估计值或拟合值。样本观测值i10YiiiYXY4.4.Page 64 X Xi i X X Y ei uiE(Y|XE(Y|Xi i) )Yi )X|E(Y 10iiXi i 10iiXY图图3.9 3.9 总体回归方程和样本回归方程总体回归方程和样本回归方程Page
44、 65二、普通最小二乘法二、普通最小二乘法(OLS(OLS-Ordinary Least Squares-Ordinary Least Squares) )1.1.目标函数目标函数 ( (X Xn n , , Y Yn n) ) ( (X X1 1 , , Y Y1 1) ) ( (X X2 2 , , Y Y2 2) ) ( (X Xi i , , Y Yi i) ) iiiYYeXY10Y X iiiYYe图图3.10 3.10 最小二乘法原理图最小二乘法原理图Page 66 给定一组样本观测值(给定一组样本观测值(X Xi i, Y, Yi i)()(i=1,2,i=1,2,n n)要求
45、样本回归线尽可能好地拟合这组值。要求样本回归线尽可能好地拟合这组值。iiieYYmin)(min) 1 (缺点:缺点:ei可能正负抵消。Page 67缺点:缺点:难以处理和计算。iiieYYminmin)2(22min)(min)3(iiieYYPage 682.2.最小二乘法最小二乘法则则 普通最小二乘法普通最小二乘法(Ordinary least squares, OLS)给出的判断标准是:)给出的判断标准是:残差平方和最小。残差平方和最小。估计出的参数估计出的参数10和使残差的平方和最小。使残差的平方和最小。2102210)()(min:,iiiiiXYYYe要求和即寻找Page 693
46、.OLS3.OLS参数估计参数估计210210)(),(iiiXYeQ最小:,时,于的一阶偏导,偏导数等,对上式求)Q(010100),(0),(110010QQiiiiiiiiiXXYXYQXYXYQ)(2)(),()(2)(),(101210110100210010Page 700)(0)(1010iiiiiXXYXY所以:所以:即:即:iiiiiiYXXXYXn21010上述方程组称为上述方程组称为正规方程组正规方程组(normal equationsnormal equations)。)。 )()(21Page 71XYXYnYYyXXxxyx)X(X)Y(Y)X(X)X(XnYXYX
47、niiiiiiiiiiiiiiiiii11012222110)(1 YXYX代入正规方程组得:将的离差。用小写字母表示对均值。;定义离差:的样本均值和是和其中的估计值:和解上述正规方程组得到Page 72iiXY10样本回归线(方程):样本回归线(方程):0 截距项截距项 :当解释变量为零时,被解释变量的取值;当解释变量为零时,被解释变量的取值;11 斜率项斜率项 :当解释变量每变动一个单位时,被解释变量平:当解释变量每变动一个单位时,被解释变量平均变动均变动 个单位。个单位。Page 73例例3.8:设设Y和和X的的5期观测值如下表所示,试估计模型:期观测值如下表所示,试估计模型:Yi =
48、0 0 + 1 1Xi + ui 序号序号12345Yi1418232530Xi 1020304050解:解:采用列表法计算。计算过程如下:采用列表法计算。计算过程如下: 法法1 1:序号序号Yiii ii2114101401002182036040032330690900425401000160053050150025001101503690550039. 01505500511015036905)(2221 iiiiiiXXnYXYXn3 .10)15039. 0110(51)(110iiXYn所以估计方程为:所以估计方程为:iiXY39.03.10Page 75序号序号YiXiyi= Y
49、i -xi=Xi-xiyixi211410-8-2016040021820-4-1040100323301000425403103010053050820160400110150003901000Y YX X225110,305150nYYnXXii3 .103039. 022,39. 010003901021XYxyxiii法法2 2:Page 76三、样本回归线的性质(几个常用结果三、样本回归线的性质(几个常用结果) 000)(Q(1) 00e 1100iiiiiieeXYe因此,由正规方程式证明:即:的均值等于残差:性质Page 770X0X)(Q(2) 0XeX :2ii101iiii
50、iiieXYe因此,由正规方程式证明:证明:即不相关与解释变量残差性质注:注:CovCov( (e ei i,X,Xi i)=)=EEe ei i-E(e-E(ei i) )X Xi i-E(X-E(Xi i) )=E=Ee ei iX Xi i- e- ei iE(XE(Xi i) )=E(=E(e ei iX Xi i) )Page 78 ( :1 3111110YYY)X-XYY)X-XY X)X-Y( XYYYiiiiii两边取均值得:两边求和:法证明:即:值值等于其估计值的平均被解释变量的样本平均:性质Page 79 00 :2YYYYYYYYeeiiiiiiii两边取均值得:)(即
51、:法Page 80iiiiieXeYY10平均数相等平均数相等YY 残差和为零残差和为零00eei或自变量与残差不相关自变量与残差不相关0),(iieXCOV样本回归线的性质总结样本回归线的性质总结Page 81四、截距为零的一元线性回归模型的参数估计四、截距为零的一元线性回归模型的参数估计v当当u ui i满足假定条件时,估计量满足假定条件时,估计量的的OLSOLS表达式为:表达式为:iiiiiiiiiiXYeXYXYEXY)(样本回归方程:样本回归模型:总体回归方程:总体回归模型:2iiiXYX试证明试证明第三节第三节 最小二乘最小二乘估计量的统计性质估计量的统计性质Page 83 当模型
52、参数估计出后,需考虑参数估计值的精度,当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。量的统计性质。 一个用于考察总体的估计量,可从如下几个方面考一个用于考察总体的估计量,可从如下几个方面考察其优劣性:察其优劣性: (1 1)线性性)线性性:即它是否是另一随机变量的线性函数;:即它是否是另一随机变量的线性函数; (2 2)无偏性)无偏性:即它的均值或期望值是否等于总体的:即它的均值或期望值是否等于总体的真实值;真实值; (3 3)有效性)有效性:即它是否在所有线性无偏估计量中具:即它是否在
53、所有线性无偏估计量中具有最小方差。有最小方差。Page 84iiiininiYYKYW), 2 , 1(KWY,), 2 , 1(,i1i0ii1010;,使得:和即存在不全为零的的线性组合。可以表示为的线性函数,即均是一、线性性一、线性性含义:含义:证明:证明:) (XK)0)( . 11iii1i222222221estimatorLinearYKxxYiKxxXnXnXnXXXxYxxxxYYxxxYxxYxxYYxxyxiiiiiiiiiiiiiiiiiiiiiiiiiii性估计量的一个线性函数,是线是不全为零。不全为零,亦即离差,所以的样本值与其平均值的为,则令)(Page 8501
54、012. 11()11iiiiiiiiiiiiYXYK Y XnYK XYK X YnnK XnWiK XnW Y不 全 为 零 。令证明:证明:Page 86二、无偏性二、无偏性含义:含义:1111221212210101)()()()0( .1 iiiiiiiiiiiiiiiiiiiiiiiiiiiiuEK)E(uKuKxxXxuKxXxxxxxxKuKXKKuXKYK)(11001010)(,)(EE。即:,体回归系数的值的数学期望分别等于总,估计量证明:证明:Page 870000010100)()01)1(11)1( .2 iiiiiiiiiiiiiiiiiiiiiiiiuEW)E(
55、uWXXXKXXnXXKnXWKXnXKnWuWXWWuXWYW)(iiiiuWuK0011证明:证明:综上分析综上分析:样本回归系数又可以表示为随样本回归系数又可以表示为随机误差项的线性组合。机误差项的线性组合。Page 88v 因为同时具有线性性和无偏性,因此,因为同时具有线性性和无偏性,因此,OLSOLS是线性无偏估计量,不过证明是线性无偏估计量,不过证明OLSOLS估计量是线估计量是线性无偏估计量并没有排除还有其它的线性无偏性无偏估计量并没有排除还有其它的线性无偏估计量。因此,要证明估计量。因此,要证明OLSOLS的优越性和价值,的优越性和价值,还需要进一步说明最小二乘估计量的其它重要
56、还需要进一步说明最小二乘估计量的其它重要性质。性质。Page 89三、最小方差性(有效性三、最小方差性(有效性)含义:含义:最小二乘估计量在最小二乘估计量在所有线性无偏估计中,具所有线性无偏估计中,具有最小方差。有最小方差。Page 90最小二乘估计量的方差:最小二乘估计量的方差:221)var(iux2222111101)var()var()var( iuiiiiiiiiiiiixuxxuKuKuXKYK证明:证明:2220)var(iiuxnX)2)( 1)21(21)var(1)var(1)1( 22222222222222222222222222020000XnXXnXXXXXxxnX
57、xXnxxXxnxXnxXxxnXxnuxXxnuxXxnuXKnuWiiiiiiiuiuiiiiuiiiiuiiiiiiiiii通分后(最小方差性的证明略)(最小方差性的证明略)证明:证明:全部估计量全部估计量BLUEBLUE估计量估计量线性无偏估计量线性无偏估计量线性估计量线性估计量n由于由于OLSOLS估计量具有线性性、无偏性和最小方差性,因此估计量具有线性性、无偏性和最小方差性,因此被称为最优线性无偏估计量(被称为最优线性无偏估计量(The Best Linear Unbiased The Best Linear Unbiased EstimatorEstimator),简称),简称B
58、LUEBLUE性质。性质。图图3.11 BLUE3.11 BLUE估计量的图形表示估计量的图形表示Page 93四、四、OLSOLS参数估计值的分布参数估计值的分布) ,()var(,.2) ,()var(,.1) ,0( 222002220002211221112iiuiiuiuiuuixnXNxnX)E(xNx)E(Nu即,如果古典假设如果古典假设5 5成立成立: :第四节第四节 拟合优度检验拟合优度检验Page 95一、拟合优度的概念一、拟合优度的概念 问题:问题:采用采用OLSOLS方法,已经保证了模型最好地拟方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?合了样本
59、观测值,为什么还要检验拟合程度?拟合优度拟合优度(Goodness of fit) :样本回归直线与样本回归直线与样本观测值之间的拟合程度。样本观测值之间的拟合程度。Page 96 用最小二乘法得到的回归直线用最小二乘法得到的回归直线 至少从残差平方和为最小这一意义上来说是至少从残差平方和为最小这一意义上来说是所有可所有可能直线中最佳的拟合线能直线中最佳的拟合线。它是对。它是对Y Y和和X X之间关系的一之间关系的一种描述,但该直线是不是种描述,但该直线是不是Y Y和和X X之间关系的一种恰当之间关系的一种恰当的描述呢?如果各观测点紧密地聚集在这条直线的的描述呢?如果各观测点紧密地聚集在这条直
60、线的周围,则表明该直线对周围,则表明该直线对Y Y和和X X之间关系的描述是好的;之间关系的描述是好的;否则,用直线来描述这两个变量之间的关系就未必否则,用直线来描述这两个变量之间的关系就未必恰当。恰当。ttXYPage 97 (a)恰当描述)恰当描述 (b)不恰当描述)不恰当描述图图3.12 3.12 拟合优度的概念拟合优度的概念Page 98 应该指出,对于任意两个变量的一组观测应该指出,对于任意两个变量的一组观测值,我们总是可以运用最小二乘法得到一条直值,我们总是可以运用最小二乘法得到一条直线,问题是该直线能否较好地拟合所给定的观线,问题是该直线能否较好地拟合所给定的观测值,这就是拟合优
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 实验室支出管理办法规定
- 商品混凝土车辆管理办法
- 医院后勤管理制度
- 医院医生岗前培训心得范文(19篇)
- 2025全面合同指南汇编
- 2025年上海市物业管理委托代理合同
- 2025餐厅租赁合同模板
- 医用Ⅲ类射线装置理论考核试题及答案
- 2025手游区域代理合同
- 深度神经网络在目标跟踪中的性能提升
- 生物必修1教师用书
- 工程合同平移协议
- 园艺植物育种学知到课后答案智慧树章节测试答案2025年春浙江大学
- 《电力机车制动系统检修与维护》课件 项目二任务四检修中继阀
- GB/T 15683-2025粮油检验大米直链淀粉含量的测定
- 2025吉林省安全员C证考试(专职安全员)题库及答案
- 电钻清洗消毒流程
- 装修贷款申请书
- 造林安全文明施工方案
- 员工作风培训
- 施工现场防扬尘、防噪音、防光污染措施
评论
0/150
提交评论