第五章解释变量包含虚拟变量的回归模型课件_第1页
第五章解释变量包含虚拟变量的回归模型课件_第2页
第五章解释变量包含虚拟变量的回归模型课件_第3页
第五章解释变量包含虚拟变量的回归模型课件_第4页
第五章解释变量包含虚拟变量的回归模型课件_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章解释变量包含虚拟变量的回归模型

一、虚拟变量的基本含义二、虚拟变量的引入三、虚拟变量的设置原则第五章解释变量包含虚拟变量的回归模型一1一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品2这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummyvariables),记为D。例如,反映文化程度的虚拟变量可取为:1,本科学历D=0,非本科学历这种“量化”通常是通过引入“虚拟变量”来完3

一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。一般地,在虚拟变量的设置中:4概念:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一个以性别为虚拟变量考察企业职工薪金的模型:其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。概念:同时含有一般解释变量与虚拟变量的模型5二、虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定E(i)=0,则

企业女职工的平均薪金为:1.加法方式二、虚拟变量的引入虚拟变量做为解释变量引入模6

企业男职工的平均薪金为:几何意义:假定2>0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。企业男职工的平均薪金为:几何意义:假7可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。02028

又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上。这时需要引入两个虚拟变量:又例:在横截面数据基础上,考虑个人保健支出对9模型可设定如下:

在E(i)=0的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:高中以下:模型可设定如下:在E(i)=0的初始假定下,10高中:大学及其以上:假定3>2,其几何意义:高中:大学及其以上:假定3>2,其几何意义11还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。

如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:还可将多个虚拟变量引入模型中以考察多种“定性”因素的12女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:132.乘法方式加法方式引入虚拟变量,考察:截距的不同。许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。2.乘法方式加法方式引入虚拟变量,考察:截距的不同。14例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。如,设消费模型可建立如下:例:根据消费理论,消费水平C主要取决于收入水平Y,但15这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。假定E(i)=0,上述模型所表示的函数可化为:

正常年份:

反常年份:这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察16

当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。例,考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。表中给出了中国1979~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。当截距与斜率发生变化时,则需要同时引入加法与乘法形式17第五章解释变量包含虚拟变量的回归模型课件18以Y为储蓄,X为收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n1

1990年后:Yi=1+2Xi+2ii=1,2…,n2

则有可能出现下述四种情况中的一种:(1)1=1,且2=2,即两个回归相同,称为重合回归(CoincidentRegressions);以Y为储蓄,X为收入,可令:1990年前:Yi=1+19(2)11,但2=2,即两个回归的差异仅在其截距,称为平行回归(ParallelRegressions);(3)1=1,但22,即两个回归的差异仅在其斜率,称为汇合回归(ConcurrentRegressions);(4)11,且22,即两个回归完全不同,称为相异回归(DissimilarRegressions)。(2)11,但2=2,即两个回归的差异仅在其20平行回归平行回归21汇合回归汇合回归22相异回归相异回归23可以运用邹氏结构变化的检验。这一问题也可通过引入乘法形式的虚拟变量来解决。将n1与n2次观察值合并,并用以估计以下回归:Di为引入的虚拟变量:可以运用邹氏结构变化的检验。这一问题也可通过24于是有:可分别表示1990年后期与前期的储蓄函数。

在统计检验中,如果3=0的假设被拒绝,则说明两个时期中储蓄函数的截距不同,如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。于是有:可分别表示1990年后期与前期的储蓄函数。25具体的回归结果为:(-6.11)(22.89)(4.33)(-2.55)由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为:1990年前:1990年后:=0.9836具体的回归结果为:(-6.11)26邹氏结构变化的检验和虚拟变量法的比较邹检验只是告诉我们结构是否已经变化,而不能告诉我们当有变化时候是因为只是斜率相异或只是截距相异,或两者均相异。但是虚拟变量法不仅告诉我们两个回归是否有差异,而且落实到差异的起因——由于截距或由于斜率或由于两者。我们只要做一个回归,因为其他的回归可以方便地由它导出。这个单一的回归可以用来做各种假设检验。由于合并而增加了自由度,参数估计的相对精度也有所改进。邹氏结构变化的检验和虚拟变量法的比较邹检验只是告诉我们结构是273.临界指标的虚拟变量的引入(分段回归)

在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。

3.临界指标的虚拟变量的引入(分段回归)在28则进口消费品的回归模型可建立如下:这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:则进口消费品的回归模型可建立如下:29OLS法得到该模型的回归方程为:则两时期进口消费品函数分别为:当t<t*=1979年,当tt*=1979年,OLS法得到该模型的回归方程为:则两时期进口消费品函30三、虚拟变量的设置原则虚拟变量的个数须按以下原则确定:

每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。

例已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:三、虚拟变量的设置原则虚拟变量的个数须按以下31则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量:则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量:32则冷饮销售模型变量为:其矩阵形式为:

如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:则冷饮销售模型变量为:其矩阵形式为:如果只取六个观33显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。

这就是所谓的“虚拟变量陷阱”,应避免。显然,(X,D)中的第1列可表示成后4列的线34复习本学期考试范围是前五章,就是绪论,一元回归,多元回归,非线性,虚拟变量。还要讲三章,但是不作考试要求。还有一次上机实践复习本学期考试范围是前五章,就是绪论,一元回归,35考试重点1.计量经济学由哪三个学科结合而成的独立学科?2.为什么要引入随机扰动项,随机扰动项产生的原因是什么?为什么我们总是假设随机扰动项服从正态分布?3.最小二乘法(OLS)的估计一(多)元线性回归模型的基本假设有哪些?如果满足这些经典假设OLS得到的估计量有什么优良性质?高斯-马尔可夫定理的内容是什么?考试重点1.计量经济学由哪三个学科结合而成的独立学科?364.计量经济学模型的检验有哪四种?5.一元回归中F值和t值的关系F=t26.t值和估计值、标准差的关系是什么?7.多元回归的偏回归系数的解释8.双对数模型的系数的解释,半对数模型的系数的解释。9.在给出显著性水平比如为0.05看P值能判断出t和F检验是否能够通过,以及给出t分布的临界值的情况下也能判断t检验是否通过。4.计量经济学模型的检验有哪四种?3710.得到回归的结果能看出哪个是判定系数,残差平方和(RSS)和随机干扰项的标准差以及赤池信息准则(AIC)和施瓦茨准则(SC)。以及判定系数的范围和趋于哪个值就较好,和AIC、SC是越大越好还是反之。其他的指标的意思能了解。11.在对随机误差项做正态性检验的时候,如果我们得到残差直方图和Jarque—Bera(雅克—贝拉)检验结果,能够根据给定的显著性水平判断是正态分布或者不是。12.学会课件中和实验课中的非线性模型变成线性的模型的方法。10.得到回归的结果能看出哪个是判定系数,残差平方和(RSS3813.参考虚拟变量那章的课件中的例子:怎么定义有n个类别用n-1个虚拟变量表示方法。以及一个包含虚拟变量的模型如何导出几个具体的而且去掉虚拟变量的模型的方法。14.第二次实验课的多重共线性和逐步回归以及为什么你能说有的模型做得不好?15.一元还是多元模型做得好,你该用什么指标去判断,这在多元回归的课件中以及第二次实验课有。13.参考虚拟变量那章的课件中的例子:怎么定义有n个类别用n39第五章解释变量包含虚拟变量的回归模型

一、虚拟变量的基本含义二、虚拟变量的引入三、虚拟变量的设置原则第五章解释变量包含虚拟变量的回归模型一40一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。一、虚拟变量的基本含义许多经济变量是可以定量度量的,如:商品41这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummyvariables),记为D。例如,反映文化程度的虚拟变量可取为:1,本科学历D=0,非本科学历这种“量化”通常是通过引入“虚拟变量”来完42

一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。一般地,在虚拟变量的设置中:43概念:同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一个以性别为虚拟变量考察企业职工薪金的模型:其中:Yi为企业职工的薪金,Xi为工龄,Di=1,若是男性,Di=0,若是女性。概念:同时含有一般解释变量与虚拟变量的模型44二、虚拟变量的引入虚拟变量做为解释变量引入模型有两种基本方式:加法方式和乘法方式。上述企业职工薪金模型中性别虚拟变量的引入采取了加法方式。在该模型中,如果仍假定E(i)=0,则

企业女职工的平均薪金为:1.加法方式二、虚拟变量的引入虚拟变量做为解释变量引入模45

企业男职工的平均薪金为:几何意义:假定2>0,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对工龄的变化率是一样的,但两者的平均薪金水平相差2。企业男职工的平均薪金为:几何意义:假46可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。020247

又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上。这时需要引入两个虚拟变量:又例:在横截面数据基础上,考虑个人保健支出对48模型可设定如下:

在E(i)=0的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:高中以下:模型可设定如下:在E(i)=0的初始假定下,49高中:大学及其以上:假定3>2,其几何意义:高中:大学及其以上:假定3>2,其几何意义50还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。

如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:还可将多个虚拟变量引入模型中以考察多种“定性”因素的51女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:522.乘法方式加法方式引入虚拟变量,考察:截距的不同。许多情况下:往往是斜率就有变化,或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟变量来测度。2.乘法方式加法方式引入虚拟变量,考察:截距的不同。53例:根据消费理论,消费水平C主要取决于收入水平Y,但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。如,设消费模型可建立如下:例:根据消费理论,消费水平C主要取决于收入水平Y,但54这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察消费倾向的变化。假定E(i)=0,上述模型所表示的函数可化为:

正常年份:

反常年份:这里,虚拟变量D以与X相乘的方式引入了模型中,从而可用来考察55

当截距与斜率发生变化时,则需要同时引入加法与乘法形式的虚拟变量。例,考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。表中给出了中国1979~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。当截距与斜率发生变化时,则需要同时引入加法与乘法形式56第五章解释变量包含虚拟变量的回归模型课件57以Y为储蓄,X为收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n1

1990年后:Yi=1+2Xi+2ii=1,2…,n2

则有可能出现下述四种情况中的一种:(1)1=1,且2=2,即两个回归相同,称为重合回归(CoincidentRegressions);以Y为储蓄,X为收入,可令:1990年前:Yi=1+58(2)11,但2=2,即两个回归的差异仅在其截距,称为平行回归(ParallelRegressions);(3)1=1,但22,即两个回归的差异仅在其斜率,称为汇合回归(ConcurrentRegressions);(4)11,且22,即两个回归完全不同,称为相异回归(DissimilarRegressions)。(2)11,但2=2,即两个回归的差异仅在其59平行回归平行回归60汇合回归汇合回归61相异回归相异回归62可以运用邹氏结构变化的检验。这一问题也可通过引入乘法形式的虚拟变量来解决。将n1与n2次观察值合并,并用以估计以下回归:Di为引入的虚拟变量:可以运用邹氏结构变化的检验。这一问题也可通过63于是有:可分别表示1990年后期与前期的储蓄函数。

在统计检验中,如果3=0的假设被拒绝,则说明两个时期中储蓄函数的截距不同,如果4=0的假设被拒绝,则说明两个时期中储蓄函数的斜率不同。于是有:可分别表示1990年后期与前期的储蓄函数。64具体的回归结果为:(-6.11)(22.89)(4.33)(-2.55)由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的,储蓄函数分别为:1990年前:1990年后:=0.9836具体的回归结果为:(-6.11)65邹氏结构变化的检验和虚拟变量法的比较邹检验只是告诉我们结构是否已经变化,而不能告诉我们当有变化时候是因为只是斜率相异或只是截距相异,或两者均相异。但是虚拟变量法不仅告诉我们两个回归是否有差异,而且落实到差异的起因——由于截距或由于斜率或由于两者。我们只要做一个回归,因为其他的回归可以方便地由它导出。这个单一的回归可以用来做各种假设检验。由于合并而增加了自由度,参数估计的相对精度也有所改进。邹氏结构变化的检验和虚拟变量法的比较邹检验只是告诉我们结构是663.临界指标的虚拟变量的引入(分段回归)

在经济发生转折时期,可通过建立临界指标的虚拟变量模型来反映。例如,进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。

3.临界指标的虚拟变量的引入(分段回归)在67则进口消费品的回归模型可建立如下:这时,可以t*=1979年为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:则进口消费品的回归模型可建立如下:68OLS法得到该模型的回归方程为:则两时期进口消费品函数分别为:当t<t*=1979年,当tt*=1979年,OLS法得到该模型的回归方程为:则两时期进口消费品函69三、虚拟变量的设置原则虚拟变量的个数须按以下原则确定:

每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。

例已知冷饮的销售量Y除受k种定量变量Xk的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:三、虚拟变量的设置原则虚拟变量的个数须按以下70则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量:则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量:71则冷饮销售模型变量为:其矩阵形式为:

如果只取六个观测值,其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论