计量经济学第八章虚拟变量回归_第1页
计量经济学第八章虚拟变量回归_第2页
计量经济学第八章虚拟变量回归_第3页
计量经济学第八章虚拟变量回归_第4页
计量经济学第八章虚拟变量回归_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量经济学第八章虚拟变量回归计量经济学第八章-虚拟变量回归 引子引子: 对在校生的对在校生的消费行为消费行为进行调查进行调查, ,发现在校生的消费行为呈发现在校生的消费行为呈现现多元化的结构多元化的结构。人际交往消费、手机类消费、衣着类消费、。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。为了了解男、女生而食品类消费、学习用品类消费不突显。为了了解男、女生在在消费支出结构上消费支出结构上的差异,应当如何建立模型?的差异,应当如何建立模型? 面临的问题:面临的问题:

2、如何把性别(男、女生)这样的非数量变量引入如何把性别(男、女生)这样的非数量变量引入方程?方程? 问题的一般性描述问题的一般性描述 前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性)。前面讨论的回归模型中,所遇的变量均为定量变量(可直接测度、数值性)。 例如:例如:GDPGDP,工资,收入、受教育年数,销售额等,工资,收入、受教育年数,销售额等. . 在实际建模时,一些定性变量具有不可忽视的重要影响。在实际建模时,一些定性变量具有不可忽视的重要影响。 例如:研究某个企业的销售水平,产业属性(制造业、零售业)、所例如:研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私

3、营、非私营)、地理位置(东、中、西部)、管理者的素质、不有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。性描述的。 面临的面临的问题:在同时考虑定量和定性因素的条件下,依据现有的回归分析知问题:在同时考虑定量和定性因素的条件下,依据现有的回归分析知识,如何对非定量因素进行回归分析?识,如何对非定量因素进行回归分析? 一、基本概念一、基本概念 1 1、定量因素、定性因素定量因素、定性因素 定量因素:可直接测度、数值性的因素。定量因素:可直接测度

4、、数值性的因素。 定性(属性)因素定性(属性)因素:表示某种属性存在与否的非数值性因素:表示某种属性存在与否的非数值性因素. 2 2、虚拟变量的定义、虚拟变量的定义 虚拟变量:取值为虚拟变量:取值为0、1的人工(特殊)变量的人工(特殊)变量 。 注:虚拟变量的同位语有:哑元变量、定性变量等等。通常用字母注:虚拟变量的同位语有:哑元变量、定性变量等等。通常用字母 D 或或DUM加以表示(英文中虚拟或者哑元加以表示(英文中虚拟或者哑元Dummy的缩写)。的缩写)。 第一节第一节 虚拟变量虚拟变量 问题:直接在回归模型中加入定性因素存在诸多的困难,能否采用问题:直接在回归模型中加入定性因素存在诸多的

5、困难,能否采用“虚拟变量虚拟变量”对定性变量进行量化,以达到定性因素能与定量因素有着相对定性变量进行量化,以达到定性因素能与定量因素有着相同作用之目的?同作用之目的? 虚拟变量的设置规则是在回答虚拟变量的设置规则是在回答“如何如何”问题。其规则涉及到以问题。其规则涉及到以下的三个方面下的三个方面: : 1 1、“0”0”和和“1”1”的选取原则的选取原则; ; 2 2、属性、属性(状态、水平)(状态、水平)因素与设置虚拟变量数量的关系因素与设置虚拟变量数量的关系; ; 3 3、虚拟变量在回归分析中的角色及作用等方面的问题、虚拟变量在回归分析中的角色及作用等方面的问题. . 具体说明如下:具体说

6、明如下:二、虚拟变量的设置规则(原则)二、虚拟变量的设置规则(原则) 1 1、虚拟变量的、虚拟变量的“0”0”和和“1”1”选取原则选取原则 取取“0”或或“1”应从分析问题的目的出发予以界定。应从分析问题的目的出发予以界定。 “0”0”代表基期(比较的基础,参照物)代表基期(比较的基础,参照物) “1”1”代表报告期(被比较的效应)。代表报告期(被比较的效应)。 例如,比较收入时欲考察例如,比较收入时欲考察性别(定性变量)的作用(性别(定性变量)的作用(差异)差异). . 当研究男性收入是否高于女性时,当研究男性收入是否高于女性时,是将女性作为比较的基础(参照是将女性作为比较的基础(参照物)

7、,故设物),故设男性为男性为“1”1”,女性为,女性为“0”0”。 定性因素的属性既可能为两种状态,也可能为多种状态。定性因素的属性既可能为两种状态,也可能为多种状态。 例如,性别(男、女两种)、季节(例如,性别(男、女两种)、季节(4 4种状态),地理位置(东、种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等中、西部),行业归属,所有制,收入的分组等。 2 2、属性因素属性因素(状态、水平)(状态、水平)与虚拟变量数量的关系与虚拟变量数量的关系 定性因素定性因素D如何选取?其设置规则为:如何选取?其设置规则为: 1)定性因素有)定性因素有m (m=2,3,4,)个相互排斥类

8、型(或特征、水平)个相互排斥类型(或特征、水平) ,当回,当回归模型有截距项时,模型中只能引入(归模型有截距项时,模型中只能引入( m-1)个虚拟变量,否则会陷入)个虚拟变量,否则会陷入“虚虚拟变量陷阱拟变量陷阱”(产生完全共线)。(产生完全共线)。(为什么?)(为什么?) 2)回归模型无截距项时,则引入)回归模型无截距项时,则引入m个虚拟变量。个虚拟变量。 注:注:“虚拟变量陷阱虚拟变量陷阱”的实质:完全多重共线性。的实质:完全多重共线性。 例(例(一个陷入一个陷入“虚拟变量陷阱虚拟变量陷阱”实例)研究实例)研究居民住房消费支出居民住房消费支出Y Yi i 、居、居民可支配收入民可支配收入X

9、 Xi i之间的数量关系,回归模型设定之间的数量关系,回归模型设定为:为:现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异,如何办? 为了对为了对 “城镇居民城镇居民”、“农村居民农村居民”进行区分,分析各自在住房消费支进行区分,分析各自在住房消费支出出 Y Yi i 上的差异,设上的差异,设 只设定一个虚拟变量原因:模型有截距,只设定一个虚拟变量原因:模型有截距,“居民属性居民属性”定性变量只定性变量只有两个相互排斥的属性状态(有两个相互排斥的属性状态(m=2),故只设定一个虚拟变量。),故只设定一个虚拟变量。则模型为则模型为 若在量化只有两个相互排斥属

10、性的若在量化只有两个相互排斥属性的“居民属性居民属性”定性变量时,引入定性变量时,引入 m=2 个虚拟变量。个虚拟变量。模型为模型为 任一家庭都有:任一家庭都有:D1+D2=1,即,即 D1+D2-1=0(完全共线),就(完全共线),就陷入了陷入了“虚拟变量陷阱虚拟变量陷阱”,产生完全共线。,产生完全共线。城镇城镇农村农村 第二节第二节 虚拟解释变量的回归虚拟解释变量的回归 在计量经济学中,通常引入虚拟变量的方式分为:加法方式和乘法在计量经济学中,通常引入虚拟变量的方式分为:加法方式和乘法方式两种:即方式两种:即实质实质: : 加法方式引入虚拟变量改变的是截距;加法方式引入虚拟变量改变的是截距

11、; 乘法方式引入虚拟变量改变的是斜率。乘法方式引入虚拟变量改变的是斜率。 虚拟变量模型:含有虚拟变量的模型称为虚拟变量模型。虚拟变量模型:含有虚拟变量的模型称为虚拟变量模型。 以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。性和引入虚拟变量的个数。 分为四种情形讨论:分为四种情形讨论: (1 1)解释变量只有一个定性变量而无定量变量,而且定性变量)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;为两种相互排斥的属性; (2 2)解释变量分别为一个定性变量(两种属性)和一个定量解)解释变量

12、分别为一个定性变量(两种属性)和一个定量解释变量;释变量; (3 3)解释变量分别为一个定性变量(两种以上属性)和一个定)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;量解释变量; (4 4)解释变量分别为两个定性变量(各自分别是两种属性)和)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量。一个定量解释变量。一、加法类型一、加法类型 1、一个两种属性定性解释变量而无定量变量的情形一个两种属性定性解释变量而无定量变量的情形 2 2、一个定性解释变量(两种属性)和一个定量解释变量的情、一个定性解释变量(两种属性)和一个定量解释变量的情形形XY共同的共同的特征:截

13、距发生改变特征:截距发生改变 3 3、一个定性解释变量(两种以上属性)和一个定量解释变量的、一个定性解释变量(两种以上属性)和一个定量解释变量的情形情形 4 4、两个定性解释变量(均为两种属性)和一个定量解释、两个定性解释变量(均为两种属性)和一个定量解释变量的情形变量的情形XYD1=0,D2=0D1=1,D2=0D1=1,D2=0D1=1,D2=1加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式: :基本分析方法基本分析方法: : 条件期望。条件期望。 运用用OLSOLS得到回归结果,再用得到回归结果,再用t-t-检验讨论因素是否对模型有影响检验讨论因素是否对模型有影响. .

14、 基本思想基本思想: : 以乘法方式引入虚拟变量时,是在所设立的模型以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟解释变量与其它解释变量(中,将虚拟解释变量与其它解释变量(X Xi i 或为或为D Di i)的乘积,作为新)的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的(以下仅讨论虚拟解释变量的(以下仅讨论虚拟解释变量D Di i与与X Xi i乘积作为新变量的情况)。乘积作为新变量的情况)。二、乘法类型二、乘法类型 目的:调整设定模型的斜率系数。目的:调整设定模型的斜率系数。乘法引入方式可分为两种情形讨论

15、乘法引入方式可分为两种情形讨论 (1 1)截距不变;)截距不变; (2 2)截距和斜率均发生变化;)截距和斜率均发生变化;分析手段:仍然是条件期望。分析手段:仍然是条件期望。(1 1)截距不变的情形)截距不变的情形模型形式:模型形式: 例:研究消费支出例:研究消费支出Y Y 受到收入受到收入X X、年份状况、年份状况D D 的影响。的影响。 (2 2)截距和斜率均发生变化)截距和斜率均发生变化模型形式:模型形式: 例:研究消费支出例:研究消费支出Y Y 、收入收入X X、年份状况、年份状况D D 间的影响关系。间的影响关系。比较:发生了那些变化?比较:发生了那些变化?例:改革开放前、后(平均)

16、例:改革开放前、后(平均)“储蓄储蓄收入收入”模型:模型: 加法方式引入加法方式引入D:为了区别改革开放前、后储蓄起点的情况(即两:为了区别改革开放前、后储蓄起点的情况(即两 模模型的截距变化)型的截距变化) 乘法方式引入乘法方式引入D:为了区别改革开放前、后:为了区别改革开放前、后“储蓄储蓄“关于关于”收入收入”的相对的相对变化情况(即两模型的斜率系数变化)变化情况(即两模型的斜率系数变化)三、虚拟解释变量综合应用三、虚拟解释变量综合应用 所谓综合应用是指将引入虚拟解释变量的加法方式、所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。乘法方式进行综合使用。 可以讨论:可以讨

17、论: 结构变化分析(结构变化分析( 关于两个回归模型的比较关于两个回归模型的比较);); 因素间的因素间的交互效应分析;交互效应分析; 分段回归分析分段回归分析以下仅对以下仅对结构变化分析、分段回归分析结构变化分析、分段回归分析进行讨论:进行讨论:1、结构变化分析(回归模型的比较)、结构变化分析(回归模型的比较) 通过对模型的参数检验,可以检验模型是否有不同的结构。即通过对模型的参数检验,可以检验模型是否有不同的结构。即定性变量定性变量D的引入,是否影响不同类型(属性)模型的的引入,是否影响不同类型(属性)模型的 1)平均水平(截距项)?)平均水平(截距项)? 2)相对变化(斜率系数)?)相对

18、变化(斜率系数)? 3 3)平均水平(截距项)和相对变化(斜率系数)?)平均水平(截距项)和相对变化(斜率系数)? 其中: Yi为第 i 个家庭的消费水平; Xi为第 i 个家庭的收入水平。则D=1:则D=0: 例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上例如:城镇居民家庭与农村居民家庭的消费函数不仅在截距上有差异,边际消费倾向可能也会有所不同。模型可以记为有差异,边际消费倾向可能也会有所不同。模型可以记为 1 1)城镇、农村居民家庭的消费行为完全一样(截距和斜率系城镇、农村居民家庭的消费行为完全一样(截距和斜率系数相等)数相等) 2 2)城镇、农村居民家庭的消费函数是截距变动模型(

19、截距城镇、农村居民家庭的消费函数是截距变动模型(截距不相等)不相等) 3 3)城镇、农村居民家庭的消费函数是斜率变动模型(斜城镇、农村居民家庭的消费函数是斜率变动模型(斜率系数不相等)率系数不相等) 4)城镇、农村居民家庭的消费函数是截距和斜率变动模型(截)城镇、农村居民家庭的消费函数是截距和斜率变动模型(截距、斜率不等)距、斜率不等) 通过对上述两个模型的截距、斜率系数检验通过对上述两个模型的截距、斜率系数检验(比较),(比较),可以判可以判断我们讨论的模型属于以下何种类型:断我们讨论的模型属于以下何种类型:一般:一般:分别回归,有以下四种情况:分别回归,有以下四种情况:不同截距、斜率的组合

20、图形不同截距、斜率的组合图形重合回归:截距斜率均相同重合回归:截距斜率均相同平行回归:截距不同斜率相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同共点回归:截距相同斜率不同 交叉(不同)回归:截距斜率均不同交叉(不同)回归:截距斜率均不同 3、分段回归分析(提高模型的描述精度)、分段回归分析(提高模型的描述精度)虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是虚拟变量也可以用来代表数量因素的不同阶段。分段线性回归就是类似情形中常见的一种。类似情形中常见的一种。 例例: 设设Y表示奖金、表示奖金、X表示销售额。当销售额低于表示销售额。当销售额低于X*时,奖金与时,奖金与销售额呈

21、某种线性关系;当销售额高于销售额呈某种线性关系;当销售额高于X*时,奖金与销售额呈更加时,奖金与销售额呈更加陡峭的线性关系。如图:陡峭的线性关系。如图:.X* X Y 例例1:中国城镇居民家庭的储蓄函数:中国城镇居民家庭的储蓄函数 根据我国城镇居民家庭1955202X年人均收入 和人均储蓄 的数据资料(以1955年的物价水平为100),建立储蓄模型:第四节第四节 案例分析案例分析用最小二乘法得估计结果为:用最小二乘法得估计结果为: 模型隐含着一个重要假定,我国城镇居民家庭的储蓄行为在1955年至202X年期间是不变的。 假定未必能够成立,因为与居民储蓄有关的许多重要因素在1979年以后发生了明

22、显变化,主要表现为: 1)在经济体制改革之前,我国居民的收入一直在低水平上徘徊,大多在经济体制改革之前,我国居民的收入一直在低水平上徘徊,大多数居民家庭的收入仅能维持温饱,因而平均储蓄倾向很低,积蓄很少;数居民家庭的收入仅能维持温饱,因而平均储蓄倾向很低,积蓄很少; 1979年后,我国居民的收入水平迅速提高,与此同时,居民储蓄也年后,我国居民的收入水平迅速提高,与此同时,居民储蓄也在大幅增长在大幅增长(由此看来前、后两时期,居民的储蓄行为有显著差异);(由此看来前、后两时期,居民的储蓄行为有显著差异); 2)在改革开放前的大多数年份,我国的消费品市场存在严重短缺的在改革开放前的大多数年份,我国的消费品市场存在严重短缺的现象。消费者既使有钱也难以买到所需的商品,而不得不把钱暂时存起现象。消费者既使有钱也难以买到所需的商品,而不得不把钱暂时存起来。因此

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论