(概率论与数理统计专业论文)基于面板数据的半参数估计与应用.pdf_第1页
(概率论与数理统计专业论文)基于面板数据的半参数估计与应用.pdf_第2页
(概率论与数理统计专业论文)基于面板数据的半参数估计与应用.pdf_第3页
(概率论与数理统计专业论文)基于面板数据的半参数估计与应用.pdf_第4页
(概率论与数理统计专业论文)基于面板数据的半参数估计与应用.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于面板数据的半参数估计与应用 专业:概率论与数理统计 硕士生:杨波 导师:余锦华教授 摘要 面板数据又称为平行数据、纵向数据,是用来描述一个总体中给定样本在一 段时间的情况,并对样本中每一个样本单位都进行多重观察。面板数据研究已成 为近十年来经济计量学的一个热点。作为经济计量学的另一个热点,半参数估计 近年来也得到了相当的关注,它被应用来弥补参数估计的前提条件难以达到,而 非参数估计又需要丢失大量有用信息韵情况。因而有着非常广阔的应用前景。本 文中,作者提出了一种基于虚拟变量的扩展局部回归法,这是一种简单而又实用 的方法,通过它,我们可以对面板数据进行半参数建模,由第四章的实例验证可 以看出,扩展局部回归法确实为我们提出了种针对面板数据进行半参数回归的 新思路。 关键词:面板数据半参数估计扩展局部回归法 s e m i p a 船m e t 订c e s i i m a t i o na n da p p h c a t i 衄 f o r p a n e ld a t a m a j o r :s c a l i s i i c s a n d p r o b a b i l i t y n a m e :y a n g b o s u p e r v i s o r :p r o f y u h u a a b s t r a c t p 柚e ld a i a ,a l s 0b ec a l l e dl o 岵n u d i n a ld a t a ,i su s c d1 0d c r 慨i h cg i v e n 髓m p l c s c 订c sj 1 iap e r i o do ft j m c a i mm a l 【e sm u h i p l eo b s c r v a l l o n s 向rc v c r yu n i li 鼢l p l e s n i s 删l r i p l eo b s c m t j o ni sn o io n l yj i l c l u d co b s c m 抽n 如ru h 科yc h 盯a c l e 瞻l i c so f u n 最毗o n m et 妇e ,b u la l s o 确湘d eac 0 毗汹柚o b s e w a t 硫f o r 岫 c h a r a d c r 担i i c so f t h cu 姐s a m p l c i nap e r i o d0 f l i 腓w p 删ld a l a j s l i s e d 脚撑 衄d 啪r ec o n i 讪a l l yj nc v e r y l d ,j n c l u d ee c o m i c s ,s o c j o l o g ) ra n d 0 ma 髓l y s i s f o rp a 雎ld a t ab e m e sah o lp o i d t 抽e c o 舯m c l l 。虹m f c 。c my 强瞳a sa l h e rh o t p o 锄,s c m i p m m e i r j cc s t j m a i i d nj sa 蛔g c l 蛐c q u i v a l e ta l i e n f 蛔n 扛u s e dt o f e 船d y as t a t e l i d 匝【h c c o n d 弛璐o f 肛锄吐m 嘲洫曲n 玳d t oc a t c ha n d n - p 啪眦峨e s i i m 曲n 舢吼d i 鼢r dm 姐y1 l s e f l l l 曲珊a i 妣s o ,s e m i p a 舢e t r i c e s i 姗a i i o nh 笛av c r yw i d 盯a p p b e d 如r c g r o l l n d i l h cd i s 辩r i m j o n ,跏t h o rg i v e s 鲫 甜g m c m e d 1 0 c a lr e 掣e s s i o n 脚嘶db a s e do nd u 础yv 盯j a b l e n e 呲t h o di ss i i n p l c 删u f i l lw ec a nm a l 【es e m i p 盯a m c i f j ce s l j l n a t i o n 如rp a m ld a l ab yn ,a n dt h m u g h l h ee 呷i r i c a lc x a n l p l e ,珧e 蠲yt 0 矗n dl h a la u g r n e n l e d1 0 c a lr e g r c s s i o nm e m o do 赶 u sa s 轴r e d l yan e wm e a 他t od 0s 咖i p 盯啪c c 血锚i j m a l j o n 向rp a n e ld a i a k e yw o r d s :p 柚e ld a t a ,s e m i p 锄眦l r i ce s l j i n a i 汹,a u g n l e m e dl 0 c a lr e g r e s s i o n m e l h o d 中山大学硕士学位论文基于面板数据的半参教估计与应用 第一章引言 统计是数据科学,统计学的发展,是根据数据的形式的改变而发展的【1 】。数 据是进行统计分析的基础所在,所谓统计分析也就是通过对样本数据使用适当的 统计方法进行分析整理以得出科学的结论与预测。可以看出数据对统计分析而言 是至关重要的。从m u n d l a k ( 1 9 6 1 ) 1 、b a l e s l f a 和n e r l o v e ( 1 9 6 6 ) 2 把p a n c l d a l a 引入到经济计量中开始,现今的统计分析主要处理的数据形式已经由单纯的时间 序列( 1 cs e r i e s ) 和截面( c r o 昭s e 血s ) 数据向能提供更丰富信息的面板数据 ( p a n c ld a t e ) 转变。 单独的时间序列或截面数据都分割了数据间的联系。而面板数据( 又叫平行 数据或纵向数据) 则把二者综合起来,同时利用了截面数据和时间序列。在2 0 世纪5 0 年代面板数据方法开始被用于解决经济问题,随着相关研究的逐渐深入 与增多,在近2 0 年以来,面板数据方法已经成为了计量经济学理论方法的重要 发展之一。它为估计技术的发展和理论结果提供了非常广阏的天地。相对通常的 时间序列模型和截面数据模型雨言。面板数据模型有着显著的优点:第一。解决 了样本容量太小而引起的问题,特别是研究分布滞后模型时,这种优点更加明显。 第二,缓解或消除了时间序列模型中多重共线性的影响。一方面由于样本容量的 扩大,可以使解释变量之间的多重共线性减弱,另一方面面板数据不仅可以反映 样本中同一个体随时间变化的规律性,同时还可以反映不同个体特征之间的差 异。从这个角度来说,多重共线性是可以避免的。第三,可以解决潜变量因素的 影响。在时间序列模型和截面数据模型中,由于种种原因,常常省略了某些不可 观测的解释变量,即所谓的潜变量。潜变量的省略不仅会使模型的精度降低,而 且影响了人们对潜变量在经济运行中的作用研究。这些特点使得面板数据的应用 越来越广泛,而且从更加实际韵角度来看,研究者已经能够利用面板数据来分析 一些不能够用时间序列或截面条件单独研究的问题。下面三例正是如此: 1 在一个被广泛引用的劳动力供给研究中,本一普拉斯观测到在某一特定的 1 m u 栅a k ,y ,陆州叫p r o d l l d i 嘟f 批o f m a n 噼m ib i 硒即伽删0 f f a 珊e c i 挑崦1 9 6 1 ,4 3 ,4 6 2 b a l c s 擅如e 娜dm i mp 幽gq 嘴棚i o na n d 啊m e s 盯醅n 出m 伽。融i m 硝叽o fad y n 删c e c o n 叫j c m o d d :髓ed c 删d h n 丑h i r 】“o a s 【j 】e 嘲o m c 雠q1 9 6 毛3 4 ,5 舾6 1 2 中山大学硕士学位论文 基于面板数据的半参数估计与应用 时闻点,一群妇女中的5 0 可能在工作,这一发现是意昧着这组妇女当中平均 有一半在工作还是意味着同样的这一半人在每一个时期都在工作呢? 这一点还 不太清楚。对于政策研究或任何统计结果的解释来说,这些有着非常不同的含义。 横截面数据本身是不会说明这一问题的。 2 ,在生产函数分析当中的一个长期悬而未决的问题是不能分离规模经济和技 术革新。横截面数据仅仅提供了前者的信息,而时间序列数据又把两者的影响混 杂在一起,没有希望分离。例如,通常假设规模收益不变以便揭示技术变化。当 然,这一假设脱离了问题。格林曾经在1 9 8 3 年应用面板数据研究分析了一大批 电力企业生产成本,从而很好地分离了技术变化与规模经济。 3 ,分析置前我国韵结褐性失业问题,它既受到各通区产业结构荫影响,也受 到国家在各个时期的宏观政策的影响。只利用截面数据,即选择同一时间上不同 省市的数据作为样本观测值,可以分析各省市不同的产业结构对结构性失业的影 响,但是不能分析国家的宏观政策对各省市结构性失业的影响:只利用时间序列 数据,即选择同一省市或全国在不同时间上的数据作为样本观测值,可以分析国 家的宏观政策对结构性失业的影响,但是不能分析不同的产业结构对结构性失业 的影响。如果采用面板数据,即在不同的时间上选择不同省市的数据作为样本观 测值,无疑既可以分析不同的产业结构对结构性失业的影响,也能分析国家宏观 政策对结构性失业的影响。 有了数据后接下来的工作就是建立统计模型了。a 们最常用的是参数模型, 这种模型要求形式是固定的,即解释变量和被解释变量之间的关系是明确的,通 过带入它们的观测值可以估计出模型参数的估计值。模型参数的估计是建立参数 模型的核心内容。在建立了理论模型并收集整理了复合模型要求的样本数据之 后,就可以选择适当的方法估计模型,缛到参数的估计量。模型参数的估计是一 个纯技术的过程,通过近一个世纪的研究,现在的参数估计方法已经有了非常成 熟的发展,最常用的有普通最小二乘法( o l s ) 、最大似然法( m l ) 等。参数模 型在现今有着非常广泛的应用。在很多领域,包括农业、水文、医疗卫生特别是 经济系统等中都发挥着积极的作用。由于参数模型形式确定,因而有很好的解释 和预测作用。这在2 0 世纪五六十年代西方国家的经济预测中不乏成功的实例。 虽然参数模型有着非常好的解释和预测作用,但是这必须得有一个前提作为 中山大学硕士学位论文 基于面板数据的半参数估计与应用 保证,这个前提就是要确保所建立的模型形式是正确的,它确实能正确地反应解 释变量和被解释变量之间的关系。为此在建立模型前我们必须得知道各个变量之 间的相互关系。在一般情况下,可以通过丈量的模型模拟来选择适当的模型形式, 不过在非常复杂的经济环境中,有些时候某些变量之问存在的关系是很难知道 的,如果仍然使用确定性的参数模型来模拟它,势必会存在模型的设定误差,因 而不能满足应用和研究的需要,更不用说其解释与预测作用了。因此人们开始寻 找别的出路,1 9 7 7 年s l o n e 发表了一篇著名的论文n s 砬e n ln o n p a r a i n c i f j c r e g 嗍s i o n 3 ,由此揭示非参数回归在理论和方法上都已取得了重要的进展。非参 数回归模型的特点是:回归函数的形式可以任意,没有任何约束,解释变量和被 解释变量的分布也很少限制,因而有较大的适应性。对比参数模型而言,非参数 模型往往有更好的拟合效果,对以往的经济现象的推断有更离的精度。 非参数模型理论方法的发展和单位根检验、协整理论以及以它们为基础的动 态计量经济学模型理论方法的发展是2 0 世纪7 0 年代以来计量经济学理论方法所 获得的最重要的发展之一。非参数回归模型假定经济变量的关系未知,要对整个 回归函数进行估计,因而非参数回归模型是较线性和非线性回归模型更符合现实 的模型。虽然非参数回归模型有许多的优点,不过它也有缺点,它有很好的拟合 效果,但是由于解释变量和被解释变量之间没有确定的关系,所以它的外推预测 能力相对参数回归模型要弱了许多。在实际应用上来说,它也尚有一定的局限性。 现实中,经济现象的影响因素不止一个,当解释变量的个数d 越来越大时,非参 数回归模型的核估计和局部线性估计的收敛速度( 内点处的收敛速度为 d o 叫“+ ”) ,假定回归函数二阶可微) 将越来越慢,而线性回归模型和非线性 回归模型的最小二乘估计和最大似然估计的收敛速度为。伽叫2 ) ,我们自然想到 能否在模型中加入参数部分以提高估计的收敛速度昵? 另外,假设影响y 的因素 ( 即解释变量) 可以分为两个部分,即z 和z 。根据经验或历史资料可以认为因 素x 是主要的,而且y 同x 是线性的;而2 则是某种干扰因素( 或者看作协变量) , 它同y 的关系是完全未知的,而且没有理由将其归入误差项。此时如果采用非参 数回归加以处理,则会失去太多的信息,如果采用线性回归,一般拟合情况很差, 3s i 咖ec j 咖s i s 艟m n 咖p 矗n m 曲证托g r e 鞠i 删p 】1 k 加i j s0 fs c a t i 醴i 峨1 9 7 7 u x5 9 5 捌 3 中山大学硕士学位论文 基于面扳敦据的半参数估计与应用 因此比较自然地,我们会想到采用两者的混合,这就提出了半参数回归模型的概 念。 半参数回归模型的方法融合了参数回归方法和较近发展起来的非参数方法, 但并非这两类方法的简单叠如。可以想象,在不少实际问题中,它可能是一个更 接近真实、更能充分利用数据中所提供的信息的方法。近年来,由于半参数回归 模型在微观经济领域的广泛应用,使得这类模型成为了菲参数计量经济学研究中 的一个热点。它有机地接合了两类回归模型方法,继承了它们各自的特点,使得 半参数回归模型既有较好的拟合效果,又克服了非参数回归模型难以外推的缺 点。 目前,在面板数据理论和应用研究中,主要有两个热点领域:一个是非线性 模型研究,另一个是动态线性模型单位根和协整的理论联系和应用研究。而在对 非线性模型的研究中,有部分学者对面板数据模型进行了半参数估计的尝试。l i 和s l e n g o s ( 1 9 9 6 ) 烈对半参线性面板数据模型进行了估计,并且证明当t 很小。 n 很大时,估计量是以n m 一致收敛。 壬s j a o 和l i ( 1 9 9 8 ) 1 4 】又对半参面板数据 模型给出了三个序列相关检验,第一个是l 阶序列相关检验,第二个是检验高阶 寄列相关。第三个是检验个体行为,这种模型允许滞后因交量作为解释变量,在 原假设为一个鞅差误差过程情况下,它们分别服从渐近正态或者卡方分布。对一 个带个体效应的二元响应的面板数据,k e ( 1 9 9 9 ) p 】利用半参估计方法进行估 计,这个估计具有n 帕一致收敛性。本文将采用局部回归估计方法对面扳数据 模型的半参数估计进行探讨,并将结果应用到实例中进行检验。 中山大学硕士学位论文 基于面板数据的半参数估计与应用 第二章背景知识 面板数据和半参数回归模型估计都是近3 0 年来计量经济学理论方法的重要 发展和研究热点,它们均具有很好的应用价值。因此本文将它们结合起来,在面 板数据的形式下探讨半参数回归模型的估计方法以及将此应用到具体实例中去 加以检验。在此之前,先将相关背景知识简介如下: 2 1 面板数据模型 单方程面板数据模型的一般形式为, y 口f + z 反+ n i ,f - 1 ,n ,z l ,r ( 2 。1 ,1 ) 其中南为1 x 芷向量,成为芷1 向量,茁为解释变量的数目。按照规范表示这里 的和反应该写成矩阵j 。和琶,而且有 戤- ,屯,)4 - 帆,如,儿) 。 但是为了简化书写,在本文中采用( 2 1 1 ) 的表示。误差项均值为零,方差 为以。 模型( 2 1 1 ) 常用的有如下三种情形: 情形1 :a i - a f ,只- 卢f 情形2 :a f a ”成- 卢i 情形3 :d l - 口,觑- 芦j 对于情形1 ,在横截面上无个体影响、无结构变化,用普通最小二乘估计可 以给出口,多豹一致有效估计。相当于将多个时期韵截面数据藏在一起作为样本数 据。对于情形2 ,称为变截距模型,在横截面上个体影响不同。个体影响表现为 模型中被忽略的反映个体差异的变量的影响,又分为固定影响和随机影响两种情 况。对于情形3 ,称为变系数模型,除了存在个体影响之外,在横截面上还存在 变化的经济结构,因而结构参数在不同横截面单位上是不同的。 由于面板数据模型可以构造和检验比以往单独用横截面数据或时间序列数 据更现实的行为方程模型,大大地丰富了计量经济学的经验研究。但是面板数据 包括两维的数据( 横截面和时间) ,如果模型设定不正确,将造成较大的偏差, 中山大学硕士学位论文基于面板数据的半参数估计与应用 估计结构和实际将相差甚远。所以,在建立面板数据模型时,必须控制不可观察 的个体和时间的特征,以避免模型设定的偏差并改进参数估计的有效性。 研究面板数据的第一步是检验刻划被解释变量y 的参数是否在所有横截面 样本点和时间上都是常数,即检验所研究的问题属于上述3 种情形中的哪一种, 以确定模型的形式。广泛使用的检验是协方差分析检验。主要检验两个假设: 假设l 斜率在不同的横截面样本点上和时间上都相同,但截距不同。 日1 :y t 口f + 芦+ ( 2 1 2 ) 假设2 截距和斜率在不同的横截面样本点和时间上都相同。 日2 :y 口一口+ 卢+ ( 2 1 3 ) 显然,如果接受了假设2 ,则没有必要进行第一步的检验。如果拒绝了假设2 , 就应该检验假设1 ,判断是否斜率都相等。如果假设1 被拒绝,就应该采用模型 ( 2 1 1 ) 。叶阿忠1 给出了下面定理以构造f 统计量来对上述假设进行检验: 定义各符号含义如下: 1 r 1 rr 记只。手荟 墨。亭善,。善瓴一暑) 一动 。弘枷n 。只) ,。黔+ 只) 2 定理2 1 ( 1 ) 5 1 以一z 2 l n ( r 一足一1 ) 】; ( 2 ) 在h :下,是正一z 2 加r 一僻+ 1 ) 】和$ ,一s 。) d :一z 2 泓一1 ) 僻+ 1 ) 】; ( 3 ) 慨一是) 蠢与墨z 独立。 由此可得到检验胃,的f 统计量 最等掣掣。f 【o 一孵+ 1 ) ,。口出1 ) 】 s l 伽r 一一噼+ 1 ) 】 “八,”弋圳 定理2 2 ( 1 ) 在h 。下,s :z z 2 如口一1 ) 一置1 和岱:一量) 西一z 2 如一1 ) k 1 : ( 2 ) p :一s ) 砰与s 。独立。 由此得到检验q 的f 统计量 和为 互。嬲。f 协一班,n 口* 1 ) 】 ,ti = - r n 一1 j ,“一、一1 j l 5 s l 他r n 僻+ 1 ) 】 “ 一 “ 第f 群的残差平方和是兄鼹,。一j :j ,模型( 2 1 1 ) 的残差平方 墨。善麟 记睨。善k 一,。善j ,4 善一,则模型2 工2 的残差平 方和为 s :- 一瞩皑 _rhf 记乙。善驴一砖前b 。荟善固珏 弓。善渺嘲2 ,其中歹嗜善善”i 。者善善则模型2 工3 的残差平方和为 墨乙一焉砭1 给定显著水平,查f 分布表得到临界值,与由计算得到的f 统计量数值进行 对比,即可得到拒绝或接受假设的结论。 变截距模型( 2 1 _ 2 ) 是应用最广泛的一种面板数据模型,此模型的一个常见 构造假定跨单位的差别可以由常数项的差剐来说明4 ,这样模型中的是一个待 估未知参数。这种情况称为固定影响模型。通过引入虚拟变量可以将它变为古典 回归模型,用0 l s 方法即可以估计出参数值。当横截面的单位是总体的所有单 位时,固定影响模型是一个合理的模型。如果横截面单位是随机地抽自一个大的 总体,该模型仅适用于抽到的横截面单位,而不是样本之外的其他单位。在这种 4 也可能允许斜率跨f 变动,但是这导致了某些新的方法问题和计算中的复杂性。康韦尔和施密特在1 9 8 4 年的一项研究中对此进行过仔细探讨 中山大学硕士学位论文 基于面板数据的半参数估计与应用 情况下,把总体中个体的差异认为服从随机分布可能更合适。于是模型( 2 1 2 ) 可以写成如下形式: y ni 肛+ 工i 芦j + a l + h n ( 2 1 4 ) 其中q 为模型中被忽略的反映个体差异变量的影响,假定它与干扰项“。一样是 随机变量。这种情况称之为随机影响模型。 假定口。与不相关a 进一步假定: e m ;) a e 0 。) - o ,q :) - 盯;,e ( 口? ) 一口:, e 口1 ) - o ,e 0 。”p ) 一o ( 1 - j ,f _ s ) ,e 扣f 口,) - 0 ( f _ j ) 令一+ 吒,则 e ( 以) 以+ ,e ( k ) - 程( r s ) , q i 似i w ;) i 口:j r + 口:韶 y - ( 眺一) m r , q 其中8 是元素全为l 的r 1 列向量。所以在给定屯下,y 。的方差为司t + 以, 称,盯:为方差成分有时也称模型( 2 1 4 ) 为方差成分( 或误差成分) 模型。 由假定可知与不相关,于是0 l s 将得到参数的无偏和一致估计,不过 由于o l s 虽然得到参数的一致估计,但标准误差被低估了,而且o l s 估计不如 可行的广义最小二乘估计有效,所以采用可行的广义最小二乘法( f g l s ) 可以 估计出模型的参数值。 当0 已知时,g 他e ( 1 9 9 8 ) 1 7 给出了参数估计形式; 占l 【善鼬柳1 【善妒y i 】 其中6 - ( 如,) ,把模型( 2 1 4 ) 改写成如下形式 y i j 一+ w i f - 扣,n _ :i f 。0 ,置) ,叫一,) 。 中山大学硕士学位论文 基于面板数据的半参数估计与应用 当q 未知时,需要先求出q 中未知量拜,盯:的无偏估计,然后再进行广义最 小二乘估计。m a d d a k ( 1 9 7 1 ) 5 详细证明了西,盯:的一个无偏估计量: 钟;鲨兰娑_ 鬻娑一孚。吒2 1 万i 五f 一”。i 瓦百一一了。 不管是固定影响模型还是随机影响模型都有其各自的优点,那么在具体问题 中,我们究竟如何来选择使用固定影响还是随机影响模型呢,h 拍s 蚴( 1 9 7 8 ) 删设 计了一种检验方法。它是基于这样的思想,在没有相关性的假设下,最小二乘虚 拟变量( l s d v ) 模型的0 l s 和g l s 都是一致的,但是o l s 是非有效的,而在 备选假设下,o l s 是一致的,而g l s 不是。所以,在原假设下,这两种估计不 应该有系统性的差别,一种检验可以基于这种差别。h 卸s 嫩n 的一个重要结论是: 一个有效估计量与它的非有效估计量之间的差别的协方差是零。为此,构造统计 量 i ,t 【6 一声弦1 【6 一声】 其中6 是l s d v 模型的估计结果,岔是假定模型为随机影响模型时采用f g l s 估 计的结果,金为璐d v 模型或者随机影响模型经过估计后得到的协方差矩阵。该 统计量服从自由度为t 的z 2 分布。 2 2 非参数估计 参数回归模型对回归函数提供了大量的信息且回归结果可以外延,因而当假 设模型成立时,其推断有较高的精度。但参数回归模型的一些假定在现实中未必 成立,例如c d 生产函数的如下假定在现实中就很难成立: ( 1 ) 技术进步是中性的; ( 2 ) 技术进步独立于要素投入量的变化; ( 3 ) 要素替代弹性为l ; ( 4 ) 生产函数具有一次齐次性,即不变规模报酬。 因而当模型参数的假定与实际背离( 也包括模型的随机干扰项的正态性假定与实 际背离) 时,就容易造成模型设定误差。此时,基于假设模型所作的推断其表现 5 m 柚d 山g ,“m 缸r i a n c 哪p 呻铀皓m 0 d e b 抽p 0 0 l i n g o 螂& d i 衄壮d 弛s 一镐 d 融a ”皿抛嘲m 妇,3 9 ,1 9 7 1 3 4 1 - 3 5 8 9 中山大学硕士学位论文 基于面板数据的半参数估计与应用 可能很差这就促使人们寻找别的出路,而非参数回归则是朝着这个方向的一种 努力。非参数回归模型的特点是:回归函数的形式可以任意,没有任何约束,解 释变量和被解释变量的分布也少限制,因而有较大的适应性,但非参数回归结果 外延困难。非参数技术的目的是放松回归函数形式的限制,为确定或建议回归函 数的参数表达式提供有用的工具,非参数技术并不能取代参数技术,两者相结合 将会得到用单一方法无法获得的结论。 非参数计量经济学模型的非参数估计方法主要有权函数方法( 核估计和k 近 邻估计) 和最小二乘法( 正交序列估计、样条估计和小波估计) 。n a d 盯a y a ( 1 9 6 4 ) 帮wa t s o 1 9 “) 提出了一种既适合解释变量是确定性变量,也适合解释变量是 随机变量的核估计。 核估计的核心问题就是核权函数的选择和窗宽的选择。窗宽的选择方法有交 错鉴定方法、惩罚函数法和插入法( 1 k p l u 分洫m c i l l o d ) ,常用的是插入法,即把 未知函数的估计插入到渐近公式里以选择晟佳窗宽。插入法的思想最初由w o o d m o 如( 1 9 7 在进行密度估计时引入,后由s o d ol l ,1 1 a pi a 和m m p n ( 1 9 7 7 ) 提出插入法选择窗宽的迭代计算步骤,s h e a 廿咐和j o s ( 1 9 9 1 ) ,g a s r ( 1 9 9 1 ) 改 进了这一方法。改进的插入法有好的理论分析性质与好的实际效果,并且被认为 比交错鉴定方法和惩罚函数法要好。核权函数在核估计中起光滑的作用,即消除 扰动的随杌因素,使所得曲线反浃交萋之闻的实际经济关系。常用的核权函数有 高斯( g a 嘲i a n ) 和e p 锄c h n 蜘v 核权函数。 非参数回归估计的正交序列估计和样条估计都需要估计出一系列的参数。为 了减少参数估计的个数,我们可采用局部线性回归估计,即对于给定的x ,认为m ( ) 在x 附近近似于线性的,对x 附近的那部允数据应用线性回归豹技术,而局 部邻域的太小由窗宽来控制。这样,局部线性回归估计只需估计两个参数,而不 是一系列参数。 局部线性回归方法从理论和实践上都是吸引人的。第一,传统回归方法将经 济变量局部上的变化差异掩盖了,因而无法反映经济现象的结构变化。传统回归 方法处理有结构变化的经济交置之间关系时常用的手法是;l 入虚拟变量,但虚拟 变量只能反映两个时期或若干已知时期经济现象的结构变化。而局部回归的结果 能够动态地反映经济现象的结构变化。第二,以往根据经济理论建立的线性或非 中山大学硕士学位论文 基于面板数据的半参数估计与应用 线性计量模型,隐含若干假设条件。而这些隐含条件对于具体问题不一定符合。 局部回归假定变量之间的关系未知,因而没有隐含任何假设条件,所以更加符合 实际。第三,其它普遍使用的核估计,如n a d a 瑚i y a _ w 咖n 估计导致不必要的偏 差,而g 硒s c r m u l l e r 估计在处理解释变量为随机性变量时有较大的方差。第四, 局部回归方法既适合于解释变量为确定性变量的固定设定模型,也适合于解释 变量为随机性变量的随机设定模型。第五,局部回归方法适合于随机设定模型解 释变量分布均匀情形,也适合于分布不均匀的情形。第六,局部多项式拟合不必 进行边界修正,它在边界的偏差自动与内部的偏差有相同的阶。f a n 和g j f b e l s ( 1 9 9 2 ) 在理论上证明了局部多项式回归拟合能自动地迸行有效的边界修正,这 是其它平滑技术所无法比拟的。也不象多数其它平滑方法,局部多项式拟合方法 进行边界修正不需要知道支撑端点的位置。在处理多维情况时,这是一个重要的 优点。因为多维情况的边界相当大,其它估计方法在进行边界修正非常困难。第 七,局部多项式回归估计在所有线性估计中,在极小极大效率f m i i m a x e 伍d e y ) 意义上接近于最优,它的有效性为l 。 2 3 半参数回归模堑 半参数回归模型由e i i g h l 9 8 6 ) 嗍等首次采用于研究城市气候条件对电力需 求的影响。其具体形式如下; y i - 卢+ g 以) + 岛f - 2 ,“,一 其中t - o n ,屯) ,芦- ( 届,以) , 1 。“,f i ) 是固定非随机设计点列。 o s 1 ,。是独立同分布随机误差,且e ( 。) - o ,e ( ? ) ,d2 。 最后,在模型: 兵一y l g ( f 。) - x + e 。 中,使用最小二乘法,得到芦的二次估计岔。 爹9 a r g 呼渺一z 2 子2 - ;砉o 。一矽4 9 ( f r ) ) 2 6 详见:昊喜之,王兆军非参数绩计方法【峋,北京高等教育出版社。1 9 9 6 王2 中山大学硕士学位论文基于面板数据的半参数估计与应用 第三章面板数据的半参数建模 将血敬数据和半参数建模绪台起来是很有蒽义的,在此之前也有人已经做过 尝试,并得出了一些结果,本章将列举其中一个具有代表性的结论和方法,并在 此基础上得到启示,得出一个面板数据的半参数建模方法一扩展局部回归法。 3 1 迭代加权偏样条最小二乘估计法 孙孝前、尤进红【1 6 1 提出了面板数据半参数建模中参数分量的一个迭代加权 偏样条最小二乘估计,在渐近方差意义下该估计比加权偏样条展小二乘估计更加 有效,且具有渐近正态性。针对模型( 3 1 1 ) : y # 4 x ;卢+ g 鳓) + s # 1 1 ,2 ,1 1 ,吩,荟 n 3 - 1 l 假定f l l j 2s 5 k f 2 l b 。5 k 和h 一 d j - o 婶一1 ) 7 ,首先定义通过 由b 样条级数近似g ( ) 产生的芦的加权偏样条最小二乘估计。为此,引入一些记 号: 对于非负整数m ,令o s 西s 1 和,( 为【o 1 】上的一个函数,再令 s :,】,为,( ) 的差分该差分定义为: m 艄懈,舻监等擎业抽。 睁舻筹器忑叫娜 障舻筹器“一o , 咿舭筹器小州, 对于非负整数v 和埘i 一阵”2 ”1 】8 ,令uz 枷i ,f - o ,1 ,和 注:f 0 1 = 0 ,“1 1 8 为取整运算。 中山大学硬士学位论文 基于面板数据的半参数估计与应用 o = s l 一- s r h ,s p + 2 ”l ,s 帆+ ylp 几d ,s 吨+ v + i 。| j 脚+ 2 v + l 。1 , ,( ) t ( 一1 ) v + 1 ( s + i _ s 施,s + l 】( 州) :,一卜,卅i + v ( ) - o 舢,。( ) , 此处,如果f ts ,则定义o j ) :一o ;否则o s ) :一1 且( f 一5 ) := ( f s ) ”( f s ) :。 可见凡。( ) 是正则化b 样条向量( 阶为v + 1 ) ,相应的在【0 ,1 】上的扩展分割是 5 ,。,并且函数男,。( t ) ,。“在( o ,1 ) 上v 一1 次连续可微。因此函 数g ( ) 可以由这组基的一个线性组合口。( 一) 来近似。那么,我们可以得到卢的 偏样条最小二乘估计( p s l s e ) : 0z q 铀b 。x r x s 。 其中 y - ( y ,y “,“,y h i ) ,】l f 一l 一( ) 1 , ;( ( f 1 。x ,( k ) ) ,是n 阶单位矩阵。 声的加权偏样条最小二乘估计为: 凡- 瞄j l f k d _ f 口窖( h ,l ) 材丑- 孑r z m k 旃昭( w l j ”,峨w 钆y 其中町1 一n i l 墨( y # 一声一嘞) d ) 2 经过第s 次迭代后的迭代加权偏样条最小二乘估计为: 露一江i i f d 细g ( 竹,昨,) m z 】- 1 工j i f k d 蛔( 叫,以) m y 其中一h 瞬由) 1 ,u 波1 ) 一n i l 墨( y u 一菇妒一日托) a 2 舀p - ( f :i ) ( ) 。1 ( y 一聊棚) 。 3 2 扩展局部回归估计法 在本节中,作者将把局部回归方法进行扩展,把半参数回归建模与面板数据 结合起来,得到一种基于面板数据的半参数回归方法一扩展局部回归法。 针对模型( 3 2 】) : 1 4 中山大学硕士学位论文 基于面板数据的半参数估计与应用 y 口一矗卢+ g 瓴) n f - 1 ,n ,f 一卜,r 9 ( 3 2 1 ) 其中h ,卢均为ix 1 阶向量,即一( ,z :。,) 。 ( 一) :令n it e 值( 气) ) ,f a l , ,e :( 9 2 ( ) ) t * ,记: 则( 3 2 1 ) 变型为 - g 瓴) 一日。+ “ y 自。口i + 扎声+ h n 显然有e 。) 一e 。( g ( 毛) ) 一目( 口j ) + 巨( 气) to ,故可将看作扰动项,因此模型 ( 3 2 2 ) 为一面板数据模型。使用针对面板模型的虚拟变量最小二乘法或者广义 最小二乘法,可以得到芦豹一次估计芦: ( 1 ) 若( 3 _ 2 2 ) 为固定影响模型: 其中工- 兄一 y 1 1 咒2 置 z 2 y 。 d - m 。,d :,以】一 卢| 【z 峨x 】1 腰村d y 】 ( 3 2 3 ) 置- y l y 2 y 。 m 善- 1毒j i 黾2x “2 羔n l h 2 x x m x h 虬,一d ( d ,d ) 。1 d 誊 1 占- 由于矩阵d 的结构很特别,它的列是直交的,故 m t , m o0 0m o 00 0 0 o 岛 岛 : 晟 9 可以设为更一般的形式tf 。1 ,一,f - l ,l ,不过这对研究结果没有影响所以为了简单起见, 我们假设每个个体的样本数量一样。 中山大学硕士学位论文基于面板数据的半参数估计与应用 而对角线上的每个矩阵是: m 。吐一 其中e ;( 1 工,1 ) ,是丁z 阶单位矩阵。 ( 2 ) 若( 3 2 2 ) 为随机影响模型: 此时令吒- 口+ q ,( 3 2 2 ) 变型为: y 自z + z n 卢+ q + ( 3 2 4 ) 令一口i + n 。,则: 嚣( 磅) - + ,( k 魄) ;,( f ,s ) ,三霹) t e ( 砰) - ,o - e ( m 叫) - 斫+ 记e e , 矿一( e m w :) 肌r - , o ( 2 1 ) 0 已知时口的g l s : 将( 3 2 4 ) 重写为: y j j 一+ m ,f 卜,n ( 3 2 5 ) 其中置- ( e ,工。) ,6 ( 肪卢7 ) 叫( i i 一,o ) 。容易证明 。专( 一一2 卵) ,q 啦言以一;e e ) 其中 一商务 对模型( 3 2 5 ) 两边都乘以q ,得到: q 一”2 n q ”2 j + q 。牡嵋 再进行o l s ,就得到参数d 的广义最小二乘估计 喜和。置】- l 【砉扫屯j 对应d 一( 卢,卢) ,我们可以很容易得到卢的一次估计口。 中山大学硕士学位论文 基于面板数据的半参数估计与应用 ( 2 2 ) 0 未知时口的f g l 5 可行的最小二乘估计f g l s 就是先求出。中未知量z 和露的无偏估计后, 再进行广义最小二乘估计。对模型( 3 2 4 ) 两边在时间上求平均,得 只;口+ 置卢+ 口 + 瓯 ( 3 2 6 ) ( 3 2 4 ) 减去( 3 2 6 ) ,得到: 虬一只= k 一置垆+ m 。一面】 ( 3 2 7 ) 模型( 3 2 7 ) 对单位均值的离差移去了异方差性,g r e e n “1 9 9 7 ) 推荐和以 钟。逃芸学 :m 等等 氓:m 其中露和声是_ i l 和芦的一致估计。如果存在: ( 硇。曙g 槭趴善( 岩枷】 则( 3 2 8 ) 和( 3 2 9 ) 估计量是无偏的。 有了z 和砰的无偏估计,就可以得到未知数日和未知矩阵q 中的估计 “卜耐爵 铲- 手( 一扫 在模型( 3 2 5 ) 两边乘以q 叫2 的估计阵,得到: q 啦y f 舀叫2 p 肛+ 矗。班工f 卢+ 盎叫2 m ( 3 2 1 0 ) 对模型( 3 2 1 0 ) 进行o l s ,即可得到参数的f g i s 估计。 得到模型( 3 2 1 ) 中参数卢的次估计卢后,将口带入模型,( 3 2 1 ) 变 中山大学硕士学位论文 基于面板歌据的半参数估计与应用 型为: 死- 儿一& p - g 瓴) n ( 3 2 n ) :模型( 3 ,2 1 1 ) 是一个面板数据形式的非参数模型,接下来我们将分两种情 况估许和投合未知函数g ( e ( i ) 若z l l i 。1 2s s s z 盯 此时可以将毛( f 。1 ,n ,f l 一,丁) 看作是一个时间序列的点,进而对g ( 的拟合退化为对一个二维平面上曲线的拟合。 为了更清楚地表达出这个意思,我们用一个新的点到来代替( j 一1 ,h , f - l 。,丁) 。 设佃,i 卜1 ,2 ,n n 为一时间序列,且满足( f 一1 妒+ f ;j 时,乃一气。 现在阚题转化为需要应甩非参数 占诗方法来拟会函数g ( p j ) ,j - 1 ,2 。,n 丁,在 引入点列p ,后,模型( 3 2 1 1 ) 变型为: 乃9 0 j ) + ,一1 ,2 , f ( 3 2 1 2 用权函数法来估计g ( ) 。得; g 善o ) 只 懒函数删“( 剥薹晔) 。 其中_ l ( 为核函数 ,o 为帝宽。常用的核函数有三角形核墨( p ) - ( 1 一p 1 ) + ,高 斯核致( p ) 。( 2 ;f ) 。2e 印( 一p 2 2 ) ,b a n k t t - e p 如础n i k o v 核墨( p ) 一o 7 5 ( 1 一p 2 ) + 等。而对于带宽 ,可根据经验选择,或用交错鉴定法进行选择。详见文献f 2 】。 ( n ) 当不满足情形i 时 情形i 是一种比较理想的情况,不过在实际生活中,事情往往难以如假设的 那么理想,当点列气不满足递增的条件时,我们就不能再把g ( 毛) 当作是一条二 维平面的曲线来进行拟合了。 壤 中山大学硕士学位论文基于面板数据的半参数估计与应用 此时的点列毛可咀视为三维立体空间中的一条曲线,对它的拟台将复杂得 多。不过我们可以采取另外的途径来估计它,那就是使用虚拟变量,对每个个体 l 来做非参数拟合,然后通过虚拟变量将它们联系起来,形成整体的未知函数的 估计。具体做法如下: 对五l i 一,气,j t l ,h ,估计。( _ ) 。 采用权函数法,结果如下: 删善。) 露 其中权函数喇- t 洋 砉i 哔为核贼川为槐 因此,未知函数g ( 的估计为: 雪) 善或) d f 其中d f ( ) - 茹;:;为虚拟函数。 固:现在我们已经得到了未知函数g ( ) 的估计( ,将它带入模型( 3 2 1 ) ,可 得; 觅一y “一女阮) - ,+ 屯i 。l ,n ,f t ,r ( 3 2 1 3 ) 模型又变回了一般的面板数据模型。根据上面的讨论,可以得出参数口的二 次估计雪。 若模型是固定影响模型,则爹,瞄也j l 。1 m 。蓟; 若模型是随机影响模型,则五i 【】。1 岛。 其中 。;魄一章飙一章) 码,也一氟觅一爹) 中山大学磺士学位论文基于面板数据的半参数估计与应用 军者军;- 刍罩;觅 至此,我们通过扩展局部回归估计法得出了未知参数声的二次估计岔。 中山大学硕士学位论文 基于面扳数据的半参数估计与应用 第四章实例验证 在本章中,我们将利用广东省7 个大中城市:广州、深圳、珠海、油头、韶 关、梅州和惠州的1 9 9 7 年一2 0 0 3 年居民人均可支配收入和消费性支出数据1 0 来 建立相应的居民消费与收入的线性模型和半参数模型,并以此来对比两个模型的 优异。数据来源于广东省相应各年的统计年鉴。 在本例中,解释变量为一维,即x 表示居民年人均可支配收入。响应变量y 表示居民年人均消费性支出。 4 1 线性回归模型 线性形式的面板数据模型为: y “- q + 妇女+ 屯f 一1 ,2 ,7 t l ,2 ,7 ( 4 1 1 ) 其中f - l 2 ,7 分别对应广州、深圳、珠海、汕头、韶关、梅州和惠州七个 城市,而f - l2 ,7 则分别对应1 9 9 7 年至2 0 0 3 年共七年。 针对模型( 4 1 1 ) ,先做协方差检验以确定模型是否属于变截距模型。 给出假设: h l :y * a t h t + wh :y * - 4 + k t + 8 h 先计算2 1 节中提到的统计量e : f 2 。i 1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论