一元非参数回归-(非参数统计)_第1页
一元非参数回归-(非参数统计)_第2页
一元非参数回归-(非参数统计)_第3页
一元非参数回归-(非参数统计)_第4页
一元非参数回归-(非参数统计)_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

参数回来与非参数回来的优缺点比较:参数回来:优点:(1).模型形式简洁明确,仅由一些参数表达(2).在经济中,模型的参数具有一般都具有明确的经济含义(3).当模型参数假设成立,统计推断的精度较高,能经受实际检验(4).模型能够进行外推运算(5).模型可以用于小样本的统计推断缺点:(1).回来函数的形式预先假定(2).模型限制较多:一般要求样本满足某种分布要求,随机误差满足正态假设,说明变量间独立,说明变量与随机误差不相关,等(3)须要对模型的参数进行严格的检验推断,步骤较多(4).模型泛化实力弱,缺乏稳健性,当模型假设不成立,拟合效果不好,须要修正或者甚至更换模型非参数回来:优点:(1)回来函数形式自由,受约束少,对数据的分布一般不做任何要求(2)适应实力强,稳健性高,回来模型完全由数据驱动(3)模型的精度高;(4)对于非线性、非齐次问题,有特殊好的效果缺点:(1)不能进行外推运算,(2)估计的收敛速度慢(3)一般只有在大样本的状况下才能得到很好的效果,而小样本的效果较差(4)高维诅咒,光滑参数的选取一般较困难非参数回来方法样条光滑正交回来核回来:N-W估计、P-C估计、G-M估计(9.1)局部多项式回来:线性、多项式(9.2)光滑样条:光滑样条、B样条近邻回来:k-NN、k近邻核、对称近邻(9.4)正交级数光滑(9.5)稳健回来:LOWESS、L光滑、R光滑、M光滑----------(9.3)局部回来Fourier级数光滑wavelet光滑处理高维的非参数方法:多元局部回来、薄片样条、可加模型、投影寻踪、回来树、张量积,等3核函数K:函数K(.)满足:常见的核函数:Parzen核:Gaussian核:Epanechnikov核:tricube核:为示性函数4回来模型:(1)模型为随机设计模型,样本观测(Xi,Yi)~iid(2)模型为固定设计模型Xi为R中n个试验点列,i=1,2,…,nYi为固定Xi的n次独立观测,i=1,2,…,nm(x)为为一未知函数,用一些方法来拟合定义:线性光滑(linearsmoother)5光滑参数的选取风险(均方误差)

(meansquarederror,MSE)志向的状况是希望选择合适的光滑参数h,使得通过样本数据拟合的回来曲线能够最好的靠近真实的回来曲线(即达到风险最小),这里真实回来函数m(x)一般是未知的。可能会想到用平均残差平方和来估计风险R(h)但是这并不是一个好的估计,会导致过拟合(欠光滑),缘由在于两次利用了数据,一次估计函数,一次估计风险。我们选择的函数估计就是使得残差平方和达到最小,因此它倾向于低估了风险。是

的估计,h是光滑参数,称为带宽或窗宽6光滑参数的选取缺一交叉验证方法(leave-one-outcrossvalidation,CV)这里是略去第i个数据点后得到的函数估计交叉验证的直观意义:因此:7光滑参数的选取定理:若那么缺一交叉验证得分

能够写成:这里是光滑矩阵L的第i个对角线元素广义交叉验证(generalizedcross-validation,GCV)其中:为有效自由度8光滑参数的选取其他标准(1)干脆插入法(DirectPlug-In,DPI)相关文献可以参考:

WolfgangHärdle(1994),AppliedNonparametricRegression,BerlinJeffreyD.Hart(1997),NonparametricSmoothingandLack-of-FitTests,SpringerSeriesinStatistics李竹渝、鲁万波、龚金国(2007),经济、金融计量学中的非参数估计技术,科学出版社,北京

吴喜之译(2008),现代非参数统计,科学出版社,北京

(2)罚函数法(penalizingfunction)(3)单边交叉验证(OneSidedCrossValidation,OSCV)(4)拇指规则(RuleOfThumb)99.1.核回来(核光滑)模型N-W估计是一种简洁的加权平均估计,可以写成线性光滑:局部回来由Nadaraya(1964)和Watson(1964)分别提出,(1)N-W估计形式:其中:,为核函数,为带宽或窗宽10局部回来(2)G-M估计由GasserandMüller(1979)提出,形式如下:其中写成线性光滑的形式:11局部回来核估计存在边界效应,边界点的估计偏差较大,以N-W估计为例,如下图12局部回来一般,核函数的选取并不是很重要,重要的是带宽的选取13局部回来一般,核函数的选取并不是很重要,重要的是带宽的选取14局部回来一般,核函数的选取并不是很重要,重要的是带宽的选取可以看到:拟合曲线的光滑度受到光滑参数h变更的影响15局部回来核估计的渐近方差核渐近偏差核估计渐近偏差渐近方差N-W估计

G-M估计

其中,h为光滑参数,f为X的密度函数,且16局部回来9.2.局部多项式回来多项式的回来模型其中可由最小二乘法估计,即局部多项式回来:对m(x)在u处进行p阶泰勒绽开,略去p阶高阶无穷小量,得到m(x)在u处的一个p阶多项式近似,即此时,x应当靠近u,且17局部回来通过最小二乘来估计系数留意:是在x的一个邻域内进行多项式估计,因此,最小二乘应当与x的邻域有关局部加权平方和:使上述问题最小化,可以得到系数的局部多项式的最小二乘估计可以很简洁得到,取p=0时为局部常数估计,即N-W核估计取p=1,为局部线性估计18局部回来写成矩阵形式:使上式最小化,可以得到系数的估计其中19局部回来得到加权最小二乘估计当p=1时(局部线性估计)的渐近偏差和渐近方差其中可以看到局部线性回来的渐近方差和N-W估计相同,而渐近偏差却比N-W回来小,说明局部线性多项式可以削减边界效应,局部线性估计由于N-W估计20局部回来局部多项式光滑可以很好的削减边界效应21局部回来检验函数(Doppler函数)22局部回来运用GCV选取最优带宽h=0.017,权函数为tricube核函数23局部回来运用GCV选取最优带宽h=0.017,权函数为tricube核函数24局部回来9.4.近邻光滑(1)k-NN回来(k-nearestneighborregression)其中={i:xi是离x最近的k个观测值之一}K-NN估计的渐近偏差和渐近方差:对于随机设计模型,近邻估计写成线性光滑器的形式权函数:25局部回来(1)k-NN回来(k-nearestneighborregression)26局部回来(1)k-NN回来(k-nearestneighborregression)27局部回来(2)k-近邻核回来K近邻核估计的权重其中R为xi中离x最近的第k个距离,K为核函数渐近偏差和渐近方差:28局部回来(2)k-近邻核回来29局部回来(2)k-近邻核回来30局部回来9.3.稳健光滑(1)局部加权描点光滑(LocallyWeightedScatterplotSmoothing,LOWESS)Step1:在x的邻域内,用一个多项式进行拟合,求出系数{βj}其中wi(x,k)为k-N

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论