基于核密度估计上证A股收益率的分析_第1页
基于核密度估计上证A股收益率的分析_第2页
基于核密度估计上证A股收益率的分析_第3页
基于核密度估计上证A股收益率的分析_第4页
基于核密度估计上证A股收益率的分析_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、*第六章基于核密度估计的上证 A股收益率分析一、模型的相关理论知识(一)问题的提出经济计量研究中常用的是参数估计,即假定经济变量之间具有一定的函数关 系,且函数形式是可以确定的,可以写成带参数的形式进行估计,经典的线性回归 和非线性回归就属于参数估计方法。但经济变量之间的关系未必是线性关系或可 线性化的非线性关系,而变量之间的真实关系到底是什么又很难确定。因而当模 型及参数的假定与实际背离时,就容易造成模型设定误差。止匕时,基于经典假设模 型所做出的预测,很难达到预期的效果。针对该问题,非参数估计方法提供了最 佳的解决办法,它使我们能寻找到最精确的非线性系统来描述变量之间的内在关 系。非参数估

2、计的回归函数的形式可以任意,没有任何约束,解释变量和被解释变 量的分布也很少限制,因而有较大的适应性,其目的在于放松回归函数形式的限 制,为确定或建议回归函数的参数表达式提供有用的工具,从而能在广泛的基础上得出更加带有普遍性的结论。核估计就是一种非参数估计方法,主要用于对随机变量密度函数进行估计。(二)核密度估计方法的原理设Xl,X2,llXn是从具有未知密度函数f(X)的总体中抽出的独立同分布样本,要依据这些样本对每一 x去估计f(x)的值。密度估计最基本的方法是直方图估计,我们可以从直方图估计导出密度核估 计。作直方图时,先用点aj把直线分成若干小的计数区间。这样,计数区间 的端点与宽度都

3、是固定的。记Ni为样本点x,x2M|xn落在第i个计数区间2©书) 里的个数,则密度函数f (x)在目,2书)里的函数估计值就取为:?(x)=Nin(ai i -ai),优 Mx :二 ai i,i=1, ,k这样的直方图估计结果是阶梯函数,如果对每个x,各作一个以x为中点的小计数区间Ix-h,x + h),再对落在该计数区间的样本点计数,设为N(x,h),则 密度估计为:?(x)=N。其与直方图不同在于它的计数区间端点划分不是2nh固定的,而是随x而变,可以自始至终保持x点在计数区间中间。不过此时计数区间宽度h一般是固定的。如果引进均匀核函数0.5K0(x) = 0当 -1 

4、63; x :二 1其他11 n x x上述变端点计数区间的密度估计可写为:?(x)= -Z Ko |nh 曰 I h J后来Parzen(1962)提出,可以将这种核函数形式放宽限制,只须积分为1 (最 好还为包正)即可。这就导出了一般的密度核估计:?(x) =Z K i,(6-1 )nh y . h其中K(,)为核函数,h为窗宽另外也可以从经验分布函数导出密度核估计1经验分布函数F (x) =-(x1, x2| ,xn中小于x的个数)也是一种计数,不过从 n一直计到x为止。利用它表示一个以x为中心,窗宽为2h计数区间里的样本点数, 于是密度估计为:?(x) = IF (x h) - F(x

5、 - h) 12hn所:甫尸)对核函数形式放宽了,一般来说,要求核函数满足以下条件:K(x)之 0, j:K(x)dx =1一.小一2.,supK(x)<", f K (x)dx < 十大lim K(x) x = 0 xpc对于一般概率密度函数,这些条件是能满足的,所以可以选一个概率密度函 数作核函数。对窗宽h的要求,显然样本数越多,窗宽应越小,但不能太小,即 h 是n的函数,且lim h(n)=0,lim nh(n)=nT s。在上述要求的核函数及窗宽条件:n下,密度f(x)的核估计?(x)是f(x)的渐近无偏估计与一致估计。(三)几种常用的和函数当- 1 M x 1其

6、他卜面介绍几种常用的核函数:.40.51,均匀核K0(x)=«002,高斯核 K1(x) =(2可 T2exp(-x2/2),3, Epanechnikov K2(x) =0.75(1 x2)+,4,三角形核 K3(x) = (1 - x) + , 152 O5,四次万核(x) =15(1-x )Q2 , 一 、,、,、70336,八次方核 K5(x) =(1 - x )十)。81通常在大样本的情况下,非参数估计对核函数的选择并不敏感,但是,窗宽h的选择对估计的效果影响较大。一般来说,窗宽取得越大,估计的密度函数 就越平滑,但偏差可能会较大。如果选的h太小,估计的密度曲线和样本拟合得

7、 较好,但可能很不光滑,即方差过大。所以,窗宽的变化不可能既使核估计的偏 差减小,同时又使核估计的方差较小。因此,最佳窗宽的选择标准必须在核估计 的偏差和方差之间作一个权衡,即使积分均方误差AMISE( f?(x)达到最小。选择 h的方法有许多,比如交错鉴定选择法,直接插入选择法,在各个局部取不同的 窗宽,或者估计出一个光滑的窗宽函数 h(x)等等1。AMISE(?(x) = , E(?(x) - f (x)2dx = (E?(x) - f (x)2 Var(?(x)dx1见于吴喜之.非参数统计M.中国统计出版社,p188-p189.=j( Bias ( ?(x)见于罗素.戴维森,詹姆斯.G麦

8、金农.计量经济理论和方法M上海财经大学出版社.p580-p581. +Var ( ?(x)dx(6-2 )可以证明,在很一般的正则条件下,使积分均方误差极小化的任何h取值一定与n年成比例。2由此得到,一般的最佳窗宽选择为h=cn/5 (其中c为常数),通过不断地 调整c,使得所采用的窗宽h=cn5的核估计达到满意的估计结果。h的两个常 见选择为:h =1.059sn,5( 6-3 )h =0.785(*75 -?0.25)n = 5(6-4)其中,n为样本单位数。s为xi的标准差,%75 -(?0.25为数据的0.75分位数 估计值和0.25分位数估计值之差。因子1.059实际上就是(4/3)

9、15 ,是通过最优 性证明得出的,因子0.785是1.059除以1.349得出的,1.349是标准正态分布 的四分位数中间跨度。二、案例分析:基于核密度估计的上证 A股收益率分析(一)案例背景材料中国的股票市场经过二十多年的发展, 已经取得了令人瞩目的成就。在市场 参与者各方的共同努力之下,市场日渐走向成熟和完善,对中国股票市场的研究 也日渐深入和丰富多彩。几乎所有的关于市场的学术研究中都会涉及到股票的收 益率,而在股票市场,对收益率随机过程的充分认识是做出正确投资决定的基础, 因为它提供了有关资产风险的基本信息。在现代金融经济学中,线性范式一直占据着主导地位,许多经典理论都是以 正态分布或对

10、数正态分布为基础建立的。股市收益率作为反映股票市场波动性的 指标,在描述股价行为的经典计量模型中, 通常被假定服从正态分布。但是许多 计量金融学家对这一经典假设做了大量的研究并发现,收益率的分布并不服从正 态分布这一假设。事实上,大多数收益率的变化存在很明显的尖峰现象,也就是说相对正态分布而言,在均值附近的数据点特别多。许多学者认为这只不过是由 一些“异常值”所引起,从而在统计分析中将这些“异常值”去掉。例如,国内 学者陶亚民认为,上海股市收益率分布是服从正态分布的,但这却是在剔除了 “异 常点”的基础上得到的结论。然而Mandelbrot认为将这些“异常值”值从数据中 去掉是不可取的。因为“

11、异常值”的出现并不是一种偶然现象,尖峰和厚尾现象 几乎是所有股票收益率数据所共有的。这说明“异常值”本身反映了股票收益率 并不服从正态分布这一假定。陈启欢也通过实证研究的方法得到我国股市收益率 分布曲线并不服从正态分布。因此,在收益率分布非正态的情况下,本案例利用非参数估计中的核密度估 计方法来对上证A殳指数收益率的密度进行估计。(二)数据来源及说明本案例采用wind资讯公司提供的2005年1月至200/11月12日期间我国上证 A殳日收盘指数,共计1180t观测值为样本,运用密度估计模型来研究股指数收 益率波动。(三)模型建立与估计结果P,_ _ P本模型的建立,米用上证 A殳指数日收益率R

12、t书为变量。Rt书=Pt* P , Pt R是第t日的收盘指数,Pt,是第t+1日的收盘指数。另外,本案例的模型估计是通 过使用碌件来实现的。1、收益率分布的正态性检验本案例利用Shapiro-Wilk (夏皮罗-威尔克)惭计量对样本作正态性检验。 在做件中,函数shapiro.test() 提供惭计量和相应的p值,当p值小于某个显著 水平a (比如0.05)时,则认为样本不是来自正态分布的总体;否则认为样本是 来自正态分布的总体。在此,假设上证 A殳指数收益率服从正态分布,得出的检 验结果如下:Shapiro-Wilk normality test data: xW = 0.8, p-val

13、ue < 2.2e-16从上述结果可以看出,上证 A股指数收益率不服从正态分布。2、核函数与窗宽的选择由于核函数在核密度估计中不敏感,满足核函数条件的高斯核、均匀核、Ep-anch-nikov 核、Biweight 核的最优性几乎一致(Prakasa Rao,1983)。因此, 本文仅选取高斯核作为核函数进行估计。对于窗宽的选择,本案例先由(3)式和(4)式分别计算得出h1 =0.006376 , h2 =0.003952。再在选用高斯核函数的条件下,根据使积分均方误差AMISEfx) 达到最小法则,得到高斯核估计的最优窗宽为 h1 =0.006376=(四)非参数估计下的上证A股指数收

14、益率密度函数的实际应用在核估计的核函数与窗宽都确定后,就可以得到上证A股指数收益率的核估 计密度函数的确定形式:?(x)=1181 0.006376 *2二 一 1 Z exp -2 10.006376 )x -xi21(6-5)在非参数核密度估计的情况下,收益率的期望和方差为:°° fjxexp -'11EX = x?(x)dx =2 2n h qjy2,J(hy+xi)exp !dy=ZI 2 J5二 3n 1n i . 2 二/2、(x -xi)22hdx(6-6)n idxio 二1.nE(X ) = x ?(x)dx =oOf2 2 Jx exp -(x-

15、xi)2h22、1 n- dx = h2 +£nn id2 xi(6-7)(6-8)Var(X) = E(X2) - E(X)2通过公式(6-6), (6-7), (6-8),可以计算出核估计密度函数的期望与方差, 见表1:表1上证A股指数收益率非参数估计与实际的收益率的统计特征比较核估计均值核估计方差实际均值实际方差0.0010970.0006540.001097 0.000614从表1可以看出,核估计收益率的期望与原来数据的均值是相等的,但是方差却不同,核估计的方差比实际数据的方差偏大。由于本案例采用的是高斯核(正态核)函数,所以可以推导出核估计条件下 的收益率分布函数是:C1

16、nx - x;!?(x) =PrX wx) =,£ |(6-9)n a h .)由公式(6-9)可以知道在核估计密度函数下的收益率分布函数形式,因此我们就可以计算出收益率落在不同区间时概率值的大小,计算结果见表 2:表2上证A股指数收益率的区间概率值区间 (-8, -0.05 ) (-0.05,0)(0,0.05)(0.05, +8)概率值0.021950.430420.532710.01491表2的计算结果表明:上证A股指数的收益率下跌大于0.05的可能性 2.193%,而上涨大于0.05的可能性是1.574%,下跌的可能性大于上涨的可能性。 这说明近年来我国上证A股市场不景气,我

17、们认为可能是受到金融危机的影响。(五)结论非参数回归函数估计方法是近20年来现代统计学发展的一个重要方向,它改 变了传统统计学的格局,对未知分布的数据模型的处理及不完全数据的处理提供 了一种新的统计方法。在非参数估计时,不固定函数的形式,也不设置参数,函数 在每一点的值都由数据决定,因而有较大适应性。同时,在抽取样本对总体进行估 计时,不必依赖于样本所从属的总体的分布样式 ,可以广泛地运用于不同类型的 总体。所以,非参数估计方法在广泛的基础上,得出更加带有普遍性的结论。本案例利用非参数核密度估计法对上证 A股指数的收益率分布形式进行了实 证研究。研究发现,非参数核密度估计方法能够较好地描述股票

18、收益率分布尖峰 厚尾的特征,对收益率分布给出一个比较准确的拟合效果。 在此基础上,本案例 通过计算还得到了在非参数估计下的收益率的期望和方差,以及收益率落在各个区间的概率值。通过比较分析各个区间的概率值,揭示了近年来上证A殳市场的特征。*参考文献:1李子奈,叶阿忠.高等计量经济学M.北京:清华大学出版社,2000.2叶阿忠.非参数计量经济学M.天津:南开大学出版社,1995.3罗素戴.维森,詹姆斯.G麦金农.计量经济理论和方法M.上海财经大学出版社,2006.4张世趟,程小军,苏明.基于非参数方法的A股指数估计J.南方金融,2009, (1):25-27.5薛毅,陈立萍.R软件建模与R软件M.

19、清华大学出版社,2007.6吴喜之.非参数统计M.中国统计出版社,2006.7陶亚明,蔡明超,杨朝军.上海股票市场收益率分布特征的研究J.预测,1999,(2):57-58.8区诗得,刑国东.股票收益率密度的非参数估计及投资策略J.理论新探,2006, (3).9陈启欢.中国股票市场收益率分布曲线的实证J.数理统计与管理,2002,(5):9-11.*附录程序命令:(1)在EXCEL中计算收益率;(2)把EXCEL格式的数据另存为文本数据,并命名为shuju.txt,存入C盘;(3)在R软件中调入foreign程序包;(4)用R软件读入数据,命令为sj<-read.delim("

20、;c:/shuju.txt")#把数据赋值给 sjx<-sj"收益率"x#把收益率赋值给X,并显示出x(5)在R软件中进行正态性检验,命令为shapiro.test(x)结录为:Shapiro-Wilk normality testdata: xW = 0.8, p-value < 2.2e-16(6)在R软件中进行五数总括(为下面画正态分布和计算窗宽做准备),命令为fivenum(x)结果: -0.221935690 -0.008411541 0.002237005 0.012307580 0.342559766最小值下四分位数 中位数 上四分位数 最大值(7)调入核函数软件包 kernsmooth(8)选择核函数形式,三种核函数与正态函数做比较,命令为plot(bkde(x,kernel="normal

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论