(应用数学专业论文)深圳a股市场行业板块数字结构特征的挖掘和实证研究.pdf_第1页
(应用数学专业论文)深圳a股市场行业板块数字结构特征的挖掘和实证研究.pdf_第2页
(应用数学专业论文)深圳a股市场行业板块数字结构特征的挖掘和实证研究.pdf_第3页
(应用数学专业论文)深圳a股市场行业板块数字结构特征的挖掘和实证研究.pdf_第4页
(应用数学专业论文)深圳a股市场行业板块数字结构特征的挖掘和实证研究.pdf_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

四川大学硕士学位论文 6 4 8 f i 深圳a 股市场行业板块数字结构特征的 挖掘和实证研究 专业:应用数学 研究生:余竞指导教师:李竹渝 摘要:席卷全球的“金融风暴”,用活生生的事实,对现存的许多金融理论提 出了质疑。全球最具影响力的金融专家之一,曾经促成了格林斯潘发表那篇成 为全球股市泡沫破灭的导火索的、关于“非理性繁荣”的著名演讲的罗伯特希 勒,在今年3 月2 4 日所作的演讲中,就呼吁要实践新金融经验和新金融技术, “包括计算机技术、互联网技术、更加面向客户、更加友好的信息技术,使得 金融更加民主化,换句话就是使得大众,更多的人能够在未来更方便,更广泛 地使用动态风险管理工具。” 从数据挖掘的角度,本文基于对个股原始交易数据的数据处理和统计计算 分析,探讨整个深圳a 股市场个股的板块结构特征,旨在为市场参与者提供基 于计算机技术、更加面向客户、更加友好的信息方面,作了一些有益的尝试。 我们采用实行涨跌幅限制后1 9 9 8 年9 月8 日至2 0 0 3 年1 月7 日( 大致是 一个行情波段) 深圳a 股市场全部个股的日交易数据,针对一些文献采用股市 没有复权处理的交易数据的误区,我们首先给出原始交易数据的复权修正公式, 在复权处理后的数据基础上,按行业板块探讨了深圳a 股市场对数收益率的统 计特性、不同持有期的风险量度v a r 以及各行业板块的自相关性及板块间的相 关性,推出了相关系数的分布并讨论了相关系数的检验与样本容量的关系。对 中国股票市场行业板块数字结构特征的挖掘和实证分析方面做了一定的研究并 得到一些有价值的结论: “分散投资理论”的预期结果被观察到,罗伯特希勒对“市场有效性理 论”、“随机漫步理论”的质疑被观察到:我国深圳股票市场在数据采集期的 市场表现的一些总体特征,如“快涨慢跌”、“轮涨齐跌”等被观察到。考虑 到很多数据特征还不能立即给出明确的结论,而这些数据挖掘的结果又明显包 含了额外的信息,本文特意将一些原始的计算结果在附录部分完整的给出来。 关键词:数据挖掘;行业板块;结构特征;收益率分布;风险v a r ;相关系数 2 四川大学硕士学位论文 m i n i n g a n d e m p i r i c a la n a l y s i s o nc h a r a c t e r so fl i s t e d c o m p a n i e s c l a s s i f i e db y i n d u s t r yi ns h e n z h e ns t o c km a r k e t m a j o r :a p p l i e dm a t h e m a t i c s g r a d u a t e :l i n g y u a d v i s o r :z h u y ul i a b s t r a c t :t h ef a c to f f i n a n c i a ls t o r m o p p u g n ss o m eo ff i n a n c i a lt h e o r e m s r o b e nh i l l e r a p p e a l t o p r a c t i c e n e we x p e r i e n c ea n d t e c h n o l o g y o nf i n a n c e i n c l u d i n gc o m p u t e rt e c h n o l o g y , i n t e r a c tt e c h n o l o g y , m o r ef r i e n d l y i n f o r m a t i o n t e c h n o l o g yf a c i n gc l i e n t s s oa st om a k ef i n a n c em o r ed e m o c r a t i z a t i o n i na n o t h e r w o r d s ,t om a k et h ep e o p l em a k e u s eo fd y n a m i cr i s k m a n a g e t o o l sm o r e c o n v e n i e n t l ya n d m o r ea b r o a di nt h ef u t u r e f r o mt h ev i e wo fd a t a m i n i n g ,t h i sp a p e r d i s c u s s e st h es t r u c t u r ec h a r a c t e r so ft h e c l a s s i f y i n gb l o c k so f l i s t e dc o m p a n i e si ns zs t o c km a r k e tb a s e do nd e a l i n gw i t h o r i g i n a l l yd e a l i n gd a t aa n ds t a t i s t i c a l c a l c u l a t i o na n de m p i r i c a la n a l y s i s ,s u c ht o p r o v i d e t h em a r k e t p a r t i c i p a n tm o r ef r i e n d l yi n f o r m a t i o nb a s e do nc o m p u t a t i o n w ec a l c u l a t et h ed e a l i n gd a t ad u r i n gt h ep e r i o do f8 9 1 9 9 8t o7 1 2 0 0 3 i n w h i c ht h er u l e ro fr e s t r i c tt ot h er a n g eo fr i s ea n df a i 】h a sb e e nc a r r i e do u t a tf i r s t , t h ed e a l i n gd a t ah a sb e e na d j u s t e d t h e nt h es t a t i s t i c a lc h a r a c t e r s ,v a l u ea tr i s k , d i s t r i b u t i o no fc o r r e l a t i o n sa n dt h er e l a t i o nb e t w e e nc o r r e l a t i o na n dt h ea m o u n to f s a m p l ea r ed i s c u s s e d a n ds o m ev a l u a b l ec o n c l u s i o n sa r e d r a w no u t :d i s p e r s e d i n v e s t m e n tt h e o r y , r o b e r t sd o u b t so n v a l i d i t yo fm a r k e tt h e o r y ,r a n d o ms t r o l l t h e o r y b e c o m ec o n s c i o u s s o m ec h a r a c t e r so ft h ec l a s s i f y i n g b l o c k so fl i s t e d c o m p a n i e si ns z s t o c km a r k e t ,s u c ha s q u i c ku pa n ds l o wd o w n ,u pt o g e t h e ra n d d o w nb yt u r n a l s ob e c o m ec o n s c i o u s k e yw o r d s :d a t am i n i n g ;c l a s s i f y i n g b l o c k so fl i s t e d c o m p a n i e s ;s t r u c t u r a l c h a r a c t e r s ;d i s t r i b u t i o no f r e t u r nr a t e ;v a l u e a tr i s k ;c o r r e l a t i o n 四川大学硕士学位论文 第一章综述 中国股票市场经过十余年的发展,从初创期步入稳定和成熟期。其作为市 场经济不可分割的一部分,在经济生活中日益显示出举足轻重的作用。对我国 股票市场的定性、定量研究,也日渐丰富和深入。尤其是对市场数据的实证定 量研究,越来越被市场参与各方所关注。 股票市场的实证研究,通常都离不开对收益率的分析。目前,几乎所有的 关于市场的学术研究,对收益率的计算都采用了利用指数收益率来进行整体计 算。这使我们得以了解整个股票市场的总体市场表现,但掩盖了股票个体市场 表现的差异性和关联性等重要信息。从为投资者或从业者提供统计咨询的角度 来说,这样的收益率分析是远远不够的。有的研究者注意到这种缺陷,进行了 针对个股收益率分析,讨论个股类群( 板块) 收益率关系的研究,但遗憾的是, 无论是板块还是板块内的个股,都是采取非随机抽样的方法,仅对个别板块, 选取个别代表性个股进行分析。 同时,要把握诺大的证券市场个股市场表现的差异性和关联性,需要对所 有个股从不同的分析角度进行聚类,即研究整个股票市场内部的结构特征。由 于整个股票市场个股数量庞大,且个股之间存在相关性,以及各种突发事件等 不确定性的影响,使得传统的统计方法很难奏效,数据挖掘( d a t am i n i n g ) 技术成 为重要手段。这方面的工作文献也鲜有记载。少数涉及内部结构的聚类分析, 也局限于对某种板块分类中的某一个板块内部进行聚类,尚缺乏对整个股票市 场全部股票各类之间结构特征的分析。 美国耶鲁大学教授罗伯特希勒,在凤凰网第1 1 2 期世纪大讲堂特别节目 所作的题为“金融风险和金融新秩序”的报告( 2 0 0 3 年0 3 月2 4 日) 指出:“我 们过去从金融市场中得到了一些错误的经验。这些就是过去一些理论,比如说 市场有效理论,随机漫步理论,还有泡沫不存在理论,等等,可能在解释市场 方面还有很大的缺陷,我们应该实践一些新的金融经验,以使得市场进一步发 展。那么新技术包括计算机技术,互联网技术,包括更加面向客户,更加友好 的这些信息技术的使用,他们都有潜力,使得金融更加民主化,换句话就是使 得大众,更多的人能够在未来更方便,更广泛地使用动态风险管理工具。” 本文工作的想法就是从数据挖掘的角度,直接分析庞大的原始交易数据, 并利用统计工具,探讨股票市场的市场表现所蕴藏的内部结构特征。计算结果 表明,罗伯特希勒教授的观点在某些方面得到了应证。比如:罗伯特希勒 教授认为,股票的市场表现并非其基本面的完全体现。尽管按行业对股票进行 四川大学硕士学位论文 分类有着显然的合理性,而本文对按行业分类的板块相关性计算结果亦显示, 能够与行业基本面一致的相关性不到所有相关性的一半;罗伯特希勒教授还 认为,股票市场的上下波动并非象“随机漫步理论”所说的是完全随机的,本 文对数据挖掘的结果亦表明,上涨和下跌有着诸多明显不同的行为特征,比如 “慢涨快跌”、“轮涨齐跌”等。对这些事实的揭示,本身就具有其独到的数 据挖掘方面的价值。 针对我国深圳a 股市场4 5 4 只个股从1 9 9 8 年9 月日至2 0 0 3 年1 月7 曰的 日交易数据,采用按行业划分的板块结构,分2 4 个板块进行了对数收益率及其 分布的统计特征、持有期风险指标v a r 以及各行业板块间相关性的统计分析, 力求从按行业对市场上个股进行分类的角度。揭示、描述其市场表现的内部结 构特征,在为市场参与者提供基于计算机技术,更加面向客户,更加友好的信 息挖掘方面,作了一些尝试性的工作。 第二章预备知识 2 1 金融计算公式 2 1 1 股票原始价格数据采用上的误区及其修正 迄今为止。一些研究中国股市市场有效性及数字特征的文献中所直接下载使 用的股市市场数据是没有经过复权处理的。本文所使用的原始数据经过如下复 权处理。 复权公盏 、 设分配方案为每l o 股派息k 元( 己扣税) 送n 股配m 股( 配股价q 元股) , 除权前股价为p ,除权后实际股价为s ,复权价为p ,则 除权后,假设在市场交易没有产生股价涨跌的情况下,每股股价应为: ( 与原来股票相当的现金价值加上新支付的现金并减去新得到的现金) ( 支 付所有这些现金所获得的相应股票数量) = r l o p + m q - k ) ( 1 0 + n + m ) 除权后,由于市场交易产生了股价的涨跌,实际的每股价格为s ,为了把涨 跌的因素分解出来,用有涨跌的每股价格除以无涨跌的股票价格,就得到了一 个市场交易的涨跌因子s ( 1 0 + n + m ) ( 1 0 p + m q - k ) ,再用这个涨跌因子乘上除权前 的每股价格,即为复权价: 6 四川大学硕士学位论文 p = p s 0 0 + 一十m ) ( 1 0 p + 用吁一七) 2 1 2 收益率公式 p :第r 天的股票价格( 已复权) ,n :第f 天的单期( 时间间隔个交易 日) 收益率,( 七) :多期( 时间间隔七个交易日) 收益率,一:年名义收益率tf 。: 年真实收益率:l r :对数收益率 单期收益率:r ,:翌出 p 。 多期收益率:1 十r ( 七) = ( 1 + n + 1 ) ( 1 + ,m ) ( 1 + n + 1 ) = 兀( i + + ) j = l 对数收益率:业内人士通常将任一时间期限的收益率表示为年名义收益率,例 如。一个3 的3 个月真实收益率通常用1 2 的年名义收益率来表示。显然,由 多期收益率公式计算出的真实收益率比名义收益率偏大: r ,= ( 1 + 书一1 m 其中,坍是一年内收益记复利的频数,当m 趋于无穷大时,就称为连续复利。 这时,( 1 + ! 旦) 收敛到矿1 ,则 r 。e r 。一1 j e r = 1 + ,。j r 。i n ( i + r 。) 令扣= l n ( 1 + r j ,称f r 为连续复利收益率,也称为对数收益率。 本文采用的每只股票的单期对数收益率定义为: l n 旦:1 n 只幽b 一 ( 2 ) 只一, 实为单只股票原始价格复权处理后对数值的一阶差分值。 2 1 3 风险度量的v a r 指标 7 四川大学硕士学位论文 风险管理的基础和核心是对风险的定量分析和评估。主要方法包括灵敏度 分析、波动性方法、v a r 、压力实验( s t r e s st e s t i n g ) 、极值理论( e x t r e m e v a l u et h e o r y ,简称e v t ) 等。其中,l e a r 是目前金融市场风险测量的主流方法。 肠r ( v a l u ea tr i s k ) 计量的是在一定概率水平下,金融投资组合价值在持有 期内最多可能损失的金额。目前已受到业界的广泛认可,为全世界许多金融机 构在金融风险控制、机构业绩评估以及金融监管等方面所广泛采用。 假定口为金融资产的初始价值,是持有期内的投资收益率,则在持有末 期,金融资产的价值p = p 。( 1 + r ) 。假定收益率r 的均值和方差分别为u 和。 在某一置信水平c 下,金融资产最低价值p 。;。= p 。( 1 + ,m i 。) ,这里。表最低收益 率。则相对于金融资产价值期望的v a r 为相对瞻尼 丽绝对炀尼为 i z a r ,= e ( p ) 一p 。= 一p o ( ,m 。一) ( 3 ) v a r 。= p o p 。= 一p o i 。 本文采用的是相对v a r 。 ( 4 ) 2 2 统计预备知识 2 2 1 对数收益率数宇特征的统计量 假定某金融资产的对数收益率样本观测值为,2 ,0 ,则观测期内: 样本均值为:丑= i i 善k 。,样本方差为:号2 = 丢了骞( ,j 样本偏态为: s = 石= 吾喜( 。一国3 丘) 2 ( 5 ) 样本峰度为: 足= 丽= b 歹窑( 。一向4 ( 6 ) 当收益率服从正态分布时,偏态估计量s 的均值为0 ,方差为6 k :峰度估计量 8 四川大学硕士学位论文 k 的均值为3 ,方差为2 4 k 正态分布的k o l m o g o r o v s m i r n o v 检验: 设随机样本x ,x :,x 。的经验分布函数( e d f ) 为: s ( z ) :生, 聆 其中,q 是x s x ,的个数。k o l m o g o r o v s m i r n o v 检验统计量 见= 理答 m 删s o ,) 一f ( t ) j ,i s ( x 一一f ( t ) ) j ) , 在“样本来自真分布,( 砖”的零假设下有表可查。大样本的渐进公式为: 其中, p ( v f n d z ) 墨( x ) , 0 x f 一2 ) ,则拒绝零假设。 2 - 3 1 - 3 样本相关系数的现实意义以及与样本容量的关系 样本相关系数的现实意义可以从两个方面来理解。 一种理解是两个变量间同步变动程度的尺度。从公式( 1 0 ) 不难看出,以 正相关为例:相关系数越大,表明正相关性越强,若要相关系数的值尽量大( 接 近1 ) ,一方面从求和的意义上要求( x 一i ) 与( y 一歹) 要同号:另方面要求当 ( x 一i ) 的值较大时,( 儿一歹) 的值同时也较大,反之亦然。从实际意义上来叙述, 就是增减趋势的同步性和增减幅度的同步性。 另一种理解是回归直线对观测值拟合的程度。 设( x ,y ) 是x ,l r 的观测值,扛1 , 2 ,玎。线性回归模型为: y ,= p o + 届x + e , i = 1 , 2 ,一,l 其中, e ( e ) = 0 v a r ( e ) = o r 2 c o v ( p i ,e j ) = 0 ,( j d 风,届的最小二乘估计是使下面的残差平方和函数取到最小值的反,矗, 1 6 ( 1 4 ) 四川大学硬士学位论文 r s s ( p o ,届) = - 2 ,一反一届一) 分别对风和届求导,令导数为零,有 arss(po,p,)o :一2(),一风一屈_):opo 一u ,i 。 旦墨掣:一2 x ,( y 一p o 一届一) :o 阳, 一。 “” 整理得 , 8 0 n - 4 - i 一= 只 风一+ 属一2 = x , y , 解得 矗:鲨挚:鲨型掣 x ,2 一吉( x ,) 2t 2 一”( 吉x ,) 2 :苎兰! 二堕:墨兰:二三兰:二翌兰! 翌 t 2 一”( 习2一2 2 i 一+ i 2 ( t 一习( ) ,一歹) ( j ,一歹) 2 、 ( 一一i ) 2( 咒一歹) 2 ( t i ) ( y ,一歹)( m 一萝) 2 疗一1 ( _ 一i ) 2 ( y ,一歹) 2 ( 一i ) 2 玎一1 盯。 = ,- = 二 。盯j 注意到在回归模型( 1 4 ) 中,y 被看作因变量,x 看作自变量。若将x 看作因 变量,y 看作自变量,则相应的回归模型为 x 。= p ;+ p 1y f + e t , 完全类似地,有 屏= 拿 o , r 。? = 反烈 四川大学硕士学位论文 即,样本相关系数等于分别以x 和y 为因变量的两条回归直线斜率的几何平均。 较小的r 。2 意味着以垂直方向的偏差平方和为最小,和以水平方向的偏差平方和 为最小两个目标分别配制的回归直线在斜率上发生了较大的偏移,即对同样的 数据散点分布,向x 轴尽量拉平与向y 轴尽量拉平时,回归直线发生了较大的 转动,说明回归直线对实测值的拟合程度比较差。 由于本文数据量很大,需要讨论当样本容量n 很大时,相关性检验呈现的 特征。 计算与t 一检验临界值对应的统计量现实值的临界值屹 由( “) 式,有 。z = 撩 解出 ,2 = ( 1 5 ) 不难看出,样本容量n 越大,要拒绝“不相关”所要求t 一检验统计量的实测值 超过的临界值就越小。而且,只要n 足够大,( 1 5 ) 的右端总能小过事先给定 的屹,:,这说明当样本容量大到一定程度时,检验就失效了。对大容量样本间统 计相关性的检验,如何寻找使得检验失效的样本容量大小的临界值,这是需要 进一步研究的课题。可以断言的是,对相关性检验而言,样本数量并非越多越 好。 2 3 2 时间序列的自相关性 为了讨论时间序列数据的平稳性和独立性,需要分析其自相关性。 自相关分析讨论的是同一变量不同时期的数据之间的相关程度。 对于具有n 个观测值的时间序列y 。,其滞后1 期的数据形成的序列可以表 示为m 一其滞后期数据所形成的序列可表示为只一。当 y , 的均值不为0 时, 用以下方法估计 只 的自协方差函数: y k 少一。= 去薯( y ,一歹) ( y 。t 一歹) ,| | = 。,1 ,2 , 四川大学硕士学位论文 式中,n 是时间序列月的数据个数,罗= 去喜y ,是时间序列所有观测值的总 平均值。称 的估计 九) 为样本自协方差函数,令 a = 声一。= 尹。氏,k = 0 , 1 ,2 ( 1 6 ) 称 肼) 的估计 a 为样本的自相关函数。其具有9 。= l ,p 一。= 见,凤1 等性质。 当时间序列诸项之间没有自相关时,样本自相关系数的抽样分布近似于以0 为均值,以l 厂_ 为标准差的正态分布。 吖门 第三章数据来源和数据处理 3 1深圳a 股市场行业板块 本文采用经博文咨询公司的行业划分。行业板块名称及相应的股票代码参 见附录1 ,共含上述各板块共包括2 4 个板快4 5 4 只股票。所有个股数据从海通 成都证券网上交易系统下载。时间区间为1 9 9 8 年9 月8 日至2 0 0 3 年1 月7 日, 大致是深圳a 股大盘指数的一个上涨、下跌的行情波段。与实行涨跌幅限制以 前的数据相比,由于“异常值”被人为地截断了,换言之,波动性被人为地加 以了限制,所以,相应的收益率分布更接近正态分布。为了有一个直观的比较, 特选取了实行涨跌辐限制前一段相同时间段( 1 9 9 1 年4 月3 日至1 9 9 5 年7 月3 日) 的数据,分别给出了其对数收益率分布以及对数收益率分布的概率密度函 数的拟合曲线。 从图l 左面的同比例( 即,纵轴的变化范围一样) 对数收益率分布图可看 出,实行涨跌幅限制前后的对数收益率数据波动情况明显不同;图l 右面的拟 合分布曲线也明显不同:上图为实行涨跌幅限制前的对数收益率分布图,相应 的偏度为s k w n e s s = 0 6 8 3 ,峰度k u r t o s i s = 1 2 6 3 4 ,下图为实行涨跌幅限制后的对 1 9 四川大学硕士学位论文 数收益率分布图,相应的偏度为s k e w n e s s = 0 7 2 2 ,峰度k u r t o s i s = 5 4 5 2 。实行涨 跌幅限制前的数据理论波动范围为( m ,十m ) ,而实行涨跌幅限制后的数据理论 n 1 1 波动范围为( 1 n 了7 = ,i n 兰) ,在不同的变化区间内,同样一个数值所代表的波动性 l ul u 显然不同;同时,实行涨跌幅限制前的数据由于波动范围的原因,存在些较 大数值,因而具有明显更大的峰度。综上所诉,如果将两类数据混在一起,无 论是分析波动性还是分布特征都是不恰当的,所以在进行统计特征分析时,或 全部采用实行涨跌幅限制前的数据,或全部采用实行涨跌幅限制后的数据是完 全有必要的,本文全部采用实行涨跌幅限制后的数据。 可以看出,对数收益率分布拟合曲线具有类似正态分布的形状,但是否可 以认为就是服从正态分布呢? 这是每个研究者很自然会关心的问题。为此,需 要作统计检验。本文对实行涨跌幅限制前后期大盘指数的对数收益率数据,作 了正态性的反趋势正态概率图q - q 检验,结果见图2 。 反趋势正态概率图纵轴表示的是差值,该图描述在正态概率图中各点偏离 q q 正态概率直线的偏差。如果数据呈现出正态分布的特点,那么这些点应随 机地聚集在一条通过零点的水平直线的周围。 从图2 的反趋势正态概率图可以明显看出,绝大多数散点并非随机地落在 一条过零点的直线的周围,而是组成了s 型的明显曲线模式,因此有理由认为 数据拒绝正态分布。k s 检验采用l i l l i e f o r s 改进后更严格的k s 统计量,均拒 绝了正态分布:口= 0 0 1 时检验零界值分别为c ( 1 0 0 4 ) = o 0 3 3 t 0 0 l ( ) 时,相应的相关系数右上角加标签+ + ;当t t o 嘲1 时,相应的相 关系数右上角加标签+ ;表示在不同显著性水平下拒绝零假设。n 为参与相关系 数计算的有效观测值数量。 附录2 、附录3 和附录4 中的板块名称左到右( 从上到下) 依次为: 板电 公机基建交 能 农信 躯雾 块 房 子百纺工共化化机械础筑通盘旅瀛林轻商息冶 名 地 产货织业事工 纤 电制建材 工 融游开牧工贸技金 产 称品 业造设料具发尉术 四川大学硕士学位论文 将与各个板块相关性检验的p 值 0 o s 的板块按相关系数绝对值大小顺序列 表,结果见表4 。s p s s 原始计算结果见附录2 。 其中,房地产行业与金融、建筑材料、基础建设等成正相关,虽然相关系 数较小,分别为o 2 3 2 ,o 0 5 2 ,0 0 2 6 ,但不相关的概率很低,分别为小于0 0 0 1 , 0 0 0 1 和等于o 0 2 1 ,表明房地产行业收益率越高,这些行业的收益率也有越高 的趋势。与百货行业的相关系数更低,只有一0 0 17 ,但不相关的概率为0 0 2 1 , 小于0 0 5 ,表明房地产行业与百货行业成负相关。即房地产行业收益率越高, 百货行业的收益率有越低的趋势。 相关的概率很大( 即相关性显著) 而相关系数的值却很小的原因是,参与 相关性计算的数据非常多,导致检验相关系数的临界值非常小。从文献查到当 n = 1 0 0 0 时,置信水平为9 5 和9 9 的临界值分别为o 0 6 2 和0 0 8 1 。而本文的n 值为数千乃至数万,当然相应的临界值就更小。对于前面提到的使相关性检验 失效的样本容量的临界值的问题,本文除给出各行业相关性检验的原始结果, 还给出了参与计算的样本容量,如果能从其它旁证结果( 如财务数据等) 对行 业相关性进行验证的话,样本容量临界值的选择应该可以从中得到参照。 表5 观察期相关性强弱顺序表 房地产金融建材基建旅游百货 相关系数2 3 2 1 3 5 20 2 60 2 4一0 1 7 屯子产晶 石油盒融化纤交具农#蒇游 机电 公冶金 相关系数0 8 2 0 7 00 6 80 3 70 2 a0 2 30 2 30 1 90 1 2 百费有垅石油垒鞋化纤旅辩机电公事衷转冶盘地产 相关系敷0 6 3 0 5 80 5 70 3 40 2 80 2 8d 2 40 2 40 2 1一0 1 7 钫炽建材医药 相关系藏一0 2 4 o l 工业石油考战空具 相关系数 0 , 3 50 2 8 0 1 9 公共业袁#麓辨石油百货电子 褶关系教 o , t 1 55 0 3 5 0 2 0 0 7 9 化工叠矗化纤簟游表林能 相关熏敷 0 9 8 0 4 90 2 30 1 6 化纤盘融电子化工机制冶盘交能薄百盘 旅漪农林 相关系救 0 6 80 4 9 0 4 50 4 50 4 00 3 4 a 3 40 2 自 0 2 0 四川大学硕士学位论文 机电农#旅游百货 电子化工 相关系数 ,0 3 20 3 1 0 2 80 2 30 :2 9 机挂制造化纤有线轻工 相关系数 :0 4 5 0 3 1 0 1 7 基础建设地产 相关系赣0 2 6 建筑材料金融地产纺织交具抬金 相关系数 0 9 30 5 2一0 2 40 2 00 2 0 交具金融化纤旅游电子 石油建材工业 相关系数 0 7 60 4 00 3 70 3 70 3 52 00 1 9 金融地产旅游化纤化工石油建材交具电子 百货冶金 相关系鼓2 3 2 ,1 0 e 1 0 10 9 80 9 1 0 f 1 3 0 7 50 7 6d s 70 5 5 旅游金弛轻工化工石油公事机电百货化纤 地产电子农林 相关系数 t 1 0 80 4 5拈 0 4 10 3 50 3 10 2 80 2 8- 0 2 4- 0 2 30 2 1 能潦开发石油化纤化工 相关系数 0 3 80 3 4- o ,5 农林牧剐公事 石油机电轻工百货电子化工旅谫化纤 相关系数 0 4 50 3 50 3 2 0 2 50 2 40 2 40 2 3 0 2 10 2 0 轻工旋游农林机制 相关系数 0 4 50 2 5 0 1 7 商贸 相关系数 农林化纤机糖公事地产轻工纺织 相关系敷 0 4 40 :2 70 2 2 0 2 10 1 80 1 80 1 6 冶金金融 有境化纤石油百货建材电于 相关系藏 c 6 50 5 10 4 51 3 3 7 0 2 1 0 2 00 1 2 医药有拽纺织 相关系蠡0 2 8 0 1 4 有战舟络睫曩电子石油 工业 相关幕藏 0 6 3, 0 4 2由3 8, 0 3 6 石油开发垒融电子百货 旅游螗冶金农林交其 公工业 相关系敷 0 9 10 6 20 5 b 0 4 10 3 80 3 70 3 5 0 3 5d 3 50 3 3 3 5 四川大学硕士学位论文 观察上表发现:金融板块与其它板块的相关性相对最强,表明在观察期内, 金融板块最有理由充当整个深圳股市所有板块的“风向标”的角色;同时,更 重要的是,有些板块之间的相关性与行业基本面分析相吻合,有些则不能由行 业基本面分析来解释,这说明,上述统计分析的结果为我们提供了更为丰富的 信息这正是我们的数据挖掘工作所希望的结果。对结果的分析,则因分析 者的视角、手上的资料等而异。为了提供更为深入、细致的数据资料,进一步 将观察期( 1 9 9 8 年9 月8 日至2 0 0 3 年1 月7 日) 大致分为行情的上升期( 1 9 9 8 年9 月8 日至2 0 0 1 年6 月7 日) 和下降期( 2 0 0 1 年6 月8 日至2 0 0 3 年1 月7 日) ,重新考察行业板块的相关性。s p s s 的原始计算结果见附录3 和附录4 。 在上升期,金融、石油开发、有线网络对其它板块的相关性都相对比较强。 同时,金融和石油开发之间有相对较强的相关性,它们与有线网络都没有明显 的相关性。 在下降期,与其它板块相关性较强的板块,除了金融最强外,还有商贸、 有线网络和化纤,且这几个板块之间都存在明显的相关性。同时发现,各板块 的相关性整体来说更强了:有显著相关性的板块更多,尤其是板块间相关系数 更大。下降期比上升期有更强的相关性表明了:整个观察期的行情存在“轮涨 齐跌”、“异涨同跌”的特点。 值得注意的是,在下降期、上涨期以及整个观察期,行业板块的相关性都 出现了较大的差别。说明在行情的上涨和下跌阶段,板块间的关联性不同。 虽然对大盘指数对数收益率时间序列的平稳性检验中,自相关函数图对平 稳性假定不能作出拒绝。但由于我们能够利用大盘指数按行业分类的内部结构 的有关信息,并通过对各结构类别间线性相关性的挖掘,从而发现上涨期与下 跌期的诸多不同特征,如“快涨慢跌”、“轮涨齐跌”等,说明股票市场的波 动并非“随机浸步理论”所描述的那样,是完全随机地上下波动。我们有理由 认为,上涨阶段与下跌阶段有着不同的行为模式。 尽管大盘指数的对数收益率数据通过了平稳性检验,尽管各行业板块间的 相关系数很小,但是,对简单线性相关性的研究帮助我们发现了更深入的现象, 从而获得对客观现实更真实的认识。 第五章结论 5 1 现实意义下的成果。 除了一些一般性的结论,如整个股票市场具有“慢涨快跌”、“轮涨齐跌” 四川大学硕士学位论文 等现象被证实以外,被学术界普遍接受而极少数顶尖专家提出质疑的一些理论 如对“市场有效性理论”、“随机漫步理论”的质疑也在本文中得到了实证的 证据。 5 2 统计方法上的独到之处。 除了用常规的先进统计方法计算股票市场对数收益率的统计特征、风险指 标外,阐述了相关性包含对两个变量问增减趋势的关联性和增减幅度的关联性 及其对于股票市场的适用性,对样本相关系数的统计特征及检验进行了较为深 入的讨论。 5 3 数据处理和数据挖掘方面的积极尝试。 完成了对整个深圳a 股市场近五年的全部个股交易数据从数据收集、数据 整理到对全部数据进行整体统计计算的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论