聚类分析在证券市场分析中的应用_第1页
聚类分析在证券市场分析中的应用_第2页
聚类分析在证券市场分析中的应用_第3页
聚类分析在证券市场分析中的应用_第4页
聚类分析在证券市场分析中的应用_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

聚类分析在证券市场分析中的应用摘要:聚类分析是一种非常常用的数据挖掘技术,它在 证 券投资分析方面有很大的研究和发掘潜能与空间。投资者在实践中可以将聚 类分析应用于投 资分析中, 这样便可对股票的收益、成长、行业因素等方面进行全面的分析与考察,建立全面、合理的评价体系。研究者也可从多方面多 视角为市场的营销战略与策略提供非常科学的参考体系,并将其运用于整个市场分析。 总之,将聚类分析引入到证券市场的分析中来, 为各方面都提供了很好的需求。本文将选取甘肃、宁夏、青海在沪深证券所上市的企业为例,具体分析聚 类分析在证券市场 分析中的应用。关键词:聚类分析;投资分析;证券市场;SPSS 软件;Analysis of the application of clustering analysis in the stock marketAbstract: Clustering analysis is a very commonly used data mining techniques, it has a lot of research in securities investment analysis and the potential and space. Investors clustering analysis can be applied in practice in investment analysis, it can be for stock returns, growth, industry factors and so on to conduct a comprehensive analysis and investigation, a comprehensive and reasonable evaluation system. Researchers can also be used in many ways more perspective to the market marketing strategy and strategy offers a scientific reference system, and applied it to the whole market analysis. In a word, the clustering analysis is introduced into the stock market analysis, provides a good demand for everything. This article will select gansu, ningxia, qinghai, the listed companies in Shanghai and shenzhen securities as an example, the concrete application of clustering analysis in the stock market analysis.Key words: clustering analysis; investment analysis; stock market;spss software;目录第一章 引言 11.1 研究背景 11.2 聚类分析法 11.3 研究意义与方案 2第二章 聚类分析 22.1 聚类分析的原理概述 22.2 聚类分析的流程 32.3 聚类分析的方法 42.3.1 系统聚类法类间距离的度量 52.3.2 系统聚类法类的个数确定 6第三章 聚类分析在证券市场分析中的应用 73.1 聚类分析指标体系的建立 73.1.1 证券行业分析及指标的选择 73.1.2 指标评价体系 73.2 实证研究 103.2.1 样本数据标准化 113.2.2 用软件对数据样本进行聚类 123.2.3 聚类结果 213.2.4 结果验证 243.2.5 结果分析 26总 结 28致 谢 28参考文献 281第一章 引言1.1 研究背景我国进入改革开放以来,国内市场经济有着快速、健康的发展条件,证券业也从 20 世纪 90 年代开始迅速发展。就像不能否定我国经济发展所取得的成就一样,也不能否定我国证券业在这些年的发展。由于经济的发展,国民收入快速的增多,于是大家纷纷开始将更多的资金投入到金融市场中来,而证券市场又作为非常重要的金融市场,因此越来越多的人们将投资的目标锁定在证券市场。不过,事实也说明了问题,证券市场中,尤其是投资股票在过去的二十几年中,为很多投资者带来了客观的收益。但是,也并不是说证券业的发展只带来了积极的成就,在看到这些成就的同时也应该关注到目前还可能存在的一些不足。活跃在我国证券市场中的有一部分人缺乏投资证券的知识和经验,他们往往只关注于短线的操作,喜欢投机,同时各种媒体也不加以正确的引导,使得投机的氛围在这些人当中越来越浓。证券市场 应该有起到投资与融资、优化资源配置的作用。而这些问题是与这些作用想违1背的。现在,很多投资者都知道,证券市场中的股票市场是风云多变的,股价一直以来也是涨跌不定。有位著名的经济学家说过一句话, “如果股市只有操作,没有回报,那就是常说的一种零和博弈,钱只是在不同的人之间转手,并没有创造出更多的财富和价值。 ”因此,投入于证券市场的资金只有转移到真正能产生更多财富的企业当中,才能创造出更多财富,证券市场也才起到一定的作用。因此,正确引导那些投资者,认真的分析与研究市场和企业的发展前景和盈利能力,要有此心也要有此能。聚类分析就是一个很好且实用的研究方法,它能客观正确的研究与分析证券市场。1.2 聚类分析法回归分析、判别分析与聚类分析 一起称为多元统计分析中的三大分析方法。2而聚类分析是建立在某种优化的意义下,按照研究的对象的共性分类,他的基本目标是发现样品的自然分组方法,从而分辨出在某一些共性和特征上相似或相同的事物,并把他们按照这个共性进行划分成若干类别。聚类分析是起源于分类学的,很久以前,人们都没有专门可以利用的数学工具进行定性定量分类,于是只有依靠大家长期以来的经验来进行。伴随着科技的进步,人们对分类的要求也跟着提高,再2想依靠传统的经验来分类远达不到要求,于是只有将数学工具引入到了分类中,随着人们科学技术的发展,逐渐便形成了聚类分析。聚类分析的原则是同一类中的个体要具有一定的相似性,而不同类别的个体之间要具有较大的差异。它的优点和特征在于分类的结果是非常直观和清晰的,它的图标是能够很明确的表现其分类的结果,能够综合利用多个变量进行分类,它进行分类所得到的结果比以前传统的方法更全面、合理。1.3 研究意义与方案聚类分析是一种非常有效的、可以从多角度的为证券投资指导方向的分析方法。这种方法在很多领域都有了广泛的应用,但在证券投资与分析方面还有很大的研究和挖掘空间 。我国的证券业,尤其是股票市场虽然一直处于一个不稳定的状态,3但是毕竟还处于快速发展与健全的时期,相信我们所期待的规范时期即将到来。在现有的证券分析研究方案基础上,通过聚类分析的方法 ,引入反映公司收益性、4成长性、盈利能力等指标运用科学的手段证实它在证券市场分析中的作用,以期能为更多的投资者提供一种全面、客观的分析证券市场的方法并得到大家的认可。同时不断的引导和灌输投资者正确的理念和知识,并从中得到有意义的指导,让市场也可以更快更好的发展。本篇论文首先将从研究的背景出发,说明此论文研究的意义与可行性,引导出所需要用到的研究方法聚类分析法。然后将聚类分析的不同方法和步骤做进一步的解释。最后将聚类分析在市场具体细分中的应用做详细的介绍,并通过选取的45 家上市企业为实例,运用 SPSS 软件进行检验分析。全文通过这三个部分全面的对聚类分析在证券市场分析中的作用做一个深入的分析和总结。第二章 聚类分析2.1 聚类分析的原理概述在聚类分析具体应用到证券研究中的时候,我们可以将不同的证券用每股收益、每股净资产、市盈率等财务上的指标加以表现 。那么用数学符号就可以将证券研5究表示如下:iNii YY,2,1NjM 2,1;,13其中 表示所研究的第 i 个对象, 表示要研究的第 i 个对象的第 j 个属性。同时iYijY可以直观的将研究对象看作是 M 维空间上的一个点,而聚类分析所要做的就是将 M维空间上的 N 个点加以分类而已。这个分类标准就是距离。距离是作为样品之间的相似程度的度量,是聚类分析的基础。而我们可以用以下几类距离加以选择:绝对值距离、欧氏距离、马氏距离、明科夫斯基距离等。(1)绝对值距离mkjkiijYd1(1)表示的是研究的对象 i 到研究对象 j 的距离,而绝对值是以两个研究对象不相关ijd为前提条件的,当这个条件不满足时,其聚类的结果应该得到怀疑。(2)欧氏距离2/11mkjkiij Yd(2)(3)马氏距离1YjiTjiijmd(3)其中 和 分别表示所研究的对象 i 和 j 的 m 个属性所组成的向量, 是聚类变iYj 1量的协方差阵:,其中miiTY11 miY1(4)明科夫斯基距离qmkjkiijpqd/11(4)其中 ,当 时即为欧氏距离。 是表示权重,由于其选择的主观性、任意性1q2kP经常对其丢弃,忽视了研究变量的重要性差异因此研究结果不免偏颇。本文的距离选择了欧氏平方距离,因为后文选取的样本数据是 45 家企业的股票,它的分类是未知的。而马氏距离适用于随机变量的样本点,并用于已知变量类别的情况。明科夫斯基距离又是一种范式距离,欧氏距离是它的一种形式。但是,又鉴于后文所选取的指标有净利润增长率、资产负债率、基本每股收益、每股净资产等指标,他们都为连续变量,因此选择欧氏平方距离(SPSS 软件中为“平方Euclidean 距离” )最为合适。由公式(2)可知,欧氏平方距离为:mkjkiij Yd122(5)42.2 聚类分析的流程在实际的研究与分析中,运用聚类分析来研究证券市场应当按照一定的顺序与步骤来进行。以股票为例,首先我们得对要研究的股票建立一个综合的评价指标体系,如主营收入增长率、净利润增长率等客观指标。然后根据所了解的各类股票群的一些特征和状况划分出一个分析的范围,再对范围内的股票样本进行数据的收集。对收集到的数据进行处理,并用相关软件进行分析,最后再做出聚类分析的结果,取出其中有用的信息,为投资者做出决策。其流程图如图 2.1 所示:建立股票综合评价指标体系选定聚类分析的范围收集股票样本的指标数据求取行业指标的均值对数据进行标准化处理用 SPSS 软件进行聚类分析根据需要确定聚类程度分析聚类结果,做出决策图 2.1 聚类分析流程图2.3 聚类分析的方法聚类分析有很多种类,大致划分为以下几类:(1)快速聚类分析法快速聚类分析发的思想是首先将样品粗糙得分类,再依据样品间的距离按一定的规则逐步调整,直至不能再调整为止。它适用于样本数目较大的数据集的聚类分析,但它也有一定的局限性,需要事先指定分类的数目,并且这个数目对最终分类结果有较大的影响。快速聚类法的步骤首先也是要选择聚类种子点或者中心点,再将每个观察样本分配给最近的种子,然后重新把每个聚集中的中心点作为种子,并不断重复以上过程直到种子的变化足够的小。(2)模糊聚类分析法模糊聚类分析是采用的模糊数学语言对对象按一定的要求进行分类的方法。模糊聚类分析一般是指根据研究对象本身的属性来构造模糊矩阵,并在此基础上根据一定的隶属度来确定聚类关系,即用模糊数学的方法把样本之间的模糊关系定量的确定,从而客观且准确地进行聚类。模糊聚类分析所讨论的对象,事先没有给定任何模式供分类参考,要求按照样本各自的属性特征加以分类。它的原则就是“最小5化类间相似性,最大化类内相似性”。(3)最优分割法这种方法又被大家称为有序样品聚类法。简单的讲就是将研究对象的全部样品当作一类,然后根据某种最优的准则将其分割为两类,再分为三类,以此类推,直到样品被分割为我们所需要的类为止。(4)系统聚类分析法其基本思想是假设要研究的对象有 n 个样品,每个样品有 m 项指标。首先定义这些样品间的距离,然后将这 n 个样品看成是 n 类,再将最近的两类合并聚为新的小类,将已聚合的小类按其相似程度(用类间距度量)再聚合,,依此类推。这样每次缩小一类,直到最后将全部样品合成一类,并类的全部过程可以用聚类谱系图来描述。基本步骤如图 2.2:计算 n 个样品两两间的距离K=n,i=1合并距离最近的两类K=n-ii=i+1K=1否画谱系聚类图是决定分类个数及各类的成员图 2.2 系统聚类分析法基本步骤系统聚类分析法的特点为事先可以无须知道分类对象的分类结构,而只需要一批分类数据,然后选好分类统计量,并按一定的方法步骤进行计算,便能得到其分类系统图。它既可以对观测量也可以对变量进行聚类,既可以连续变量也可以是分类变量,提供的距离计算方法和结果显示方法也很丰富。在进行实证分析研究的时6候,往往采用不同的聚类分析法就会有不同的分类结果,而在实际过程中,系统聚类分析还是最常用的一种方法,因此本文也采用系统聚类分析法。2.3.1 系统聚类法类间距离的度量距离作为对样品之间的相似程度的度量是聚类分析的基础。假设以 i,j 分别表示样品 , 表示样品 之间的距离,含样品数为 与 的两个类为:jix,ijdjix, pnq,pnpG.21qqxG,.21类 与 之间的距离为 ,常用的类间距离定义如下:pqqD(1)最短距离 qpijpqjd,mn两个类中样品之间距离最短的作为类间距离,其特点是样品有链接聚合的趋势,因此不适合一般数据的分类处理。(2)最长距离 qpijpqGjdD,ax两个类中样品之间距离最长者作为类间距离。(3)类平均距离 pqGijijpqdn221两类中所有两两样品之间的平方距离的平均作为类间距离。这种方法是一种比较广泛,聚类结果也较好的方法。本论文便采用此方法来进行度量类间距离。2.3.2 系统聚类法类的个数确定在聚类分析中,最后数据对象的类的个数应该怎么来划分,将哪些划分为一个类别。虽然这没有一个统一的标准,但是常用的几种分类个数方法有:(1)根据数据点的散布图直观的确定分类个数如果指标只有 2 个,那么可以通过数据点的散点分布图来直观的确定。如果有3 个变量,则可以绘制三围空间的散点分布图,并通过旋转三维坐标轴由数据点的分布来确定应该分为几类。如果变量超过 3 个时,则需要综合这些指标,综合成 2 个或 3 个,再来确定。(2)根据聚类谱系图确定分类个数数据经过系统聚类法处理后,便会得到相应的谱系图。再根据如下准则确定分7类。首先任何类都必须在相近类中是突出的。各类所包含的元素不宜过多。分类的数目要符合实用目的。(3)根据聚类分析折线图确定分类个数在聚类分析中,把离的较近的类进行合并,因此在并类过程中聚合系数会呈现出增加趋势,系数越小表示合并两类的相识程度越大。在聚类分析折线图中,以 y轴表示聚合系数,x 轴表示分类数,画出聚合系数随着分类个数的变化曲线图。在曲线开始变得平缓的地方,选择较为合适的分类数。这种方法的优点就是简洁、直观,因此后文的分类数就是以此为依据来确定分类个数。第三章 聚类分析在证券市场分析中的应用3.1 聚类分析指标体系的建立3.1.1 证券行业分析及指标的选择利用聚类分析,我们首先得将研究的对象进行分类,然后再量化分析与研究,因此我们要建立相应的评价指标。影响整个证券行业价格水平的因素大概有收益性和成长性。这里我们选择每股收益、主营收入增长率和净资产收益率来评价行业因素对证券的影响 。86每股收益越高,反映的是整个行业的投资收益越高,每一股的获利的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论