版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
i//⋯llllIJIfIJl111.r/rllllll[/If/lllllfllllllClassifiedU.D.CSouthwesti//⋯llllIJIfIJl111.r/rllllll[/If/lllllfllllllClassifiedU.D.CSouthwestJiaotongA—SHARESTOCKPORTFOLIOBASEONMUIJIPLE—I’A。QUANTITATIVECandidate:Fang—Degree西南交通大学硕士学位论文主要工本人在学位论文中所做的主要工作(贡献)如下:本文以截止2012年5月24日A股西南交通大学硕士学位论文主要工本人在学位论文中所做的主要工作(贡献)如下:本文以截止2012年5月24日A股市场上的2395家上市公司作为研究对象,通过对上市公司的主要财务指标(所有者权益合计、净利润、营业利润(主营利润)、经营活动产生的现金流净额、总股本)进行分析,剔除了部分上市时间较短的公司,最终通过七个大的选股模型筛选出了十二个适于不同投资者的个股组合,主要工作如下:第一、本文采用的选股因子是市盈率、市营率、市净率、市现率、营利增率、现金流增率六个因子。本文对这六个因子进行了备选因子有效性的检验、有效但冗余因子的剔除,得出了在本文选股的样本区间内只有市净率、市盈率、市营率、现金流增率才是最有效的选股因子的结论。第二、本文采用andArcher的方法,以2011年3月31日的沪深300指数的样本股,对A股市场上做个股组合的最优规模进行了论证,得出了在A股市场上以只左右的股票来构建投资组合是最优的,这样既能有效分散风险又能最大获得收益。第三、本文对因子采用的是从低到高的打分方法,然后取得分较低的若干只股票进行个股组合,再从波动率、战胜市场基准概率、收益率(月度收益率、年化收益率、月度超额收益率)、风险指标(IR、Sharpe值、Beta)、t检验等角度对组合进行评价。所选出的股票组合在样本区间内大熊市行情下的表现全部优于市场基准,证明该选股方第四、本文分别针对个人、机构股市投资者提出了参考组合,以满足投资者多方本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其它个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名:乡2秀级日期:J-on第l摘要随着我国证券市场的不断发展,上市公司数量是日益增加。据世界银行数据库2011年的调查显示,2010年我国上市公司的数量达到2063家,上市公司总市值占国内生产总值比重为81第l摘要随着我国证券市场的不断发展,上市公司数量是日益增加。据世界银行数据库2011年的调查显示,2010年我国上市公司的数量达到2063家,上市公司总市值占国内生产总值比重为810%。截止20125月24日,我国上市公司总数达到了2395家,这个数量未来还会持续增加。如何在众多上市公司中去选择值得投资的股票,是每一个股市投资者都关注的关键问题。基于此,将详细分析上市公司的部分财务指标,并结合统计检验的方法,以求帮助投资者找出最具本文首先剔除了部分上市时间较短的公司,再对上市公司的主要财务指标(所有者权益合计、净利润、营业利润(主营利润)、经营活动产生的现金流净额、总股本)进行分析,用建仓目的股票价格派生出了市盈率、市营率、市净率、市现率、营利增率、现金流增率六个因子,对这六个因子进行了因子有效性的检验、有效但冗余因子的剔除,得出了在本文选股的样本区间内只有市净率、市盈率、市营率、现金流增率才是最有效的选股因子的结论。本文以建仓日沪深300指数的样本股为例,采用EvansArcher方法发现A股市场上做个股组合的规模在50左右为佳,这样不仅可分散风险还能获得更多收益。本文以沪深300指数作为市场基准,将市净率、市盈率、市营率、现金流增率四个因子分类为质量、价值、成长三类因子,构造了质量、价值、成长、价值质量、价值成长、质量成长、价值质量成长七个大的选股模型。对每个因子按照从低到高的顺序进行打分,选出总得分排名靠前的若干只股票构建投资组合。主要从收益率和风险两个角度对所选出的股票组合进行评价,最终从众多的股票中筛选出了十二个投资组合,这些组合来自不同的选股模型,很难对其优劣进行简单评价。这十二个组合都是优于市场基准的,适合个人投资者的有六个,分别是V5、QG20、VQ(I)20、VG5、VQG(I)20、VQG(II)15;适合机构投资者的组合有六个,分别是V50、QG45、VQ(I)40、VQ(II)45、VQG(I)45VQG(II)40资者可以根据自己的投资偏好选择投资组合。本文研究的主要意义也就在于通过量化的方法在A股市场找出若干支表现相对优秀的股票构建不同风格的投资组第1f合,并通过历史数据证明这些组合是有效的,从而达到为股票投资者提供投资参关键词:多因子;有效性检验;选股模型;组合规模;个股组合第1f合,并通过历史数据证明这些组合是有效的,从而达到为股票投资者提供投资参关键词:多因子;有效性检验;选股模型;组合规模;个股组合第|IIWiththedevelopmentofChina'sstockmarket,thenumberoflistedcompaniesdatafromtheBankWDIdatabaseof201increasingdaybyday.Thenumberoflistedshowsthatin2010第|IIWiththedevelopmentofChina'sstockmarket,thenumberoflistedcompaniesdatafromtheBankWDIdatabaseof201increasingdaybyday.Thenumberoflistedshowsthatin2010Chinaandthereaches2063oflistedcompaniesaccountedfortheproportionofGDPis81.O%.ByMay2012,thetotalnumberoflistedcompaniesinChinareaches2395andthenumberincreaseinworthinvestedstockmanyforeachstockinvestor.Basedonpaper akeytofmdoutthemoststockportfoliothroughanalyzingthecompaniesofcombiningthestatisticalThispaperfirstlyeliminatessomelistedcompaniestimetothenthemainasTotalindicators,sucActivitiesGeneratedEquity,NetProfit,OperatingProfit(MainFlow,NetTotalShareCapital.ThestockspriceofopenapositionderivessixincludingPriceEarningratio(PE),Priceratio,PriceBookratio(PB),ratio,ProfitIncreaseratio,CashflowIncreaseratio.TestCashsixvalidity,eliminatetheeffectivebutredundancyfactor,andthenobtainthattheBookratio(PB),PriceEarningratio,CashFlowratioarethemosteffectivestockselectionfactorsamongstockThispapertakesCSl300indexsampledstocksofopeningapositionasanddiscussesscaleofstockportfolioinA-sharemarketbyEvansshowthattheoptimalscaleofstockportfolioisaboutArcher’SBasedontheCSl300astheclassifiesPriceratio(PB),PriceEarningratio(PE)Operatingratio,CashFlowIncreaseintothreekindsoffactorsquality,value,andconstructssevenstockselection 第lV qualit)reachfactorfromlowtogrowth(VQG)severalstockstotalscoreranklowertotermsportfoliosaandindicatorsare1stockbyit第lV qualit)reachfactorfromlowtogrowth(VQG)severalstockstotalscoreranklowertotermsportfoliosaandindicatorsare1stockbyittheirdifferentstockaresuitablefordisadvantagewhichsuitableareinvestors。 V50、owntopreference.ThispaperaimsatfmdingrelativelystockinthencreatestylesofportfoliothroughprovedeffectivelybywhichCanhistoricaldata,SOastOachievethegoalreferenceforstockKeywords:Multiple-Portfolio;Stoc第V录目第1绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1研究背景和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯选题背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。1.1.2研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..2国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。3国内研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..4j峦评第V录目第1绪论⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.1研究背景和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯选题背景⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。1.1.2研究意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..2国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。3国内研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..4j峦评研究思路和行文框架⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.61.3.113.3技术路线⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯7相关理论概述⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.8多因子量化选股模型第2多因子量化选股模型的定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。8多因子量化选股模型的分类⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯备选因子处理备选因子的选取2.2.2备选因子有效性检测有效但冗余因子的剔除⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯lO模型的建立和选股⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1因子得分排序⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯112.3.2组合股票个数选择选股模型的建立多因子量化选股模型的绩效评价⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..132.4.1市场基准2.4.2无风险利率⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.2.4.3双总体t检验⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.2.4.4收益率评价指标2.4.5风险度评价指标⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.52.4.6战胜基准频率 7数据的选取与预处⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..18样本的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯1第3数据的说明9数据的选取19⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。20基于我国A股市场的实证分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21备选因子的选取⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。21⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯21⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯一第4第Vl4.4多因子选股模型的建立和选股组合股票个数的选择4.4.2质量模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4.4.3价值模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4.4.4成长模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第Vl4.4多因子选股模型的建立和选股组合股票个数的选择4.4.2质量模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4.4.3价值模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4.4.4成长模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.小结4.5四个衍生模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.4.5。1质量成长模型4.5.2价值质量模型4.5.3价值成长模型4.5.4价值质量成长模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯小结4.6本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯54组合的相关性分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯4.6.2风险收益特征比较⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯56论谢结致⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.58参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第1第1绪1.1研究背景和意义选题背经济全球化是当今世界经济发展的主要潮流,随着经济的高速发展,世界经济一体化的趋势也越来越明显。我国第1第1绪1.1研究背景和意义选题背经济全球化是当今世界经济发展的主要潮流,随着经济的高速发展,世界经济一体化的趋势也越来越明显。我国自改革开放以来,经济飞速发展,在世界经济体系中占有十分重要的地位,2011年GDP总值更是跃居全球第二,超越日本成为了世界第二大经济实体。中国的经济飞速发展,离不开上市公司对政府经济工作的支持。当经济发展到一定的程度,就会带来经济上的创新,股票就是在经济创新中产生的。众所周知,世界上第一张股票是1602年在荷兰阿姆斯特丹证券交易所上市交易的东印度公司发行的,从此以后,上市公司通过上市股票就可以募集到更多的资金进行再生产与投资。从1602年第一张股票发行开始到现在超过四百年了,全球的资本市场发生了巨大的变化,虽然上市交易金融产品也不在局限于股票,出现了诸如远期、期货、期权、互换等金融产品,但股票交易在资本市场中仍然占据着大半山河。俗话说,股市是一个国家经济的晴雨表,由此可见股市在一个国家的经济发展中的作用。自从上个世纪九十年代上海证券交易所和深圳证券交易所开业以来,我国上市公司的总数与日俱增,期间经历过不少挫折和坎坷,但我国的股市正在日趋完善,目前我国的股市分为A股和B股,A股下面又有主板、创业板、中小板,这说明我国股市是一个层次分明的资本市场,满足了不同的投资者对于投资的不同需求,对不同风险偏好的投资者而言也有不同的选择。来自世界银行WDI据库2011年的调查数据显示(见表1.1从表1.1可以看出,从20002010年十年间,我国的上市公司总数基本上是翻了一番,但是上市公司的总市值占国内生产总值的比例却是在提高,虽然2005年因为股改的影响使得上市公司总市值占国内生产总值比重有所下降,但并没有影响股市成为中国最主要的资本投资市场。目前我国A股市场的投资。http://wwwstatsgovcntjsjqtsjgjsjnollt20120711—402817378第2也日渐多样化,主要分为个人投资者、机构投资者、合格的境第2也日渐多样化,主要分为个人投资者、机构投资者、合格的境外机构投资者(俗称QFII,QualifiedForeignInstitutionalInvestors),虽然他们的投资目的和投资能力都不同,但是他们共同关注的不外乎是使自己所持有的资产增值保值。表l-1上市公司数和上市公司总市值占国内生产总值(GDP)比重截止到2012年5月24日,我国A股上市公司总共有2395家,而且随着时间的推移,上市公司还会变得越来越多。这些上市公司涵盖了各行各业,如何才能在这两千多家公司的股票中选取具有投资价值和高成长性的股票进行投资并获利?这是一个很复杂的问题,同时也是一个富有实践意义的问题。因此本文研究的重点在于挖掘上市公司背后的故事,通过对上市公司多的多个财务因子进行量化分析的方法在两千多家上市公司的股票中选出具有投资价值的股票做投资组合,以获取稳定的收益。1.1.2研究股票市场具有高风险高收益率的特点,如果投资者想从股市中获取收益,投资者就得具备一定的投资素养,具体包括选股跟择时两方面。股市是变化莫测的,市场中充斥着各种信息,如何甄别信息的真伪、如何降低风险以获取更高收益,是每个股市投资者关注的话题。目前关于股市的投资策略研究现状是:投资策略实证分析在学术上的研究目前较少,普通的投资者缺乏足够的专业知识进行投资策略研究,投资策略研究在各个券商、基金公司、机构投资者中盛行。由于投资策略的研究成果有产权之争,因此进行投资策略研究的机构往往只会将研究成果作为自己的投资参考,或者将这些成果通过产权的形式销售给其它的投资者,普通的投资者得到这些研究成果的机会是微乎其微。基于此,本文拟在前人的基础上进行量化分析,希望对投资者提供投资策略参考。量化投资最早于20世纪50年代起源于美国,90年代引入中国,是一种利用计算机技术且采用一定的数学模型去践行投资理念、实现投资策略的主动投资过程。主要内容包括:量化选股、量化择时、股指期货套利、商品期货套利、统第3计套利、算法交易、资产配置和风险控制八个方面。它的优势在于:纪律性、系统性、及时性、准确性和分散性。种种迹象表明,我国A股市场相对于海外成熟资本市场而言是新兴的资本市场,A股市场发展历史较短,有效性偏弱,市场上被错误定价的股票相对也较多,量化投资策略正好可以发挥它的优势来捕获股市场中的各种投资机会。近年来,我国已经推出了数十只量化基金,也取得了骄人的战绩,量化投资已经在中国形成了百花齐放的局面。我国上市公司的数量势必会越来越多,依靠传统的行业分析等方法进行股票选择很难选出高投资价值的股票来,量化选股很有必要。随着我国高等教育和计算机应用技术的普及,对于普通投资者而言,量化投资不再第3计套利、算法交易、资产配置和风险控制八个方面。它的优势在于:纪律性、系统性、及时性、准确性和分散性。种种迹象表明,我国A股市场相对于海外成熟资本市场而言是新兴的资本市场,A股市场发展历史较短,有效性偏弱,市场上被错误定价的股票相对也较多,量化投资策略正好可以发挥它的优势来捕获股市场中的各种投资机会。近年来,我国已经推出了数十只量化基金,也取得了骄人的战绩,量化投资已经在中国形成了百花齐放的局面。我国上市公司的数量势必会越来越多,依靠传统的行业分析等方法进行股票选择很难选出高投资价值的股票来,量化选股很有必要。随着我国高等教育和计算机应用技术的普及,对于普通投资者而言,量化投资不再是新鲜事物,他们必然可以运用简单的量化投资方法在A股市场中进行投资。本文通过对A股两千多家上市公司进行多因子量化选股分析,通过大量的数据处理和统计检验来确保选股的有效性,提出了明确的选股策略。希望本文的研究结果能给我国普通投资者以启示,从而促进量化1.2国内外研究现状迄今为止,关于多因子量化选股做投资组合的学术研究在国外的研究成果很多也很成熟,但是国内的学术上的研究较少,国内主要是众多机构的研究者在进行研究,他们的研究往往从市场实际出发,他们的研究成果跟实际情况就更接近,对于投资者而言也就更具有参考价值和实践意义。国外研究现量化选股是计算机技术和市场发展到一定阶段的产物,国外的专家学者以及各个机构投资者都在量化选股上面做了深入细致的研究。1990年诺贝尔经济学奖获得者Markowitz1952年提出了投资组合的相关理论,多因子量化选股正是基于众多的因子来分析单个股票的投资价值,再建立投资组合。Rosenberg,Reid,Lanstein(1984);Fama,French(1Vishny(1994)的研究成果表明账面价值受到很多因素的影响,在大多数时候并不能很准确地反应上市公司股票的内在价值。Asness(1997)认为,公司股票估值应该关注公司最近的基本面(诸如财务水平、偿债能力、盈利能力、现金流量充足第4程度等)数据的变化。FrankelLee(1998)认为投资者在关注公司股票价格之前更应该先关注公司的基本面数据。Dechow,Sloan(1997)和LaPorta(1996)分别在研究成果中提出市场预期系统误差对于长期收入的增长可以部分的解释为投资策略的成功和账面价值对于市值的效果。Fama,French(1995)和Chert,Zhang(1998)分低现金流、低盈利能力、低现金流、不断上升的财务杠杆。提出了从盈利能力、杠杆率,流动第4程度等)数据的变化。FrankelLee(1998)认为投资者在关注公司股票价格之前更应该先关注公司的基本面数据。Dechow,Sloan(1997)和LaPorta(1996)分别在研究成果中提出市场预期系统误差对于长期收入的增长可以部分的解释为投资策略的成功和账面价值对于市值的效果。Fama,French(1995)和Chert,Zhang(1998)分低现金流、低盈利能力、低现金流、不断上升的财务杠杆。提出了从盈利能力、杠杆率,流动性及资金来源、营运效率三个方面选取9个财务指标来对股票进行打分,如果某项财务指标大于临界值(一般为零),记为分,反之记为0分,根据打分的高低将股票区分出来,然后再选取若干只股票做不同的投资组合。2008的数据显示,Piotroski的多因子量化选股策略是其所跟踪的56个选股策略中的收益率唯一为正的策略。D.Pio仃oski的基础上将S.Mohanram(2005)最高PB的前1/5的股票作为作为研究样本,从盈利能力、增长的稳定性、财务的稳健性三个大的方面选取了9个指标进行打分,再做股票的投资组合。在股市应该投资多少支股票才可以有效的分散非系统风险?这也一直是困惑投资者和研究者的谜题。EvansArcher(1968)以S&P500指数的470支股票作为研究对象,得出了以8支股票作为投资组合可有效的降低非系统性风险。Lorie(1970)的研究成果肯定TEvansArcher8支股票的建议,但是Gruber(1977)的研究成果表IjYJEvansArcher建议投资股票的支数显然太少。TrippeR(1986)指出EvansArcher的研究方法会造成设定误偏(MisSpecification问题,他们认为需要更多的股票家数才能充分地分散非系统性风险。根据Evans,Archer的建议,得出投资股票的支数应该由成本效益的边际分析来决Line)配合Elton,Gruber所得出的投资组合支定,利用资本市场线(数与标准差的理论数值,以及市场利率与共同基金的交易成本,计算出借款的投资人至少需要投资30家股票,贷款的投资人至少需要投资40家股票。1.2.2国内研究现状国内近几年关于多因子量化选股的研究发展迅速,主要是以机构投资者自研为主,研究成果主要为机构投资决策参考。国内学术界关于多因子量化选股的论第5文几乎没有,国内学术界关于量化选股首推丁鹏(2012)编写的《量化投资第5文几乎没有,国内学术界关于量化选股首推丁鹏(2012)编写的《量化投资⋯.策略与技术》一书,该书主要引自各个券商的研究报告,对多因子量化选股做了详细的介绍,是目前国内不多见的量化投资书籍。书中关于多因子选股采用的是安信证券的金融工程分析师潘凡(2011)的研究报告,里面验证了30个常见选股因子的有效性,并且对其中的有效因子进行去冗处理,最后形成了一个基于9个有效因子的多因子选股模型。他在研究报告中重点强调的是因子有效性分析和有效但冗余因子的剔除两部分。殷鑫(2012Piotroski的基于P/B股票特征的财务指标评分选股方法对中国A股上市公司的股票2000~2012年的历史行情进行了回溯实证研究,结果表明,Piotroski选股策略构造的股票组合盈利能力良好,远超过同期的市场指数的收益率,因而是值得推广使用的投资选股策略。袁捷(2008)以沪深A股为研究对象,形成了市场大势判断指标、板块热点评判指标、技术分析评判指标、基本分析评判指标和主力机构支撑评判指标等五个指标体系的评判分析工具,得出了一套可以量化的投资评判标准。蔡健林(2009)参考加拿大皇家银行较为成熟的价值选股指标体系,结合中国股市实际,提出了两个模型,并对2004年9月30日到2009年10月30日的股票数据进行了拟合,结果表明,采用小波算法要比遗传算法的结果要好。汪洋(2010)以19个上市公司的财务指标和市营率、市净率、市销率等四个指标为研究对象对选股策略进行研究,结果表明,股票的评估指标体系对股票的超额收益率有着一定的影响,可以帮助投资者做出正确的投资决策。吴荻(2011)采用了多因素的Z评分选股方法对中国A股市场进行实证研究,先运用多因素Z评分对股票进行排序并分为上等、下等和其他三个等级,再将上等、下等中的股票按照市值加权平均构建最优和最劣两个投资组合,再在样本内外时期运用回溯检验分析模型的选股能力。结果表明,该方法是充分有效的。马辉(2012)选择了行业投资比例、betaalpha、预期收益率等四个方面的因子,再利用二次规划对投资者的个股进行了资产配置,使用户实现了在风险和收益之间1.2.3述综上所述,如何才能在股市中战胜市场?如何才能在股市中获得超额收益?第6这是每一个投资者永远追求的,因此也衍生出了各种选股策略。相对而言,多因子选股策略往往是有经验的投资者的首选,多因子选股策略综合了市场上的多方面信息,可以有效避免极端的情况带来的损失,还可以获得市场上潜在风险的超额收益。已有的研究成果虽然取得了很大的成绩,但尚有些许不足,主要有两点:一是大部分的研究成果虽然也是多因子选股策略,但是对于因子的有效性、因子有效但冗余没有加以考虑,更没有考虑组合的规模;第6这是每一个投资者永远追求的,因此也衍生出了各种选股策略。相对而言,多因子选股策略往往是有经验的投资者的首选,多因子选股策略综合了市场上的多方面信息,可以有效避免极端的情况带来的损失,还可以获得市场上潜在风险的超额收益。已有的研究成果虽然取得了很大的成绩,但尚有些许不足,主要有两点:一是大部分的研究成果虽然也是多因子选股策略,但是对于因子的有效性、因子有效但冗余没有加以考虑,更没有考虑组合的规模;二是在构建组合的时候很少考虑股票组合的规模对于非系统风险的分散程度,具有很大的随意性。基于此,本文将对A股市场上的股票进行多因子量化选股,综合考虑因子的有效性、剔除有效但冗余因子、组合的规模等多方面的因素,进行更为科学可1.3研究思路和行文框架研究思本文主要是研究如何运用多因子模型在中国A股市场中选取具有投资价值的股票做投资组合,样本选取的是截止2012524A股市场上2395市公司的股票,通过初步处理,剔除不符合要求的样本;第二步是对因子的有效性进行分析,剔除无效、有效但冗余的因子,根据各个因子的不同属性构建多个投资组合;第三步是对每个组合的投资策略进行绩效分析,通过与市场基准收益的比较及组合间的比较来对比不同的投资策略的选股能力。希望能选出目前股市场上最具有投资价值的股票建立组合。1.3.2行文框本文具体的行文安排如下:第1章是绪论,从中国A股目前的投资状况入手,强调多因子量化选股的然性。对国内外的研究现状做了相关的阐述,确定了自己研究的出发点。第章是相关的理论概述,从多因子量化选股模型开始,介绍多因子量化选股从因子选取到模型绩效评价一系列的相关理论,为实证研究打下理论基础。第3章是数据选取与预处理,介绍数据的来源及对某些数据的处理方式进行说明,对本文所第7要用到的计量统计软件进行简介。第4章是实证分析,进行因子的选取、因子有效性第7要用到的计量统计软件进行简介。第4章是实证分析,进行因子的选取、因子有效性及冗余分析、建立模型,再对模型进行绩效评价,选出最有投资价值的股票组合。最后一章是本文的结论,对本文的实证研究结果进行总结,得出A股的多因子量化选股是可行的。对下一步研究提出了展望。1.3.3技术本文技术路线如图1.1所示。本文主要分为两个大的板块,一个是模型的建立,另一个是模型的绩效评价。最终得出适合个人、机构投资者的个股投资组合。子\’~有效但冗余的剔建Archer3一>—组合规模篓篓l霍量l鬟薹l囊兰l霍薹ll囊薹}囊收益率评价指风险度评价指战胜基准频评选取I率l惦图1.1第8第2章相关理论概多因子量化选股模型多因子量化选股模型的多因子量化选股模型是指将影响公司股票价格以及公司价值的若干个重要的因素通过数量化的思想建立起来的估值模型。这些因素可以是公司的基本面指标,诸如市盈率、市现率、市营率等等,也可以是公司股票价格的技术面指标,与单因子选股模型一样,多因子量化选股模型也是很重要的选股模型,它克服了单因子选股模型选股面很窄、选股结果不科学等缺点,它的优势在于因素多、第8第2章相关理论概多因子量化选股模型多因子量化选股模型的多因子量化选股模型是指将影响公司股票价格以及公司价值的若干个重要的因素通过数量化的思想建立起来的估值模型。这些因素可以是公司的基本面指标,诸如市盈率、市现率、市营率等等,也可以是公司股票价格的技术面指标,与单因子选股模型一样,多因子量化选股模型也是很重要的选股模型,它克服了单因子选股模型选股面很窄、选股结果不科学等缺点,它的优势在于因素多、选股面广、选股结果相对科学。因为市场变化时瞬息万变的,单因子选股模型虽然在某一个时点选出的股票很科学,但是无法满足投资组合的长期持续性,相比较之下,多因子量化选股模型由于总结了众多因子的信息,所以多因子选股模型的结果更苛刻,也就更能满足市场的长期持续性。换句话说就是,多因子选股模型的表现相对于单因子选股模型而言的话更稳定,因为考虑的因子比较多,无论在何种市场状况下,总有一个乃至好几个因子在发挥作用。因此,在股票量化投资界里面,总是有很多宽客在研究多因子量化选股模型这些多因子量化选股模型的核心主要在于:一是因子的选取;二是如何运用选取的因子建立模型并得到最终的结果。多因子量化选股模型的通过对前人多因子量化选股的成果进行分析,不难发现,无论选择的因子个数是多少,基本上都可以将这些因子归纳为价值、成长和质量三类。通常价值类因子包括市盈率、市营率、市现率等;成长类因子包括营业利润增长率、净资产增长率等;质量类因子包括总资产收益率、净资产收益率等等。由此可以将多因子量化选股模型分为价值模型ⅣValue)、成长模型(GGrow)和质量模型Quality)--种基本模型。价值模型的主要作用是找寻出估值相对较低的公司的股第9票建立组合,成长模型主要是选择高成长性的公司的股票建立组合,质量模型主要是选择资质优秀的公司的股票建立组合。将这三个基本第9票建立组合,成长模型主要是选择高成长性的公司的股票建立组合,质量模型主要是选择资质优秀的公司的股票建立组合。将这三个基本模型ⅣGQ)组成子按照一定的权重(参考文献中是等权重或者V:G=5:5,V:Q=5:5,G:Q=5:5,V:G:Q334进行组合,还能得到价值质量模型(QV、价值成长模型ⅣG成长模型(QG)、价值质量成长模型(QVG2.2备选因子处理 备选因子的选取备选因子的标准从何而来?这依赖于市场经验和经济逻辑,选取更多、更有效的因子不光会使选股模型捕获信息的能力增加,还能提高选出的组合的收益率。备选因子的选取关键在于选择既有代表性又对所有上市公司适用的因子,故在选择备选因子的时候需多方比较,尽可能选择可以明显分出优劣等级的因子,不能涵盖所有行业的上市公司的因子尽量不选。如投入资本回报率(ROIC)这个因子在银行板块的股票中不能进行计算,在选择因子时不能选取这个因子,这个因子具有代表性但并不适用所有的上市公司。备选因子可以是上市公司的基本面指标,如市净率(P/B)、市盈率(PIE)、每股盈余(EPS)等;也可以是技术分析层面的指标,如移动均线①饮)、平滑异同移动平均线(MACD)、平均差等;或其它方面的指标,如宏观经济变量(利率、政策)等。2.2.2备选因子有效性检并不是所有的备选因子都对模型有效,选择有效的因子至关重要,因此有必要进行因子的有效性检验。关于因子的有效性检测方面,前人通常采用排序法来检验备选因子的有效性,国泰君安证券的金融工程分析师蒋瑛琨(2011年9月日)、安信证券的金融工程分析师潘凡(2011126各自的研究成果中因子的有效性检测方法进行了阐述,本文采用的是潘凡所采用的方法进行因子的有效性检测。对于任一备选因子而言,在模型建立的第一个月月初计算市场中每只股票该因子数值的大小,再按照一定(如从小到大)的次序对样本空间的所有股票进行排并将们平均iil2nn_N算每个的收益第10排名,持有这些组合到期末。期末计算这n个组合的年化复合收益率、相对市场基准收益的超额收益率、各个组合跑赢市场基准的概率。为了检测选股因子的有(1)如果某个因子能显著的影响组合的预期收益率,各个组合的排列序数应化复合收益率为_(i_l,2,...,Il,n∈M,所第10排名,持有这些组合到期末。期末计算这n个组合的年化复合收益率、相对市场基准收益的超额收益率、各个组合跑赢市场基准的概率。为了检测选股因子的有(1)如果某个因子能显著的影响组合的预期收益率,各个组合的排列序数应化复合收益率为_(i_l,2,...,Il,n∈M,所有组合的排列序数就是,=【e,‘】与之对应的收益率就是X=盹,气,⋯,■】’,x与I的相关性绝对Abs(Corr(X,功应该Abs(Corr(X,,))≥MinCo(2—其中,MinCorr是模型所设定最小的相关性临界(2)设排在第一位的和最后一位的两个极端组合相对市场基准的超额收益分别是AR,和么E,如果彳墨>彳R(因子越小,收益越大),两者须满足如下条件彳足>MinAR,oe>0和么B<MinARb。黼<0反之,如果彳墨<么R(因子越小,收益越小),两者须满足:AR.>MinARto,o>0和么R<MinARbo.o,.<0其中肋叫R。黼分别是两个极端组合超出市场基准收益的最小临界值,前者是跑赢市场基准的组合,后者是跑输市场基准的组合。(3)在检验期间,无论市场的走势是以何种形式(上涨、下跌、振荡),排在第一位的较高收益组合应该以较高的概率跑赢市场基准,排在最后一位的较低收益组合应该以较高的概率跑输市场基准。如果某一因子同时满足上述三个条件,至少能说明该因子在过去某一特定的时间段里可以表现出良好的选股能力,这个因子也就可以作为被进一步筛选的有效因子2.2.3有效但冗余因子的剔除对于有效但冗余的因子剔除方法参考安信证券的金融工程分析师潘凡(1年1月26日)提出的方法。同类的选股因子可能会因为其内在的相近因素使得所第11选出的股票组合在收益率和股票结构等方面具有较高的一致性。即同类因子的作用可能会重合但是不会叠加,这些因子就是冗余因子,因此要保留同类因子中区分度最高、收益最好的一个因子,剔除冗余因子。假第11选出的股票组合在收益率和股票结构等方面具有较高的一致性。即同类因子的作用可能会重合但是不会叠加,这些因子就是冗余因子,因此要保留同类因子中区分度最高、收益最好的一个因子,剔除冗余因子。假设上一步总共选取了k个有111月,剔除冗余因子的具体步骤如下:(1)先对不同因子所构造的n个组合进行打分,组合得分的分值与组合在模型构建期的收益率有关,收益率越大,组合得分就越高。令排列第1的和第的两个极端组合相对基准的超额收益率分别是彳蜀和彳心,如果么墨<AR,,则将组合j值设为j0=12n如果么墨>彳也,组合J的分值就为n-j+l(jl2n)。组合的分值确定后,将得分赋值给每月该组合内的所有个股。(2)按月度计算所有个股的不同因子得分间的相关性矩阵,令第t月的所有个股因子得分相关性矩阵为:(Score—Con',∽,),材,V=l,2,...,k,U跟V为不同的因子。(3)计算整个样本期内相关性矩阵各个元素的平均值,计算公式为(4)设定一个得分相关性阀值MinScoreCorr,在得分相关性均值矩阵中该阀值的元素所对应的所有因子里,只保留与其它因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。2.3模型的建立和选股因子得分排首先选取去除冗余因子后的有效因子,将股票池中的股票分别按照各个属性的有效因子进行排序(价值类因子从d,N大的顺序、成长指标和质量指标按照从大Nd,的顺序),然后对每个指标的股票排序进行打分,排在第一的股票记为排在第二的记为2,依次打分,排在第n的就记为ii,最后将股票的得分分别除以总的股票只数n,也就是说,所有股票的分数构成了(o,1】分布。第122.3.2组合股票个数选择股票组合的市场风险由系统性风险和非系统风险组成,其中系统性风险不可分散,非系统风险可以通过增加股票的个数来使风险分散化。但股票组合的个股数量并不是越大越好,一方面,组合股票数量达到一定的程度时,非系统风险的边际降低程度会递减,随之而来的较高交易费用、管理成本将会开始蚕食组合的收益率;另一方面数量众多的证券组合中可能包含一些无法及时得到相关信息且收益较低的证券,从而增加了及时有效进行投资组合调整的难度,因此需要在分散风险和提高收益之间找寻一个平衡点。本文采用Evans,Archer(1968)提出的方法对组合的分散化程度进行度量。具(1)以股票组合的标准差为因变量对组合规模k的倒数进行回归,估计出回归系数舀及夕,回归公式为第122.3.2组合股票个数选择股票组合的市场风险由系统性风险和非系统风险组成,其中系统性风险不可分散,非系统风险可以通过增加股票的个数来使风险分散化。但股票组合的个股数量并不是越大越好,一方面,组合股票数量达到一定的程度时,非系统风险的边际降低程度会递减,随之而来的较高交易费用、管理成本将会开始蚕食组合的收益率;另一方面数量众多的证券组合中可能包含一些无法及时得到相关信息且收益较低的证券,从而增加了及时有效进行投资组合调整的难度,因此需要在分散风险和提高收益之间找寻一个平衡点。本文采用Evans,Archer(1968)提出的方法对组合的分散化程度进行度量。具(1)以股票组合的标准差为因变量对组合规模k的倒数进行回归,估计出回归系数舀及夕,回归公式为其中砖是股票组合的标准差,k是组合包含的股票数。回归结果中,&表示(2)对于不同规模的k,计算出残余可分散风险占比曼掣兰,残余可分散风险口占比越小则分散化程度越好。2.3.3选股模型的建立选择去除冗余因子的有效因子,按同一属性的各个有效因子的得分进行等权根据实际情况选择排名靠前的若干只股票。例如,选择得分在所有排名中的前若干只股票建立投资组合。借助相关的交易软件构造投资组合指数,比较投资组合跟大盘指数的收益的差异。第132.4多因子量化选股模型的绩效评价市场基准的在评价一个股票组合的投资业绩时,必须选择一个市场业绩衡量基准。这个市场基准应该至少涵盖市场上上市公司总市值的一半以上,而且具有良好的市场代表性和可投资性,且能很好地反映市场上股票价格变动的概貌和资本的运行状况。更重要的是,市场上大部分投资者都会以这个作为市场基准来衡量自己的投资业绩。一般而言,符合这个标准的市场基准往往是代表某个市场的市场指数(如S&P500、Nikkei225、沪深300指数、上证指数等等),用某个市场上的股票组合跟某个市场的市场基准之间作比较,研究所得出的结论才更科学、更有实际意义。2.4.2无风险利第132.4多因子量化选股模型的绩效评价市场基准的在评价一个股票组合的投资业绩时,必须选择一个市场业绩衡量基准。这个市场基准应该至少涵盖市场上上市公司总市值的一半以上,而且具有良好的市场代表性和可投资性,且能很好地反映市场上股票价格变动的概貌和资本的运行状况。更重要的是,市场上大部分投资者都会以这个作为市场基准来衡量自己的投资业绩。一般而言,符合这个标准的市场基准往往是代表某个市场的市场指数(如S&P500、Nikkei225、沪深300指数、上证指数等等),用某个市场上的股票组合跟某个市场的市场基准之间作比较,研究所得出的结论才更科学、更有实际意义。2.4.2无风险利无风险利率是指将资金投资于某一项没有任何风险的投资对象而能得到的利息率。这是一种理想的投资收益,一般受基准利率影响。在美国这样成熟的资本市场上,美国国库券(国债bond)的利率通常被公认为市场上的无风险利率,这是因为美国政府的公信力被市场认可,被认为不会出现违约的行为。国内的资本市场在制度方面还不够成熟,无风险利率选取的标准也不一样,央行最近发布的10年期国债利率、1年期存款利率、5年期存款利率都可以当作是无风险利率2.4.3双样本t双样本t检验是检验两个样本的均值与其各自代表的总体之间的差异是否显著。双样本t检验分两种情况:(1)独立样本均值的显著性检验,样本间两两相互独立,用于检验独立样本之间的显著性差异;(2)相关样本均值的显著性检验,样本间存在一定的相关性,用于检验相关样本间的显著性差异。本文比较的是股票组合的收益率与市场基准收益率是否具有显著性差异,股票组合所选取个股可能也是市场基准收益率组合所选取的个股,因此二者具有相关性。所以采用相关样本的双样本t检验。第14相关样本的双样本t检验公式如下:∥1一t=其中“、段分别是两个样本{Xl}、{X:)的平均数,&、屯分别是两个样本{X。)、{x:}的标准差,,是两样本的相关系数,第14相关样本的双样本t检验公式如下:∥1一t=其中“、段分别是两个样本{Xl}、{X:)的平均数,&、屯分别是两个样本{X。)、{x:}的标准差,,是两样本的相关系数,自由度是强+吃一2相关样本的双样本t检验原假设风一≠段,即假设{x,)、{X:)的平均数之之间没有显著性差异;备择假设马:2.4.4收益率评价指标对于某一个股票组合的好坏,可以用收益率去衡量。本文所选取的收益率主要有三个:总收益率、年化复合收益率、相对收益率。(1)假定初始建仓日期为五,建仓时总权益为^‘,平仓日期为互,平仓时总权益为Ⅳ2,则总收益R_-N"2-(2)年化复合收益率单独看总收益率并不能说明一个投资组合的好坏,因为总收益率跟投资的期限长短有关系,投资期限越长,总收益率就越高。因此判断一个投资组合的好坏用年化复合收益率更合适。年化收益率为R:r1+必×100%悟:rl+盟×100%P(2-LJL/其中互一五表示投资期限,气争表示将投资期限折算成年第15尘萨100%表示的是投资组合在互一五这段投资期限内的总收益第15尘萨100%表示的是投资组合在互一五这段投资期限内的总收益率。(3)相对收益率相对收益率是用来查看某个投资组合的收益率相对于市场基准收益率的好坏程度,亦可称为超额收益率。用以下公式表示相对收益率=总收益率.业绩基准收益率相对收益率=年化复合收益率.业绩基准年化收益率一般情况下,后者用的较多。业绩基准往往是代表某个市场的市场指数如(S&P500、Nikkei225、沪深300指数、上证指数2.4.5风险度评价指标对于投资者,特别是机构投资者而言,收益率固然能从一方面去判别一个投资组合的好坏,但是并不是判别好坏的唯一标准,投资者在注重收益率的同时更加注重资产的风险。因此,风险度指标从另一方面可以辅助收益率指标体系来衡量一个投资组合的好坏。本文所选择的风险度指标主要有:B系数、Sharpe(1)13系p系数来源于统计学,在投资学里面反映的是某一投资资产相对于市场基准的变化。一般用p系数的绝对值来表示变化幅度,如果绝对值越大,表示资产的收益变化相对于市场基准的变化越大;反之,表示相对于市场基准的变化越小。如果p系数为负,表示收益跟市场基准是反方向变化的。因此,p系数常作为察投资策略降低投资波动性风险能力的指标。在计算p系数时,不光需要投资策略的表现数据,还需要反映市场基准表现的数据(通常是最能表现市场的某个指数)。p系数的定义为:展=铬协其中,‘是投资组合k的收益率,%是市场组合的收益率,Cov(rk,厶)是投第16资组合k的收益率与市场组合收益率的协方差,var(r.)是市场收益率的方差。系数一般通过定义来估计,因此可以将p系数的定义扩展为:c2v㈥一挈咧啊圭k在第t个时间段(如El、周、月、年等)的收益率,咯是投资组合k在第16资组合k的收益率与市场组合收益率的协方差,var(r.)是市场收益率的方差。系数一般通过定义来估计,因此可以将p系数的定义扩展为:c2v㈥一挈咧啊圭k在第t个时间段(如El、周、月、年等)的收益率,咯是投资组合k在某个时间段(如T天、T周、T月、T年等)的平均收益率,T是时间的长度。‰是证券市场组合在第t个时间段的收益率,_是证券市场组合在某个时间段的平均收益率。(2)Sharpe1990年度诺贝尔经济学奖得主威廉·夏普(Sharpe)以投资学最重要的理论基础Model,资本资产定价模型)出发,AssetRatio)又被称为夏普指数,用以衡量金融资展出名闻遐迩的夏普比率(SharpeSharpe率的计算公式是q=其中,名是收益率均值,0是无风险利率,%为收益率的标准差。沼Sharpe率反映的是单位投资组合平均收益率超过无风险收益率的程度。其值为正,则该考察期内投资组合的平均收益率大于无风险利率,说明在该短时期内投资该组合比银行存款的收益要高。Sharpe率越大,说明该投资组合的单位风险能获得的风险收益越高。(3)信息比率IR(InformationRatio)的定义其中,口为组合相对市场的超额收益率,彩为主动风险。信息比率以马克维茨(Markowitz)的均异模型为基础,用来衡量超额风险带来的超额收益,比例第17说明超额收益越高。信息比率表示单位主动风险所带来的超额收益。在基金管理中,信息比率通常用来衡量基金的选股能力,将基金报酬率减去同类基金或者是市场基准报酬率(剩下的值为超额报酬),再除以该超额报酬的标准差,信息比率越高,该基金表现持续优于市场基准的程度越高。合理的投资目标应该是在承担适度风险的情况下,尽量的去追求高的信息比率,而非单纯的追求高信息比率。2.4.6战胜基准第17说明超额收益越高。信息比率表示单位主动风险所带来的超额收益。在基金管理中,信息比率通常用来衡量基金的选股能力,将基金报酬率减去同类基金或者是市场基准报酬率(剩下的值为超额报酬),再除以该超额报酬的标准差,信息比率越高,该基金表现持续优于市场基准的程度越高。合理的投资目标应该是在承担适度风险的情况下,尽量的去追求高的信息比率,而非单纯的追求高信息比率。2.4.6战胜基准频战胜基准频率也是衡量组合好坏的一个指标。它所显示的是组合指数超过市场基准指数的频率,战胜基准频率数值较高的话说明组合能以较高的概率获取市场较多的超额收益率,战胜基准频率数值较低说明组合以较低的概率获取市场较第18第3数据的选取与预处3.1样本的选截止到第18第3数据的选取与预处3.1样本的选截止到2012年5月24日A股上市公司总共有2395家,以这2395家上市公司的财务数据为样本空间,从2010年第一季度开始,以季报为单位,基本数据为所有者权益合计、净利润、营业利润(主营利润)、经营活动产生的现金流净额、总股本5个指标,并由此衍生出了市盈率、市营率、市净率、市现率、营利增率、现金流增率6个指标,表31对于各个因子的名称和定义有一个解释。对于市盈率、市营率、市净率、市现率采用向前滚动三个季度的方法,也就是说,如果采用最近一季度的季报,我们都用这一季度的季报再加上前三季度的季报得到季报之和,再采用这个和来计算滚动的市盈率、市营率、市现率、市净率、营利增率、现金流增率采用历史同期水平做同比,这样更能说明在历史同期公司的经营状况,但是由于营利增率、现金流增率的数据会出现极端的状况,因此采用向前滚动三季度的增长率加上当季的增长率再求均值,这样数据会相对准确一点。最终以这六个指标作为研究对象,进行进一步的分析。表3.1各个因子的名称和注:表中的最新价是指的组合构建之目的股票价格。本文的建仓日为2011331在当日停牌的股票就以后一交易日年4月1日)的价格补上。在数据的与处理中,剔除了总股本为O、所有者权益为0、净利润为0、营业利润为0、经营活动产生的现金流净额为O的股票,在建仓当日最终还剩下2040只股票,本文的主要目的是对这2040只股票中进行多第19因子选股且构建投资组合。对于市盈率而言,市盈率是越低越好,但是由于市场上的股票不会出现负的状况,所以在市盈率排序打分时,剔除了市盈率为负的140只股票,最终剩下1900只股票。本文对于ST和*ST的股票不做剔除,本文是第19因子选股且构建投资组合。对于市盈率而言,市盈率是越低越好,但是由于市场上的股票不会出现负的状况,所以在市盈率排序打分时,剔除了市盈率为负的140只股票,最终剩下1900只股票。本文对于ST和*ST的股票不做剔除,本文是针对全部的A股进行多因子选股,就必须考虑模型建立的客观性,ST和的股票既然能入选,就说明这些股票已经脱胎换骨进入优质股级别了。3.2数据的说本文的财务数据全部来自于Wind数据库,股价与指数行情数据全部来源于交易行情软件Foxtrader,对于每个策略都采用在Foxtrader构造指数的形式来衡量组合收益的,这样就不用去计算组合的真正的收益率了,直接计算指数的收益率再比较大小,简化了大量的计算过程。为了更好的表达出股票组合的市场表现和组合的优劣,本文在交易行情软件Foxtrader里面对选出来的前N只股票按流通股的股本权重来构造指数来表示各个投资组合策略。本文所选取的市场基准是沪深300股价指数,所以选择沪深300股票指数作为基准,是因为它反映了中国沪深A股市场上股票价格变动的情形和资本的运行状况,它的样本涵盖了沪深A股70%左右的市值,具有足够市场代表性。为了更好地体现每个投资组合策略跟市场大盘的关系,每个投资策略指数的基期是2011331基点是322329,这样投资组合跟大盘的构建指数的另一个优点是,Foxtrader可以解决数据缺失的问题,这样就避免个股因为当天停牌或者其它原因造成的数据缺失所带来的数据处理问题,使问3.3数据的选本文以2011年3月31日为组合建仓日,所有的组合指数都选取从20113月31日到2012年10月31日共387个日交易数据作为样本期。其中2011年月31日到2011年12月30日共187个日交易数据作为因子检验筛选期年1月4日到2012年10月31日共200个日交易数据作为选股模型的样本外检验期。本文的无风险利率采用的是2012年7月6日人民银行最新确定的1年期第20定期存款利率3.O%,数据来自中第20定期存款利率3.O%,数据来自中国人民银行官方网站圆。本文所采用的收益率列不是对数收益率序列,而是每一天的收盘价对建仓日的收盘价的收益率序列,即墨2{},(i_l,2⋯·,387)其中Ⅳi表示的是指数第i天的收盘价,Ⅳo表示是指数在建仓日的收盘价。3.4本文所用到的相关软件本文的财务数据全部来自于wind资讯数据库,本文的交易数据全部来自于阳光飞狐的Foxtrader,本文处理数据使用的软件包括Foxtrader、foxpro6.02008a、SPSS、EViews6.0圆hrtp://www,pbc.gov.cn/publish/zhengcehuobisi/631/2012/20120706180100684952896/2012070618096-第21第4基于我国A股市场的实证分备选因子的选取上文提到,本文以2395家上市公司的财务数据为样本空间,从2010年第一季度开始,以季报为单位,基本数据为所有者权益合计、净利润、营业利润(主营利润)、经营活动产生的现金流净额、总股本5个指标,结合建仓当日的股价,衍生出了市盈率、市营率、市净率、市现率、营利增率、现金流增率六个指标。第21第4基于我国A股市场的实证分备选因子的选取上文提到,本文以2395家上市公司的财务数据为样本空间,从2010年第一季度开始,以季报为单位,基本数据为所有者权益合计、净利润、营业利润(主营利润)、经营活动产生的现金流净额、总股本5个指标,结合建仓当日的股价,衍生出了市盈率、市营率、市净率、市现率、营利增率、现金流增率六个指标。这六个常用的选股指标就是本文所采用的备选因子。上文对这六个因子分别有详细的介绍,此处不再赘述。4.2备选因子有效性的检验首先,计算每个个股在建仓目的各个候选因子得分,再进行排序,具体步骤如下(1)计算2011年3月31日每个个股的各因子指标,在涉及财务指标的计算时采用最新的财务报表以反映公司最新的财务状况。(2)根据各个因子指标的计算结果,按照一定的顺序(价值类因子从d,N的顺序、成长指标和质量指标按照从大Nd,的顺序)对股票样本进行排列。接着对每个股票进行打分,排在第一位的个股得分为l,排在第二位的个股得分为依次类推,排在最后一位的个股得分为1900。为了方便研究,再将所有个股的得分全部除以1900得到一个(o,11分布,最后将所有的样本股票按照不同的得分情况升序排列(升序的打分方法为小分值的个股排列在前,反之,降序打分法为大分值的个股排列在前)后再平均分成5份,每一份包含着380支个股,每一份作为一个组合在Foxtrader软件里面按流通股的股本权重构造组合指数,每个指数的基期是2011年3月31日,基点是322329点。(3)计算不同因子下的5个排序组合的复合年化平均收益、相对于业绩准的平均年化超额收益、战胜或跑输市场的概率等。以上因子有效性检验的相关数据如表41所示,从中可以看出,表现最好的第22因子是市营率,它的第1组合9个月的年化复第22因子是市营率,它的第1组合9个月的年化复合平均收益率为一28.83%,而同的沪深300指数复合收益率只有一40.1%;第5组合的年化复合平均收益率更低,仅为·59.03%;5个组合序数与收益率的相关系数为-0.9660,说明该指标的选股区分度很好;组合1在所有的交易日里面以9625%的概率跑赢市场,组合在所有的交易日里面以8717%的概率跑输市场,这也可以说明该因子的选股区表4.1因子有效性检验相关数据注:沪深300指数从2011年3月31日到2011年12月30日的平均年化收益率是.22.57表4.2通过有效性检验的因子根据2.2.2节备选因子有效性检测所列的三个评估因子的有效性标准假定,做出本文评价因子有效性的标准如下:(1)组合序数和组合年化复合平均收益率相关性阀值MinCorr取值为0.5;(2)两个极端组合的最小超额收益阀值和MinA‰肭分别取值5.00%和一5.00%;(3)两个极端组合中,高收益组合能以70.00%以上的概率跑赢市场基准,低收益组合能以70.00%以上的概率跑输市场基准。根据以上的三个数量标准,结合表4.1的数据,剔除了市现率、营利增率第23这两个无效的因子。表42列出了剩下的有效选股因子。4.3有效但冗余因子的剔除根据2.2.3节提出的打分方法,在每个月月初计算所有个股在不同选股因子下的得分,再计算这些分值之间的相关性矩阵,最后计算整个样本期(1年月31日到2011年12月第23这两个无效的因子。表42列出了剩下的有效选股因子。4.3有效但冗余因子的剔除根据2.2.3节提出的打分方法,在每个月月初计算所有个股在不同选股因子下的得分,再计算这些分值之间的相关性矩阵,最后计算整个样本期(1年月31日到2011年12月30日)的相关性矩阵平均值,具体的相关性平均矩阵如表4.3所示。所有的个股的因子得分都按照升序排列(个股得分方法参见42节)平均分为5组。丁鹏(2012)在他主编的《量化投资——策略与技术》一书中提安信证券工程师潘凡选取的得分相关性阀值MinScoreCorr取值为O.5,本文MinScoreCorr也取值为O.5。表中所有因子的平均相关系数均小于阀值。由以判定,经过因子有效性分析剩下的四个因子之间均不存在大范围的选股效果冗余问题表4.3有效因子打分相关性平均值矩阵因此,本文进行多因子选股分析的有效但不冗余因子为市净率、市营率、市盈率、现金流增率四个因子。4.4多因子选股模型的建立和选股上文的数据结果表明最终的股票综合评价模型是由4个分值相关性较小因子组成的。为了评估个股的综合表现,会在选股建仓日对所有的正常交易的股票按照4个因子分别评分后再按照一定的权重计算加权平均值。如果某个因子没有取值或者为负数,那么就剔除掉这只股票,由排名在后的个股补上。完成综合打分后,将市场上所有个股按照平均得分的高低进行升序排列,选择排名靠前的若干只股票进入量化组合。对于选股模型所选出的个股组合,个股数量较多,为第24曼曼曼皇曼鼍曼曼曼量曼曼曼皇曼曼曼曼寰舅舅曼皇曼曼曼曼曼曼曼曼第24曼曼曼皇曼鼍曼曼曼量曼曼曼皇曼曼曼曼寰舅舅曼皇曼曼曼曼曼曼曼曼曼璺笪曼II曼曼皇曼曼曼量曼曼曼曼曼曼曼曼曼曼曼量曼曼皇曼曼量量曼曼!曼曼曼曼鼍曼曼曼鼍曼曼了研究方便,通过在Foxtrader软件里面按流通股的股本权重构造组合的指数来表示该组合,由于选取的市场基准是沪深300指数,组合的构建日期是20113月31日,为了能更好体现组合跟市场的差异,构造的指数的基期就是201 13月31日,基点就是沪深300指数2011年3月31目的收盘点数3223.29点 组合股票个数的股票组合的市场风险由系统性风险和非系统风险组成,其中系统性风险是不可分散,而非系统风险可以通过增加股票的个数来使风险分散化。但股票组合的个股数量并不是越大越好,原因有二,一是组合股票数量达到一定的程度时,非系统风险的边际降低程度会递减,随之而来的较高交易费用、管理成本将会开始蚕食组合的收益率;另一方面数量众多的证券组合中可能包含一些无法及时得到相关信息且收益较低的证券,从而增加了及时有效进行投资组合调整的难度,因此需要在分散风险和提高收益之间找寻一个平衡点,换句话说就是要找到组合规对于不同的选股因子,组合的最优个股规模可能不同,本文以沪深300股票价格指数的样本股为例,试图从风险分散的角度来诠释A股市场投资组合的最优个股规模。沪深300指数是由中证指数有限公SecuritiesCo.,Ltd)编制,由上海证券交易所和深圳证券交易所在2005年4月8日联合发布的反映整体A股市场价格走势的指数,它所反映的是中国证券市场股票价格变动和运行状况。由于沪深300指数的样本股数量众多,涵盖了沪深A股市场上绝大多数板块,因此用该指数的样本股的风险分散程度来诠释A股的风险分散程度是合适的,也是最具代表性的。选取沪深300指数当前成份股中截至2011年3月31日的所有股票构成样本,剔除市盈率、市营率、市净率、现金流增率为零的样本股,共计269只个股。对这四个因子按照前文所述的方法进行打分求和,再对这269只个股的得分按照从小到大的次序进行排列,并在Foxtrader里面构建组合,用组合指数来衡量组合的行情。由于是采用排名前K(K=12,⋯269)只个股构建组合,构建了个投资组合。按照EvansandArcher的方法,求出K个股票构成的组合指数的日对数收益率序列的标准差,再对标准差序列和组合规模的倒数进行回归分析,得第25到一个关于组合的标准差和组合规模的估计方程,方程如4.1式所示:1&七:o国237+o旬138宰玄其中K=1,2,⋯,269,式子中的0.0237代表的是不可分散风险,0.0138搴÷代表的是可分散风险。从上式可以看出,随着组合规模的扩大,组合的可分散风险是逐渐减小的。对于不同组合的规模K,根据前文相关理论可以计算出残余可分散风险占比为·aL*K=酉0砭.0两第25到一个关于组合的标准差和组合规模的估计方程,方程如4.1式所示:1&七:o国237+o旬138宰玄其中K=1,2,⋯,269,式子中的0.0237代表的是不可分散风险,0.0138搴÷代表的是可分散风险。从上式可以看出,随着组合规模的扩大,组合的可分散风险是逐渐减小的。对于不同组合的规模K,根据前文相关理论可以计算出残余可分散风险占比为·aL*K=酉0砭.0两=竺饕竺,残余可分散风险占比越小则风险分散化程度越好。图4.1表示的是组合规模在【O,269]之间的组合的残余可分散风0O00O0000图4- 沪深300指数样本股不同规模股票组合残余可分散风险占图4.1是沪深300指数样本股不同规模股票组合的残余可分散风险占比,从图中可以看出,随着组合规模的不断扩大,残余可分散风险占比逐渐下降,同时可分散风险占比的下降速度也呈逐渐减少的趋势。从图4.1的局部放大图可以看出,当组合的个股规模达到59只时,质量模型组合的残余可分散风险占比下降到以内;此外,从国内外公募基金的持股情况来看,其公布的平均持股数量在第26只左右,而实际的重仓股一般控制在50个以内。本文认为,在A股市场上以50左右的股票来构建股票量化组合是合适的,这样既能有效分散风险,最大化获得收益,又能满足基金等机构投资者的建仓和持股需要。但对于个人投资者而言,最优规模要根据具体情况而定,下文会有所提及。4.4.2质量第26只左右,而实际的重仓股一般控制在50个以内。本文认为,在A股市场上以50左右的股票来构建股票量化组合是合适的,这样既能有效分散风险,最大化获得收益,又能满足基金等机构投资者的建仓和持股需要。但对于个人投资者而言,最优规模要根据具体情况而定,下文会有所提及。4.4.2质量模型质量模型(Quality,Q)的主要目的就是选择资质优异的公司股票构建投资组合,本文选取的质量因子就只有市净率,这个因子通过了因子有效性分析、有效但冗余因子考察,具有很强的代表性。表4.4质量模型对组合个股数量的敏感性分析注:表中的基准指的是沪深300指数;Num组合个股数量,Std示各个组合月收益标准差,Hit表示各个组合战胜市场基准的频率MR表示各个组合的平均月收益,YR第27各个组合相对于市场基准的信息比率Sharpe为各个第27各个组合相对于市场基准的信息比率Sharpe为各个组合的夏普比率,Beta为各个组合的系数,Prob.和t-Stat为各个组合相对于市场基准日收益率序列的t统计结果。从实际的质量模型对组合规模的敏感性分析来看(见表4.4),当股票组合的规模K=45只时,波动较小,组合战胜市场基准的概率值最大,为68.22%。由于选股的样本期所处的时间段是一个熊市,所以组合基本上都是负的收益率,市场基准也是负的收益率,因此从收益的角度来看,组合规模K=45时,月收益率较大,超额收益率为0.06%;从风险的角度来看,信息比率偏大说明超额收益相对其他的组合偏高,这跟组合规模在45时超额收益为0.06%相吻合。Beta值偏小,说明组合规模K=45时,组合的波动性较小,因而风险也就越小。由于选股的样本期所处的时间段是一个熊市,所有组
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 国内担保贷款合同示范
- 企业承包经营合同的环保要求
- 2024公众号搭建合同
- 2024融资服务合同范文
- 集体土地上房屋拆迁补偿标准
- 2024终止合同协议书
- 2024水马购买协议合同
- 建筑项目施工管理协议书
- 2024年企业知识产权归属协议书
- 资金管理与账户监督合同
- 三年级下册口算天天100题(A4打印版)
- 三基选择题(东南大学出版社)
- 2021年大唐集团招聘笔试试题及答案
- DBJ53/T-39-2020 云南省民用建筑节能设计标准
- 2022版义务教育数学课程标准解读课件PPT模板
- 实验五 PCR扩增课件
- 马拉松运动医疗支援培训课件
- 中医药宣传手册
- 不良资产处置尽职指引
- 人教部编版七年级历史上册第19课 北魏政治和北方民族大交融课件(23张PPT)
- 机械设备定期检查维修保养使用台账
评论
0/150
提交评论