版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、网络新闻评论的情感倾向对股市收益率的影响探究王瑶佩引言随着股市的不断发展,各种股市理论研究层出不穷,从最初由Bachelier(1900)随即漫步理论(RandomWalkTheoryRWT)和samuelson(1960's)有效市场理论(EfficientMarketHypothesisEMH),认为市场是随即有效不可预测的,到如今运用逐渐完善的基本面分析方法和技术分析方法,对股市的运行进行了科学的阐释。如今基本面分析方法和技术分析方法仍是股市分析的主流方法。但是,自Kahneman和Tversky通过研究人们的非理性决策进而提出前景理论(ProspectTheory),并于200
2、2年获得诺贝尔经济学奖以来,投资者情绪与市场的关系越来越受到学术界的关注。学者们基于认知心理学发展的最新研究成果,从行为金融学的视角,进行理论和实证两方面研究,试图以全新的视角来揭示股票市场收益与波动内在原因。目前国内外学者更多的基于BakerM和WurglerJ.(2006)1提出的六个代理变量:封闭式基金折价、股票换手率、IPO数量和上市首日平均收益率、股权融资的比例股利升水等间接指标来探究情绪对股市的影响,本文希望运用更贴近直接情感的评论的中情感倾向来探究对股市收益率的影响,本文的研究是基于RobertP.Schumaker(2012)1BakerM,WurglerJ.Inveester
3、sentimentandthecrosssectionofstockreturnJ.JournalofFinance,2006,61(4);1645-1680,-C,一、,.一,一,一,l,RobertPSchumakera,?,YuleiZhangb,Chun-NengHuangc,HsinchunChend,Evaluatingsentimentinfinancialnewsarticles,DecisionSupportSystems53(2012)458464研究方法,并有所改进。数据的预处理互联网新闻情感分析模型架构预处理主客观分析训练分词处理期据去噪网络财经新闻词性标注分类器H情感
4、分类器褒贬分析训练特征选取优化参教融感典金情词在本文中,我们借鉴PaganandSossounov(2003)的非参数法,适当调整其中的牛、熊市判别标准,通过寻找股价变化的波峰和波谷,诊断股票市场的牛、熊周期。60004000刈2011.042012.05改口2010.072011.122015.06二才W-二忘-匚0号(m2T?寸=b寸“巴母二S2E二£0禽HUEHimT3尊H寸孑e晟一国N二弓I鼾I一三昴一-Hwa-o-叫人早QH中国Qo2013.07但是后来我们发现其实从2013年7月到2014年10月上证综指的涨跌幅不超过3%,于是,我们在原先的定义基础上增加了大家常提到的“
5、猴市”,也就是震荡市,最终,本文选取2014年5月-2014年7月的数据作为猴市样本,2014年8月到2014年10月的数据作为牛市样本,2015年8月-2015年10月的数据作为熊市样本,略过股灾期,互联网新闻评论来自东方财富网。情感指标与初步模型Bt,MtfMtbuyMtsellbuysellMt=MtMtSent=Btln(1Mt)本文采用WernerAntweilerandMurrayZ.Frank(2004)的情感指标作为研究对象,目前大多数研究采用一天作为时间窗口,本文采用RobertP.Schumaker(2012)的20min作为时间窗口来探索一天内影响的情况。Rt=C、;Se
6、n;(RtRt1Rtj)/j=C八'Sent;股市的收益率,本文采用上证综指的20min的涨跌幅作为研究对象实验过程三个时间段的数据处理过程类似,仅以熊市数据为例首先引入数据LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockbearDATAFILE=研一熊市数据.txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;引入数据后,因为情感指数和股市收益率都是时间序列数据,为了防止“伪回归”的出现,需要对sent和R进彳TADF单位根检验procautoregdat
7、a=Project.stockbear;modelreturn=/stationarity=(adf=3);run;结果如下:AUTOREG过程sent增广Dickey-Fuller单位根检验滞后RhoPr<RhoTauPr<TauFPr>F零均值3-168.7811<.0001-8.0059<.0001单均值3-169.3343<.0001-8.0047<.000132.0383<.0010趋势3-176.1743<.0001-8.1545<.000133.2709<.0010AUTOREG过程Return增广Dickey-F
8、uller单位根检验滞后RhoPr<RhoTauPr<TauFPr>F零均值3-647.5513<.0001-12.2758<.0001单均值3-654.8968<.0001-12.2971<.000175.6091<.0010趋势3-654.9962<.0001-12.2870<.000175.4865<.0010可以看出在1%的显著水平下,sent和R是平稳的,没有单位根,然后又进行了滞后1阶、2阶,4阶的检验,P-Value均小于0.001,所以可以认为sent和R是平稳的。然后,为数据集增加新的变量sent1为sentt
9、-1,以此类推sent2,sent3,sent_4,sent_5,sent_6,分别为sent的t-2至t-6项。本文希望探究时隔多久情感因素对股市的影响最大,影响持续的时间会有多长。AVGR新两期收益的平均值,用于检验时间窗口的长度是否会影响情感变量的选取和显著程度dataProject.stockbearl;|setProject.stockbear;|AVGR2=(return+lag(return)/2;sent_1=lag(sent);sent_2=lag(sent_1);sent_3=lag(sent_2);sent_4=lag(sent_3);sent_5=lag(sent_4)
10、;sent_6=lag(sent_5);run;生成新的数据集后,首先本文对各个变量进行了Pearson相关性分析:Pearson相关果散Prob>IdunderHO:Rho=0观测数sentsent_1sent_2seni_3seni_4sent_5seni_6Returnsent1.00000S4S44178c.000151S0.25687<00015170126780.00395170138700.0016S16012&4500041512018731c.00015120.2586&<0001S451D.4417&<000151&1
11、.000005440.442i4<0001517026687<00315170/12&870,00395160138910001B5150.12649.0041512O.OOWQ6447S44sent_2026587<00015170.44234<.0001517h000000.U234<.00015170.25590<,00015150.124985,0D4S5150.13B510.0016515FQ350904144543sent_3D.1267800039517Q.25687<00015V0.44234<00015171.00000
12、543044234<.0001517D.26S90<00015160.124960045515-0.057730.1752543sent_4D.1387D00016SI6D126870039516D.265WSU0.44234£00015171O(XM)DS4204416&<ooai516D.2659Dc.00015160.0432fi0.3138542sent_5D.1264900D41512Q138910.00165150.124M0004.5515026590<0001516044166<.00015161oooaoS410.441&
13、;6<00015160.083190.0531541sent_60.10731v.00015120J25490.00415120.13351D.D0165150.1249SQ.G0455150253go5160.44166<00015151.000005410.095440.0264541Return02湖50001545000B4209447544-00350904144543-0U5773017S2543D043JB0.313554206319005315410095440.02&45411.DQ0CX)574可以看出在各个自变量之间的相关性并不强,可能出现多重共线性的
14、可能性小,回归时我们选用逐步回归法,将sent和sent的一阶至六阶滞后项都做为自变量进行回归。方差分析模型30.002514130.02800校正合计4160.03051源自由度平方和均方F值Pr>0.0008361012.33<.00010.00006781均方根误差0.00823R方0.0822因变量均值-0.00025283调整R方0.0755变异系数-3256.92892参数估计变量自由度参数标准误差t值Pr>|t|容差力差膨胀Intercept1-0.000319710.00040373-0.790.4289.0sent10.002640.000450775.85
15、<.00010.817011.22398sent_11-0.000832480.00046614-1.790.07480.776061.28857sent_31-0.000790900.00042327-1.870.06240.927971.07762共线性诊断个数特征值条件指数偏差比例Interceptsentsent_1sent_311.582791.000000.005760.185290.207870.1212720.995171.261140.991950.001420.006300.000600560.869521.349190.000161720.225490.019240
16、.7867440.552521.692540.002140.587790.766590.09139结果分析:根据方差分析我们可以看出在1%的显著性水平下从方程的整体的整体拟合效果是显著,从各个自变量来看,在其他变量不变的情况下,sent增加一个单位,因变量hrearn增加约0.00264个单位,其他变量的解释原理相同,但在5%勺显著水平下根据多重共线性诊断可以看出vif值小于10,且在1附近不存在严重多重共线性。问题R-square较小,说明还有很多影响股市收益率的因素未考虑在内,但是在只考虑情感因素的前提下,R-square能达到8流右,足以说明,情感因素在股市收益率的变动过程中起到了不可替
17、代的作用。同理,对猴市数据和牛市数据进行相同的分析。其ADF检验,相关系数分析与前者类似。以下只对回归结果进行分析猴市结果如下:方差分析源自由度平方和F值Pr>F模型10.000013040.000013044.660.0315误差424校正合计4250.001190.001200.00000280均方根误差0.00167R方0.0109因变量均值0.00007034调整R方0.0085变异系数2378.74944参数估计变量自由度参数标准误差t值Pr>|t|容差力差膨胀Intercept1-0.000053460.00009931-0.540.5907.0sent_610.000
18、204680.000094852.160.03151.000001.00000共线性诊断个数特征值条件偏差比例指数Interceptsent_611.577681.000000.211160.2111620.422321.932790.788840.78884牛市结果如下:方差分析源自由度平方和均方F值Pr>F模型10.000046340.000046348.460.0040方差分析源自由度平方和误差2450.00134校正合计2460.00139均方F值Pr>F0.00000548均方根误差0.00234R方0.0334因变量均值0.00014452调整R方0.0294变异系数1
19、619.54926参数估计变量自由度参数标准误差t值Pr>|t|容差力差膨胀Intercept1-0.000102310.00017140-0.600.5511.0sent10.000527660.000181412.910.00401.000001.00000共线性诊断个数特征值条件指数偏差比例Interceptsent1.495081.000000.252460.252460.504921.720770.747540.74754比较三个结果可以看出:在猴市熊市和牛市中,首先共同点,在情感对股市收益率都有正向影响,且都显著;受情感因素影响最大的是熊市时期,其次是牛市,再者是猴市;熊市和
20、牛市受当期情感因素的影响,且影响时间较短,而熊市则受到6期前的影响更大。最后为了检验三市划分的合理性,本文对三个时间段的数据进行了合并与分组,进行了方差齐性检验。dataProject.stockmonkey2;|setProject.stockmonkey;|group=1;run;dataProject.stockbull2;|setProject.stockbull;group=2;run;dataProject.stockbear2;|setProject.stockbear;|group=3;run;datastock;mergeProject.stockmonkey2Project
21、.stockbull2Project.stockbear2;bygroup;run;procanovadata=stock;classgroup;modelsent=group;meansgroup/duncan;run;因变量:sent源自由度平方和模型271.34145019461526.480136校正合计19481597.821586均方F值Pr>F35.67072545.47<.00010.784419R方变异系数均方根误差sent均值0.044649266.22390.8856750.332680源自由度Anova平方和均方F值Pr>Fgroup271.34145
22、01635.6707250845.47<.0001在1%的显著性水平在三个时期的情感的组内均值有显著性差异,所以分组分析是合理的附件1SAW序LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockmonkeyDATAFILE=研一猴市数据.txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;procautoregdata=Project.stockmonkey;modelsent=/stationarity=(adf=3);run;procautoregdata=P
23、roject.stockmonkey;modelreturn=/stationarity=(adf=3);run;dataProject.stockmonkey1;|setProject.stockmonkey;|AVGR2=(return+lag(return)/2;sent_1=lag(sent);sent_2=lag(sent_1);sent_3=lag(sent_2);sent_4=lag(sent_3);sent_5=lag(sent_4);sent_6=lag(sent_5);run;proccorrdata=Project.stockmonkey1;varsentsent_1se
24、nt_2sent_3sent_4sent_5sent_6return;run;proccorrdata=Project.stockmonkey1;varsentsent_1sent_2sent_3sent_4sent_5sent_6AVGR2;run;procregdata=Project.stockmonkey1;modelReturn=sentsent_1sent_2sent_3sent_4sent_5sent_6/tolvifcollinselection=stepwiser;run;procregdata=Project.stockmonkey1;modelAVGR2=sentsent
25、_1sent_2/tolvifcollinselection=stepwiserrun;LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockbullDATAFILE=研一牛市数据.txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;procautoregdata=Project.stockbull;modelsent=/stationarity=(adf=3);run;procautoregdata=Project.stockbull;modelreturn=/stat
26、ionarity=(adf=3);run;dataProject.stockbull1;|setProject.stockbull;|AVGR2=(return+lag(return)/2;sent_1=lag(sent);sent_2=lag(sent_1);sent_3=lag(sent_2);sent_4=lag(sent_3);sent_5=lag(sent_4);sent_6=lag(sent_5);run;proccorrdata=Project.stockbull1;varsentsent_1sent_2sent_3sent_4sent_5sent_6return;run;pro
27、ccorrdata=Project.stockbull1;varsentsent_1sent_2sent_3sent_4sent_5sent_6AVGR2;run;procregdata=Project.stockbull1;|modelReturn=sentsent_1sent_2sent_3sent_4sent_5sent_6/tolvifcollinselection=stepwiser;run;procregdata=Project.stockbull1;|modelAVGR2=sentsent_1sent_2sent_3sent_4/tolvifcollinselection=stepwiser;run;LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockbearDATAFILE=研一熊市数据.txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;procautoregdata=Project.stockbear;modelsent=/stationarity=(adf=3);run;procautoregdata=Project.stockbear;modelreturn=/stationarity=(adf=1);run;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025合同模板城镇供热特许经营协议范本
- 2025买车不过户合同协议书
- 家用智能设备安全及紧急控制策略
- 课题申报参考:马克思政治经济学批判视域中的数字劳动研究
- 课题申报参考:链主企业数字化提升产业链自主可控能力的机制与路径研究
- 科技创业的挑战与应对策略研究
- 用知识武装孩子为孩子打造一个安全的成长环境
- 2024年收获机械项目项目投资申请报告代可行性研究报告
- 2024年高纯石英纤维正交三向织物项目项目投资申请报告代可行性研究报告
- 教育领域的创新思维培养方案与实践
- 消防产品目录(2025年修订本)
- 地方性分异规律下的植被演替课件高三地理二轮专题复习
- 光伏项目风险控制与安全方案
- 9.2提高防护能力教学设计 2024-2025学年统编版道德与法治七年级上册
- 催收培训制度
- ISO 22003-1:2022《食品安全-第 1 部分:食品安全管理体系 审核与认证机构要求》中文版(机翻)
- 2024年广东省高考地理真题(解析版)
- 2024高考物理广东卷押题模拟含解析
- 人教版五年级上册数学简便计算大全600题及答案
- GB/T 15945-1995电能质量电力系统频率允许偏差
- GB 32311-2015水电解制氢系统能效限定值及能效等级
评论
0/150
提交评论