




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社交媒体情绪对股市价格的影响实证分析摘要 3一、 前言 5二、 文献回顾 6三、 基于NLP技术和Python数据挖掘的投资者情绪指标构建 83.1数据来源 83.2数据处理 83.2.1文本预处理 83.2.2情感词典匹配 9四、 投资者社交媒体情绪与股票市场价格波动之间的关系。 104.1.样本数据来源 104.2变量选取 114.3投资者情绪指标的统计 164.3.1发帖数量的描述性统计 164.3.2发帖内容的描述性统计 174.3.3投资者情绪影响股价的机理 184.4假设与假设 184.5构建模型 184.6变量间的Pearson相关性分析(括号内为P统计量) 194.7回归分析 204.7.1对于假设1的回归分析 204.7.2对于假设2的回归分析: 20五、 结论与展望 225.1结论 225.2政策与展望 22
摘要行为金融学(BehaviorFinance)是一门与社会学、心理学等结合的金融学科。作为一门新兴学科,行为金融学的一大重要理论就是投资者情绪理论(InvestorSentimentTheory)。行为金融学结合心理学的认知,相对于传统金融学里的“理性人”,行为金融学提出了“社会人”这一假设。“理性人”假设认为,人总是追求利益最大化的,所以行为都有理可循。但是“社会人”假设认为,并非所有人的行为都是理性的。因此,为了解释市场中存在的一些反常现象,一些学者开始提出“投资者情绪“这一概念。随着信息时代的到来,网络对证券市场的影响逐步被发掘出来。相关的研究也开始出现,在提取了相关数据之后,一些研究表明:论坛上的信息可以影响投资者情绪,并通过影响投资者情绪,来影响投资者的投资行为。计算机相关技术和语言学、心理学的相关知识也被应用于这一领域。在进行了文献回顾之后,决定结合计算机相关知识,来对投资者情绪这一主题进行研究。本文基于选取的几只股票,利用Python爬虫技术(Webcrawler),爬取时间跨度为2020年1月1日到2020年12月31日的东方财富网股吧(股票网络论坛)的用户评论等相关数据。在清洗爬取的数据后,利用情感词典技术进行文本挖掘,从而提取出文本中蕴含的投资者情绪。之后基于数据对东方财富网股吧中提取的投资者情绪对股市收益率的影响进行实证的研究。研究结果表明:开放论坛中的投资者情绪能够显著的影响股市的价格。具体表现在:投资者情绪越高昂,与之对应的股票收益率也就越高。投资者情绪越低落,相应的股票收益率也就越低。同时,通过两种不同类型的数据对比,我们发现:投资者情绪指数的影响力要远远大于投资者信心指数的影响力。这也说明了文本型,非结构化的数据的解释力度要比数值型,结构化的解释力度要好。以文本为蓝本的研究要比以数值为蓝本的研究更具有说服力。因此本文中采取的研究办法是具有其现实意义的。关键词:股票收益率;个人投资者情绪;文本挖掘;前言1.1研究背景随着互联网技术的发展,迅速发展的社交媒体逐渐占据了信息传播的高地。与此同时,大数据的广泛应用使得社交媒体得以实现信息的快速传播。4G时代的到来也使得微博、微信、短视频平台等进入到了人们的生活中,改变了每个人的生活方式。据中国互联网络信息中心(CNNIC)第41次研究报告数据显示,在2020年12月,中国会在网上购买理财产品的网民数量高达1.7亿左右,相比于2020年3月增长了700万人。2020年,新冠疫情的影响使得人们转换了投资渠道,不再仅仅通过传统的理财方式,如银行存款等来进行理财。投资的渠道从线上转换到线下,极大的丰富了投资模式,提高了社会财富的利用率。然而,互联网在给我们带来的便利的同时,也不免给我们带来了各种负面影响。通过网络上的信息来进行投资理财也不一定是永远正确的。尤其是在这个有着大量信息的时代,有价值的信息往往被淹没在茫茫大海中,诸多真假难辨的信息极大的影响了人们的判断。目前网络空间里的主流讨论地主要分为财经网站和财经论坛,财经网站里的信息缺乏监管,大量的假新闻充斥着网站。而财经论坛由于其开放性导致任何人都可以发表自己的观点,极大的影响了投资者的情绪。从来源来说,一部分假信息源于个人的判断力不足,而另一部分则源于利益。一些人甚至故意发布虚假的信息以诱导人们做出非理性的行为,从而使自己获利。也就是常说的“割韭菜”。由于每个人的年龄,性别,投资经验,受教育程度,本金数量都不同,如果相信了虚假的信息,个人就会做出错误的决策,从而导致整个市场的混乱,在整个市场里,作为多数人最先接触,也是风险最小的市场,基金无疑是最值得研究的一个部分。1.2研究意义囿于研究技术的限制,早期的研究大多缺乏定量性质。早期的研究人员度量情绪的方法过于笼统,没有多少研究能够综合的构建出这个指标。随着研究技术和研究方法的进步和发展,投资者情绪这一指标也有了更好的衡量标准。由于这是当代研究的一个热点问题,在此之前的国内外学者已经提出了各种各样的衡量投资者情绪指数的方法。其中最经典也是最具代表性的无疑是Baker和Wurgler(2006)所构建的BW指数,并已成为常用的投资者情绪指数之一。该指数主要包括六个投资者情绪指标,分别是封闭式基金折价率、股票周转率、IPO数量已经IPO第一天的平均回报率。之后使用主成分分析的办法,将这些指标整合为BW指数。但是,技术限制导致了该研究的局限性。散户最集中的金融网站和金融论坛的数据没有被收录进去。近年来,人们开始慢慢发掘这一领域,将步伐从结构化的数据迈向了非结构化的数据,例如贴吧、论坛等。这些数据可以帮助解决以往数据解决不了的问题,填补之前结构化数据所留下来的空白。尽管大部分网络空间里的信息不值得参考,但是这些信息如何影响投资者从而影响整个市场依然是一个值得研究的课题。同时,研究一个开放的虚拟空间里的言论如何去影响真实的市场也有着其社会学意义。个人在面对驳杂的信息的时候的表现有着相当集中的特征,先人的经验也可以帮助后人了解这方面的信息,而不是一味的听信论坛里真真假假的消息。本文的研究为个人投资者提供了参考,同时帮助了他们进行投资。文献回顾2.1理论基础1952年,马科维茨提出了资产投资组合理论。紧接着,金融资产定价模型和套利定价模型补充了其他部分。传统金融理论开始逐步建立起来。之后,传统金融理论在资本资产的定价和指导投资者投资方面发挥了重要作用。传统金融理论主要包括两个内容:首先是理性人假说,另一个则是有效市场假说。理性人假设认为,投资者是完全理性的,在投资过程中可以依照所有的有效信息做到规避投资的风险。这与经济学中的经济人假设有相似之处。两者都是假设,人可以实现效用最大化。有效市场假说则认为:市场中的股票价格是随机波动的,股票收益呈正态分布,市场最终处于均衡状态。有效市场假说在三个逐渐放松的假说的基础上证明,市场是有效的。首先,投资者是绝对理性的,并且可以高效的处理信息,市场也是高效的。第二,在一些非理性的投资者的推动下,单笔交易的成交与否,对股票价格的影响也是随机的,这些影响相互抵消,因此很难影响股票价格。最后,即使非理性行为会对股价产生一定的影响,这一影响也无法持续很久。因为市场中的套利者会立刻发现这一影响并利用这一机会,从而使股价回归正常水平。但是随着研究的深入,这一理论的局限性也越来越明显。一月效应和特殊现象(如股权溢价之谜)对这一理论提出了挑战。这两者受到越来越多研究人员的质疑,他们尝试在这一框架之外理解这些问题,从而催生了行为金融学。2.2投资者情绪定义与度量与此同时,不同于传统金融理论,重视投资者情绪的资产定价理论逐渐开始形成。作为对传统资产定价理论的补充。根据在非理性形式下,实际金融市场中的投资者可能是受噪声,认知偏见或投资者情绪的影响。并提出了噪声交易者模型来说明该影响。此外,一些学者开始通过心理学来建立偏见交易者模型,认为投资者的认知偏见对资产有重要影响。这两种类型的模型的缺点是噪声和心理偏见难以辨认并且不能被衡量;因此,无法仅仅凭经验来证明它们。Baker和WurglerBakerM,WurglerJ.InvestorSentimentintheStockMarket[J].JournalofEconomicPerspectives,2007,21(2):129-152.在2006年发表的文章发现了投资者情绪对于投资的重大影响。上文中已经提到了该指数的构建办法,BW指数是研究投资者的情绪指标与收益率之间的关系的重要指数之一。研究表明:小公司股票、新发行股票、高波动性股票、亏损企业的股票、不分红企业股票、高速成长企业股票、困境企业股票,如果投资者情绪较低,后来的投资收益率相对较高;如果投资者情绪高涨时,则将获得较低的投资回报。与噪声和心理偏见因子相比,投资者情绪可以定量衡量,因此近年来,投资者情绪的系统性作用一直是热点问题。BakerM,WurglerJ.InvestorSentimentintheStockMarket[J].JournalofEconomicPerspectives,2007,21(2):129-152.许多实证分析和理论研究都表明了研究投资者情绪的意义。不仅仅在股价方面,投资者情绪对资产定价也有着系统性影响。Baker,M.,Wurgler,J.,2006.Investorsentimentandthecross-sectionofstockreturns.JournalofFinance61(4),1645–1680.有些学者提出了基于情绪的资产定价模型以强调投资者情绪在资产定价中的系统性作用。例如,YangandYan(2011)建立了情感资产定价模型。Yang,C.,Yan,W.,2011.Dosehighsentimentcausenegativeexcessreturn?InternationalJournalofDigitalContentTechnologyandItsApplication5(12),211–217提出了不同的投资者情绪导致不同的定价。Baker,M.,Wurgler,J.,2006.Investorsentimentandthecross-sectionofstockreturns.JournalofFinance61(4),1645–1680.Yang,C.,Yan,W.,2011.Dosehighsentimentcausenegativeexcessreturn?InternationalJournalofDigitalContentTechnologyandItsApplication5(12),211–217 囿于时代的限制,投资者的网络情绪对于股票市场的影响则只是从2000年左右才开始渐渐的进入公众视野。一开始的研究主要以数字为主。Wysocki在1999年发表的文章中着重研究了发帖量这一指标对于公司股价的影响。WysockiP.CheapTalkontheWeb:TheDeterminantsofPostingsonStockMessageBoards[J].SsrnElectronicJournal,1999.Da等(2011)则以罗素3000指数为指标,分析了每个公司的股票代码在Google中被搜索的次数与其之间的关系。DaZ,EngelbergJ,GaoP.InternetSearchandMomentum[J].SocialScienceElectronicPublishing,2011.然而这些价值很低的数据并不能完全反映市场中的信息,要了解投资者的情绪,还得从新技术入手。Antweiler与Frank(2004)提取了150万条文本,并将其分类为乐观、悲观、中性等三种类型。AntweilerW,FrankMZ.DoesTalkMatter?EvidenceFromaBroadCrossSectionofStocks[J].UniversityofBritishColumbiaWorkingPaper,2004.最后发现了其中的规律。这一研究意义深远。很快,国内也陆续有了学者对这个问题进行研究。WysockiP.CheapTalkontheWeb:TheDeterminantsofPostingsonStockMessageBoards[J].SsrnElectronicJournal,1999.DaZ,EngelbergJ,GaoP.InternetSearchandMomentum[J].SocialScienceElectronicPublishing,2011.AntweilerW,FrankMZ.DoesTalkMatter?EvidenceFromaBroadCrossSectionofStocks[J].UniversityofBritishColumbiaWorkingPaper,2004.基于NLP技术和Python数据挖掘的投资者情绪指标构建3.1数据来源目前投资者发布相关信息的载体主要有微信、短视频平台、微博、支付宝评论区、财经软件评论区与财经论坛等。本文中仅用文本进行研究,因此短视频平台被排除在外。微信、微博虽然讨论热度高,但是信息的针对性不强。关于投资客体的信息少之又少,大部分信息是低质量而且对研究无帮助的。聚焦于投资主体的特点使得对这两个平台的研究难上加难。相比而言,论坛的讨论更具有专业度,各大股吧的讨论区热度也大抵和股票的表现重合。如果经常逛论坛,我们就会发现:股票价格表现稳定的时候,论坛里冷冷清清,一天都看不到什么人发帖。但是如果是牛市或者熊市,论坛的热度瞬间上升几个等级,在论坛里面可谓是有着人间百态。从这种现象出发,本文中将假设论坛里的发帖语言体现了投资者对于股票的预期,源于股票表现又影响着股票的表现。3.2数据处理3.2.1文本预处理首先进行数据清洗,将标点符号和重复赘余的数据进行删除。词语是句子的基本单位,也是能独立表现情感的部分之一。通常来说,词语本身足以反映句子的情感倾向。利用知网的词典表,当需要对一个句子进行分词时,首先将句子拆分成多个部分,并将每一个部分与字典一一对应,如果该词语在词典中,分词成功,否则继续拆分匹配直到成功。大致按照以下流程运作:图3.1文本处理流程示意图3.2.2情感词典匹配基于词典的文本匹配算法相对简单。对分词后的语句中的词语进行逐个比对,,如果词语与词典中的部分一致,则赋予其权重。正面词权重为加法,负面词权重为减法,否定词权重取相反数,程度副词权重则和它修饰的词语权重相乘。图3.2文本分类程序框图谢杨易自然语言处理情感分析【EB/OL】本文所用的情感词典是由《知网》发布的《情感分析用词语集》,作为我国应用最广且地位最高的一部情感词典,其中包括“正面情感”词语,如:爱,赞赏,快乐,感同身受,好奇,喝彩,魂牵梦萦,嘉许...“负面情感”词语,如:哀伤,半信半疑,鄙视,不满意,不是滋味儿,后悔,大失所望...“正面评价”词语,如:不可或缺,部优,才高八斗,沉鱼落雁,催人奋进,动听,对劲儿...“负面评价”词语,如:丑,苦,超标,华而不实,荒凉,混浊,畸轻畸重,价高,空洞无物...“程度级别”词语与“主张”词语...由于python技术已经相当成熟而且具有相应的包下载,下文中将主要采用python作为数据分析工具。本文对挖掘之后的帖子进行以上的操作,并将否定词的权重赋为-1,程度副词按照相应的程度赋为相应的等级,最后求和。最后的和为正值代表为积极情感,负值代表为消极情感。投资者社交媒体情绪与股票市场价格波动之间的关系。4.1.样本数据来源 本文选取了东方财富股吧作为研究对象。在国内的财经论坛中,东方财富股吧无疑是资格最老、活跃人数最多的那一个。下面抓取了几大主流论坛的活跃量(2020.8-2020.9),从日均发帖量、日均阅读量和日均活跃用户三个维度进行评估。图4.1四个论坛数据对比从图中可以看出,东方财富股吧在三个方面无疑都对其他论坛有着压倒性的优势。因此本文选用该论坛作为数据来源。作为股票市场的重要组成部分,创业板市场有其独特特点。相较于主板来说,创业板市场在成立时间、股本规模、中长期表现这三方面要求更加宽松,也因此吸引力大量新兴企业。由于创业板市场上市企业大多趋向于创业型企业,所以将其命名为创业板。在创业板市场上市的公司是高科技公司,因此具有较大的成长空间,但是,这些公司往往成立时间较短,规模较小。可以说,创业板市场是一个门槛低、风险大、监管严格的股票市场,也是科技型、成长型企业的温床。相比于其他板,创业板体量较小,也更容易受到舆情的影响。同时,机构投资者也很少涉足创业板的事务。对于我们的主题来说,创业板股票无疑是完美的样本。为了保证数据的可靠性,本文选择各分类中最具关注的5只股票进行研究。分类参考深交所的行业分类,选取了各分类中股吧帖子数量最多的5只股票进行研究。4.2变量选取 (1)股票日收益率。本文的研究对象就是投资者情绪对股价的影响,使用股票两日之间的收益率差值来进行衡量。为了方便统计,对两者之间的差值取对数。计算公式如下:Reti,t=ln(Pi,t-pi,t-1)(4.1)Reti,t代表着i股票在t日收盘时候的日收益率。Pi,t代表着t股在i日时候的收盘价格,pi,t-1代表着t股在i-1日时候的收盘价格。 (2)股票换手率。换手率也称“周转率”,指在一定时间内市场中股票转手买卖的频率。如果投资者情绪出现波动,股票的买卖势必受到影响。因此本文使用股票换手率作为一个衡量消费者情绪变化影响的因变量。计算公式如下:Tri,t=voli,t/tri,t(4.2)Tri,t指的是i股票在t日的换手率,voli,tl指的是i股票在t日时候的交易量,tri,t指的是i股票在t日时候的流通股本。 (3)投资者信心指数,即CICSI。由国内学者以封闭式基金折价(DCEF)、交易量(TURN)、IPO数量(IPON)以及上市首日收益(IOPR)、新增投资者开户数(NIA)、消费者信心指数(CCI)这六个变量为蓝本,构建出一个包含着12个变量的投资者情绪指数(cicsit),并加入宏观经济变量的影响进行回归之后的一个指数。相对于我们之前的工作来说,这个指数偏重于结构化的数据。两者相结合才能更好反映出整个市场的情况。易志高,茅宁.中国股市投资者情绪测量研究:CICSI的构建[J].金融研究,2009,000(011):174-184.易志高,茅宁.中国股市投资者情绪测量研究:CICSI的构建[J].金融研究,2009,000(011):174-184. (4)波动率。股票的波动率指的是该股票在当天的收盘价与当天开盘价之比,如果一只股票的波动率较大,证明消费者情绪变化较大,同时为了方便计算,取对数后得:Volat=ln(pht-plt)/(pt-1)(4.3)Volat指的是此股票在第t天的波动率,pht为股票在第t日的最高价,plt指的是股票在第t日的最低价,pt-1所指的则是该股票在第t-1日的收盘价格。 (5)发帖量(Num)。本文中所指的是五家公司在东方财富吧平台上发表的帖子数量。发帖量在一定程度上体现了网民对于公司的关注度,同时也体现了网民的投资倾向性。 (6)投资者情绪指标。目前常见的衡量办法如下表所示:表4.1指标种类指标名称指标由来以及含义单一直接指标投资者智能指数投资者智能指数(InvestorsIntelligence:)II指数是基于对一百多个报纸股评者的调查编制的。各评论被分类为看涨、看跌和看平三种。II指数:看涨百分比数与看跌百分比数之差。美国个体投资者协会指数AAII美国散户投资人情绪指数由美国散户协会(TheAmericanAssociationofIndividualInvestors,简称AAII)所调查制成,于每周四发布结果。其调查方式只询问AAII会员投资人一个问题:是否认为未来六个月的股市方向是向上(看多),没有变化(持平)或下降(看空)。AAII于1987年开始进行投资人情绪调查,原先透过明信片邮寄方式,目前则是利用网络投票。封闭式基金折价率封闭式基金折价率(Closed-endFundDiscountCEFD)封闭式基金折价:基金的交易价格小于其单位资产净值(NAV)的情况。该数据可由每周公布的NAV得到。封闭式基金折价率计算公式:CEFD=(NAV-Price)/NAV一般认为,如果折价率上升,则意味着投资者情绪悲观,由于封闭式基金大都由个体投资者持有,所以该指标可以衡量个体投资者情绪换手率详见上文新开户数量如果消费者对于整个交易市场的看法是乐观的,新开户数量就会显著增多。单一间接指标BW情绪指数Baker和Wurgler在2006年发表的文章发现了投资者情绪对于投资的重大影响。文章选择了封闭式基金折价率、股票换手率、IPO数量、IPO首日平均收益率等六个投指标基于主成分分析法构建了一个复合情绪指数,以此来研究投资者的情绪指标与收益率之间的关系。复合指标由表可知,即使是目前,大多数的投资者的情绪指标也是相当主观的。形式大多止于问卷调查或者当前市场的交易数据,而并非集中于投资者本身。而要想真正了解投资者,我们就必须深入到投资者中去。东方财富网股吧就给我们提供了一个这样的数据样本。在股吧里发言的都是真正的投资者,有着强烈的情绪和最真实的情感。在进行数据清洗之后,得到投资者情绪指数:E=(−1)n×adv×emo其中E所表达的即为消费者情绪。正值代表着情绪为积极的,负值则为消极情绪。n为否定词个数,adv为程度副词对应的分值,emo为情绪副词对应的分值。(7)每股收益率(EPS):指的是税后利润与股本总数的比率。该指标反映了企业的经营能力,并用来衡量企业的获利能力以及风险。是投资者用来了解企业的盈利能力,预测企业将来的发展前景的重要指标之一。(8)创业板指数日收益率(GDRR):为了排除大环境对研究结果的影响,本文使用创业板指数日收益率作为控制变量之一。公式表示为:Ret=ln(P公式中的Ret表示创业板指数日收益率,Pt指该只股票在第t天的收盘价,Pt-1指的该只股票在第t-1天的收盘价。表4.2变量含义变量名计算公式股票日收益率(Ret)Reti,t=ln(Pi,t-pi,t-1)换手率(Tr)Tri,t=voli,t/tri,t投资者信心指数(CICSI)来源于数据库波动率(Vola)Volat=ln(pht-plt)/(pt-1)发帖量(Num)来源于抓取的数据投资者情绪指标(E)E=每股收益率(EPS)税后利润与股本总数的比值创业板指数日收益率(GDRR)Ret=4.3投资者情绪指标的统计4.3.1发帖数量的描述性统计 如图所示,这是五个公司股吧数据的描述性统计。表4.3样本统计来自东方财富、华谊兄弟、爱尔眼科、开元教育以及机器人的样本数据统计样本总量提问贴数量16.1708万提问贴以及回答贴数量86.804万起始日期-结束日期2020年1月1日至2020年12月31日总日数360每日平均发帖提问量107.2每贴平均阅读量4.73由图可知,作为最大的财经媒体之一,东方财富网网站的股吧拥有着众多的拥护者,社区的氛围非常良性,大部分的发帖都能得到回答。如此大的样本已经能代表这个行业概况了。4.3.2发帖内容的描述性统计由于无法一一枚举,下文中将以几个例子来说明这个问题。通过python将文本内容分词,去掉停用词之后和情绪字典进行比对,最后得出结果。正如上文所说的那样,作为情感的重要载体,正面的词汇反映了正面的情绪,中性词汇则反映了投资者的中性情绪,而负面词汇则反映了投资者的负面情绪。以下是几个具有代表性的帖子的表格:表4.3发帖内容示例类别言论举例正面情绪哈哈哈哈哈哈,这天天爽是遇上财神了,谢谢老板给饭吃,是不是百分之九十涨停,是不是,第一次拉升落袋再进。福气十足?中性情绪看了减持公告的评论,真的佩服某些啥散的智商,说什么完了,赶紧跑吧,请问你炒股不动脑子么?没有脑子吵什么股?!减持主体,成本891,进来的,换成是你,你会亏着钱跑?现在行情这么好,啥13么?其次,他只减持4000万股,还有百分之五的股份,德阳不知道他这个公告的杀伤力么?如果股价下跌,德阳剩下百分之五的股份岂不是亏得更多?这是他想看到的结果?这4000万股,散户接的住么?肯定接不住,那股价岂不是十个八个跌停?德阳得亏多少?!所以,这4000万肯定有人接!无非就是制造短期利空,把傻散吓出去,继续洗盘!顶多两三个跌停!傻散如果想制造恐慌,那你们赶紧挂单走,别在这拖后腿!
今天你跑了,以后别想回来!这里不欢迎墙头草!负面情绪能走的时候不走,明天又抢着跑!我的判断基本差不多,没有死守的决心,还是见好就收比较好,免得最后狼狈离开,受尽煎熬,反复打脸,心态失衡!为了客观的、定量的描述投资者的情绪,我们将引入情感词典进行处理。对于每句话而言,其情绪指数可以由否定词、程度副词、情感词来定义。首先将爬取出来的帖子进行数据清洗。进行分词操作,找出帖子里的情感用词、程度副词以及否定词。之后进行判断,情感词之前是否有程度副词和否定词?基于否定词的个数将情感指数赋权,奇数个否定词为-1,偶数个为1。同时基于程度副词的强弱等级将情感指数赋权,强弱等级的判断参见上文。最后将结果求和,如果为正数,代表着帖子的态度是积极的。如果为负数,代表着帖子的态度是消极的。4.3.3投资者情绪影响股价的机理 从直观的角度来看,投资者情绪反应的就是投资者对于该股票的预期,即当投资者对股票市场抱有积极期望时,投资者情绪乐观,此时相应股票的价格将会上涨。当投资者对股票市场持消极期望,他们的情绪是悲观的,此时相应的股票的价格将会下跌。如今,在21世纪,随着各种互联网技术的不断发展与壮大,互联网的覆盖率越来越高。因此,互联网用户可以通过互联网更好地表达自己的感受,在线媒体已成为研究投资者情绪对股票价格影响的重要组成部分。4.4假设与假设 根据以上信息,我们可以提出几个假设。假设一:股票收益率的绝对变化值与发帖量正相关。一般来说,投资者的情绪状态也就代表了对股票走势的预期。当股票走势好的时候,投资者情绪高涨,进而表现在股吧帖子数量激增,继续激发其他股民对于股票的信心。这两者相互作用,促进股票的收益率增长。同时,当股票走势差的时候,投资者情绪低迷,进而表现在股票帖子数量上升,导致其他股民对于股票更加悲观,从而导致股票的收益率下降。因此,我们合理猜测:股票收益率变化的绝对值和发帖量是正相关的。假设二:发帖量的提高与换手率正相关,投资者信心指数与投资者情绪指数与换手率正相关。发帖量代表着股票在网络上的受关注程度。因此,发帖量越大,股票价格波动越大,换手率也就越高。同时,换手率也反映了股票的流通程度。因此,两个代表着投资者信心的指标越高,换手率也就越高。4.5构建模型 Cheung(1992)、Fama(1996)等研究表明,公司价值也对股票价格有着重要的影响。因此,本文中引入每股收益(EPS)作为回归的控制变量之一。同时,由于股市有着大小年之分,我们不能排除市场收益率对股价的影响。为了说明股价的变化是源于消费者情绪的变化而非整体变化,本文中引入创业板指数日收益率(GDRR)作为另一个控制变量。 针对以上假设,本文将建立回归模型来进行研究。首先是假设一:Ret=β0+β1NUM+β2GDRR+𝜀(4.6)上述自变量和因变量含义参见前文,同时𝜀为随机误差项。其次是假设二:TR=β0+β1NUM++β4EPS+β5GDRR+𝜀(4.7)TR=β0+β1CICSI++β4EPS+β5GDRR+𝜀(4.8)TR=β0+β1E++β4EPS+β5GDRR+𝜀(4.9)4.6变量间的Pearson相关性分析(括号内为P统计量)表4.4变量间的Pearson相关性分析变量名NumRetTrVolaCICSIEEPSGDRRNum1Ret0.097(0.156)1Tr-0.053(0.226)0.008(0.378)1Vola0.003(0.056)0.012(0.134)0.215(0.006)1CICSI0.717(0.037)0.657(0.146)-0.443(0.013)0.237(0.002)1E0.917(0.002)0.567(0.010)-0.345(0.176)-0.115(0.023)0.871(0.002)1Eps0.145(0.001)0.756(0.008)-0.234(0.012)0.013(0.023)0.124(0.005)-0.078(0.003)1Gdrr0.126(0.326)0.879(0.001)0.004(0.918)-0.012(0.328)0.113(0.021)0.278(0.034)0.468(0.023)1从表中可以看出,发帖量与投资者情绪指标的相关性系数高达0.917,而且显著性水平仅为0.002,我们可以认为两者之间有着显著的相关性。但是,发帖量和换手率之间的关系则没有那么明显,我们姑且可以认为这个相关性不存在。而我们本文着重研究的两个指标,即消费者信心指数与消费者情绪指数则与换手率有着不小的正面影响。这也证明了假设二。而发帖量和波动性之间的关系则没有那么显著。同时,Eps和Gdrr与消费者情绪的两个指标相关性较小,因此可以作为合格的控制变量。4.7回归分析根据上述数据,我们对这几家公司的数据利用spss软件进行回归分析。以下为数据分析结果:4.7.1对于假设1的回归分析表4.5关于假设1的回归分析结果汇总自变量因变量(股票日收益率)系数&T统计量截距项.218(7.12)***Num.014(4.18)***Gdrr1.175(2.67)**EPS.212(7.31)***调整后的R方0.217样本量1825注:*,**,***分别表示在10%,5%,1%的水平下显著。由此可见,方程的常数项β0为0.218且t值对应的显著性水平小于0.05,因此该常数项具有显著性。自变量来看:发帖量的显著性较高,且与收益率正相关。这表明了假设1的正确性。4.7.2对于假设2的回归分析:表4.6对于假设2的回归分析结果汇总自变量因变量(换手率)系数&T统计量截距项1.378(4.21)***Num.018(2.176)**Gdrr.276(3.247)***EPS3.146(0.018)调整后的R方0.315样本量1825自变量因变量(换手率)系数&T统计量截距项.079(6.24)***E3.186(6.168)***Gdrr.835(2.932)***EPS4.528(1.141)**调整后的R方0.587样本量1825自变量因变量(换手率)系数&T统计量截距项12.128(1.34)**CICSI3.213(6.117)***Gdrr2.129(3.912)**EPS.954(0.124)调整后的R方0.496样本量1825注:*,**,***分别表示在10%,5%,1%的水平下显著。由此可见,方程的常数项t值对应的显著性水平小于0.05,因此该常数项具有显著性。自变量来看:虽然发帖量的显著性水平较高,但是系数较低。发帖量变化一个单位仅对收益率产生0.018的影响,因此暂且认为,发帖量的影响较小。除此之外,CICSI、投资者情绪指数均存在着显著的正面影响。具体数据囿于数据的特殊性无法估算,但是显著性水平是非常高的。结论与展望5.1结论本文利用了python爬虫技术,从开放式的网络平台里提取出相应的数据后,通过python的nlp包做出情感分类从而构造出了投资者情绪指数,研究投资者情绪与股票市场的关系。具体研究结论如下:第一,研究结果表明,开放论坛中的投资者情绪能够显著的影响股市的价格。投资者情绪越高昂,相应的股票收益率也就越高。投资者情绪越低落,相应的股票收益率也就越低。同时,通过两种不同类型的数据对比,我们发现:投资者情绪指数的显著程度要远远大于投资者信心指数的显著程度。这也说明了文本型,非结构化的数据的解释力度要比数值型,结构化的解释力度要好。以文本为蓝本的研究要比以数值为蓝本的研究更具有说服力。本文中采取的研究办法是具有现实意义的。同时,从我们的研究结果来看,发帖量与股市价格的相关性虽然很高,但是影响力却很小,在两个回归方程中的系数均很低。如果从发帖量来判断股票市场的价格,会造成误导,从而导致投资的失败。第二,根据研究结果来看,投资者情绪指数、投资者信心指数均对个股换手率有正面影响。而情绪指标的相关性更好,这说明非结构性数据仍是一片尚待开发的蓝海。根据回归结果分析,发帖量对股票的换手率的影响不是很大,所以交易平台中的投资者,即东方股吧中的股民多数还是相对理性的。5.2政策与展望大数据时代的到来,使得我们对技术的依赖性不断增加,信息技术对我们的日常生活产生着越来越大的影响。我们在网络论坛上表达自己情绪的同时,也影响着其他的投资者。由于网络的特性,这些意见会被放大,影响着越来越多的人。我们的言
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 服装批发商直播带货与网红营销考核试卷
- 刨花板行业绿色生产与可持续发展考核试卷
- 弹射玩具销售季节性规律考核试卷
- 乐器配件精密加工技术考核试卷
- 动物用药品销售与市场预测分析考核试卷
- 刺绣艺术在充电宝的个性化设计考核试卷
- 创业项目品牌定位与市场推广考核试卷
- 劳务合同范本迁户口
- 学校铲车租赁合同范本
- 淘客推广合同范本
- 2025新人教版英语七年级下单词默写表(小学部分)
- 2025年春新外研版(三起)英语三年级下册课件 Unit6第1课时Startup
- 2025江苏苏州高新区狮山商务创新区下属国企业招聘9人高频重点提升(共500题)附带答案详解
- 《蒙牛集团实施财务共享过程中存在的问题及优化建议探析》8800字(论文)
- 平抛运动的经典例题
- 录井作业现场风险评估及控制措施
- 2025年度商会工作计划
- 社区管理与服务专业实习总结范文
- 施工现场5S管理规范
- 科研方法讲座模板
- 投资学基础(第二版)教案全套 李博
评论
0/150
提交评论