




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
企业文化专题研究-定量视角看企业文化基于机器学习的研究1、引言本文利用最新的机器学习技术(词嵌入模型),基于
209480
份财报电话会议
记录文本数据,生成了一套文化词典;而后分别针对创新、诚信、质量、尊重
和团队合作五大价值观,对
2001-2018
年间每家企业的企业文化进行年度打分。
相比于传统的基于研发支出和专利数量的企业创新能力度量方法,本文的企业文
化度量方法可以反映企业的更多信息,涉及的范围更为广泛。此外,通过实证,
我们发现企业文化与企业业务成果之间存在相关性(业务成果包括经营效率、风
险承担能力、盈余管理能力、高管薪酬设计、企业价值和交易能力)。并且在经
济不景气的情况下,企业文化与企业绩效的联系更加紧密。最后,本文提供了一
些具有启发性的证据,表明企业文化可以由重大的企业事件(例如兼并和收购)
塑造。什么是企业文化?据
O’Reilly和
Chatman(1996,
p.
160),企业文化是“一
个共用的价值观系统和一套组织成员的态度行为准则”。与根深蒂固的国家文化
价值观不同的是,企业文化具有路径依赖性,并且可以被某些企业事件改变和塑
造
(Weber、Shenkar和
Raveh1996;
Guiso、Sapienza和
Zingales2015;
Grahametal.
2018;
Grennan2018)。企业文化之所以重要,是因为企业员工难免会面临无法被
事先妥当规范的情景
(O’Reilly1989;
Kreps1990)。尽管这一主题非常重要,然
而现存文献对大样本的研究仍十分有限,这可能是由于企业文化的概念比较模糊,
导致了实证研究中的度量问题在本文中,我们提出了一种半监督机器学习方法来衡量企业文化。我们的出
发点是标普
500
中的企业在其网站上常提及的五个价值观(Guiso、Sapienza和
Zingales2015):“创新”、“诚信”、“质量”、“尊重”和“团队合作”,这其中的每
一个词汇都代表了企业的核心价值观。我们通过引入一种量化文本的新型机器学
习方法(Mikolov等人,2013
年;word2vec模型),基于词嵌入模型对金融和会
计领域相关研究做出了重要的方法论贡献。首先,本文基于词嵌入模型训练了一
个神经网络模型,针对财报电话会议文本数据,通过联系上下文的方式来学习其
中所有单词和短语的含义。然后,基于该模型的结果,我们构建了一套“文化词
典”,其中包含了与每个文化价值观密切相关的单词和短语。例如,这个神经网
络会自动学习像“联盟(alliance)”和“生态系统(ecosystem)”这样的单词、像
“双赢(win-win)”这样的短语、甚至是像“肩并肩(shouldertoshoulder)”和
“亲密的(handinglove)”这样的俚语,然后将其分类为企业文化词典中的“团队
合作”部分。接着,通过对会议记录中的该类单词和短语进行加权频率计数,我
们可以得到一个企业在“团队合作”这一项的得分。使用财报电话会议记录来计算企业文化的得分的原因如下:第一,高管团队
会极大地影响一个企业目前的文化(例如,Guiso,
Sapienza和
Zingales2015;
Graham等人
2019)。Guiso、Sapienza和
Zingales(2015)进一步说明,要想使一个
特定的价值观深入人心,企业领导必须以身作则,践行并宣传这个价值观。如果
管理者可以做到“言行一致”,那么其在电话会议中的发言在一定程度上可以真实反映公司的价值观。第二,财报电话会议的主要目的并不是讨论一个企业的价值
观,而是企业的经营和绩效。一个企业的网站或者新闻稿中所描述的信息并非一
定有效,因为在那里他们将相对容易地运用“套话”来宣扬他们的价值观。为了确
保信息有效,我们衡量企业文化时使用的是电话会议中的问答环节(QA),而
不是演讲的部分,以此减少企业过度的自我营销问题。在问答环节中,管理者几
乎没有机会选择要讨论的主题
(Lee2016)。第三点,我们的方法判别并分类了与
特定的企业文化最相关的单词和短语,创建了一个相对详尽的文化词典。此外,
我们的方法在对企业文化进行打分时,对出现得较频繁的单词/短语赋予了更低
的权重——这将有助于解决过度关注“声明”价值观的问题。在打分之前,我们也
会删除主观感情色彩过于浓重的段落(Larcker和
Zakolyukina2012)。正如
Loughran和
McDonald(2011)所指出的,电话会议记录中的非平凡的词语会不可
避免地面临被错误分类的问题,我们关心的是错误分类的情况占比有多少。在本
文中,我们将尽可能地用通俗易懂的语言,介绍一种全新的机器学习方法,助力
金融和会计领域的研究。首先,本文基于
2001
至
2018
年间
ThomsonReuters’
StreetEvents数据库中的
209480
份财报电话会议记录,训练了词嵌入模型,获得了
7501
个不同企业的企
业文化价值观(共
62664
条企业的年度数据)。我们选择运用“创新”、“诚信”、
“质量”、“尊重”和“团队合作”这些最成熟、最实用的指标,来检验我们的企业文
化衡量方法的有效性。我们发现企业文化价值观与这些标志有很强的正相关关系。
同时,我们也将本文基于
QA部分的度量方法与基于以下内容的度量方法进行了
比较:(a)基于整个电话会议(包括讲演部分和
QA部分);(b)对
QA部分的种子词语的简单统计,包括一些表示价值观的词语,如
“创新”;(c)将词嵌入模型应用于年度报告(
10
-
Ks)中的管理层讨论与分析部分(MD&
A)。接下来,我们将探讨强大的企业文化对企业业务成果的影响。我们发现,拥
有强大企业文化的公司,通常有着更高的运行效率、更高的风险承受能力、更
少的盈余管理、更有效的高管薪酬设计方案(更有利于培养风险承担能力和明
确长期导向),以及更高的企业价值。并且,在经济不景气的时期,企业文化与
绩效之间具有更明显的联系。在另一个应用实例中,我们检验了企业文化在兼并
收购(M&As)中扮演的角色,使用的数据是
2003
至
2018
年间近
8000
次兼并收
购数据。首先,我们发现,在“创新”和“尊重”这两项价值观得分高的企业更有可
能成为收购者,而在“诚信”和“质量”这两项价值观得分高的企业则不大可能成为
收购者。就兼并双方的匹配度而言,我们发现,文化价值观更相近的企业更有可
能达成交易。我们进一步发现,在控制了并购方与目标企业的企业文化匹配程度
后,并购方的价值观与其目标企业在并购前的价值观有着正相关关系——这表明
企业文化本身也受到并购的影响。本文对管理、会计、财务等领域的企业文化相关研究做出了重要的、长远的
贡献。尽管这一主题很重要,但在以往有关企业文化与企业政策的研究中,主要
是采用企业文化的代理指标(Biggerstaff、Cicero和
Puckett2015;
Davidson、Dey和
Smith2015)或依赖调查/访谈所提供的证据(例如,Guiso、Sapienza和
Zingales2015;
Graham等人
2018,
2019)。本文通过使用一种最新的机器学习技术——词嵌
入模型(Mikolov等人
2013)来衡量企业文化。该模型可以随着时间的推移,轻松
适用于大量的公司样本,从而扩展和补充了以往的研究工作。研究表明,相比于
传统的基于研发支出和专利数量的企业创新性度量方法,本文的企业文化度量方
法可以反映企业的更多信息,涉及的范围更为广泛。并且我们发现,基于大样本
数据,企业文化与效益产出在任何维度都存在相关性。据我们所知,本文是金融和会计学领域中的第一篇将神经网络语言模型应
用于定性分析公司披露的文章。这个神经网络语言模型是“深度学习”的前沿理论
(e.g.,
LeCun,
Bengio和
Hinton2015)中的一个重要部分。从方法论的角度来看,我们的贡献主要有两个方面。
首先,我们引入词嵌入模型作为一种量化单词含义的新方法。Loughran和
McDonald(2016)指出,大多数文本分析方法仅仅在文档层面进行,且忽略了
文字间的顺序和其所处的语境,将单词视作了一个个独立个体。在许多应用场景
背后都包含着这种“词袋”的假设。比如语气(情感)的测量、手动构建单词表
(Loughran和
McDonald2011;
Henry和
Leone2016)、文本分类(Routledge和
Sacchetto和
Smith2018)和主题建模(Huang等人
2018;
Lowry、Michaely和
Volkova2020)。词嵌入模型(
word2vec)通过使用神经网络,实现对词的上下文语境进行
深度解析,从而超越了这个假设。因此,单词和短语被编码成数字向量,而不是
被视作单独的标志。这种矢量化提供了一种在表达层面量化语义而不仅仅是句法
的有效方法。第二,我们提出了一种全新的用于文本分析的半监督机器学习方法。这个方
法介于监督学习方法和无监督学习方法之间。监督学习方法需要大量带标记的观
测值作为训练集——这些观测值通常以企业效益产出的形式呈现(例如预测并购,
参见
Routledge,
Sacchetto和
Smith[2018];管理层竞选,参见
Erel等人[2019]);
无监督学习则最大限度地减少了人为的输入,让数据自动呈现其内在含义(例如
主题建模,参见
Huang等人[2018]和
Li等人[2020])。相比而言,我们的方法并不
依赖人为标记的文档,但是我们仍然可以为算法提供有限但关键的指导(即文化
价值及其种子词),
让它能够从财报电话会议文本数据中归纳和收集企业文化信息。
因此,我们的方法可被应用于在以下两种情况中,从企业披露报告中衡量其他预
定义的企业属性:(1)缺乏明确的企业效益产出结果或者人为标记的数据,这种
情况下监督学习并不适用;(2)预定义的企业属性相当微妙,无法在数据中自动
显现,这种情况下主题建模(例如隐式狄利克雷方法,即
LDA方法)也不适用。2、数据、预处理、句法分析和短语学习2.1
使用财报电话会议文本数据来给企业文化打分调查显示(Graham等人,2018
年),当高管们被问及对建立企业文化影响
最大的因素时,超过一半的人认为,其现任
CEO是影响最大的因素,而不是公
司所有者、创始人、市场声誉或形象、内部政策和程序以及过去经历的困难时期
等。早期的研究结果(Biggerstaff,
Cicero,
Puckett(2015),
Davidson,
Dey,
Smith(2015),
Guiso,
Sapienza,
和
Zingales(2015))与该调查结论保持一致。这些研究运
用了
CEO的属性和行为来作为企业文化的代理变量。财报电话会议是一种常用
的企业外部沟通渠道,主要涉及
CEO(有时也有其他高管)与分析师们的交谈
——我们希望,它能解释这些企业领导人以及其领导企业的重要企业价值观;
Graham等人(2018)
也推荐将财报电话会议作为衡量企业文化的主要途径。诚然,使用财报电话会议作为数据来源时存在一个重要问题:管理者可能会
试图在会议期间粉饰自己的企业文化。值得说明的是,这些会议的首要目的应该
是讨论企业的运营和绩效,而不是营销自己的企业文化。以往的研究表明,财报
电话会议除了提供关于营收的信息之外,还提供了与价值观息息相关的信息。电
话会议的信息质量大多归功于其交互性,这种交互性也使得电话会议包含更多针
对会议参与者提出的具体问题的即时性回答(Frankel,
Johnson,
andSkinner1999;
Matsumoto,
Pronk,
andRoelofsen2011;
Lee2016)。因此,高管对企业经营和绩效进
行的讨论,使得我们最终可以应用财报电话会议,对企业文化进行评分。相较于
QA部分,电话会议中的演讲部分很可能是提前打好了草稿,或者经过企业律师
和投资者关系部精修的。而
QA部分有更强的自主性,让管理者们几乎无法作假。
在实验中,我们担心样本数据中混入了太多管理者们的“套话”,所以选择了
QA部分来衡量企业文化。从方法论的角度来看,我们使用的方法也有助于提高样本数据的有效性。一
个合理的假设是,“讲套话”的管理者会更倾向于使用常用词,如表示价值观的
词本身。我们的方法能够学习成百上千、甚至成千上万的与每一个文化价值观存
在关联的单词和短语。而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中建自动施工方案
- 《物理竞赛题解析与物理竞赛辅导教学方案》
- 汽车车门施工方案
- 内墙保温板施工方案
- 农村拆除施工方案范本
- 扬州脱硫烟囱施工方案
- 古诗二首(东溪和蚕麦)阅读练习
- 建筑工程临时用工合同
- 包头中招试题数学试卷
- 污泥干化机更换施工方案
- GB/T 24475-2023电梯远程报警系统
- 衢州市建筑工程质量通病防治措施
- 《中式面点技艺(第二版)》教案(高教版)
- 工厂车间环境监测控制系统的设计和实现
- 《神经梅毒》教学课件
- 六年级下册数学同步学堂
- 【电气专业】15D501建筑物防雷设施安装
- 通信施工安全生产培训(登高作业施工专题)
- 四位数乘四位数乘法题500道
- 企业生产管理-9S现场管理培训PPT课件教材讲义
- 猪场赶猪方案
评论
0/150
提交评论