版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中国工商银行金融青年论坛论文
互联网金融的健康发展与风险管理
大数据的源起演进与赢利逻辑
一基于金融和营销业的部分实例
2014年7月
-1-
大数据的源起演进与赢利逻辑
——基于金融和营销业的部分实例
蔡宁伟
摘要:2005年以后,针对大数据的研究层出不穷。但是,仍存在两大亟需解决
的问题:一是对大数据本质的认识不足,忽视对其源起和演进的探索;二是对大
数据赢利的关键点展开不足,未能全面展示大数据赢利的逻辑内涵。本研究尝试
弥补上述两大认识不足。通过定义梳理对比,发掘大数据的本质特征、获取特质、
优势应用和现实意义,说明大数据的来龙去脉。通过列举部分金融业和相关企业
的实例,诠释大数据的赢利步骤、特征和目的,明确纵横向大数据的优势,并提
出未来大数据的五类价值发现和发展展望。
一、引言
2005年特别是2010年以后,社会对于“大数据”的研究呈井喷式的增长。
这种增长一方面源自理论研究的不断推动,Nafwre和Science杂志于2008年、2011
年相继推出专刊,专题介绍大数据;一方面源自实践应用的提升,2012年美国
等发达国家对大数据的不断重视,启动“大数据研究与开发计划"(BigData
ResearchandDevelopmentInitiative),引导多国将其提上国家战略的议程;还有
一方面源自热点新闻的持续聚焦,2013年“斯诺登事件”就安全部门秘密监控
的猛烈爆料与持续发酵,引发公众对大数据隐私泄漏的警惕和好奇。由此,学界
和产业界都展开了对大数据的研究和探索,取得了一定成果;一些发达国家和先
进企业已经将大数据的分析应用到实际工作中,取得了一定成效。
但是,这一阶段的研究和实践还存在一些亟需解决的问题,对大数据本质及
其赢利关键的说明与解释仍然不足。主要表现为两个方面:一是对大数据本质的
认识不足,一些研究片面认识其是基于物联网、社交网络或“云计算”的时代产
物,而忽视对其源起和演进的探索;二是对大数据赢利的关键点展开不足,研究
未能全面展示大数据赢利的逻辑内涵,只看现象不看原因,对其价值取向和趋势
缺乏系统梳理。因此,无论是学界和企业界抑或大众对于大数据如何产生暨怎样
-2-
发展、以什么方式赢利等关键问题的认识仍然模糊甚至存在分歧。
t1t
对比中外全面梳理初次提出首次尝试
学者组织归纳认知地图建构模型
图1大数据获取渠道与赢利逻辑之研究设计
本研究尝试弥补上述两大认识不足,通过列举部分金融业和相关企业的实
例,说明大数据的前世今生,诠释大数据的赢利逻辑,并提出大数据未来的价值
发现和发展展望。在此,我们进行了图一中的研究设计,尝试通过比较全面的对
比、梳理和归纳,来建构大数据的演进过程与赢利模型;其中上部是研究的主要
过程和结果,下部是对应采取的研究方法和意义。
二、大数据的定义与内涵
事实上,西方早在20世纪80年代,就已经有了大数据的提法(朱东华、张
嶷、汪雪锋、李兵、黄颖、马晶、许幸荣、杨超、朱福进,2013)。我国针对大
数据的研究相对起步相对较晚,在20世纪80和90年代已经出现了与大数据相
关的一些概念,如“样本”(Sample)、“大样本”、“全样本”、“抽样”、“大数据
流”、“大数据量”、“海量数据”、“数据库”等等。虽然这些概念与大数据本身截
然不同,但至少可以作为技术层面了解和分析大数据的视角、手段与方法。目前,
学者对于大数据的概念众说纷纭,在此本研究截取中外学者和组织具有代表性的
观点,通过文本分析和梳理归纳,对比和解析大数据的定义与内涵。
表1大数据的代表性定义与特征
-3-
提出者国别定义特征
Manyika>Chui^Brown、意指一般数据库软件难以获取、存储、管理和非一般、大
Bughin、DobbsARoxburgh>美分析的大容量数据容量
Byers(2011)
Mayer-Schonberger>Cukier意指为人类的生活创造前所未有的可量化的可量化、转
英
(2012)维度,开启重大的时代转型,其核心是预测'型、预测
Gartner意指在一个或多个维度上超出传统信息技术超乎寻常
美
(2013)的处理能力的极端信息管理和处理问题2
维基百科(Wiki)意指无法在一定时间内用常规软件工具对其处理时间
(2014)无内容进行抓取、管理和处理的数据集合3长、数据集
合
意指由科学仪器、传感设备、互联网交易、电来源多样、
国家科学基金会(NSF)子邮件、音视频软件、网络点击流等多种数据规模大、复
美
(2013)源生成的大规模、多元化、复杂、长期的分布杂、长期、
式数据集4数据集合
意指用来描述数据规模巨大、数据类型复杂的规模巨大、
李瑞、贾鸿飞数据集,其规模已经超出普通的数据库管理工类型复杂、
中
(2012)具在可容忍的运行时间内进行数据的捕获、存处理难度
储和处理的能力
意指无法在可容忍的时间内用传统IT技术和处理时间
李国杰
中软硬件工具对其进行感知、获取、管理和服务长、数据集
(2012)
的数据集合合
意指为了更经济更有效地从高频率、大容量、高频率、大
互联网数据中心(IDC)不同结构和类型的数据中获取价值而设计的容量、不同
中
(2013)新一代架构和技术,描述信息爆炸时代的海量结构类型、
数据,并命名与之相关的技术发展与创新$技术创新
1参见[英]维克托•迈尔-舍恩伯格、肯尼思•库克耶.《大数据时代》M.杭州:浙江人民出版社,2012
年12月第一版,1-103。
"参见http:〃ww.gartner.com,2013年1月1日;它是一家知名的信息技术顾问咨询公司。
3参见http:〃en.wikipedia.org,2014年3月8日。
4参见http:〃www.nsf.gov,2013年1月1日。
5参见郑玲微.《大步跨入大数据时代》[J].杭州:《信息化建设》,2013(1):11-13。
-4-
香山会议意指数字化生存时代的新型战略资源,是驱动战略资源、
(2013)中创新的重要因素,正在改变人类的生产和生活驱动创新、
方式'改变现状
就大数据本身而言,综合表一中的定义,我们认为学者公认的大数据主要有
以下特征。一是容量特别巨大(Volume),不仅是TB(1000GB)、PB(1000TB)
或者EB(1OOOPB)量级,据相关研究论文或报告称大数据总量基本以ZB(2
的70次方)计量(方方,2012)。二是数据来源多样(Variety),数字、文字、
图片、音频、视频、档案文件、电子日志等都是其来源。三是处理要求迅速
(Velocity),既然是海量数据,从中要求提取的有用信息一定具有时效性;因此
我们认为这一特征的实质来源于大数据的大容量,且更准确的应该作为对大数据
处理的要求。四是具有一定价值(Value),但价值密度低、隐藏较深,需要深入
挖掘和不断“提纯”。以商业银行ATM监控为例,一般监控视频要求存储时间
达3个月,但如果涉及某个客户异常交易或者外部风险事件的可能仅有短短的
1-3分钟。五是处理要求精准性(Veracity),类似于处理要求迅速,我们认为这
一特征的实质同样源自大容量的特征,且应视为对大数据的处理要求;甘绮翠
(2013)认为这一特征是企业维度的特征,更适合于企业要求。我们认为:不仅
企业,就连政府、高校等机构同样有此需要,2013年曝光的美国“楞镜门”事
件从一定程度上验证了政府等机构对大数据的这一特征需求。止匕外,对于战略资
源、驱动创新和改变现状而言,我们认为这并非单指大数据的特征,而是其价值
与意义的体现。在目前的实践中,大数据已经起到了上述作用,并将进一步发挥
它们的特长。
就大数据的获取而言,我们认为目前主要呈现如下三大特征:一是渠道越便
利,数据获取越易。以常见的调研问卷为例,以前调研获取信息一般通过面对面
问答或发放问卷及手写录入,后来发展到电话调研和计算机录入回答,再后来开
始了网上或手机填答,目前微信等渠道也可以开展调研和投票,广受被调查者喜
爱。二是沟通越丰富,数据信度越高。所谓数据的信度(Reliability),意指数据
的可信程度,即重复调研前后数据结果的一致程度。在问卷调查中,很容易因为
1参见石勇.《数据挖掘与大数据在金融与银行领域的应用及前景》[R].北京:大数据专题报告,2014年2
月22日。
-5-
被调查者不理解题目的意思而引起回答的不一致,甚至前后矛盾,而问卷在设计
时也往往设置这样具有内在逻辑的题目,以验证回答的信度。在以往发放回收问
卷中,被调查者和调查者难以多次沟通,即便出现疑问被调查者也难以询问;而
目前采用微信、电子邮件等方式调研则更容易促进双方的沟通,即便出现问题交
流也比较及时、沟通成本较小,这是沟通方式或渠道丰富的益处。三是调研激励
越大,数据效度越高。所谓数据效度(Validity),意指数据的有效程度,即“所
答即所问"。以往,国内的调研往往借助亲朋好友的关系进行,没有礼品、奖金
等激励,结果发现存在部分被调查者敷衍了事、心不在焉的情况,如问及个人收
入选择年收入为“0”等,即便其为某公司中层管理者。后来,逐步发展为给予
现金、购物网站礼券、奖品、书籍、手机话费作为报酬的方式,由于采取按劳所
得的原则,数据获取愈加准确,有的调研长达30分钟,多则给出高达100元的
奖励。
三、大数据的源起与演进
综合上述定义,不难看出,大数据研究的绝大多数内容与人们的生产生活休
戚相关,是人们工作生活的数字化集合。因此,相当比例的大数据研究针对的是
社会科学的研究。当然自然科学也需要大数据,不过自然科学一定比例的数据来
自更为稳定、具有一定限制条件的实验室,而不一定需要通过大数据的形式或途
径来获取,有的数据可以直接通过观测获得。由于大数据具有上述针对性,因此
其源起在一定程度上打上了社会科学的烙印,从而具有一定社会科学的特征。事
实上,科学主要分为自然科学、社会科学和人文艺术三类。自然科学可以称为科
学,具有其特有的研究体系和方法,强调精确探索世界万物的客观规律;人文艺
术则更多地偏向感性思考,并不追求准确,较少存在理性活动;社会科学主要研
究人与社会的关系,借鉴了自然科学的理性方法,但具有自身感性变化的一面,
兼故了自然科学与人文艺术的特征,是理性与感性的交集,被称之为“准科学”。
比如,以社会科学中的管理学为例,就被誉为“科学与艺术的合体”。因此,图
2中展示的三类科学之间也存在交叉和互补。
-6-
在大数据概念提出之前,人类已经对数据产生了浓厚的兴趣。远古时代,“结
绳记事”就是一种数据记载和记录创新;近现代,借鉴了自然科学研究方法的社
会科学,其定量研究中的抽样、取样、样本分析或者质性研究中的案例研究实际
都是从大数据、大集合中提取具有代表性、典型性的部分“小数据”,从而分析
和预测整体数据即大数据的全貌。因此,大数据的本质离不开数学、统计学、概
率论、计算机技术和信息科学的学科群支持,也离不开高等数学与数理统计、生
物学、社会学、经济学、心理学和管理学等其他相关学科的理论补充。
值得一提的是,就大数据的潜在应用指数而言,尽管零售行业以“啤酒与尿
布”(Walmart)】,“少女怀孕”(Target)2等经典大数据分析的案例备受关注,金
融行业仍排名居首(Manyika、Chui、Brown>Bughin^Dobbs,RoxburghByers,
2011)o有学者预测,包括金融企业在内的企业正在放弃“以产品为中心”
1此营销组合主要针对单身父亲或去超市购物的父亲,尿布与啤酒这两种原本看似风马牛不相及的商品摆
在一起,使尿布和啤酒的销量大幅增加;此组合的奥妙在于不仅满足了男性角色的需要,更同时满足了同
一客户作为父亲角色即其幼小子女的需要。
2此事件源自一位愤怒的美国父亲对超市经理的投诉,认为其17岁的女儿绝不可能怀孕,而超市却将婴儿
尿布和童车的优惠券寄到他们家里:事实上,超市的广告促销并非失误,而是针对每一位客户的购物清单
组合列出了下一步营销的对象和举措,而他的女儿在超市购买了某些测孕和备孕商品后被证实真的怀孕了。
-7-
(Good-dominantLogic)转变为"以服务为中心"(Service-dominantLogic)(冯
芷艳、郭迅华、曾大军、陈煜波、陈国青,2013),或者称之为“以客户为中心”
(Customer-dominantLogic)。
从其数据来源来看,大数据的制造者、拥有者和使用者都比较多元,个体、
群体、组织均参与其中,且个人信息与家庭、企业、政府等组织信息甚至国家信
息相互交汇融合,数据量不断增大,这与其多样性的特征相一致。我们认为:政
府、企业、非营利组织(科研机构、高校)、网络与开放数据(个人、团队)等
都可能是大数据的拥有者。例如,税务部门拥有很多企业和员工的收入数据,住
建部门拥有很多个体的房屋居住和交易数据;商业银行拥有所辖客户的账户与交
易行为数据,快递公司拥有大量客户的信息和交易情况数据;高校拥有大量的学
生与毕业生信息数据,医院拥有一定量的患者信息及疾病治疗数据;咨询机构和
顾问公司拥有多年积累的项目调查数据,还有一些个人建立了源于自身兴趣和专
业的数据库。但是上述数据之间,因为数据所有者的职能、定位和监管要求等,
难以实现共享,于是一些企业逐步尝试多元化经营,以期获得更广范围的数据。
例如:2012年建设银行推出“善融商务”,从而终止与阿里巴巴的合作转而独立
获取有关数据;2013年淘宝与天弘基金联手推出“余额宝”,从而在一定程度上
弥补了自身金融交易信息不足的短板;2014年工商银行推出在线商城“融易购”,
则在一定层面完善了社会数据缺失的弱势;与之类似,2014年腾讯入股京东和
大众点评,努力丰富生活服务电商品类,旨在强化社会数据和交易数据的获取,
与此同时,百度收购糯米也是一例很好的佐证。
如图2所示,大数据的源起比较全面的展示了大数据的信息源、支持学科群
和应用领域。其中,应用领域在此主要以科学类别概括说明,而从实践上,大数
据的应用主体往往又回到了其来源,例如个人、企业、非盈利组织、政府等都可
能成为大数据的挖掘和使用主体。所以,在图二中,来源还有一个箭头从此出发,
直接与应用相联系,这反映的是大数据的来源与应用主体可能同源。如是,通过
图二可以直观展示大数据的来龙去脉与前世今生。
四、大数据的优势与创新
既然大数据与社会科学研究联系比较紧密,又备受研究者和实践者的关注,
-8-
那么大数据一定有其独特的优势和创新点。那么,大数据的独特优势到底是什
么?大数据的创新究竟如何体现?大家往往众说纷纭、莫衷一是。我们认为:大
数据的独特优势正是在于其信息的全面,进而实现由局部数据向全面数据、由结
果数据向过程数据、由总量数据向明细数据、由过时数据向实时数据的应用转变,
对应推动组织采取全面管理、流程管理、精益管理和敏捷管理的开展,从而可以
采取创新的方法从中挖掘出个人或组织希望得到的、准确的、可靠的信息,提升
分析、归纳与预测的信度和效度,进而有利于达成个体或组织目标。
图3大数据的应用转型与管理变革
如图3所示,大数据独特优势是建立在其特征之上的,依据视角不同,可以
分为四大维度。从范围维度上上看,大数据实现了从局部数据向全局数据的转型,
拥有全量数据不再是空想,继而有助于个体或组织实现全面管理和制定战略规
划;从导向维度上看,大数据实现了从结果数据向过程数据的转型I过程导向
更有助于发现和解决问题,继而有助于个体或组织提升过程管理和实施流程再
造;从层次维度上看,大数据实现了从总量数据向明细数据的转型,各个粒度的
数据可以实现分类分层聚焦,继而有助于个体或组织实现精益管理和采取质量控
制;从时间维度上看,大数据实现了从过时数据向实时数据的转型,提供了基于
当前情境的数据获取和未来数据预测,继而有助于个体或组织实施敏捷管理和采
取风险规避。事实上,全面管理、过程管理、精益管理和敏捷管理等管理变革正
1参见陈新跃.《从大数据到价值挖掘》[R].北京:大数据报告,2014年2月14日。
-9-
是大量企业基于自身和外部数据的创新,在制造企业、组织运营、流程管理等领
域得到了广泛的应用。止匕外,战略规划、流程再造、质量控制、风险规避等可能
成为个体或组织的主要目标愿景之一,这些目标本身也存在一定内在联系,因此
不能说哪一项是所谓“终极目标”,在某一环境下都可能成为急待解决的重点,
只能依据大数据应用主体的情境和需要而定。
为更好的展示大数据的优势与创新,我们首先需简要回溯大数据的学科支
持,特别是有关社会科学研究本体、客体及方法论的现状和局限。众所周知,社
会科学研究一般包含研究主体即研究者、研究客体即研究对象两大要素,研究和
研究方法科学性的必然要求就是合理控制研究误差。目前,有关研究方法的论文
和论著一般都明确指出:研究误差往往来源于样本的抽样I,即概率误差和系统
误差(也称“操作误差”)两部分,但这两类误差仅仅来源于两大要素之一的研
究主体。根据研究的两要素分类并兼顾主客体之间的关系,除了抽样误差之外至
少还存在两类误差:一是来源于研究客体的误差,即调查对象故意制造的误差和
无意出现的误差,这是一般定量研究所忽略或事后难以发现的;二是来源于研究
主客体沟通的误差,即研究主客体交互的误差(王兴周,2006),这是一般定量
研究难以检验和根治的。
在此,我们以社会科学研究中最为常见的一种研究方法:调查研究(Survey
Research)为例,其研究目的在于对研究对象的特征和关系进行调查,并做统计
分析和描述,即取得和分析资料(邱泽奇,2003)o这种研究方式的一个重要特
征,是其在时间维度上的一次性,或者称为单点性。因而,调查研究通常被称作
是一种横截面研究,其优势在于针对性对性较强,便于实施,灵活性较大(何斌、
郑弘、李思莹、董振宁,2013)。正是由于调查研究的横剖特征,使其在具有大
量优点的同时,也存在着一些内在的不足和局限。这种局限性的一个主要体现,
就是调查研究对现象之间因果关系的推断相对软弱无力。由于“从社会调查中所
获得的这种抽掉时间框架的‘事实'中,人们往往比较容易发现不同现象相互之
间的‘共变'特征,而比较难发现它们之间的‘因果'特征”,因此在解释社会
现象之间的因果关系方面,调查研究的方法存在着明显的不足(风笑天,2006)o
1大数据样本意味着“全样本”,即便如此,为保证时效性和控制成本,实现大数据处理要求快(Velocity)
的要求,我们认为样本的选择即抽样必不可少一一既要全面又要抽样,从粗糙中寻求精确(石勇,2014)。
-10-
比如,其结果容易受到调查方案设计的缺陷或执行过程中的偏差影响,又如调查
者不配合或不如实作答等,所以用以保证问卷或量表信度和效度的工作需要一定
的投入,也需要耗费较长的时间。对此,也有学者提出量化研究可以借鉴质性研
究的优势,反之亦行,以实现优势互补(胡中锋、黎雪琼,2003),进而以顺序、
平行和交错三种方式进行融合(陈忠卫,2013),例如采取仿真实验、案例推演、
沙盘模型、计算机决策等方法。
大数据的出现,恰恰可以在一定程度上解决上述问题,成为除了质性研究以
外弥补调查研究和定量研究缺陷的另一种思路与途径。以我们熟悉的金融业务为
例,两类误差有如下典型案例。为避免第一类误差,英国小额贷款公司Wonga利
用大数据挖掘算法开展某些贷款业务,他们通过对客户以往各种碎片化信息进行
获取和整理,用大量的数据还原客户特征的全貌并建立贷款模型,同时根据不良
贷款等风险信息不断完善模型,从而有效控制风险。如今Wonga年利润逾5亿美
金,其风险管理能力广受业界好评(李瑞、贾鸿飞,2012)o与之类似,阿里公
司根据在淘宝网上中小企业的交易状况筛选出财务健康和讲究诚信的企业,向他
们发放无担保贷款,目前已放贷300多亿元,坏账率仅为0.3%(郭贺铿,2013)o
为避免第二类误差,金融行业可以利用大数据开展如下创新。例如,某商业银行
的一位信用卡客户每月平均刷卡5次、刷卡金额1500元、打1次客服电话,且办
卡一年来从未收到或受理任何投诉;按照传统的单一数据分析,该客户应该是一
位满意度较高、风险流失较低的客户。但如果通过大数据搜索到该客户的微信,
通过“某银行”、“投诉”、“抱怨”、“生气”、“不满意”、“不方便”、“打不通”等
相关“关键词”的组合检索,发现真实情况是:由于他的工资卡和信用卡不在同
一家银行,导致还款极为不便,好几次打客服电话没有接通,已多次在微信上抱
怨,满意度和忠诚度均较低,与传统分析得出了截然不同的结论。
综上所述,大数据的内涵不仅仅是某一时点的截面数据,更是一定时期积累
的纵向数据。因此,大数据不仅可以为社会科学研究中基于演绎逻辑的定量研究
广泛使用,也可以为另一类研究方法即基于归纳逻辑的以案例研究(CaseStudy).
追踪研究(PanelStudy)>扎根理论(GroundedTheory)、参与式观察(Participant
Observation)实验研究(ExperimentalStudy)>档案研究(内容研究)(Archives
Study)等为代表的质性研究所引入和使用。本质上看,大数据因其来源多样,
-11-
从而可以通过不同渠道、维度、时段的数据进行相互验证,更容易发现单一来源
数据的不足和矛盾,从而实现多源交互检验。这一方式类似案例研究构建的“证
据三角形"(Triangulation)(Yin,20041)2,通过多种途径提高数据的信度和效度。
五、大数据的赢利与逻辑
既然大数据存在上述优势,那么大数据又是如何实现赢利的呢?大数据赢利
需要遵循怎样的逻辑?我们接下来将对图二中的应用部分作进一步阐释,并尝试
将大数据的赢利演进与其特征、目标相结合,以认知地图(CognitiveMap)2的
方法构建大数据赢利的逻辑内涵。在图四中,上层是大数据赢利的各阶段性目标,
中层是大数据赢利的各个步骤,下层是大数据在赢利过程中的特征,我们将三者
结合在一起通过图4来展示:
图4大数据赢利的特征、目的与逻辑内涵
(一)大数据的赢利步骤
首先,从图4大数据赢利演进的中间部分,即大数据赢利的逻辑内涵来看,
1参见[美]Yin,R.,K.《案例研究设计与方法》IM].重庆:重庆大学出版社,2004年11月第一版,1-59、
106-114»
2认知地图也称"心像图"(MindMap)、"心智图"(MentalM叩)等,由Tolman于1960年代提出,以普
通地图的形式展示知识的有机结构;本研究采取广义认知地图的方法,是基于认知科学的人类对于事物及
其相互之间关系的关联图示,可用于表达隐性知识的图形(张凌,2012).
-12-
组织若想实现大数据的价值基本需要采取以下五个步骤。一是从个体、组织、国
家等大数据的源头获取数据,一般而言,企业最初获取或者日常获取的这类数据
往往是一种横截面的数据,即节点数据,主要反映某一时间点的信息。因此,即
便此时的数据涵盖了方方面面,严格意义上讲也只能称为横截面大数据。二是企
业等数据搜集主体通过长时间的积累和追踪,不断累积横截面的数据,逐渐形成
某一时间段的大数据。在研究上,这类数据被称为纵向数据,具有考量个体和组
织行为习惯、特征偏好等功用。三是大数据搜集的主体通过数据挖掘,寻找大数
据中隐含的内在联系与因果关系,可以发现某些数据及其行为主体的规律。事实
上,只有横截面与纵向共享的全量数据,才能称为真正意义的大数据。四是即便
企业拥有了大数据,也不能直接通过它来实现赢利,需要在结合内在规律的同时
通过发现其中的个性化数据信息信息,进而采取精准营销、流程优化、产品创新
等手段。这一系列手段,是企业实现内部改进、提升对外服务的必要条件。五是
即便企业不断优化改善,实现了营销等方法上的准确定位与创新,企业仍然存在
长期的发展挑战。这时候,依托大数据进行中长期战略预测、对颠覆性的小概率
事件进行风险管理,将事后和事中风险前移到事前管理,可以使企业在解决“近
忧”的同时兼故“远虑”,保持企业的基业常青。
(二)大数据的赢利特征
从图4大数据赢利演进的下部分,即大数据赢利的特征来看,前文提到的大
数据特征始终贯穿大数据赢利逻辑的全生命周期。一是横截面的大数据获取主要
体现了大数据获取渠道的多样性(Variety)、容量大等特征。二是纵向大数据的
积累主要体现了大数据容量大(Volume)、价值密度低等特征,横纵向大数据的
集合更加复合展示了上述特征。三是正因大数据具有上述特征,因此在进行数据
挖掘、规律寻找的之时,处理要求快(Velocity)便成为其通用的要求。不难看
出,处理要求快实际并非大数据本身所具有,而是大数据处理主体的必然要求。
四是更进一步,从发掘个性化数据,实施精准营销、优化创新起,精确性(Veracity)
也是处理大数据的必然要求。因此,类似处理要求快,精确性也并非大数据本身
独有,海量数据汇聚一起,准确需要处理主体来实施。五是对于企业等主体关注
的有关战略预测、风险管理的核心大数据,必然具有较高的价值(Value),事实
上,这一价值主要针对所需要的主体而言,即存在一种相对价值,并且这一价值
-13-
的赋予和附加恰恰是实施主体通过搜集积累、数据挖掘、创新优化等手段所累进
的。例如,工商银行已经实现了由事后监督向基于操作风险监控事中管理的战略
转型,并创新地开展了事前预测,增强流程和系统的风险管控能力(易会满,
2013)。这一创新正是基于大数据的上述特征并应用于实践,不断改善公司治理,
增强企业的核心竞争力,取得了良好的经营管理效益。
(三)大数据的赢利目的
从图4大数据赢利演进的上部分,即大数据赢利的目标要求来看,源自大数
据实施主体的要求与大数据赢利的步骤和特征休戚相关、相辅相承,从而形成一
整套交互融合的逻辑体系。一是横截面的大数据获取主要解决信息不对称的问
题,避免因某些数据的缺失导致企业决策失误,实现某一时点数据的对称共享。
二是仅仅有横截面的大数据处理还远远不够,需要企业通过自身、外包、外购、
开源、交换等多种途径积累更长时间段内的纵向数据,最终建立纵横向维度的大
数据集合,以拥有足够的数据资源较少甚至消除概率误差、系统误差、研究客体
误差和研究主客体沟通的“四大误差”,为企业进一步挖掘数据价值提供基础支
撑。三是个性化数据挖掘用以实现精准定位的目的,无论外部精准营销,还是内
部流程诊断,个性化的数据必不可少,而通过大数据的不断提炼和发掘,可以将
某些个体的信息片段或者断点连接起来,形成展示个体信息和习惯的全貌,获得
抽样调查因果关系解释不足的先天缺陷。四是进一步发掘企业关注的长期核心数
据、小概率异常数据等,提炼事关企业战略发展、宏观经济形势变迁、极端概率
风险事件的数据,保障企业实现持续稳健发展。五是无论上述哪一方面,实质都
是为了助力企业内外部挖潜,确保企业实现赢利,帮助企业持续提升绩效。
六、大数据的价值与展望
社会科学研究的一个重要目标,就是要探索和解释不同社会现象(研究变量)
之间的因果关系。而因果关系的基本条件之一,就是存在关系的两种现象之间具
有时间上先后顺序。作为原因的现象要发生在前,作为结果的现象要发生在后(风
笑天,2006)o正如Cook和Campbell(1986)以及Shadish、Cook和Campbell(2002)
等提出有效的因果推论必须满足三条准则:一是假定的原因和结果之间具有共变
性,或者称之为存在稳定的关系;二是原因暂时优先性,即原因必须发生在结果
-14-
之前;三是能够控制和排除可能的因果关系之间存在其他解释的可能性,即除此
原因之外没有其他替代性的解释。其中的准则之二,就是用以保证因果关系的时
间顺序,即先后顺序的必要条件。大数据的出现,为社会科学研究实现这一目标
奠定了更为坚实的资源和信息基础,其建构、解释和预测的精确性(Veracity)
甚至可以达到前所未有的高度。2014年,美国微软纽约研究院的经济学家
Rothschild通过综合博彩公司赔率、投票排行等大数据分析,以概率的形式成功
预测了24项奥斯卡大奖中的21项,成功率高达87.5%'无独有偶,美国印第安纳
大学利用谷歌的心情分析工具,从海量网民的留言中归纳出六种心情,进而预测
道琼斯工业指数,准确率高达87%(郭贺铿,2013)。我们认为:通过一定规模
的大数据,更容易发现和解释不同社会现象之间的因果关系,进而为个人、组织
特别是以赢利为目的的制造和金融等企业提供更为方便、准确的金融产品和信息
服务。具体来看,主要表现为以下五个方面:
(一)实现精准营销
大数据有助于企业实现精准营销。前面提到的经典案例“啤酒与尿布”、“少
女怀孕”等都是一定量级数据综合分析的结果。尽管经过了大量客户与实践的检
验,但仍不排除存在一定数量的促销和广告推送失误。例如,不排除美国有的已
婚女性也喜欢喝啤酒,也不排除已婚女性持有先生的信用卡帮助先生购买啤酒。
但是,在更为广阔的大数据面前,这些例外都会迎刃而解。例如,除了“啤酒与
尿布”,钟情啤酒的已婚女性可能还存在其他购物组合,如“啤酒与女士香水”、
“啤酒与护发素”等等,如果企业发现这类组合,便可以将客户从的单身父亲类
别中剔除,并建立新的客户类别。在此基础上,向客户推送的营销信息、金融产
品也可以不断完善,实现个性化、差异化与定制化。事实上,所谓垃圾信息只是
用错了地方、给错了对象,一旦投送的客户确实需要这些信息,便会“视为珍宝”,
决不置之不理。依靠大数据作为支撑,垃圾短信、垃圾邮件、垃圾广告都可以变
废为宝,延伸客户关系管理(CRM)的范畴,建立企业与客户更为紧密的联系。
(二)发掘新型产品
大数据有助于企业发掘新型产品。在产品和服务的创新过程中,除了企业主
动发起之外,来自客户的需求也不容忽视。无论是客户的客观需要、抱怨投诉和
意见建议,积少成多,便可以从中发现端倪。例如,一些客户因持有不同银行的
参见,2014年3月4日。
-15-
信用卡或者在不同银行贷款,需要每月定期去多家银行或者登陆各银行网银还
款,有银行正是基于客户“多头还款”的问题开发了基于同一银行卡的定期转账
还款产品,很受这类客户的欢迎。再如,一旦有客户在网银退出某类金融产品或
者通过电话银行、自助银行放弃某项金融服务的使用,不妨在随后的流程或界面
上多问一句:可否请您告知我们放弃此类产品的原因?并列举若干选项:A、操
作不方便;B、未达预期收益;C、存在安全隐患;D、其他银行有收益更好的产
品……以及您还需要补充的情况等等。日积月累,这些信息更有助于了解客户和
竞争对手,进而不断完善、丰富和改进金融产品与服务。
(三)优化内部流程
大数据有助于企业优化内部流程。除了外部客户之外,企业员工这一内部客
户的感受和体验也不容忽视。基于大数据理念,可以协助企业寻找影响员工满意
度的关键瓶颈,梳理导致内部抱怨的流程要点,从而帮助企业进一步优化流程,
提高运营效率和服务质量。例如,通过系统监控,可以发现员工在哪些环节操作
时间过长,在哪些步骤容易出现失误,并进一步分析有没有员工可以在计划时间
内保质保量完成,为什么一些员工需要更多的时间,为什么一些员工会出现失误。
进而通过改进操作流程、完善运营系统、进一步培训监督等方式来共同提升员工
的操作水平。事实上,20世纪80年代后出现的“全面质量管理”(TQM)、“戴
明环”、“六希格玛”(6。)等管理理念正是基于企业内部数据分析、汇总的结果。
而通过大数据,还可以结合员工个体的日常行为、企业的重大事件等来共同预测、
防范和控制一些小概率错误的影响,合理控制或降低事故的作用范围和程度。
(四)创新商业模式
大数据有助于企业创新商业模式。相信在未来的若干时间,一批数据公司、
顾问公司、数据仓储公司、数据挖掘公司、分析统计公司、数据营销策划公司会
应运而生,活跃在各个行业;而一批企业数据库、行业数据库、政府数据库会逐
步建立,甚至有的数据库会实现部分数据的开源共享,从而产生更大规模的数据
使用与融合。当然,无论上述哪种商业模式,或者精准营销、创新产品、优化流
程的哪个方面,企业或者个人都将付出一定技术与人力成本。因此,我们在此提
示各类组织、个体,在选择大数据挖掘处理之前,一定要先行了解和评估大数据
分析运营的成本,从而结合自身实际客观考量是亲历亲为还是业务外包,是全面
-16-
挖掘还是典型取样,是自己自足还是开源共享。可与预见的是,在不久的将来,
一批基于大数据应用的企业整合、并购和外包浪潮会随之到来,并深刻影响和改
变我们的工作与生活。这一时期,更需要公民、企业与政府联手,制定有关大数
据应用与共享的系列法律和规则。
(五)加强风险管理
大数据还有助于提升风险管理水平。众所周知,大数据是与互联网相伴相生
的,在密切人与人联系的同时,相关风险事件也层出不穷。其中,以电话欺诈、
信用卡欺诈、支付欺诈为代表的“三类欺诈”尤为突出,又与个人信息泄露和部
分数据共享有着紧
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业示范温室大棚安装协议
- 儿童玩具设计总监聘任合同
- 厂房水电施工合同:印刷业篇
- 演出器材租赁合同
- 生态农业园绿化施工合同
- 建筑公司项目经理聘请协议
- 知识产权保护合同规范
- 图书馆资料储存分类方法
- 煤矿安全监查员工作规范
- 旅游景点设施管理
- 1D4 10kV避雷器试验报告
- 中小学教师信息技术培训
- 国家基本公共卫生服务项目培训课件
- 工程图学习题集答案合工大课件
- 2023年江苏省沿海开发集团有限公司校园招聘笔试模拟试题及答案解析
- 压花制作(观赏植物学)课件
- 《夏商周考古》第5章西周文化(4-6节)
- 惠普的管理流程-详细解读
- T-CIATCM 008-2019 中医药卫生经济信息标准体系表
- 地下车库给排水及管线综合设计要求
- 2022年安全员上岗证继续教育考试答案
评论
0/150
提交评论