版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、用途本为商弈投资的被投资客户、项目融资辅导营被孵化的客户提供行业分析并帮助他们进行产品创新。同时为商弈投资(TMFOX VENTURE PARTNERS)合作的投资机构、科研机构和机构提供行业研究和投资参考。研究方法本收集大量可靠的具性的资料及数据,仔细分析对比得出相关结论,并通过对项目融资辅导营企业进行调研,进一步获取更全面的信息,且与本行业进行了深入探讨研究。本是基于认为可靠且已公开的信息,力求但不保证这些信息的准确性和完整性,也不保证文中观点或陈述不会发生任何变更。仅为商弈投资(TMFOX VENTURE PARTNERS)所有,和个人不得以、或。撰写人欢迎指导、。1 / 30目录一、概
2、述3二、大数据概览32.1 大数据定义32.2 大数据主要特征42.3 大数据代表未来4三、大数据产业现状73.1 大数据的源与流73.2 大数据产业结构103.3 主要子行业113.4 行业存在. 13四、中期投资要点174.1 数据资产方向174.2 数据融合处理方向204.3 后端应用(商业智能)224.4 综合分析23五、典型公司介绍245.1 上市公司245.2 项目融资辅导营会员企业272 / 30一、概述大数据以“降低信息不对称和提高决策有效性”为目标,可广泛作用于几乎所有行业,必将掀起一场新的。目前,大数据已经迎来了高速发展的黄金成长期,看好其发展趋势,投资者提高对其中孕育机会
3、的关注度。从源到流看,大数据涵盖数据、数据融合处理、数据应用三个过程;按照物理分层,大数据又可以分为硬件、基础、应用信息服务四个维度。每一个细分领域都正在不断演进,存在不少问题也孕育着巨大的机会,万千创业者不断地寻找着新的突破口。目前制约大数据更好更快发展的主要问题有以下几点:一是数据的归属权不清晰,各家数据资产型企业私密占有,制约着大数据的融合及发展;二是数据有效性将直接影响到大数据的应用水平,从源数据到分析样本过程需要大量人工干预;三是配套软硬件成熟度不够:适宜处理海量数据的数据库尚未成熟,私有云的普及程度也不高;四是数据尚未获得真正意义上的定价和。基于对大数据的研究,判断,未来 3-5
4、年的中期投资思路主要包括新数据、新模式、数据融合处理和商业智能 4 个方面。其中,新方向关注新型人机交互模式的可穿戴设备、低并找到了硬需求作为切入点的智能家居、基于食药品生产追溯的物联网等相关企业;新模式方向关注针对新的底层统计公司、“以免费服务获数据”和“有偿返还数据给用户”三种可能的创新;数据融合处理方向关注针对金融业务的创业及私有云相关企业;商业智能方向关注对细分行业有深刻理解的大数据应用及 SaaS 云服务提供商。综合标的数量、确定性、所需投入和价值等考虑,重点推荐针对细分行业的大数据应用SaaS 云服务提供商、私有云解决方案提供商,追踪关注新的发展,并发掘相应的底层统计公司(类似针对
5、移动应用的友盟)。二、大数据概览2.1 大数据定义大数据是一个伴随社会信息化而诞生,以海量数据(主要特征包括数量大、种类多、处3 / 30理速度要求快、以前没有或无法获取且现在正不断生成)积累为基础,囊括无数条“数据产生-数据处理-信息提取-数据消费-新数据生产”的环状链,以降低信息不对称、提高决策有效进智慧和知识演进为目标,可广泛作用于几乎所有实体的跨界生态系统和发展趋势。2.2 大数据主要特征大数据的主要特征有以下 7 个方面:第一,数据量巨“大(massive)”,以 PB 甚至 EB 为计算,超出了绝大多数企业现有的常规数据处理能力;第二,数据种类“多(various)”,涵盖已经利用
6、广泛的结构化数据和非常规的半结构与非结构化数据;第三,因为数据量大、种类多,为了提高应用水平,则必然要求相应数据处理能力更强,处理速度更“快(quick)”;第四,这些数据在很大程度上是随着社会信息化程度提高而近期产生的,以前没有或无法获取但又正在不断生成的“新(fresh)”数据;第五,因为其“大”、“多”、“快”、“新”的特征,再加上“降低信息不对称、提高决策有效进知识与智慧演进”是全人类的共同需求,大数据或早或晚必将影响、覆盖到几乎所有行业和实体,其“价值(erful)”空间十足;第六,典型的大数据链是如“数据产生-数据处理-价值提取-数据消费-新数据生产”的环状流程,而无数条闭环交叉,
7、互为源流,了各种商业主体参杂其间,涉及数据终端、基础硬件、基础、应用互联网等领域的跨界“生态系统(ecosystem)”;第七,基于以上特征和对市场的观察,判断大数据蓬勃发展的“趋势(trend)”已经成型并长期看好其发展。2.3大数据代表未来1) 环境驱动数据产生成本逐年下降,和企业对大数据的投资力量日益增强,新的数据源正不断4 / 30产生并壮大,大数据蓬勃发展的外部环境已经成熟。成本逐年下降根据 IDC 的判断,数据产生成本是符合反摩尔定律的,即数据产生成本大概每两年下降一半;而这一趋势,最起码会持续到 2015 年。大量新数据源互联网世界完成从 Web1.0 到 web2.0 的过渡,
8、移动互联网日趋成熟,物联网长足发展,高粘性、强(实时快速)互动性、去(弱)中心化、全民等特征明显呈现,线上与线下深度融合,各种(人人、人机)交互的网状结构更加复杂与饱满,全新数据源层出不穷。各种、O2O、电子支付等的发展,让可以捕捉到海量的商业交易活动行为痕迹;同时,SNS、自、LBS 技术等的高速发展可以较好地呈现不同主体的关系链、偏好、等信息;前述两者共同让面向主体的识别与判定变得更加容易和精准;、医疗、视屏、物联网等则让进一步加深了对自己和环境的理解。投资力度增强从国家层面看,2012 年 3 月 9 日,投资 2 亿启动“大数据研究与发展计划”,希望增强海量数据、分析萃取信息的能力。预
9、计欧盟、中国等主要经济实体也很可能跟进出台相应引导政策。在公司层面看,、微软、IBM、Oracle 与 BAT 等国内外巨头均加强了在大数据相关领域的布局。根据,到 2015 年跟大数据相关的全球投资总额将增加到 5.2 万亿。2) 需求驱动认为整个人类都一直并将继续面对和突破四个约束能源约束、信息约束、智慧约束和审美约束。其中,能源约束指人类生存、改善、发展所需的材料和泛能量之总和,能源是一定的,总量取决于人类的活动半径,利用水平则依赖于智慧和信息;信息约束指人类做决策所需要的非实物形态、非价值观和方法论的信息(具有一定的特点)总和,信通过监测、取样、保存而不断生成和更新迭代;智慧约束指人类
10、生产或决策所需要的价值观、方法论等信息综合处理研判能力及知识,智慧通过人类不断的探索、试错行为产生新信息并再处理、再研判、再探索的行为而更新完善,并指导未来的决策;而审美约束5 / 30则指不同实体的亿万条效用曲线的共性和个性,在短期审美不易改变,很大程度作为人类思考和行为的指南针,长期则也会受智慧及信息影响而缓慢变迁。在这四个约束条件的共同作用下,人类通过不断探索、试错去寻求改善,从一个个旧的稳态发展到一个个新的稳态和帕累托均衡,以终为始,周而复始。图 1:人类发展的四个约束条件海量的,多种类的,以前没有或无法获取但正源源不断生成的大数据将直接而迅速地在较大程度突破信息约束,为突破智慧约束提
11、供了广度和深度都前所未有的素材和原料;而“大数据”另一个特征速度(信息快速处理能力)又能帮助在现在和不远的未来将这些素材和原料进行有效提取与再加工,形成知识演进和智慧积累,加快对智慧约束的突破;并指导更好的发现自己(审美约束,即亿万条效用曲线),理解和开发环境(能源约束),提高行为有效性。因此,大数据直接而深度的影响信息约束和智慧约束,并间接的影响到能源约束和审美6 / 30约束,认为他非常深度的契合了人类发展的需求,从需求层面讲必然代表未来的方向。三、大数据产业现状3.1大数据的源与流大数据从源到流到汇聚应用,包含数据、数据融合处理、数据应用三个主要过程。从前到后看,这三个过程分别对应于数据
12、资产领域、数据融合与处理相关领域、数据应用相关领域。图 2:大数据链示意图1)数据资产领域“数据正在成为一种()资产”已经是行业的共识。大数据很大程度上是随着社会信息化程度提高而在近期产生的,即是以前没有或无法获取且正在不断生成的“新(fresh)”数据。不同的公司把握着各个数据,而把握数据资产的企业也必然成为大数据的首批和直接受益者。从公司业务模式上,数据资产公司可以区分为纯数据资产公司和兼数据资产公司;从数据类型上,数据可以区分为交易数据(含询价等)和交互数据。纯数据资产公司指其产品和业务即为数据本身,代表企业如友盟和个信互动等。友盟(Umeng)将代码植入各种移动应用,向移动应用创业者提
13、供应用统计分析、用户反馈等服务,目前,国内主流开发者大多是友盟的用户,超过 18 万的移动应用从友盟服务中获7 / 30益。个信互动的个推,面向公众提供专业机推送解决方案,并向开发者提供推送的BI 数据,目前的接入用户已经超过 6.8 亿。不难看出,该类公司有几个特征,一是处于数据流中某个基础性的控制节点;二是在控制节点后了一整类的兼数据资产型公司;三是标的数量很少,一个具体领域(如的信息推送或者应用统计服务)只能容纳下 1-2 家企业;四是该类企业处于底层,较少为非业界所知。兼数据资产公司相对纯数据资产公司显然,下表按照交易数据与交互数据对其进行分类整理。表 1:主要兼数据资产类企业表格中所
14、列示的都是规模较大、有所成绩的企业,因为如果数据没有相当深度和广度的累积,价值将非常低。但是,看到不断有新的企业成长起来,百花齐放百家,抢夺已有的或者开辟全新的。2)数据融合与处理相关领域在数据融合与处理相关的领域,主要解决包含两个方面:一是数据标准化与有效性整理;二是面向过程(具体目的)的数据处理与粗提取。典型的案例如数据库,商业与各信贷主体之间每天都在发生着海量交易,交易一旦发生则进入各商业数据库(录入通过人机交互过程完成数据的标准化和预8 / 30类别国内相关代表企业国外交易数据金融人行资信安融汇众FICO泛金融万得同花顺大智慧BloombergB2B阿里巴巴焦点科技Globalsour
15、ceB2C天猫京东苏宁易购AmazonC2C淘宝拍拍易趣Ebay垂直类梦芭莎聚美优品凡客诚品当当Zap消费类 O2O大众点评美团Groupon电子支付银联支付支付宝财付通拉卡拉Paypal物流顺丰快递中国邮政德邦快递UPS其他中国移动沃尔玛711交互数据SNS人人网腾讯物联网远望谷Digi搜索引擎雅虎搜索3721搜狗其他盛大网易优酷视屏互动百科Wiki处理),每天晚上各商业对数据进行整理和加密,次日将信贷主体与信用数据加密通过接口将数据包提交到数据中心,然后中心将各数据包加成导入到数据总库进行更新,完成数据标准化和有效性整理并形成更新后的数据状态。而面向过程的数据处理与粗提取,比如对某信贷主体
16、的数据进行查询后,可通过插件进行风险(企业)或信用评分(个人)的简单核算,不同金融机构可设置不同的标准,根据自身风险政策完成初步的可否授信、授信额度大小的批量化评估。较成类似机构包括、万得、同花顺等,目前均局限于金融行业,但每个行业都有不同的数据整合入库的需求,而数据标准的制定及数据汇聚的执行是其难点所在。另外,在大数据的融合与处理相关领域,两个绕不开的点为基础(数据库云计算,在后文“中期投资要点”中。3)数据应用相关领域如上文所述,掌握数据资产的企业群是大数据的首批和直接受益者,因为他们会自然、方便的对大数据进行把玩、加工、消化、利用。而随着应用价值的逐步体现及大数据产业的发展,应用将必然扩
17、张到生产生活的方方面面,广泛影响各行各业。针对各个行业应用大数据的潜在价值做了一个评估(结论参见下表),从其中可以看到,大数据的应用将使得金融保险、公共管理、贸易物流等领域获得极大的价值。9 / 30行业大类细分行业整体价值潜力企业平均数量绩效波动性供销伙伴密度交易密度行业波动性商品制造业建筑业自然资源计算机和电子房地产批发贸易服务交运仓储零售废物管理与政治餐饮其他服务休闲表 2:大数据应用潜在价值的行业分类表3.2大数据产业结构本节,重点探讨围绕大数据垂直构架(硬件、信息服务)的产业结构情况。首先按照从硬件-基础-应用-信息服务和数据生成-处理-应用两条线各 4 个维度来划分大数据的产业结构
18、,涉及 11 大类主要的产品和服务:设备、设备、服务器、数据库、监测、智能搜索与、系统集成、IT 基础设施服务、实施服务、以及云计算。图 3:大数据产业结构示意图以上 11 种主要产品和服务都是大数据的重要,但其中基础(数据库分布式文件系统)、应用是大数据产业价值转化变现的最关键部分,云计算对10 / 30金融保险专业技术服务企业管理公共管理教育医疗机构公用事业备注:前 20% 前 20%-40% 前 40%-60% 前 60%-80% 最后 20% 缺相关数据大数据的广泛应用有着举足轻重的意义,其他 7 种在某种意义上则是在原有基础上持续更新并与大数据发展配套的过程。在软硬件和信息服务领域的
19、垂直划分中,认为商业智能带动的应用、云计算和是国内大数据发展的三家马车,也是更可能有所作为的地方。3.3主要子行业1) 硬件与基础大数据增长带动硬件和基础发展。和服务基础设施用于产生的数据,是数据周期的第一站。随着“新摩尔定律”逐步得到验证,预计大数据将呈现越来越快的增速,同时大数据中非机构化数据占比也将逐步提高,这直接推动着和服务器行业的大发展。如何更快、更好、更准确地把数据分门别类、按需,提高性能和计算能力,是器和服务器提供商的新问题。基础提供商主要是提供操作系统、数据库等,对已经好的数据资源进行高效管理,是器、服务器的下游环节。器、服务器等硬件设备的发展也将直接带动基础的升级。国际巨头上
20、述领域,寡头格局已经形成。EMC、IBM、HP、Sumsung、Oracle 等国际巨头在硬件与基础领域多年,市场竞争格局基本稳定,寡头竞争态势明显。因为其基础的优势,又逐步向更下游的应用等领域渗透,不断完善自身产品线客户粘性。领先的技术优势、丰富的客户资源、强大的并购能力等构建了国际巨头的护城河,使得国内企业短期内很难。2) 商业智能应用商业智能的体系和意义从数据的最终利用深度来区分,商业智能划分为数据报表、数据分析、数据挖掘三个层次。其中,报表系统只是简单地进行数据管理,描述企业已经发生的事件,比如 Excel、水晶报表、Reporting Service 等报表系统;数据分析师对数据进行
21、优化分析,造成企业目前状况的次原因,比如 OLAP 技术;数据挖掘则是对数据进行分析,发现知识、未来。商业智能的最终目的,是为了产生更好的商业决策。11 / 30商业智能的实现过程是通过收集来自企业和外部各种数据源的不同数据,提取有用信息,经过数据、转换、重构进入数据仓库或数据集市,然后通过合适的查询和分析工具、数据挖掘工具、联机分析处理工具对数据进行加工处理,最终转化为知识。从商业智能系统建立的技术角度看,构建一个完整的商业智能系统涉及到的技术主要有数据仓库(DW)技术、联机分析处理(OLAP)技术、前端分析展示技术和数据挖掘(DM)技术等组成。国内现状国内供应商专注于报表、应用解决方案等领
22、域。国内 BI 厂商的共同特点是,产品线不全,厂商实力相对较弱,基本可以分为三类:第一类是从报表工具、展示工具等延伸而来的厂商,这类厂商占绝大多数,如润乾、科技等;第二类是从等管理软件延伸而来,如、浪潮、金蝶等,专注于战线工具和分析模型方面,并开始向应用和行业解决方案;第三类是专业 BI 厂商,如菲奈特融通、东方国信等,专注于 BI 应用行业解决方案。国内厂商在数据仓库、数据集市、BI 工具等方面,缺乏有竞争力的产品。3)云计算云计算的三种服务交付模式:(基础设施即服务)、PaaS(即服务)和 SaaS(即服务)。表 3:云计算的三种服务交付模式云计算厂商则可以细分为提供商、系统集成商和服务提
23、供商。12 / 30指的是以服务形式提供服务器、和网络硬件。这类基础架构一般是利用网格计算(puting)架构建立虚拟化的环境,因此虚拟化、集群和动态配置也被涵盖在 IssS中,这方面代表有亚马逊的弹性云服务,ServePath 下的 GoGrid 等PaaS指的是以服务形式提供给开发 应用城市需开发及部署 ,让他们可利用此 来开发、部署和管理 SaaS 应用程序;这种 一般包含数据库、中间件及开发工具,所有都以服务形式通过互联网提供;PaaS 也是 SaaS 模式的一种应用,这一层面的代表有 App、MOSSO 等SaaS指的是通过浏览器,以服务形式提供给用户应用程序;SaaS 是一种 布局
24、模型,其应用专为网络交付而设计,便于用户通过互联网托管、部署及介入;SaaS 应用 的价格通常为“全包”费用,囊括了通常的应用 证费、 费以及技术支持费,将其 为每个用户的阅读租用费;SaaS 可以通过浏览器把应用程序作为服务提供给成千上万的用户;这一层面的代表有、 map、office live 等表 4:云计算的三种厂商4)越发重要,迎来发展契机。产品覆盖硬件、及服务;细分领域众多,竞争激烈且龙头各异。安全硬件主要包括/、检测/防御系统(IDS/IPS)、管理(UTM);安全主要包括内容安全与管理、管理、控制等;安全服务主要包括安全咨询、等级评测、风险评估、安全审计、运维管理、安全培训等方
25、面。3.4行业存在1) 数据的归属权不清晰,数据资产型企业私密占有,制约着大数据的融合及发展。阿里巴巴,这家集 B2B、B2C、C2C与第支付于一身的巨无霸企业,在 2009年前后开始低调试水小贷业务,并在之后成立了阿里金融事业部。基于阿里所累积信用和行为数据的全新风险管理模式,快速灵活的放款流程,为需求旺盛但供给远远的小微企业小额信贷业务打开了一条别样的路。阿里金融从出现开始便受到了广泛关注和。许多机构和个人都向往之,也对其模式了解得清楚明白,但均默默然而无法。究其原因,就在于“阿里独有的沉淀信用及行为数据”数据,阿里金融的独门利器。无论已有的金融交易(如、大智慧等),亦或、O2O、第支付是
26、 SNS 和其他交互数据源;现状是原始数据在后端,被掌握者控制,数据的创造者(用户们)是否掌握与自己相关的数据取决于的开放性和接口提供企业们互相独立地像挖矿一样在沉淀数据中淘金,各自取得一些不错的成果,13 / 30提供商云计算需要能够实现虚拟化、自动负载平衡、随需应变的软硬件,这部分的提供商主要是传统的软硬件生产商,如 Vmware、Oracle、Sun、IBM、Cisco 等;国内的相关公司包括浪潮信息、成、中兴、方正科技等系统集成商帮助用户搭建云计算的软硬件,尤其是企业私有云:代表厂商包括 IBM、HP、AT&T 等;国内公司包括成、浪潮、东软等;服务提供商包括为企业和个人用户提供计算和
27、资源的公司、为应用开发者提供开发的PaaS 公司、SaaS 应用服务提供商;代表厂商包括 Amazon、Racksp、Salesforce 等;国内公司包括鹏博士、网宿科技、神州泰岳、金蝶、焦点科技、等但事实上数据的私密占有也严重制约着大数据的广泛应用和整体发展。那么,数据到底是谁的?是企业的,还是数据创造者(用户)的?还是既是平台企业的,也是用户的?什么样的数据是公开的,什么样的数据是私密的?一般认为,原始数据沉淀在上,实际占有并可以使用,但在未获的情况下不能提供给第,用户对原始数据的占有获取权及公开程度基本取决于用户与达成的协议(多为安装前的“用户须知”部分,用户除用脚投票外并无实际协议制
28、定权);而对原始数据经过统计提炼获得的其他信息属于企业。参考国外,数据是属于个人的,企业可以解除、使用数据不代表个人放弃对数据的所。国际趋势上看,信息主体的权利正在强化,如信息主体的遗忘权、转移权;信息控制主体的责任更加明晰,如明确了负有个人信息保护义务的服务提供商范围、要求服务提供商设置个人信息保护专职岗位,增加了服务提供商对行为义务,便于用户采取预防和减损措施。国内的政策方面:2012 年 12 月 28 日,出台关于加强网络信息保护的决定,对网络信息保护进行了原则性的规定;2013 年 7 月,工信部出台电信和互联网用户个人信息保护规定;除此以外,技术、公共及服务信息系统个人信息保护指南
29、作为我国首个个人信息保护的,虽然不具有法律上的强制约束效力,但具有指南性,亦可作为衡量互联网企业是否有过失的参考性标准;目前,我国正在起草电子商务法,强化对的。2) 数据有效性将直接影响到大数据的应用水平。数据的质量大数据就像砂金矿,为了开采出金子,人们需要不断的淘沙,淘出,然后再经过冶炼获得千足金。而数据质量就相当于砂金矿的含金量和成色,良好的数据质量是挖掘价值的基本保障。认为,数据质量主要涵盖两个大方面:一是基本质量,包含准确性、一致性、容量和更新率 4 个要点;二是可应用性,包含易识别性、易处理性、获取及时性、性和智能性 5 个要点;详情见下表。14 / 30表 5:数据质量的主要特征洗
30、数据的难度在大数据应用中,有一项极其重要也极其的工作,那就是“洗数据”。洗数据就是把大量包含无效数据、分布杂乱无章的原始数据进行归并聚合,通过建立数据标准并执行来取得需要的分析样本的过程。正所谓:Garbage In, Garbage Out! 数据挖掘的领域内有一个观点:如果数据准确度在 60%的时候,你干出来的事,一定会被用户骂;如果数据准确度在 80%左右,那么用户会说,还不错;只有数据准确度到了 90%的时候,用户才会觉得真厉害。但是从数据准确度从80%到 90%要付出的成本要比 60%到 80%的付出大得多得多。大多数据的数据挖掘团队都会止步于 70%这个地方,因为再往后,这就是一件
31、相当累的活,绝对少不了大量人力的工作。这里使用用户地址举例说明,因为地址是用户自己填写的,有很多的坑,这就需要大量的洗数据工作。首先,第一类是假/错地址,因为有的商家或是用户做测试,比如直接就输入“该地址不存在”、“13243234asdfasdi”之类的情况,这类的地址可以通过程序识别出来。然后,很多情况是很难通过程序识别出来,比如“宇宙路地球小区”,但这类地址可以识别出来。甚至还有连人脑都无法识别的,比如“市东四环中路 23 号南航5 楼 540 室”,这个地址根本不存在。其次,第二类是真地址,但是因为用户输入不标准,所以很难处理,比如将“建国门外大街” 缩写成 “建外大街”,“中国工商”
32、缩写成“工行”;比如错别字将“朝阳门”写成“潮阳门”;比如颠倒,将“东四环中路朝阳公园” 和 “朝阳公园(靠东四环)”;比如别名,将有的写开发商的小区名“国际”,有的则写行政的地名“八里庄东里”等等等等。15 / 30数据质量基本质量准确性数据中不出现错误的概率一致性多种数据来源中数据的一致性容量数据覆盖的深度和广度更新率相关数据实时更新程度可应用性易识别性数据简明简要呈现并容易被理解的程度易处理性数据易操作和易处理的程度获取及时性及时获取数据以采取行动和决策的程度性数据可被管理者获得的程度管理者可应用的程度智能性数据本身对数据创造者的标志和识别数据本身对数据创造场景的标志和识别图 4:数据有
33、效性和成本曲线图像上面这样的例子多得不能再多了,如果希望提高数据可应用的程度,那么必然需要花大量人力通过编写程序和手动挑选来淘洗数据。而随着投入的边际效用递减,数据有效性的要求越高,则需要投入的成本就成倍甚至指数级增长。3) 适宜海量数据处理的软硬件成熟度不够,成本太高,普及率低下。从某种意义上来说,“大数据”一直存在,只是受限于时代和科技,因为缺乏相应的数据、分析工具而无法实现。市场上缺乏兼具业务场景普适性和海量数据处理能力的数据库大数据时代的到来,使得电子商务、公共管理、SNS 等领域几乎每个与用户相关的业务数据量都在亿级别,某些的日系统调用可能达到百亿级别,而且历史数据不能轻易删除,所以
34、需要能对 TB 甚至 PB 级数据进行高速处理的数据库。传统的关系型数据库,如 Oracle, SQL Server 等不能很好地满足用户需求,而较新的 NoSQL 数据库也依然没有达到适应不同业务场景的需求,目前依然需要根据用户不同的业务特征来选择适合的数据库。私有云和云服务普及程度太低所有企业和个人都或多或少有大数据应用的需求。但不同的实体有不同的出发点,更在意安全和性的企业希望构建属于自己的私有云;应用需求少,对成本更敏感的企业则需要的即时云服务。但受限于人们对云技术的接纳程度、云服务的成本优势尚不明显等原因,私有云和云服务普及程度偏低也大大限制了大数据的发展。4) 数据尚未获得真正意义
35、上的定价和。数据的公开性与归属权不清晰直接导致了数据融合工作被割裂到一个个的独立的数据16 / 30资产型。目前的大数据应用是针对公开数据和自有数据的价值挖掘,数据尚未获得真正意义上的定价和产品化。在数据共享相对成金融体系,以业为例,跨间的数据共享通道是人民与银监会分别牵头、管理的系统与客户风险统计系统,均采取“报送数据才能享受共享”及“信贷主体本身可申请及查询”的原则。在未纳入众多、小贷、互联网金融等机构数据的情况下,上述数据池的成本已经非常高。那么多新的交易和交互数据源如何进行互相融合,并形成一个个类似于金融投资业的万得、同花顺一样在细分业务场景下成熟且具有应用价值的数据池?这是一个问题。
36、数据的,从破除阻碍的角度看并关键在于两点,一是数据的公开性与归属权需要在法律及政策层面得到更明确的规范和指引,二是对同类业务场景下不同的数据制定统一的数据标准;从操作层面看,在应用范围的选择上,不应寻求一步到位或大而全,最好确定到具体的业务场景和产品形态;从实现路径看,寄望于行政力量介入模式(类似于间整合)的可行性不高,也许“数据于用户,通过第机构数据真实性,用户再进行跨融合”才是一条可以期待的路。四、中期投资要点本章,根据前文对大数据产业的梳理和主要问题的分析,融合笔者的判断,从数据资产、数据融合和后端应用三个方未来 3-5 年大数据的产业点和投资方向进行研讨分析,并在最后一节进行综合比较。
37、4.1数据资产方向的重要性不再累述,各数据资产公司已经门阀、互相挞伐,但依然不断有新的企业出现,以不同的模式和资源去抢夺一块块细分的区域。认为,掌握数据资产的有两个重要的切入点。1) 新的可穿戴设备17 / 30以谷歌眼镜、智能手表和智能手环为代表的可穿戴设备是已经出现雏形正逐渐的全新移动数据终端,因为可能创造全新的人机交互模式,其中蕴藏了大量的投资机会。就目前情况看,针对运动和健康的智能手环发展确定性更高,但概念和范围较小,价值空间够大;不少企业已经投入智能手表的竞争当中,如果按照将屏幕搬到手表上的模式,智能手表的发展空间也不大,而如果将智能全部做到 6 寸(提高移动互联用户体验)而把智能手
38、表作为智能的“副机”,整合基本通讯、生活小、智能手环的功能,则很可能有较大突破;智能眼镜是真正意义上在人机交互模式上有创新的可穿戴设备,虽然目前的技术成熟度不够高,但想象空间更饱满。未来的可穿戴设备,如果要达到智能的高度,则必须创造一个稳定、有效的新人机交互模式(可能是语音识别、也许是体感识别、也许是眼球控制等)。那么,从 PC 互联网向移动互联网的搬家过程创造的巨大空间可能在可穿戴设备普及的过程中重现。相关的重点投资对象在近期可以考虑为模式识别与人机交互相关的技术企业,全新可穿戴设备成型后可考虑为设备配套的主要元器件和模块设计生产商。智能家居以路由器、机顶盒等为中心的智能家居,将使路由器、机
39、顶盒等从分发节点到控制中心的高度,而围绕其产生的大量数据也可能成就一些新的数据资产型企业。智能家居行业竞争的重点有三个,一是跨家电生产商的兼容整合能力,这是必要条件;二是给用户较低的介入成本,这是竞争要点;三是找到一个硬需求作为切入点,这是成功要素。相关的重点投资对象可以参照以上三点来选择,满足以上三个条件的一定是好标的,如果创业团队再有较好的品牌经营能力和“互联网”,那么企业价值更佳。如刚获得次轮风险投资的极路由和项目融资辅导营会员企业巨雷科技等都是不错的投资标的。物联网物联网也是一个重要的数据。因为行业运用水平不均衡的原因,重点关注专注于安全生产、(食品、药品)质量控制和物流的追溯性物联网
40、系统及针对汽车的车联网两个点。18 / 30相关的重点投资对象可以考虑为提高通信稳定性与降低传感器成本的硬件生产商、对相关行业(特别是食品、药品、物流、汽车)有专业理解的系统集成商、与主要和 SAP等管理兼容性良好的系统集成商,持续关注国家对物联网底层通信协议的明确或者变化。2) 新的模式新“友盟”模式可穿戴设备、智能家居、物联网等新都可能为新“友盟”的诞生创造空间,具体讲,比如可能出现针对可穿戴设备的开发者应用统计,针对智能家居的应用统计,以传感器通信为的物联网应用统计。他们一定与友盟或者个推一样,专门针对整个新的某一个具体问题而生,抓住切入的时间窗口非常重要。免费服务交换数据类似于互联网通
41、过费用了平面对订阅用户的传统,相信,在的未来可能出现以免费服务交换个人数据(双方以契约互相)的公司,使数据获得真正意义上的定价而成为资产。这个概念看似非常前卫,实则与早已成熟运用的有偿问卷本质一致。推断这个切入点应该还是与紧密结合的移动互联网交互中心(现在看依然是智能,未来可能是可穿戴设备),当然也可能是某项具体应用(如淘宝、)。而这个搅局的公司,可能是中移动、中、电信等通信运营商,或者苹果、微软、小米等拥有操作系统的互联网硬件厂商,或者 360、BAT 等这种本来就具备庞大用户基础也具备强大相关技术的互联网企业;假如是其他新进入创业者,那么该公司一定会带有传媒和的,以某项具体应用(如淘宝、)
42、作为切入点而非大而全,并很可能会选择与前述大企业结盟。该模式出现后会立即成为、投资人关注的焦点,在一个短暂的喧嚣背后,很可能是大量有资源有的其他企业全力进行着准备工作;可以预见无论吃螃蟹的人是谁,最终 BAT、360 等大型互联网公司,苹果、微软、小米等拥有自己操作系统的公司,或者移动运营商都很可能加入这场争夺。这种模式有两个关键点:一方面是既尊重隐私(途径合法获取)又隐私(纯粹以获取数据);另一方面是即使拿到数据资产,还必须打造具有稳定的商业闭环,这个过程可能很辛苦和漫长。这两点直接对应到互联网公司的两大痛点用户体验和商业19 / 30闭环。重点关注本类模式创新,对投资标的的选择上谁能拿捏好
43、尊重隐私与隐私的平衡,快速获得大量的用户,同时能尽快找到稳定的模式,就是好的投资标的。数据有偿返还用户原有数据资产类企业可能将引入第机构(公)和保险公司(兜底责任),有偿地反向出售其掌握的信息给用户自己。数据有偿地返还用户的模式将打破原来数据被封闭在各独立的现状,大大增强了数据的效率和应用价值。推断切入点会首先出现在交易数据(含询价等以交易的数据),逐步扩散到对用户特征辨识度高的交互数据;而典型的应用场景,首先还是金融业务的风险评估,逐步扩展到精准和定位。由于该模式事实上将打破企业对数据的某种独占性,作为既得利益者的企业(特别是大)缺乏足够的激励进行自我,在某种程度上需要外部环境的改变进行触发
44、。认为,可能的触发点也许是“以免费服务交换数据”模式的出现或者是和政策层面对数据归属的进一步明确和规范。重点关注本类模式创新,虽然其本身不会带来新的投资标的,但会为大数据整体发展作出巨大贡献。4.2数据融合处理方向数据的融合处理是大数据价值挖掘的基础,其主要投资点包含数据、基础、云计算等三个方面。1)业(数据)金融业已经是高度信息化的行业,同时也是数据的重要。目前的体系尚未纳入公司、小贷公司、互联网金融企业和第支付(行为数据)等,未来 3 年,一条重要的投资线索就是专门解决未纳入目前体系的小金融机构数据整合问题。新的系统不与人行系统形成竞争关系,而是互补关系。新系统成熟后,小微金融和个人业务开
45、展前,将同时并行查询人行与新两套系统。未纳入人行体系的金融机构既是数据提供方也是数据需求方,其他非报送金融机构和信贷主体本身也是数据的需求方。在构建模式上,相信其会参照“报送数据机构自动享有查询权限”、“其他机构经信贷主体查询”两条原则。就模式看,相信其会采取差别20 / 30定价策略,对数据提供方(小贷、P2P 等)只需要覆盖成本即可,而把点放在其他金融机构(如等)上。预计:第一,构建体系工作量极大,对牵头方的实力、资质要求都非常高,且涉及同业竞争等,成第支付企业也许有先发优势;第二,因为绝大多数小贷和互联网金融企业都明显带有地域特征,构建体系的尝试也必然是从一个个地域开始,可能形成分头开始
46、、各自割据的形势;第三,是一件高度依赖数据提供方配合的事情,牵头者一定会联合当地的主要金融机构共同发起;第四,现行的人行系统建立在人民对各商业的指导与管理权限基础之上,而新体系的搭建则很可能面对明显的道德风险与逆向选择问题,解决好这个问题非常关键;第五,牵头方要积极关注部门对各新型金融机构的政策变化。另外,只是起点,数据融合并的过程从交易数据中的金融交易数据开始,接着是细分行业的其他交易数据融合(如间、O2O间等),最后会扩散到交互数据的融合。2) 数据库从某种意义上来说“大数据”一直存在,只是受限于时代,缺乏对应的数据、分析工具。大数据时代的到来,使得电子商务、公共管理、SNS 等领域几乎每
47、个与用户相关的业务数据量都在亿级别,某些的日系统调用可能达到百亿级别,而且历史数据不能轻易删除,所以需要能对 TB 甚至 PB 级数据进行高速处理的数据库。结构化数据高效处理、非结构化数据高效处理已经成为用户的刚性需求,而传统的关系型数据库,如 Oracle,SQLServer 等并不能很好地满足用户。NoSQL 数据库大比拼: Cassandra, HBase,MongoDB, Riak一文对主流的 NoSQL 以亿级数据在不同的需求(读、写、扫描及相应不为配比)下从吞吐量和延迟时间两个维度进行了测试分析。研究认为当前依然没有普适和万能的NoSQL 数据库,用户应该针对不同的应用特点选择不同
48、产品。相关的重点投资对象可以考虑为针对海量数据处理的新型数据库生产商、具备海量非结构化数据处理能力的公司以及对细分领域有深刻认识的系统集成与实施公司。3) 云计算相关领域海量数据的堆积旺盛了对云计算的需求,云计算的发展同时也正推动着大数据应用。但21 / 30不同的实体有不同的出发点,更在意安全和性的企业希望构建属于自己的私有云;应用需求少,对成本更敏感的企业则需要的即时云服务。这也正是云计算与大数据相关的两个重点演进方向。私有云与行业云云计算可以降低 IT 运营成本,IT 运营效率,已经是大势所趋,私有云将在未来几年将高速发展,谁能在保持现有产品/服务水平下进一步降低成本,就代表未来的方向。
49、在私有云的中,重点关注对云硬件产品的创新(特别是在成本节省方向)、推荐关注对细分行业应用特点有深刻理解的系统集成商。比如,项目融资辅导营会员企业神云科技专门做 ARM 构架下的瘦客户机,在达到 X86 构架同等效果而同时将成本显著降低,便在私有云的普及中拥有很好的机会。以数据分析处理的SaaS 云服务对相关细分领域(如服装零售等)需求和大数据特点熟练掌握,面向小微企业的 SaaS服务提供商,以集约和共享的方式达到降低用户成本的效果;同时,因为服务提供商服务于某一行业的很多企业,将进一步形成细分领域的独有经验和优势。在短期看,基于 B2C、C2C、的数据分析处理 SaaS 云服务是最重要的投资点
50、。O2O4.3后端应用(商业智能)有大数据的地方就有商业智能,商业智能在细分行业市场规模悬殊巨大,传统上是金融、电信、三块领衔,电子商务的崛起使得零售、物流和/也成为一个非常重要的应用领域。在行业内,大公司横向拓展整合资源,并购大戏不断;小厂商深耕行业以专业化取胜。行业既能决定 BI 需求的潜力,又能为 BI 企业提供坚实的护城河,深刻理解行业和已有数据积累商业智能大数据应用的生存壁垒。预计,商业智能将按各行业信息化程度高低次序依次铺开,首先受益的是零售、物流、金融、电信、几个板块;同时,在 BI 应用先行行业(特别是零售和物流),每个细分领域都将出现专门的领先型行业解决方案提供商。相关企业在
51、细分领域的地位确立后,经过横向托张或者兼并,每个大行业(如服装、餐饮)都可以造就一家以上亿元营收级别的公司。22 / 30重点关注在不同细分领域(特别是 C2C 市场,具体细分到如零售业中服装大类的女装)以“效率挖掘”和“精准定位”为两条需求主线,具有级数据分析能力的小型数据应用或者服务提供商。4.4综合分析前文已经从数据、数据融合、后端应用三个维度对主要中期投资点进行了分别阐述,下面从价值度、市场规模、标的数量、所需投入和确定性 5 个方面对以上投资点进行对比分析。表 6:中期投资点对比分析从价值度看,新型人机交互模式的可穿戴设备、新模式及数据库的价值度最高;从市场规模看,新型可穿戴设备、数
52、据库及商业智能后端应用的规模最大;从标的数量看,基于商业智能的应用、SaaS 服务及私有云方向投资标的最多;从所需投入看,新型人际交互设备、数据库业的投入最多;从确定性看,以后端应用的商业智能和数据处理方向确定性更高。综合以上,投资者重点关注针对细分行业商业智能解决方案的应用SaaS服务提供商、私有云与行业云相关企业两类投资标的;对新型、新型模式的出现及成熟保持实时追踪和高度关注。23 / 30投资点价值度市场规模标的数量所需投入确定性新新人机交互设备10103104智能手环56668智能家居67668车联网66668物联网追溯系统87868新模式新“友盟”模式108267免费服务交换数据10
53、8484反向出售数据106446数据融合处理业86397数据库99399私有云778610商业智能SaaS8910610应用8910610备注:从 1-10 表示程度从低到高。五、典型公司介绍5.1上市公司1)(300229)基本信息是国家规划布局内重点企业,公司资本2.04 亿元。公司成立于 1993 年 2 月,原名易宝北信,2001 年 12月更名为,2007 年 12 月,公司整体变更为公司,2011年 6 月在交易所创业板上市,代码 300229。公司现有员工近 600 名,总部设在北京,并已在、广州、杭州、长沙等地设有或办事处。公司秉承“搜索信息、整合内容、发现知识”的技术理念,专
54、注于海量非结构化信息处理为的软件研发、销售和技术服务,目标是成为大数据时代中国专业互联网服务领域的厂商。主营业务公司主要从事以非结构化信息处理为的研发、销售和技术服务,产品包括企业搜索、内容管理和文本挖掘等相关和应用;从事相关行业的信息化工程咨询、开发、实施和服务;提供基于非结构化信息智能处理技术的运营和信息服务。目前主要产品和服务包括三大类:级产品、服务类产品和应用级产品。表 7:主要产品24 / 30级产品TRS 大数据管理系统TRS 内容协作TRS 文本挖掘TRS服务器系统服务类产品TRS 社会分析云服务TRS 信息服务应用级产品TRS 机器数据挖掘引擎TRS 企业搜索引擎TRS 垂直搜
55、索引擎TRS 互联情管理系统TRS 知识管理系统财务数据表 8:财务数据主要亮点目前大数据应用仍处在行业生命周期的早期,后续发展空间巨大。公司凭借其技术优势,重点布局后端的行业应用市场,将在未来大数据的应用中抢得先机,看好公司中长期的增长潜力。2)讯飞基本信息讯飞信息成立于 1999 年 6 月 9 日,2008 年在交易所挂牌上市(代码:002230),是一家专业从事智能语音及语音技术研究、及产品开发、语音信息服务的国家级骨干企业,主要股东包括:中国移动、大资产经营、广信、联想 投资、盈克等。公司在语音技术领域是基础研究时间最长、资产规模最大、历届评测成绩最好、专业最多及市场占有率最高,其智
56、能语音技术代表了世界的最高水平。主营业务讯飞是一家专业从事智能语音及语言技术研究、及产品开发、语音信息服务及电子政务系统集成的国家级骨干企业。目前公司的主要产品和服务围绕智能语音识25 / 30截止日期2013/9/302012/12/312011/12/312010/12/31每股净资产4.0619 元3.89 元6.21 元2.81 元每股收益0.1789 元0.3614 元0.7 元0.67 元每股现金含量-0.0061 元0.4292 元0.3235 元0.6083 元每股资本公积1.6756 元1.6241 元3.3756 元0.185 元资产合计73384.8 万元75318.2
57、万元72279.4 万元22722.3 万元资产总计89891.5 万元87131.3 万元79570.6 万元28479.4 万元长期负债合计0 万元350 万元0 万元主营业务收入11976.6 万元21086.4 万元19118.6 万元14765.6 万元财务费用-848.58 万元-1630.04 万元-615.84 万元-51.05 万元净利润3654.36 万元7372.25 万元7339.05 万元6030.46 万元别在语音引擎、教育信息化、应用、行业应用等领域进行布局。表 9:讯飞主要产品与服务财务数据表 10:讯飞财务数据主要亮点公司携世界领先水平的智能语音识别技术,在移
58、动互联网、教育信息化和行业应用等领域积极布局,取得了丰硕成果。教育信息化领域,围绕普通话和英语口语技术打造从学习、培训到的服务,并最终聚的教育门户;移动互联网领域,以“灵犀”26 / 30截止日期2013/9/302012/12/312011/12/312010/12/31每股净资产6.7544 元3.5558 元4.67 元4.06 元每股收益0.33 元0.48 元0.53 元0.63 元每股现金含量0.2386 元0.4286 元0.4663 元0.5558 元每股资本公积金4.5983 元1.3084 元2.3688 元1.65 元资产合计260552 万元110556 万元10318
59、4 万元54725.5 万元资产总计411438 万元185338 万元万元.4 万元长期负债合计10287.8 万元4407.18 万元3294.61 万元3397.72 万元主营业务收入75745.2 万元78394.1 万元55701.4 万元43605.7 万元财务费用-960.9 万元-1271.05 万元-293.57 万元-244.27 万元净利润14027 万元18240.5 万元13262.9 万元10113.9 万元语音引擎混音引擎语音识别引擎声纹识别引擎讯飞语音云教育信息化学习产品智能早教玩具应用讯飞语音输入讯飞输入法灵犀互动音乐爱吼网音乐语音搜索行业应用电信运营商应用解决方案公共安全应用方案消费电子及移动终端行业应用方案智能建筑应用方案和“语音云”为抓手,背靠中移动实现合作互赢;公司已有的语音云目前也已经累计了众多的开发
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2023七年级英语下册 Unit 10 I'd like some noodles说课稿 (新版)人教新目标版
- 消防控制室管理制度
- 2024-2025学年初中同步测控优化设计物理八年级上册配人教版专项训练含答案
- 法国课件湘教版
- 简讯格式与范文
- 西京学院《机械工程测试技术》2022-2023学年第一学期期末试卷
- 西京学院《产品造型材料与工艺》2023-2024学年第一学期期末试卷
- 西华师范大学《中国近现代政治思想史》2023-2024学年第一学期期末试卷
- 西华师范大学《信息技术教育应用》2023-2024学年第一学期期末试卷
- 西华师范大学《统计计算与软件》2023-2024学年第一学期期末试卷
- (2024年)财务报表分析培训讲义
- 金融学专业大学生职业生涯规划
- 产品销售经理培训课件
- 变革管理手册
- 蔬菜栽培生理学课件
- 大型商场消防安全知识培训
- 【工程项目全生命周期管理及案例分析5900字(论文)】
- 长津湖影评及观后感
- 关注护士职业心理健康
- 2024年合肥市轨道交通集团有限公司招聘笔试参考题库含答案解析
- 普速铁路接触网运行维修规则
评论
0/150
提交评论