版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据(征信领域)行业分析报告2020年9月
目 录一、行业简介 41、大数据相关定义 42、大数据的特征 43、大数据产业发展历程 5二、行业发展情况分析 61、大数据产业发展规模 62、大数据产业区域结构 73、大数据产业行业结构 84、大数据的征信领域应用 85、行业未来发展趋势 8(1)各行各业对数据分析的需求将更加旺盛 8(2)人工智能化是大数据的发展方向 9(3)产业链的分工将日益清晰和细化 9(4)数据处理外包行业将兴起 10三、行业驱动力分析 111、国家政策扶持 112、市场整体认知度不断提升 123、基于数据分析的业务管理在企业应用场景越来越广泛 12四、行业应用需求分析 131、金融科技 132、征信 14五、行业竞争分析 161、竞争格局 16(1)大数据行业整体竞争情况 16(2)征信服务领域的竞争态势 172、行业进入壁垒 18(1)技术壁垒 18(2)客户资源壁垒 18(3)人才壁垒 19(4)应用领域资质壁垒 193、征信领域主要企业 19(1)上海华夏邓白氏 19(2)益博睿 20(3)中诚信征信 20(4)金电联行 20(5)芝麻信用 20(6)前海征信 21(7)苏州朗动 21六、行业发展制约因素 211、数据积累不足,开放程度不高 212、高端技术人才竞争激烈 21附件:行业上下游情况 221、数据来源 22(1)产业概况 22(2)关键技术:数据库技术 232、数据管理 24(1)产业概况 24(2)关键技术:分布式架构 253、数据应用 26(1)产业概况 26(2)关键技术:机器学习和人工智能 26
大数据(征信领域)行业分析报告一、行业简介1、大数据相关定义对于大数据的概念,目前尚无业界所广泛接受的明确定义。各权威机构及普遍理解的大数据定义如下:麦肯锡在研究报告《大数据的下一个前言:创新、竞争和生产力》中认为:大数据是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集;美国国家标准技术研究所(NationalInstituteofStandardsandTechnology,NIST)的大数据工作组在《大数据:定义和分类》中认为:大数据是指那些传统数据架构无法有效地处理的新数据集。维基百科列示的定义是:大数据,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。Gartner列示的定义是:大数据是体量大、快速和多样化的信息资产,需用高效率和创新型的信息技术加以处理,以提高发现洞察、作出决策和优化流程的能力。国内普遍的理解是:大数据是具有数据量巨大、来源多样、生成极快、且多变等特征并且难以用传统数据体系结构有效处理的包含大数据集的数据。2、大数据的特征在传统的数据处理周期里,处理数据只有两个环节:从“数据源”到“应用”,而各个环节使用的技术也较为简单。传统的数据源需要经过处理存到一个结构化数据库进行管理,然后再使用诸如数理统计、结果可视化等技术完成对数据的应用。与传统的数据处理周期不同,大数据处理需要在传统的“数据源”到“应用”这一流程上增加“数据管理”这一步骤,以应对海量大数据带来的新挑战。对于大数据的数据特征,业界通常引用国际数据公司(InternationalDataCorporation)定义的4V进行描述:①数据量大(Volume):虽然对大数据量的统计和预测结果并不完全相同,但是一致认为数据量将急剧增长。②类型繁多(Variety):除了结构化数据外,大数据还包括各类非结构化数据,例如文本、音频、视频、点击流量、文件记录等,以及半结构化数据,例如电子邮件、办公处理文档等。③数据价值(Value):从海量价值密度低的数据中挖掘出具有高价值的数据。这一特性突出表现了大数据的本质是获取数据价值,关键在于商业价值,即如何有效利用好这些数据。④处理速度快(Velocity):通常具有时效性,企业只有把握好对数据流的掌握应用,才能最大化地挖掘利用大数据所潜藏的商业价值。3、大数据产业发展历程我国的大数据产业目前已经历了三个时期:①探索期:大约从2004年前后,随着数据库等技术的进步,数据挖掘概念开始普及,越来越多的企业将信息管理作为单独的业务部门。但由于当时企业数据采集能力的限制,以及企业信息化时间较短,本身管理软件中积累的历史数据有限,一些厂商推出的领先数据管理方案并不容易获得企业认可,业务尚不足以推动技术的快速进步。②市场启动期:2008年金融危机后,国内企业为了尽快从业务低迷的状态中恢复,获得市场竞争优势,对商业智能(BI)以及商业分析(BA)的需求出现快速提升,主要应用在决策支持、业务优化、销售机会挖掘预测等领域。但在随后的2010-2011年,领先企业拥有优势后并不甘愿放弃,而落后企业更急于寻求方案快速赶上,使得共同作用下,企业级市场对商业智能及商业分析的需求并未减退,反而成为一种常态。③高速发展期:到了2012年以后,由于企业信息化及互联网应用的日益完善,对消费者及企业内外部所积累的数据日益丰富,大数据的概念迅速为各类人群所接受。而在企业领域,包括营销、风险管控、预测、客户挖掘、海量数据实时处理、可视化展现、数据仓库建设等方面的多样化需求迅速扩张,业务推动技术进入高速创新期。而进入2015年后,企业深度利用数据价值的意识迅速提高,数据资产管理成为热门概念,企业开始愿意通过数据交易进行变现,各种与大数据有关的政策及法律法规不断完善。预计,中国大数据市场将在2020年前后进入成熟期。一方面业务需求的变化将推动细分领域出现丰富的商业模式,并使得新产品和服务具有稳定的刚性需求;另一方面随着产业链的完善,专注于细分行业及细分应用领域厂商竞争逐渐稳固,而不善于充分利用数据的企业将被快速淘汰出局。二、行业发展情况分析1、大数据产业发展规模目前,我国大数据产业发展在经历初期探索、市场启动等阶段后,大数据的技术、应用以及社会公众的接受度等方面逐步趋于成熟,整个产业开始步入快速发展阶段,行业规模增长迅速。根据中国电子信息产业发展研究院发布的数据显示,2018年中国大数据产业的市场规模约为4,384.5亿元人民币,同比增长23.50%。随着国家政策激励以及大数据应用模式的逐步成熟,未来几年中国大数据市场仍将保持快速增长,预计到2021年中国大数据市场规模将达到8,070.60亿元。数据来源:整理自公开资料当前,国内大数据正在被越来越广泛地应用到政府公共管理、金融、交通、零售、医疗、工业制造等领域,随着大数据应用范围的不断扩大,大数据所形成的市场价值将不断提升。2、大数据产业区域结构当前,由于各地区发展基础和起步时间不同,全国各省市大数据发展水平存在明显的差异性。从区域角度来看,华北、华东、中南是大数据企业主要集中区域,这些区域集中了中国主要的互联网企业和金融、消费品、制造等行业用户。其中,2018年华北地区份额最高,占27.60%。数据来源:大数据产业生态联盟3、大数据产业行业结构大数据市场刚刚迈入中国之时,国内对大数据的应用领域主要集中在互联网,智能交通、电子政务、金融理财、电商物流等方面虽然得到了发展,但应用领域仍然较为狭窄。近年来,随着泛互联网的发展,各行业的数据量激增,金融科技、征信、工业、医疗等更多领域开始关注并利用大数据技术挖掘数据价值,并逐步成为大数据行业的主流下游应用领域。4、大数据的征信领域应用随着我国社会信用体系建设的步伐不断加快以及计算机和网络技术的不断提高,征信业的发展也需要适应大数据时代发展所带来的技术变革。征信机构在积累征信数据的同时,也需要提升自身的数据存储能力,丰富所积累数据的维度,提升数据分析挖掘、处理速度等各方面能力,从而促进大数据技术在征信领域的应用。随着云计算、数据挖掘等信息技术的发展和应用,为征信产品的创新和升级奠定了技术基础。数据处理能力的提升,使得征信机构可以对数据资源进行更充分地挖掘和分析,开发出具有更高技术含量的产品和服务,满足银行、保险等金融机构多层次、全方位、专业化的征信需求。此外,以互联网金融为代表的新型互联网服务行业的快速发展也带来大量新的征信需求。对于互联网金融企业,需要借助信用信息共享来防范信用风险、降低交易成本。大数据技术在征信领域的应用,可以帮助其甄别和防范可能发生的风险。5、行业未来发展趋势(1)各行各业对数据分析的需求将更加旺盛随着计算机技术的发展普及,各种信息系统的广泛运用,各类系统中积累了大量的原始数据,各行各业对于数据分析的需求越来越急迫,除了分析这些数据内部所蕴含的规律、预测相关系统的运行趋势以外,对于数据分析的广度和速度都有了越来越高的要求。这些需求促使IT、互联网厂商不断加快对于数据分析技术的研发创新。一方面,大数据分析不再局限于结构化的历史数据,而更倾向于分析来自社交网络、各种传感器采集的非结构化数据;另一方面,激烈的市场竞争促使大数据解决方案厂商加大了对数据的快速、实时分析、智能决策技术的研发投入。(2)人工智能化是大数据的发展方向人工智能的实现以大数据和深度学习算法为基础。深度学习依托于模拟人脑进行分析学习的神经网络,通过模仿人脑的思维方式进行数据的分析和处理。大数据则为人工智能提供的海量数据进行算法的验证和模型的构建。在没有海量数据支持的情况下,仅依靠深度学习算法上的革新是无法实现人工智能的。而近期人工智能之所以能取得突飞猛进的进展,是因为这些年来大数据长足发展的结果。正是由于各类感应器和数据采集技术的发展,我们开始拥有以往难以想象的海量数据,并开始在某一领域拥有深度的、精细化的数据。而这些,都是训练某一领域智能的前提。大数据是让人们通过数据看到未来,帮助人类决策;而人工智能则是为了彻底将人们从劳动中解放出来,帮助或者替代人类完成任务。大数据为人工智能提供数据支持,人工智能通过主动学习、处理、分析大数据,自发得到可以指导人类决策的依据,指导或者直接替代人类进行决策和行动。人工智能将是各个领域的大数据应用的发展方向。(3)产业链的分工将日益清晰和细化随着数据价值认知的深化,用户对于数据的质量要求越来越高,标签的准确性、无效或错误值的比例、数据检索的效率和数据关联的精准度等指标对产业链上各类产品或服务价格的影响日渐加大。同时,在综合性的大型数据交易平台带动下,围绕数据所产生的各类需求能够得到最大程度的凸显,必然会促进大数据产业链的划分逐渐清晰和细化,诸如数据采集、汇聚、加工、交易和分析等环节在内的细分产业都将得到极大的推动。此外,企业在大数据产业链中的定位将会更加明确和聚焦。当前很多跨越了多个环节的企业,将会根据自身的优势和特点来重新定位在大数据产业链中的角色,可以预见的是某些数据拥有者将专注于对外提供数据服务,而目前横跨分析和应用环节的企业将会有很大一部分成为专业的分析技术提供商。(4)数据处理外包行业将兴起当前,有大量公司将各种IT和业务功能外包给服务提供商,这其中包含数据分析。数据外包将是继软件外包之后的另一大产业。从历史上来看,我国的软件外包产业始于20世纪八十年代,此后一直保持持续稳定增长,软件外包已经成为发达国家的软件公司降低成本的一种重要的手段。而数据外包作为一个新兴的大数据产业,即为企业和科研客户提供海量数据处理的外包服务,帮助客户完成海量数据作业任务,并最终交付精准无误的数据成果。使用户最小成本、最大利益获得处理后的数据资产,从而可以将更多的人力和资本投入到生产和科研活动中。市场研究和咨询公司HexaResearch于2017年公布的报告称,全球数据分析外包市场将在2016年至2024年间的复合年增长率超过30%,年收入超过60亿美元。大数据的价值体现在基于海量数据形成的洞见以指导人类行为。海量数据不仅仅体现在数据体量上,还体现在关联性上。分离数据形成的“数据孤岛”是大数据行业面临的重要问题,其阻碍了数据的连接融合,使数据无法形成知识体系产生洞见,降低了数据的利用价值。只有跨领域的数据分析才更有可能形成真正的知识和智能从而产生更大的价值。同时,大数据本身具有非常强的资产属性,大数据时代,数据就是金钱。因此,基于各类大数据的共享与交易也将得到蓬勃的发展。三、行业驱动力分析1、国家政策扶持大数据对整个世界的影响力呈现快速增长趋势,美国等发达国家纷纷布局大数据产业,推出大数据相关政策。我国对大数据的政策支持力度上也在不断提升。2012年以来,发改委、科技部、工信部等部门在科技和产业化方面支持了一批大数据相关项目,推进技术研发取得积极效果。2014年3月,“大数据”第一次出现在《政府工作报告》中,并明确提出设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。2015年6月的国务院常务会议上,政府再次强调“推进简政放权,放管结合、优化服务,而大数据手段的运用十分重要。”2015年7月,国务院办公厅印发了《关于运用大数据加强对市场主体服务和监管的若干意见》。2015年9月国务院印发的《促进大数据发展行动纲要》,进一步明确推动大数据发展和应用的总体目标、主要任务、政策机制等内容。2016年3月,国家“十三五”规划纲要发布,指出要实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。此外,2019年7月,国务院办公厅发布《关于加快推进社会信用体系建设构建以信用为基础的新型监管机制的指导意见》,强调充分发挥“互联网+”、大数据对信用监管的支撑作用,着力提升信用监管信息化建设水平,建立完善事前、事中、事后信用监管体系,进一步发挥信用在创新监管机制、提高监管能力和水平方面的基础性作用。上述政策的出台无疑推动了大数据市场快速增长以及大数据技术在征信领域的应用,对本行业的发展起着重要的作用。2、市场整体认知度不断提升随着信息化和工业化深入融合的进程加快,大数据、云计算、人工智能等前沿概念和技术逐步渗透到社会的各个领域,对传统经济产生巨大的冲击和影响,尤其是随着大数据时代变革的深入,越来越多的企业开始认识到数据资产的重要性,并逐渐开始关注如何有效利用这些数据来产生更大的价值。例如在互联网和金融领域,数据的拥有规模,分析和运用数据的能力将决定企业的核心竞争力。对这些企业来说,掌控数据就可以深入了解市场需求,采取更为精准的策略,从而带来巨大的回报。目前,作为数据资产先行者的企业,如谷歌、Facebook、亚马逊、阿里巴巴等,都在挖掘多种形态的设备及软件功能,积累各种类型的数据资产,发挥大数据的商业价值。3、基于数据分析的业务管理在企业应用场景越来越广泛虽然企业级大数据应用目前在国内还处于初级阶段,但是商业价值已经显现出来。运用大数据指导运营的企业数量快速增长,大数据在应用层面开始取得良好的效果;大数据技术的应用场景也在持续扩展,逐步与金融、征信、互联网等多个领域进行深入结合。以大数据技术在征信领域的应用为例,随着大数据与征信行业的深入结合,大数据企业可利用大数据技术对企业信息进行收集、整理以及深入挖掘,从而提供企业信息的多维展示以及征信相关的分析成果,帮助金融机构在资质验证、准入核验、风险识别及预警等多个方面大幅提高工作效率及准确度。大数据技术可以帮助企业更快地从海量信息中获取想要的信息,加快企业的业务决策,传统的IT系统将越来越不能满足当前的大数据分析需求。四、行业应用需求分析大数据行业的下游应用领域极其广泛,例如金融科技、征信等领域,下游应用领域市场规模的增长代表着大数据行业市场需求的上升。1、金融科技金融科技是基于大数据、云计算、人工智能等一系列技术创新,全面应用于支付清算、借贷融资、财富管理、零售银行、保险、交易结算等六大金融领域,是金融业未来的主流趋势。回顾人类金融发展史,科技创新与金融创新始终紧密相连,特别是进入信息社会以来,在摩尔定律的作用下,新技术的出现速度不断加快,而金融与科技的共生式成长也使得现代金融体系伴随信息技术共同经历着指数级增长。大数据在金融业的应用场景相当广泛。如在银行业,大数据应用场景集中在数据库营销、用户经营、数据风控、产品设计和决策支持等;在证券业,证券企业可以运用大数据技术进行数据挖掘和分析以找到高频交易服务对象、资产较高的服务对象和理财服务对象,然后证券公司就可以根据服务对象的特点进行精准营销,推荐针对性服务。根据艾瑞咨询统计,2018年我国金融机构技术资金投入达2,297.3亿元,其中投入到以大数据、云计算为代表的前沿科技资金为675.2亿元,占总体投入的比重为29.4%。另外,艾瑞咨询预计,到2022年中国金融机构技术资金投入将达到4,034.7亿元,其中前沿科技投入占比将增至35.1%。数据来源:艾瑞咨询虽然我国目前与欧美发达国家相比,金融基础比较薄弱,但正是我国金融市场尚未成熟的特点给予我国金融科技快速发展的土壤,未来相关金融机构投入到以大数据、云计算为代表的前沿科技资金投入也会不断加大,这也会在相当程度上推动大数据行业的发展。2、征信征信是依法收集、整理、保存、加工自然人、法人及其他组织的信用信息,并对外提供信用报告、信用评估、信用信息咨询等服务,帮助客户判断、控制信用风险,进行信用管理的活动。党的十八大以来,在党中央、国务院统一部署下,我国征信业发展明显提速,初步形成了“政府+市场”双轮驱动,金融信用信息基础数据库与市场化征信机构错位发展、功能互补的市场格局,征信体系在市场经济中发挥了更为重要的基础性作用。从征信企业业务流程看,信息收集、信息加工处理、信用产品输出、商业化应用是征信业务开展的四大关键环节,而大数据的应用贯彻于征信企业业务流程四大关键环节始终。特别是央行在2009年1月发布了征信行业数据标准:《征信数据元信用评级数据元》、《征信数据交换格式信用评级违约率数据采集格式》,该标准格式的发布带动了大数据风控技术的快速发展。同时,以机器学习、神经网络为代表的大数据算法的不断完善,也极大地推动我国征信行业的发展。根据央行征信中心统计,截至2019年底,征信系统共收录10.2亿自然人、2,834.1万户企业和其他组织的信息,规模已位居世界前列。此外,我国央行征信中心2011、2015和2019年征信查询总次数分别为3.09亿次、7.19亿次和25.1亿次,增长速度较快,特别是2015年到2019年,征信查询总次数增长了近2.5倍,年复合增长率达到36.69%。数据来源:中国人民银行征信中心虽然我国目前征信查询次数增长较快,但是对于中国庞大的人口基数来说,人均查询次数仍然偏少,且考虑到我国目前金融市场尚未成熟的特点,未来我国征信行业市场需求巨大。综上所述,以金融科技、征信等领域为代表的大数据下游应用领域市场规模的增长一方面对大数据产业提供了稳健的需求保障,另一方面也对大数据技术提出了更高的需求。这就要求大数据相关企业不仅要不断加大技术研发投入,而且要更加深入了解、分析下游应用领域市场诉求,从而提供更加贴合市场需求的大数据技术解决方案。五、行业竞争分析1、竞争格局(1)大数据行业整体竞争情况目前,根据自身核心竞争力与商业模式情况,我国大数据企业主要呈现数据优势型、技术拥有型、应用服务型三大特征,行业内企业均具备一项或多项上述特征。①数据优势型企业具备数据优势型特征的企业即先天拥有或以收集数据资源为目标的企业,这类企业占据一定的先发优势,可利用手中的数据资源提升自身的企业竞争力,或主导数据交易平台机制的形成。具备数据优势型特征的企业以在自身行业积累了丰富数据资源以及力图汇聚开放网络数据的企业为代表。②技术拥有型企业具有技术拥有型特征的企业是以技术见长的,专注于数据采集、存储、分析以及可视化工具的企业,主要为软件企业、硬件企业和解决方案服务商。③应用服务型企业具有应用服务型特征的企业是指为客户提供云服务和数据服务的企业,这类企业广泛对接各个行业,专注于产品的便捷化和可维护性,同时针对不同行业客户的需求提供差异化的服务。(2)征信服务领域的竞争态势目前,我国征信服务行业处于发展初期,参与主体主要包括征信公司、互联网公司、咨询公司等,也有少部分IT企业参与其中,整体技术水平有待提高,产品较为单一且重合度较高,基本处于起步状态。在征信服务领域,传统的征信、市场咨询服务往往以报告的形式提供给终端用户;传统的IT数据咨询服务通常以做项目的模式出现,通过咨询规划、解决方案设计、项目实施的方式满足客户特定需求。近年来,传统征信服务企业的业务模式受到较大的冲击,新型征信服务企业采用创新产品和服务方式导致竞争格局产生重大变化。大数据时代需要建立可量化、可定价、可交易的征信体系,并且允许数据以更加安全、合理的方式进行流通,降低征信市场的服务成本。在信息向市场主体有序开放的大趋势下,经验丰富和技术领先的征信服务提供商将逐步占据越来越多的市场份额。据中国人民银行征信管理局统计,截至2019年12月末,全国企业征信机构备案企业数量为128家。2020年5月19日,国务院发布《关于新时代加快完善社会主义市场经济体制的意见》,构建适应高质量发展要求的社会信用体系和新型监管机制。完善诚信建设长效机制,推进信用信息共享,建立政府部门信用信息向市场主体有序开放机制。健全覆盖全社会的征信体系,培育具有全球话语权的征信机构和信用评级机构。这预示着企业征信领域将迎来更为广阔的市场前景,征信服务行业的竞争格局将随着参与主体的扩容而发生动态调整,行业竞争将有所加剧。目前,我国征信服务行业正处于发展早期,尚未出现市场份额较大的垄断型企业,行业发展拥有广阔的前景和发展空间。总体来看,虽然大量市场化机构参与到企业征信业务中,但是大多数企业征信机构产品单一,竞争力较弱,可替代性较高。预计未来,只有已经完成品牌积累且具有先进技术实力的科技型企业才具有广阔的发展前景。2、行业进入壁垒(1)技术壁垒本行业有较高的技术要求,包括数据分析、数据处理、数据资源整合、数据安全等方面。例如:在数据分析方面,将海量的数据资源通过模型提炼成为对客户业务和商业决策产生直接帮助的知识产品;在数据处理方面,搭建更高效的数据仓库;在数据安全上,保证物理层面上的信息安全以及数据的加密;在数据资源整合方面,整合不同标准、不同格式、不同口径的数据源。同时,大数据技术应用于征信领域时,大数据企业还需要对下游客户的业务流程、业务需求有深刻的理解。这些都对本行业的新进企业形成了较高的技术壁垒。(2)客户资源壁垒销售渠道和客户基础是本行业企业能否在本行业立足的关键因素之一,本行业的下游客户一般包括大型互联网、金融机构,上述客户往往对服务质量有较高的要求,对供应商的选择也比较谨慎。同时,客户一旦选择某种平台型产品,一般会将其整合进入公司内部的决策规则流程,因此对该类服务有较高的粘性。随着行业先进入者客户资源的逐渐扩大,对客户群体会形成标准化的服务模式,有助于与客户之间建立长期合作关系,进一步增强客户粘性。因此,本行业对于没有成熟技术能力或者缺乏部分较稳定客户基础的新进者来说,存在一定的客户资源壁垒。(3)人才壁垒本行业是集科研与应用为一体的知识、资源、技术密集型行业。人才是产生技术成果、挖掘资源的关键要素,人才的流失就意味着科技成果和信息等技术的流失,也可能意味着部分上下游资源的流失。尤其在技术更新和商业创新的时代背景下,高端的技术人才显得更为重要。相关专业人才主要集中于率先进入此领域、具有多年行业实践经验的行业领先者中,对新进入者形成较高人才壁垒。(4)应用领域资质壁垒大数据技术在各领域应用时,需根据业务开展所处细分领域的监管要求获得相应资质。以大数据在技术在征信领域的应用为例,根据《征信业管理条例》,设立经营企业征信业务的征信机构,应当符合《中华人民共和国公司法》规定的设立条件,并自公司登记机关准予登记之日起30日内向所在地的国务院征信业监督管理部门派出机构办理备案。只有获得征信业务经营备案资质的企业才可以从事企业征信相关业务,并通过信息主体、企业交易对方、行业协会、政府有关部门、人民法院依法公布的判决、裁定等公开渠道采集企业信用信息。根据中国人民银行数据,截至2019年12月底,全国仅有22个省(市)的128家企业征信机构在中国人民银行分支行完成备案。3、征信领域主要企业(1)上海华夏邓白氏上海华夏邓白氏商业信息咨询有限公司主要经营商务咨询服务、企业征信服务等,通过高价值的商业洞察专注于企业运营风险管理,帮助企业提升营收、削减成本、管控风险以及实现业务转型,为客户提供及时、准确、富有洞察力的商业信息以及定制化的风险管理解决方案。(2)益博睿益博睿信息技术(北京)有限公司是Experian集团在中国的全资子公司,主要经营企业征信、决策分析、反欺诈和身份认证、数据质量和精准营销等四大业务,向世界各地的客户提供数据和分析工具。益博睿在中国已经成为银行零售风险管理和巴塞尔新资本协议实施的重要厂商。(3)中诚信征信中诚信征信有限公司是中国诚信信用管理有限公司的全资子公司,为专业化、全方位的信用服务机构。中诚信征信是目前信用产品较全、信用风险管理经验丰富的全国性信用风险管理机构之一,能够为企业、政府、金融机构等提供全方位信用管理咨询和信用管理软件系统开发服务。(4)金电联行金电联行(北京)信息技术有限公司的主要业务是通过基于大数据理论和云计算创建的客观信用评价体系为中小微企业提供信用融资授信服务,同时为金融机构提供量化风险管理为政府社会信用体系建设提供服务的技术型高新科技企业。(5)芝麻信用芝麻信用管理有限公司是蚂蚁金服旗下独立的第三方征信机构,其业务之一是通过云计算、机器学习等技术提供企业信用报告、风险云图等服务。芝麻信用研发的小微企业信用洞察系统“灵芝”专注为小微企业提供企业征信服务和整体征信画像。(6)前海征信深圳前海征信中心股份有限公司是中国平安保险(集团)股份有限公司的全资子公司,产品包括反欺诈产品、信用风险产品、数据开放平台、综合报告等四大产品类型,覆盖贷前、贷中、贷后全流程,可应用于租赁、借贷、购物、酒店、餐饮、交通、公益事业等多个领域。(7)苏州朗动苏州朗动网络科技有限公司立足于企业征信的相关信息整合,经过深度学习、特征抽取和使用图构建技术,为用户提供全面、可靠、透明的数据信息。该公司的”云聚数据”分享平台,为商业银行、政府征信、基金以及多家互联网企业提供数据解决方案。六、行业发展制约因素1、数据积累不足,开放程度不高与发达国家相比,我国数据积累存在几方面的不足:对于数据采集、数据整理、数据存储上没有足够的意识,对历史数据没有很好的保留和沉淀;数据积累偏静态,没有做到动态更新,导致有些数据过于陈旧;数据孤岛现象严重,没有做到数据开放和共享,同时数据的归属权不清晰,一些原始数据存储在平台后端,被平台掌握者控制,数据的使用者是否掌握与自己相关的数据取决于平台的开放性和接口提供。上述这些现象制约着大数据的融合及发展。2、高端技术人才竞争激烈大数据处理在我国属于新兴行业,对从业人员的行业经验和技术水平有较高要求。由于近年来行业发展迅速,对行业有深入了解的高素质专业人才相对比较缺乏,难以满足日益扩大的市场需求,需要高级专业人员拥有包括图像、语音、文本数据的自动处理技术,以及数据的抓取、清洗等基础能力。缺乏技术人才企业就无法提供有质量保证的产品和服务。人才的短缺将直接影响到服务质量与客户的满意度,一定程度上制约了行业的快速发展,当前业内公司除了加强自身人才培养之外,也开始加大力度引进外部人才,造成行业内人才竞争不断加剧。同时,由于大数据企业多集中在北京、上海等发达城市,企业员工所需付出的生活成本较高,对于薪酬的要求也较高。为了留住及吸引高端技术人才,相关人员的薪酬支出亦会给大数据企业带来较大的压力。附件:行业上下游情况大数据产业链覆盖从数据采集挖掘到数据应用服务,当前大数据及相关应用的产业链日益完善。产业链概况如下:1、数据来源(1)产业概况近年来,官方数据开放程度逐渐提高,行业联盟兴起,第三方数据服务蓬勃发展,各大企业(以互联网核心企业为主)也开始逐步开放群体画像数据,不同口径单一数据的跨界融合成倍放大了数据价值。从整体趋势上来讲,数据来源已较为多元,数据产生量爆炸式增长,可供分析的数据维度越来越丰富。据Forrester的研究结果,目前在线或移动金融交易、社交媒体、GPS坐标等数据源每天要产生超过2.5EB(1EB为2的60次方字节)的海量数据。据国际数据公司预计,全球数据总量增长率将维持50%左右,2020年全球数据总量将达到40ZB(1ZB=1024EB);中国将达到8.6ZB,占全球的21%。数据来源:国际数据公司(InternationalDataCorporation)伴随着数据资源价值逐步得到认可,数据流通的需求不断上升,除企业直接合作外,数据交易市场开始出现,建立数据需求方与供给方之间成规模化的联系。数据的开放需要多方助力,数据的流通与分享能够成倍提升大数据的经济价值和社会价值。当前大数据应用的数据源仍以自由数据为主,尚未形成完善统一的监管政策与行业规则,企业之间的数据孤岛情况仍然存在,数据交易方面,数据交易模式与数据资产定价标准有待建立,发展程度尚不成熟。数据源是大数据应用的起点与核心,用户的自有数据资源是后续开发应用的基础资产。在大数据的背景下,除了自有数据的不断增大之外,打破数据孤岛,实现数据开放,大数据的价值才能最大地显现。用户的自有数据与外部服务商的数据相结合,将成为各个垂直行业价值开发的起点。(2)关键技术:数据库技术在解决大数据问题时,首先需要解决的问题是针对不同数据的分类选择不同方法进行数据的整理与存储。当前,来自各领域的数据呈现爆发式增长,包括网页与社交媒体、机器数据、内部数据、交易数据、生物数据、来自数据提供商的数据等。大数据与传统数据最重要的区别即是数据类别由原来的结构化数据,加入了半结构/非结构化的数据。为解决半结构化/非结构化数据的爆发,NoSQL数据库应运而生。NoSQL(NotOnlySQL)数据库泛指非关系型数据库,能够解决大规模数据集合的处理问题,特别是针对非关联性数据。NoSQL数据库包括Key-Value存储、列存储、文档型等多种类型,适用于多种场景,具体情况如下:数据库类型相关产品举例典型应用场景数据模型优点Key-Value数据库Redis,etcd内容缓存,主要用于处理大量数据的高访问负载等Key指向Value的键值对,通常用哈希表来实现查找速度较快列存储数据库Cassandra,HBase分布式的文件系统以列簇式存储,将同一列数据存在一起查找速度较快,可扩展性较强,较容易进行分布式扩展文档型数据库ElasticSearch,MongoDB等Web应用Key-Value对应的键值对,Value为结构化数据数据结构要求不严格,表结构可变,无需预先定义表结构图数据库Neo4J,JanusGraph,ArrangoDB等社交网络,推荐系统等图结构能够自然扩展使用图形的相关算法,如最短路径寻址,N度关系查找等2、数据管理(1)产业概况数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,经历了人工管理、文件系统、数据库系统三个发展阶段。狭义的数据管理包括数据准备、存储管理、计算处理及数据安全等环节。随着互联网和移动互联时代的到来,非结构化数据呈现爆发式增长,继而对数据的处理和管控提出了更高的要求,将对非结构化数据的清洗、加工、挖掘、集成和可视化被纳入广义数据管理过程,以满足更深入的数据处理需要,在此过程中,数据管理的外延还将持续拓展。数据管理各环节概况如下:资料来源:艾瑞咨询(2)关键技术:分布式架构与传统数据“数据简单、算法复杂”的计算不同,大数据计算是数据密集型计算,对计算单元和存储单元间的数据吞吐率要求极高,对性价比和扩展性要求也非常高。因此传统以来大型机和小型机的并行计算不能满足大数据时代数据体量、规模、类型的变化。由此,分布式计算被大规模应用到了大数据领域。分布式计算系统是一组自治的计算机集合,通过通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 沪教版三年级下册数学第二单元 用两位数乘除 测试卷含答案(达标题)
- 国画基础学教案
- 暑假的学习计划(16篇)
- 湖北省襄阳市2023-2024学年高一上学期期末考试化学试题(含答案)
- 评估服务委托合同
- 诚信承诺声明
- 详细保证书模板保证心得
- 语文大专辩论赛评分卷
- 财务收款确认书
- 质量守则系统保证书
- 2023年中石油中国寰球工程有限公司招聘笔试真题
- 新解读《JTGT 5214-2022在用公路桥梁现场检测技术规程》
- 2024内置直驱动力刀塔
- 油气藏工程智慧树知到答案2024年中国地质大学(武汉)
- 2024至2030年中国永磁同步电动机行业市场研究分析及发展前景规划报告
- Unit 2 Great People 教学设计2024-2025学年冀教版英语九年级上册
- 正确对待顺境和逆境 课件 2024-2025学年统编版道德与法治七年级上册
- 2024山西航空产业集团限公司公开招聘105人高频考题难、易错点模拟试题(共500题)附带答案详解
- 统编版(2024新版)七年级上册历史期末复习课件
- 沪教版三年级上册用一位数除除法竖式计算题练习100道及答案
- 2024-2030年中国注塑磁铁行业市场发展趋势与前景展望战略分析报告
评论
0/150
提交评论