大数据时代概述_第1页
大数据时代概述_第2页
大数据时代概述_第3页
大数据时代概述_第4页
大数据时代概述_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

123大数据概概述大数据4V特性相关领域应用4相关技术术架构目录5总结1大数据概概述大数据产产生的背背景什么是大大数据大数据时时代数据量级级变化大数据产产生背景景数据量级级不断增增加||根据IDC监监测,人人类产生生的数据据量正在呈呈指数级级增长,,大约每每两年翻翻一番,,这个速速度在2020年之前会会继续保保持下去去。数据结构构日趋复复杂|大量新数数据源的的出现则则导致非非结构化化、半结构化化数据爆爆发式的的增长TBPBZBEB地球上至至今的数数据量::在2006年年,个人人用户才才刚刚迈迈进TB时代,,全球一一共新产产生了约约180EB的的数据;;在2011年年,这个个数字达达到了1.8ZB。而有市场场研究机机构预测测:到2020年,,整个世世界的数数据总量量将会增增长44倍,,达到35.2ZB((1ZB=10亿TB)说明互联网((社交、、搜索、、电商))、移动动互联网网(微博博)、物物联网((传感器器,智慧慧地球))、车联联网、GPS、、医学影影像、安安全监控控、金融融(银行行、股市市、保险险)、电电信(通通话、短短信)都都在疯狂狂产生着着数据。。1GB((Gigabyte))=1024MB1TB((Terabyte))=1024GB1PB((Petabyte))=1024TB1EB((Exabyte)==1024PB1ZB((Zettabyte)=1024EB平均每一分钟钟中国互联联网上发发生了什什么?百度搜索索查询48.7万次5万条微博465名新用户1.37亿人同时QQ在线556篇博客文章章83名新博客4944条心情更新新6597篇日志发布布13.9万张照片上传传3125条状态更新新发布417篇日记更新新97个视频上传传到优酷酷,内容容总计14个小时5.6万人淘宝在线线交易额230万元80篇新帖子发发布新回复1200篇是的,我们已经经进入了了大数据时时代大数据时时代变化数据在web2..0的时时代,人人们从信信息的被被动接受受者变成成了主动动创造者者全球每秒秒钟发送送2..9百百万封电电子邮件件,每天会有有2..88万万个小小时的视视频上传传到Youtube,,推特上每每天发布布5千千万条条消息量级每月网民民在Facebook上要要花费7千亿亿分钟,,发送和和接收的的数据高高达1..3EBGoogle上上每天天需要处处理24PB的的数据据…20世纪90年代,数数据仓库库之父的的BillInmon就经常提提及BigData2011年5月,在“云计算算相遇大大数据””为主题的的EMCWorld2011会议中,EMC抛出了BigData概念什么是大大数据::BigData名词由来来什么是大大数据(NO-SQL,,NotOnlySQL)不同“看”数据的方方式10可视:结结构化资资料15%未视:半半/非结构化化数据85%DB/DW主管们看看的战情数位位仪表板板,其实实是残缺缺的…大数据不不仅仅是是“大””多大?PB级比大更重要的的是数据的复复杂性,有时甚甚至大数数据中的的小数据据如一条条微博就就具有颠颠覆性的的价值大数据=海量数据据+复杂类型型的数据据海量交易易数据::企业内部部的经营营交易信信息主要要包括联联机交易易数据和和联机分分析数据据,是结结构化的的、通过过关系数数据库进进行管理理和访问问的静态态、历史史数据。。通过这这些数据据,我们们能了解解过去发发生了什什么。大数据包包括:交易数据据和交互互数据集集在内的的所有数数据集海量交互互数据::源于各种种网络和和社交媒媒体。它它包括了了呼叫详详细记录录、设备备和传感感器信息息、GPS和地理定定位映射射数据、、通过管管理文件件传输协协议传送送的海量量图像文文件、Web文本和点点击流数数据、评评价数据据、科学学信息、、电子邮邮件等等等。可以以告诉我我们未来来会发生生什么。。大数据的的构成大数据要要上升为为国家战战略国家时间政策备注美国2012-3-29《大数据研究与发展计划》推动政府开放、提升政策预见性(粮食、天气、流感等)、提高政府服务水平、降底运营开支英国2010-5数据权、我的数据日本2012-5ICT战略中国2012-5互联网大数据技术创新研究14拒绝大数数据时代代,可能能会失去去生命!!《大数据时时代:生生活、工工作与思思维的大大变革》一书的作作者维克克托·迈尔·舍恩伯格格,如是是说,““如果你是是一个个个人,如如果你拒拒绝的话话,可能能会失去去生命,,如果是是一个国国家的话话,拒绝绝大数据据时代的的话,可可能失去去这个国国家的未未来,失失去一代代人的未未来。””这一句话话恐怕不不能算作作耸人听听闻,因因为每当当人们站站在现在在这个节节点的时时候,总总会去眺眺望未来来,但是是未来往往往在你你不经意意当中已已经悄悄悄地来到到你的身身边。15硬件成本本的降低低网络带宽宽的提升升云计算的的兴起网络技术术的发展展智能终端端的普及及电子商务务、社交交网络、、电子地图图等的全全面应用用物联网大数据时时代到来来的必然然性:大数据市市场分析析12011年-2016年中国大数据市场规模2各行业大数据市场规模政府、互联网、电信、金融的大数据市场规模较大,四个行业将占据一半市场份额。由于各个行业都存在大数据应用需求,潜在市场空间非常可观。2011年是中国大数据市场元年,一些大数据产品已经推出,部分行业也有大数据应用案例的产生。2012年-2016年,将迎来大数据市场的飞速发展。2012年中国大数据市场规模达到4.7亿元,2013年大数据市场将迎来增速为138.3%的飞跃,到2016年,整个市场规模逼近百亿。2大数据的的4V特性体量Volume多样性Variety价值密度度Value速度Velocity1234数据量Volume多样性Variety价值密度度Value速度Velocity4V特性从非结构化化数据的的超大规规模和增增长,比比结构化化数据增增长快10倍到到50倍倍,是传传统数据据仓库的的10倍倍到50倍,总总数据量量的80~90%大数据的的异构和和多样性性,多种种形式((文本、、图像、、视频、、机器数数据),,无模式式或者模模式不明明显,不连贯的的语法或或句义大量的不不相关信信息对未未来趋势势与模式式的可预预测分析析,深度度复杂分分析,机机器学习习、人工工智能Vs传统统商务智智能(咨咨询、报报告等))实时分析析而非批批量式分分析,数数据输入入、处理理与丢弃弃,立竿竿见影而而非事后后见效Volume数据量PB是大数据据層次的的临界点点.KB->MB->GB->TB->PB->EB->ZB->YB->NB->DBVariety多样性企业内部部的经营营交易信信息;物联网世世界中商商品,物流信息息;互联网世世界中人人与人交交互信息息,位置信息息等是大大数据的的主要来来源.文本/图片/视频等等非结构化化/半结构化化数据能够在不不同的数数据类型型中,进行交叉叉分析的的技术,是大数据据的核心心技术之之一.语义分析析技术,图文转换换技术,模式识别别技术,地理信息息技术等等,都会在大大数据分分析时获获得应用用.非结构化化数据相对于结构化化数据而而言,不方便用用数据库库二维逻逻辑表来来表现的的数据即即称为非非结构化化数据,包括所有有格式的的办公文文档、文文本、图图片、XML、HTML、各类报报表、图图像和音音频/视频信息息等等。Value价值挖掘大数数据的价价值类似似沙里淘淘金,从海量数数据中挖挖掘稀疏疏但珍贵贵的信息息.价值密度度低,是大数据据的一个个典型特特征.2010年海地地地震,海海地人散散落在全全国各地地,援助助人员为为弄清该该去哪里里援助手手忙脚乱乱。传统统上,他他们只能能通过飞飞往灾区区上空来来查找需需要援助助的人群群。一些研究究人员采采取了一一种不同同的做法法:他们们开始跟跟踪海地地人所持持手机内内部的SIM卡,由此此判断出出手机持持有人所所处的位位置和行行动方向向。正如如一份联联合国(UN))报告所述述,此举举帮助他他们“准准确地分分析出了了逾60万名海地地人逃离离太子港港之后的的目的地地。”后后来,当当海地爆爆发霍乱乱疫情时时,同一一批研究究人员再再次通过过追踪SIM卡把药品品投放到到正确的的地点,,阻止了了疫情的的蔓延。。Velocity速度1s是临界点点.对于大数数据应用用而言,必须要在在1秒钟内形形成答案案,否则处理理结果就就是过时时和无效效的.实时处理理的要求求,是区别大大数据引引用和传传统数据据仓库技技术,BI技术的关关键差别别之一.讨论一下下:传统的数数据库与与大数据据的区别别?问题1:大数据与传传统数据据库的区区别大数据是在传统数据库学科的分支——数据仓库与数据挖掘的基础上进一步发展起来的。但有两点比较主要的不同:结构化程度:传统数据库保存的是结构化或者半结构化的数据,以二维表或者标准XML文件的方式存储数据,由于结构清晰,处理相对容易;大数据面向的是一切计算机可以存储的数据格式,包括互联网上的各种网页、图片、音频、视频,包括办公文档、报表,包括人们在搜索引擎中输入的关键词、在社交网络中的留言、喜好,也包括各种传感器自动收集的监控结果等等,显然不同的格式处理起来更加困难。噪声(异常)数据的处理:传统数据库通常把异常数据先剔除,应用在需要高精确度的领域,如银行对每个账户的管理;大数据则允许异常数据存在,更多应用在预测方面,找出大量数据中隐藏的关联关系,少量异常数据不会对总体结果产生影响。3相关领域域的应用用大数据使使移动电电商进入入个性化化时代

各种网络平台的开封不仅增加了数据的规模,而且使数据具有较强的流动性和有效性社会化登录使得用户第一次在互联网上具有统一的身份个性化电电商时代代两者合起起来创造造了这样样一种网网络环境境:通过过利用各各网络平平台的数数据,企企业能够够相对容容易地查查到用户户的具体体身份,,了解该该用户在在网络上上都干了了些什么么。有了了这些信信息,企企业就可可以在移移动电商商平台上上更好地地实现个个性化推推荐。数据支撑撑营销,,电商战战线新阵阵法当前大数数据可以以辅助销销售的方方面包括括:提高高潜在客客户的质质量,提提高销售售机会数数据的质质量,提提高目标标客户开开发精确确性,区区域规划划,赢利利率等等等。而在在市场营营销中,,大数据据也功不不可没。。除了提提供提高高转换率率策略,,销售前前景预测测,增长长收入和和客户生生命周期期外,还还有可以以帮助我我们判断断销售周周期内各各阶段哪哪些内容容是最有有效的,,以及如如何改进进客户关关系管理理系统。。如果公公司是提提供基于于云计算算的企业业软件服服务,大大数据还还可以提提供关于于何降低低客户获获取成本本(CAC),客户终终身价值值(CLTV)的信息,,管理许许多其他他客户驱驱动的指指标,这这些指标标对于经经营云业业务至关关重要。。数据挖据据流程知识运用用知识运用用就是对对挖掘的的评估结结果在现现实决策策中的运运用,这这是一个个非常重重要的过过程,也也是数据据挖掘的的最终目目标,价价值的体体现。数据准备备数据准备备,是从从海量的的原始数数据中准准备要据据挖掘的的数据,,它是长长期的、、无规律律的数据据积累的的结果。。由于原原始数据据不适合合数据挖挖掘,所所以要先先进行预预处理,,包括数数据选择择、清洗洗、推测测、转换换等操作作。数据据准备的的好坏直直接决定定着数据据挖掘的的质量和和效率。。数据挖掘掘数据挖掘掘是整个个程序的的关键过过程,按按照数据据挖掘的的目标要要求,选选择合适适的算法法,来挖挖掘数据据规律,,常见的的算法有有决策树树、分类类、神经经网络、、Apriori算法等。。模式的评评价、分分析对挖掘过过的数据据结果进进行解释释、分析析、提取取有意义义或有使使用价值值的规律律,还原原成人们们能够理理解的数数据语言言。1、信息的發發現和收收集2、信息传播指导导3、效果评评估4、负面处处理5、品牌调调研6、消费者者决策分分析大數據商商務電子子的應用用信息的發發現和收收集竞品信息发现、行行业资讯讯获取情报数据据全面整整合传播方向向发现大数据为我们带来了什么?她是80/885后她的生活活習慣她喜歡甚麼化妝品她的個性性她平常參參加哪些些互動活活動她用甚麼麼手機她喜歡甚麼電影她喜歡甚麼她的休閒娛樂她平常的的作息時時間大数据为我们带来了什么?她是80/885后商品、美食是她的最最爱她爱兰蔻她个性、清新、时尚对喜欢的的东西有有某种狂热她关注新媒体和移动互联联网关注网络营销销、推广活动动爱小米爱热播剧爱汽车爱旅游10点、14点前后是她她频繁上上网的时时间•每一秒::全球发发送290万封电子子邮件;;•每一分钟钟:微博博推特上上新发的的数据量量超过10万;;社交网网络Facebook的浏览览量超过过600万;•每一天::全球上上传2.88万小时视视频至Youtube;•每个月::网民在在Facebook上花费7千亿分钟钟;•上一年::人们制制造并使使用的数数据达1.8ZB。数据已经经渗透到到当今每每一个行行业和业业务职能能领域,,成为重重要的生生产因素素。人们们对于海海量数据据的挖掘掘和运用用,预示示着新一一波生产产率增长长和消费费者盈余余浪潮的的到来,,大数据正正成为最最值得关关注的领领域之一一.“大数据据”在互互联网行行业通常常表现为为互联网网公司在在日常运运营中生生成、累累积的用用户网络络行为数数据。信息的發發現和收收集信息的發發現和收收集發現收集情报数据据全面整整合竞品广告投放放+公关活动动洞察分析析,全面了解竞品品市场动动态。12%10%5%3%70%Search-suningSale-suning-suning-cnsuningBbs-suning5%3%广告投放力度广告创意内容广告投放阵地传播诉求传播声量趋势传播媒体投放广告公关联想苹果三星手机品牌各媒体声量比重微博新闻博客论坛传播方向向发现海量数据据中,2大维度、7大指标挖掘关键键资讯,,准确提提供传播播方向。。重点位置置+重要内容容名人权重重首页露出出首屏露出出焦点图露露出热门位置置热点位置置热搜位置置传播主要要诉求及及类别不同类别别内容TOP10媒体与网网友评价价正负信信息TOP10传播指导导目标人群群界定媒介战略略指导传播内容容指导目标人群群界定年龄性别收入所在区域职业教育程度……..消费心理喜好关注内容活跃时间关注群体…….男女14:0014:3018:00品牌产品服务质量物流售后渠道诚信价格美誉性能档次形象效果卖点行业名人时评家准确了解解用户构构成,掌掌握用户户行为特特征Who--围绕哪类类人群展展开传播播?受众分布布是否与与设想吻吻合?媒介战略略指导了解用户户触媒习习惯,锁锁定用户户所在媒媒体分布布,合理理分配媒媒体投放放资源。。……35%10%25%15%10%5%Where-媒体选择择预算分配配传播方式式传播内容容指导What-确定卖点点诉求方向向话题设计计传播力度度全面了解解消费者者决策因因素及竞竞品传播播内容,,为后期期传播内内容策略略提供支支持。喜欢不喜欢前卫的、、卓越的的、有格格调的…无保障的的、不安安全的….购买动机机Action购买Share重复购买Attention关注Interesting记忆Choice选择决策轨迹效果评估估传播表现现评估搜索表现现评估用户到达达评估用户购买买评估AICAS模型:消费者决策轨迹AttentionInterestingChoiceActionShare工作量人员配备工作时长信息量信息总量媒体亮点影响力点击量、健康度首页时长媒体占有率竞品比较自身比较用户关注百度指数网站流量销售转化产品售出数产品评论数传播表现现评估指标:信息总量量影响力媒体占有有率提及数负面数信息影响力覆盖度曝光时长网站权重曲线搜索表现现评估首页露出出条数前三页露露出条数数前五页露露出条数数联想词露露出个数数相关词露露出个数数用户到达达评估指标:声量评估估内容评估估满意度评评估百度指数数决策变化化网站流量量用户购买买评估SALES产品评论数每日评论评论总数产品售出数每日售出售出总数负面处理理负面识别别及分级级危机追踪踪及路径径分析负面识别别及分级级盐城论坛坛二级页页面尼康,垃垃圾..联想频死死机、坑坑爹…负面内容容语义识识别负面位置置影响力力判断ACABAABCBBBACCCBCACC级重大负负面315网站首页页:京东商城城销售问问题电视视….尼康D600深陷“进进灰门””…智能识别别负面信信息,更快速的发现负面面负面处理理优先排排序,更科学的指导负面面处理搜索引擎擎首页小米2使用不到到一天爆爆炸营养快线线商标遭遭侵权..危机追踪踪及路径径分析(上午9:03当事人粉粉丝助推扩大大声势))(上午9:05专家、意意见领袖袖发表观点点))发展期潜伏期爆发期消退期当事人(上午9:00发表XX奶粉促进进婴儿性性早熟))事件声量量跟踪事件发布布者跟踪踪实时把控控事件脉脉络(下午13:00媒体要热点对对事件进进行报道道)(一个月竞争品牌牌恶意传播播扩散))品牌调研研大众用户户评价消费用户户评价关联品牌牌联想大众用户户评价产品产地地知名度行业地位位品牌口碑碑SNS视频问答论坛博客微博深入了解解潜在用用户对我我们的评评价。消费用户户评价效果周期期安全性价格优势势售后保障障对消费用用户的评评价进行行全面分分析,有有效帮助助我们改改善工作作。关联品牌牌联想关注同时关注了解消费费者感兴兴趣的关关联品牌牌,为后后续品牌牌联合传传播提供供指导支支持。消费者决决策分析析决策因素素发现决策点与与传播卖卖点差异异性比较较决策因素素发现卖点品牌产品特点点服务价格质量物流渠道真实了解解消费者者决策因因素,提提供销售售策略。。决策点与与传播卖卖点差异异性比较较有效长效产品传播播卖点::速度快、、无痛感感、快速速脱毛消费者关关注点::长期有有效了解传播播卖点与与消费者者决策点点差异,,有效改改进卖点点传播策策略。报告呈现现报告类型型报告内容容报告结论论表现形式式6大类报告告类型、、64种专项研研究多指标((20类、258个分析指指标)战略角度度:定位、诉诉求方向向、整体体策略执行角度度:预算分配配、媒体体选择、、内容设设计直观、简简洁例子:电电商用户数数据分析析与挖掘掘2020-02-27说明报告介绍分析:分析店铺的整体运营状况;分析客户特征,从不同细分角度寻找不同客户之间的差异;客户属性特征分析客户消费行为分析目的:为了卖家能更直观的了解自己店铺的运营现状;了解客户特征,为客户维护和回购刺激提供决策依据;提供个性化的实施建议;数据来源订单数据客户数据外部数据行业数据订单样本XXX专卖店自:2012-8-10到2015-4-30,状态为交易成功的订单极值处理剔除客单价>2000元的订单剔除客单价<10元的订单剔除批发商:购买次数大于50次订单处理方式同一客户一天内多比订单默认合并为一笔订单备注信息息:2020-02-273.如何实施?2.客户特征表现?1.整体现状?购物体验深入客户关系管理客户属性特征消费行为特征个性化实施方案1.1购物体验验DSR评分1.2深入客户户关系管管理1.2..1年滚动趋趋势1.2..2月滚动趋趋势一、购物物体验现现状1.1DSR动态评分分DSR评分不错错,尤其其在“宝宝贝与描描述相符符”上比比较突出出。提升DSR的其他方方案:客服专业业性服务务及客户户信息收收集;批量进行行(利用用订单中中心)::个性化化包裹、、发货提提醒、同同城到达达提醒等等;个性化进进行:物物流跟进进、退款款跟进、、评价跟跟进等但是整体体的退款款率非常常大!!!!1.2..1年滚动趋趋势:活活跃客户户**备注注:回头头客比例例=(一年购购买2次及以上上新客户户+一年前购购买过又又来买的的客户))/一年总客客户数,,如,201308指201209--201308整体销售售额呈现现一定的的稳定增增长趋势势;回头客销销售额占占比整体体呈现逐逐渐上升升的趋势势,目前前占到6%,低于行行业均值值,需后后续加强强老客户户的维护护。整体客户户数同销销售额类类似,呈呈现一定定的稳定定增长态态势;相比而言言,老客客户的客客单价高高于新客客户。但是目前前的整体体现状仍仍需改进进。1.2..2月趋势从销售额额的趋势势来看,,波动非非常大,,中间竟竟然出现现几个月月非常低低的销售售情况,,如2013年的1、2、6、7、8月份。需需引起高高度重视视。去年下半半年以来来整体情情况还不不错。新老客户户占比从店铺整整体来看看还是主主要有新新客户支支撑;只是在某某几个月月份,整整体销量量特别不不好的时时候,能能够凸显显老客户户的价值值。从客户数数可以明明显的看看出,老老客户的的贡献人人均贡献献大于新新客户的的人均贡贡献值。。2.1客户属性性2.1..1地域2.1..2地址—职业2.2客户消费费行为2.2..1RFM2.2..2购物时间间分析2.2..3商品分析析二、客户户特征2.1..1地域2.1..2地址—职业地址-职业回购购情况::2.2..1RFM:F&M新客户复复购分析析:R首次客单单价在100元以下的的属于低低价值客客户,复复购率低低于4%右,占比比总客户户数的40%;首次客单单价在100~~200元的属于于中价值值客户,,复购率率也低于于4%,占比约约为57%;首次客单单价大于于200元的可以以归类为为高价值值客户,,复购率率略高,,占比约约为3%;新客户复复购分析析:首次次客单价价2.2..2购物时间间分析地域—时点:不同区域域在购物物时间上上还是存存在一定定的差异异性,可可以适当当的针对对不同的的地区在在不同的的时间点点进行营营销。页面优化化方案::1、日常搭搭配套餐餐、页面面关联的的选择2、充分利利用流量量(主打打产品--搭配套餐餐),提提升ROI3、浏览连连带率高高,但是是购买连连带率/单品购买买情况不不佳研究详情情页面((优势的的突出/劣势的攻攻击)6、A与B商品功能能大致相相同,A更便宜加强对价价格高产产品的价价值认同同5、A和B价格一样样、功能能一样,,A是主推将B与A分开,由由其他热热销款带带动B7、A和B功能不同同(搭配配)匹配度不不高,调调整;组组合价格格太高买了又买买看了又看看看了最终终买4、单品转转化率低低,单品品整体转转化率高高主图吸引引人,价价格以及及页面详详情不尽尽如意订单催付订单关怀个性化跟进基础策略略:新客户培培养策略略:购后2天感谢/EDM关怀购后8天商品使用指导/晒单有礼/加微信/加微博购后20天关联商品推荐/商品回购周期营销购后30天满月礼/定向营销/短信关怀购后60天当季热卖品推荐/60天关怀/大促购后90天换季新品推荐购后当天发货通知/快递/包裹礼品购后180天购后220天进入流失客户组管理(沉默期)(睡眠期)(睡眠期)(睡眠期)当季清仓品推荐/聚划算(活跃期)(活跃期)(活跃期)(流失期)新客户培培养案例例DAY1DAY8DAY30DAY45DAY60感谢信干货特辑辑,根据据客户购购买的产产品种类类,分类类推送。。会员生日日特权/满月礼会员专享享优惠刺激激3.1..2后期重点点:沿着着RFM特征进行行资源投入一段生命周期内必须有一定量的维系类活动;营销类活动和维系类活动按照一定比例匹配;随着客户关系从购买到死亡,资源投入逐渐下降,保持资源利用的高效性;一段生命周期内客户接触次数有下限,也有上限;每个活动都应该有针对性,或针对新客户、或这对某一会员等级的用户,切忌大众化;活动选择活动特性售后期0天365天以上7天45天活跃期90天沉默期140天睡眠期流失期死亡催付、发货通知、评价有礼、

包裹礼品、晒单奖励会员升级刺激、满月礼、会员特权提醒2-3次维系类活动保证DSR2-3次营销类活动1-2次维系类活动1-2次维系类活动1-2次营销类活动上新通知、爆款打造

事件营销、定向推荐节日关怀、会员活动、

降级预警、60天回购刺激1次维系类活动1次营销类活动节日关怀、特权提醒、

降级预警、99天记忆唤醒店铺活动、爆款打造

促销活动、事件营销0-1次维系类活动1次营销类活动会员特权提醒节日关怀爆款打造促销活动促销活动事件营销0-1次营销类活动上新通知、店铺活动、爆款打造、关联推荐中间结合合:地域域、地址址--职业、信信用等级级、购物物时间、、商品等等等维度度用户行为为数据用户消费费数据用户社交交等UGC数据据培亚马逊、、SMG、淘宝宝信用卡中中心、蚂蚂蚁金服服谷歌地图图、大众众点评、、美团等等APP的自动动定位系系统互联网金金融数据据支付宝、、陆金所所用户地理理位置数数据互联网大大数据简单罗列列几个行行业fackbook、新新浪大数据在在营销和和销售中中的十大大应用1.大数据使得得根据每每个客户户和每个个产品的的关系进进行等级级差别定定价策略略,最大大限度的的优化定定价变得得可能。。麦肯锡的的分析发发现,一一家典型型的公司司75%的收入来来源于其其标准产产品,在在每年这这成百上上千种定定价标准准产品的的决策中中30%的时候公公司无法法定出最最好的价价格。假假定销售售量没有有减少,,1%的价格提提高却可可以带来来高达经经营利润润8.7%%的增加,,定价具具有显著著的提高高盈利能能力的潜潜力空间间。2.大数据可以以带来更更大的顾顾客回应应率以及及更深层层次的客客户信息息根据下图图的调查查问卷,,Forrester的研究发发现44%的B2C的市场营营销人员员正在使使用大数数据提高高客户的的的回应应率,36%的营销人人员运用用数据分分析和数数据挖掘掘,获取取更多的的深层客客户信息息从而策策划更多多的关系系驱动的的市场策策略。3.客户分析(48%%),操作分分析(21%%),欺诈和和合规(12%%),新产品品与服务务创新(10%%)和企业数数据仓库库优化(10%%)是当今最最常见的的大数据据销售和和营销案案例大数据联联盟(DataMeer))最近的研研究发现现,客户户分析统统领大数数据在销销售和市市场营销销部门的的应用。。而支持持这个趋趋势的有有下面四四个关键键策略::增加潜潜在客户户、减少少客户流流失、增增加每个个客户的的投入以以及改进进现有产产品。4.大数据将分分析数据据嵌入到到情境营营销中许多公司司的营销销平台技技术正在在快速完完善,支支持这个个趋势的的基础是是不断变变化的客客户、销销售、服服务和与与现有系系统不匹匹配的渠渠道需求求。这造造成了许许多营销销部门在在数据和和处理上上无法完完全集成成好。大大数据分分析可以以创建可可扩展的的系统分分析,可可以再一一定程度度上缓解解这个问问题。下下图来自自Forrester的研究,,在SAS网站上可可以免费费下载,,结合直直觉与参参与的情情境营销销工具和和技术::企业营营销技术术手册。。5.大数据分分析可以以完善客客户关系系使得营营销方案案更成功功通过大数数据分析析,定义义和指导导客户发发展,营营销人员员创造更更大客户户忠诚度度。下图图来自于于SAS赞助Forrester的研究,,分析是是如何在在整个客客户生命命周中提提供价值值的(图中两条条线间的的距离表表示者数数据分析析带来的的价值)。大数据带给我们们的隐患:隐忧一,数据采集集过程中中的偏差差。隐忧二,,市场干扰扰数据的的准确性性。隐忧三,,“第三只只眼”的的监控。。隐忧四,,营销轰炸炸。数据和数据集集本身并并不是客客观的,,而是由由人们设设计的,,人们用用数据来来说话,,从数据据进行推推断以及及解释数数据。大量的刷量以以及水军军好评差差评等数数据已经经严重干干扰了数数据的准准确性,,这实际际上大大大降低了了数据的的价值。普通人的的各种私私人信息息也会成成为被收收集的数数据,我我们的隐隐私岌岌岌可危!!!!!!!隐私×应对措施企业方面面:一个好的的企业应应该未雨雨绸缪,,从现在在开始就就应该着着手准备备,为企企业的后后期的数数据收集集和分析析做好准准备,企企业可以以从下面面六个方方面着手手,这样样当面临临铺天盖盖地的大大数据的的时候,,以确保保企业能能够快速速发展,,具体为为下面六六点:1.目标2.准则3.重新评估估4.重视大数数据技术术5.培训企业业的员工工6.培养三种种能力Teradata大中华区区首席执执行官辛辛儿伦对对新浪科科技表示示,随着着大数据据时代的的到来,,企业应应该在内内部培养养三种能能力。第第一,整整合企业业数据的的能力;;第二,,探索数数据背后后价值和和制定精精确行动动纲领的的能力;;第三,,进行精精确快速速实时行行动的能能力。4相关技术术云计算列数据库库实时分析析hadoop生态集群群技术领域域的挑战战1、对现有有数据库库管理技技术的挑挑战传统的数数据库部部署不能能处理数数TB级别的数数据,也也不能很很好的支支持高级级别的数数据分析析。急速速膨胀的的数据体体量即将将超越传传统数据据库的管管理能力力。如何构建建全球级级的分布布式数据据库(Globally--DistributedDatabase)),可以扩扩展到数数百万的的机器,,数已百百计的数数据中心心,上万万亿的行行数据。。2、经典数数据库技技术并没没有考虑虑数据的的多类别别(variety)SQL(结构化化数据查查询语言言),在在设计的的一开始始是没有有考虑非非结构化化数据的的。3、实时性性的技术术挑战::一般而言言,像数数据仓库库系统、、BI应用,对对处理时时间的要要求并不不高。因因此这类类应用往往往运行行1、2天获得结结果依然然可行的的。但实实时处理理的要求求,是区区别大数数据应用用和传统统数据仓仓库技术术、BI技术的关关键差别别之一。。网络架构构、数据据中心、、运维的的挑战::技术架构构的挑战战:人们每天天创建的的数据量量正呈爆爆炸式增增长,但但就数据据保存来来说,我我们的技技术改进进不大,,而数据据丢失的的可能性性却不断断增加。。如此庞大大的数据据量首先先在存储储上就会会是一个个非常严严重的问问题,硬硬件的更更新速度度将是大大数据发发展的基基石。分析技术术:数据处理理:自然然语言处处理技术术统计和分分析:A/Btest;topN排行榜;;地域占占比;文文本情感感分析数据挖掘掘:关联联规则分分析;分分类;聚聚类模型预测测:预测测模型;;机器学学习;建建模仿真真大数据技技术:数据采集集:ETL工具数据存取取:关系系数据库库;NoSQL;SQL等基础架构构支持::云存储储;分布布式文件件系统等等计算结果果展现::云计算算;标签签云;关关系图等等一些相关关技术存储结构化数数据:海量数据据的查询询、统计计、更新新等操作作效率低低非结构化化数据图片、视视频、word、pdf、ppt等文件存存储不利于检检索、查查询和存存储半结构化化数据转换为结结构化存存储按照非结结构化存存储解决方案案:Hadoop(MapReduce技术)流计算((twitter的storm和yahoo!的S4)数据采集数据储存数据管理数据分析与挖掘数据采集数据储存与管理数据分析与挖掘计算结果展示大数据的的相关技技术ETL数据众包(CrowdSouring)结构化、非结构化和半结构化数据分布式文件系统关系数据库非关系数据库(NoSQL)数据仓库云计算和云存储实时流处理A/BTesting关联规则分析分类聚类遗传算法神经网络预测模型模式识别时间序列分析回归分析系统仿真机器学习优化空间分析社会网络分析自然语言分析MapReduceR语言标签云(TagCloud)聚类图(Clustergram)空间信息流(Spatialinformationflow)热图(Heatmap)经过剁手手族24小时的的鏖战,,天猫双双11的的销售总总额最终终定格在在1207亿,,↓↓↓↓大数据给给您带来来的启发发是什么么?选择择一个身身份来展展开,如如阿里工工作人员员、某某某商家老老板、消消费者。。http:///mp../s?src=3×tamp=1479133962&ver=1&signature=647xkNKM4XhK34f8eCbmy1vu4i2ZWn1pOjgwEoIRB4Qd-euNb8ne2XX5cBvyb5YMEWS8j483gbyF-BUgr445**m0lH6LZCoSbGcFfrISxmIl*ZXTWO2TsmwABei5OOzNrFPYGbkJc1Q3XyOrmIrmx0z8VK8VFRF0PC*rJr6S67*k==双11大大数据::品牌排排行、最最败家城城市、最最败家星星座!请各位同同学,周周六之前前交到学学委。5总结云计算大数据云计算服服务及好好处基础设施施服务((InfrastructureasaService,IaaS)平台环境境服务((PlatformasaService,,PaaS)应用软件件服务((SoftwareasaService,,SaaS)存储服务务网络服务务开发与运运行环境境计算服务务各类开放放服务能力力办公应用用信息化应应用通讯应用用互联网应应用数据库123好处IaasPaaSSaaS低成本、、大规模模、高效效率提供供IT基础设施施统一平台台架构,,开放平平台能力力,引入入外部开开发创新新力量,,形成生生态系统统增强业务务性能,,降低业业务提供供成本,,降低终终端要求求基于网络络以服务务的形式式提供计计算、存存储等资资源能力力基于互联联网以服服务的形形式提供供平台运运行环境境(运行行库)基于互联联网以服服务的形形式提供供软件应应用云计算优点方便易用用经济实惠惠资源整合合超强计算算能力安全性更更高绿色环保保6.1..3云计算的的优点和和问题云计算服服务的问问题云计算标标准问题题隐私权、、知识产产权问题题数据完全全问题云计算核核心服务务层3个子层的的比较<1>核心服务务层1云计算体体系架构构云计算应应用于移移动商务务领域将将为众多多移动商商务企业业的发展展提供全全新的技技术基础础和服务务模式,,尤其是是中小企企业将获获得更廉廉价的资资源、更更广阔的的发展机机遇和更更完善的的服务。。云计算将将给移动动商务带带来全面面的历史史发展机机遇。(1)打破移动动终端性性能瓶颈颈;(2)提供全新新的IT资源部署署模式;;(3)更加安全全的数据据存储模模式;(4)提供商业业智能级级的经营营决策模模式。1云计算带带来的机机遇你认同下下面4点发展机机遇吗??WHY??2全新移动动商务模模式构建建<1>基于“供供应链云云”的全全程移动动电子商商务模式式基础云平平台:主要由云云计算服服务提供供商提供供云计算算的基础础架构和和平台建建设,为为电子商商务企业业提供使使用云计计算的基基本环境境和物理理基础。。对应于于云计算算的的Iaas和Paas基础云服服务层::主要由应应用开发发商提供供云计算算的相关关服务和和公共应应用接口口.为电电子商务务企业提提供所需需的服务务和软件件。对应应于云计计算的SaaS服务和和PaaS服务务:企业应用用云层::这一层是是企业开展全程程移动商商务的核核心层。。在这一一层移动动商务企企业应用用供应链链管理的的基本思思想,开开展企业业核心业业务流程程的重组组,构建建移动供应应链管理理系统。。利用已已有的云云计算平平台和服服务,整整合企业业资源,,改善企企业流程程,合理理分配权权限,采采用广泛泛的“供供应链云云”实现现全程移移动商务务的最终终目标综上所述述:从云计算算平台供供应商,,到云计计算应用用开发商商,再到到云计算算的使用用者—移移动商务务企业,,形成了了一个全全新基于于云计算算的产业业链。目目前,诸诸如用友友、金算算盘、伟伟库等大大型服务务商都已已经开始始打造全全程移动动商务服服务系统统,基于于“供应应链云””的全程程移动商商务已经经进入实实践应用用的阶段段。2全新移动动商务模模式构建建<2>基于“移移动云””的移动动电子商商务模式式此模式解解决了移移动终端端性能瓶瓶颈的问问题,还还极大地地提高了了数据分分享的便便捷性、、任务执执行的高高效性。。在这种种模式下下,对手手机等移移动终端端没有复复杂的硬硬件性能能要求,,只要具具备简单单的跨系系统平台台就可以以顺利连连接“云云端”,,获

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论