实战:大数据带你揭秘京东运营_第1页
实战:大数据带你揭秘京东运营_第2页
实战:大数据带你揭秘京东运营_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实战:大数据带你揭秘京东运营

刘海锋:大规模内存数据库JIMDB在2015中国大数据技术大会首日全体会议中,京东云平台总架构师、系统技术部负责人刘海锋带来了名为《大规模内存数据库JIMDB:从2014到2016》的主题演讲。他介绍了大规模的以内存为中心的新型数据库——JIMDB,包括它过去两年的发展历程、技术脉络以及是怎么支撑起京东的电商业务。电商业务需要非常迅捷的数据访问,这不仅是用户体验的需求,也是技术开发人员提升效率的需求,因此,京东延续数据库领域的泰斗级人物JimGray的“Memoryisthenewdisk(内存是新的磁盘)”理念,从2014年开始启动了JIMDB。JIMDB的全称为JingdongIn-MemoryDatabase,是一种新型的以内存为中心的全托管、全管理服务化的数据库,主要针对灵活类型、半结构化数据的快速存取访问。JIMDB最早基于Redis,但京东团队对它进行了持续的改进与重新实现。目前,JIMDB已能满足电商业务所需要的自动故障切换、在线弹性扩展、灵活复制与全自动化运维等需求,在生产环境达到数千机器、数万容器实例的大规模应用,支撑了京东海量的在线业务。刘海锋举出了JIMDB的实际成效案例,“内存存储带来了极佳的、非常稳定的性能。以京东线上某个比较重要的集群为例,在双11期间它整体的QPS超过200多万,而且99%的请求在2毫秒之内返回。JIMDB让用户体验更好,让我们的业务开发起来更加简单,让运维工作更加省心、更加轻松。”刘海锋透露,京东未来还将从专署集群过渡到聚合各个IDC的RAM资源,聚合整个RAM资源,让数据动态流动、降低整体硬件成本。他认为,“内存是存储的未来”一定是趋势所在。刘彦伟:让更多人玩转大数据京东大数据平台研发负责人刘彦伟做了题为《京东实时数据平台的实现和应用》的主题演讲。他表示,京东希望通过打造一个优秀的大数据基础平台,降低京东大数据消费的门槛,让更多的人能够玩转大数据,让每个人都成为大数据的专家。京东这两年发展非常快,大数据也呈现了同步快速发展态势。截止2015年Q3京东大数据基础平台整体容量突破90PB,每天新增超过1PB数据,每日扫描数据量超过了5PB,每天约有20万个作业运行。京东大数据平台是以平台化的思维为整个京东提供大数据基础服务,其中包括硬件资源、平台工具、数据服务、用户画像、技术输出等,希望通过基础设施和工具的建设,让更多的用户可以自助地在平台上做自己的大数据业务。刘彦伟介绍说,整个京东大数据平台分两部分,一部分是离线的数据平台,一部分是实时的数据平台。2014年之前还是离线的数据处理为主,2014年之后,不论是业务上还是技术上,对实时的要求越来越迫切,因此京东打造了实时数据平台。从京东商城、京东金融、京东智能、京东到家的各个业务条线,每天都在产生大量的数据,这些数据通过统一的平台“数据直通车JDBUS”实时接入,统一在JDQ实时数据总线实时存储,再通过实时计算平台JRC完成实时计算,可供精准化营销、实时运营决策、实时监控等领域使用。京东大数据平台通过技术解决了三大难题:第一数据接入的问题,第二数据存储的问题,第三数据计算的问题。在京东首页“猜你喜欢”的模块,就是基于离线的用户画像、商品画像并结合用户的实时浏览行为,经过复杂的实时推荐算法提供的。在站外的广告位,比如新浪,也会基于实时的模式打造个性化推荐。而在对商家服务的京东数据罗盘中,为商家提供的数据决策支持系统也是一个典型应用。商家可以看到实时的订单、用户、浏览等营销数据,帮助商家提升自己的运营效率、效果。万昊:大数据技术在京东广告中的应用京东数字营销大数据高级总监万昊发表了《大数据技术在京东广告中的应用》的主题演讲,分享了京东在广告上大数据的实践。万昊认为,大数据并不必然就一定有效果。除非人们能从中发现有用的信息和规律,这才是大数据真正重要的地方。传统营销中人群定向是一种退而求其次的方法,广告主直接找到他的核心或潜在用户才是最直接的。而京东大数据就可以实现这种直接的定向,比如定向看过或买过指定商品的、指定品牌和店铺的用户。京东怎么知道用户在京东的体验得到满足了呢?这也有可以量化的指标衡量:用户购买的商品总额和商品数。京东广告将此两个指标作为主要优化目标,实现的方法是大规模机器学习、标签标引。万昊说,京东的搜索广告和推荐位广告是一套架构。同一个广告单元,可以有两种定向:购物行为定向和搜索定向,排序根据质量因子×出价决定。所谓质量因子就是机器学习模型起效的地方,比如用户看了两个商品,却只买了其中一个,肯定是对一个感兴趣,对另一个兴趣不大。京东广告使用深度学习技术来预估用户的兴趣,根据结果选择让何种广告处在更显眼的位置上。这样,用户买到了他想买的东西,广告商推广卖出了自己的东西,京东帮助用户选到了心仪的商品,同时也从广告商那收到了广告费,达到三赢的状态。杜宇甫:构建大数据生态环境京东集团云平台数据首席架构师杜宇甫发表了题为《构建大数据生态环境》的主题演讲,他的演讲内容包括大数据的产生历史,大数据的分析过程以及对于大数据生态的思考。杜宇甫表示:生态的意义在于整个系统中包含了数据的生产者、分解者和消费者。每次信息革命,人类的数据都在不断增大,当“互联网+信息”爆发的时候也即是人类进入大数据时代的开端。杜宇甫将大数据生态分为:数据收集、数据存储、数据建模和分析、数据应用五个阶段。五个阶段环环相扣,让数据在生态中进行自主运转。杜宇甫认为,消费不足并不是因为需求不足,而是由于产能供给不足,只有创新才能激发新的消费空间。针对创新激发需求这个问题,京东建立了数据云平台,目的是想建立一个大的数据生态环境,让数据能在这个生态中循环起来。在这个生态里,任何一个人,在任何一个环节上都能够用起来,玩起来。“当用户数据不足,无法用于决策和优化推广的时候,我们可以为用户提供咨询服务,帮用户做数据收集;我们也有数据市场(京东万象数据开放平台)可以进行数据共享和交易;如果用户不懂数据价值,我们可以提供数据专家帮助用户挖掘价值;如果用户无法支持海量数据分析,我们可以提供分布式数据集群,硬件和软件资源帮用户处理数据;在上层我们提供数据生成工具,把整个数据环节串联起来,最终帮用户将数据变现和产生更多商业价值。数据的交易和增值,开放和共享不仅给企业自身带来价值,同时也会为其他的企业和整个社会带来积极的影响。”京东的精彩分享引发了大数据技术大会与会者的强烈关注,也成为现场

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论