美团实时计算平台_第1页
美团实时计算平台_第2页
美团实时计算平台_第3页
美团实时计算平台_第4页
美团实时计算平台_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、美团实时计算实践与应用OutlineBackgroundArchitectureFeaturesCustomers & BenefitsLessons LearnedQ&AOutlineBackground美团数据仓库业务场景多:2500+指标数,600+分析师/运营/数据RD;业务变化快:40K 任务/天,500+ 报表,半年翻倍;数据量大:4P+总数据量,30T/天增量;实时计算技术以Kafka, Storm为代表的流式计算技术蓬勃发展,解决了大数据处理的时效性问题;OutlineArchitecture数据处理架构实时计算架构OutlineFeatures开发者困惑开发一个实时应用,除了

2、写业务逻辑外,我还要做什么?拓扑框架拓扑=应用逻辑+可配置框架开发者困惑准备开发前,我要怎样引入数据流?程序中间状态存在哪?结果存在哪?解决方案应用拓扑=流+计算框架+Se+结果解决方案应用拓扑=流+计算框架+Se+结果开发者困惑准备开工啦!那我在哪开发?在哪测试?测试开发化Git整合、版本管理、开发测试,线上运维;开发者困惑拓扑终于上线啦!如何控制延迟?拓扑状态?如何延迟统计日志流转全流程的延迟延迟统计日志流转全流程的延迟定制化服务用户自定义Metrics的服务定制化服务用户自定义Metrics的服务开发者困惑运行了一段时间,开始考虑:扑和别人的拓扑会不会抢资源?拓资源分组按等级/部门对资源

3、进行分组调度策略优化机器独占、拓扑独占、拓扑共享开发者困惑是否有公共数据可以用?能否使用其它拓扑产出的结果?如何管理数据?拓扑依赖关系清晰展示拓扑和数据之间的关系功能特性拓扑框架;的解决方案;测试开发化;延迟统计服务;定制化服务;资源分组和调度策略优化;拓扑依赖关系;OutlineCustomers & Benefits应用领域风控安全、反爬虫机群指标统计业务指标统计(新客,销售额等)100+个Topology;record/s的实时数据;期4GB/s,60万收益节省开发时间:5Days-Hours;2W-1W;反爬虫:获得线性扩容能力;延迟从3小时降到十几秒;在现有框架下增加新的封禁分析功能,几个小时就完成从开发到上线观察效果;安全:获得实时性,完成异30s内;别从3-4小时降到收益:准实时反馈,CTR和访购率5-10%;实时的用户行为分析,2%;效果较大,点击下单提高效果展示:实时看到策略的效果,查找问题从2天缩短到当天,加快了算法迭代速度;风控刷机项目:项目开发、测试、上线只用了不到2周,节省了分布式数据流和分布式计算框架的开发,只需要关注逻辑模块的开发,节省了70%的工作量;OutlineLessons Learned经验教训拥抱开源:受益于开源,跟进社区发展,积极回馈社区;Storm管理系统尝试开源;解决方案:输入、输出、状态、警、延迟等,以开发者为中心;报贴近用户做产

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论