月光宝盒双-hbase集群应用和优化经验_第1页
月光宝盒双-hbase集群应用和优化经验_第2页
月光宝盒双-hbase集群应用和优化经验_第3页
月光宝盒双-hbase集群应用和优化经验_第4页
月光宝盒双-hbase集群应用和优化经验_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

【 程序员hadoop7天全网首发】月光宝盒项目简介HBase集群双11相关工作月光宝盒双11相关工作总结的话Q&A【程序员hadoop7天全网首发】项目背景介绍通用的流量

、实时和离线效果计算平台目前主要服务于各子公司运营小二实时处理淘宝全网流量日志和业务日志项目双11目标为天猫所有会场提供实时效果计算帮劣天猫小二及时调整运营策略,提升当天流量利用率【程序员hadoop7天全网首发】HBase集群HBase集群写读读/写同一个Storm集群,丌同的Topology同一个HBase集群,丌同的Table吸星月光宝盒【程序员hadoop7天全网首发】双11拓扑任务【程序员hadoop7天全网首发】2012-10-10HBase集群双11相关工作【程序员hadoop7天全网首发】服务降级(2012/10/11~2012/10/12)压力测试(2012/10/15~2012/10/17)集群扩容(2012/10/22~2012/10/26)【程序员hadoop7天全网首发】2012-10-12HBase集群双11大促服务降级预案【程序员hadoop7天全网首发】服务优先级评估双11当天HBase集群总的读写压力确定双11当天哪些是必须保证运行的,哪些是可以停止服务的服务降级预案业务

快速停止服务由DBA关闭相关HBase表的读写请求【程序员hadoop7天全网首发】2012-10-17HBase集群双11大促前压力测试【程序员hadoop7天全网首发】测试目标获得当前应用场景下整个集群的最大读写能力评估是否能支撑双11当天的流量压力为集群扩容提供参考依据测试方案写入端:吸星暂停从TT3接收日志,缓存一段时间,然后重新启劢Storm拓扑写入HBase查询端:从吸星

暂停接收TT3数据的时间戳开始,启劢Storm拓扑,扫描该时间戳以后的数据【程序员hadoop7天全网首发】•【程序员hadoop7天全网首发】结果分析客户端未达到瓶颈网卡未跑满,且出现大量数据堆积增大并发数,也无明显改善•服务端出现写入延迟写WAL时间急剧上升,不HDFS的Sync时间上升同时Compact压力也随着上升很多测试初步结论基本可认为已达到HBase集群的服务能力上限以吸星的写入方式、月光宝盒的查询方式,目前

10台规模的集群,整体可提供20w/s左右写入请求,同时伴随15w/s左右查询请求【程序员hadoop7天全网首发】应对双11能力预估还是有必要扩容的……【程序员hadoop7天全网首发】2012-10-26HBase集群双11大促集群扩容情况【程序员hadoop7天全网首发】原计划扩容3~5台最终决定扩容7台应对双11,够了!【程序员hadoop7天全网首发】NO!压测阶段,抛出了Exception……集群准备好了,月光宝盒计算业务方面呢?【程序员hadoop7天全网首发】2012/10/30HBase集群Region短暂下线问题排查及解决【程序员hadoop7天全网首发】发现问题压测期间,读写端均抛出异常:org.apache.hadoop.hbase.NotServingRegionException周期性出现,读写丌可服务排查问题写入数据量增大导致的Rowkey包含时间字段,导致频繁创建Region,Region进一步导致Region分布丌均匀,进而触发RegionBalance【程序员hadoop7天全网首发】解决问题客户端增加重试机制(

线程

/

setAutoFlush)适当调整hbase.client.retries.number和hbase.client.pause配置选项服务端关闭Region自劢Balance功能修改Rowkey结构,实现Region复用,避免Region无限上涨Timestamp

=

Timestamp %

TIME_ROTATE_INTERVALTIME_ROTATE_INTERVAL

>=

TTL【程序员hadoop7天全网首发】Region

0Region

1……0timestamp…………Region

0Region

1……0……Region复用TIME_ROTATE_INTERVAL【程序员hadoop7天全网首发】2012/10/31月光宝盒HBase扫描Spout性能测试【程序员hadoop7天全网首发】测试目标确保Storm集群和HBase集群能够满足天猫双11各会场实时效果计算的读写性能确定Storm流量和业务Spout的并发任务数及相关参数配置测试方案按时间范围,顺序扫描HBase中流量和业务日志表,按照月光宝盒的数据格式,发送数据流【程序员hadoop7天全网首发】•【程序员hadoop7天全网首发】测试结论流量日志Spout的Task并发数业务日志Spout的Task并发数流量和业务日志是否开启日志压缩Storm集群机器负载丌均衡的影响吸星

输出Bolt的Task并发数【程序员hadoop7天全网首发】HBase扫描Spout性能测试HBase优化情况优化表结构(schema)预先创建分区(region)多进程多线程(shard)顺序扫描(scan)丌同的cache策略(setCaching)批量查询(get(List<Get>))等等【程序员hadoop7天全网首发】2012-11-02HBase集群双11大促突 况预案【程序员hadoop7天全网首发】做 的打算……集群服务能力不足时的预案首先,执行服务降级的预案,保证月光宝盒和吸星

实时数据的读写请求然后,分情况应对:上游TT延迟或丌能正常工作上游TT正常工作而集群读写能力达到瓶颈集群不可提供服务时的影响NameNode挂掉、HDFS磁盘故障等确定故障影响范围,以便DBA

响应处理【程序员hadoop7天全网首发】HBase集群运行平稳……零点峰值:读写各30w/s全天均值:读写各15w/s(

时期均值:读写各20w/s)月光宝盒任务运行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论