360云盘底层Cassandra+Storm介绍_第1页
360云盘底层Cassandra+Storm介绍_第2页
360云盘底层Cassandra+Storm介绍_第3页
360云盘底层Cassandra+Storm介绍_第4页
360云盘底层Cassandra+Storm介绍_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

360云盘底层Cassandra+Storm介绍•Cassandra+Storm整体架构及现状•Cassandra系统改进及实践•Storm系统改进及实践Cassandra+Storm集群现状•

集群规模主机规模

备份规模

数据规模单日新增13000台8000台400PB500TB单集群规模集群容量9P150台(24/3T)300台(24/3T)……18P……600台(36/4T)79PCassandra+Storm集群现状业务接入层CassandraIDC1IDC2IDC3Storm业务接入层CassandraStorm电信业务接入层CassandraStorm…….业务接入层CassandraStormIDC21IDC22IDC23业务接入层CassandraStorm联通业务接入层CassandraStorm…….Cassandra系统改进-数据可靠性•

主要问题:–

扇区、磁盘故障、主机故障导致副本缺失–

新写入数据副本可能不足(ONE/QUORUM)–

系统自带机制不能保证副本及时修复:•

读修复、Hinthandoff、Repair操作局限性•

损坏的SSTable在内存索引中,但磁盘数据读异常Cassandra系统改进-数据可靠性•

文件/磁盘自动摘除–

目的:•

去腐生肌•

消除影响–

基于统计•

文件异常访问次数•

摘除文件比例Cassandra系统改进-数据可靠性•

数据节点定期扫描修复–

目的:•

磁盘/文件故障摘除即启动修复•

尽快恢复全副本的状态–

修复方式:•

确定故障所属Range•

RowScan

+

Diff•

KeyScan

+

Read(ALL)Cassandra系统改进-数据可靠性•

增量数据的检查修复–

目的:•

保证新写入数据副本数足够•

解决hinthandoff缺点–

处理方式:•

新增辅助表:proxycheck•

副本不足记入辅助表–

数据节点写失败:超时/拒绝–

数据节点停机•

读修复Cassandra系统改进-数据分配策略•

主要问题:–

基于集群的数据Partition策略,不灵活–

不同Keyspace根据数据类型及访问需求,需要不同的Partition策略–

部分KeySpace

有范围Scan的需求Cassandra系统改进-数据分配策略•

基于KeySpace的Partition策略:–

支持RandomPartitioner和ByteOrderedPartitioner–

修改表的Meta信息存储,增加Partition策略–

增加不同Partition的Token对应关系–

修改访问接口内部实现,实现不同Partition的兼容性Cassandra系统改进-EraserCode•

主要问题:–

数据规模原来越大,储存成本越来越高–

SimpleStrategy

,Networ

kTpStrateg

y

存储3副本成本太高Cassandra系统改进-EraserCode•

基于Stripe的EC存储策略:–

数据切分成N段子数据–

N段子数据计算出P个校验值–

N+P段数据依序存储在环上Cassandra系统改进-EraserCode•

EC存储数据切分及存储原理:–

数据内容按照大小切分成N个字段–

子段的Key,有前缀+Value的Md5–

原始Key只存储子Key列表Storm系统改进-大文件缓存•

主要问题:–

部分Storm

topology依赖数据量较大,如机器学习模型–

规模达数百兆,导致topology启动时间过长–

数据变化不大Storm系统改进-大文件缓存•

大文件缓存:–

大文件采用类似Jar

管理方式,由supervisor管理–

topology下线之后并不立即删除,长时间不用才释放Storm系统改进-应用Jar包P2P分发•

主要问题:–

topology的jar包比较大–

workerꢀ数量在上千台服务器上–

topology启动

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论