浅析分布式存储架构-设计自己的存储-58同城徐振华_第1页
浅析分布式存储架构-设计自己的存储-58同城徐振华_第2页
浅析分布式存储架构-设计自己的存储-58同城徐振华_第3页
浅析分布式存储架构-设计自己的存储-58同城徐振华_第4页
浅析分布式存储架构-设计自己的存储-58同城徐振华_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

浅析分布式存储架构—设计自己的存储技术中心·架构部徐振华2012-02-06内容概要分布式存储架构介绍和现状需要那些基础知识

高并发服务端架构

常用存储架构比较如何设计分布式存储的架构

分析需求,做好平衡

如何做到RAS(可靠,可用,可扩展);

利用硬件,分级存储介绍重点:架构理论:CAP:ConsistencyAvailabilityPartitiontolerance只能满足其二

BASE

:BasicallyAvailable(基本可用)Softstate(柔性状态)

Eventuallyconsistent(最终一致)

ACID(原子性一致性隔离性持久性)

I/O五分钟法则Amdahl定律和Gustafson定律,摩尔定律

介绍和现状现状

2011年,AmazonS3服务增加了5000亿份存储对象和文件

技术:SimpleDB,Dynamo目前全球累计已经有超过1400亿张照片发布在Facebook网站上

每天平均有超过2.5亿张照片上传至FacebookFacebook目前存储的照片和视频数据量超过100PB(1PB=1024TB)

HBase每月存储1350亿条信息

技术:Facebook图片存储系统HayStack,cassandra,hbase

2008年google谷歌网页索引数量突破1万亿

技术:GoogleMegastore,GFS,bigtable介绍和现状基础知识数据结构网络集群操作系统存储领域其它领域基础知识网络服务器模型

s:1,c:1,bio;一个请求一个线程s:1,c:n,nio

;多个请求,一个线程分发

seda:StagedEvent-DrivenArchitectureSelect(轮询)和epoll(事件驱动callback);C10K问题,C500K,C**K本质方法:I/O模型职责划分内核和协议栈优化目标:尽量少占用CPU,提高资源利用率DRM的目标一致常用网络库Netty,Mina,libevent,libev,ACE,ASIO基础知识各种IO模型分布式存储架构数据结构主要存储模型Consistenthash,(去中心化)B+tree,(实时,随机)LSMtree,(批量顺序)其它Bitmap(bloomfilter缓存命中)Dynamo,hbaseMerkleTree(一致性)DynamoSkipList(跳表lsm变形)leveldbprio_tree(优先搜索树mmap)mognodb基础知识

consistenthash分布式存储架构B+tree分布式存储架构

cassandra数据存储过程分布式存储架构Lsmtree分布式存储架构MerkleTree分布式存储架构集群无主;Master_slave;P2P(全主)操作系统进程调度内存管理文件管理:存储领域存储硬件

事务和锁(MVCC二段提交三段提交,paxos)常用数字扇区512,内存页4k,磁盘块大小4k

mtu1500其它领域人工智能:k_means基础知识基础知识应用Dynamo数据同步,BT下载

MerkleTreememcached

linux内存管理

+libevent+(consistenhash)

基础知识linuxvfs体系分布式存储架构如何设计架构分析需求,做好平衡使用Kiss原则,做到RAS设计和充分利用硬件,分级存储实践如何设计分析需求,做好平衡1分析需求

数据结构

文件

table,object

数据特点容量大小

访问模式读写比例,实时读写,顺序读写

实时性2平衡1CAP理论,BASE理论/ACID2选择存储模型B+orLSM资源利用率和管理高吞吐和低延迟随机与顺序规模与实时B+orLSM

3实践

Mongodb选择如何设计原则和目标原则:kissunix设计哲学目标:RASRAS:Reliability,Availability,Scalability高可靠,高可用,高扩展R:过载控制:Qos,(随机早期检测)A:容灾

多副本(同机柜,机房,数据中心)S扩容

分片:a取模b一致性hashcB+tree或变种如何设计利用硬件,分级存储数据中心Facebook开源服务器、数据中心,将开源存储方案,分级存储

网络延迟

局部性原理

cdn

按对象访问热点进行迁移:

最热的进SSD,中等热度的放SAS,轻热度的存SATA展望硬件分离,你的CPU在一台服务器上,而内存在另外一台服务器,网卡可能在第三台服务器上如何设计facebook数据中心电力布局分布式存储架构

淘宝cdn分级分布式存储架构数据分布分布式存储架构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论