




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第6章云存储技术提纲存储基础知识云存储概念与技术原理对象存储技术存储技术趋势存储重要历史回顾总的趋势:存储容量和IO速度的不断增加。网络存储的发展网络存储根据服务器类型可以进行如下分类:网络存储的发展根据组网形式不同,当前三种主流存储技术如下图所示:DASDAS(DirectAttachedStorage—直接连接存储)是指将存储设备通过SCSI接口或光纤通道直接连接到一台计算机上。优势连接简单低成本需求较好的性能通用的解决方案劣势有限的扩展性专属的连接备份和数据保护TCO(总拥有成本高)NASNAS(NetworkAttachedStorage—网络附加存储)是将存储设备连接到现有的网络上,提供数据和文件服务,应用服务器直接把FileI/O请求通过LAN传给远端NAS中的文件系统,NAS中的文件系统发起BlockI/O到与NAS直连的磁盘。优势资源共享构架于IP网络之上部署简单较好的扩展性异构环境下的文件共享易于管理备份方案简单低的TCO劣势扩展性有限带宽瓶颈不适应某些数据库的应用SANSAN(存储区域网络)通过光纤通道连接到一群计算机上。在该网络中提供了多主机连接,但并非通过标准的网络拓扑。优势实现存储介质的共享非常好的扩展性LANFree和ServerFree高性能支持服务器集群技术容灾手段低的TCO劣势成本较高SAN孤岛技术较为复杂需要专门的技术人员维护DAS、NAS、SAN三种形态比较
DASNASFC-SANIP-SAN传输类型SCSI、FCIPFCIP数据类型块级文件级块级块级典型应用任何文件服务器数据库应用视频监控优点易于理解兼容性好易于安装成本低高扩展性高性能高可用性高扩展性成本低缺点难以管理,扩展性有限;存储空间利用率不高性能较低;对某些应用不适合比较昂贵,配置复杂;互操作性问题性能较低DAS、NAS、SAN每种组网技术都有其优势和劣势,在实际运用中需要权衡各方面的资源和适用范围。一般来说,DAS是最直接最简单的组网技术,实现简单但是存储空间利用率和扩展性差,而NAS使用较为广泛,技术也相对成熟,SAN则是专为某些大型存储而定制的昂贵网络。RAIDRAID是廉价冗余磁盘阵列的简称,磁盘阵列是由很多价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。在具体介绍RAID之前,我们先了解一下相关概念。名词说明分区又称为Extent;是一个磁盘上的地址连续的存储块。一个磁盘可以划分为多个分区,每个分区可以大小不等,有时也称为逻辑磁盘。分块又称为Strip;将一个分区分成多个大小相等的、地址相邻的块,这些块称为分块。分块通常被认为是条带的元素。虚拟磁盘以它为单位将虚拟磁盘的地址映射到成员磁盘的地址。条带又称为Stripe;是阵列的不同分区上的位置相关的strip的集合,是组织不同分区上条块的单位。软RAIDRAID的所有功能都依赖于操作系统(OS)与服务器CPU来完成,没有第三方的控制/处理(业界称其为RAID协处理器――RAIDCo-Processor)与I/O芯片硬RAID有专门的RAID控制/处理与I/O处理芯片,用来处理RAID任务,不需耗用主机CPU资源,效率高,性能好。RAIDRAID可以细分为:RAID0、RAID1、RAID3、RAID5、RAID6、RAID10、RAID50。1)RAID0RAID0以条带形式将RAID阵列的数据均匀分布在各个阵列中,没有磁盘冗余,一个磁盘失败导致数据丢失,所示,总容量=(磁盘数量)*(磁盘容量)。优点可多I/O操作并行处理,极高的读写效率速度快设计、使用与配置简单缺点无冗余不能用于关键数据环境RAID2)RAID1RAID1以镜像作为冗余手段,虚拟磁盘中的数据有多个拷贝,放在成员磁盘上,具有100%的数据冗余,但磁盘空间利用率只有50%,所以,总容量=(磁盘数量/2)*(磁盘容量)。优点理论上读效率是单个磁盘的两倍;100%的数据冗余;设计、使用简单缺点ECC((错误检查与纠正))效率低下,磁盘ECC的CPU占用率是所有RAID等级中最高的,成本高;软RAID方式下,很少能支持硬盘的热插拔;空间利用率只有1/2RAID3)RAID3以xor校验为冗余方式,使用专门的磁盘存放校验数据,虚拟磁盘上的数据块被分为更小的数据块并行传输到各个成员物理磁盘上,同时计算出xor校验数据存放到校验磁盘上。只有一个磁盘损坏的情况下,RAID3能通过校验数据恢复损坏磁盘,但两个以上磁盘同时损坏情况下RAID3不能发挥数据校验功能。总容量=(磁盘数量-1)*(磁盘容量)。优点相对较高的读取传输率高可用性,如果有一个磁盘损坏,对吞吐量影响较小高效率的ECC操作缺点校验盘成为性能瓶颈每次读写牵动整个组,每次只能完成一次I/ORAID4)RAID5以XOR检验为冗余方式,校验数据均匀分布在各个数据磁盘上,对各个数据磁盘的访问为异步操作,RAID5相对于RAID3改善了校验盘的瓶颈,总容量=(磁盘数-1)*(磁盘容量)。优点高读取速率中等写速率缺点异或校验影响存储性能磁盘损坏后,重建很复杂RAID5)RAID6RAID6能够允许两颗磁盘同时失效的RAID级别系统,其总容量=(磁盘数-2)*(磁盘容量)。优点快速的读取性能更高的容错能力缺点很慢的写入速度成本更高RAID6)RAID10RAID10(镜像阵列条带化)将镜像和条带组合起来的组合RAID级别,最低一级是RAID1镜像对,第二级为RAID0。其总容量=(磁盘数/2)*(磁盘容量)。优点高读取速率高写速率,较校验RAID而言,写开销最小至多可以容许N个磁盘同时损坏(2N个磁盘组成的RAID10阵列)缺点贵只有1/2的磁盘利用率RAID7)RAID50RAID50将镜像和条带组合起来的组合RAID级别,最低一级是RAID5镜像对,第二级为RAID0。其总容量=(磁盘数-1)*(磁盘容量)。优点比单个RAI5容纳更多的磁盘比单个RAID5有更好的读性能至多可以容许n个磁盘同时损坏(N个RAID5组成的RAID50阵列)比相同容量的单个RAID5重建时间更短缺点比较难实现同一个RAID5组内的两个磁盘损坏会导致整个RAID50阵列的失效RAID级别比较
需要根据具体的应用情况决定使用那种RAID级别,各种级别的比较如表所示项目RAID0
RAID1RAID10
RAID5
、RAID3RAID6最小配置12434性能HighestLowestRAID5<RAID10<RAID0RAID1<RAID5<RAID10RAID6<RAID5<RAID10特点无容错最佳的容错最佳的容错提供容错提供容错磁盘利用率100%50%50%(N-1)/N(N-2)/N描述
不带奇偶效验的条带集磁盘镜像RAID0与RAID1的结合带奇偶效验的
条带集双校验位其中RAID3与RAID5的区别为:RAID3更适合于顺序存取,RAID5更适合于随机存取。需要根据具体的应用情况决定使用那种RAID级别。磁盘热备
所谓热备份(简称为热备)是在建立RAID磁盘阵列系统的时候,将其中一个磁盘指定为热备磁盘,此热备磁盘在平常并不操作,当阵列中某一磁盘发生故障时,热备磁盘便取代故障磁盘,并自动将故障磁盘的数据重构在热备磁盘上。热备盘可分为以下两种:全局热备盘:针对整个磁盘阵列,对阵列中所有RAID组起作用局部热备盘:只针对某一RAID组起作用。
磁盘热备的主要过程1)由5个磁盘组成RAID5,4个数据盘,1个热备盘存储校验条带集,热盘平时不参与计算。2)某个时刻某个数据盘损坏,热备盘根据校验集开始自动重构。3)热备盘重构结束,加入RAID5代替损坏磁盘参与计算。4)替换新的磁盘,热备盘进行COPYBACK复制。5)热备盘复制完成后,重新建立校验集。RAID5setofdrives:4active,1hot-spareCOPYBACK完成某个磁盘损坏,重构过程开始重构过程结束,RAID5可靠性恢复冗余插入新磁盘,COPYBACK开始逻辑卷快照(snapshot)DEAC快照是某一个时间点上的逻辑卷的映像,逻辑上相当于整个BaseVolume的拷贝用途(利用少量存储空间保存原始数据的备份)文件、逻辑卷恢复备份、测试、数据分析等基本概念:BaseVolume:快照源卷RepositoryVolume:快照仓储卷,保存快照源卷在快照过程中被修改以前的数据SnapshotVolume:快照卷某一个时间点的逻辑卷映像:逻辑上相当于整个BaseVolume的拷贝可将SanpshotVolume分配给任何一台主机SnapshotVolume可读取、写入或拷贝存储空间需求需要相当于BaseVolume20%的额外空间快照过程1)首先保证源卷和仓储卷的正常运行2)快照开始时源卷是只读的,快照卷对源卷3)快照完成,控制器释放对源卷的写权限,我们可以对源卷进行写操作,快照是一些指向源卷数据的指针。4)当源卷数据发生改变时,首先在源卷的数据改变之前将原数据写入仓储卷上,并且将快照指针引导到仓储卷上,然后再对源卷数据进行修改。5)最后更新源卷数据,此时快照可以跟踪到更新之前的旧数据。数据分级存储概念数据分级存储:即把数据存放在不同类别的存储设备(磁盘、磁盘阵列、光盘库、磁带)中,通过分级存储管理软件实现数据实体在存储设备之间的自动迁移;根据数据的访问频率、保留时间、容量、性能要求等因素确定最佳存储策略,从而控制数据迁移的规则。优点最大限度地满足用户需求减少总体存储成本性能优化改善数据可用性数据迁移对应用透明在线(On-line)存储:指存储设备和所存储的数据时刻保持“在线”状态,可供用户随意读取,满足计算平台对数据访问的速度要求近线(Near-line)存储:主要定位于客户在线存储和离线存储之间的应用,将那些不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上,但同时对这些设备要求是寻址迅速、传输率高,需要的存储容量相对较大。离线(Off-line)存储:对在线存储数据的备份,以防范可能发生的数据灾难。提纲存储基础知识云存储概念与技术原理对象存储技术存储技术趋势云存储概念关于云存储的定义,目前没有标准。云存储一般包含两个含义:1)云存储是云计算的存储部分,即虚拟化的、易于扩展的存储资源池。用户通过云计算使用存储资源池,但不是所有的云计算的存储部分都是可以分离的。2)云存储意味着存储可以作为一种服务,通过网络提供给用户。用户可以通过若干种方式(互联网开放接口、在线服务等)来使用存储,并按使用(时间、空间或两者结合)付费。从技术层面看,目前业界普遍认为云存储的两种主流技术解决方案:基于虚拟化技术和分布式存储。分布式存储从技术特征上看,分布式存储主要包括以下四种:分布式块存储分布式文件存储分布式对象存储分布式表存储块存储技术块存储将存储区域划分成固定大小的小块,是传统裸存储设备的存储空间对外暴露方式。块存储系统将大量磁盘设备通过SCSI/SAS或FCSAN与存储服务器连接,服务器直接通过SCSI/SAS或FC协议控制和访问数据。块存储方式不存在数据打包/解包过程,可提供更高的性能。系统目标:为现有各种应用提供通用的存储能力在云计算环境下,块存储设备面临着分布式环境数据块数据块数据块数据块数据块存储节点2数据块数据块数据块数据块数据块存储节点1索引节点直接索引1直接索引2直接索引3直接索引4直接索引5直接索引6目录索引目录索引数据块数据块数据块数据块存储节点传统设备的块存储面向的是单一的物理设备块存储技术块存储主要包括DAS和SAN两种存储方式直接附加存储DAS以主机为中心,将外部的数据存储设备通过SISC/IDE/ATA等I/O总线直接连接到服务器上,使数据存储设备是服务器结构一部分SAN采用块数据组织,通过可伸缩的高速专用存储网络互连不同类型的存储设备和服务器,提供内部任意节点间多路可选择的数据交换。应用服务器文件系统SCSI,FCJBOD应用服务器文件系统光纤交换机RAIDRAID块存储技术优点缺点DAS设备成本低廉,实施简单通过磁盘阵列技术,可将多块硬盘在逻辑上组合成一块硬盘,实现大容量的存储不能提供不同操作系统下的文件共享存储容量受限I/O总线支持的设备数量服务器发生故障时,数据不可访问数据备份操作非常复杂SAN可实现大容量存储设备数据共享可实现高速计算机和高速存储设备的高速互联可实现数据高效快速集中备份建设成本和能耗高,部署复杂单独建立光纤网络,异地扩展比较困难互操作性差,数据无法共享元数据服务器会成为性能瓶颈适用场景DAS服务器在地理分布上很分散,通过SAN或NAS在它们之间进行互连非常困难既要求数据的集中管理,又要求最大限度的降低数据的管理成本许多数据库应用和应用服务器在内的应用,它们需要直接连接到存储器上SAN与其它计算资源紧密集群来实现远程备份和档案存储过程磁盘镜像、备份与恢复、档案数据的存档和检索、存储设备间的数据迁移以及网络中不同服务器间的数据共享等用于合并子网和网络附接存储系统分布式文件存储文件存储以标准文件系统接口形式向应用系统提供海量非结构化数据存储空间。分布式文件系统把分布在局域网内各个计算机上的共享文件夹集合成一个虚拟共享文件夹,将整个分布式文件资源以统一的试图呈现给用户。它对用户和应用程序屏蔽各个节点计算机底层文件系统的差异,提供用户方便的管理资源的手段或统一的访问接口。分布式文件系统的出现很好的满足互联网信息不断增长的需求,并为上层构建实时性更高,更易使用的结构化存储系统提供有效的数据管理的支持。在催生了许多分布式数据库产品的同时,也促使分布式存储技术不断的发展和成熟。技术特点提供NFS/CIFS/POSIX等文件访问接口协议开销较高、响应延迟较块存储长应用系统跟存储系统的耦合程度中等存储能力和性能水平扩展适用场景适合TB~PB级文件存储,可支持文件频繁修改和删除。例如图片、文件、视频、邮件附件、MMS的存储海量数据存储及系统负载的转移文件在线备份文件共享传统分布式文件系统NAS技术特点应用服务器以太网交换机文件系统RAID文件系统RAID网络附加存储NAS是一种文件网络存储结构,通过以太网及其他标准的网络拓扑结构将存储设备连接到许多计算机上,建立专用于数据存储的存储内部网络文件协议支持NFS和CIFS网络文件协议连接方式百兆/千兆以太网主要功能细颗粒度数据共享及跨平台文件共享存储扩展高达数百TB,不停机适用场景商业或企业级数据共享;高性能计算或技术计算优点易于管理,节约成本缺点系统(包括存储容量和性能)扩展性差以SUN-Lustre文件系统为例,它只对数据管理器MDS提供容错解决方案。Lustre推荐OST(对象存储服务器)节点采用成本较高的RAID技术或SAN存储区域网络来达到容灾的要求,但Lustre自身不能提供数据存储的容灾,一旦OST发生故障就无法恢复,因此对OST的可靠性就提出了相当高的要求,大大增加了存储的成本,这种成本的投入会随着存储规模的扩大线性增长。对象存储技术对象存储为海量非结构化数据提供Key-Value这种通过键-值查找数据文件的存储模式,提供了基于对象的访问接口,有效地合并了NAS和SAN的存储结构优势,通过高层次的抽象具有NAS的跨平台共享数据和基于策略的安全访问优点,支持直接访问具有SAN的高性能和交换网络结构的可伸缩性。对象存储成为云存储技术的新热点技术特点访问接口简单,提供REST/SOAP接口协议开销高、响应延迟较文件存储长引入对象元数据描述对象特征应用系统跟存储系统的耦合程度松散支持一次写多次读对象存储技术对象是介于文件和块之间的一种抽象,具有唯一的ID标识符。对象提供类似文件的访问方法,如创建、打开、读写和关闭等。每个对象是一系列有序字节的集合,是数据和数据属性集的综合体。数据包括自身的元数据和用户数据。数据属性可以根据应用的需求进行设置,包括数据分布、服务质量等。对象维护自己的属性,简化了存储系统的管理任务,增加了灵活性。对象分为根对象,组对象和用户对象。对象特点对象存储系统组成部分对象(Object):对象存储的基本单元对象存储设备(OSD):对象存储系统的核心文件系统:文件系统对用户的文件操作进行解释,并在元数据服务器和对象存储设备间通信,完成所请求的操作。元数据服务器(MDS):为客户端提供元数据网络连接:对象存储系统的重要组成部分。表存储技术表存储系统用来存储和管理结构化/半结构化数据,向应用系统提供高可扩展的表存储空间,包括交易型数据库和分析型数据库。NoSQL是设计满足超大规模数据存储需求的分布式存储系统,没有固定的Schema,不支持join操作,通过“向外扩展”的方式提高系统负载能力。系统目标:管理结构化数据或半结构化数据交易型分析型TB~PB级NoSQL存储日志详单类存储TB级OLTP关系数据库OLAP数据仓库交易型数据特点:每次更新或查找少量记录,并发量大,响应时间短分析型数据特点:更新少,批量导入,每次针对大量数据进行处理,并发量小分布式表存储技术特点适用场景NoSQL存储通常不支持SQL、只有主索引、半结构化大规模互联网社交网络、博客、微博等日志详单类存储兼容SQL、索引通常只对单表有效、多表Join需扫描,支持MapReduce并行计算大规模日志存储处理、信令系统处理、经分系统ETL等OLTP关系数据库支持标准SQL、多表join、索引、事务计费系统、在线交易系统等OLAP数据仓库支持标准SQL、多表Join、索引中等规模日志存储处理、经分系统等分布式表存储NoSQL数据库分类类型主要产品特点列存储HbaseCassandraHypertable顾名思义,是按列存储数据的。最大的特点是方便存储结构化和半结构化数据,方便做数据压缩,对针对某一列或者某几列的查询有非常大的IO优势。文档存储MongoDBCouchDB文档存储一般用类似json的格式存储,存储的内容是文档型的。这样也就有有机会对某些字段建立索引,实现关系数据库的某些功能。Key-Value存储TCabinet/TyrantBerkeleyDBMemcacheDBRedis可以通过key快速查询到其value。一般来说,存储不管value的格式,照单全收。(Redis包含了其他功能)图存储Neo4JFlockDB图形关系的最佳存储。使用传统关系数据库来解决的话性能低下,而且设计使用不方便。对象存储db4oVersant通过类似面向对象语言的语法操作数据库,通过对象的方式存取数据。XML数据库BerkeleyDBXMLBaseX高效的存储XML数据,并支持XML的内部查询语法,比如XQuery,Xpath。表存储适应场景典型NoSQL数据库适用场景数据库最佳适用适用场景Cassandra写操作较多,读比较少的时候。如果你的系统都是基于Java的时候主要应用场景包括:银行、金融行业、数据分析。应用于FacebookMongoDB主要支持海量数据存储,动态查询,定义索引,针对大数据库的高性能使用,大容量磁盘空间。适用于:网站数据、缓存、大尺寸,低价值的数据、高伸缩性的场景、用于对象及JSON数据的存储Redis在数据库大小可预见的前提下,适用于数据变化速度快的应用较小数据量的高性能操作和运算上,包括:股价系统、数据分析、实时数据采集以及实时通信场景CouchD对于数据变化不太频繁的业务,运行有预先定义的查询。此外对于版本控制有高要求的业务同样适用CRM、CMS系统等HBase类似于BigTable,需要随即、实时的读写大数据适合于非结构化数据存储的数据库,如:Facebook网站、邮件数据库等各种存储技术对比
分布式对象存储分布式文件存储块存储NoSQL存储存储单位对象,就是带客户化元数据的文件文件数据块文档更新方式不支持就地更新,通过建立新的对象版本进行更新支持就地更新支持就地更新很少更新协议通过HTTP的REST和SOAPCIFS和NFSSCSI,FiberChannel和SATAApache协议,HTTP/REST元数据支持支持客户化元数据固有的文件系统属性固有的系统属性固有的文件系统属性最佳应用场景相对静态的文件数据和云存储共享文件数据交易数据和频繁变化的数据非关系型数据存储,适用于海量数据存储和OLAP的应用场景最大优势扩展性和分布式访问简单的共享文件访问和管理高性能易扩展、灵活的数据模型、高可用、大数据量,高性能制约因素不适合频繁变化的交易数据;不提供基于锁机制的共享协议很难扩展到数据中心之外的范畴很难扩展到数据中心之外的范畴很难实现数据的完整性;缺乏强有力的技术支持等存储类型存储类型分布式文件存储对象存储直接附加存储DAS块存储表存储存储域网络SANIPSANFCSAN网络附加存储NAS日志详单类存储NoSQL存储Google文件系统GFSHadoop分布式文件系统OLTP关系数据库OLAP数据仓库BC-oNestAmazonS3BigTableHBaseSwiftCassandraMongodb存储虚拟化企业用户面对日益复杂的异构平台,不同厂商的产品,不同种类的存储设备,给存储管理带来诸多难题。数据应用已不再局限于某一企业和部门,而分布于整个网络环境。系统整合、资源共享、简化管理、降低成本以及自动存储将成为信息存储技术的发展要求。存储虚拟化技术(StorageVirtualization)是解决这些问题的有效手段,现成为信息存储技术的主要发展方向。随着网络存储的飞速发展给存储虚拟化赋予了新的内涵。使之成为共享存储管理中的主流技术。
存储虚拟化的基本原理是:把多个存储介质模块(如硬盘、磁盘、磁带)通过一定手段集中管理,把不同接口协议(如SCSI,iSCSI或FC等)的物理存储设备(如JBOD,RAID和磁带库等)整合成一个虚拟的存储池,根据需要为主机创建和提供虚拟存储卷。即把不同存储硬件抽象出来,以管理工具来实现统一的管理,不必再管后端的介质到底是什么。存储虚拟化
虚拟化的目的主要有三个:抽象,隐藏,隔离。存储虚拟化的目的是为了提高设备使用效率,统一数据管理功能,设备构件化,降低管理难度,提高可扩展性,数据跨设备流动,其技术如下图所示。从系统的观点看,存储虚拟化有3种途径:基于主机的存储虚拟化、基于网络的存储虚拟化、基于存储设备的存储虚拟化。基于主机的存储虚拟化
基于主机的虚拟存储依靠于代理软件,它们安装在一个或多个主机上,实现存储虚拟化的控制和治理。它的实现方式一般由操作系统下的逻辑卷管理软件完成(安装客户端软件),不同操作系统的逻辑卷管理软件也不相同。优点支持异构的存储系统缺点:占用主机资源,降低应用性能存在操作系统和应用的兼容性问题导致主机升级、维护和扩展非常复杂,而且容易造成系统不稳定性需要复杂的数据迁移过程,影响业务连续性。基于网络的存储虚拟化
基于网络的虚拟化方法是在网络设备之间实现存储虚拟化功能,它将类似于卷管理的功能扩展到整个存储网络,负责管理Host视图、共享存储资源、数据复制、数据迁移及远程备份等,并对数据路径进行管理避免性能瓶颈。它的实现方式通过在存储域网(SAN)中添加虚拟化引擎实现。优点与主机无关,不占用主机资源能够支持异构主机、异构存储设备使不同存储设备的数据管理功能统一构建统一管理平台,可扩展性好缺点:部分厂商数据管理功能弱,难以达到虚拟化统一数据管理的目的部分厂商产品成熟度较低,仍然存在和不同存储和主机的兼容性问题。基于存储设备的存储虚拟化
基于存储设备的存储虚拟化方法依赖于提供相关功能的存储模块,它的实现方式是,在存储控制器上添加虚拟化功能(虚拟化引擎)。优点与主机无关,不占用主机资源数据管理功能丰富。缺点:一般只能实现对本设备内磁盘的虚拟化不同厂商间的数据管理功能不能互操作多套存储设备需配置多套数据管理软件,成本较高。存储虚拟化技术对比
不同的存储虚拟化技术都有其适用场景和优势,下表给出了三种存储虚拟化技术各种特性的对比。比较内容基于主机基于存储设备基于网络存储视图一致性差好好单点管理否是是主机是否安装管理软件需要不需要不需要独立于主机或存储设备非独立非独立独立统一存储池是是是存储分配灵活性差好好性能差差好SAN扩展性差好好SAN高可用性差好好SAN安全性差好好相对价格低高中应用案例多少少主要用途使服务器的存储空间可以跨越多个异构存储阵列,常用于在不同磁盘阵列之间做数据镜像保护异构存储系统整合和统一数据管理(如容灾备份)异构存储系统整合和统一数据管理(如容灾备份)适用场景主机已采用SF卷(即Storage
Foundation,一种磁盘管理工具)管理,需要新接多台存储设备;存储系统中包含异构阵列设备;业务持续能力与数据吞吐要求较高系统中包括自带虚拟化功能的高端存储设备与若干需要利旧的中低端存储系统包括不同品牌和型号的主机与存储设备;对数据无缝迁移及数据格式转换有较高时间保证提纲存储基础知识云存储概念与技术原理对象存储技术存储技术趋势传统块存储与对象存储在传统的存储系统中用文件或块作为基本的存储单位,块设备要记录每个存储数据块在设备上的位置;而在对象存储系统中,对象是数据存储的基本单元,Object维护自己的属性,从而简化了存储系统的管理任务,增加了灵活性,在存储设备中,所有对象都有一个对象标识,通过对象标识OSD命令访问该对象。对象存储架构对象存储的核心是将数据通路(数据读或写)和控制通路(元数据)分离,并且基于对象存储设备(Object-basedStorageDevice,OSD)构建存储系统,每个对象存储设备具有一定的智能,能够自动管理其上的数据分布。对象存储结构由对象、对象存储设备、元数据服务器、对象存储系统的客户端四部分组成。对象的组成对象是系统中数据存储的基本单位,每个Object是数据和数据属性集的综合体,数据属性可以根据应用的需求进行设置,包括数据分布、服务质量等。对象基本存储单元名字空间:对象ID数据元数据元数据类似于inode,描述了对象在磁盘上的块分布属性根据需要而定义E.g.多媒体对象的延迟和吞吐请求因此,对象存储就是实现对象具有高性能、高可靠性、跨平台以及安全的数据共享的存储体系,是块和文件之外的存储形式对象(Object)包含了文件数据以及相关的属性信息,可以进行自我管理对象存储结构
传统的访问层次和虚拟数据访问模型对象存储系统组成
对象(Object)包含了文件数据以及相关的属性信息,可以进行自我管理OSD(Object-basedStorageDevice)一个智能设备,是Object的集合文件系统文件系统运行在客户端上,将应用程序的文件系统请求传输到MDS和OSD上元数据服务器(MetadataServer,MDS)系统提供元数据、Cache一致性等服务网络连接网络连接是对象存储系统的重要组成部分。它将客户端、MDS和OSD连接起来,构成了一个完整的系统对象的分类OSD(Object-basedStorageDevice)
每个OSD都是一个智能设备,具有自己的存储介质、处理器、内存以及网络系统等,负责管理本地的Object,是对象存储系统的核心。OSD同块设备的不同不在于存储介质,而在于两者提供的访问接口。OSD的主要功能包括数据存储和安全访问。目前国际上通常采用刀片式结构实现对象存储设备。OSD的主要功能
OSD提供三个主要功能:(1)数据存储。OSD管理对象数据,并将它们放置在标准的磁盘系统上,OSD不提供块接口访问方式,Client请求数据时用对象ID、偏移进行数据读写。(2)智能分布。OSD用其自身的CPU和内存优化数据分布,并支持数据的预取。由于OSD可以智能地支持对象的预取,从而可以优化磁盘的性能。(3)每个对象元数据的管理。OSD管理存储在其上对象的元数据,该元数据与传统的inode元数据相似,通常包括对象的数据块和对象的长度。而在传统的NAS系统中,这些元数据是由文件服务器维护的,对象存储架构将系统中主要的元数据管理工作由OSD来完成,降低了Client的开销。OSD功能说明:OSD使用Object对所保存的数据进行管理。它将数据存放到磁盘的磁道和扇区,将若干磁道和扇区组合起来构成Object,并且通过此Object向外界提供对数据的访问。每个Object同传统的文件相似,使用同文件类似的访问接口,包括Open、Read、Write等。但是两者并不相同,每个Object可能包括若干个文件,也可能是某个文件的一部分,且是独立于操作系统的。除了具体的用户数据外,OSD还记录了每个Object的属性信息,主要是物理视图信息。将这些信息放到OSD上,大大减轻了元数据服务器的负担,增强了整个存储系统的并行访问性能和可扩展性。如图显示了OSD的作用。文件系统
文件系统对用户的文件操作进行解释,并在元数据服务器和OSD间通信,完成所请求的操作。现有的应用对数据的访问大部分都是通过POSIX文件方式进行的,对象存储系统提供给用户的也是标准的POSIX文件访问接口。接口具有和通用文件系统相同的访问方式,同时为了提高性能,也具有对数据的Cache功能和文件的条带功能。同时,文件系统必须维护不同客户端上Cache的一致性,保证文件系统的数据一致元数据服务器(MetadataServer)
MDS控制Client与OSD对象的交互,主要提供以下功能:(1)对象存储访问:MDS构造、管理描述每个文件分布的视图,允许Client直接访问对象。MDS为Client提供访问该文件所含对象的能力,OSD在接收到每个请求时将先验证该能力,然后才可以访问。(2)文件和目录访问管理:MDS在存储系统上构建一个文件结构,包括限额控制、目录和文件的创建和删除、访问控制等。(3)ClientCache一致性:为了提高Client性能,在对象存储系统设计时通常支持Client方的Cache。由于引入Client方的Cache,带来了Cache一致性问题,MDS支持基于Client的文件Cache,当Cache的文件发生改变时,将通知Client刷新Cache,从而防止Cache不一致引发的问题。对象存储与传统存储的对比存储接口存储系统优点缺点块级存储块块存储设备如:SAN,提供高性能的随机I/O和数据吞吐率可扩展性和可管理性较差、价格较高、不能满足成千上万CPU规模的系统文件储存文件块存储设备+文件系统如:NAS,扩展性好、易于管理、价格便宜开销高、带宽低、延迟大,不利于高性能集群中应用对象存储对象块存储设备+文件系统+定位逻辑+应用程序支持高并行性、可伸缩的数据访问,管理性好、安全性高、适合高性能集群使用处于发展阶段,相应的硬件、软件支持有待进一步完善基于Hadoop构建对象存储系统系统组成:对象访问接口层(AccessEdge)、对象元数据存储层(MetaDataStorage)、对象实体数据存储(DataNode)和归档管理(ArchiveManagement)59基于Hadoop构建对象存储系统HDFS上的对象数据存储:为了减少HDFS中小文件的数据,将小的对象文件和归档文件归档。60基于Hadoop构建对象存储系统桶的创建和删除61基于Hadoop构建对象存储系统对象的创建62基于Hadoop构建对象存储系统对象的删除63基于Hadoop构建对象存储系统小文件的归档管理:主要由周期性执行的MapReduce任务完成64提纲存储基础知识云存储概念与技术原理对象存储技术存储技术趋势存储技术趋势存储技术趋势包括以下几个方面:1)存储虚拟化2)固态硬盘SSD3)重复数据删除4)语义化检索5)存储智能化6)混合存储系统7)软件定义存储SDS存储技术趋势1)存储虚拟化存储虚拟化是目前以及未来的存储技术热点,目前最新的存储虚拟化技术有自动分级存储(HSM)、自动精减配置(Thinprovision)、云存储(Cloudstorage)、分布式文件系统(Distributedfilesystem),另外还有诸如动态内存分区、SAN和NAS虚拟化。2)语义化检索数据检索目前主要分为两类,一是基于文件名,二是基于文件
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国电力电子元件行业发展分析及发展趋势研究报告
- 2025-2030中国生物芯片行业发展趋势与投资战略研究报告
- 2025-2030中国生物活性肽行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国生物可吸收骨螺钉行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国生物人工胰腺行业市场发展趋势与前景展望战略分析研究报告
- 2025-2030中国生啤酒分配器行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国瑞士车床行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国环卫清洁设备行业发展分析及发展趋势预测与投资风险研究报告
- 2025-2030中国环保卫生巾市场销售规模及未来需求量预测研究报告
- 2025-2030中国特殊胺行业市场发展趋势与前景展望战略研究报告
- 人教版小学数学五年级下册《同分母分数加减法》课件
- 个人业绩相关信息采集表
- 模具维护保养记录表
- 003-04-PFMEA第五版表格模板-(带实例)-2020.2.3
- 电大行政管理毕业论文细谈我国选人用人机制存在的问题及对策
- 260吨汽车吊地基承载力验算
- 加气站罩棚专项施工方案
- 桂美2011版三年级美术下册《折折剪剪》说课稿
- 托玛琳专业知识教学课件
- 部编版八年级语文下册《时间的脚印》评课稿
- 儿童绘画心理课件
评论
0/150
提交评论