存储入门必读-存储基础知识_第1页
存储入门必读-存储基础知识_第2页
存储入门必读-存储基础知识_第3页
存储入门必读-存储基础知识_第4页
存储入门必读-存储基础知识_第5页
已阅读5页,还剩133页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

存储入门必读一一存储基础知识

目录

第1章网络存储主要技术4

1.1NAS简介4

1.2SAN简介5

1.3NAS、SAN和DAS的区另U6

1.4SCSI访问控制原理介绍错误!未定义书签。

1.5NAS实现类型对比:统一式、网关式和横向扩展式(Scale-out)10

1.6智能存储系统概念解析12

1.7“大数据〃概念解析13

第2章主要协议和相关技术14

2.1SCSI访问控制原理介绍14

2.2FC协议详解16

2.3iSCSI协议20

2.4FCIP协议21

2.5iSCSI,FC和FCoE的比较23

2.6虚拟网络学习笔记之一:VXLAN24

2.7SMI-S协议简介25

第3章文件系统相关知识26

3.1什么是文件系统26

3.2CIFS27

3.3NFS27

3.4NFSv4新特性介绍28

3.5CIFS和NFS区别29

3.6存储系统与文件系统的关系30

3.7分布式文件系统发展史30

3.8Wireshark入门:第一次亲密接触34

3.9数据类型概念和应用场景39

第4章RAID技术详解39

4.1RAID类型介绍39

4.2磁盘寻址45

4.3如何计算磁盘性能47

4.4浅谈RAID写惩罚(WritePenalty)与IOPS计算48

4.5企业级闪存盘的结构和特征50

第5章数据复制与容灾51

5.1恢复时间目标(RT。)和恢复点目标(RP。)51

第6章备份技术52

6.1浅谈重复数据删除技术的风险和预防之策52

6.2NAS环境中的备份53

6.3制定备份策略需要考虑哪些因素?56

6.4关于数据消重技术(de-duplication)57

6.5备份系统的设计和备份技术的选择57

6.6LTO线性磁带开放技术简介62

6.7浅谈重复数据删除的实现64

6.8物理磁带库简介67

6.9备份和归档的区别68

6.10备份架构--三种基本备份拓扑70

6.11虚拟磁带库(VTL)简介72

第7章windows相关73

7.1磁盘分区对齐详解与配置-Windows篇73

7.2WindowsPerfmon与LinuxlOstat存储性能工具75

7.3Windows磁盘MBR结构详解-BasicDisk篇77

7.4Windows存储管理之磁盘结构详解78

7.5WindowsGPT磁盘GUID结构详解81

7.6存储SCSI锁解读:WindowsCluster篇84

7.7Windows扩展逻辑卷的操作方法85

第8章Linux相关86

8.1Linux存储管理基础:如何理解I/O?86

8.2AIX主机逻辑卷管理器(LVM)概念详解87

8.3磁盘分区对齐详解与配置-Linux篇90

8.4LinuxFC/iSCSI存储设备管理系列(一):Linux系统设备驱动入门93

8.5细数Linux发行版98

8.6逻辑卷管理器(LVM)概念解析102

第9章存储网络技术103

9.1SFP模块光信号强度知识介绍103

9.2SAN管理入门系列(三)Zone概念105

9.3SAN管理入门系列(四)VSAN和virtualfabric106

9.4SAN管理入门系列(八)NPIV技术107

9.5LinkAggregation(链路聚合)108

9.6SAN网络设计原则109

9.7存储区域网络(SAN)中各种缓存(Cache)技术的应用和比较111

9.87解FCoE的8个技术细节115

9.9FCoE与FCIP间的小同大异117

第10章存储I/O专栏118

10.1正确描述I/O类型118

10.2关于不同应用程序存储10类型的描述119

10.3数据库存储I/O类型分析与配置-SQLServer篇120

10.4浅析I/O处理过程与存储性能的关系122

第11章其它存储技术125

11.1云计算定义-NIST125

11.2PowerPath功能概览126

11.3SAS和SA1A的区别129

11.4软件定义的数据中心131

11.5论存储IOPS和Throughput吞吐量之间的关系132

11.6浅析闪存盘(FlashDrive)内部架构与应用考虑134

11.7云计算的三种模型:公有云、私有云和混合云135

第1章网络存储主要技术

1.1NAS简介

在20世纪80年代初,英国纽卡斯尔大学布赖恩.兰第尔教授(BrianRandell)和同事

通过“纽卡斯尔连接”成功示范和开发了在整套UNIX机器上的远程文件访问。继“纽卡斯

尔连接”之后,1984年Sun公司发布了NFS协议,允许网络服务器与网络客户分享他们的

存储空间。90年代初Auspex工程师创建了集成的NetApp文件管理器,它支持windowsCIFS

和UNIXNFS协议,并有卓越的可扩展性和易于部署,从此市场有了专用NAS设备。在短短

几年中,NAS凭借简便高效应用的中心思想,逐渐成为网络数据存储方案的主打设备之一。

目前EMC公司Celerra产品拥有优异的性能及多功能性,在全球NAS市场处于领导地位。

NAS概念

NAS(Network-AttachedStorage,网络附加存储)是指连接到计算机网络的文件级别

计算机数据存储,可以为不同客户端提供数据存取。

NAS被定义为一种特殊的专用数据存储服务器,包括存储器件(一个或多个硬盘驱动器

的网络设备,这些硬盘驱动器通常安排为逻辑的、冗余的存储容器或者RAID阵列)和内嵌

系统软件,可提供跨平台文件共享功能。NAS通常在一个LAN上占有自己的节点,无需应用

服务器的干预,允许用户在网络上存取数据,在这种配置中,NAS集中管理和处理网络上的

所有数据,将负载从应用或企业服务器上卸载下来,有效降低总拥有成本,保护用户投资。

PubicData

PubbcData

PubbcDatoNFSOimt

NAS本身能够支持多种协议(如NFS、CIFS、FTP、HTTP等),而且能够支持各种操作

系统。NAS是真正即插即用的产品,并且物理位置灵活,可放置在工作组内,也可放在混合

环境中,如混合了Unix/Windows局域网的环境中,而无需对网络环境进行任何的修改。NAS

产品直接通过网络接口连接到网络上,只需简单地配置一下IP地址,就可以被网络上的用

户所共享。

NAS特点

与采用存储区域网络(SAN-StorageAreaNetwork)的方案比较,采用网络附加存储

(NAS-Network-AttachedStorage)结构的方案具有以下特点:

1.以网络为中心,开放的标准协议支持

区别于存储区域网络(SAN)的设计方案,网络接入存储(NAS)的模式以网络为中心。该方

案利用现有的以太网网络资源来接入专用的网络存储设备,而不是另外再部署昂贵的光纤交

换机网络来连接传统的存储设备,这样保护了用户对以太网的投资。

近年来,千兆以太网的传输带宽(1000Mbps,为125MB/S)已经得到普及,并且有望朝万

兆以太网发展。届时,以太网的传输带宽将会是10倍于SAN赖以生存的各种SCSI和Fiber

Channel协议的传输带宽。EMC公司Celerra产品支持目前最流行的TCP/IP网络协议,而使

用的NFS和CIFS文件服务协议也是业界标准协议,充分做到设备的兼容性。

2.独立的操作系统

Celerra的DART操作系统具备自主知识产权,专注于文件系统的传输。该操作系统功

能强大,性能优越,保证了文件系统高速可靠的传输。Celerra后端通过SAN网络连接后端

存储设备,拥有多条链路冗余,避免单点故障,保障了数据安全性。月户的数据只要保存一

个拷贝,即可被前端的各种类型的主机所使用,因此,具备主机无关性。Celerra的DART

操作系统对于不同操作系统Unix和Windows同样保证了数据共享,并且各自的访问权限亦

可得到相应的保证。

3.安装及管理简便

NAS无需服务器直接上网,而是采用面向用户设计的、专门用于数据存储的简化操作系

统,内置了与网络连接所需的协议,整个系统的管理和设置较为简单,Celerra只要现有的

网络具有空闲的网口,在无需关机的情况下,即可提供给前端不同类型主机进行访问,无需

在主机上安装任何的软硬件。

4.NAS底层协议

NAS采用了NFS(Sun)沟通Unix阵营和CIFS沟通NT阵营,这也反映了NAS是基于操

作系统的“文件级”读写操作,访问请求是根据“文件句柄+偏移量”得出。

由于NAS以上诸多优点及良好的兼容性,笔者相信NAS未来将会得到更加广泛的应用。

1.2SAN简介

SAN(StorageAreaNetwork的简称)直译过来就是存储区域网络,它采用光纤通道

(FibreChannel)技术,通过光纤通道交换机连接存储阵列和服务器主机,建立专用于数据

存储的区域网络。SAN网络存储是一种高速网络或子网络,SAN存储系统提供在计算机与存

储系统之间的数据传输。一个SAN网络由负责网络连接的通信结构、负责组织连接的管理层、

存储部件以及计算机系统构成,从而使SAN技术保证数据传输的安全性和力度,SAN具有以

下几点优势:

1.SAN的可扩展性意味着你有少数的磁盘不受连接到系统上的限制。SAN可以增长到数百个

磁盘,但是普通物理服务器的极限只有十几个。

2.SAN的性能不会受到以太网流量或本地磁盘访问量的制约。数据通过SAN从自己的私有网

络传送,隔开用户流量、备份流量和其他SAN流量。

3.在正确的配置环境下,SAN数据被区域划分。用户保存数据的分区和其他人处在同样的区

域隔离就如同将UNIX服务器和Windows服务器连接到相同的SAN上,但这两种服务器上的

数据访问是不同的,事实上,Windows系统不能“看到“UNIX的数据,反之亦然。

4.SAN系统不需要重新启动就能添加新的磁盘,更换磁盘或配置RAID组。数据流完全避开

服务器系统,SAN同样增加了数据备份和恢复性能。

5.分区也可以在SAN上将你的工作负载分离。不仅是将你的数据分离保护,而且对那些影响

应用程序性能的不相关的工作负载采取屏蔽。在适当的区域应用SAN共享从性能上讲不是问

题。

6.SAN有个无可比拟的优势,就是存储连接距离为10公里距离(约6英里)。不是说你一定

会用到这个优势,但当你需要的时候,它就能显现出来。具有距离优势,可以将数据存储到

一个独立的位置,从系统服务中脱离出来。

7.在如SAN这样的存储网络上的自动精简配置的空间利用效率,要比本地存储的来得高。当

一个系统需要更多的存储资源时,SAN将动态分配资源。这意味着物理系统可以享受自动精

简配置,就像虚拟化那样。

1.3NAS、SAN和DAS的区别

目前磁盘存储市场上,存储分类(如下表一)根据服务器类型分为:封闭系统的存储和

开放系统的存储,封闭系统主要指大型机,AS400等服务器,开放系统指基于包括Windows、

UNIX.Linux等操作系统的服务器;开放系统的存储分为:内置存储和外挂存储;开放系统

的外挂存储根据连接的方式分为:直连式存储(Direct-AttachedStorage,简称DAS)和网络

化存储(Fabric-AttachedStorage,简称FAS);开放系统的网络化存储根据传输协议又分为:

网络接入存储(Network-AttachedStorage,简称NAS)和存储区域网络(StorageAreaNetwork,

简称SAN)。由于目前绝大部分用户采用的是开放系统,其外挂存储占有目前磁盘存储市场

的70%以上,因此本文主要针对开放系统的外挂存储进行论述说明。

表一:

存储分类

封闭系统的存储

「内置存储

开放系统的存储Direct-AttachedStorage

直连式存偌(DAS)Network-AttachedStorage

外挂存储•网络接入存储(NAS)

Fabric-AttachedStorage“

网络存储(FAS)StorageAreaNetwork

存储区域网络(SAN)

今天的存储解决方案主要为:直连式存储(DAS)、存储区域网络(SAN)、网络接入存储(NAS)。

如下表二:

今天的存储解决方案

ApplicationApplication

Application

FileSystemFileSystem

开放系统的直连式存储(Direct-AttachedStorage,简称DAS)已经有近四十年的使用历

史,随着用户数据的不断增长,尤其是数百GB以上时,其在备份、恢复、扩展、灾备等方

面的问题变得日益困扰系统管理员。

主要问题和不足为:

直连式存储依赖服务器主机操作系统进行数据的10读写和存储维护管理,数据备份和

恢复要求占用服务器主机资源(包括CPU、系统10等),数据流需要回流主机再到服务器连

接着的磁带机(库),数据备份通常占用服务器主机资源20-30%,因此许多企业用户的日常

数据备份常常在深夜或业务系统不繁忙时进行,以免影响正常业务系统的运行。直连式存储

的数据量越大,备份和恢复的时间就越长,对服务器硬件的依赖性和影响就越大。

直连式存储与服务器主机之间的连接通道通常采用SCSI连接,带宽为10MB/S.20MB/S.

40MB/S、80MB/S等,随着服务器CPU的处理能力越来越强,存储硬盘空间越来越大,阵列

的硬盘数量越来越多,SCSI通道将会成为10瓶颈;服务器主机SCSIID资源有限,能够建立

的SCSI通道连接有限。

无论直连式存储还是服务器主机的扩展,从一台服务器扩展为多台服务器组成的群集

(Cluster),或存储阵列容量的扩展,都会造成业务系统的停机,从而给企业带来经济损失,

对于银行、电信、传媒等行业7X24小时服务的关键业务系统,这是不可接受的。并且直连

式存储或服务器主机的升级扩展,只能由原设备厂商提供,往往受原设备厂商限制。

存储区域网络(StorageAreaNetwork,简称SAN)采用光纤通道(FibreChannel)技术,

通过光纤通道交换机连接存储阵列和服务器主机,建立专用于数据存储的区域网络。SAN经

过十多年历史的发展,已经相当成熟,成为业界的事实标准(但各个厂商的光纤交换技术不

完全相同,其服务器和SAN存储有兼容性的要求)。SAN存储采用的带宽从100MB/s、200MB/s,

发展至lj目前的lGbps、2Gbps,.

网络接入存储(Network-AttachedStorage,简称NAS)采用网络(TCP/IP、ATM.FDDI)

技术,通过网络交换机连接存储系统和服务器主机,建立专用于数据存储的存储私网。随着

IP网络技术的发展,网络接入存储(NAS)技术发生质的飞跃。早期80年代末到90年代初

的10Mbps带宽,网络接入存储,'乍为文件服务器存储,性能受带宽影响;后来快速以太网

(lOOMbps)^VLAN虚网、Trunk(EthernetChannel)以太网通道的出现,网络接入存储的读

写性能得到改善;1998年千兆以太网(1000Mbps)的出现和投入商用,为网络接入存储(NAS)

带来质的变化和市场广泛认可。由于网络接入存储采用TCP/IP网络进行数据交换,TCP/IP

是IT业界的标准协议,不同厂商的产品(服务器、交换机、NAS存储)只要满足协议标准

就能够实现互连互通,无兼容性的要求;并且2002年万兆以太网(10000Mbps)的出现和

投入商用,存储网络带宽将大大提高NAS存储的性能。NAS需求旺盛已经成为事实。首先

NAS几乎继承了磁盘列阵的所有优点,可以将设备通过标准的网络拓扑结构连接,摆脱了服

务器和异构化构架的桎梏。

其次,在企业数据量飞速膨张中,SAN、大型磁带库、磁盘柜等产品虽然都是很好的存

储解决方案,但他们那高贵的身份和复杂的操作是资金和技术实力有限的中小企业无论如何

也不能接受的。NAS正是满足这种需求的产品,在解决足够的存储和扩展空间的同时,还提

供极高的性价比。因此,无论是从适用性还是TCO的角度来说,NAS自然成为多数企业,

尤其是大中小企业的最佳选择。

NAS与SAN的分析与比较

针对I/。是整个网络系统效率低下的瓶颈问题,专家们提出了许多种解决办法。其中抓

住症结并经过实践检验为最有效的办法是:将数据从通用的应用服务器中分离出来以简化存

储管理。

问题:

应用服务器存储系妩

3

图1

由图1可知原来存在的问题:每个新的应用服务器都要有它自己的存储器。这样造成

数据处理复杂,随着应用服务器的不断增加,网络系统效率会急剧下降。

解决办法:

共享存储器

从图2可看出:将存储器从应用服务器中分离出来,进行集中管理。这就是所说的存

储网络(StorageNetworks)。

使用存储网络的好处:

统一性:形散神不散,在逻辑上是完全一体的。

实现数据集中管理,因为它们才是企业真正的命脉。

容易扩充,即收缩性很强。

具有容错功能,整个网络无单点故障。

专家们针对这一办法又采取了两种不同的实现手段,即NAS(NetworkAttachedStorage)

网络接入存储和SAN(StorageAreaNetworks)存储区域网络。

NAS:用户通过TCP/IP协议访问数据,采用业界标准文件共享协议如:NFS、HTTP、CIFS

实现共享。

SAN:通过专用光纤通道交换机访问数据,采用SCSI、FUAL接口。

什么是NAS和SAN的根本不同点?

NAS和SAN最本质的不同就是文件管理系统在哪里。如图:

图3

由图3可以看出,SAN结构中,文件管理系统(FS)还是分别在每一个应用服务器上;

而NAS则是每个应用服务器通过网络共享协议(如:NFS、CIFS)使用同一个文件管理系统。

换句话说:NAS和SAN存储系统的区别是NAS有自己的文件系统管理。

NAS是将目光集中在应用、用户和文件以及它们共享的数据上。SAN是将目光集中在磁

盘、磁带以及连接它们的可靠的基础结构。将来从桌面系统到数据集中管理到存储设备的全

面解决方案将是加

NASSAN0

1.4NAS实现类型对比:统一式、网关式和横向扩展式

(Scale-out)

NAS主要有三种类型的实现:统一式、网关式和横向扩展式(Scale-out),统一NAS使

用统一的存储平台将基于NAS和基于SAN的数据访问合并,提供了可以同时管理二种环境

的统一管理界面。网关NAS使用外部存储来存取数据,网关NAS和存储的管理操作是分开

的。横向扩展式(Scale-out)NAS可组合多个节点,形成一个集群NAS系统。本文将对比三

种不同NAS实现类型。

统一NAS提供文件服务,同时负责存储文件数据,并提供块数据访问。它支持用于文

件访问的CIFS和NFS协议,以及用于块级访问的SCSI和FC协议。因为基于NAS和基于SAN

的访问合并到同一个存储平台,统一NAS降低了企业的基础设施成本和管理成本。

统一NAS的一个系统中包括了一个或多个NAS头及存储。NAS头与存储控制器连接,

提供到存储的访问。存储控制器提供了与iSCSI和FC主机的连接。存储可使用不同的磁盘类

型(例如SAS、ATA、FC和闪存盘),以满足不同的负载需求。下图显示的是一个统一NAS

连接的例子。

网关式NAS

网关式NAS设备包含一个或多个NAS头,使用外部存储或者独立管理的存储。与统一

NAS相似,存储是与其他使用块级I/O的应用共享的。这种解决方案的管理功能比统一存储

复杂,因为NAS头和存储器的管理任务是分开的。网关式解决方案可以利用FC基础设施,

例如:交换机等,访问SAN存储阵列或直连式存储阵列。

网关式NAS的扩展性比统一NAS好,因为NAS头和存储阵列可以独立地根据需求进行

扩展升级。例如:可以通过增加NAS头的方式提升NAS设备的性能。当存储容量达到上限

时,网关NAS设备可以独立于NAS头对SAN进行扩展,增加存储容量。网关式NAS通过在

SAN环境中进行存储共享,提高了存储资源的利用率。下图显示的是一个网关式NAS连接

的例子。

NASGateway

ServersStorageAStorageBStorageC

横向扩展式(Scale-out)NAS

统一NAS和网关NAS实现都提供了一定的扩展性能,可以在数据增长和性能需求提高

时对资源进行扩展。对NAS设备进行扩展主要涉及增加CPU、内存和存储容量。扩展性受

制于NAS设备对后续增加NAS头和存储容量的支持能力。

横向扩展式(Scale-out)NAS可组合多个节点,形成一个集群NAS系统。只需要向集群

NAS架构中添加节点即可实现资源的扩展。整个集群可看作是一个NAS设备,资源是集中

管理的。在需要扩大容量或提高性能的时候,可向集群中添加节点,这不会造成停机下线的

情况。横向扩展NAS可以集合许多性能和可用性中等的节点,形成集群系统拥有更好的总

体性能和可用性。它还有易使用、陈本低以及理论上可无限扩展的优势。

横向扩展式(Scale-out)NAS在集群中的所有节点上创建了一个单一文件系统。节点的

所有信息都可以彼此共享,因此连接到任何节点的客户端都可以访问整个文件系统。集群

NAS将数据在所有节点间分条,同时使用镜像或效验方式进行数据保护。数据从客户端发送

到集群时,数据被分割,并行分配给不同节点。当客户端发送文件读取请求时,集群NAS

从多个节点获取相应的块,将他们组合成文件,然后将文件发给客户端。随着节点的增加,

文件系统实现动态扩展,数据在节点之间均衡分布。每个增加的节点都增加了整个集群的存

储、内存、CPU和网络能力。因此,整个集群的性能都得到提升。

横向扩展式(Scale-out)NAS适合解决企业和客户当前面临的大数据问题。它统一管理

和存储高速增长的数据,同时又十分灵活,能满足各种性能需求。下图显示的是一个横向扩

展式(Scale-out)NAS连接的例子。

Scale-outNAS

2node3node4node5&more

nodes

Capacity!

Podonrunce■

应用于:了解统一式、网关式和横向扩展式(Scale-out)NAS的概念和区别。

1.5智能存储系统概念解析

智能存储系统是配置了多块硬盘和大量内存,并提供多条I/O通路,拥有智能操作系统

的存储阵列。它采用复杂的算法来实现最优化的存储资源处理,以满足高性能需求的应用程

序。本文将介绍智能存储系统的组成部件。

一般来说,前端、缓存、后端和物理磁盘四部分构成一个智能存储系统。智能存储系统的数

据处理是为从主机发起的I/O请求到达前端端口开始,然后经过缓存。如果被请求的数据保

存在缓存中,那么读请求直接在缓存中完成。如果数据不在缓存中,则经过后端端口到物理

磁盘上读取数据。主机被写入数据经过前端端口,先写入缓存,然后经后端端口保存到物理

磁盘。

IntelligentStorageSystem

Host

前端

智能存储系统的前端由前端端口和前端控制器组成,它提供了存储系统和主机之间高可

用的连接端口。一个智能存储系统拥有多个前端端口,以实现大量主机同时对智能存储系统

的读写。不同的前端端口支持不同的传输协议,这些传输协议包括FC、FCoE和iSCSI等。前

端控制器通过内部数据总线将数据写入缓存或从缓存读取数据。

缓存

缓存可以通俗理解为内存,它可以减少主机I/O访问请求所需时间。缓存的最小单位是

页,缓存就是由页组成。应用I/O的大小决定了缓存页的大小。由于缓存没有寻道时间和旋

转延时,因此缓存的响应时间不到机械磁盘的十分之一,可以快速的处理大量数据或者实时

数据,大幅提升了智能存储系统的性能。

后端

智能存储系统的后端由后端端口和后端控制器组成,它提供了缓存和物理磁盘的连接端

口。一个智能存储系统可以拥有多个后端端口,这样可以提供更好的数据保护、负载均衡能

力和冗余性。数据从缓存通过后端端口传到物理磁盘,后端控制器为读写数据提供临时的数

据存储,并充当交流着的角色。

物理磁盘

物理磁盘的主要作用是保存数据。智能存储支持不同类型的物理磁盘,如:闪存盘、SATA

盘和SAS盘等。••般来说,闪存盘数据访问时间最快,SATA盘数据访问时间最慢,用户可

以根据不同应用类型配置不同类型的物理磁盘。

应用于:智能存储系统概念解析

1.6〃大数据〃概念解析

大数据是一个新提出的且在不断演化的概念,是指数据量超过了菖规软件工具在可接受

的时间内的抓取、存储、管理和处理能力。它即包括结构化数据,也包括非结构化数据。其

数据的来源多种多样,可以来自商务应用处理、网页、视频、图像和社交媒体等。这些数据

集通常需要实时地抓取和更新,以用于分析、预测性建模和决策等用途。

BigDataLandscape

VerticalAppsAd/MediaAppsBusinessAnalyticsand

IntelligenceVisualization

ORAO_€lHvoerion.--I-obIeou

LogDataApps(dlMETANAtKHS「

tHaoaott(BusinessIntelligenceAST»EMN

TURTI§sasBTBCaM-*■

CDChSQSnss?

panopticon

_DataAsAServiceAutonomy

__J3IESE3BBoiikGEBBDOplatforaI

SCT3m仙-hzux・皿2.士lawE

alteryxvisually

AnalyticsOperationalInfrastructureAsStructured

InfrastructureInfrastructureAServiceDaubases

Hort二等口CoucwsasalOgen工XCLG

doudera送递正,1二二二.WlndowsAzure

LM©GRtKNPLUM

Volt

NNBTBZZAkognitio

.•MarkLogicCINZfOZRZMZAZTZlCZA

GoogleBigQuory

Technologies

Hanse布公如也

copyri作©2oi2Feinieib/go/chinesebiop.fortesxom/davefe.nicib

从大数据中吸取价值存在很大的机遇。大数据的生态系统(如下图所示)由以下元素组成:

1、从多个位置收集数据,并从收集的数据中生成数据(元数据)的设备。

2、数据收集器,收集来自设备和用户的数据。

3、数据聚合工具,从收集的数据中吸取有意义的信息。

4、数据用户和买家,是指数据价值链中从他人收集或聚合的数据中收益的人群。

BigDataEcosystem

KPMG,Daloitto

Accenture,IBMGS

MlIBMrHP,

Ter>datnOracle,EMC.

fAtes,CapGemmi

Vmwarc,Equinix

Centric,TCS,

Int0nHOzone

SAF>SAS

IBM,CloudtraOmch.IBM

Orxh,Cisco,Dell,MicroStrategy

Fujitsu,HPQlikVIew

Microsoft.Salc^Forcc,

NetApp,DdlrEMC.EveryAncU

IBM,FujKw.

Hitachi

Facobook.Ooogh

IBM,SAROracle,Apple,Am^xor

HP,HortenWorks,

MArkLo^k,lOGen

/go/chinese

大数据的数据量、多样性、变化范围和复杂性超出了传统的IT设备和数据处理工具及

方法的处理能力。对大数据进行实时分析需要新的方法、架构和工具,以提供高性能、大规

模并行处理(MPP)数据平台和对数据集的复杂分析。

数据科学是一门新兴的学科,商业组织可以利用这门学科从大数据中获取商业价值。数

据科学是多门学科(统计学、数学、数据可视化和计算机科学)的综合。数据科学家的职责

是设计各种高级算法对海量数据进行分析,以寻找新的价值点,为更多的决策提供数据支持。

很多领域和市场已经开始利用数据科学,从大数据的分析中获益。其中包括医学与科学

研究、医疗医护、公共管理、欺诈检测、社交媒体、银行、保险公司,以及其他以数据为中

心的实体。

应用于:帮助用户了解大数据相关概念。

第2章主要协议和相关技术

2.1SCSI访问控制原理介绍

下面为大家介绍SCSI-2和SCSI-3访问控制原理。主要内容包括:SCSI-2

Reserve/Release/Reset和SCSI-3PersistentReserveIN/PersistentReserveOUT/PREEMPT以及

SCSI访问控制常见场景。

SCSI-2Reserve(预留)/Release(释放)/Reset(重置)

SCSI-2协议中客户端访问lun过程如下:

1、客户端向lun发起预留操作

2、预留操作成功后,客户端获得lun操作权限;预留失败,提示预留冲突,会继续尝试,

直到预留成功。

3、客户端操作完毕后,执行释放操作,其他客户端可以预留。

SCSI-2访问控制主要峡点有:

1、预留操作基于路径。预留和释放必须由相同的客户端完成,一台主机不能释放另外一台

主机的预留,同一主机HBA卡不能取消相同主机另外一块HBA的预留。

2、预留无法长久保留。主机重启将会丢失预留信息。

3、如果lun已经被预留,其他主机无法再预留。如果其他主机要想获得lun操作权限,必

须对lun进行重置,重置操作可能会导致数据丢失。重置后释放掉lun现有的预留,重置操

作由lun主动发起,原来预留主机并不知晓。

SCSI-3PersistentReserve(PR)/PREEMPT(抢占)

SCSI-3协议引入PGR(persistentgroupreservation)功能。在访问lun之前,客户端首先

向lun注册(registration)一个预裙密钥(reservationkey),注册成功后客户端可以尝试进行

永久预留(reserve),永久预留成功后就可以获得lun操作权限。预留密钥是一串16进制的

ASCII码,最长8个字节。永久预留一共6种类型,由1、3、5、6、7.8数字表示。包括两

种操作类型和三种客户类型,操作类型包括写排它和所有访问排他,客户类型包括所有客户

端、已注册客户端和所属客户端。数字与永久预留类型对应关系如下:

1->writeexclusive

3->exclusiveaccess

5->writeexclusive-registrantsonly

6->exclusiveaccess-registrantsonly

7->writeexclusive-allregistrants

8->exclusiveaccess-allregistrants.

不同注册类型对应不同访问权限。与SCSI-2不同,SCSI-3释放操作根据预留密钥。不同

客户端可以使用相同密钥或是不同密钥进行预留,具体可以结合永久预留类型决定。客户端

可以通过抢占来获取已被永久预留的lun访问权限。SCSL3抢占和SCSI-2重置不一样,抢占

不会造成数据丢失。

SCSI-3关于PGR相关操作命令分为两大类:分别是PRIN和PROUT,PRIN主要用于查询,

PROUT用于修改。SCSI命令执行过程中,需要明确该命令是哪种类型。

常见使用场景

集群I/OFencing

为了防止集群故障发生“脑裂”现象,2-节点集群可以通过SCSI-2Reseve/Release触发

I/Ofencing来保证整个集群正常运行,是SCSI-2不适用于多•节点集群,多•节点集群可以使

用SCSI-3PGR。主流厂商集群套件都己经支持SCSI-3PGR,比如:VCS、HACAMP、RHCS等。

2、集群文件系统

集群文件系统需要保证多节点同时访问存储时的数据一致性,SCSI-2/SCSI-3都可以满足,

当一个节点尝试访问一个已经被预留的存储就会产生访问权限冲突。SCSI-3PGR相比SCSI-2

Reserve/Release更能够减少访问权限冲突。

小结:SCSI-2具体基本访问控制能力,但是无法满足Active/Active多路径环境和集群多

节点访问存储的需求。SCSI-3通过引入客户端注册和操作权限分类概念,强化并行访问权限

控制,弥补SCSI-2的不足。

2.2FC协议详解

FC协议简介

开发于1988年,最早是用来提高硬盘协议的传输带宽,侧重于数据的快速、高效、可

靠传输。到上世纪90年代末,FCSAN开始得到大规模的广泛应用。

FC协议其实并不能翻译成光纤协议,只是FC协议普遍采用光纤作为传输线缆而不是铜

缆,因此很多人把FC称为光纤通道协议。在逻辑上,我们可以将FC看作是一种用于构造

高性能信息传输的、双向的、点对点的串行数据通道。在物理上,FC是一到多对应的点对

点的互连链路,每条链路终结于一个端口或转发器。FC的链路介质可以是光纤、双绞线或

同轴电缆。

FC协议栈

高层协议

SCSI-3ATM

IPI-3命令集映SCSI-3FC链路封装FC-ATM

FC4射(IPI-3STD)命令集映射FC-LE

FC-3通用服务

FC2结构协议光纤物理与信号接口FC-ALFC-AL-2

FC-1/解码(FC-PH,FC-PH2,

存8b/10b编码

FC-PH3)

FG0■物理变换铜,光连接

FC-0:连接物理介质的界面、电缆等;定义编码和解码的标准。

FC-1:传输协议层或数据链接层,编码或解码信号。

FC-2:网络层,光纤通道的核心,定义了帧、流控制、和服务质量等。

Fc-a:定义了常用服务,如数据加密和压缩△

FC-4:协议映射层,定义了光纤通道和上层应用之间的接口,上层应用比如:串行SCSI协议,

HBA卡的驱动提供了FC-4的接口函数。FC-4支持多协议,如:FCP-SCSI,FC-IP,FC-VL

光纤通道的主要部分实际上是FC-2。其中从FC-0到FC-2被称为FC-PH,也就是“物理层〃。

光纤通道主要通过FC-2来进行传输,因此,光纤通道也常被成为“二层协议”或者"类以太网

协议”。

在此重复:光纤通道并不是SCSI的替代;一般而言SCSI是光纤通道的上层。光纤通道

一般是指FC-PHY层:FC0-FC2。术语FCP,即光纤通道协议,是指对SCSI的界面协议或FC-4

层映射。我们这里讨论的是光纤通道的内在工作原理,而不是指光纤通道协议。

光纤通道的数据单元叫做帧。即使光纤通道本身就有几个层,大部分光纤通道是指第2

层协议。一个光纤通道帧最大是2148字节,而且光纤通道帧的头部匕起广域网的IP和TCP

来说有些奇怪。光线通道只使用一个帧格式来在多个层上完成各种任务。帧的功能决定其格

式。相比我们在IP世界中的概念,光纤通道帧格式是奇特而且奇妙的。

光纤通道帧起始于帧开始(SOF)标志,随后是帧头部,这个一会进行描述。数据,或

光纤通道内容,紧随其后,然后是帧结束(EOF)。这样封装的目的是让光纤通道可以在需

要时被其他类似于TCP的协议所承载。

FC协议交换方式

按照连接和寻址方式的不同,FC支持三种拓扑方式:

1.PTP(点对点):一般用于DAS(直连式存储)设置

N_PORT

人生

stomgconlincccnicti

服务器和存储设备在点对点的环境里都是N_PORT.通过一条上行一条下行两条通道进行数

据存储与读取。

2.FC-AL(光纤通道仲裁环路):采用FC-AL仲裁环机制,使用Token(令牌)的方式进行仲

裁。光纤环路端口,或交换机上的FL端口,和HBA上的NL端口(节点环)连接,支持环

路运行。采用FC-AL架构,当一个设备加入FC-AL的时候,或出现任何错误或需要重新设置

的时候,环路就必须重新初始化。在这个过程中,所有的通信都必须暂时中止。由于其寻址

机制,FC-AL理论上被限制在了127个节点。

L_PORT

FC-SW(FCSwitchedl交换式光纤通道):在交换式SAN上运行的方式。FC-SW可以按照任意

方式进行连接,规避了仲裁环的诸多弊端,但需要购买支持交换架构的交换模块或FC交换

机。

光纤信道(FC)中的基本实体是光纤信道网络,与一般分层网络不同的是,一个光纤信

道网络很大程度上由功能单元以及各单元间接口所指定,各部分组成如下:

N_PORTs-光纤信道流量终点;

FCDevices-N_PORT访问的光纤信道设备;

FabricPort-光纤网络接口,连接N_PORT;

在N_PORT间传输数据喷的网络结构;

交换结构或混合结构下的一组辅助服务器,包括支持设备发现和网络地址解析服务

的名称服务器。

主要的光纤信道网络拓扑组成如下所示:

ArbitratedLoop-N_PORTs以菊花链(daisy-chain)形式连接在一起;

SwitchedFabric-由交换单元组成的网络;

MixedFabric-由交换机和"fabric-attached"环路组成的网络。L_PORT将

loop-attachedN_PORT(NL.PORT)与环路连接起来,并且NL_PORT通过FL_PORT接入该

结构。

光纤通道的寻址方式

在数据中心网络中,光纤通道(FUFibreChannel)是通过WorldWideName(WWN)来

标识一个唯一的设备。WWN是一个64位的地址cWWN对于光纤通道设备就像Ethernet的

MAC地址一样都是全球唯一的,它们是由电器和电子工程协会(IEEE)标准委员会指定给制造

商,在制造时被直接内置到设备中去的。

IEEE定义生产Et义

NodeWWN:.约

生产EMIww宇科

PortVWVN:和:00^55:60:6勺柿:6o:oa|

数据中心天空

生产厂商逸贵的16*制字存

<tet»c«ntonkyxom

♦使用,或一个或¥个餐口:5nM根酩HBA卡

通常用NodeWWN来标示每台不同的FC交换机,它是唯一的;对于FC交换机的端口,

则使用PortWWPN来标示交换机的端口。所以一个交换机只有一个NodeWWN和多个

PortWWPNo根据IEEE标准定义,WWN的定义方式有三种,可以见《深度分析FC/FCOE

中WWN的类型定义》一文所述。

因为WWN的地址太长所以用这个地址来寻址的话会影响到路由的性能。这样光纤通道

网络采用了另外一种寻址方案。这种方案是用基于交换光纤网络中的光纤端口来寻址称为

FCID。基于交换光纤网络中的每个端口有一个唯一的24位的地址,FCID,这种FCID就类似

TCP/IP中的IP地址。用这种24位地址方案,这样得到了一个较小的帧头,这能加速路由

的处理。但是这个24位的地址必须通过某种方式连接到与WorldWideName相关联的64

位的地址。

在光纤通道(SAN)环境中,FC交换机它本身负责分配和维持端口地址。当有一个WWN

登录到交换机的某一个端口时,交换机将会为其分配一个FQD地址,同时交换机也将会创

建FCID和登录的WWN地址之间的关联关系表并维护他们的关系。交换机的这一个功能是

使用名字服务器(NAMESERVER)来实现的。

名字服务器其实是光纤操作系统的一个组件,在交换机内部运行。它本质上是一个对象

数据库,光纤设备在连接进来时,向该数据库注册它们的值这是一个动态的过程。动态的寻

址方式同时也消除了手工维护地址出错的潜在的可能,而且在移动和改变SAN方面也提供

了更多的灵活性。

数据中心天空

・动态堆址(8/24-ft)

•本地生成

・注册到光纤通道网路•花烧衣

-FC-AL3•-故(例0TW*)

sUJA比M

-FC-SW=24-ft

=修,。8,MOPabneMU

24•位N_PorVF_Pon可用范88

mr剧iFFf

一个24位的FCID地址由三个部吩所组成:Domain,Area,Port组成。

Domain(从23到16位)

Area(从15到08位)

Port或仲裁环物理地址・AL_PA(从07到00位)

Domain:端口地址中最重要的字节是Domain。这是标识交换机本身的地址。最多只能达到

256个地址。除了一些被保留使用的地址外,实际上只有239个地址可用。这意味着在你

的SAN环境中,所在在一个SAN网络中最多只可能达239个交换机。同时Domain可以

用来标识一个san网络一个FC交换机的唯一性。

Area:它提供256个地址。地址的这一个部份被用于识别个别的FL.Ports环,或它可能被用

于当做一组F_Port的识别符,例如,多端口的一个光纤卡的识别符。这意谓着每组端口有

一个不同的area编号,即使对于只有一个端口的组也是如此。

Port:地址的最后部份提供2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论