计算机系统结构_第1页
计算机系统结构_第2页
计算机系统结构_第3页
计算机系统结构_第4页
计算机系统结构_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

对于共享主存的多个CPU系统,绝大多数还是采用各个都有自

己的Cache。在这样的系统中由于Cache的透明性,仅靠采用写直达

法并不能保证同一主存单元在各Cache中的对应内容都一致。例如,

处理机A和处理机B通过各自的Cachea和Cacheb共享主存。当处

理机A写入Cachea的同时,采用写直达法耶写入了主存,如果恰好

Cacheb中也有此单元则其内容并未变,此时若处理机B也访问此单

元时读到的就会是原先的内容而出错。因此,还需要采取措施保证让

各个Cache有此单元的内容都一致才行。

一种解决方法就是采用播写法,所谓播写法,是指任何处理机要

写入Cache时,不仅写入自己Cache的目标块和主存中,还把信息或

者播写到所有Cache有此单元的地方,或者让所有Cache有此单元的

块作废(以便下次访问时按缺块处理,从主存中调)。采用作废的办

法可以减少播送的信息量,IBM370/168.IBM3033都是采用的这种办

法。

另外办法是控制某些共享信息(如信号灯或作业队等)不得进入

Cacheo还有一种办法是目录表法,即在CPU读,写Cache不命中时,

先得查在目录表,以判定目标块是否有在别的Cache内,以及是否正

在被修改等,然后再决定如何读,写此块。

Cache内容跟不上主存内容变化问题的一种解决办法是,当I/O处

理机未经Cache往主存写入新的内容的同时,由操作系统经专用指令

清除整个Cache。这种办法的缺点使Cache存储器对操作系统和系统

程序员不透明了,因此并不好,另外解决办法是当I/O处理机往主存

某个区域写入新的内容时,由于专用硬件自动地将Cache内对应此区

域的副本作废,从而保持了Cache的透明性,CPU,I/O处理机共享

同一Cache也是一种解决办法。

总之,结构设计必须解决好Cache存储器的透明性带来的问题

当今国家,要想在综合国力上取得优势地位,就必须在科学技术

上取得优势,尤其要在高新技术产品的创新设计与开发能力上取得优

势。在以信息技术为代表的高科技应用方面,要充分利用各种新兴技

术、新型材料、新式能源,并结合市场需求,以实现世界的又一次“工

业大革命”;在工业设计与工程设计的一致性方面,要充分协调好设

计的功能和形式两个方面的关系,使两者逐步走向融合,最终实现以

人为核心、人机一体化的智能集成设计体系。从工业设计的本身角度

看,随着CAD、人工智能、多媒体、虚拟现实等技术的进一步发展,

使得对设计过程必然有更深的认识,对设计思维的模拟必将达到新的

境界。从整个产品设计与制造的发展趋势看,并行设计、协同设计、

智能设计、虚拟设计、敏捷设计、全生命周期设计等设计方法代表了

现代产品设计模式的发展方向。随着技术的进一步发展,产品设计模

式在信息化的基础上,必然朝着数字化、集成化、网络化、智能化的

方向发展

计算机控制系统包括硬件组成和软件组成。在计算机控制系统中,

需有专门的数字-模拟转换设备和模拟-数字转换设备。由于过程控制

一般都是实时控制,有时对计算机速度的要求不高,但要求可靠性高、

响应及时。计算机控制系统的工作原理可归纳为以下三个过程:

实时数据采集:对被控量的瞬时值进行检测,并输入给计算机。

实时决策:对采集到的表征被控参数的状态量进行分析,并按

已定的控制规律,决定下一步的控制过程。

实时控制:根据决策,适时地对执行机构发出控制信号,完成

控制任务。

这三个过程不断重复,使整个系统按照一定的品质指标进行工

作,并对被控量和设备本身的异常现象及时作出处理。

计算机网络控制系统面临的挑战

计算机控制系统虽然控制规律灵活多样,改动方便;控制精度

高,抑制扰动能力强,能实现最优控制;能够实现数据统计和工况显

示,控制效率高;控制与管理一体化,进一步提高自动化程度。但

是由于经典控制理论主要研究的对象是单变量常系数线性系统,它只

适用于单输入单输出控制系统。系统的数学模型采用传递函数表示,

系统的分析和综合方法主要是基于根轨迹法和频率法。现代控制理论

主要采用最优控制、系统辨识和最优估计、自适应控制等分析和设计

方法。而系统分析的数学模型主要用状态空间描述。随着要研究的对

象和系统越来越复杂,依赖于数学模型的传统控制理论难以解决复杂

系统的控制问题:

不确定性的模型:传统控制是基于模型的控制,模型包括控制对

象和干扰模型。传统控制通常认为模型是已知的或经过辨识可以得到

的,对于不确定性的模型,传统控制难以满足要求。

高度非线性:在传统的控制理论中,对于具有高度非线性的控制

对象,虽然也有一些非线性控制方法可供使用,但总的来说,目前非

线性控制理论还很不成熟,有些方法又过于复杂,无法广泛应用。

复杂的任务要求:在传统的控制系统中,控制任务往往要求输出

量为定值或者要求输出量跟随期望的运动轨迹,因此控制任务比较单

-0但过于复杂的控制任务是传统的控制理论无能为力

分布式计算是一门计算机科学,它研究如何把一个需要非常巨

大的计算能力才能解决的问题分成许多小的部分,然后把这些部

分分配给许多计算机进行处理,最后把这些计算结果综合起来得

到最终的结果。最近的分布式计算项目已经被用于使用世界各地

成千上万位志愿者的计算机的闲置计算能力,通过因特网,您可

以分析来自外太空的电讯号,寻找隐蔽的黑洞,并探索可能存在

的外星智慧生命;您可以寻找超过1000万位数字的梅森质数;

您也可以寻找并发现对抗艾滋病病毒的更为有效的药物。这些项

目都很庞大,需要惊人的计算量,仅仅由单个的电脑或是个人在

一个能让人接受的时间内计算完成是决不可能的。

随着计算机的普及,个人电脑开始进入千家万户。与之伴随产

生的是电脑的利用问题。越来越多的电脑处于闲置状态,即使在

开机状态下中央处理器的潜力也远远不能被完全利用。我们可以

想象,一台家用的计算机将大多数的时间花费在“等待”上面。即

便是使用者实际使用他们的计算机时,处理器依然是寂静的消费,

依然是不计其数的等待(等待输入,但实际上并没有做什么)。

互联网的出现,使得连接调用所有这些拥有限制计算资源的计算

机系统成为了现实。

那么,一些本身非常复杂的但是却很适合于划分为大量的更

小的计算片断的问题被提出来,然后由某个研究机构通过大量艰

辛的工作开发出计算用服务端和客户端。服务端负责将计算问题

分成许多小的计算部分,然后把这些部分分配给许多联网参与计

算的计算机进行并行处理,最后将这些计算结果综合起来得到最

终的结果。

当然,这看起来也似乎很原始、很困难,但是随着参与者和参

与计算的计算机的数量的不断增加,计算计划变得非常迅速,而

且被实践证明是的确可行的。目前一些较大的分布式计算项目的

处理能力已经可以达到甚而超过目前世界上速度最快的巨型计算

机。

分布式计算比起其它算法具有以下几个优点:

1、稀有资源可以共享。

2、通过分布式计算可以在多台计算机上平衡计算负载。

3、可以把程序放在最适合运行它的计算机上。

其中,共享稀有资源和平衡负载是计算机分布式计算的核心

思想之一。

实际上,网络计算就是分布式计算的一种。如果我们说某项

工作是分布式的,那么,参与这项工作的一定不只是一台计算机,

而是一个计算机网络,显然这种“蚂蚁搬山”的方式将具有很强的

数据处理能力。网格计算的实质就是组合与共享资源并确保系统

安全。

分布式存储思想的出现,使得解决这些问题变得越来越现实。

本文的目的就是利用分布式思想建立一个廉价、部署简单、稳定、

可靠、易扩展、自组织的分布式存储系统。每个文件就是一个数

据集,也就是说数据的存储最终以文件形式,存储在文件系统中。

文件系统是OS系统一个重要的部分,文件系统通过设备驱动来

访问设备(如磁盘)。各种不同的文件系统如ext2、ext3、ReiserF

S等,会挂接到虚拟文件系统VFS(VirtualFileSystemSwitch)

"1,在VFS这一层消除底层各种文件系统的差异,为系统调用接

□SCI(SystemCallInterface)层提供通用的访问接口。

网络文件系统(NetworkFileSystem,NFS)'III也是一种文

件系统,数据(文件)并不是存放在本地文件系统中,实际存放在

容量大、更安全、可靠的服务器文件系统之上。把远程的文件系

统挂接到本地系统的VFS中,就像操作本地文件系统一样。VFS

消除了本地和远程差异,充当Client,通过NFS协议和文件服务

器(FileServer)通讯来访问远程数据文件。

这种方式只是有限提高了存储的安全,来自使用一个强壮、

可靠的服务器替代用户的PC等终端。在存储上可以利用磁盘镜

像来加强安全,甚至是读写效率也大大提高。但是服务器的损坏

(如整个磁盘组损坏),所有数据都要丢失,而且价格昂贵,随着

存储需求的加大,需要持续投入,一旦到极限(如需要更多的磁

盘插槽),不得不再购买更强健的服务器或扩充设备。NFS并不

能应对大量用户访问,在用户比较多(如数千个用户)时,用户维

护和安全控制上是灾难。

分布式文件系统(DistributedFileSystem,DFS)采用多台

机器群集在一起构建一个文件系统,剥离文件元数据和数据,采

用一个专门的集中式f也有非集中式1服务器维护文件系统的元

信息,多台专门存储的服务器提供数据存储服务,对元数据的操作

和数据读取也分开。这是目前分布式文件系统采用的一个主要模

式,本论文阐述的分布式存储系统也不例外,主要采用这个思想

来构建系统。比较典型的分布式文件系统有AFS(AndrewFile

w

System)[IlkCodaFileSystemC12]LustreFileSystem"0

Coda是在AFS2原型上发展起来,LusWe源于Coda发展而成

分布式文件系统,由于分开文件元数据、读、写,在并发读

写、可扩展性上要强于NFS,具有非常好的网络吞吐量,系统的

性能上更稳健。对于较大的数据文件,会拆分文件成块,所以分

布式文件系统对很大的数据文件也能获得比较好的读写性能。

但这些分布式系统并没通过在设计上保证数据的安全性、系

统的灾难保障,主要将这些推给OST(以Lustre为例),这就要求O

ST的存储上一般要使用RAID或构建在NAS、SAN上等来保证。

真正要使用Lustre来构建一个分布式文件系统比较昂贵,维护上

NFS还要复杂。

由于数据的不断增长,数据文件越来越大,传统的文件系统

很难存储这些文件(如T级大小的文件),处理就更困难,对文件

并行读写上有更高的要求。需要一种更好的机制处理这些文件。

以GFS(GoogleFileSystem),143为代表新兴分布式文件系统,

延续以前的分布式文件系统的基本思想,从设计上保证了在廉价

机器上也能构建一个分布式系统,并且具有很强的扩展性性、容

错能力、高性能

本论文阐述是,采用非结构化的P2P思想,建立一个存储系

统。这样设计简单、实用、高效,便于实现图型化界面管理(对元

数据管理)。但不准备设计一个完备的分布式文件系统,重点落在

存储上,即设计一个存储平台。主要面向企业存储,存储节点有

限,这样对于中心控制服务器没有太多的压力,不会成为系统的

瓶颈。对外服务提供ClientAPI来访问系统,保持系统的简单、

易维护和安全。

基于P2P技术的Napster笆是一个代表,采用中心控制节点,

来定位文件。系统本身不提供存储,数据本身存储在各个客户端,

客户端上报所拥有的数据,中心服务器根据这些信息定位查找文

件所在客户端。这种技术一般文件共享,强调通过P2P分享而不

是存储。利用P2P也可以建立存储系统,目前已经实现系统有很

多。如Gnutella1191,采用对等P2P结构,构建在广域网或互

联网上,使用专门的存储节点或用户参与贡献空间,构建一个网

络的存储系统,用户可以存放数据到该存储系统之上。不同的组

织可加入存储服务,共同构建一个存储系统,通过用户的使用获

取回报。

GFS其实也是采用P2P思想构建了一个分布式文件系统(参

考GFS系统架构图),通过应用客户端访问该系统,所以被误认

为是C/S模式。具体做法是采用中心索引服务器记录文件元数

据,这样做最大的好处就是定位迅速,简化设计,由于中心索引

服务器只是维护元数据信息,数据节点的加入和退出,负担很小。

其侧重点不紧紧构建一个存储系统,本身也是一个分布式文件系

统。Nutch..们以及Hadoop等开源项目就是GFS的实现。国

内学术论文比较多,实现为系统的不多,没有什么影响力。早点

的有北京

设计Shamrock系统的设计目标就是要构建一个廉价系统,

并支持海量数据存储,支持大尺寸数据文件,负载分担(均衡),

可靠、能容忍系统局部失效(硬件或系统软件错误),不会导致系

统服务的终止和数据的丢失,易扩展。

本文阐述的分布式存储系统Shamrock是基于不太可靠的

廉价PC组成的存储网络,网络中每台用于存储数据的机器,称

为数据节点(DataNode)。所有的DataNode都可以构建在异构、

异质系统之上(推荐使用更稳定的Linux系统)。对于要存储的数

据文件,被拆分成多个“块"(Block)n3,所有这些Block按一定的

冗余度分散存放于各个DataNode之上。当需要读取该文件时,

把这些Block再合并成原来的文件。即使一个DataNode的损坏

退出服务,多副本机制可以保证对系统没有任何影响。存在损坏

DataNode之上的所有Block,在其它DataNode上者B能找至U副本,

对整个存储系统来说没有丢失任何数据。

系统本身能快速修复,检测Block的副本数不足时,在其它

DataNode上能快速重新构建数据副本,该方法比完全复制整个

文件备份要迅速得多,提高了数据的可靠性。随着数据量的增加,

可随时按需要加入DataNode,系统会自动把该机器纳入整个分

布式体系里的存储节点。系统具备不问断服务能力,在其上的数

据具有持续的生命力,无须作任何迁移数据的工作。

并行计算或称平行计算是相对于串行计算来说的;所谓并行计算

可分为时间上的并行和空间上的并行。时间上的并行就是指流水线

技术,而空间上的并行则是指用多个处理器并发的执行计算。并行计

算科学中主要研究的是空间上的并行问题。从程序和算法设计人员的

角度来看,并行计算又可分为数据并行和任务并行。一般来说,因为

数据并行主要是将一个大任务化解成相同的各个子任务,比任务并行

要容易处理。

空间上的并行导致了两类并行机的产生,按照Flynn的说法分

为:单指令流多数据流(SIMD)和多指令流多数据流(MIMD)o我们

常用的串行机也叫做单指令流单数据流(SISD)oMIMD类的机器又

可分为以下常见的五类:并行向量处理机(PVP)、对称多处理机(S

MP)、大规模并行处理机(MPP)、工作站机群(COW)、分布式共享

存储处理机(DSM)。并行计算机有以下五种访存模型:均匀访存模

型(UMA)、非均匀访存模型(NUMA)、全高速缓存访存模型(COMA)、

一致性高速缓存非均匀存储访问模型(CC-NUMA)和非远程存储访问

模型(NORMA)□

并行计算机是靠网络将各个处理机或处理器连接起来的,一般来

说有以下几种方式:

静态连接:处理单元间有着固定连接的一类网络,在程序执行期间,

这种点到点的链接保持不变;典型的静态网络有一维线性阵列、二维

网孔、树连接、超立方网络、立方环、洗牌交换网、蝶形网络等。

动态连接:用交换开关构成的,可按应用程序的要求动态地改变连接

组态;典型的动态网络包括总线、交叉开关和多级互连网络等。

节点度:射入或射出一个节点的边数。在单向网络中,入射和出射边

之和称为节点度。

网络直径:网络中任何两个节点之间的最长距离,即最大路径数。

对剖宽度:对分网络各半所必须移去的最少边数。

对剖宽度:每秒钟内,在最小的对剖平面上通过所有连线的最大信息

位(或字节)。

所谓分布式计算是一门计算机科学,它研究如何把一个需要非常

巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分

分配给许多计算机进行处理,最后把这些计算结果综合起来得到最终

的结果。最近的分布式计算项目已经被用于使用世界各地成千上万

位志愿者的计算机的闲置计算能力。分布式要解决的项目都很庞大,

需要惊人的计算量,仅仅由单个的电脑或是个人在一个能让人接受的

时间内计算完成是决不可能的。在以前,这些问题都应该由超级计算

机来解决。但是,超级计算机的造价和维护非常的昂贵,这不是一个

普通的科研组织所能承受的。随着科学的发展,一种廉价的、高效的、

维护方便的计算方法应运而生一一分布式计算!

分布式计算是近年提出的一种新的计算方式。所谓分布式计算就

是在两个或多个软件互相共享信息,这些软件既可以在同一台计算机

上运行,也可以在通过网络连接起来的多台计算机上运行。分布式计

算比起其它算法具有以下几个优点:

1、稀有资源可以共享,

2、通过分布式计算可以在多台计算机上平衡计算负载,

3、可以把程序放在最适合运行它的计算机上,

其中,共享稀有资源和平衡负载是计算机分布式计算的核心思想之

一。实际上,网格计算就是分布式计算的一种。如果我们说某项工作

是分布式的,那么,参与这项工作的一定不只是一台计算机,而是一

个计算机网络,显然这种“蚂蚁搬山”的方式将具有很强的数据处理

能力。网格计算的实质就是组合与共享资源并确保系统安全。

分布式计算使用的操作系统包括分布式操作系统,网络操作系统,基

于中间件的操作系统

其中分布式操作系统又包括多处理器系统和多机系统,这个应该

很好理解,多处理器系统肯定只有一个操作系统,多机系统的分布式

也是只有一个操作系统分配机器资源,这样的分布式系统机器与机器

之间具有非常高的透明性,而网络操作系统,基于中间件的操作系统,

都是由多个计算机组成,每个计算机有独立的操作系统。

这些分布式计算的区分还有通信方式,资源管理方式等不同,这

里就先不说了,大家有兴趣可以查一下。另附上面一段是根据我的分

布式课的课件写的,很感谢这位对自己要求严格,却很懂变通的老师。

上面已经说了,网格计算是分布式计算的一种,依照我现在的判断以

上分布式操作系统除了多处理器分布式计算不是网格计算以外,其他

的都可以称为网格计算。网格计算是伴随着互联网而迅速发展起来

的,专门针对复杂科学计算的新型计算模式。这种计算模式是利用互

联网把分散在不同地理位置的电脑组织成一个“虚拟的超级计算机”,

其中每一台参与计算的计算机就是一个“节点”,而整个计算是由成

千上万个“节点”组成的“一张网格”,所以这种计算方式叫网格计

算。这样组织起来的“虚拟的超级计算机”有两个优势,一个是数据

处理能力超强;另一个是能充分利用网上的闲置处理能力。

下面终于轮到我们的主角云计算登场了。

云计算(Cloudcomputing),是一种新兴的共享基础架构的方

法,可以将巨大的系统池连接在一起以提供各种IT服务。很多因素

推动了对这类环境的需求,其中包括连接设备、实时数据流、SOA的

采用以及搜索、开放协作、社会网络和移动商务等这样的Web2.0应

用的急剧增长。另外,数字元器件性能的提升也使IT环境的规模大

幅度提高,从而进一步加强了对一个由统一的云进行管理的需求。云

计算被它的吹捧者视为“革命性的计算模型”,因为它使得超级计算

能力通过互联网自由流通成为了可能。企业与个人用户无需再投入昂

贵的硬件购置成本,只需要通过互联网来购买租赁计算力,“把你的

计算机当做接入口,一切都交给互联网吧”。

狭义云计算是指IT基础设施的交付和使用模式,指通过网络以

按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供

资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限

扩展的,并且可以随时获取,按需使用,随时扩展,按使用付费。这

种特性经常被称为像水电一样使用IT基础设施。

广义云计算是指服务的交付和使用模式,指通过网络以按需、易

扩展的方式获得所需的服务。这种服务可以是IT和软件、互联网相

关的,也可以使任意其他的服务。

云计算的特点

(1)超大规模。“云”具有相当的规模,Google云计算已经拥有10

。多万台服务器,Amazon、IBM、微软、Yahoo等的“云”均拥有几

十万台服务器。企业私有云一般拥有数百上千台服务器。“云”能赋

予用户前所未有的计算能力。

(2)虚拟化。云计算支持用户在任意位置、使用各种终端获取应用服

务。所请求的资源来自“云”,而不是固定的有形的实体。应用在“云”

中某处运行,但实际上用户无需了解、也不用担心应用运行的具体位

置。只需要一台笔记本或者一个手机,就可以通过网络服务来实现我

们需要的一切,甚至包括超级计算这样的任务。

(3)高可靠性。“云”使用了数据多副本容错、计算节点同构可互换

等措施来保障服务的高可靠性,使用云计算比使用本地计算机可靠。

(4)通用性。云计算不针对特定的应用,在“云”的支撑下可以构造

出千变万化的应用,同一个“云”可以同时支撑不同的应用运行。

(5)高可扩展性。“云”的规模可以动态伸缩,满足应用和用户规模

增长的需要。

(6)按需服务。“云”是一个庞大的资源池,你按需购买;云可以象

自来水,电,煤气那样计费。

(7)极其廉价。由于“云”的特殊容错措施可以采用极其廉价的节点

来构成云,“云”的自动化集中式管理使大量企业无需负担日益高昂

的数据中心管理成本,“云”的通用性使资源的利用率较之传统系统

大幅提升,因此用户可以充分享受“云”的低成本优势,经常只要花

费几百美元、几天时间就能完成以前需要数万美元、数月时间才能完

成的任务。

以上都摘自一个叫互动的wiki里,现在web2.0的东西越来越多

了,我们可以自己发布学习资料,很方便。然而所谓的高深的云计算

不过是分布式计算,和web2.0技术的结合,当然还有发展了。它的

技术成熟必将给我们带来很大的方便。

GoogleMap就是一个云计算服务,Google里有很多服务,用户如

果想使用GoogleMap,只要上网找到它,Google公司的后台服务器便

开始竭尽所能为你提供你所申请的map

并且非常快,这么快捷的服务,当然依赖于各种资源分配算法和分布

式技术等等。有报道说GoogleMap有一天会变成收费的,虽然目前它

是免费的。

云计算就是给我们承诺了一个这样的未来,我们可以不用在本地

机器上安装软件,直接去网上就可以使用它。这样的好处当然是本地

机器的处理能力不用很高,存储容量也不用很大就可以完成各种高难

度的任务,如果你需要的话。比如不用安装环境,就可以在网上编程,

然后把编的程序存在网上,客户端就得到了很大程度的解放。而且我

们中国的公司也不用担心微软再向我们讨要什么版权费啥的。目前网

上已经有了各种office工具,打击盗版的日子将随着云计算的普及

消失。

集群(Cluster),是由一群同时运行同一个应用的服务器组成

的服务器组,形成一个虚拟的服务器,为客户端用户提供统一的服

务。为了均衡集群服务器的负载,达到优化系统性能的目的,集群

服务器将众多的访问请求,分散到系统中的不同节点进行处理。从而

实现了更高的有效性和稳定性。早在几年前,集群技术就被应用于数

据中心的服务器设备上,效果显著。与分布式文件系统相比,集群存

储系统有几大优势:因为数据不需要从一个文件系统拷贝或复制到

另一个文件系统,通过集群系统共享应用和数据的任务执行起来要比

在单独的设备上执行快得多;集群可以为文件和文件系统提供更多的

空间;如果集群内的某台服务器出现了故障,另一台服务器就可以把

它的工作接手过来,故障恢复也成为了现实;用户也可以同时对位

于其网络上的存储设备里的所有文件进行访问。

集群中的每个节点能够访问集群中所有节点的所有数据、重做

日志文件、控制文件和参数文件。数据磁盘由于在全局范围内可用,

允许所有节点访问数据库。每个节点都有自己的重做日志和控制文

件,但其他节点必须能够访问这些文件,以便在系统故障时恢复该节

点。通过应用集群技术,不仅可有效提升数据中心服务器系统的稳

定性、可用性及可管理性,同时一,允许用户使用价格相对低廉的配

置(如刀片)捆绑来替代昂贵的单块集成电路的高端服务器,在不

影响性能的情况下节约了存储成本。

集群存储常见的两种模式是镜像服务器双机和双机与磁盘阵列

柜。集群中镜像服务器双机系统是硬件配置最简单和价格最低廉的

解决方案,通常镜像服务的硬件配置需要两台服务器,在每台服务器

有独立操作系统硬盘和数据存储硬盘,每台服务器有与客户端相连网

卡,另有一对镜像卡或完成镜像功能的网卡。

镜像服务器具有配置简单,使用方便,价格低廉诸多优点,但由

于镜像服务器需要采用网络方式镜像数据,通过镜软件实现数的同步,

因此需要占用网络服务器的CPU及内存资源,镜像服务器的性能比

单一服务器的性能要低一些。

有一些镜像服务器集群系统采用内存镜像的技术,这个技术的优

点是所有的应用程序和网络操作系统在两台服务器上镜像同步,当主

机出现故障时,备份机可以在几乎没有感觉的情况下接管所有应用程

序。但是因为两个服务器的内存完全一致,当系统应用程序带有缺陷

从而导致系统死机时,两台服务器会同步死机。同时,在大数据量读

写过程中两台服务器在某些状态下会产生数据不同步,因此镜像服务

器适合那些预算较少、对集群系统要求不高的用户。

与镜像服务器双机系统相比,双机与磁盘阵列柜互联结构多出了

第三方生产的磁盘阵列柜,目前,豪威公司、精业公司等许多公司都

生产有磁盘阵列柜,在磁盘阵列柜中安装有磁盘阵列控制卡,阵列

柜可以直接将柜中的硬盘配置成为逻辑盘阵。磁盘阵列柜通过SCSI

电缆与服务器上普通SCSI卡相连,系统管理员需直接在磁盘柜上配

置磁盘阵列。

双机与磁盘阵列柜互联结构不采用内存镜像技术,因此需要有一

定的切换时间(通常为60-180秒),它可以有效的避免由于应用

程序自身的缺陷导致系统全部死机,同时由于所有的数据全部存储

在磁盘阵列柜中,当工作机出现故障时,备份机接替工作机,从磁盘

阵列中读取数据,所以不会产生数据不同步的问题,由于这种方案不

需要网络镜像同步,因此这种集群方案服务器的性能要比镜像服务

器结构高出很多。

双机与磁盘阵列柜互联结构的缺点是在系统当中存在单点错的

缺陷,所谓单点错是指当系统中某个部件或某个应用程序出现故障

时,导致所有系统全部死机。在这个系统中磁盘阵列柜是会导致单

点错,当磁盘阵列柜出现逻辑或物理故障时,所有存储的数据会全

部丢失,因此,在选配这种方案时,需要选用一个品质与售后服务较

好的产品。

当网络服务需要有相同的内容,双机与磁盘阵列柜互联结构是

很好的选择,否则每台服务器需要将相同的内容复制到本地硬盘上。

当系统存储的内容越多,这种镜像服务器双机的代价越大,因为每

台服务器需要一样大的存储空间,任何的更新需要涉及到每台服务

器,系统的维护代价会非常高。

由于双机与磁盘阵列柜互联结构为服务器组提供统一的存储空

间,这使得系统的内容维护工作比较轻松,如Webmas-ter只需要

更新共享存储中的页面,对所有的服务器都有效。当文件系统的存储

空间增加时,所有服务器的存储空间也随之增大。对于大多数Inter

net服务来说,它们都是读密集型(Read-intensive)的应用,文件

系统在每台服务器使用本地硬盘作Cache(如2GB的空间),可使

得访问文件系统本地的速度接近于访问本地硬盘。

此外,存储硬件技术的发展也促使从无共享的镜像服务器双机

集群向双机与磁盘阵列柜互联结构的集群迁移。存储区域网(SNA,

StorageAreaNetworks)技术解决了集群的每个结点可以直接连

接/共享一个庞大的硬盘阵列,硬件厂商也提供多种硬盘共享技术,

如光纤通道(FiberChannel)>共享SCSI(SharedSCSI)。I

nfiniBand是一个通用的高性能1/0规范,使得存储区域网中以

更低的延时传输I/0消息和集群通讯消息,并且提供很好的伸缩

性。InfiniBand得到绝大多数的大厂商的支持,如Compaq>Dell、

Hewlett-Packard>IBM、In-tel>Microsoft和SUNMicro

systems等,它正在成为一个业界的标准。这些技术的发展使得共

享存储变得容易,规模生产也会使得成本逐步降低。

通过Linux集群存储系统可以实现对系统中的所有文件、设备

和网络资源的全局访问。这样,无论应用程序在集群中的哪台服务器

上,集群文件系统允许任何用户都可以对这个软件进行访问。甚至在

应用程序从一个节点转移到另一个节点的情况下,无需任何改动,应

用程序就可以访问系统上的文件。Linux集群技术最大的发挥了PC

机和网络的优势,可以带来可观的性能,是一种大有前途的技术。

现代社会由于大规模的科学和工程计算的需求,迫使计算机必须不断

地提高其运算速度和存储容量。计算机的发展历史表明,为了达到更

好的处理性能,除了必须提高系统的硬件的速度外,系统的结构也必

须不断改进,特别是当元器件的速度达到极限时,后者将变成焦点问

题。于是,超级并行机已经成为复杂科学计算领域的主宰。但以超级

计算机为中心的计算模式存在明显的不足,而且目前正在经受挑战。

超级计算机虽然是一台处理能力强大的“巨无霸”,但它的造价极其昂

贵,通常只有一些国家级的部门,如航天、军事、气象等部门才有能

力配置这样的设备。而随着人们在日常工作遇到的商业计算越来越复

杂,人们迫切需要数据处理能力更强大的计算机,而超级计算机的价

格显然阻止了它进入普通人的工作领域。于是,人们开始寻找一种造

价低廉而数据处理能力超强的计算模式,最终科学家们经过努力找到

了答案---GridComputing(网格计算)。

网格(grid)是一个集成的计算与资源环境,或者说是一个计算资

源池。网格也是一种先进的计算基础设施(AdvancedComputational

Infrastructure,简称ACI),用于研究与工程应用相结合的项目,学科

领域涉及超级计算技术、网络技术、数据库技术、中间件技术、并行

算法和各种计算科学研究与应用技术,是一个综合性的跨学科高技术

研究课题。网格计算(GridComputing)是伴随着互联网技术而迅速

发展起来的,是将地理上分布的计算资源(包括数据库、贵重仪器等

各种资源)充分利用起来,协同解决复杂的大规模问题,特别是解决

仅靠本地资源无法解决的复杂问题,是专门针对复杂科学计算的新型

计算模式。这种计算模式是利用互联网把分散在不同地理位置的电脑

组织成一个“虚拟的超级计算机”,其中每一台参与计算的计算机就是

一个“节点”,而整个计算是由成千上万个“节点”组成的“一张网格”,

所以这种计算方式叫网格计算。这样组织起来的“虚拟的超级计算机”

有两个优势,一个是数据处理能力超强;另一个是能充分利用网上的

闲置处理能力。简单地讲,网格是把整个网络整合成一台巨大的超级

计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、

专家资源的全面共享。

近年来,随着计算机计算能力的迅速增长,互联网络的普及和高

速网络成本的大幅度降低以及传统计算方式和计算机的使用方式的

改变,网格计算已经逐渐成为超级计算发展的一个重要趋势。网格计

算是一个崭新而重要的研究领域,它以大粒度资源共享,高性能计算

和创新性应用为主要特征,必将成为21世纪经济发展的重要推动力。

二十世纪九十年代以来,世界各个国家,尤其是发达国家,建立了很

多超级计算应用中心(NCSA)和工程研究中心,美国还制定了新一

轮规划的先进计算框架计划(ACIP),发展面向21世纪的先进计算技术.

我国在科技部的领导和主持下,经过306主题专家组及相关单位的努

力,作为我国高性能计算和信息服务的战略性基础设施的国家高性能

计算环境发展很快。在已建成的5个国家级高性能计算中心基础上,

又于中南、西北等地建立了新的国家高性能计算中心,科技部并加强

了网格节点的建设,形成以科学院为主体的计算网格。教育部也启动

了网格计算工程,第一批12个网点正在建设中,国家基金委也列出

专向基金资助网格计算。

网格是借鉴电力网(electricpowergrid)的概念出来的,网格的最终

目的是希望用户在使用网格的计算能力时一,就如同现在使用电力一样

方便简单。

在科学计算领域,网格计算可以在以下几个方面得到广泛应用:

1.分布式超级计算。网格计算可以把分布式的超级计算机集中起来,

协同解决复杂的大规模的问题。使大量闲置的计算机资源得到有效的

组织,提高了资源的利用效率,节省了大量的重复投资,使用户的需

求能够得到及时满足。

2.高吞吐率计算。网格技术能够十分有效地提高计算的吞吐率,它利

用CPU的周期窃取技术,将大量空闲的计算机的计算资源集中起来,

提供给对时间不太敏感的问题,作为计算资源的重要来源。

3.数据密集型计算。数据密集型的问题的求解往往同时产生很大的通

讯和计算需求,需要网格能力才可以解决。网格可以药物分子设计、

计算力学、计算材料、电子学、生物学、核物理反应、航空航天等众

多的领域得到广泛的需求。

4.基于广泛信息共享的人与人交互。网格的出现更加突破了人与人之

间地理界线的限制,使得科技工作者之间的交流更加的方便,从某种

程度上可以说实现人与人之间的智慧共享。

5.更广泛的资源贸易。随着大型机的性能的提高和微机的更加普及,

及其资源的闲置的问题也越来越突出,网格技术能够有效地组织这些

闲置的资源,使得有大量的计算需求的用户能够获得这些资源,资源

的提供者的应用也不会受到太大的干扰。需要计算能力的人可以不必

购买大的计算机,只要根据自己的任务的需求,向网格购买计算能力

就可以满足计算需求。早期的网格体系结构是五层沙漏结构。在五层

沙漏结构中,最重要的思想是以“协议”为中心,它侧重于外部的行为

而不是内部的特征,通过协议可以实现一种机制,使得虚拟组织的拥

护与资源之间可以进行资源使用的协商,建立共享关系,并且可以进

一步管理和开发新的共享关系。这一标准化的开放结构对网格的扩展

性、互操作性、一致性以及代码的共享都有好处。

五层沙漏模型中,强调的是被共享的物理资源(或者是这些资源

所支持的服务)在OGSA中,服务所指的概念更广,包括各种计算

资源、存储资源、网络、程序、数据库等等,一切都是服务。五层模

型实现的是对资源的共享,而在OGSA中,实现的对服务的共享。

在OGSA中一切都看作是网格服务,网格是可扩展的网格服务的集

合,即网格={网格服务}。

以网格服务为中心的模型的好处有以下几点:网格中所有组建都

是虚拟的,通过提供一组相对统一的核心接口,所有的网格服务都基

于这些接口的实现,就可以很容易地构造出具有层次结构的、更高级

别的服务,这些服务可以跨越不同的抽象层次,以一种统一的方式来

看待。虚拟化也使得将多个逻辑资源实例映射到相同的物理资源上

成为可能,在对服务进行组合时不必考虑具体的实现,可以以底层资

源组成为基础,在虚拟组织中进行资源管理。通过网格服务的虚拟化,

可以将通过的服务语义和行为,无缝地映射到本地平台的基础设施之

上。

一:云计算的概念:

云计算是一个囊括了开发,负载平衡,商业模式,以及架构的时

髦词,是软件业的未来模式,简单地讲,云计算就是以Internet为中

心的软件,是一个基于internet的数据中心、服务中心、以及计算中

心。

云计算是基与互联网的计算,它能像电网供电一样,把需要共享

的资源、软件和信息提供给终端用户。

云计算的表现形式多种多样,简单的云计算在人们日常网络应用

中随处可见,如腾讯QQ空间提供在线制作Flash图片,彩字秀提供

的个性文字图片的处理,GoogleDoc和GoogleApps、zoho、用远程

软件进行Office处理。

1:云计算强调资源的共享,而不是独占

2:云计算强调资源的集中,而不是分散

3:云计算强调的是服务,而不是技术

4:云计算强调动态资源配置,而不是静态分配

5:云计算强调专业分工,而不是事必躬亲

二:云计算的原理:

云计算是分布式处理并行处理和网格计算的发展,或者说是这些

计算机科学概念的商业实现。

云计算的基本原理是,通过使计算分布在大量的分布式计算机

上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互

联网相似。这使得企业能够将资源切换到需要的应用上,根据需求访

问计算机和存储系统。

这可是一种革命性的举措,打个比方,这就好比是从古老的单台

发电机模式转向了电厂集中供电的模式。它意味着计算能力也可以作

为一种商品进行流通,就像煤气、水电一样,取用方便,费用低廉。

最大的不同在于,它是通过互联网进行传输的。

云计算的蓝图已经呼之欲出:在未来,只需要一台笔记本或者一

个手机,就可以通过网络服务来实现我们需要的一切,甚至包括超级

计算这样的任务。从这个角度而言,最终用户才是云计算的真正拥有

者。

云计算的应用包含这样的一种思想,把力量联合起来,给其中的

每一个成员使用。

三:云计算的特点:

1:云计算安全可靠

首先,云计算提供了最可靠、最安全的数据存储中心,用户不

用再担心数据丢失、病毒入侵等麻烦。

很多人觉得数据只有保存在自己看得见、摸得着的电脑里才最

安全,其实不然。你的电脑可能会因为自己不小心而被损坏,或者

被病毒攻击,导致硬盘上的数据无法恢复,而有机会接触你的电脑的

不法之徒则可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论