计算机毕业论文侯文豪.doc_第1页
计算机毕业论文侯文豪.doc_第2页
计算机毕业论文侯文豪.doc_第3页
计算机毕业论文侯文豪.doc_第4页
计算机毕业论文侯文豪.doc_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东北农业大学毕业说明书计算机科学与技术入学年级:2010春学生姓名:时丽萍学号:968B20115003所学专业:计算机科学与技术东北农业大学中国.哈尔滨2011年12月目 录1 引言-22 实时集群系统的可靠性设计-22.1冗余设计-32.2选择高可靠性设备-32.3 合理结构-42.4网络规划-42.5 利用可靠性理论对其进行分析估算-43 一个实时集群系统可靠性模型及分析-43.1可靠性分析-43.2可用性分析计算-54 结束语-61 引言进入信息化社会后,各行各业都在竞相发展各自的高新技术产品和构建自己的信息处理环境。这就为计算机创造了更多的应用机会。当然也给计算机带来了挑战,如天气预报、核爆模拟、基因测序、航空航天器的电子操纵成像系统等。然而,这些计算又是非常费时的,许多问题即使在大型机、巨型机上求解也需花费几天甚至几十天的时间;若是在微机上计算,就可想而知了。而已有的向量机、SMP等中、大型机,由于价格昂贵,还不能普遍应用,好在人们可以利用用户所拥有的网络工作站的空闲时间进行并行计算。这就是90年代兴起的集群(Cluster)计算机。无论从性能价格比还是可用性、可伸缩性、可靠性方面,集群都有无比的优势和发展前景。因此就针对一个实时系统的硬件构成可靠性作以分析计算。2 实时集群系统的可靠性设计什么是集群:简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想 的集群是,用户从来不会意识到集群系统底层的节点,在他/她们看来,集群是一个系统,而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系 统的节点。对于实时系统来说,除过在规定时间内处理完要求的任务外,可靠性是不能不给予重视的。但作为一个计算机系统来说,整个系统的可靠性是由软件系统和硬件系统的可靠性共同保证的。这两者都可通过良好的的设计获得高质量,但硬件在制造过程中可能会引入质量问题,如在工作时由于温度、腐蚀或震动而产生磨损,这两者对软件是不存在。所以软件系统的可靠性还不像硬件设备那样,有成熟技术研究方法。更不能照搬硬件设备衡量可靠性的分析方法。它的可靠性主要由设计开发阶段的各种措施和管理方法来保证。另外硬件又是软件运行的基础,硬件的故障自然会影响系统的正常工作。为了从根本上保证系统可靠。本文先对硬件系统的可靠性作进行了分析研究。集群计算机类型是很多的,就目前应用情况来说,不管哪类集群都要求高的性能、高伸缩性、高可用性。尤其是由多传感器构成的实时集群系统,可靠性要求就更高。如果设计构建不周到,就可能给日后应用埋下隐患。2.1 冗余设计:对于高可靠性的系统来说,这是常用的基本方法;也是除集群系统之外的其它系统、设备所采用的常规方法。在集群系统中,由于集群计算机的特殊结构,这种方法具有双重作用。一是对整个集群计算环境来说可以配备多机系统,构成多机备份。二是由于同种角色的多个节点的存在,构成了互为备份的系统。尤其对于实时集群计算机系统来说,专门负责通信的通信节点(或称为通信服务器)、集群处理数据存储节点(或称为数据库服务器)、作业控制台(前端机)等均可设计成多备份。另外, 必要时亦可将网络设备、通信链路都设计成多备份。图1所示系统为一多传感器集群计算机系统结构图。它由4个计算节点、2个通信节点、2个存储节点、2个控制台,通过一个交换机连接,构成高可靠性、高可用性系统。数据输入接口*2Cisco switchswitch控制台*2数据库服务器*2计算节点*4通信服务器*2图1 多传感器集群计算机系统结构图2.2 选择高可靠性设备就集群构建所用设备来说,除选择稳定的性能外,还必须选择具有高可靠性的设备,如MTBF不小于5万小时。不过这一要求,对于计算节点和网络设备来说,已不成问题。但对于辅助设备来说就要给予足够重视和选择。如为集群计算机提供数据的输入接口等。图1中,数据输入接口相对来说,比其他设备失效率高,这是由于它的构造和结构决定。所以选择时要经过专门挑选。2.3合理结构结构的合理性在于没有互为影响其物理性能的发挥地连接方式。高可靠性的设备不会因为连接结构而与较低可靠性的设备连接使得整机可靠性打折扣。即要符合安全的“水桶原理”。2.4 网络规划虽说是同一集群系统,但各部分有各自的任务分工,为了使局部不影响整体性能,可以利用新技术对网络进行逻辑上的隔离。如VLAN技术。图1系统中,由于集群计算机还要与其它子系统连接,为了不使网络中的其他子系统间的通信影响集群计算机性能,本系统就划分为了4个VLAN段。目的是可减少集群内部不同区域节点间的无关信息流通而带来的网络拥挤。2.5 利用可靠性理论对其进行分析估算根据可靠性理论,将系统按功能划分成并联和串联的关系,对其进行可靠度定量计算。估算出系统的可靠度系数。作为衡量系统可靠性高低的依据。3一个实时集群系统可靠性模型及分析3.1可靠性分析为实现用户对集群计算机系统的高可用和高可靠性(MTBF5000小时)。实时集群计算机应用系统的部分设备是由两套构成热备份。应用可靠性理论,可得到该系统的可靠性模型如图2所示:同步通信服务器同步通信服务器主交换通信节点1通信节点2存储节点1存储节点2计算节点1计算节点4图2 实时集群计算机系统可靠性模型图2所示结构是根据可靠性理论,对实时集群计算机系统进行功能概括,而得到的可靠性模型。图2中的连接关系是反映可靠性的相互关系,而非系统的物理连接关系。这样依据可靠性理论和设备的失效率、维修率,可定量分析计算系统的可靠性和可用性。这里说明一点就是,交换机只使用了一个,未有冗余。因为它的MTBF超过了10万小时。同时还选择了著名品牌-cisco产品。附表 设备失效率注:*为确保计算结果的可信度,将厂家给出的失效率增大了2倍。系统的可靠性与组成系统的单元数量、单元的可靠性以及单元之间的相互关系有关。下面用数学模型法分析预测系统的可靠性和可用性。由可靠性理论知,对于串、并联系统的可靠度、失效率有下述关系:将参数代入上式, 可以得到平均无故障时间为:小时。满足系统5000小时的要求。3.2可用性分析计算平均无故障时间(MTTF)度量系统的可靠性,但大多数系统在故障后需要维修再次启用。这样, 引入用平均维修时间(MTTR:Mean Time To Repair)来度量系统的可维护性。那么, MTTF+MTTR就为两次故障间平均时间(MTBF:Mean Time Between Failure),则可用性定义如下:式中,:失效率(Failure law);:维修率(Repair law)。对一个串并联系统来说,与可靠性相对应,可用性有如下计算公式:当t=时,,即稳态可用性。将失效率、维修率值代入式(4)得到系统的可用性A=0.93168931871 。这说明系统在其生命期中有93.17%的可用时间。4结束语:集群计算机系统是由硬件和软件构成的,硬件除计算机外还有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论