版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概 容错技术发展历 系统可用性级别定 著名顾问咨询公司分析报 Cluster集群技术简 Cluster集群技术定义 术 Cluster可以做什麽 Cluster不能做什麽 Stratus容错解决方案优 零停顿时 无故障恢复时 无内存数据丢 标准Windows2003兼容 Windows2003可靠性增 应用透明 生命周期总成本和风 先进的维修服 Stratus与Cluster的竞争比 硬件体系结 系统选 系统安 系统配 应用投 故障处理与恢 应用系统故障恢复周 Windows2003可靠性增值功 ........................................................................................... TotalCostofOnwership—总成本核 解决方案比较综 典型比较案 概述此文主要描述怎样与当前StratusTechnologies,Inc.®所的称为Cluster集群系统的最大竞争者,如IBM、Sun和HP等,竞争的策略。潜在市场的变化:近期咨询表明,在Stratus传统的竞争市场中,HighAvailabitity(Cluster集群)CACluster集群市场发展更快一些。这就是Stratus凭借其产品优势而涉足Cluster集群市场的初衷。ContinueousAvailability(CA)系统的变化:今天,Stratus能够提供非常低的和成本的基于In®技术和 ®Windows®2003操作系统的Win架构硬件容错服务器—ftServer™这些系统运行已被公认为是开放环容错技术发展历程StratusCluster集群系统的比较有体系结构开始设计容错体系结构。目前主要产品表现为以Stratus产品为代表的CA连续可用性的硬件级容错服务器;另一条是在通用服务器的基础上,配合Cluster技术及相应集群而构成的Cluster集群高可用性Cluster集群系统。系统可用性级别定义为了帮助企业更深入了解不同系统产品的可用性差异,著名顾问咨询公司International orp.®(IDC)AL4(CAAL3Cluster集群AL2Cluster集群AL1(RAID磁盘镜像或RAID记录或日志文件系统提供为AL0(stand-alone注:ALn —AvailabilityLeveln(可用性级别n) —ContinuousAvailability(连续可用性)Cluster集群 —HighAvailability(高可用性)RAID—磁盘阵列著名顾问咨询公司分析报告面对Stratus推出业界首台基于Win架构的硬件级容错服务器,一些著名顾问咨询各机构给予高度评价,认为StratusftServer产品的问世为关键业务应用1.2.1IDCIDC在对ftServer的分析报告中“Finall,sinceavailabilityismajorconcernforNTusers,whychooseaserverdesignedtorecoverfromfailureratherthanaserverdesignednottofailintheplace?Theanswerisobvious:Don'tlettheoutagehappenat1.2.2D.HBrownAssociates“D.H.BrownadmiresStratusforhavingtheconfidenceandfortitudeforproducingtheftServersystem.Withthismulti-yeareffortbyStratus,webelievethatthefirmhasmadeamajorcontributiontotheartandscienceoffault-tolerantsystems.”1.2.3ButlerGroupButlerGroupbelievesthattheftServer™productfamilywillhavewideappealtoenterprisesinallindustrysectorsthatincreasinglyneed99.999%availability.1.2.4ARCAdvisoryGroup通过StratusftServer技术及产品的分析,ARC“New,low-costtechnologyforfault-tolerantplatformsisnowavailableforWindows2003environments.Manufacturersshouldrevisitsomeoldassumptionsaboutwheretheybenefitfromdeployingtheseplatforms.Collaborationputsapremiumonreal-timemanufacturinginformation,andthesesystemscanhelpensurethattheinformationisalwaysavailable.Next,generationsystems,productionmanagementsystems,businesssystems,andcollaborativesystemscancallbenefitfromthistechnology.”Cluster集群技术简述ClusterCluster技术不Cluster集群技术定义?Clusters集群系统是两个或多个标准服务器通过冗余网络连接一些外部RAID或JBOD磁盘设备以提供无单点故障的硬件平台,可以支持具有快速硬件、软LAN故障恢复(重启动)能力的应用环境。Cluster在“很短的时间内”切换ClusterClustersHW/SWClusterMonitor”Monitor(HP-MCSG术语Node-nodeCluster中的一个计算机。(package(HP-C构成一个应用,当“B”出现故障,希望A和C也中止,所package运行的磁盘资源(逻辑卷IP地址。如果一个package通过硬件或或管理员命令恢复到另一个实际上并不驻留在“node”上,而是驻留在外部的RAID或package相关Scripts-用于启动和中止packageClusternodeCluster.编写script并不很但是欲覆盖所有可能的故障恢复却有些难度。Script包含了IP地址信息、nodeCluster规定的scriptClusterCluster造成困难,即使第二个Cluster运行相同的应用package。MonitorPrograms-"ClusterMonitor"和"PackageMonitor"是两个特殊的Cluster组件它们是运行于Cluster中所有node上的程序,确定Cluster和网络的状态,以及在出现故障时控制package的恢复。PackageMonitor管理package,而ClusterMonitor管理Cluster中的node。DuplicateLANs-一般来说(但并不必要,Clusternode连接两个分离的LAN,提供对LANCluster提供第三个LANCluster(Clusterpackage状态的监测程序之间的通信机制LANHPD-系列服务器上的很多插槽,使得它Cluster的需求。ClusterReconfigurationClusterMonitorClusternode出现故障时进行“ClusterCluster重新配置node将从Clusternodepackagenode启动。Got'chas包含了使重新配置复杂化的网络故障,因为一些node认为其它的node已经了而此时那些node仍然在运行,这种无法连通的原因在于网络的故障。尽管具备某些预置段来处理这种情况,遗憾的是,这些令人失望。这些硬件厂商没有设置呼叫来通报这种实效的系统。PackageFailoverPackageMonitor监测package心跳以及在监测到packagescript杀掉在那个node上的所有packagenode上的“start”script去启动在这个node上的package。在此需要考虑的是—如果stopscript出现问题,或不能中止所有的进程(由于某些悬挂的Unix进程,这将产生一些令人头疼的现象。此外,数据库又会怎样呢?startscript应该确定数据库是一致的,尽管它可能是容易或不容易去做,—一个script不可能去解决数据库的一致性问题!可以按故障恢复需要来将package配置到Cluster上一组node上或任何可用的node上。ClusterFlavorsCluster分为两个集合(一个处于工作状态,而另一个处于随时承接故障恢复状态8个nodeCluster技术的上限一直在改进)16个node来支持一些IPRe-direction-当一个故障恢复执行时,Clustermonitor具有将所有IP地址从故障node转移到另一个node上的能力。RAIDandJBODDiskArrays-这些术语将在本文的最后去定义。在这里Cluster(一般的)SCSI总线将外部磁盘联接到Cluster的node上,使得任一node均可磁盘阵列上的数据。node(无论在哪里定义node提供服务SCSI寻址限(一个SCSI总线最多16个一般地成为在Cluster上node8(node一个:8个node)及8个RAID或JBOD磁盘组。Cluster可以做什麽?由于或硬件,或者由操作员命令,Clusters能够在Cluster的一个node上重新启动失效的package种HW/SW升档的策略。附加的(昂贵的)亦可允许在Cluster中的node间“automaticpackagebalancingClustersClustersCluster常地,他们放弃了使Cluster运转的努力,采取了标准LAN配置的硬件(即,HWCluster集群结构的够实施Cluster不能做什麽?最重要的,Cluster并没有消除停机时间;他们通过提供重启动失效应用的策略Stratus中任何伸缩性的改进是因为LAN,并非Cluster。没有什麽Cluster技术可以将acrossCluster的技术是LAN网络及其高明的编程,而不是Cluster!大多数RAID/JBOD设备不允许在Clusternode上共享磁盘资源(逻辑卷。这是因为逻辑卷包含了文件系统,Unix将很多文件系统缓存在node的内存上以提高速度。一个node上的文件系统信息是不能够被其他node的,因而,RAID不能在node间共享逻辑卷。Unix提供了工具(NFS和RFS),node可以与网络上的其它nodeUnix功能,不是Cluster功能。Cluster集群系统提供和标准的计算机一样的服务没有类似Stratus那样的callhome功能。Cluster厂商(IBM,SUNHP)都没有建立或具备象Stratus一样的保证客户满意的服务组织结构。在故障恢复过程中,Cluster集群系统不能恢复或转移内存的内容。这就是为什麽在故障恢复易将丢失“Inflight”数据,这也是Stratus可以作为坚强的OpenView(NNM)服务器(因为NNM采用大规模的内存驻留技术的数据库Cluster不能在Cluster的node之间转移象SNA,X.25,Async,或Bisync非网络的物理连接。这就是为什麽在OLTP报文交换应用中担忧Cluster的道理。Stratus容错解决方案优势Stratus是业界唯一一家全力致力于广硬件级容错机技术的厂商,并始 Windows2003剧增。Stratus适时在今年六月推出了业界第一台基于In技术和Windows2003的硬件级容错服务器系列产品—ftServerStratus生产的容错服务器秉承Stratus零停顿时间Stratus容错计算机系统提供业界最高可靠性、和可用性。服务器系统采(DMR)和三模(TMR)99.999%,平均(意外599.999%99.99%,平均每年非计划(意外)停机时间超过4~5小时的可用性相比,用客户获得极大的稳定性。无故障恢复时间无内存数据丢失Stratus独特的冗余硬件结构不但保证磁盘静态数据的完整性,而且保证内存数标准Windows2003兼容性StratusftServer支持标准的Windows2003AdvancedServer操作系统环境。保持应用二进制兼容标准Windows2003下运行的无需任何需该即可运行在ftServer容错平台上。Windows2003可靠性增值StratusftServer利用其独特的冗余结构和容错技术,改进和完善了Windows2003的可靠性和稳定性。为加强可靠性而设计的Stratus强化驱动不但可以实时检测和故障部件,而且可以检测和不良驱动的内存越界写操作,防止造成系统转在Windows2003发生后,ftServer立即可从一个CPU重启动,使CPU保持内存状态数据,StratusftMemory提供预先定义内存段,使得当系统后的重启动期应用透明性Stratus故障处理在硬件部件级完成。任何故障均能被自动,而不会导致系统进一步严重问题。Stratus容错系统对应用使透明的,即:应用的测试仅限于正常的测试。而无需进行繁琐的、重复的程功能系统的如同单机一样。没有额外备份或集群技术的需要生命周期总成本和风险Stratus的故障处理和使可的为企业的成本奠定基础从而Stratus先进的维修服StratusStratus换句话说,Stratus客户服务中心承担了客户员的部分职责,从而使得Stratus特别适合的、要求更为苛刻的、无人职守的的应用环境Stratus提供基于互联网技术的eCAC从Stratus硬件容错服务器的特点可以看出服务器所组成的网络系统将是结构简单,连续可用性的。由此为用户带来众多的利益,如系统开发建设简单管理成本低,系统扩充简单方便等好处Stratus与Cluster的竞争比较StratusftServer是为那些基于Win架构的关键性业务应用的客户设计的。Stratus二十多年的关键性业务应用的经验告诉“可用性”对那些要求苛刻的客户意味着什麽。对于那些客户,Stratus解决方案的优势不仅仅就体现在可StratusftServer99.999+%数据,特别是In-flight应用和的简易最低总成本—TotalCostof先进的可硬件体系结构然不同的产品。首先从结构上将,StratusftServer的硬件体系结构是为消除停Cluster集群系统仅仅是多台StratusftServer图Cluster集群系统结构系统选购实现的安装调试,Cluster集群系统是由几台可共享资源、可互操作的单系统构成,ClusterCluster切换恢复时有可能造成的计算机系统性能下降问题,最后要对有关进行Cluster集群管理、编程等方面的培训。Stratus的容错计算机系统只需单机配置,一套硬件,一套系统,一套应系统安装Cluster集群系统不是一个完整系统。它是两台通用服务器,阵列磁盘子系统,Cluster及相应集群经过集成调试才能获得。因而,客户首先需要确定而Stratus容错计算机的安装是对一台单机的安装,没有特别的容错,安装系统配置主连向客户端网备份主连向客户端网备份 共享磁盘阵 Cluster集群切换及Cluster需进行Cluster集群系统的调试工作,测试系统第 是否具备Cluster集群功能是否能在双机间进行切换因此Cluster集群系统的安装调试而Stratus容错计算机的配置是对一台单机系统进行配置,没有特别的容错环境应用投产StratusClusterClusterCluster集群方案均拖延它们。这种利益的损失是无法弥补的。应用除了正常的标准测试外,在Cluster集群系统环境下,需要根据应当的环境切换程序必须反复进试以证明其执行的正确性的是,这就是说,建立一个Cluster集群系统,实现所有的故障恢复,以及应用的者当单点故障的Cluster管理员休假,她(他)只指调试(在安装阶段而且是长期的测试,以保证Cluster依然在正常工作CAStratus方案对故障是基于硬件的、一步到位实现故障的和处理,为您的客户产生的效益或保护其投资成本。某些产生这种故障恢复失效情况的例子所有用户采用netnodeA另外一些应用B的用户增加在nodeB上。当nodeA,应用A在nodeB上重启动时,因为在nodeB上存在着用户,没有足够的netsocket供应用A的用户去登录—结果是,一些用户不能在nodeB上的应用。.一个应用使用了各种系统资源:memory,swapspace,CPUcycles。Cluster故障恢复将应用转移到另一个nodenode上没有足够的资大多数Cluster顾问和喜爱者也得承认“Cluster”周期性的进试。然在峰值期的用户负载没有实现时,所有用户都可以登录。你不能在“off-peak”时间得到有效测试!!!“假如在峰值时间,测试引起停机,……故障处理与恢复Cluster承诺中,没有涉及数据的一致性、完整性。没有任何硬件来查询瞬间的或中间的问题。Cluster是标准计算机网络环境,只有可以“package”的应用据库,不能受Cluster保护。而在Stratus上—所有得到保护!ClusterRAID可使你随时增加磁盘,但应用却不能利用这附加空间的便利条件,除非这packagepackage必须暂停。这包括新的程序、新的逻辑卷,或IP资源。当某个packagenodepackage将自动失效于返回该node,除非由Cluster管理员手工采用sysadmin命令去改变(logic:你不希望应用返node强制下,这种情况有时会发生的。最终此package在此失败,而无法恢复到任何node上。在故障恢复出现后,与性能相关的又是怎样?在node后,Cluster就不再CPUnode以预留这些额外处理的资在应用实施Cluster程序后,它是否可以无变动的移植到另一种硬件平台上(C语言代码可以移植,而程序就不可能了。怎样理解对“开放系统”应理解应用系统采用“驻留内存数据库”的含义。Oracle,InformixSybase“驻留内存数据库”实际上是在内存中的、而不是磁盘中的“重要”数据上处理的每一笔in-flight交易的状态。对银行应用来说,每一笔正在处理的金融一次呼叫多有一“华尔街应用同样也透内存驻留数据OpenViewNNMCluster切换不能恢复的内存驻留数据使Cluster不能保护正在流动的交易。应用系统故障恢复周期上图示意了一个典型的故障期间,在StratusCluster集群系统上应用系统不Totalrecovery =Basicsystemrecovery+Databaserecovery+Networkrecovery+Applicationrecovery顿所带来的风险是不可的。在Stratus容错服务器环境下,应用是不会存在Windows2003可靠性增值功能ftServer利用其独特的硬件体系结构,提供了若干增值功能,进一步完善了Windows2003Online在Windows2003发生后,ftServer立即可从一个CPU重启动,使CPU保持内存状态数据,这个功能即可使应用即刻投入运行,又可提供问题的资料。这种功能在亦通用服务器体系结构为基础的Cluster集群系统上是做不到的。快速重StratusftMemory提供预先定义内存段,使得当系统后的重ClusterFtServer配置运行环境独立于Windows2003的冗余管理通信板。即使在ftServer处于停机状态,仍然可以透过管理通信板做到的系统启Cluster集群系统是一个复杂的环境,对系统管理员提出了额外的更高的技术水在Stratus容错技术环境下,员仅需要标准单机环境的技术水准就可胜Stratus可以为所有场Stratus自公司成立起,就把客户服务列为公司文化之一。Stratus的先进服务机制已嵌入到其硬件体系结构之中。StratusServiceNetwork—SSNStratus客户服StratuseCAC页面界面,客户可以透明的驻留在Stratus客户服务中心的客户服务数据库资料。客户可以清楚的了解自ftServer安装以来系统历史,Stratus客户服务中心工其他的厂商是否在服务与支持上具备关键性应用的主导思想?是否能提供StratusTotalCos
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国魔箱式换热器行业投资前景及策略咨询研究报告
- 2024至2030年中国铁制圣诞工艺品行业投资前景及策略咨询研究报告
- 2024至2030年中国设备清洁剂行业投资前景及策略咨询研究报告
- 2024至2030年中国电脑程控跑步机行业投资前景及策略咨询研究报告
- 人教版数学二年级下册-77万以内数的读法-教学课件
- 2024至2030年柳橙果酱项目投资价值分析报告
- 2024至2030年收卷切边机项目投资价值分析报告
- 《作文开头和结尾》课件
- 2024至2030年压力表旋塞阀项目投资价值分析报告
- 2024至2030年修补剂项目投资价值分析报告
- 血液透析患者护理查房教学课件
- DB4403T264-2022消防设施物联网系统技术要求-(高清正版)
- 环境可靠性测试培训课件实用
- 《二氧化碳的性质》说课课件(全国优质课获奖案例)
- 信息技术微型课题申报表
- 部编版语文六年级上册作文总复习课件
- 小学校危险化学品自查记录表
- 初中英语宾语从句新课件
- 混凝土发货单
- 楼梯间涂料施工方案
- 中国石油天然气股份有限公司油气田地面工程项目管理规定
评论
0/150
提交评论