




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
容错与集群系统的对比分析关键应用服务器选型原则第一、 系统安全可靠性第二、 系统可管理性第三、 系统维护性第四、 系统扩展性第五、 系统实用性第五、 系统经济性第六、 其他A类服务器可选方案高可用性方案—HA方案(HighAvailability)服务器集群方案双机双柜方案—硬件无单点故障双机单柜方案—外置存储柜单点故障Unix、Windows平台连续可用性方案—CA方案(ContinuousAvailability)容错服务器方案硬件无单点故障,操作系统经过强化独自开发的专用容错系统(Tendem、Stratus)Unix、Windows容错系统(Stratus)HA和CA技术的发展60‘70‘80‘90‘2000‘专有容错系统软件容错系统硬件容错系统单机双机ClusterTruUnixClusterUnix,Windows集群HA方案
80年代末到90年代初DEC的TruUnix上开始发展90年代末开始在Windows上发展容错CA方案80开始发展纯硬件容错技术
天腾和容错两家公司
专用容错系统、专用领域91年容错公司推出Unix容错机98年天腾被康柏收购01年容错公司推出Windows容错机02年康柏被惠普收购
计算机业界对可靠性的定义方案可靠性99.999%99.99%99.9%99%容错服务器独立服务器使用外部磁阵的独立服务器简易的集群系统消除单点故障的集群系统大型主机集群和容错方案的概念比较内容集群HA方案容错CA方案故障类型仅避免永久性故障避免永久性和瞬间性故障,其中瞬间性故障占硬件故障的90%(IBM服务器专家实验结果)可靠性指标99.9%-99.99%,具体水平依赖于实施水平、应用类型、数据规模、切换原因等许多不确定因素,难保证99.999%以上,所有容错系统(公司)必须承诺的指标,容错公司统计数据达到99.9998%非计划停机时间平均每年53分钟到9小时平均每年5分钟,容错公司统计数据小于2分钟冗余性级别系统级别冗余,软件执行机制部件级别冗余,硬件执行机制设计目的避免服务器的硬件故障避免服务器的硬件故障、提高操作系统的可用性数学基础平行式结构,避错设计架桥式结构,容错设计方案表现听任故障造成停机,只能采取从灾难中恢复的方法容忍故障出现,预防灾难发生可靠性级别AL2-AL3,中等级别AL4,最高级别集群HA方案是高可用性方案,但这并不是真正意义上的容错!
集群和容错方案的拓扑结构比较心跳线系统结构复杂环节过多,外部连接故障发生点多系统结构简单如同单机,内部连接故障发生点少无单点故障的集群方案无单点故障的容错方案数据镜像操作系统SCSIENETSMMMPU,Memory住服务器集群软件中间件应用软件操作系统SCSIENETSMMMPU,Memory备用服务器集群软件中间件应用软件磁盘阵列心跳线定期侦测集群和容错方案硬软件结构比较CPUMemoryCPUMemoryI/OI/O操作系统中间件应用软件硬软件结构复杂依赖集群软件对所有软件和硬件要求苛刻切换机制只能覆盖部分实际应用情况硬软件结构简单纯硬件容错结构对所有软件无特殊要求时钟同步,无需切换HACA数据丢失CPU中正在处理的数据内存中驻留的重要数据I/O中正等待写入/出的数据选择新平台进行切换业务延滞等待检测故障出现永久故障瞬间故障故障恢复集群和容错方案的工作原理比较实践证明切换不是总能成功的!集群和容错硬软件可靠性实测比较Source:StandishGroup,June2002.Datacollectedovera12monthperiodfrom1,893enterpriseproductionsystems.Downtimenumbersincludeplanneddowntimeandunplanneddowntimeduetooperatorerrors,networkandenvironmentalissuesaswellassystemsoftwareandhardwareproblems.结论是:容错服务器的硬软件可靠性是最高的集群略微提高了硬件的可靠性但反而降低了软件的可靠性!2003美国供电中断是由于集群切换的失败区域供电中断13分钟集群和容错方案的对比(一)
技术对比内容集群HA方案容错CA方案硬件结构冗余服务器和磁盘柜,通过集群软件,设计切换机制,由软件来执行故障的恢复100%部件冗余,计算机指令时钟同步,通过比较或表决线路,由硬件执行容错,预防故障发生软件结构集群系统对所有软件的要求比较高,包括数据库软件和应用软件,而其集群造成软件结构复杂,必须编制脚本,增加故障的不确定因素单软件映像,强化驱动和热插拔支持,软件结构像单机这么简单,无需做特殊处理停机故障类型所有故障,包括永久和瞬间故障绝大部分故障都不会造成停机故障造成停机时间几分钟—几十分钟不等,根据服务器之间的切换时间和应用复杂程度,来决定停机时间零切换时间,故障不会造成停机数据完整性故障发生导致动态实时数据丢失,切换不完善导致数据不一致没有数据丢失,保证数据完整性和一致性应用软件测试所有应用软件必须经过严格切换测试,模拟故障不全无需进行切换测试,所有软件对客户是透明的集群和容错方案的对比(二)
系统计划实施对比内容集群HA方案容错CA方案系统设计复杂,必须考虑所有硬软件在集群系统下的可用性设计简单,只需考虑单机应用安装步骤硬件结构复杂,现场组装时间长,软件必须安装两次,而且现场必须编制切换的脚本程序模块化设计,插拔式安装,时间短,软件一次安装完成,无需现场编制任何脚本程序安装时间一天3小时左右测试必须经过严格的所有硬件故障模拟测试,所有软件故障模拟测试,以及故障导致切换的测试只需经过硬件热插拔测试,由于软件由其开发商以经过长期严格测试,无需在现场测试测试时间模拟故障不能完全考虑到现场的实际应用状况,故严格的测试需要一周左右时间几分钟的模拟硬件故障测试技术要求安装实施工程师必须对集群技术、微软技术和应用软件的技术非常熟悉,并具有丰富的经验只需要了解单机技术和微软技术即可,无需经过特殊的专业培训集群和容错方案的对比(三)
系统管理对比内容集群HA方案容错CA方案设备管理本身包含设备多,管理复杂,尤其除了管理服务器以外,还必须对磁盘柜进行管理设备单一,管理简单,如同管理单机一样管理系统检测一般只有在开机时,服务器才会进行自检,正常使用时,不具备实时检测和纠错功能具有实时自我检测功能,并且能自动隔离故障,无须人工检测管理方式必须现场进行管理,而且严格上来讲,必须7x24小时现场有工程师管理可配置远程管理功能,由于故障不会导致系统瘫痪,即使故障发生,也无需立即到达现场处理故障运行中测试集群在实际应用中必须定期进行故障模拟和切换测试,以确保一旦故障出现,系统能够顺利切换,一般两周到一个月必须测试一次只需对系统进行定期常规的健康检查,一般不需要测试人员要求对系统管理员必须经过专业技术培训,熟悉硬件和软件技术,以及时在现场作出故障处理不需要经过专门的技术培训集群和容错方案的对比(四)
系统维护对比内容集群HA方案容错CA方案易难程度由于设备多,维护难度大,需要专业工程师维护维护容易,无须经过专业培训,故障出现一般无须立即响应故障修复拆机后替换式故障诊断,故障定位后,替换故障备件,现场可能一次不能完成,修复时间长模块化设计,系统自动提示故障位置,故障部件所在的模块一起更换,故障定位和备件更换快热插拔一般只有电源、风扇和硬盘支持热插拔,除以上部件外,均须停机拆卸更换所有部件支持热插拔,包括CPU、内存、电源、风扇、I/O板卡,甚至底板均可连同模块一起热插拔,可在线进行部件更换故障修复后测试集群系统在任何故障修复后均必须再进行切换测试,保证故障再次发生,系统能够顺利切换故障修复后只需进行常规健康检查服务形式被动式服务,一般采取人工电话咨询、工程师现场故障判断和备件更换,无法进行远程维护和自动报警主动式服务,一旦机器出现故障,机器会自动监测和隔离故障,并主动向容错公司的维护网络报警,工程师也可以进行远程维护备件送达服务容错服务器的主动式服务4.ftServer®会将新换上的部件自动进行同步并始终保持系统的运行3.随后,新的“客户可自行更换单元”即会被送出1.当部件发生故障,系统将自动隔离故障并使用冗余的部件继续运行2.“主动通知”技术将自动向Stratus公司的客户服务中心报告故障双向客户服务中心主动通知集群和容错方案的对比(五)
拥有成本对比内容集群HA方案容错CA方案硬件采购成本有双机双柜和双机单柜选择,平均成本较低一般硬件采购成本较高软件采购成本(参考市场价格:下页)操作系统:Windows企业版两套数据库:SQL企业版两套集群软件:双机双柜必须另购一套应用软件:企业版一套操作系统:Windows企业版一套数据库:SQL标准版或企业版一套应用软件:标准版一套切换软件:不需要实施成本集群一般需要专业的工程师到现场安装实施,集成费用、测试费用一般比较高实施成本低,基本无测试成本,就如同单机集成开发成本软件二次开发后须经过集群环境测试,开发成本高,另外系统投产后如果需要增加软件和修改软件,也会产生开发成本没有特殊的软件开发生命周期一般使用周期为3-4年一般使用周期为4-6年管理维护成本对人员数量、技术水平、培训要求高人员数量少,无须特殊技术和培训集群和容错方案的对比(六)
拥有成本对比典型IT环境的构建与运行费用分析
一个IT环境5年总费用的典型例子“Thesmallestelementofthecostofrunningservers
isactualserverpurchaseprice.”
JayBretzmannDirectorofIBM’sxSeriesMarketing“服务器硬件购买成本实际上是最少的成本因素!”初期投资整个生命周期中的总体成本容错服务器集群服务器HACA时间经济效益集群和容错方案的对比(七)
采购成本对比内容集群HA方案容错CA方案双机双柜价格双机单柜价格ftServer价格硬件价格HPDL580G3双lInteXeon3.66GHz/1MB4GB内存,2个73GB硬盘双网卡,冗余电源HPMSA1000F200146GB硬盘6块¥480000HPDL580G3双lntelXeon3.66GHz/1MB4GB内存,2个73GB硬盘双网卡,冗余电源HPMSA1000F100146GB硬盘3块¥330000Stratusft4600双IntelXeon3.6GHz/2MBCPU(逻辑),4GB内存(逻辑),2个74GB硬盘,4个160GB硬盘双网卡¥1180000软件价格Windwos2003企业版:2套¥60000Windwos2003企业版:2套¥60000Windwos2003企业版1套2CPUSQL企业版:2套¥6800002CPUSQL企业版:2套¥6800002CPUSQL标准版1套¥100000集群软件:1套¥140000安
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三农农业休闲观光项目指南
- 建设工程可行性研究
- 营口冷链物流公司
- 项目进度管理与会议纪要实录
- 垃圾分类示范城市
- 零售连锁店数字化门店运营方案
- 中级养老护理练习试卷附答案
- 储能系统和综合能源系统解决方案分享
- 新能汽车产业发展政策及技术趋势分析
- 重要项目决策会议纪要实录
- 地铁站安全运行现状评价报告
- 中石化供应链VPN接入方案
- 无人机应用与基础操控入门课件
- 跨学科主题学习的设计
- 掌握说明方法-2024年中考语文阅读点拨及进阶训练(解析版)
- 孔雀东南飞课件幻灯片课件
- 四川省会计师事务所服务收费标准
- 中国品牌授权行业发展环境、市场运行态势及投资前景分析预测报告
- 留置导尿法操作评分标准
- 休克的临床表现与急救
- 2024年皖北卫生职业学院单招职业适应性测试题库附答案
评论
0/150
提交评论