容错技术与容错服务器201309_第1页
容错技术与容错服务器201309_第2页
容错技术与容错服务器201309_第3页
容错技术与容错服务器201309_第4页
容错技术与容错服务器201309_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

他们需要连续可用性的解决方案连续可用性是必需的,停机时间是不能容忍的实时关键领域应用24x7小时可用性1上海海得控制系统股份有限公司南京分公司技术部:曹晓华2013年09月容错技术与容错服务器内容容错技术与容错服务器单机容错VS.双机热备容错带给客户的价值行业应用3什么是容错?容错是什么?这就是容错

我们不用担心某一个部件的损坏会导致整个系统的失效系统能容忍任一部件的失效并继续工作

计算机系统可靠性设计方案避错设计技术>>

容错设计技术4容错技术的发展60‘70‘80‘90‘2000‘专有容错系统软件容错系统硬件容错系统单机双机Cluster集群5世界上最可靠的服务器技术和解决方案

美国容错技术有限公司

|StratusTechnologies1980--硬件级容错计算机系统厂商Stratus成立(位于美国波士顿),主要投资者有Intel,NEC,Investcorp,MidOceanPartners1981--首先推出基于硬件的容错计算机系统1986--建立世界上第一个提供24小时服务的远程服务网1990—推出世界上第一个容错的UNIX操作系统-FTX1991--推出RISC结构的XA/R系列容错计算机系统1995--推出RISC结构的Continuum系列容错计算机系统1997--推出容错的HP-UX操作系统2001--推出世界上第一台WinNTX86平台硬件容错服务器ftServer2005--推出支持RedHatLinuxEnterprise的X86平台硬件容错服务器6技术合作伙伴基于

OS可用性特征的合作内存再同步强化驱动程序企业关键应用的支持方式ftServer®W系列产品安置在

Redmond测试实验室共同决定处理器的使用程序(LockStep技术)更早得到最新处理器ftServerW系列产品安置在

Intel实验室ftServerW系列产品安置在

EMC认证实验室

CLARiiON®产品的转销合作支持方式7容错服务器的优越性容错服务器的优越性

连续处理技术

操作简单

价格优势8ContinuousProcessing®

Technology快速部署,简化操作;

最高级别的在线运行时间保障连续运行的最佳方案——连续处理技术9Stratus连续处理®技术(一)10锁步技术(时钟同步技术)零切换时间单软件映象消除单点故障CPU

NwaySMPSNPASICMemoryChipsetTMRCPU

NwaySMPSNPASICMemoryChipsetCPU

NwaySMPSNPASICMemoryChipsetDMRLockstepCPUsDiskPCISSPASICPCISSPASICDisk11错误检测和隔离嵌入式I/OPCI磁盘处理器芯片集内存错误检测和隔离错误检测和隔离嵌入式I/OPCI磁盘处理器芯片集内存错误检测和隔离同步锁定

CPUs多路径I/O模块方式实现660012Stratus连续处理®技术(二)13Windows2003:Server,EnterpriseServer,DataCenterServerI/OSystemSecurityLocalVirtualProcessStructureObjectServicesFileServerObjectmanagement/executiveruntimeDeviceDrivers(Level1)Level2PlatformInterfaceI/ODevicesDMAControlBIOSCacheControlPrivilegedArchitectureHardwareAbstractionLayer(HAL)PCIConfig IOVA InterruptsKernelDaemons Services Applications ManagementFileServerSecuritySessionManagerReplicatorLogonAltererEventLoggerOtherSQLServerMSExchangeWebServerDiagnosticsRemoteConsoleServerManagementStratusValueAddDeviceDrivers(Level1)Level2BIOSHardwareAbstractionLayer(HAL)PCIConfig IOVA InterruptsDiagnosticsRemoteConsoleServerManagement

Stratus软件增强透明性14故障安全软件机制软件屏蔽瞬间硬件错误强化驱动程序预防软件故障广泛综合和错误插入测试准确捕捉,分析和纠正软件问题内存和磁盘数据保护故障防范!!!软件可靠性预防、诊断、和解决软件问题15

Stratus连续处理®技术(三)16

ActiveService™体系结构自动的故障检测和隔离(服务器的自身纠错机制)集成的故障”回叫”和远程支持

(StratusCAC)Stratus和第三方的合作支持系统非工作状态的管理能力技术激活的服务方式在问题引发系统停顿前检测和报告错误

故障防范管理访问网络ActiveService体系结构17

ActiveService™体系:自动获得可用性热插拔部件非常容易更换系统自动同步更换的部件系统正常处理贯穿整个更换过程!系统自动订购正确的更换部件NextDayDeliveryService部件故障.系统隔离错误并通知

Stratus有CPU故障

18GuestOS问题分析处理一站式的技术支持CountonStratus&Hite19ActiveService™体系:24x7关键性系统支持可用性动员全球性24x7电话支持准确的故障隔离,部件派发Stratus驱动OS问题解决Microsoft金牌认证合作伙伴100%可用性计划Worldwide

ActiveService™

Network20容错服务器产品线ftServerEnter-SeriesWindows/Linux-basedsolutionftServerT-Series/L-SeriesTelco/EnterpriseLinuxSolutionftServerV-SeriesVOSUNIXsolutionContinuumVOSUNIX&HPUNIXsolution21最新推出的第五代容错服务器采用最新架构IntelXeon5500“Nehalem”processors处理器。服务器整体性能提升125%以上;逻辑内存可扩展至96GB;内置8对2.5”SAS磁盘,物理存储容量可达8TB;集成远程管理模块,服务器的管理更加智能灵活…222600

Low-endsystem4500

Mid-tiersystem6300

High-endsystemProcessors1-socket1-and2-socket2-socketCPUQPIPerformanceQuad-core2.00GHz

4.8GT/sQPIQuad-core2.00GHz4.8GT/sQPIQuad-core2.93GHz6.4GT/sQPICPUCache4MBShared4MBShared8MBSharedMemoryBandwidth19.2GB/s38.4GB/s51.1GB/sMemorySlots6DIMMSlots6or12DIMMSlots12DIMMSlotsSystemMemory16GB48GBor96GB96GBEmbeddedSAS,2xENET(10/100/1000),3xUSB2.0(rear),1xUSB2.0(front),2xCOMM,VGA,BMC,DVDR(front)PCISlotsEmbedded2xPCIePCISlotExpansionNotAvailable2xPCIeGen2

OR2xPCI-X2xPCIeGen2OR2xPCI-XRAID1Disk(Internal)8x2.5”SASDisksFormFactor4URack4URack4URackNote:AllI/Ooptionsspecifiedinlogicalcount,physicalcountis2timesnumbersspecified23内容容错技术与容错服务器单机容错VS.双机热备容错带给客户的价值行业应用24MicrosoftState/windowsserver/en/library/dba487bf-61b9-45af-b927-e2333ec810b61033.mspx?mfr=true25双机方案是如何工作的?DataDisk(Mirror)OSSCSIENETSMMMPU,MemoryServer-PrimaryClusterAppMiddlewareApplicationOSSCSIENETSMMMPU,MemoryServer-StandbyClusterAppMiddlewareApplicationStorageEnclosureHeart-BeatCheckingWorkstation2Workstation3Workstation112326DataDisk(Mirror)OSSCSIENETSMMMPU,MemoryServer-PrimaryClusterAppMiddlewareApplicationOSSCSIENETSMMMPU,MemoryServer-StandbyClusterAppMiddlewareApplicationStorageEnclosureHeart-BeatCheckingWorkstation2Workstation3Workstation1123双机方案是如何工作的?27系统架构Stratus

ftServer(SingleSystem)System&DataDisk(Mirror)SCSISCSIStorageEnclosureENETENETSMMSMMMPU,MemoryMPU,MemoryOSMiddlewareApplicationDataDisk(Mirror)StorageEnclosureCluster(MulitpleSystems)OSSCSIENETSMMMPU,MemoryServer-PrimaryClusterAppMiddlewareApplicationOSSCSIENETSMMMPU,MemoryServer-StandbyClusterAppMiddlewareApplication28拓扑结构比较心跳线系统结构复杂环节过多,外部连接故障发生点多无单点故障的集群方案无单点故障的容错方案系统结构简单如同单机,内部连接故障发生点少29工作原理比较—容错PassiveBackplaneSSPSSPSNPSNPI/OI/OCPUCPU1+1=?1+1=?MEMMEM22DiskDisk所有运算在不同板上同时进行I/O板CPU/MEM板30当CPU主板出现问题时…….PassiveBackplaneSSPSNPI/OI/OCPUCPU1+1=?1+1=?MEMXDiskDiskSNPSSP2MEM2任何一块CPU板上的任何部件损坏,都不会影响系统的正常运行。正在进行的运算和操作会象没发生问题一样继续下去。31如果I/O板再出现问题呢?PassiveBackplaneSSPSNPI/OI/OCPU1+1=?DiskDiskSSP2MEM2X任何一块I/O板上的任何部件损坏,也不会影响系统的正常运行。正在进行的运算和操作同样象没发生问题一样继续下去。I/O板CPU/MEM板32工作原理比较---集群I/OCPU1+1=?MEM2I/OCPU1+1=?MEM2Disk0100010110100010101010111010111010010110001100011101X1+2=3CPU、内存和等待I/O的所有数据丢失,数据库、应用、文件系统都没有被安全关闭需要时间等待备机检测到故障发生需要时间和运气进行磁盘组切换、需要时间和运气进行文件系统检查需要时间重新启动应用程序,需要重新进行一些运算以回到断点需要时间和运气重新启动数据库并进行数据库修复工作最重要的是:切换并不一定总是成功!!!系统A系统B33集群和容错方案硬软件工作原理比较通用HA容错CA交易丢失选择新平台业务延滞故障出现故障恢复数据丢失,后期会花费大量的力量来找回

恢复总时间= 基本系统恢复时间

+数据库恢复时间

+应用程序恢复时间

+网络恢复时间34计算机业界对可靠性的定义方案可靠性99.999%99.99%99.9%99%容错服务器独立服务器使用外部磁阵的独立服务器简易的集群系统消除单点故障的集群系统大型主机35每年的停机成本.08764.388.76Hoursunavailable$25,000perhour$10,000perhour$5,000perhourComputingEnvironment$900.00$43,800.00$87,600.00$400.00$22,900.00$43,800.00$219,000.0024x799.9%$2,200.0099.999%$109,500.0099.95%Costofdowntimewillvarybyapplication.0087699.9999%$44.00$88.00$219.00Downtimemeans$$$$........36$$$$$Windows2003x22套主机系统集群部件以及存储阵列应用程序和中间件

x2系统维护以及停机损失应用程序和中间件x1集群软件集群规划实施费用-集群设计-集群测试验证-应用程序设置简单的单机管理Win2003x1RapidDiskResync用户成本比较容错ftServerTCO比较一套ftServerCluster集群37成本对比例举内容集群HA方案容错CA方案双机热备价格单机容错ftServer价格硬件价格X3850M2-7141IntelXeon

Processor

7330(2.40GHz/6MBL2QuadCore)

DDR2

4G;FSB1066MHz

2*GigaEthernet,4U,RSAII,2*1440w

2套SANSwitch2/8冗余光纤交换机,FCHBA卡及相关电缆,

2套IBMStorageDS3400双控制模块146GB硬盘6块2套

Stratusft4410系列

DMR双路四核IntelXeon2.0GHz/2X6MBCPU(逻辑)FSB1333MHz8GBDDR2内存(逻辑)2个146BSAS系统硬盘,4个500BSATA数据硬盘,分别做镜像RAID1保护一对双口1000-base自适应网卡软件价格Windwos2003企业版2套Windwos2003企业版1套iHistorianServerIO:20,000

2套iHistorianServerIO:20,000

1套ROSEHA软件:1套安装测试价格10%硬件和OS安装已经在设备报价中,仅数据库软件安装总价382003美国供电中断

是由于集群切换方案的失败区域供电中断13分钟39当我们有彻底避免灾难的方案时

为什么还要选择灾难恢复方案呢灾难恢复集群方案灾难预防容错方案“Whychooseaserverdesignedtorecoverfromafailure,ratherthanaserverdesignednottofail?”

VernonTurner,IDC40内容容错技术与容错服务器单机容错VS.双机热备容错带给客户的价值行业应用41容错为客户带来价值Stratus向客户提供解决方案:具有连续可用性能力

-拥有无可比拟的优势

(99.9998+%uptime)操作简便性-

提供具有显著的操作简便性财务优势-

产品和解决方案(最小的TCO)42容错服务器的优势1.可用性:99.999%vs99.95%2.故障恢复时间3.动态数据一致性4.应用透明性5.生命周期及风险6.可维护性43为用户提供最好的可用性解决方案连续可用性是必需的,停机时间是不能容忍的实时关键领域应用24x7小时可用性44全球大客户都信赖ftServer零售/分销博采公共安全工业制造交通运输医疗健康电信金融45内容容错技术与容错服务器单机硬件容错VS.双机热备容错带给客户的价值行业应用46工业控制系统的应用ftServersystems:oneoffirstserverstoearn

theABB“IndustrialI

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论