NCPI最新的理念_第1页
NCPI最新的理念_第2页
NCPI最新的理念_第3页
NCPI最新的理念_第4页
NCPI最新的理念_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ZkPCLegndarv Reliability"信息中心网络基础物理设施技术现状与发展趋势中国电源学会副理事长张广明网络关键物理基础设施 “ NCPI” (Network Critical Physical Infrastructure),它包 括了与数据中心基础物理设施有关的全部内容,诸如不停电供电系统、空调制冷系 统、IT设备(机架)微环境、系统管理、机房建设等方面。在IT行业,实际应用中存在的问题和随着技术进步不断提出的新要求,是 NCPI新设计理念的产生和新产品开发生产的基础和动力,同时也是检验新的系统 方案设计和新产品是否符合要求、有没有推广应用前景的唯一客观的标准。对于

2、使 用者来说,充分了解应用中的问题,才能客观地准确地去评价系统方案设计和产品 的先进性,才能有针对性地选用既符合使用要求、性能价格比又高的解决方案和相 应的产品。数据中心和网络系统出现近40年之后,其物理基础设施从多方面而言仍停留 在手工行业阶段-将来自不同供应商的类型迥异的设备进行定制化设计,组合成一 个数据中心需要的非标准化的大型基础设施系统。而简单地定制连接和组建起来使 之运转(鲁伯哥德堡效应)导致的结果是系统的非标准化、复杂性和发生人为错 误的几率高。美国可用性研究中心是首先进入IT系统基础物理设施研究和设计领域的咨询 机构,从2000年起派出工程师和设计专家到全球 200多家大型UP

3、S用户、电力设 计机构考察,认真倾听来自设备经理、IT经理、CEO、工程顾问、项目经理等不 同层面的反馈,发现了以前从未认真思考过的问题,并总结归纳出了5个方面共22条用户需求,这些需求是当前数据中心包括供电系统在内的基础物理设施面临 的也是今后必须解决的迫切问题。美国可用性研究中心在研究报告中阐述了解决这 些问题的科学方法和未来的发展趋势,这些意见和要求中很多已超出了传统概念的 机房和UPS设备的功能范围,预示着传统的机房和供电系统正发生着设计理念的 变化。一,当前信息中心机房及供电系统存在的问题当前的已建和正在计划建造的信息中心基本上是按传统的观念和陈旧的模式设 计建造的,通过对建造水平和

4、运行状况的市场调查,总结出以下十个方面的基本情 况和问题:(1)使用UPS以便提高供电系统的可用性的观念已被绝大部分用户接受,在 国民经济各个领域和部门新建和改建的供电系统中,几乎都已建立或正计划建立 UPS供电系统,可谓言者必称 UPS说明广大用户对借助UPS供电系统提高供电质 量的重要性已经有足够的重视。但系统设计建造水平绝大部分处在 UPS 应用的初级 阶段一在系统中简单地加入 UPS设备,在电网正常时成为系统中可靠性的薄弱环 节、新的故障源和维护工作的难点。(2)供电系统的故障还是要发生的,这是个不争的事实。用户特别是运维人员 感到,安全性和可靠性是当前供电供电系统最主要的问题。通过对

5、供电系统故障情1ZkPCLegndarv况的调查和分析发现,系统故障总数中的5070%!由于配电系统中其它环节和设 备的质量问题、安装问题、人为操作和维护问题引起的,或者由于这些问题而诱发 关键设备UPS产生误动作乃至发生故障。UPS只是涉及供电系统可靠性问题的因素 之一,仅仅提高UPS设备的可靠性,是不能从根本上解决整个供电系统的安全性和 可靠性的。(3)用户感到最困惑的事是,供电系统故障后,由于系统过于复杂、产品供应 商反应速度、维修人员的技术水平和工作经验、备件储备和提供情况、故障原因的 查找和分析,还包括系统中各种设备供应厂商之间的互相推诿等原因,使系统故障后得不到及时迅速地修复,甚至

6、找不到引发故障真正原因的结论。传统的设计方法 中各种类型设备的简单的堆砌和多供应商状况不仅大大影响了系统的可靠性,同时 也是故障后不能尽快修复的重要原因之一。(4)从使用维护情况来看,UPS已经具备的智能管理和通讯管理功能没有得到 充分的发挥。当今的UPS已经从原来所谓的独立电源设备发展成今天具有多种通讯 方式管理和与IT系统无缝集成地网络设备,但是在实际应用和运行维护中,权威 人士估计对系统和设备的智能管理和通讯功能的应用率大概只有20%这种现象与用户管理水平有关,也与系统和设备厂家的管理集成化程度低和兼容性差有直接的 关系。(5)通过对多个数据中心供电系统的调查,发现 很多已经在运行的特别

7、是在原 系统基础上改造的UPStt电系统在设计上不规范,系统配置不尽合理,存在着诸多 隐患。诸如:系统中所有设备和环节都是串连的,形成多个单路径故障点;系统中 各相接的设备输入输出阻抗不匹配,因相互影响而降低可靠性或者不得不降容使 用;系统中因配置了输入谐波电流大和启动冲击电流大的设备,不仅污染电网,而 首先是在系统内部形成严重的相互干扰;系统中电力传输线(包括数据传输线)过 长和布局零乱而易产生干扰和发生人为事故;系统中配置了大量的断路器,由于产 品质量问题,或者配置得不合理,使系统有时发生不明的故障;系统中零地电压差 过大,零、地线系统设计和线缆选用不符合标准等。(6)采购配置UPS设备时

8、仍然存在着一些错误的观念和误导。例如确定选用 UPS的性能标准时,不是从UPS的输出电性能指标、输出能力和可靠性指标、对电 网的适应能力、系统配置能力、智能管理和通讯功能、可维护性和可扩充性、可靠 性和可用性等方面对其进行全面的考察,而是把厂家宣传的产品能达到的某些最高 指标做为自己选用的标准;简单地以 UPS电路结构形式定优劣;忽视 UPS寸电网的 适应能力和电力污染问题等。(7)提高使用维护水平与提高设备技术水平同等重要。在UPStt电系统各类故 障的起因中,人为原因造成的故障占很大的比例。人为故障的原因可归结为维护人 员对所配置的设备的基本性能了解不够、对系统和设备监测监控信息和显示功能

9、不 熟悉、选用配置设备时的选型不当、对设备运行时的常规维护要求不清楚且执行不 严格等。维护水平既与运行维护人员的技术水平、经验和培训工作有关,又与系统 本身是否易维护、系统管理智能化程度以及系统和设备管理修复难易程度有直接关 系。(8)当前已建和正在设计建造的数据中心供电系统中,普遍的存在着资源浪费和生命周期成本问题:预算投资和可用空间造成 UP昭量的浪费,从UPSft电系统 容量来看,大部分用户的UPS一次装机容量和实际负载量差别过大,在最初装机运 行时UPS的实际带载量仅为装机容量的百分之九左右。在第五年时实际负载量也只 达到装机容量的28%用户在UPS容量上的投资,70%Z上被闲置浪费了

10、;由于传 统的系统设计建造方法和所选用设备的匹配、安装调试等问题,使系统的建设周期 过长,一般情况下,因系统的进度及可用性要求的不同,数据中心的实际建设时间 一般要三个月到十八个月之间不等;由于企业的决策者对未来业务可能发生变化的 不可知性,以及供电系统设计和所选用设备对环境和功能要求变化的适应性很差, 就使得对系统的投资存在风险问题,基础物理设施需要大量投资,但没有可变通及 灵活的变更、扩充和退出策略。二,信息中心UPS供电系统设计建造理念的变化上面提到的当前信息中心 UPSft电系统现X和存在的8个问题,是UPS厂商和 供电系统设计者必须面对的实际问题,正是这些客观存在的问题促使着 UP%

11、术的 进步和供电系统设计理念的变化。归总这些变化主要表现在以下四个方面:(1)研究工作从单台UPS设备向整个供电系统变化UPSa仅是供电系统中的一个环节,一个完整的系统中除了UPS系统外,还可能有变压器、瞬态电压浪涌抑制器、电网进线开关柜、负载配电柜、柴油发电机组、交流稳压器、隔离或升降压变压器、电池系统、各种开关、断路器、保险、 转插,上百乃至几百个级连接点和相应的传输线。所有这些在系统中都会形成单路 径故障点,由于这些部件和环节在可靠性模型中的串联特性,以及它们之间的相互 影响,就使得系统可靠性大幅度降低。 UPS厂商和供电系统设计者意识到, 在不断 提高UPS设备的性能和可靠性的同时,还

12、必须加强对整个供电系统的研究。所研究 的问题包括:系统中各种设备和环节的相互匹配和可靠性问题、系统可用性和冗余 配置问题、可修复和降低修复时间问题、UPS设备的模块化冗余系统结构问题、各种设备和环节连接技术的研究和规范化问题、供电系统的布局(集中式、区域式、 分散式)问题、系统的可维护性和集中管理问题等。(2)对系统可靠性的研究向可用性研究变化在绝大部分配置UPS供电系统的部门和单位,都对供电的连续性提出了非常高 的要求,越来越多的厂商和用户已经形成这样一个共识:UPS系统经过多年发展,在其性能指标已完全满足计算机网络设备要求的情况下,真正能为用户带来价值的 是其可用性。可用性定义为:系统在使

13、用过程中,可以正常使用的时间与总时间之 比。可用平均无故障工作时间MTBF和平均修复时间 MTTR表示,可用性 A(t)=MTBF(MTB+MTTR在概念上它包含了系统中设备的可靠性、可管理性和可维护 性。可用性高意味着给用户更多的正常使用时间,把故障后不可用时间降到最低限 度。对可用性的研究促进了 UPS设备和供电技术的全面发展,包括设备和系统的冗 余可容错技术、设备的模块化可在线热插拔维护和扩容技术、系统的集成一体化技 术、智能管理和与IT系统无缝集成地通讯管理技术等。(3)从对单纯的供电系统研究向整个IT基础物理设施(NCPD研究变化保证计算机和网络IT设备正常运行的条件除了配置 UPS

14、供电设备外,还必须 有与之配套的完整的供电系统、空调及通风系统、机架及 IT设备线缆的支撑系 统、消防及门禁系统、基建及装修装饰等,统称为网络关键物理基础设施,这些设 施都会在一定程度上影响信息系统的可用性,所以研究工作自然地就由单纯的电力 供应扩展到空气调节(包括IT机架微环境)、IT设备机械支撑、系统的集中管理 等。NCPI概念的提出标示着供电系统设计观念和策略发生了变化,从关注产品和 系统本身到关注用户的实际应用,从供电设备一点向数据中心电力支撑系统的思维 模式的转变。换句话说,不再孤立地看待性能单一的供电系统,而是把它放在一个 大系统中去,对系统做全面的研究、设计、构建、管理和评估。从

15、UPS设备到一体化供电系统,再到 NCPI,是供电系统设计思维模式的重大变 化。(4)提高UPSffi电系统的“适应性”当经济环境的变化周期小于设备的生命周期时,就会对设备的适应性提出要 求。由于技术发展和经济环境的不确定性和不可预测性,要求一台设备能够自动而 有准备地适应新的需求是根本不可能的。一般来说,物理设施不可能像软件系统那 样容易地进行逻辑上(程序上)的升级。比如,一台 10kVA的UPS要想“升级” 为20kVA的UPS是根本不可能的,除非最初的标称值为10kVA的实际容量是20kVA,而那恰恰不是所谓的可适应性,而是“一步到位”的模式。“适应性”向 “一步到位”的系统设计模式提出

16、了挑战。系统要适应的变化包括:经济形势的变 化、IT设备技术革新和功率密度的变化、维护人员操作水平的变化、组织管理模 式的变化、设备运行场地的变化等。对于 NCPI来说,要适应这些变化,需要考虑 以下的设计思路:模块化、“积木化”设计;开放式设计;集成化设计;高密度、 小型化设计。三 集成化设计理念是UPStt电系统新的发展趋势以上四点系统设计理念的变化,导致了 UPS集成化设计理念的产生,在这种设 计理念下产生的典型的产品是 APC公司的“英飞集成系统” 一ISX。该产品在设计 中遵循了以下四点原则:各供电设备制造和供应渠道的统一化;各供电设备和环节(包括负载机架)结构的一体化和连接的规范化

17、;各供电设备和环节(包括负载机 架中的PDU电源状态管理的集中化;各供电设备和环节结构的模块化、冗余配置 和连接的热插拔功能。ISX是实施NCPI理念的具体方案,是一个完整的 UPS供电 系统,它由电力供应、空气调节、IT设备机械支撑和系统管理等 4个子系统组成。该产品最大的特点是适应性强,把供电系统的可用性、可管理性、可扩展性等 功能都提高到了一个新的水平。下图所示为系统配置示意图。图中:电源机柜1,PX80 KW UPS 5,VX机柜2,80KW配电单元机架PDU3, XR电池机柜机柜附件4,机柜分配面板制冷6,精密空调7,机柜排风单元(ARU8,机柜气流分配单元(ADU管理服务英飞管理器

18、系统和组件级服务环境监测单元环境管理系统3ZkPCLegendary Reliability系统的性能特点如下:针对以UPS»核心的供电系统各种设备做统一的性能设计和设备配置,有 利于加强各设备之间的匹配,提高设备利用率,降低各设备和系统中的谐波干扰和 相互影响;设备机架结构的标准化和安装连接的规范化,不仅可加快安装速度,还可 提高装配质量,缩短连线长度和零乱状况,有利于减小维护难度和降低人为故障的 发生;该产品的大部分功能部件都冗余配置,并可热插拔维修,可把系统故障修 复时间降到最低,大幅度提高系统的可用性;开放式设计和强大的电源集中管理功能,提高了系统的可管理性和可能维 护性,用

19、户可在必要时能够自行对设备进行重新集成,对运行状况信息的管理进行 二次开发,以及自主地不依赖供应商地对设备进行维修维护;用户可根据IT系统规模和业务扩展的阶段性做定制化配置,可有效地避 免一次性过量的投资和供电容量的浪费;模块化设计不仅能提高系统的可用性,使 UPS系统的扩容变得容易,并且 对体积较大的设备来说,模块化设计还能增加空间布局的灵活性,从而提高了对空 间的适应性,并为系统未来可能的改造或重新设计留有可调和余地并提供可行性方 案。四,机房设计理念的变化新的设计理念同时也在指导和改变着传统的机房设计理念和建造方法,最明显 地变化体现在以下四个方面:1 .对供电系统的设计不能局限在只是通

20、过变压器和主电源开关向机房提供满 足功率容量和电压制式要求的动力电,而是要对整个机房乃至IT设备微环境(机架或机柜)的供电质量、可靠性和可用性、电力传输、各种设备的匹 配和连接、电源的管理等一系列问题做全面的研究和设计;2 .对机房空调制冷系统的研究和设计不能局限在保证机房内的温度和湿度,还 要保证IT设备微环境(机架或机柜)的温度和湿度,这方面研究理念的一个 重要变化是“如何把IT设备产生的热量有效地带走",保证IT设备在最佳 的温湿度环境下工作;3 .对整个机房的集中管理得到所有系统设计和机房建设者的普遍重视,提高管 理水平是提高系统可靠性和可用性的关键因素之一,同时也是提高使用

21、维护 水平、降低人为故障的有效措施;4 .机房是作为固定资产投资建设的,在IT技术快速发展和变化周期缩短到 3-5 年的形势下,如何缩短建设周期和提高对应用需求迅速变化的适应能力变得 尤为重要。五,新的设计理念的最终目标 一NCPI标准化在现今全球数千个数据中心的 NCPI所具有的复杂程度和不一致性面前,其他 所有成熟行业的系统分析家们都会目瞪口呆。最近几十年来,在其他行业中标准化 的观念已上升到一个新的高度,成为了一种富有创造性并具突出战略意义的企业哲 学。而在NCP领域,尽管由于行业特殊性使标准化存在着实际的困难,以及长期以 来缺乏公众监督的动力行业内广泛的变革兴趣,但业内人士已逐渐认识到

22、必须避免 一次性独特工程设计的低效及容易出错的复杂性,透明地管理IT物理基础设施的日常业务,才能建立起任何基础设施所期望的高品质。他们开始凭借自己的经验和 商业判断力来推动行业朝着更稳定和更高效的标准化方向发展。我们可以将标准化 应用于网络关键物理基础设施的设计、部署和运营当中,以获得易于理解、可预测 和高效的NCPI结构和功能。除一些重大改进(如批量生产、可兼容的连接、易于理解和资源共享等)之 外,几乎在NCPI产品与设计建设流程的每个方面都存在着实现标准化的必要性和 可能性。我们可以从NCPI系统自身的设计入手,仅这一点就会带来广泛且显著的 好处。然后,用户可以以此为基础,将标准化应用于

23、NCP的流程,并在所有数据 中心之间采用相同的NCPI配置和流程,从而推动标准化观念朝更广阔的方向发 展。由于标准化可显著地提高 NCPI的商业价值-可用性、适应性和总拥有成本 - 的每项性能。因而必然成为NCP吱术发展中的一个长期地具有战略意义的发展趋 势。NCPI的模块化和标准化对提高商业价值的的作用示意在下图中NCP的模块化和标准化对提高可用性的作用表现在以下三个方面:(1)提高设备可靠性:标准化的模块化组件可以按照比非模块化系统大得多的产量进行批量生产,从 而降低了生产缺陷。而且,模块化组件可以返回制造商处进行维修,从而极大地提 高了维修质量。止匕外,采用标准化连接的模块化系统可以按照

24、与现场同样的方式在 工厂内进行配置,因而可以在工厂内进行预先测试,以发现缺陷。标准化的模块化 组件也使得内部冗余(组件发生故障时无需停机)以及热插拔更换(在拔出发生故 障的组件时无需停机)功能更易于实现。采用标准化的设备监控系统后,借助于易 于掌握的管理工具,可以更方便地进行 前瞻性维护,以便在问题逐步演变为重大损 失之前识别问题。此外,还降低了对容易出现人为错误的 预防性维护的依赖性。(2)降低平均恢复时间(MTTR):可以迅速将发生故障的模块化组件拔下,以进行更换,因此,不存在因等待修 理而耽搁系统恢复的情况。标准化令系统更容易理解与操作,加快了问题的诊断速 度,并提高了用户自己进行诊断与

25、更正的可能性。(3)减少人为错误:迄今为止,在提高可用性的所有途径中,减少人为错误是最行之有效的手段。 随着设备与程序的标准化,功能更加透明,日常操作更加简单并更容易学习,一切 事物都按照预计的方式运行 -所有这些,都降低了发生从输入错误命令到拔错插 头的任何故障的可能性。NCP的模块化和标准化对提高适应性的作用表现在以下三个方面:(1)加快部署速度:模块化组件加快了规划与设计速度,这是因为可以根据设计目标以合理的方式 配置系统结构,包括模块单元的物理排列,以及仅选用满足当前IT需求的设备数量与类型。在管理层试图调整过度规划到未来 10年的数据中心设计方案费用的同 时,无需等待其结果即可立即开

26、始部署。由于模块化结构所固有的设计灵活性,即 便是特殊的NCPI需求,也不会给规划时间拖后腿。由于标准化批量生产的设备可 以实现现货供应,因而提高了交货速度。现场配置与连接的速度也更快了,不仅仅 因为连接方式都采用标准化形式并进行了简化,还因为由于只使用必需的构造模 块,设备的数量减少了。止匕外,由于标准化模块可以采用与现场一模一样的方式在 工厂进行连接并预先测试,系统的调试速度也提高了。与采用静态定制设计方案和 一次性工程设计的传统整体式基础设施相比,以上效率的提高使得从概念到调试的 时间从几个月缩短至几周,重新配置的时间从几周缩短至几天。止匕外,仅根据当前的IT需求进行设计,因而只需部署比

27、典型的传统系统设备 数量更少的小型基础设施,进一步缩短了各个部署阶段所需的时间。(2)增强可扩展的能力:采用模块化构造模块结构,系统功能可以逐块获得,因而可使从配线柜到大型 数据中心的任何大小的IT空间的配置达到最佳状态。更为重要的一点是,可以只 按照启动时所需的IT需求来设计基础设施。而后,随着IT需求的增长,可以添加 更多的构造模块,而无需重新对整个系统进行工程设计,也无需关闭关键设备。这 种“系统规模优化”策略显著降低了数据中心在使用寿命期间的成本。(3)增强可重新配置的能力:IT的更新周期通常为二年至三年,因此,重新配置、升级或移动能力在NCPI适应性中占据着重要的地位。模块化组件可以拔下、重新排列并重新连接。除了因商业需要而进行的重新 配置之外,IT设备的功率密度随着其物理尺寸的不断缩小(如刀片式服务器)而稳定增长, 因此,也需要定期重新配置机架、供电系统和制冷系统。此外,可热插拔的模块化组件为重新 配置不同级别的冗余、不同电压或不同插头类型提供了可能性。不仅是模块化结构简化了断开 连接、移动并重新连接这一物理过程,除此之外,制造商对设备模块化的仔细设计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论