版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
云计算参考架构在私有云当中,主要包含以下几个组件:物理基础架构、虚拟化层、服务自动化层、服务门户、安全体系、云API和可集成的其它功能。(如图私有云参考架构)图3.4私有云参考架构a) 物理基础架构物理架构的定义是组成私有云的各种计算资源,包括存储、计算服务器、网络,无论是云还是传统的数据中心,都必须基于一定的物理架构才能运行。在私有云参考架构中的物理基础架构其表现形式应当是以资源池模式出现,也就是说,所有的物理基础架构应当是统一被管,且任一设备可以看成是无状态,或者说并不与其它的资源,或者是上层应用存在紧耦合关系,可以被私有云根据最终用户的需求,和预先定制好的策略,对其进行改变。b) 虚拟化层虚拟化是实现私有云的前提条件,通过虚拟化的方式,可以让计算资源运行超过以前更多的负载,提升资源利用率。虚拟化让应用和物理设备之间采用松耦合部署,物理资源状态的变更不影响到虚拟化的逻辑计算资源。且可以根据物力基础资源变化而动态调整,提升整体的灵活性。c) 服务自动化层服务自动化层实现了对计算资源操作的自动化处理。它可以集中的监控目前整体计算资源的状态,比如性能、可用性、故障、事件汇总等等,并通过预先定义的自动化工作流进行相关的处理。服务自动化层是计算资源与云计算服务门户相关联的重要部件,服务自动化层拥有自动化配置和部署功能,可以进行服务模板的制定,并将服务内容和选择方式在云计算服务门户上注册,用户可以通过服务门户上的服务目录来选择相应的计算资源请求,由服务自动化层实现服务交付。d) 云API云应用开发接口提供了一组方法,让云服务门户和不同的服务自动化层进行联系,通过云API,可以在一个私有云当中接入多个不同地方的计算资源池,包括不同架构的计算资源,并通过各自的服务自动化体系去进行服务交互。e) 云服务门户云服务门户是用户使用私有云计算资源的接口,云服务门户上提供了所有可用服务的目录,并提供了完善的服务申请流程,用户可以执行申请、变更、退回等计算资源使用服务。云服务门户收到最终用户的请求时,将根据预先定义好的策略对该请求进行立刻供应、预留或者排队。不同的用户通过同一个云服务门户当中,将会看到只属于自己的应用、计算资源和服务目录,这是云计算当中的多租户技术,用户使用的资源在后台集中,但是在前端是完全的逻辑分离,有众多的安全保护措施来确保隔离。f) 安全体系在私有云当中,具有完整的安全体系,包括物理资源、虚拟化平台、系统安全、应用安全和用户访问安全,每个层次都有相关的安全监控和控制,确保最终用户的应用运行稳定可靠。g) 集成私有云当中可以集成其它更多的功能,以达到更好的服务效果。如服务级别管理,提供更好的服务质量。容量管理,为私有云的服务能力和扩展趋势作出建议。计量和收费,真正实现按使用付费。2.1虚拟化数据中心参考架构2.1.1虚拟化数据中心蓝图图-虚拟化数据中心如图“图-虚拟化数据中心“所示,在整个虚拟化数据中心当中包括了虚拟化平台,虚拟化数据中心管理,虚拟化数据中心备份,虚拟化数据中心运维,虚拟化数据中心安全,总共5个组成部分。通过对每个组成部分的功能进行详细划分,我们可以得到虚拟化数据中心的参考架构图(图3.8虚拟化数据中心架构图)。图-虚拟化数据中心架构图虚拟化平台:虚拟化数据中心的基础和应用运行平台,实现所有计算资源的池化,能够实现共享、动态、集中监控、集中管理、扩展和高可用的特性。虚拟化数据中心管理:虚拟化数据中心的管理平台不但可以实现对底层基础架构的管理,同时也可以实现对虚拟化资源的管理,并且可以在统一的管理平台上实现跨地域,多数据中心的管理。虚拟化数据中心运维:虚拟化数据中心运维平台是确保虚拟化数据中心进行自动化操作的关键平台,也是和未来的有云门户进行接口的平台。虚拟化数据中心备份:通过虚拟化备份平台的建设,对整个数据中心中的应用、数据实现集中的备份和恢复,确保当出现系统故障、误操作等情况下的应用系统可用性和可恢复。虚拟化数据中心安全:集中的虚拟化数据中心安全,根据不同用户、不同管理员的使用权限和角色,对其能够访问的系统,能够执行的操作进行详细的定义。2.1.2虚拟化中心计算平台虚拟化平台组成虚拟化数据中心基础架构平台是面向业务系统以虚拟化技术为核心的一体化架构平台。它主要包含: 统一计算资源层:无状态的计算资源节点,各个计算节点能够透明的添加,调配,更改或删除,并且不影响应用系统的正常运行;单个计算节点应具备更好的虚拟化技术支持能力,优化的CPU和MEM配比,充分保证虚拟技术对物理资源的充分利用;多协议支持能力,要对FC、iSCSI和NFS协议均具备良好的拨接端口和支持能力;精简的连接架构,网络交换架构要控制在二层之内,做到一次布线的多协议,多链路支持能力;图形化的管理界面,能实施动态监控和管理各个模块单元;开放的体系架构,能够连接第三方的统一网络和统一存储及虚拟化资源层。 统一网络资源层:与虚拟交换机环境一体化的网络交换环境,能实现虚拟机提供的平滑漂移;端到端的网络QoS保障,能动态调节虚拟机的网络负载;可支持跨地域的二层网络交换架构,同步状态下能支持100KM的同城数据中心间实现一体化资源池体系;能与现有的网络结构充分融合,应由业界领导的网络厂商的核心产品构成,充分保障兼容性和用户投资。 统一存储资源层:多协议支持能力,要同时具备FC、iSCSI和NFS的稳定支持能力;动态的I/O资源调整能力,通过分层存储(企业级闪存磁盘,光纤通道磁盘和SATA磁盘)自动化的调度其上的虚拟机所处的位置,使虚拟机在存储资源层具备透明的I/O随需调整能力;存储级的虚拟环境快照和克隆能力,要能支持虚拟机环境的快照和克隆技术,对虚拟化环境提供高效的保障环境;针对虚拟化环境的存储消重技术,充分利用虚拟化环境下大量数据重复的特点进行消重支持,更高效的利用存储资源;与虚拟资源层紧密结合的复制和灾备技术,从数据层充分保障虚拟化环境的备份,复制和灾备体系的稳定和高效实现。 虚拟化资源层:稳定可靠的虚拟化操作系统,具备安全高效的内核,充分保障虚拟化操作系统层的稳定可靠运行;极小的性能消耗,最大限度的把物理资源有效的提供给虚拟机进行使用;个体封装,各个虚拟机之间独立运行,互不影响;高可用的支持支持能力,保障虚拟化的业务应用系统可以按需实现容错,漂移,冷备等不同层次的高可用能力;开放性的支持能力,对统一计算平台、统一网络平台和统一存储平台的第三方环境具备良好的兼容性和支持能力,并得到充分的测试认证。在各个统一资源层的基础上通过开放的API接口,构建一体化的监控部署工具进行统一管理,其目标就是构建一套有机结合在一起的,可以快速灵活部署和调用的虚拟化数据中心基础架构体系。图-虚拟化数据中心基础架构平台组成图虚拟化平台功能特性虚拟化数据中心基础架构平台要求整个平台能够端到端的灵活调整资源部署,能够按照业务部署的要求快速的添加和调用资源部署;在这个平台上运行的应用业务系统能够实时调节计算、网络和存储资源配置,而且对应用用户完全透明没有影响;因此该平台应该具备以下功能特点:为应用业务系统提供可快速部署、调配的资源池体系,满足虚拟机的部署和资源灵活调整需求;与虚拟化层技术紧密结合在一起,使虚拟化层的管理工具可以直接快速的调用底层资源;一体化的监控和部署环境,能够对统一计算平台、统一网络平台和统一存储存储的各个层资源进行一体化的监控和快速部署及调整;统一计算平台的各个计算单元应具备无状态的属性特点,满足透明的实时变更、添加和调整计算资源的需要;统一网络平台应具备多协议的稳定支持能力,具备面向虚拟化层的QoS保障能力,具备一致的网络性能和安全规则部署能力;统一存储平台应具备稳定的多协议支持能力,具备面向虚拟化层的I/O实时调节能力,具备完整的与虚拟化技术紧密结合的存储备份、复制与恢复技术能力;经过严格测试认证和预先集成的体系架构,有效避免各个层面的潜在风险,并最大限度的发挥虚拟化平台的优势;在空间、能耗和维护成本上应比传统的物理架构具备明显的优势;能够提供面向SLA的服务级别保障,使用户的整个IT资源平滑的向ITaaS架构过渡;提供统一的支持服务体系,帮助用户快速准确的解决问题。虚拟化平台扩展性虚拟化数据中心基础架构平台要能够满足用户业务应用系统实施变更和快速增长的需求,因此要求整个平台能够具有非常灵活和高效的扩展能力:模块化的快速部署能力,可一体化的添加计算、网络和存储资源,并与原有虚拟化基础平台能够形成统一的资源体系;按需独立横向扩展计算资源、网络资源或存储资源的能力,满足各个层面资源扩展的需求;具备跨地域的资源融合能力,可以将位于不同地理位置的虚拟化基础架构平台融合为统一的虚拟资源池架构,满足用户构建双活或多活数据中心及未来云架构数据中心的需求。虚拟化平台性能虚拟化数据中心基础架构平台必须能够充分发挥虚拟化技术的性能,支持业界领先的虚拟化技术软件所需要的各种功能,并能够在最大程度上发挥虚拟化技术的优势。在稳定可靠的前提条件下,整个统一虚拟化基础架构平台应具备足够的灵活性以满足用户业务应用系统对不同规模和性能的要求。例如:应具备小型、中型、大型的平台建设规模,它们之间的性能和容量不同,但又在一定的范围内灵活可调,同时具备统一在一起融合管理的能力。按照目前用户的普遍规律来划分:小型规模应满足50个左右的业务应用系统或500个左右的虚拟桌面环境;中型规模应满足200个左右的业务应用系统或1000个左右的虚拟桌面环境;大型规模应满足800个左右的业务应用系统或3000个左右的虚拟桌面环境。与现有环境融合虚拟化数据中心基础架构平台是用户今后部署和运维业务应用系统的主要资源平台,同时它又是全面面向虚拟化技术紧密集成的资源平台,所以它需要完善的支持好虚拟化技术所需的各种支撑,而虚拟化资源层则需要尽量丰富的支持用户现有的应用部署环境。以用户现有环境为例,Intel平台上的Windows环境和Linux环境的支持是十分必要的。另外还应该提供有效的工具和服务能够为用户提供所需的从物理环境到虚拟化环境下的应用迁移服务。在用户今后的使用过程中还应提供相应的规划、部署、运维等方面的最佳实践建议。虚拟化平台高可用虚拟化数据中心基础架构平台至少需要具备“5个9”或更高的高可用性,还应该能够用户需求扩展相应的保护和安全手段,满足用户迈向“永不停顿”的云计算数据中心的需求。至少应该从以下层面综合考虑:产品层次的高可用性:冗余的产品模块和结构,在发生局部硬件故障时不影响产品正常使用或可以实时更换修复;架构层次的高可用性:计算,网络和存储控制节点都是冗余的体系架构,充分保障整个系统的高可用性;管理层次的高可用性:管理控制节点和路径均有冗余保障,充分实现管理架构的高可用性;提供不同层级的应用和数据保护能力:根据用户的SLA模型,结合备份恢复,快照,克隆,归档,压缩,消重,同步异步复制,灾备技术,多路径负载均衡技术,等等方面的技术保障,来实现不同级别,比如:小时级别、分钟级别或秒级别的高可用业务保护能力;提供不同层级的安全访问控制能力:能实现针对不同需求用户的功能分层管理,在虚拟化的动态数据中心中也要实时保障整个系统认证的稳定可靠,保障权限分配系统的安全和高效运行,实时监控异常状态,并能够进行处理和恢复。2.1.3虚拟化数据中心管理虚拟化数据中心管理挑战随着虚拟化技术在数据中心的实现,虚拟化数据中心到私有云以及公有云的过程中,传统的IT管理方式已经被彻底改变。虚拟化转变了IT基础架构的管理方式。服务器成了动态软件文件,网络成为了可以灵活调度的资源,存储由单一的阵列和磁盘变成了透明共享的存储空间。IT管理者可按需使用基础架构资源池以更高的速度和效率加以配置、管理和保护。企业可以按最高的可用性和服务级别无缝交付应用程序,而没有传统IT解决方案的高昂成本和复杂性。图-虚拟化数据中心管理挑战:但是伴随着数据中心虚拟化程度的深入,用户将会面临越来越多的管理瓶颈(如图-虚拟化数据中心管理挑战):IT架构复杂度提高随着IT系统虚拟化程度越来越高,面临的虚拟化管理也越来越复杂;基于虚拟化平台的企业内部应用系统越来越多,使得虚拟数据平台的压力变的多样化,同时多样的应用对虚拟化平台资源的交付要求也有差异;业务系统的发展使得对分布式虚拟数据中心的需求也提上了日程;用户将要面对的是私有云和公有云的转变,如何保证目前虚拟化数据中心可以平滑的过渡到未来发展的私有云到公有云,这种转变要求目前的架构具有可靠地弹性管理。 IT管理成本增加的趋势毫无疑问,虚拟化将用户从传统的管理方式过渡到虚拟化之后,面对大量的虚拟资源,虚拟服务器,虚拟存储,要求数据中心管理成本必须得到控制,不能够随着虚拟机数量的增多以及其他要控制的虚拟对象的增多而无谓的增加管理人员的开支,管理软件的购买等成本消耗上。虚拟化管理的TCO要达到更高的水平,就必须依赖于虚拟化架构上的管理手段,而不能依赖于将虚拟化平台甚至私有云架构放到第三方昂贵的管理软件产品中去。 IT管理效率业务应用系统对IT服务的交付要求越来越高,同时虚拟化数据中心的业务流程亟待完善,面对提高IT管理效率压力的同时,还要保障IT管理服务的级别。虚拟化数据中心管理参考架构图-虚拟化数据中心管理参考架构虚拟化数据中心的管理系统建立包含多个方面的内容,从上图(图-虚拟化数据中心管理参考架构)可以看出,虚拟化数据中心管理虚拟化数据中心面对的管理主要关注以上五个部分的内容:虚拟化数据中心资源池管理:针对虚拟化数据中心当中基础架构的管理,能够实现对服务器、网络、存储的统一和融合管理,能够实现对异构资源的管理。虚拟化资源管理:在虚拟化数据中心当中,所有的计算资源都是虚拟化的方式体现,以逻辑单元的模式对应用提供服务,虚拟化数据中心管理系统应当实现对虚拟化资源的集中管理,包括自动发现,统一监控,自动化配置,资源调配,虚拟服务器部署等。高可用性管理:关键性业务在虚拟化平台上的运行必须要有高可用平台的保证,虚拟化中心管理平台需要能够为应用提供数据迁移、复制和容灾等方面的管理功能。服务级别管理:虚拟化数据中心的资源将通过标准化服务的模式提供,管理系统应当能够提供流程自动化管理,ITIL管理和CMDB联合。丰富的API接口:虚拟化数据中心管理平台需要具有丰富的API接口,为用户提供标准化的、开放的用户业务系统开发接口,实现与用户现有系统的对接和扩展。资源池管理对于虚拟化数据中心的基础部分,是由基础平台的计算资源,网络资源和存储资源共同组成的,对于不同的资源,管理员必须实现统一的资源管理才能够对各种资源做更好的调度和分配。统一的基础架构管理平台应当提供了对于资源池的统一管理和资源的自动化灵活配置等多种有效的虚拟数据中心管理功能。包括:统一的对各组成元素的管理,减少多个服务器,网络和存储配置的管理工具从单个管理点管理单个的虚拟化中心计算平台和跨地域的计算平台,实现变更的合规性管理整合的控制面板基于策略的配置和更改管理深度可见性,可以从虚拟层到物理层的深度定位可以对整个系统的硬件和应用进行监控可与第三方企业管理解决方案集成虚拟化资源管理通过采用虚拟化资源的管理平台,IT管理员可大幅改进对虚拟环境的控制:提供集中的虚拟资源控制和实现虚拟基础架构各个级别的可视性。通过前瞻性的资源管理更好的发挥每个物理资源的性能。能够实现资源清单搜索,使得包括虚拟机、主机、数据存储区和网络在内的整个虚拟化资源在虚拟化中心中的任何位置唾手可得。存储映射和报告可传达有关存储使用、连接和配置的信息。可定制的拓扑视图为您提供存储基础架构的可视性,并可帮助进行存储问题的诊断和故障排除。性能图表通过可实时或按指定时间间隔查看的更详细统计数据和图表,监视虚拟机、资源池和服务器的利用率及可用性。主机配置文件标准化并简化您配置和管理虚拟主机配置的方式。捕获经过验证的已知配置(包括网络、存储和安全设置)的蓝图,并将其应用于多台主机以简化设置。主机配置文件策略还可以监视遵从性。能效完全支持资源动态调度,可持续监视同一个个资源群集中的利用率,并在群集只需较少资源时将主机置于备用状态以减少能耗。提供一个功能强大的编排引擎,使您可以使用即时可用的工作流来自动执行多个任务,或使用轻松的拖放式界面来组装工作流,从而简化管理。具有资源整合指导功能,可指导您逐步完成整合过程,包括自动发现多台服务器、执行性能分析、转换,以及智能化地在适当主机上放置虚拟机。虚拟资源管理可以实现大规模管理,随着用户虚拟化的不断深入,和应用的不断增多,单台管理服务器需要管理成百上千台服务器,而且虚拟资源管理服务器应当可以通过链接模式进行扩展,可以跨越多个数据中心进行管理,并管理更多的虚拟资源。虚拟资源管理服务器的链接模式应当利用在整个基础架构中复制的角色、权限和许可证,实现可扩展的体系结构和跨多个虚拟化数据中心实例的可视性,使您可以同时登录、查看和搜索所有虚拟化数据中心的资源清单。虚拟机的资源管理。将处理器和内存资源分配给运行于同一物理服务器上的多个虚拟机。建立针对CPU、内存、磁盘和网络带宽的最小、最大和按比例的资源份额。在虚拟机运行的同时修改分配。使应用程序能够动态获得更多资源以适应峰值性能需要。动态资源分配。实现跨资源池的持续监视利用率,并根据业务需要和不断变化的优先事务的预定义规则,在多个虚拟机之间智能地分配可用资源。高能效的资源优化。持续地监视整个虚拟资源池群集中的资源需求和能耗。当群集只需较少的资源时,它将整合工作负载并将主机置于备用模式以减少能耗。当工作负载的资源需求增加时,将已关闭的主机恢复在线,以确保满足服务级别要求。与标准化目录管理系统集成。实现基于现有的身份验证机制实现访问控制。定制角色和权限。利用用户定义的角色增强安全性和灵活性。拥有适当权限的用户可以创建定制角色,如夜班操作员或备份管理员。通过为用户分配这些定制角色,可限制对由虚拟机、资源池和服务器组成的整个资源库的访问权限。审核跟踪。保留对重大配置更改和发起这些更改的管理员的记录。导出报告以进行事件跟踪。高可用管理 虚拟化数据中心管理平台的高可用性管理包括对管理服务器本身的高可用管理和对管理资源中的应用高可用。虚拟化资源高可用管理可扩展数据中心的可用性,虚拟化资源高可用管理能深入了解所有数据中心的服务器组件,并且非常易于配置和部署。能够自动重启虚拟机。提供一个易于使用、经济高效的故障切换解决方案。精确的访问控制,利用可配置、分层的组定义和精确的权限来保护环境。集成硬件监视可在硬件的主要组件(如风扇、主板和电源)发生故障时发出警报,从而提供物理和虚拟服务器运行情况的综合视图,预防和快速解决问题。警报和通知支持新的实体、指标和事件,如特定于数据存储区及虚拟机的警报。这些警报可触发新的自动化工作流以补救和防范问题。服务流程管理客户业务的快速变化对IT部门提出了更高的要求,如何能快速响应业务推出新的IT系统;如何保证IT系统安全、稳定的运行;如何提高服务效率和服务质量等问题成为目前IT部门主要面临的压力。而服务流程管理和自动化服务可以使用户更好地使用动态资源池中的资源,使管理方更好地管理动态资源,提供服务。服务流程管理系统应当从两个部分来进行功能建设,一个是面向服务使用用户,另一个是面向服务的管理功能,主要包括以下内容:面向服务用户:VDC管理:创建、配置、调整、删除VDC,支持对虚拟设备管理;资源申请:通过Web界面申请资源环境、时间周期、SLA要求、环境配置等;计费管理:根据VDC查询得到分配资源的使用情况、计费、结算管理等;监控管理:查询VDC的运行状态,实施监控资源状态;用户管理:建立用户、授权管理、密码管理等;日志管理:运行日志的查询、分析和审计管理等面向服务管理:客户管理:多租户管理,服务满意度、服务投诉、SLA/OLA管理;计费管理:费率、服务包、折扣等定义,结算、收费、提醒等管理;监控管理:VDC、虚拟设备、物理设备监控;报表管理:固定报表、动态报表、统计分析、仪表盘等;平台管理:资产配置管理、资源分配管理、服务交付管理等;系统日志:系统日志、安全日志、自定义日志管理;服务流程管理系统的系统架构应该考虑到其核心组件的驱动、扩展和组件扩充能力,同时,整体系统应该有分层设计的特点,具体内容如下:核心组件能力驱动管理组件:具有统一驱动知识库管理功能,可支持多厂家虚拟化技术及管理平台接入;(目前完成VmwareApi、Vizioncore管理平台接入)采控服务组件:完成服务项运行状态信息采集、实现服务项操作控制功能;策略控制组件:可设定规则、设定性能指标阈值,触发不同任务及工作流;利用该组件可实现资源池预警、服务项资源动态分配、服务等级保障等工作流引擎:图形化方式预定义工作流,可实现自动或人工任务单流转。平台分层设计资产管理:对物理设备资产信息进行信息手工录入、自动采集,信息变更采集对比提醒;资源池管理:资源池分类管理、资源池容量及性能管理服务管理:完成服务目录、服务项定义,服务模版包括配置模版、部署模版、SLA模版交付管理:对服务用户VDC及其服务项实例进行管理,完成基础架构云服务交付通过服务流程管理系统,业务部门和用户可以方便的进行计算资源的申请、交付、维护和运行、回收及再利用(如图-资源申请流程)。图-资源服务流程资源的申请确保业务部门和用户可以方便地申请IT服务和资源,通过将服务目录与资源请求管理流程集成在一起来实现,服务目录作为一个工具在创建、管理、服务定价和与IT工作整合方面变得越来越重要。应该让业务部门和用户可以基于他们的业务需求和预算情况从服务目录中选择合适的服务和对应的成本。对于每个产品和服务,保证恰当的服务级别,审批流程以及相关的成本。通过从一开始就为客户设定好期望可以减少IT与业务部门之间的不一致,这些期望包括实现请求的时间,所要执行和审批的流程以及实现请求所需的费用。同业务部门和用户约定从服务目录中选择服务,而这些服务是IT定义和维护的标准的产品和服务的集合。这样作也可以保证IT必须选择标准化的产品和服务,以便通过减少因为购买非标准的,没有经过测试或审批的产品所带来的风险。允许业务部门和用户很容易的找到、请求他们所需要的服务和跟踪服务的处理状况,这样作可以提高请求实现处理情况的透明度(跟踪从提交到完成的请求状态,也跟踪资源的使用状况,相关的成本和基于服务级别协议交付的治理)。为了提高客户的满意度,IT可以提供服务报表,发布对业务经理和用户来说有意义的指标,来展示服务的执行情况(如完成一个服务请求所用的平均时间),表明IT部门如何完成所承诺的服务内容(如满足承诺的服务请求完成时间的能力)。资源的交付在完成资源申请后,IT部门将根据确定的服务能力和要求转换为虚拟化架构可提供的资源配置,并通过自动化和程序化的管理快速的为客户提供资源,并对交付的虚拟化资源进行追踪和记录。根据当前的IT运维模式,建议以以下三种方式进行虚拟化资源的交付: 对同当前运行虚拟机有相同配置要求和业务应用要求的,可使用Clone的方式复制虚机,客户化后交付; 对配置和能力要求有相应模板对应的虚机,可从模板转换为虚机进行交付。模板的定义应符合能力及安全基线的要求,并随时根据相关管理要求进行更新。 对不符合以上两种情况的,可使用自动定制化的方式创建虚拟机,并进行客户化配置和按照要求进行标准化配置,如安全加固要求、防病毒要求,认证授权配置及审计配置等,然后进行交付。资源的运行及维护用户可通过IT运维管理流程和机制来支撑当前的IT运行和维护,主要包括:事件管理问题管理变更管理配置管理能力管理所交付虚拟化资源的运行维护可集成在当前统一的IT运维管理中统一进行管理,考虑到虚拟化架构的特殊性,可在以上各管理流程中增加虚拟化架构的各服务属性。资源的回收及利用资源的回收和利用主要同业务应用的运行周期相对应,对下线业务应用和不再使用的业务应用停止虚拟机,释放相应的CPU、内存、网络及存储资源,同时根据业务和合规性要求对退网的虚拟机文件进行归档和保留。虚拟化资源回收和利用的审批可在流程管理系统中进行,资源回收和利用的工作流可通过工作流系统进行管理。管理平台扩展一个有效的成功的虚拟化数据中心管理平台必须同时是一个开放的,具有完善接口的平台。每个企业面临的应用不同,如何将这些业务系统和虚拟化平台的管理联系起来,是衡量一个虚拟化数据中心管理平台的重要部分。 能与系统管理产品Web服务API的集成可保护您的投资,让您可以自由选择如何管理您的环境。 是可扩展的管理平台,且拥有庞大的合作伙伴体系,对操作系统和应用程序的兼容性很强。基于这种开放性,使得虚拟化数据中心的管理可以和企业现有管理平台很好的结合起来。2.1.4虚拟化数据中心备份虚拟化数据中心备份挑战根据IDC的统计表明,在虚拟化环境下,备份系统遇到了新的挑战,在有限的资源中,在更少的时间内,如何备份大量的重复的数据。与传统的备份环境不同,虚拟化环境下的计算资源,不再是有大量的空闲时间,平均资源利用率不到30%,而是由于单个物理服务器上运行大量的虚拟环境,资源利用率达到80%甚至更高。传统备份软件消耗大量的处理器,这种备份机制在传统的物理服务器使用模式下可以应用,但是在虚拟化环境下,将会由于占用的处理器资源过大而带来问题,影响应用的性能和服务级别。同时,由于虚拟化环境下,备份的内容会包括虚拟化系统的系统文件等,在每次对虚拟文件镜像进行备份时,会存在大量的冗余数据,如果不进行重复数据的删除,大量的系统文件占用的空间将被浪费,同时,在备份过程中,由于占用大量的带宽,也会对应用的性能带来影响。所以,我们需要一种新的备份机制,能够占用更少的处理器资源,同时能够利用更少的空间去存储更大的数据。重复数据消除工作是一种特殊的数据压缩技术,能够消除掉在备份过程中冗余的部分,或者是重复的部分。在消重的过程中,重复数据会被删除,只保留唯一的一份数据存储下来,重复数据的备份仅仅是增加一个引用指针。消重能够大大降低备份过程中所需要的存储空间。虚拟化数据中心备份参考架构在虚拟化数据中心中,备份系统的参考架构如下图所示(图-备份参考架构)图-备份参考架构参考架构由三层组成:1. 管理层集中的管理服务器来进行整个备份和恢复系统的管理,包括配置、策略、汇报,介质管理,客户备份目录管理,恢复目录索引管理等。2. 介质层备份介质可以使磁盘、虚拟带库(利用磁盘模拟磁带)和磁带,是用来存储备份数据,用来进行恢复使用。3. 客户端通常包括虚拟服务器、应用平台(如SqlServer,Oracle,.NetWeb服务器)等客户端是备份数据的源端,其产生的数据将交由备份系统备份到备份介质上,用来进行应用回滚和灾难恢复。在并行数据中心中,参考架构如下图所示(图-并行数据中心备份架构)图-并行数据中心备份架构虚拟化数据中心备份设计原则1. 统一的备份管理架构,提供简便的操作管理界面;并提供强大的备份报表功能,制定和不断完善备份策略。2. 确定虚拟环境的备份策略,采用不同的备份技术,实现多样化的备份方式,以提供多种数据恢复策略,从而增强备份系统的可用性。3. 设计快速有效的备份数据恢复机制,实现备份系统在业务系统允许的异常时间内进行数据完整无丢失的恢复。4. 基于disk为主的备份介质,结合数据重复删除技术及数据传输技术在最短的时间里,安全地把数据保存在异地。5. 制定完善的备份数据保存策略,实现备份数据的异地存放,从而达到系统的容灾目的。6. 支持虚拟环境的统一应用接口(APIs)2.1.5虚拟化数据中心运维随着虚拟化架构的建立,系统架构中不但存在物理设备,还将存在大量的虚拟设备,如虚拟机、虚拟磁盘、虚拟CPU等。虚拟化动态架构的易扩展和变化的特性可能造成虚拟机大量蔓延,出现违反公司法规的操作,对日常的运维管理造成巨大挑战。虚拟化运行维护主要从运行监控和IT运维流程的角度确定保证交付和支持有效的虚拟化资源的正常运行的技术能力。因此,为了简化运维管理工作,降低运维管理的复杂性,提高运维管理效率和运维管理质量,必须要建立对虚拟化环境的运维管理系统,建立集中管理系统,实现设备性能监控、故障告警、配置管理和软件管理等功能,简化运维管理工作、提高运维管理效率的自动化手段。运维组织和角色定义a) 虚拟化组织架构虚拟化运维组织基本可分为三级(如图-运维组织),流程管理系统人员为0线,负责基础架构的监控和初步的事件判断和处理;应用管理员、数据库管理员、系统管理员、网络管理员、存储管理员、备份管理员、虚拟化管理员等为1线人员,负责处理0线人员升级的请求和问题处理;IT运维团队为2线人员,负责处理无法解决的故障问题。图-运维组织b) IT运维团队人员分配 其中IT运维团队的人员根据其角色和职能的不同,又可以分为业务部门,IT管理层,IT运维经理和系统工程师,其具体的工作内容如下表所示:角色职能业务部门(用户)向IT部门提出资源申请与IT部门充分沟通,详细描述业务要求和设计实现同IT部门共同确定IT的服务和资源要求IT管理层虚拟化资源请求的审批物理资源请求的审批同业务部门领导的沟通和协调IT运维经理对当前虚拟化配置人员进行指导将虚拟化架构的管理集成到当前的IT服务管理流程中协调和组织虚拟化架构规划定义虚拟化架构相关变更的指南推动虚拟化架构开发和维护的预测负责虚拟化架构的供给,使用和维护负责协调同其他职能团队的协作.负责协调厂商的支持维护和更新虚拟化决策标准,评估虚拟化备选对象的资源需求协调和解决与应用相关的虚拟化问题协助虚拟化架构管理经理进行虚机的开发预测,负责开发和维护虚拟化架构的预测负责日常的虚拟化架构容量和资源管理发起新虚拟化架构模块的申请根据事件和问题管理流程,处理能力和性能相关问题根据变更管理流程评估虚拟化架构的变更系统工程师负责开发和维护虚拟化架构设计,包括:虚拟化架构图安装和配置手册集成计划设计迁移计划设计测试计划设计同网络和存储管理员合作构建虚拟化架构的实例,使虚拟化架构的功能正常运行支持设计、配置、安装和发布流程补丁管理和对虚拟化环境的影响评估开发和维护虚拟化架构运维手册指导流程管理系统小组的虚拟化支持工作协助问题和事件管理流程解决相关虚拟化问题开发软件和硬件升级计划完成新虚拟化架构模块安装后的配置工作创建新的虚拟机负责P2V迁移在虚拟机完成生命周期后负责删除虚拟机管理虚拟化架构的数据存储空间管理快照开发和维护虚拟化中心的角色协助服务水平管理确定虚拟化架构的维护窗口协助事件和问题管理流程解决虚拟化架构的相关问题安装和测试虚拟化补丁确认虚拟化架构有有效的监控手段来进行监控管理负责执行配置管理流程的虚拟化架构的配置项管理虚拟化运维内容:IT运维通过标准化的,策略化的,自动化的运维体系建立,对虚拟化数据中心的各种IT操作进行标准化定义,降低IT操作的风险,提升整体的IT维护效率,并确保IT服务的质量,具体的运维系统内容如图(图-虚拟化运维内容)所示:图-虚拟化运维内容a) 容量管理为更好支撑系统运行维护,需要系统运行现状,评估虚拟化基础资源的支撑能力,分析虚拟化资源的趋势特点,对将来需要及资源的预期进行测算,制定容量规划,使得虚拟化资源可以在有效范围运行,提升运维的控制能力和准确性,使系统建设规划可以按需分配。虚拟化容量管理涉及如下关键因素:性能分析资源趋势分析资源的分配及利用率分析虚拟化能力管理可分为以下几个层面:整个虚拟化数据中心的容量动态资源组内部的容量虚拟化服务器的容量虚拟机的容量虚拟化容量管理的服务要求虚拟化能力管理的服务参照服务目录如下:性能分析:定义性能分析的内容及周期资源分配及利用率分析:定义资源分配和分配资源使用率分析的内容及周期能力趋势分析:定义性能和资源使用率趋势分析的内容和周期容量管理流程通过评估后,建立容量管理流程并交付容量管理规划流程图。容量指标定义协助客户有效掌握虚拟化资源运行支撑能力,设定容量指标用于衡量虚拟化架构的支持能力,以进一步持续优化容量管理。对象包含如下:虚拟数据中心动态资源组虚拟化服务器虚拟机容量管理报告为有效的监控虚拟化资源的使用和利用率,需定期的生成各种虚拟化架构的能力报告,以便掌握虚拟化架构的当前运行能力和使用效率,并对资源的使用进行趋势分析,掌握可扩展的能力,并按需求提供虚拟化资源。协助客户定义和交付虚拟化容量管理报告,主要内容如下所示:性能使用报告资源分配及利用率分析报告资源使用趋势分析报告b) 配置管理虚拟化配置管理通过发现,控制,维护和确认虚拟化环境的所有配置项(CI)及其关系构建虚拟化架构的配置管理数据库,并根据变更需求进行更新,保证并统一集成到当前的配置管理流程中。虚拟化增加如下配置管理属性:虚拟环境的特殊配置属性虚拟资产的配置除具有原物理环境的资产属性外,还需对虚拟机增加如下属性:虚拟机的服务起始时间虚拟机申请的服务期虚拟机的宿主机虚拟化配置服务管理的服务要求虚拟化配置管理的服务要求参照服务目录的定义CMDB建立:收集虚拟环境的CI信息建立配置管理数据库配置变更:当虚拟化环境发生变更后,更新配置管理数据库中相关配置项的时限c) 变更管理虚拟化变更管理以标准的方式和过程快速有效的处理虚拟化环境的变更请求,统一集成到当前的变更管理流程中,协助客户增加/修改,定义管理属性。虚拟化变更类型虚拟化变更的类型主要包括:虚拟化架构的物理变更虚拟机状态变更虚拟机配置和位置变更虚拟资产的变更补丁升级管理定义虚拟化变更流程设定变更的请求、批准、实施的人员角色定义变更请求发起变更请求验证变更请求确认变更请求实施集成配置管理更新虚拟化变更的服务要求(OLA)虚拟化变更管理的服务要求参照服务目录的定义平台供应交付:定义确定业务需求后和经过审批后,交付满足业务要求的虚拟机及相关资源的时限系统配置变更:定义根据业务要求和经审批后,对现有虚拟化系统更改配置并交付满足业务要求的虚拟机及相关资源的时限资源释放:定义根据业务要求和经审批后,对现有虚拟化系统退网处理并释放相关资源的时限d) 事件管理虚拟化事件管理跟踪所有虚拟化环境故障事件,维护相应记录,及时处理等内容,统一集成到当前的事件管理流程中。虚拟化增加事件管理属性如下:虚拟化事件来源虚拟化事件来源主要包括:安装在虚拟机和虚拟化服务器上的监控软件vCenter发出的警告(Alarm)及事件(Event)虚拟化硬件平台告警和时间虚拟化事件类别在事件管理中增加虚拟化事件类别,子类可定义为:DataCenterCluster虚拟化服务器虚拟机虚拟网络虚拟存储虚拟化事件分级与处理流程目前可提供严重错误、警告和一般信息三级虚拟化事件告警,虚拟化事件分级可按同当前的分级标准映射,统一进行事件管理。建立虚拟化事件处理流程:定义事件处理角色和职责虚拟化事件收集与分类虚拟化事件升级虚拟化事件解决输入问题管理数据库虚拟化事件管理的服务要求(OLA)虚拟化事件管理服务要求定义如下内容:服务时间:定义接受和处理故障的工作时间响应时间:定义收到故障事件后进行响应的时间要求故障处理时限:定义故障发生后必须处理并解决的时间,如不能解决则升级处理问题转换:定义如果时间处理超过时限,是否转换成问题故障/事件报告:定义故障统计报告的周期及内容e) 问题管理虚拟化问题管理通过故障事件、问题和错误的收集和记录,预防已知虚拟化问题出现,减少对业务影响,并统一集成到当前的问题管理流程中,在当前的问题管理流程中增加虚拟化问题分类,知识库建立,其他属性可集成到当前问题管理流程中。设计问题管理流程:定义问题管理人员角色和职责识别故障事件、问题和错误问题根源分析问题影响分析输入知识数据库虚拟化问题管理的服务参照服务目录如下:服务时间:定义接受和处理问题的工作时间响应时间:定义收到问题请求后进行响应的时间要求问题处理时限:定义问题产生后必须处理并解决的时间,如不能解决则升级处理问题根源分析及处理报告:定义问题处理后的根源分析和问题处理过程方法以及和保留总结方式问题报告:定义问题统计报告的周期及内容f) 服务等级管理虚拟化服务等级管理持续监控虚拟化平台运行性能与客户体验,确保虚拟应用持续稳定的满足业务需求,提升虚拟化服务等级质量,集成到当前的服务等级管理流程中,增加虚拟化服务等级管理属性。建立虚拟化服务器等级管理体系,内容包括:建立虚拟化服务目录确认服务等级参数与目标,设立KPI指标与容量管理和财务管理集成监控系统性能和可用性水平确认并解决限制服务等级的瓶颈输出服务等级报告g) 资源成本控制虚拟化财务管理通过统计虚拟化环境的资源使用,建立财务成本模型,为虚拟化资源的合理使用和未来财务规划提供决策支持。建立虚拟化财务管理流程,内容包括:收集成本的类型和要素定义成本单元监控虚拟化资源使用状况构建成本模型TCO/ROI报告收费结算h) 生命周期管理为了保证向用户交付满足业务服务要求的高性价比的虚拟化资源,保证所交付虚拟化资源的持续稳定的提供服务,保证根据业务的生命周期合理的创建、分配、交付、回收和重新利用虚拟化资源,在满足业务服务要求的基础上,获得最大的投资回报比,将整个虚拟化资源的生命周期分为虚拟化资源申请、虚拟化资源交付、虚拟化资源的运行维护及虚拟化资源的回收利用四个阶段。虚拟化资源(虚拟机)生命周期管理建立标准的虚拟化资源的申请,交付和回收流程,确保虚拟化资源的有效利用,防止虚拟机蔓延(sprawl),减少安全风险。虚拟化资源的服务交付和支持过程图虚拟化资源生命周期管理流程建立:虚拟化资源生命周期管理流程内容包括:定义人员角色和职责:申请者(用户),批准者(IT管理者),实施者(虚拟化管理员)建立虚拟化资源服务目录资源申请流程:申请,审核确认,批复,资源交付资源的运行维护,状态监控资源回收(过期,业务下线):下线通知,审核确认,备份归档,释放资源配置,容量,变更管理更新虚拟机生命周期属性参考虚拟机请求日期,虚拟机创建日期,虚拟机过期日期,虚拟机状态(请求,建立,活动,删除等),虚拟机拥有者等虚拟化资源的服务交付和流程图(图-虚拟化资源服务交付流程图):图-虚拟化资源服务交付流程图虚拟化资源生命周期管理KPI服务时间:定义接受和处理请求的工作时间响应时间:定义收到请求后进行响应的时间2.1.6虚拟化数据中心安全虚拟化技术带来的好处不言而喻,它可以使企业对硬件资源进行有效地整合,并且可以在单一的硬件上运行多个虚拟机,不同操作系统,不同应用的虚拟机都可以运行在同一台物理机上,因此优化了硬件的利用率。虚拟化技术现在正在大规模广泛的被应用到企业当中,因此,企业不能局限于传统的安全防护手段,而是要在虚拟化层进行安全控制,才能给企业IT带来更高的安全性。但是目前国内的很多用户在实施自己的虚拟化数据中心的时候,过多的考虑了虚拟化技术的实现,而对于构建一个安全可靠地数据中心并没有什么考虑,甚至不知道怎么去实现虚拟化数据中心的安全性。虚拟化数据中心安全设计原则当用户实施虚拟化技术的时候,企业必须确保他们能够持续的保障安全的虚拟化环境来满足他们应用和数据的可靠性,安全性。保护管理控制安全总是隐含在适用于虚拟和物理环境的基本安全原则中。因此,保证虚拟化管理的安全始于保证物理环境的安全并将这些安全原则扩展到虚拟化中。限制可能会导致未经授权的高级权限访问的风险。安装防恶意软件、防火墙和主机入侵防护系统等常见安全工具。禁用不必要或多余的功能。为修补程序、更改、资产和配置管理等服务管理流程保留系统资源。应该将安全配置内建在固定模板中,以确保在部署新系统时能够正确配置。这包括物理主机配置、管理程序的配置和每个客户虚拟机的配置。网络分段拓展了虚拟化环境的维度,因为每个客户虚拟机都具有各自与虚拟主机外部的物理和逻辑网络拓扑的连接和在主机自身内部的连接。在大多数情况下,应该隔离客户虚拟机之间的网络通信。VMwarevShieldZones等技术可以限制虚拟机之间可能会带来风险的通信,并将长期建立的网络分段原则扩展到虚拟世界。与特定物理接口的连接可以进一步确保这种保护性隔离,并降低软件配置风险。虚拟化管理系统的配置尤其重要,因为这些配置可直接控制功能。例如,VMwarevCenter提供了对VMware环境的集中管理,因此必须小心部署。限制对正在运行vCenter的主机的管理访问。vCenter自身应该运行在一个专门为此目的准备的独立管理帐户下管理网络和生产网络应该相互隔离,以限制可能造成对管理功能未经授权访问的风险。如果授权管理访问权限,应该适用最低权限原则。管理访问权限应该尽可能与个人责任联系在一起。应该限制对根用户等共享管理帐户的访问,同时还应严格限制“su”等工具。基于角色的访问控制(RBAC)提供了一种将管理功能分为多个单独角色的方法,授权用户可以根据需要调用角色。对于VMwarevCenter,它的CustomRoles功能提供了一种根据角色定义和分离管理权限的内置方法。环境监控非常重要,尤其是监控管理访问和操作,包括授权和未经授权的访问与操作。公司应该在计划部署事件管理工具时深入了解虚拟化风险。这包括监控对虚拟机映像存储资源的访问。在此,基于RBAC的角色分离应该有助于确保那些具有管理访问权限的用户不能同时具有篡改管理操作证据的能力。虚拟化数据中心安全架构图-虚拟化数据中心安全参考架构在虚拟化数据中心安全设计当中,由于相比于传统的安全管理环境增加了虚拟化层,并且由于虚拟化漂移技术的出现,和动态资源变更的需求特点,必须要考虑更多的原则,来确保整体的虚拟化数据中心安全。硬件和虚拟化平台的整合监控:对基础架构的安全监控不仅仅需要针对物理设备,且需要对虚拟化资源进行监控,如虚拟化系统文件,虚拟化网络设备,虚拟化计算资源池等,做到确保计算平台环境的安全。从虚拟架构层开始:在虚拟化环境当中,存在虚拟化宿主服务器,用户可能采用多种虚拟化技术来进行虚拟化的实现,安全监控应当能够深入到虚拟化架构中,对虚拟化技术产品进行监控,如虚拟化环境下的攻击可能并不发生在从某一物理端口到另一端口,而是在虚拟化服务平台上,同一台物理服务器内部的两个虚拟机之间。逻辑化安全策略:在虚拟化环境中,虚拟化服务器,虚拟化网络端口都可能随着资源的动态变化进行资源池内的漂移,安全策略不能绑定或固定在某一个物理的资源上,必须能够跟随虚拟资源进行动态变化。统一汇报和深度挖掘:在虚拟化环境中,资源的复杂度相比物理环境下层次更多,互相之间的联系也更加复杂,且动态变化,虚拟化环境下的安全管理系统应当能够从众多联系之中,众多安全事件的联系之中,给出联合的汇报,并可以对具体的事件进行细化分析,深度挖掘,帮助管理员迅速找到安全问题。虚拟化数据中心安全组成安全解决方案包括信息安全领域通用的安全措施,同时针对虚拟化的引入,应当具有特别针对虚拟化提出了相应的解决手段,主要包括五部分内容:硬件平台加固对虚拟化总线和管理层进行加固,同时遵循虚拟化技术厂家,互联网安全中心(CIS)和信息系统防御组织(DISA)的标准。虚拟化增加了新的总线Hypervisor层(也可以被看做是虚拟机管理器层),在这一层,总线层对虚拟资源进行分配和调度等工作;同时虚拟化架构还包括虚拟网络和虚拟交换机。所有的这些组件,在传统的数据中心都是由物理机构成的。虚拟化技术同时还引入了新的管理层,负责对虚拟架构的管理。所以为了减少未授权访问的风险,Hypervisor层和管理层必须被“加固”。系统加固帮助减少了系统的安全脆弱性,通过一系列的措施,例如为虚拟架构平台配置安全的设置,应用最新的补丁包。虚拟化服务器对于它的虚拟化架构安全提供了一系列的加固方法,自动化的工具大大的降低了管理工作的负担。可以帮助每个系统确保配置成符合行业标准的系统,并且可以定制化配置特性,同时提供了系统变更的监控和管理。配置和变更管理对于虚拟化系统的配置和变更管理,对于保证IT系统的准确性和灵活性有重要的作用。虚拟环境的访问控制规则安全认证用来增强强壮的,多重的管理员身份认证,使得认证用户在访问虚拟化服务器管理终端的时候是可信的。虚拟环境中的网络安全和网络隔离充分利用虚拟化软件提供的功能(虚拟交换机,虚拟防火墙)妥善段虚拟机和虚拟网络。日志审计为客户提供了虚拟化平台原始的日志审计,并且可以对特定事件进行告警。并且,安全管理平台可以配置成对特定的异常和怀疑的行为进行告警,例如当有新的机器进入到虚拟的数据中心等等。2.1.7虚拟化数据中心容灾数据中心容灾的挑战近年来,很多企业都在面临一大难题,即:如何对他们的基础设施、技术和网络进行灾难备份与恢复,以保证其业务连续性。一个高性价比的容灾解决方案可以帮助企业以一定的IT投入获得最大的产出,同时很好地保护企业的业务免于灾难事件的影响。在多年以前的主机时代,很多企业选择建设第二数据中心,以此来平衡生产中心的工作量,并对企业的备份能力进行测试和改进,从而满足业务运营的要求并提供灾难恢复保障。随着时代的变迁,数据中心的工作量不断膨胀,对第二数据中心的管理和协调也越来越困难。为满足由于业务增长而急剧增加的数据量对数据中心的要求,更大、更复杂的数据中心环境开始出现。除此之外,众多分布式技术平台和安装在各种层面上的系统软件不断出现,而网络技术的发展也使得“随时随地任意互联”成为可能。很多企业开始认识到技术已经越来越难以维护和管理,这不仅增加了维持灾难恢复能力的复杂性,也导致了管理一个完全冗余的第二数据中心无法实现,特别是考虑到对财务、运营和技术方面的整体影响。为了帮助解决这些问题,IT服务提供商引进了多企业共享灾难恢复设施的概念——建设一个配备各种必需技术的综合基础设施,它可以被虚拟地划分为任意大小并进行相应的配置。这一“热站”概念为客户的个性化需求提供了一个资源池,并且全部都由第三方供应商在异地管理,因此可以远离企业的生产中心。这第一次证明了虚拟化灾难恢复策略的可实现性。数据中心容灾中的虚拟化从整体上看,虚拟化方法的主要好处是可以通过整合来实现规模效应。大量的服务器、存储和网络集中在一个资源池中管理,并可以按需配置。从灾难恢复的角度来看,当灾难发生时,资源池可以配置更多的容量和网络接入来帮助恢复主要生产环境。虚拟化方法有其独特的吸引力,但还需要考虑很多潜在的因素。在虚拟化技术下,服务提供商可以在个性化需求的基础上为企业提供约定的资源。为实现对硬件的最大化利用,单一物理设备将被虚拟化为多个分区,从而实现对多个环境进行恢复。同时,这种方式也允许企业只购买其需要的资源。随着时间的推移,对分布式处理恢复的更大需求越来越明显和必要。企业开始认识到利用软件去装备虚拟机器的技术,这种技术可以在恢复场地的独立硬件设备上进行恢复,同时使得明确和描述恢复过程变得更加容易——只需明确定义备份,以及严格遵守硬件的具体要求即可。假设容量、存储和界面足够充分可以为每个个体提供相等或更多吞吐量,就可以实现大量的虚拟机器恢复到一个物理点上。数据容灾的等级和技术容灾备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。根据容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行。设计一个容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。第0级:没有备援中心这一级容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。第1级:本地磁带备份,异地保存在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。第2级:热备份站点备份在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。第3级:活动备援中心在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:①两个数据中心之间只限于关键数据的相互备份;②两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。虚拟化灾难恢复策略的要点在使用虚拟化灾难恢复策略时需要考虑以下要点:恢复容量制定虚拟化灾难恢复策略的时候很重要的一点是考虑容量。企业通常会认为恢复时容量利用率不会超过100%.事实上,由于恢复的启动阶段会将系统推向极致,所需容量可能会超过生产容量。此外,恢复过程中有大量的跟进工作,这些工作也需要容量。配套资源恢复能力虽然是需要考虑的重点,但其它各种支持生产环境的要素也要考虑在内。这些要素包括处理器资源(存储、设备界面等)、磁盘资源(存储阵列、存储场地网络SANs、磁盘簇等)、外围设备(控制单元、终端、刀片等)、基础设施(外部交换机)和网络连通性(交换机、带宽等)。资源独立、网络冗余和可测量性避免灾难恢复失败的一个重点是确保虚拟化资源保持独立,而不需要依赖主生产环境。网络冗余是指不仅为内部用户,还必须为外部用户(如客户、业务伙伴、供应商等)提供接入。可测量性则是处理灾难恢复和生产运营的工作量峰值所必需的。恢复计划测试制定虚拟化灾难恢复策略非常重要的一点是考虑对计划的有效测试。测试应在系统层面上全面进行,以有效地了解特定时间段内工作量对虚拟化资源的要求,同时验证业务的完整性和基础设施的有效性。虽然局部的功能测试更容易安排,但却无法保证测试结果的真实性,因此会导致测试的效果大打折扣。重设工作量计划不论是真实情况下还是演练过程中,恢复时都应该制定详细的计划来管理整个过程中不断变化的工作量。该计划应该包括一份高层认可的正式时间表,一份恢复时资源分配的备选工作计划,一个对偏移工作量的日常备份流程,以及一份在备用场地复原这些工作的经过测试的恢复计划。灾难恢复风险控制在制定虚拟化灾难恢复策略时应考虑到给业务带来的风险。由于虚拟化的固有弱点,距离可能会受到限制,但地理的多样性必须被考虑在内。恢复场所应该与企业已有的风险规避策略所明确的风险承受能力相符,而不应该是满足技术要求的结果。清晰明确的工作量在确定构成虚拟池的具体资源之前,很重要的一点是要了解灾难恢复的工作量。明确业务的优先次序和临界点,制定出与处理流程、应用的集成和相互依赖性、以及IT支持模块相关的详细计划,从而保证虚拟化环境的可恢复性。保持完整性的规则包括问题、变更、事件、配置和资产管理在内的严格的系统管理规则是实施任何新的虚拟化灾难恢复策略的前提。这对保持恢复环境的完整性是至关重要的,同时对虚拟化资源池的最终操作、监控和维护的有效性也是至关重要的。业务和IT报告对灾难恢复项目进程的跟踪、状态的传递和结果的报告是所有灾难恢复项目的重要输出,对于判断IT功能虚拟化所进行的大量投入的效果是非常重要的。2.1.8应用部署参考标准 并非所有的应用都可以迁移到虚拟化环境,但是应当尽可能的迁移到虚拟化环境中。当虚拟环境下进行应用进行部署时会存在两种情况:从物理环境迁移到虚拟化环境在虚拟化环境下直接部署新的应用在虚拟环境下进行应用部署时应当遵循以下的原则:战略制定设计应用虚拟化战略,获得最终的架构图,以降低整体部署的复杂度并确保得到最优的价值。单一目的服务器使用单一目的的服务器来简化管理,并且能够提供更优的独立性、降低应用冲突和提升资源利用率。Active-Active将关键业务应用复杂部署到多个服务器上,并实现共同服务,以分散风险,避免当系统出现故障时的意外业务停止。备份维护基于快照的备份,提供更加可靠和稳固的恢复能力。可迁移采用基于SAN启动的服务器,确保应用系统可以随时迁移到不同的物理服务器上,避免单一服务器故障点。安全维护正确的访问控制列表,采用可靠的认真技术,如果需要的话,应当采用数据加密技术对应用产生的敏感性数据进行加密。标准化配置采用标准化的LUN,系统配置等,让部署更加快速。将SWAP空间存放在非虚拟磁盘上。在虚拟化环境下部署应用不存在标准流程,但是通过上述的原则可以获得部署的指导。无论应用时从物理服务器上迁移还是全新建立,一定要理解应用的特性并且准备针对性的部署方案。2.2云计算服务门户2.2.1云服务门户在新的服务模式中,IT是业务部门的服务提供者,这样既实现了云计算的优势,又不会牺牲安全性和控制力。用户将体验到前所未有的响应速度和灵活性,而IT部门则通过更高程度的整合、任务自动化和简化管理而得以降低成本。用户只需点击一下按钮即可部署预先配置好或已定制的服务,即可提高业务灵活性。利用基于策略的用户控制技术和安全技术,可以保持多租户环境的安全性和可控性。以虚拟数据中心的形式向内部组织高效地提供资源以提高整合率并简化管理,可以降低成本。以渐进方式实现云计算—利用现有投资和开放标准,以保证云之间的互操作性和应用程序可移植性云计算服务云计算服务门户与底层虚拟化平台协同工作,可以将基础架构作为服务提供给终端用户来使用,即IaaS,包括了对IaaS使用流程的管理,资源生命周期的管理以及所提供的服务内容的管理。IaaS服务采用自服务的方式,服务的生命周期如下图:IaaS服务生命周期主要分成以下几个阶段:服务模板定义主要指准备云计算环境,将各种合适的资源纳入到云计算资源池,准备标准的计算能力。创建服务目录主要指将计算资源标准化,按照服务的方式进行提供。服务目录中的资源可以为服务器、可以为单个的CPU或内存、可以为存储容量、可以为应用软件、可以为特定执行程序,服务目录是一个云计算环境可用计算资源的集中体现。服务订阅主要是指云服务消费者申请云计算能力和服务,或者更改某个已有的服务申请。云计算环境越是庞大、其服务管理就越是要求准确和严格。如果出现计划服务的时间无法获得所需的计算资源,就会影响相关服务申请的服务水平,从而给使用部门,即云服务消费者,带来业务上的损失。服务运行服务运行首先意味着服务的供应,通过自动化的供应平台使消费者在指定的时间获得云计算资源;其次意味着服务的管理,需要确保云计算服务的质量,包括计算性能和可靠性。这些都是云计算服务中需要关注的部分。服务终止当消费者不再需要服务时,服务会被终止,资源会被回收。资源可以重新放回资源池以重新利用。IaaS的生命周期围绕着业务需求将计算资源得以最大限度地使用,所以IaaS服务部件需要计算资源,也同样需要对其生命周期进行管理的平台。云计算服务管理平台可以涵盖云计算服务提供所需的各个环节,通常包括:服务申请和流程管理服务交付和回收,自动供应平台资源使用统计和计费服务质量监控其它的支撑服务,包括安全性等在整个服务的生命周期包括两类参与角色,终端用户即服务订阅者,云平台运营管理用户,包括云计算平台管理员,服务目录管理者和服务水平管理员。用户申请资源IaaS时,可以指定需要使用的资源的起始/结束日期。申请资源在需要使用的日期之前,不会占用云计算中心的实际资源。在使用日期之前,云计算服务门户平台会自动在有合适的可用资源的资源池中,自动部署所需要的虚拟服务器(主机名、IP地址、CPU、内存、存储空间)及应用。云计算基础架构以虚拟数据中心的形式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年木材托盘经销协议模板
- 2024年度高效汽车运送协议范本
- 2024餐饮业操作人员劳动协议范例
- 2024项目协作委托详细协议模板大全
- 不动产过户协议样本 2024 年规范
- 跨境电商网店设计趋势
- 2024年家具定制协议范本综合指南
- 创新型企业知识产权保护服务协议范例
- 2024年度学生宿舍租赁协议样本
- 太阳课件模板教学课件
- (2024年)传染病培训课件
- 供应商QPA稽核点检表(线材)
- 资质挂靠协议
- 凸函数的性质及其应用
- 标记有丝分裂百分率法计算
- HCGE2P孕三项化验单模板
- QA软件过程检查单(XXJSTZPPQAChecklist)
- BA88半自动生化分析仪维修手册
- 各系统调试报告
- 英语人称代词-物主代词-名词所有格(共4页)
- 《质量管理体系文件》ISO9001_2015_中英文对照
评论
0/150
提交评论