政务云运维管理规范20121122( 试行)_第1页
政务云运维管理规范20121122( 试行)_第2页
政务云运维管理规范20121122( 试行)_第3页
政务云运维管理规范20121122( 试行)_第4页
政务云运维管理规范20121122( 试行)_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

政务云运维管理规范20121122(试行)政务云运维管理规范(试行)引言政务云运维管理规范是为了规范政务云平台的运维管理,保障政务云平台的安全稳定运行,提高政务云平台的服务质量和效率,保障政务信息化建设的顺利进行而制定的。本规范适用于政务云平台的运维管理。范围本规范适用于政务云平台的运维管理,包括政务云平台的日常运维管理、安全管理、监控管理等方面的规范。术语和定义2.1术语政务云平台:指为政务信息化建设提供服务的云计算平台。运维管理:指对政务云平台进行日常管理和维护的活动。安全管理:指对政务云平台进行安全保障和风险管理的活动。监控管理:指对政务云平台进行实时监控和数据分析的活动。9.1计算资源池计算资源池是云计算数据中心的核心,它是由大量服务器组成的集群,用于提供计算能力。计算资源池可以通过虚拟化技术将物理服务器划分为多个虚拟机,从而实现资源的共享和动态分配。这样,用户可以根据自己的需求,随时随地地获取所需的计算资源,而不必考虑物理服务器的位置和数量。9.2存储资源池存储资源池是云计算数据中心的另一个重要组成部分,它用于存储用户的数据。存储资源池可以通过虚拟化技术将物理存储设备划分为多个虚拟存储设备,从而实现存储资源的共享和动态分配。这样,用户可以根据自己的需求,随时随地地获取所需的存储资源,而不必考虑物理存储设备的位置和容量。9.3网络资源池网络资源池是云计算数据中心的另一个重要组成部分,它用于提供网络连接和带宽。网络资源池可以通过虚拟化技术将物理网络设备划分为多个虚拟网络设备,从而实现网络资源的共享和动态分配。这样,用户可以根据自己的需求,随时随地地获取所需的网络资源,而不必考虑物理网络设备的位置和带宽。9.4机房基础设施、软件和数据机房基础设施、软件和数据是云计算数据中心的基础,它们包括机房的物理环境、操作系统、数据库、应用程序等。这些基础设施、软件和数据需要得到有效的管理和维护,以确保云计算数据中心的高可用性和安全性。10传统数据中心与云计算数据中心的服务内容区别传统数据中心主要提供基础设施和服务,如机房租赁、服务器托管、带宽提供等。而云计算数据中心则提供更加丰富和灵活的服务,如计算、存储、网络、安全、监控、备份等。云计算数据中心的服务可以根据用户的需求进行动态调整,从而实现更高效、更安全、更经济的IT服务。11运维服务报告运维服务报告是云计算数据中心的重要组成部分,它用于记录和反馈数据中心的运维情况。运维服务报告包括数据中心的可用性、性能、安全、故障处理等方面的情况。通过运维服务报告,用户可以了解数据中心的运行情况,评估服务质量,提出改进建议。11.1总则本章节介绍了政务云运维管理规范的基本准则和框架。政务云运维管理规范遵循ISO20000和ITSS的基本准则,通过基本标准框架下的扩充形成,规范政务云运维活动中涉及的各类实体,以及这些实体间的相互关系。11.2常规报告本章节介绍了政务云运维管理规范中的常规报告要求。常规报告是指日常运维活动中需要提供的报告,包括运维服务管理对象的状态报告、运维服务管理流程的执行报告、运维服务支撑系统的使用报告等。这些报告需要明确的标识报告类型、报告时间、报告内容等信息。11.3事件报告本章节介绍了政务云运维管理规范中的事件报告要求。事件报告是指在政务云运维活动中发生的异常事件,需要及时报告并进行处理。事件报告需要包括事件类型、事件时间、事件发生的原因、影响范围、处理措施等信息。11.4专题报告本章节介绍了政务云运维管理规范中的专题报告要求。专题报告是指针对某一特定问题或需求进行的报告,需要对问题或需求进行详细的分析和解决方案的提出。专题报告需要包括问题或需求的描述、分析结果、解决方案等信息。附录一:政务云服务等级协议SLA模板本附录提供了政务云服务等级协议SLA模板,用于规范政务云服务提供商和服务使用方之间的服务等级协议。SLA模板需要明确服务等级、服务内容、服务时间、服务支持等方面的要求,以确保政务云服务的稳定和可靠性。引言本文介绍了政务云运维管理规范的基本框架和要素,包括运维服务管理对象、运维活动角色及运维管理组织结构、运维服务管理流程、运维服务支撑系统和运维服务五个要素。同时,本文还介绍了政务云运维管理规范中的常规报告、事件报告和专题报告要求,以及政务云服务等级协议SLA模板。这些规范和要求的实施,可以提高政务云服务的质量和可靠性,保障政务云服务的稳定和安全。虚拟机监控器的负荷监控包括内存、网络IO、服务进程、计算资源分配和系统日志异常监控等方面。此外,还需要对虚拟计算资源进行预防性检查,以提前预警故障并分析系统运行趋势和安全日志。常规作业包括硬件更换、软件升级、可靠性计划制定、虚拟机备份、克隆与恢复等。响应支持则包括针对硬件、网络和软件故障的事件驱动响应,以及根据服务请求提供数据备份与恢复、系统扩容和虚拟机供应等服务。在虚拟计算资源的预防性检查中,需要检查虚拟机监控器的CPU和内存使用峰值、文件系统空间使用情况、IO读写情况、网络流量情况等,以及虚拟机和计算资源池的资源分配情况与分配策略。此外,还需要进行脆弱性检查,包括检查物理服务器关键硬件部件是否存在故障、计算资源池资源分配是否超过预定阀值、虚拟机监控器版本是否安装相关风险补丁等。常规作业包括更换损坏的硬件、虚拟机监控器软件升级、日常的可靠性计划制定与演习、虚拟机备份、克隆与恢复等,以及虚拟资源池的扩容与资源再分配、制作与升级标准虚拟机模板、虚拟机映像维护、虚拟机转换、虚拟资源的访问控制与权限管理和制作系统运行状况报告等。响应支持分为事件驱动响应和服务请求响应。事件驱动响应针对虚拟计算资源所依赖的硬件、网络和软件故障进行响应,包括解决物理服务器故障、物理网络设备故障、虚拟机监控器软件故障或缺陷、虚拟机紧急迁移和虚拟资源池紧急扩容等。服务请求响应则根据应用系统运行需要或需方、服务相关方的请求,提供数据备份与恢复、虚拟机备份与恢复、系统扩容和虚拟机供应等服务。服务控制器的服务进程运行状态服务控制器的日志记录虚拟存储资源的管理9.2.2.2预防性检查在对虚拟存储资源进行监控的基础上,需要进行预防性检查,包括性能检查和脆弱性检查。具体内容如下表所示:表5虚拟存储资源预防性检查表服务对象:虚拟存储资源性能检查内容:-整体性能检查,包括数据吞吐带宽、IOPS、响应时间和请求排队时间等;-后端性能检查,包括虚拟存储卷访问吞吐率、IOPS、响应时间和请求队列时间等;-控制器间性能检查,包括各服务控制器cache利用率等;-存储资源池分配策略与空间使用率的检查;-虚拟存储卷后端存储的性能匹配的检查;-服务控制器日志的检查;-用户请求错误率和所有服务所接受的请求错误率的检查。脆弱性检查内容:-服务控制器冗余度的检查;-服务仲裁控制点健康性的检查;-服务控制器微码版本的检查;-存储资源池分配策略避免过度分配的检查;-控制器存储虚拟化软件版本一致性的检查;-虚拟存储资源授权的全局性和统一性的检查;-数据副本数、保存出错率、传输出错率以及数据副本一致性的检查;-统计数据恢复的时间。9.2.2.3常规作业针对虚拟存储资源进行的常规作业如下表所示:表6虚拟存储资源常规作业表服务对象:虚拟存储资源常规作业内容:-SAN拓扑、端口、Zoning配置的维护;-服务控制器配置备份和恢复;-虚拟存储资源划分;-虚拟存储资源权限设置;-扩充存储资源池容量;-制定和实施异构存储资源池数据快照、镜像和容灾计划;-存储资源池内数据在线迁移;-数据分层管理;-维护数据副本数;-资源使用情况统计;-用户使用情况统计;-服务控制器软件升级;-更换损坏硬件;-日志文件分析和备份。9.2.3响应支持9.2.3.1事件驱动响应针对虚拟存储资源的软、硬件故障进行的响应服务包括:-解决存储虚拟化软件缺陷或故障;-解决服务控制器宕机、重启、死机等;-解决服务控制器前后端网络故障;-数据恢复;-硬件损坏更换。9.2.3.2服务请求响应根据应用系统运行需要或需方、服务相关方的请求进行的响应服务包括:-数据统一备份;-数据容灾计划制定、实施和演练;-数据访问性能优化;-数据在线迁移;-数据分级存储,降低存储成本;-新增主机分配存储空间;-现有主机存储空间调整。在监控服务的基础上,需要对虚拟网络资源进行预防性检查,包括性能检查和脆弱性检查。具体检查内容如表8所示,包括但不限于虚拟网络资源的健康状态、CPU和内存使用情况、端口的吞吐率以及链路的健康状况等。同时,还需要对虚拟网络资源的链路冗余度、使用度和调度情况进行评估和周期性检查,并对安全事件进行整理分析。针对虚拟网络资源的常规作业内容如表9所示,包括配置备份及存档、日志备份及存档、日志数据分析与报告生成、配置变更文件的审核、配置变更的操作和记录等。在响应支持方面,需要进行事件驱动响应和服务请求响应。事件驱动响应包括故障定位、虚拟网络资源更换、中断和连通网络连接、关闭和启动端口、更改和恢复配置、停止和启动进程以及虚拟网络资源重新调配等。服务请求响应包括增加或降低虚拟网络资源网络接入数量或速率、更改虚拟网络资源配置、启动或关闭端口或服务、更换、更新或升级虚拟网络资源硬件或软件、调配虚拟网络资源等。在优化改善方面,需要进行适应性改进和增加性改进。适应性改进根据应用系统特点和运行需求对虚拟网络资源进行调整,包括设备或链路负载调整、安全策略调整、监控对象覆盖范围调整、路由策略调整、局部交换优化、局部冗余优化和虚拟网络资源调配等。增加性改进则是根据虚拟网络资源的运行记录和趋势分析进行调整、扩容或升级。9.3虚拟网络资源运维服务9.3.1例行操作虚拟网络资源的例行操作包括但不限于:a)虚拟网络资源的监控、巡检和日志分析;b)虚拟网络资源的备份和恢复;c)虚拟网络资源的配置管理和变更管理;d)虚拟网络资源的性能管理和优化;e)虚拟网络资源的安全管理和漏洞修复。9.3.2响应支持虚拟网络资源的响应支持包括但不限于:a)虚拟网络资源故障的快速定位和排除;b)虚拟网络资源的紧急修复和恢复;c)虚拟网络资源的容量规划和扩容支持;d)虚拟网络资源的性能问题的解决支持;e)虚拟网络资源的安全事件的处置支持。9.3.3优化改善虚拟网络资源的优化改善包括但不限于:a)虚拟网络资源调整,如CPU、内存、端口的调配、扩容回收;b)虚拟网络资源网络架构变动;c)网络架构容量变化,如网络子系统的增减等;d)系统功能变化,如新增安全系统、新增审计系统等;e)路由协议应用及部署调整;f)整体安全策略收紧;g)虚拟网络资源冗余优化。9.3.4预防性改进根据对虚拟网络资源的运行记录、趋势的分析,结合应用系统的需求,发现虚拟网络资源的脆弱点,有针对性地进行改进性作业,包括但不限于:a)配置参数优化,例如虚拟网络资源的VLAN、QoS、ACL、带宽等;b)部署路由策略情况下端到端选路变化、端口流量变化、路由条目变化。9.3.5咨询评估咨询评估服务包括但不限于:a)(整体或局部)虚拟网络资源实际负荷与承载能力分析;b)(整体或局部)虚拟网络资源预期负荷与承载能力分析与建议;c)(整体或局部)虚拟网络资源架构变动分析与建议;d)(整体或局部)虚拟网络资源路由策略变动分析与建议;e)(整体或局部)虚拟网络资源安全策略变动分析与建议;f)(整体或局部)虚拟网络资源配置调优分析与建议等。9.4机房基础设施、软件和数据机房基础设施、软件和数据等与传统数据中心运维方式一致,参照国标送审稿《信息技术服务运行维护第4部分:数据中心服务规范》。10传统数据中心与云计算数据中心的服务内容区别云计算是目前国内外广泛关注的一项技术和应用,它具有大规模、虚拟化、高可靠、高扩展和通用、按需服务等特点。云计算与数据中心相结合,是未来一段时间数据中心发展的趋势。云计算数据中心与传统数据中心在运维对象、服务内容等方面存在差异,如下表所示。表10传统数据中心与云计算数据中心服务内容的主要差异|传统数据中心|运维对象||-------------|--------||机房基础设施|||网络及网络设备|||服务器及存储|||软件|||数据|||云计算数据中心|虚拟资源(包括网络资源、计算资源和存储资源等)|||软件|||平台|||数据|服务内容从以下视角开展例行操作、响应支持、优化改善和咨询评估:1.单一设备运行维护;2.以网络关联其他设备及基础设施的运行维护;3.以应用系统关联设备及基础实施的运行维护。围绕数据及时性、可用性、完整性、安全性开展的例行操作、响应支持、优化改善和咨询评估服务。围绕资源健康状况、使用情况和调度情况开展的例行操作、响应支持、优化改善和咨询评估服务。围绕软件提供、软件定制、本地化或统一部署、统一维护等方面,我们提供例行操作、响应支持、优化改善和咨询评估服务。针对平台运行、组件服务、个性化定制、场景式服务和统一管理等方面,我们也提供类似的服务。此外,我们还基于虚拟资源,依托软件、平台提供例行操作、响应支持、优化改善和咨询评估服务,以满足数据及时性、可用性、完整性、安全性等要求。11.运维服务报告11.1总则在运维服务实施中,我们会按照要求进行服务报告的编制和提交。服务报告通常分为常规报告、事件报告和专题报告三类。11.2常规报告常规报告分为定时和非定时两种,其中包括但不限于以下内容:a)报告名称和报告周期;b)需方和供方相关信息;c)服务综述;d)服务对象,包括但不限于机房基础设施、网络、硬件、软件、数据,其中包括:1)服务内容;2)服务完成情况及下一步工作计划;3)服务工作量;4)SLA目标相关绩效表现,如事件量、问题数、变更实施、故障时间/次数、影响业务的时间/次数等;5)SLA达成及未达成情况、安全违规及考核实施情况;6)服务对象情况分析、隐患及相关的纠正和预防措施或建议;7)重大事件(故障)的分析,包括对需方业务的影响和成本分析、纠正和预防措施及落实跟踪情况,以及相关变更和发布的绩效;8)趋势分析和预警,如响应事件量、问题数、故障时间/次数、影响业务的时间/次数;9)改进/提升建议。e)满意度分析。11.3事件报告事件报告包括但不限于以下内容:a)报告名称;b)需方和供方相关信息;c)事件描述;d)事件发生时间/地点;e)事件受理时间;f)恢复时间;g)事件处理结束时间;h)事件提出人;i)事件受理人;j)事件处理人;k)事件级别;l)事件的影响程度和范围;m)事件处理情况/工作量;n)事件发生频度;o)事件原因分析及建议;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论