运维管理标准_第1页
运维管理标准_第2页
运维管理标准_第3页
运维管理标准_第4页
运维管理标准_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE运维管理标准概述运维是管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于运维部门内部日常运营管理,涉及的对象分成两大部分,即业务系统和运维人员。其管理内容又可细分为七个子系统:第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理;第二、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复;第三、业务管理:包含对企业自身核心业务系统运行情况的监控与管理第四、目录/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理;第五、资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互;第六、信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799,该标准涵盖了信息安全管理的十大控制方面,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等;第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作安排、提供绩效考核量化依据、提供解决经验与知识的积累与共享手段。

总则为加强公司各个项目后期的系统运维管理,确保系统能够平稳、可靠地运行,更好地为客户提供管理服务,特制定本规定。实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行。完善运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量。本规定适用所有进入运维环节的项目。运维人员应根据授权,处理本规定中所涉及的业务事项。

数据库的运维管理对于数据库的变更必须有记录,可以回滚。无用表和字段要及时清理。从数据库删除数据一定要先备份再删除。定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据。定期检查备份的执行情况,确保备份操作正确执行。指定专人定期进行备份数据的恢复性试验。1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详细的操作记录;2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,必须提前与客户方进行沟通,避免操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成一致后方可实施。3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。

巡检管理定期了解设备的运转情况,做好系统日常运行的基础数据记录,做到有问题早发现、早解决,避免隐患,确保设备的完好率,保证系统运行质量。对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例行巡检、节假日和重要事件前的巡检

维护人员应根据工作计划,对维护的设备定期进行预防性巡视检查,巡查过程中应认真负责,及时发现问题,重点注意处在恶劣环境下、存在潜在质量故障的设备,巡查要认真做记录。

巡检过程中发现告警应立即进入处理流程,判定为故障的要立即进入故障处理流程

所有的巡检都应有详细的记录,包括时间、巡检情况和责任人,并应在巡检纪录卡上签字。

网络管理规范关键业务流程对以下业务系统流程监控,对业务系统是否正常运行、各项具体参数指标是否超标等进行掌控,避免或降低业务系统故障的发生率。1、单位内部的关键业务流程。2、网络吞吐量大的业务流程。3、对系统造成大的压力,频繁使用数据库的业务流程4、同其它系统集成的业务流程,这些集成会提高应用失败的风险。用户体验同系统性能指标相关联

将网络中的所有网络基础架构都进行集中监测,包括对数据库服务器、应用服务器、路由器、交换机、防火墙的监控,收集网络运行信息,将性能数据同单位内部用户的体验相结合来分析网络的性能状况,诊断系统瓶颈。

建立网络运行基准指标并观察趋势

长期监测并通过对网络运行的观察,分析网络性能的变化和流量等指标的运行趋势;及时发现网络偏离系统基准模型时的异常状况,分析故障,达到预警的目的,防止更严重问题的发生。设计报警策略,避免警报泛滥

配置报警的依据是根据信息服务管理网的网络运维管理目标,报警设置的原则:1、对影响网络和业务的重要指标设置报警;2、消除误报和重复报警;3、报警应该以多种方式及时发送给相应的负责人。创建自动化、规范化事件处理程序

信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行出现问题时能够有自动化、规范化的处理问题程序,快速处理各种潜在故障并且分配到相应的负责人,提高工作效率。另外可将工程师长期积累的知识和工作经验系统化和固化,达到快速定位故障的目的。

网络服务质量SLA的量化管理提高网络服务质量的设立量化指标,将其作为整个网络运维管理团队的整体目标。信息服务管理网网络性能管理的总体目标包括网络和设备、业务的可用性、网络的吞吐量、带宽使用百分比、网络延时、CPU和MEMORY的负载,对于不同的网络指标还要根据网络的上下级连接关系分解到每一个子指标,作为对网络故障诊断和性能管理的依据。

制定网络的升级和改进策略网络的升级和改进应该以对现有网络和系统性能数据的测量为前提,以对网络整体运行的现状及趋势分析为依据。通过对单一网络系统和整体网络系统性能数据的比较、单一网络组件和其它网络组件的数据比较、系统负载量最大时的性能数据和一般负载时的性能数据的比较等,判断是否需要对系统的局部或者整体进行升级,发现网络系统性能的瓶颈,提出网络系统改进的方法。日常规范每天两次进行业务系统、网络运行状况、业务流量及对外服务器服务状况监控巡查;按照规定的时段巡统计并汇总运维表单。(流量统计、事件统计、问题统计、手里投诉统计等)按照规定的时段查看路由、防火墙等关键系统运行情况,包括网络流量、带宽占用率等,重点检测关键设施,并记录;处理产品组网络问题应做完整、详细记录,快速响应,及时确定原因,积极组织处理,同时记录解决问题的操作过程,问题解决后应及时回复;对网络资源调配管理(ip资源分配、设备端口划分、链路传输、负载均衡等)、核心和汇聚层等核心网络运维的调试,做好汇报申请并记录。故障分析及处理,网络拓扑更新及网络优化。网络安全方案实施部署,更新维护录入知识库。处理各种网络故障,并作记录,保障网络正常运行。遇到不能处理的问题时,通知相关人员或及时汇报,并记录;工作人员要有强烈的安全意识,巡查时应注意发现各种可能的安全隐患并及时排除。请示报告制度

为加强相关信息处理和反馈管理,有效的控制系统和设备的运行状态,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论