企业战略-企业运维系统建立初探_第1页
企业战略-企业运维系统建立初探_第2页
企业战略-企业运维系统建立初探_第3页
企业战略-企业运维系统建立初探_第4页
企业战略-企业运维系统建立初探_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、.:.; 文档资源【摘要】随着IT技术在企业的运用,许多企业曾经建立了中心业务系统,企业的运作曾经离不开IT系统了。如何保证信息系统平安可靠的运转已成为企业最为关注的问题,而传统的运转维护管理方式曾经不能顺应目前环境下业务的需求。因此对IT系统需求一套管理系统来支撑,这就是运转维护系统。 【关键词】运维系统运维效力IT技术 一、背景阐明 随着IT技术在企业的运用,许多企业曾经建立了中心业务系统,如ERP、OA、数据仓库等,业务战略驱动IT战略的建立,IT战略支持业务战略,由此,许多企业的运作曾经离不开IT系统了,因此任何一个缺点呵斥的损失,影响面是比较大,甚至影响整个企业的业务。而传统的运转维

2、护管理方式比较被动, 即只需当系统出问题时, 才会引起留意和得到处理, 或者当业务受影响, 并被业务部门汇报赞扬,才发现问题。 这种管理方式曾经不能顺应目前环境下业务的需求。 其次,从生命周期的角度看,无论是硬件还是软件,大致可分为规划和设计、开发和测试、实施、运营和终止等5个阶段。前面3阶段从时间的角度看,只占生命周期的20,其他80的时间根本上是运维效力,假设整个IT的运维做得不好,那么这些破费大笔投资建立起来的系统,无法带来预期的效益,甚至于无法运用,由于运用者无法顺利运用他们。 根据Gartner Group调查发现,在经常出现的问题中,源自技术和产品方面的其实只占了20,流程失误占4

3、0,人员疏失占40。流程失误包括变卦管理没有做好、超载、没有测试等流程上的失误或不完好,人员疏失包括遗忘、训练缺乏、备份错误及平安忽略等。这就阐明IT运维方面的问题,更多的不是技术问题,而是管理方面,因此对IT系统需求一套管理系统来支撑,这就是运转维护系统。 二、信息系统运转维护面临的挑战 普通讯息系统架构的层次如下: 由此,我们可以看到,为了保证运用系统的可用性,不但要保证运用程序本身的正确性和强壮性,同时还要保证从网络到运用程序端到端的可用性,为此,从运转维护的角度来看,必需从整体的角度来规划,对与运用系统相关的IT根底设备、支撑平台进展集中监控,并与运用系统进展关联,一旦出现缺点,可以迅

4、速定位并处理;同时定义相关的流程保证一个运用的变卦不会对其他运用产生影响,对出现的问题从根源上找出缘由,并进展处理,从而保证系统的高可用性。基于本人对IT效力管理的了解,基于ITIL的框架,提出运转维护系统建立的一些想法。 三、运转维护系统的设计 那么如何设计IT运转维护系统呢?主要从两方面着手,一是管理流程的设计,二是系统监控的设计。在管理流程方面,目前ITIL(IT Infrastruct Library)根本上成为现实上的规范,它是最正确实际的结晶;在系统监控方面包括从IT根底设备运用系统进展监控,并实现事件的关联,以实现自动的监控,实现缺点的快速定位和预警,下面详细阐明。 一运维系统的

5、设计理念 运维系统的设计理念基于ITIL-IT效力管理框架,ITIL 将IT 效力管理分为: 信息和通讯根底框架管理,这部份将更偏重于技术视角。 效力管理,包括“提供IT 效力 和“支持IT 效力两部分,关注在提供IT 效力过程中,监控,管理,处置处理问题的整个过程。 面向业务的管理,将从业务的视角来看管理,将管理IT 效力与IT 效力所支撑的业务关联。 1. 信息和通讯根底框架管理 IT 根底框架的智能管理是效力保证的根底,应该是一个可以全面管理IT 根底框架中一切产品和技术的平台,并经过提供以下才干到达真正的业务价值、真正的投资报答、保证平安消费,提高效力程度。 IT 根底框架的智能管理将

6、覆盖企业IT环境,提供包括广域网,局域网,主机接入网络,网络平安设备,Internet 效力的全方位的IT 从网络到系统,运用,业务的监控管理,以及面向IT运维的事件紧缩,事件相关性分析,缺点诊断,根源缺点分析,自动化的缺点处置等一系列功能和工具。 2. 效力管理 今天,正进展着效力管理的*。几乎一切企业的IT 部门都正在向面向业务的效力提供者的转变。IT部门就像一个协作同伴一样参与到企业的业务过程,自动的提供效力职能,并向它的客户-业务部门担任。 ITIL 将企业的IT 效力管理分为: 提供IT效力,关注在提供IT 效力过程中和管理行为和手段; 支持IT 效力, 关注在支持IT 效力过程中,

7、处置问题,变卦等的动作和流程。 1提供IT 效力 提供IT 效力包括:制定规划,为业务部门按方案和效力质量提供效力 保证提供效力的继续性。 在效力提供体系实现的主要义务是: 效力程度管理 可用性管理 容量管理 本钱管理 应急方案 2支持IT 效力 支持IT 效力包括:为到达效力目的提供相关管理信息。为实现效力目的提供相应的支撑机制。 效力支持体系实现的主要义务是: 配置管理 协助 台管理 问题管理 变卦管理 软件控制和分发管理 3. 面向业务的管理 面向业务的IT 管理是从客户视角的端到端效力监控管理,它的特点是: 提供直观的监控视图,可以实时判别通讯和IT 根底框架缺点对业务的影响; 在发生

8、影响业务的缺点时,IT效力保证部门可以最快的获知问题的发生,并迅速采取行动; 根据缺点对业务的影响情况,决议处置的优先级; 当业务效力发生问题时可以确定缺点所在的根底框架层次; 通知相关客户效力系统或大客户,告知问题的情况和处理进展; 面向客户业务效力,提供基于Web 的多种视图,包括端到端效力监控层次模型,和监控构效果劳系统的各个组件; 面向业务管理的目的是经过全面的业务系统和IT 框架系统监控,加强管理,提高管理程度,并最终保证业务的胜利运转。实现IT根底框架端到端的监控和与业务的关联。 二运维系统的设计目的 确保IT流程支撑业务流程, 整体提高业务运营的质量。 提高用户的称心度, 提升企

9、业的社会效益和经济效益。 实时实现对从IT的根底架构到运用系统的端到端的运转情况进展监控。 提供从业务角度分析IT根底设备包括系统、网络、数据库、运用效力器的才干。 建立完善的支持效力流程和支持方式。 建立满足效力程度要求的效力程度管理。 三基于ITIL的理念建立规范的处置流程 在ITIL中要建立许多管理流程,在实践运用中,我觉得至少需求建立下面几个流程: 1问题管理 建立并运用问题处置程序,以实现对问题诊断和确定处理问题的方案, 并将处理方案记录在配置数据库中,针对效力程度管理确定并实现内部的问题晋级时间规范。 2资产管理 对于每天发生的事件, 问题, 变卦处置, 新效力的配置, 各个组件的

10、信息,资产管理的职责就是提供和维护这些信息, 它是与效力管理相关的最重要的义务之一。 3Help Desk管理 担当效力中与业务部门和客户的主要接触点(point-of-contac)。存储事件, 确定问题严重级别, 综合支持团队的努力, 确保及时准确地处理问题, 并提供SLA统计, 证明可以到达预期的效力级别。 4变卦管理 保证清楚的了解变卦针对一个效力中任何组件的影响, 并保证对效力程度的影响最小, 变卦管理包括SLA文档和效力目录的变卦, 以及组织变卦和针对软件和硬件的变卦。 5缺点管理 缺点管理的主要目的是尽能够快地恢复效力至效力级别协议SLA要求的水准,尽能够减少缺点对效力运营的不利

11、影响,以确保最好的效力质量和可用性级别。 四运维系统的组成 在普通的运维系统中,需求一个大房间,在大房间中分成以下几个部分,每个部分都扮演相应的角色: 第一层:大屏幕分别显示有,基于业务的视图,基于IT根底架构的视图,基于网络的视图,当缺点出现时可以以特定的颜色显示出来,同时可以显示一些公司需求直观显示的数据。 第二层:效力台Help Desk,主要提供: 接受客户的恳求 提供客户运用上的问题咨询 提供客户业务咨询 记录并跟踪缺点和客户意见 根据知识库,尽快处理问题 及时通知客户其恳求的当前情况和最新进展 根据效力级别协议,初步评价恳求,阅历处理它们或安排给一线工程师处理 对客户的缺点从提出到

12、验证及终止的整个过程进展管理 协调一线工程师和值班工程师 第三层:一线支持工程师 根据提供的监控界面迅速定位问题并处理 对于暂时的处理方法,还要把缺点提交给问题处置流程 根据效力级别,在问题未能及时处理时及时把问题提交给值班经理 第四层:值班经理个人 协调技术专家,根据效力协议的时间要求,处理问题 协调供应商,根据维护协议要求,处理问题 五运维系统的功能设计 基于ITIL设计理念,我们把ECC的实时监控部分设计成层次架构,如以下图: 1. 事件采集层 在最根本的层次上,需求从被管理的IT根底设备中获取广泛的,实时的数据,可以从网络、系统和运用层中捕获、会聚并处置大量数据的才干,我们通常称之为事

13、件管理。 事件管理是整个面向效力管理系统的中心,在数据采集阶段包括网络、系统和运用层采集的信息,只需经过事件管理效力器,转变为一致的格式,再流入智能化的管理层,实现事件的相关性分析。 数据采集层是整个管理系统进展信息处置和智能化分析的根底,因此需求充分获得准确、实时、完好的管理数据。在数据采集层,应该进展原始数据的过滤、分类、分级等预处置操作,从中提炼出重要的管理信息。数据采集层获取信息的实时和准确性,以及对原始信息的预处置才干,将在很大程度上影响整个管理系统的管理才干和效率。 2.事件处置层 数据搜集仅仅是实现业务和通讯及IT根底框架管理的根底,需求最简单的先决条件。实现真正的根底框架智能化

14、意味着可以从整个根底框架产生的大量数据中,经过采用一系列先进的过滤,事件紧缩,关联和诊断的技术进展处置,抽取管理人员需求关注的重要信息。好的根底框架监控管理系统可以将网络以致IT系统的专业化知识融入在管理系统中,根据根底框架层各组成资源的特点,从原始的管理数据中智能分析系统的真实情况,判别资源实践的运转形状,分析缺点发生的根源并提出处理建议,使运维人员处理问题更加准确和有效。普通包含以下功能: 1事件的存储 将运转维护数据与历史数据分开存储, 以确保管理的效率. 普通管理信息需求保管6个月甚至更长的数据, 以进展统计分析和存档, 而在日常运转管理中, 普通只需求查看最近一周甚至更短的信息, 普

15、通采用运转数据与实时数据分开存储, 运转数据采用高速的内存数据库保证事件处置的实时性, 历史数据采用稳定的关系型数据库保证事件存储的可靠性和容量,这种构造使事件的处置更加合理。 2事件紧缩 IT资源事件中有很多反复事件, 尤其在系统组件不稳定时, 有能够会产惹事件风暴。过多的事件会使管理员的桌面上罗列大量事件条目,管理员无法获取真正需求关注的重要事件,因此对反复事件进展合并使事件条目明晰, 协助 管理员快速找到需求处置的缺点是非常重要的。反复事件紧缩就是这样的一个过程: 经过将从下层数据源所报告的类似事件加以汇总,合并成一条事件,该事件的内容包含了该事件反复的次数以及发生的起止时间。 3事件自

16、动化处置 可以对各类事件信息进展逻辑判别, 并做出相应的动作, 如及时删除不用要的信息、完成不同事件之间的关联、对严重事件采用明显的声音报警、自动晋级警告级别假设严重事件在一段时间内没有人呼应、发送邮件进展自动通知等等。 4可用性的计算方法 根据缺点树分析FTA(Fault Tree Analysis)方法,结合可用性的计算方法,来计算效力的可用性。 组件可用率的计算方法:组件可用率 = (AST-DT)/AST*100% AST商定效力时间Agreed service time DT在商定时间内的实践停机时间Actual downtime 5可用性的评价目的 通常我们采用下面几个目的来对可用

17、性进展评价: 平均无缺点时间(MTBF-Mean Time Between Falures),它指的是从某次事故修复到下次事故发生之间的平均间隔时间,又称为正常运营时间Uptime,它是用来描画效力的可靠性。 平均修复时间(MTTR-Mean Time To Repair),它指的是事故发生到效力恢复之间的平均间隔时间,又称为停机时间Downtime,它是用来描画效力的可维护性和适用性。 3.业务关联层 业务影响分析, 基于CFIA等分析法,定义事件和业务系统的关联关系, 自动找到缺点所影响的业务和效力, 并根据关结合果创建新的效力事件报警。 4.呈现层 提供基于Web方式的监控视图, 可以为

18、不同的管理人员提供不同的监控窗口, 以实时监控相关的事件信息, 事件窗口可以经过分组显示不同类型、级别、源、时间段内的事件信息, 管理员可以一目了然的看到目前能否有事件发生, 级别如何, 并对事件进展一系列的处置任务。 5.报表处置层 各种监控信息存储在关系数据库中,可以利用报表工具进展信息统计分析,生成各种格式的报表。 报表运用可以与实时缺点监视环境实现无缝集成,为运维提供一种长期的综合视图。报表运用协助 管理人员了解其各种根底设备在各种不同期间的行为特点,从不同设备、系统和效力的层次上对各种根底架构的长期行为特点进展查看和分析。 六运维系统的设计要求 1.基于ITIL框架设计, 构造先进 运维系统的设计要求基于ITIL的框架, ITIL的框架是最正确实际的结晶。 2.可扩展性 假设需求一个新的展现层或者事件关联,必需可以无缝扩展或集成到现有的管理框架中。为了保证随着系统架构的延伸扩展而产生的越来越多的事件信息的处置性能,在恣意一个层次添加都不会影响整体框架构造。 3.集成性 集成企业现有以及未来能够要扩展的设备和管理系统。假设需求添加新的监控对象,那么最多只需简单地添加一个探针,或添加一个新的关联层 。 4.集中化 曾经处置的事件(反复紧缩和事件关联)集中在一个地方。因此管理员可以共享整个系统的事件信息。 5.关联 由于事件关联功能在整个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论