IT运维与管理高峰论坛演讲_第1页
IT运维与管理高峰论坛演讲_第2页
IT运维与管理高峰论坛演讲_第3页
IT运维与管理高峰论坛演讲_第4页
IT运维与管理高峰论坛演讲_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

XXIT运维与管理高峰论坛演讲刘静

刘静:非常荣幸今天有机会在这里跟大家一起探讨一IT

服务管理的实践。

实际上从IT服务管理的进展来看,大家在做各类各样的实

践,包含在建设按照ITLI的最佳实际,结合国内的实际情

况来建设有关的有关管理流程,而且不断地使这样的管理

流程走向更加成熟。即使是这样,我们仍然发现,好象持

续在做这些管理流程的一些实施的话,在我们整个的过程

当中仍然碰到了困难。

比如说我们很难看到一个跟业务有关的视图,比如说我们

说在支持IT业务的运维与进展,我们怎么样看到跟IT业

务有关视图与业务的可持续化,是我们很难解决的问题。

如何利用自动化的驱动来降低整个的费用,提高服务的提

供与整个服务的质量,保证快速地实施。与面临现在不管

是应用环境还是IT自身的架构建设也好,我们面临了不断

更新的技术与服务的进展。在面临这样的服务与技术进展

的时候,如何进行创新?

我们今天的内容就IT服务管理的一些实践跟大家交流。首

先,这是大家都很熟悉的Gartner关于IT成熟度的模型,

从目前我们国内的用户来讲,大家都处在一些被动式的管

理,有一部分用户在于主动式或者者是面向服务的管理,

或者者是第二层次、第三层次做了工作。比如说主动的监

控,尝试做一些容量与能力的规划方面的工作。我们来看,

我们日常的运维,与IT的资产我们如何去对它做一个更重

复地使用,与对他进行一个更高效地利用,从而减轻我们

的成本与提高我们的服务质量,同时降低在管理过程当中

的风险。

第三个问题是自动化,在自动化这点上,我们不是说要有

什么样的产品,或者者是在IT管理建设服务某一个点上实

施自动化,帮助我们提高效率。从自动化来讲,不管是可

视化、可控化都贯穿在整个管理的过程当中。自动化我们

提供流程的自动化怎么实现,包含实现运维我们做自动化

的部署、监控,在整个监控的方面,怎么样去实施自动化,

来提高我们的生产效率。

首先从可视化这个目标来讲,我们需要去洞察业务,我们

需要去熟悉,现在的业务的状态是什么,我们的IT是怎么

样去支持我们的业务的,直接能够从我们的IT业务的支持

上面看到可交付的目标。从我们的解决方案来讲,我们需

要提供实时的视图与实时的dashboard,包含我们从业务

合规、运维整个熟悉现在资产的管理所需要的可用性,与

这个可用性是不是很好地实现了我们的业务目标。

在我们的右边是给了大家一些可视化的视图,后面我们就

这些可视化的内容进行展开沟通。

第二个部门可控化,刚才已经谈到了要紧的核心思想是我

们怎么样能够提供一个完善的操纵,能够去熟悉到我们的

现有的IT资产与如何对我们的IT资产进行优化的利用。

在讲到可控化这部分,大家会想是不是讲我们IT资产的管

理,与从ITLI来讲,更侧重于CMDB这样的管理,从后面

整个运维的角度来讲,可控化对H资产、CMDB的管理,

不是在资产本身提供一个高效地利用率、管控也好,实际

上对我们的运维过程怎么样实现可视化,怎么样把纷繁复

杂的基础架构的事件、问题能够可视化变成业务影响。它

在这部分来讲,提供了非常好的业务的技术支持。

最后是自动化,将敏捷性融入到我们的运维当中,帮助我

们快速地实现运维的目标。

刚才我们从IBM服务管理三个比较核心的思想与观点,从

我们的实践来讲,大家会想到我们现在面临的是非常复杂

的IT的架构。在我们这张图下面,大家可能看到的是在我

们下面的这部分,不管是从我们的主机、开放平台、应用、

网络、语音、传输等等整个IT的基础架构。这是我们现在

面临的,从IT的视角看。

从业务视角看的话,我所需要的是一个业务的交付,从银

行业来看,我需要的是网上银行能够提供我们所承诺的服

务级别,能够在我们用户所期望,业务目标所定义的一些

响应时间也好,是在指标之内对我们广大的用户,是对业

务的用户提供服务。

我们现在IT与业务之间,我们怎么样来建立这种联系,与

怎么样实现运维,这是我们给出的一个实践的模型。

在这样实践的模型当中,要紧的部分是三个层次,在金字

塔模型最上端,是我们的业务所要实施的整个业务的管理。

在中间的层次是一个会聚的运维的管理。下面这个层次来

讲,是我们熟悉地传统IT的管理领域。我们定义为一个技

术的专业领域的管理,包含对应用、网络、主机、安全、

开放平台、存储等等的各个支持我们的IT基础架构的整个

环境的各个专业领域的管理。

我分了两部分探讨,一部分我们会侧重于在讲,根据我们

现在运维的环境,我们怎么样在基础架构的层次做技术领

域的专业的管理。另外一部分,探讨怎么样面向业务服务

的管理。

首先,我们从大家非常熟悉的领域开始,面向一个专业技

术领域的管理。当我们回到各个专业技术领域,回到网络、

应用、存储等等这些领域的时候,我们来看这个领域当中,

我们的运维目标是什么。可能作为一个网络部门的领导、

员工来讲,我们大概是说很难去把我们的网络跟业务之间

做一个非常好的很一致、完全的对应。由于网络支持着很

多的应用的运行,与我们商业的运行,在这样的情况下,

我们从我们的运维目标来看,作为我们系统专业的领域,

我们的运维目标是什么。在这个地方,我们总结了两个方

面的运维目标。

首先,运维目标是要保证我们的系统可用性。一谈到可用

性,大家会谈到,我们怎么样去实现一个高可用性,我的

可用性的能力是什么。这个地方我们定义是我们系统的可

用性目标是满足我们的业务要求的,其次从运维的角度来

讲,我们有非常重要的目标是在整个系统的生命周期的建

设过程当中,如何利用这样科学的数据的分析,来支持整

个系统的持续地进展。这是从技术的专业领域来讲的运维

目标,从现在不管是国内、国外,大家在技术领域的专业

的管理领域里面,大家的一些成功的实践来讲,我们要紧

分为下面四个方面。

第一个方面我们去提供了一个可视化地监控,或者者说我

们提供了可视化的视图。第二个方面是提供一个很牢固的

事件基础,这是非常核心的一部分,参考业务影响关系定

义鼓掌分类或者级别,与我们要采取什么措施尽量减轻或

者者是消除、预防这些能带来的影响。第三个方面是对所

专注的这个基础架构领域,它的运行的数据全面的分析,

这些分析是我们要定义什么我们的KPI。这些KPI它的运

行的绩效是怎么支撑业务的。第四个是建立流程化的管理

平台,支持运维灵活的要求。

从这个层次来讲,包含我们跟国内很多的用户来做一些运

维方面的工作,在建设的过程当中有很深的体会,有可能

你建了非常好的网络管理系统、主机管理系统、存储管理

系统或者者是其他基础架构的管理子系统。但是会发现,

这个系统很难在良性的环境下做持续地更新地满足我们的

运维要求。实际上这方面通常存在的问题是我们只是构建

这个技术平台,我们并没有去对如何让这个技术平台保证

我们的业务目标,实现我们的IT运维目标这方面做有关的

制度、流程化的支持,去使这个技术平台如何最大限度地

去发挥它的作用。

首先是建立一个牢固的事件基础,从技术平台来讲,我们

是怎么样能够去众多的基础架构事件当中进行高效地处

理。根据我们的经验,在一个类似于一个省的规模的网络

当中,即使仅仅是网络的一个专业领域一天的事件量,大

概是在几十万条左右。这是我们很多用户一起建设当中做

的统计数据,如何让这几十万条的数据发生之后,实际上

真正影响到运维、影响到业务事件的氛围并不多。我们怎

么样在这些事件当中抽取出对我们业务真正有影响的事

件,并对其进行处理。因此这方面我们特别强调如何建立

一个牢固事件的基础,在一个平台上,能够以高效地方式

对它进行处理。

在建立事件基础,事件量非常大,假如所有的事件都原始

移过来都不行,这样的话,许多进行事件的自动压缩。我

想强调,这样的压缩是不是能够从企业的需求出发做定制,

不是说把原先的丢掉了进行压缩。

建立牢固事件的基础还有一部分是我们不需要说某个交换

机的某个交换端口宕了,我们会进行什么影响,我们从事

件分析、关联机制也好,我们需要从最基础的IT事件告诉

我们。比如说是某一个营业部发生了中断,这样的信息会

比某一个断口出现了端口宕这样的信息。不管是关于IT

来讲,怎么推断优先级,与业务来讲,都要有可视化。

从我们的目标来讲,尽可能地采集更多的事件,但是从纷

繁复杂的事件进行分析,告诉我们真正跟业务有关联的事

件是什么,这些跟业务关联产生的事件,才是我们运维过

程当中需要核心地处理与解决的问题。这是第一个方面建

立一个牢固的事件基础。

第二个方面,我们怎么样从我们各个基础当中做性能的分

析支持我们的性能管理、后续的容量规划能力上的管理。

这个地方举了两个例子,一个是基于基线的性能分析,不

是每一个单次、单点的分析,而是从我们整个的业务历史

表现看。比如说金融业来讲,像网银的表现,每周一到星

期天,与每天的Array点到5点,整个的流量变化趋势是

不一样的。我们通过基线的分析,我们怎么样去获得优化

现在系统的容量,与现在的系统容量是否能够支持业务不

断增长的需要。

在性能分析这部分,我们要进行一个预测,我们要从单独

的组件,与整个业务应用组件的组合里面,我们分析现在

提供的容量与性能是不是能够满足我们整个业务增长的需

要。然后大概会在什么点的时候,假如当我们的业务增长

到什么规模,我现在的IT基础架构要进行扩容与升级,这

样的话,我们做预先的计划,避免当业务的快速增长,而

使我们的IT系统造成对业务增长的瓶颈。

第三个实践方面来讲,怎么样去熟悉我们整个的IT的资产

包含我们的网络、应用、应用之间的关系等等,包含网络

之间的关系,从而对我们整个的IT资产实施操纵,并为优

化地使用提供一个基础。

这是一些例子,关于IT的资产的报表。我们要去熟悉我们

当前的使用率是多少,是不是有闲置的,是不是我们的容

量。这部分的话,我们会去协同我们刚才谈到的容量的分

析,为我们规划未来IT的服务对业务的支撑能力提供基

础。

第四个方面,从子系统的管理来讲,是怎么样建立一个流

程化的平台,使大家日常运维的工作能够在流程化的平台

上来进行一个可效的实施,所有的运维人员都会定义他的

运维角色与运维的职责,最后通过流程化的平台去履行他

运维上的一些要求。

这是一些视图的呈现,下面还有一个视图。在这个地方,

前面我们的演讲里面也听到了我们怎么样对一些绩效等等

进行考量,现在我们看到的视图,整个故障发生持续状态

的实时的视图。

我们再回忆一下刚才谈到金字塔的服务模型,刚才我们讲

了最基础的一部分,也就是说整个IT专业领域的管理,与

在这个专业领域管理上的运维目标,有两点,一个是怎么

样保证整个系统的可控性。第二个是对系统进行评估与分

析规划未来的进展。另一方面除了两个运维目标来讲,跟

大家分享了一些在国内的建设当中,我们比较多的四个方

面的实践,建立一个可视化的视图,与建立一个非常好的

事件的基础,进行性能与容量的分析。最后是说建立流程

化的平台保证运维能够在一个企业所要求的一些制度的环

境下面进行非常良好地运行。在后面这部分内容里面,我

们会讲我们上面的两层。刚才这部分,我们更多地去看怎

么样做基础架构的运维,后面来讲,我们偏重于怎么样把

基础架构的运维跟我们的业务目标来进行结合,最终为我

们的业务来服务。

现在大家看到的这张总结的片子,是说我们对整个会聚管

理,就刚才中间的这层,实际上当我在讲基础架构的各个

专业子系统的管理的时候,大家有一些疑问了,网络只看

网络的,系统只看系统的,应用只看应用的,存储只看存

储的,谁来看业务,谁来对整个的业务目标负责,与保证

IT运维真正是实现业务目标的,因此我们要做后面的情

况。

第一步我们所谈到的是做一个会聚的运维管理,在这个管

理里面,不管是网络的、存储的、主机的开放平台、系统、

应用、语音等等各个环境子系统的数据,实际上是需要送

到会聚的平台,由会聚的平台进行处理,最终实现业务目

标建立我们的服务模型来服务。

在这个会聚的平台里面,我们在这个地方也总结了它的一

些运维目标。这个时候,我们要做集中的IT运维管理,不

再是网络看网络、系统看系统,网络与系统的运维人员在

整个体系当中变成了二线,在一线来讲,我们要看整个IT

的状态,与对当前的IT的运维来进行一个快速响应°

在这方面来讲,我们也总结了一些成功的建设实践,是建

立一个整合的事件平台,这个时候不是面向专业的子领域

的,是面向整个基础架构的整合平台,与如何进行一些可

视化的方式来去看现在的IT基础架构的状态,与现在业务

的运行状态。

基于我们现在所谈到的一个刚才讲了基础架构自身的管理

问题,会聚的运维平台,我们最终是要实现一个更高的目

标是怎么样进行一个业务服务的管理。在这个地方来讲,

我们现在看到这张图跟大家看到基础架构管理的图非常类

似。最下面是我们整个基础架构的内容,在基础架构的内

容来讲,我们要通过一些基础手段对整个数据进行采集,

包含依靠关系的采集、事件性能的采集、数据的采集,其

他第三方的数据的采集。不管是从业务部门看可视化的视

图,还是业务部门来看关注的不仅仅是我们IT提供的指

标,可能还包含业务的基础指标,比如说当前的环境下,

某一个核心的业务吞吐量是什么。因此大家会看到,我们

在整个体系管理的时候,大家能够认为,前面两部分是谈

IT的数据,这边的数据不仅仅是来自IT系统自身的数据,

还会来自于业务系统的数据。

这些数据搜集到之后,我们需要对他们进行服务关联与服

务化。

我们怎么样建立可视化的视图,它的一些全面的情况是什

么,业务人员所关注的业务的指标、当前的状态是什么,

IT运维的主管领导所关心的运维指标是什么,与全面的运

维人员关注的运维信息又是什么,我们怎么样去获得,怎

么样去处理,最终保证我们去实现我们的服务管理的最终

的目标。

在这里,我给了大家一个事例,这个事例看起来是从一个

事件的角度我们尝试去关注一个基础架构的问题,怎么样

跟我们的业务进行关联的。在这个事例当中,我们看到最

上面的事件,从基础架构搜集过来的事件,是发生在一个

服务器的名字叫做ERP-APP-01是利用率超高的事件,这是

原始的。我们忽略了中间很多传统的事件,看到最后,可

视化的系统告诉了我们什么样的信息。他告诉我们CPU使

用率超高的事件,导致了应用服务器速度的下降,而应用

服务器是ERP的关键组件,它又支持了应用,最后,实际

上还在告诉你一些结论,由于CPU应用服务的下降,导致

超过了1个Min的缺失,即使是这样的事件。先不看对整

个高层领导有影响,业务人员最后只关注这一点,我的影

响是什么。但是对我们的IT运维人员来讲,这样的信息非

常有意义。我们看到了这些信息我们怎么做我们运维的优

先级的划分,我们确信是能做出来的。

这个PPT里面讲了怎么样从第一步到我们现在所看到的业

务信息的一步中间的一些过程,由于时间的关系不全面做

解释,怎么样做规范化、丰富、怎么样从外部的数捱当中

获得关联,最终从一个简单的信息告诉我们业务影响的关

系,怎么样去做不是我们今天的重点,假如有机会以后希

望能够跟大家做一些全面地细节地沟通。

我们实际上已经从一个事例的角度来看了一下IT的基础

架构跟业务之间关联关系地一角。我们怎么样来建立一个

IT的基础架构跟IT之间的关联,首先要熟悉一件情况,

现在大家看到左下角基础架构正在发生什么情况,我们明

白发生了什么情况之后,我们需要采取什么样的行动做解

决,与这些情况是如何影响到了业务。

我们把这样的一个从基础架构的事件的发生到对业务的影

响,与实现我们整个业务管理的目标,我们把它分解为6

个步骤,或者者是叫做6大方面可能会更合适。

第一部分是监控,监控所要实施的要紧的目标是如何去获

知基础架构现在发生了什么。第二个步骤是体验,我除了

从监控的这个角度上能够获取这样的数据之外,我还要明

白我们现在的一些应用的最终的用户,他对整个应用的体

验是什么,很有可能从基础架构看网络、主机等设备都是

好的,但是有一个问题,用户访问这个业务访问不了,或

者者是非常慢。第二个来讲,我们怎么样看最终用户或者

者是IT的应用,我们的业务的用户他的表达。第三个部分

是他们之间的依靠关系,大家回忆一下我讲的例子,从简

单的CPU超标的事件,到我们整个业务全面的信息。这块

来讲,假如没有跟业务依靠关系的关联我们是没有办法实

现的。这部分来讲,有一部分非常重要的是依靠关系,除

了支持可视化的分析之外,还在支持其他方面。第四大方

面非常重要的是业务指标,什么业务指标是被关注的,与

IT的基础架构的事件问题,IT对业务指标的影响是什么。

第五个非常大的方面是视图,在视图里面分为两种,一种

是面向业务的,另外一种是从IT的运维来看的运维的视

图。第六步我们叫做行动,包含我们在刚才讲的三化当中,

非常重要的最后的一化自动化。

我对这6个步骤给大家做一个更详尽地分解。第一个步骤

是监视我们服务的基础架构,这个服务架构内容里面就包

含我们事件从终端用户来讲,安全、网络等等过来的基础

事件。最终通过服务架构监控能够看到我们右边的视图。

大家看到我右边的视图服务模型已经出来了,这块对基础

架构的监控你所能够看到的只是右上角视图的左边的部

分,只能看到发生了什么,不能准确获知发生的信息跟我

们整个业务之间的关系是什么。现在大家认为业务模型这

部分对大家来讲是不可见的。

第二个步骤来讲,衡量用户体验,主动的探测与主动的用

户表达仿真去获得我们用户表达的数据。

第三个步骤来讲,看到整个服务的依靠关系,第一个步骤

我们只是看到了这张图的左边的这部分,IT的基础架构发

生了什么,而这张,我们做到这样的步骤来讲,实际上整

个基础架构之间的关系,不仅仅是物理连接关系。而是他

们怎么样支撑我们的应用关系、业务关系,我们能够建立

出这样的服务模型。当我们建立这样的服务模型之后,我

们的基础架构发生的情况就能够跟我们的服务模型进行匹

配了。

第四个步骤当中,我们去看跟我们业务有关的关键的性能

的指标,在查看这些关键性能指标里面,我需要强调的是

一个是我们从IT的角度看我们的应能指标,还要从业务来

看,包含吞吐量。有一些用户做了这样的工作,包含当前

的IT基础架构的性能指标,跟用户的数据基础指标像吞吐

量、在线交易量,放在一起做分析,去看IT基础架构的指

标是怎么样对用户的业务指标产生影响的。

第五个方面来讲,我们这些数据都有了,我们怎么样通过

非常好的可视化的方法来提供我们服务的视图。在这里给

了大家一些服务视图的事例,这是不一致层次的视图。我

们看到了全局的视图,告诉了我们整个子系统的状态与应

用的状态。每个子系统内部的状态,像这样的一些视图来

讲,更偏向于IT运维的视图。我当前的事件是什么,与当

前的事件对我们应用的影响情况是什么。这是基于服务的

一些视图,我们IT环境当中帮助台的情况,服务水平的合

规情况,与全面的整个接触架构关系的报表情况等等。

这是最后一步实施自动化,我需要再强调一下,自动化不

仅仅是我们很容易去懂得的自动部署、自动容量、自动探

测,实际上自动化是说在我们整个IT服务管理当中,是贯

穿始终的,你会发现会贯穿于各个部门的,在其他五个方

面都会出现。

最后,可能我就再做一下总结,刚才我们要紧是从三个层

面,首先介绍了IBM服务管理的三个方面,还有刚才讲到

的可视化、可控化、自动化等等三个方面。还有一部分,

从整个基础架构管理到IT服务管理渐进的层次来讲,给大

家介绍了在IT服务管理的一些实践,大家有其他的问题,

在会议之后能够进行进一步地沟通,

非常感谢大家的宝贵时间,谢谢。

崟嗝乳非常荣幸今天有檄曾在道桂跟大保一起探言寸一IT

服矜管理的^蹑。

上彳他IT服矜管理的赞展来看,大彳家在做各槿各檬的^

践,包含在建言殳按照ITLI的最佳^除,结合H内的^除情

况来建言殳相^的相^管理流程,而且不断地使适棣的管理

流程走向更加成熟。即使是1»,我任1仍然赞现,好象持

^在做造些管理流程的一些^施的吉舌,在我年号整偃I的谩程

常中仍然碰到瞭困辘。

比如^我年号很辘看到一彳固跟H矜相li的祝H,比如^我件?

aa在支持IT渠矜的建雉与樊展,我仍号怎麽檬看到跟IT渠

矜相I与棠矜的可持化,是我凭很莫隹解决的冏题。

如何利用自勤化的n勤来降低整他1的皆用,提高服矜的提

供与整彳固服矜的^量,保瞪快速地^施。与面陶现在不管

是愿用璟境遢是IT自身的架横建言殳也好,我杷号面陶瞭不断

更新的技衔与服矜的樊展。在面陶道棣的服矜与技秫谤发展

的畤候,如何暹行由J新?

我相号今天的内容就IT服矜管理的一些^^跟大彳家交流。首

先,道是大保都很熟悉的Gartner^於IT成熟度的模型,

彳徒目前我伪H内的用户来吉菁,大像都霓在一些被勤式的管

理,有一部分用户在於主勤式或者者是面向服矜的管理,

或者者是第二次、第三眉次做瞭工作。比如^主勤的签

控,鲁就做一些容量与能力的规副方面的工作。我凭来看,

彳隹我杷号最^的IT的管理怎麽檬去面向IT服矜的管理来

的,IBM的服矜管理提出三偃|要紧的思想,第一彳固要紧的

思想是怎麽檬一彳固可视化,道是我凭在一^始^到的

冏题。如何能别把IT跟我相号渠矜之^的li系,与封蕖矜之

^的支持,我优能匏)用可视化的方式看到,能箜irn古、测

量,加且能匏)支持我凭日常的建雉,

第二他方面,我俨把它吉•^可控化,我相号怎麽檬去瞭解

我凭现在所有的IT的瓷羟,在适些IT的资羟如何来支持

我相号日常的建雉,与IT的资羟我伊妆口何去螯寸它做一佰1更重

彳复地使用,与封他暹行一偃I更高效地利用,彳兔而减馨我件?

的成本与提高我优的服矜^量,或且降低在管理谩程常中

的厘邛氤

第三彳固冏堰是自勤化,在自勤化造黠上,我凭不是^要有

什麽檬的羟品,或者者是在IT管理建言殳服矜某一彳固黠上^

施自勤化,落助我凭提高效率。彳能自勤化央言毒,不管是可

视化、可控化都贯穿在整他管理的谩程常中。自勤化我优

提供流程的自勤化怎麽^壬县包含^^il雉我凭做自勤化

的部署、整控,在整彳固盛控的方面,怎麽檬去^施自勤化,

来提高我年号的生羟效率。

首先彳徒可视化适值1目襟央言毒,我凭需要去洞察渠矜,我件号

需要去瞭解,现在的棠矜的状熊是什麽,我凭的IT是怎麽

檬去支持我俨的渠矜的,直接能匏I彳健我件子的IT渠矜的支持

上面看到可交付的目襟。彳俭我相号的解决方案来言毒,我仍号需

要提供畤的视II与^畤的dashboard,包含我优优渠矜

合规、建雉整他瞭解现在资羟的管理所需要的可用性,与

道彳固可用性是不是很好地^^瞭我件号的棠矜目襟。

在我凭的右谖是给瞭大像一些可视化的视H,彳度面我优就

造些可视化的内容迤行展^^通。

第二彳固部FE可控化,刚才已^^炎到瞭要紧的核心思想是我

优怎麽檬能匏)提供一彳固完善的操纵,能贫I去瞭解到我年号的

垣有的IT资羟与如何封我相号的IT资羟迤行僵化的利用。

在^到可控化道部分,大保曾想是不是^我杷5IT资羟的管

理,与彳险ITLI来音毒,更俱U重於CMDBiTIf的管理,彳俭彳爰面

整彳固建雉的角度来言第可控化封H瓷羟、CMDB的管理,

不是在资羟本身提供一彳固高效地利用率、管控也好,WF1

上封我杷号的^幺隹谩程怎麽^^^可视化,怎麽檬把^繁彳复

雄的基碘架情的事件、冏题能别可视化建成渠矜影簪。它

在道部分来者菁,提供瞭非常好的渠矜的技衍支持。

最彳爰是自勤化,符敏捷性融入到我优的il雉常中,落助我

杷5快速地^壬带S雉的目I票。

刚才我俯彳兔IBM服矜管理三彳固比较核心的思想与霍品黠,彳俭

我凭的言乳大保曾想到我件?现在面陶的是非常彳复潍

的IT的架横。在我相号道张If下面,大保可能看到的是在我

杷号下面的道部分,不管是彳性我件号的主檄、^放平耋、J1用、

^格、^音、傅WJ等等整彳固IT的基磁架横。it是我伸现在

面陶的,彳健IT的视角看。

彳他渠矜视角看的话,我所需要的是一彳固蕖矜的交付,彳他金艮

行渠来看,我需要的是女罔上金艮行能茹)提供我乃所承^的服

矜级别,能匏)在我粗号用户所期望,渠矜目襟所定羲的一些

警鹰畤IW也好,是在指襟之内封我件号大的用户,是筌寸渠

矜的用户提供服矜。

我相号现在IT与棠矜之我凭怎麽檬来建立造槿骄系,与

怎麽^雉,道是我相号给出的一偃星菱的模型。

在道的模型常中,要紧的部分是三低次,在金字

塔模型最上端,是我相号的渠矜所要^施的整彳固渠矜的管理。

在中的眉次是一偃1曾聚的il雉的管理。下面造彳固J1次来

需是我件号熟悉地傅统IT的管理令射或。我相号定羲卷一值I技

彳行的事渠令时或的管理,包含举打!用、^格、主檄、安全、

放平叠、存储等等的各值I支持我杷号的IT基磁架横的整彳固

璟境的各偃I事渠令取或的管理。

我分瞭雨部分探言寸,一部分我凭曾俱IJ重於在言氟根撼我件?

现在^雉的璟境,我凭怎麽檬在基磁架横的眉次做技街令直

域的事棠的管理。另外一部分,探言寸怎麽檬面向棠矜服矜

的管理。

首先,我俨彳也大像非常熟悉的领域^始,面向一彳固事渠技

彳而令直域的管理。富我伸回到各彳固事槊技彳射令鼬或,回到^^各、

鹰用、存^等等适些令黑或的畤候,我凭来看道彳固令巢或常中,

我相号的建雉目襟是什麽。可能作一彳固^^部FE的令:!蹲、

我凭大概是^很莫隹去把我凭的余罔格跟棠矜之^

做一彳固非常好的很一致、完全的封鹰。因^^^支持著很

多的愿用的^行,与我凭商棠的il行,在适檬的情况下,

我俨I彳於我俨]的建雉目檄来看,作卷我倒1系统事棠的令直域,

我相号的建雉目襟是什麽。在造彳固地方,我相脍能吉瞭雨彳固方

面的建雉目檄。

首先,建雉目檄是要保Bi我相号的系统可用性。一者炎到可用

性,大彳家博i炎到,我优怎麽檬去现一彳固高可用性,我的

可用性的能力是什麽。道他地方我凭定羲是我凭系统的可

用性目襟是满足我粗号的棠矜要求的,其次彳妙M雉的角度来

我杷号有非常重要的目襟是在整偃।系统的生命周期的建

与殳谩程常中,如何利用造棣科擘的数獴的分析,来支持整

他।系统的持^地赞展。道是彳至技街的事渠令财或来^的建雉

目襟,彳性垣在不管是n内、阈外,大彳家在技彳行令直域的事渠

的管理令酎或桂面,大彳家的一些成功的我伸要紧

分卷下面四彳固方面。

第一彳固方面我俨去提供瞭一他।可视化地签控,或者者^我

俨提供瞭可视化的祝置I。第二彳固方面是提供一他1很娶固的

事件基磁,道是非常核心的一部分。参考棠移影簪^系定

羲鼓掌分^或者级别,与我粗号要采取什麽措施翥量减馨或

者者是消除、11防造些能带来的影警。第三倜方面是器寸所

事言主的造彳固基磁架情令直域,它的il行的数摞全面的分析,

道些分析是我凭要定羲什么我凭的KPIo道些KPI它的建

行的^效是怎麽支撑渠矜的。第四值I是建立流程化的管理

平耋,支持II雉窥活的要求。

彳隹道彳固次来言黄,包含我相号跟n内很多的用户来做一些建

雉方面的工作,在建言殳的谩程常中有很深的ft畲,有可能

你建瞭非常好的女雕各管理系统、主械管理系统、存^管理

系统或者者是其他基磁架情的管理子系统。但是畲彝现,

道彳固系统很it在良性的璟境下做持地更新地满足我优的

建雉要求。上造方面通常存在的冏题是我俨集是横建

适值I技彳杆平耋,我杷号加没有去封如何^^值I技彳杆平毫保Bi

我相号的棠矜目檄,^^我相号的IT建雉目襟道方面做相^的

制度、流程化的支持,去使造彳固技街平耋如何最大限度地

去樊挥它的作用。

首先是建立一彳固笺固的事件基磁,优技钵j平耋来言毒,我凭

是怎麽檬能匏)去冢多的基磁架情事件常中迤行高效地虑

理。根撼我件号的在一偃I类期以於一偃I省的规模的^^

常中,即使彳堇僮是^^的一彳固事渠领域一天的事件量,大

概是在黑十离脩左右。道是我凭很多用户一起建言殳富中做

的统言十数撼,如何^道黑十离脩的数撼彝生之彳爰,^除上

真正影^到^雉、影警到棠矜事件的氛圉加不多。我年号怎

麽檬在适些事件常中抽取出封我凭蕖矜真正有影警的事

件,加堂寸其谨行虞理。因此11方面我凭特别弓金^如何建立

一彳固笺固事件的基碘,在一偃I平耋上,能匏)以高效地方式

螯寸它暹行虑理。

在建立事件基碘,事件量非常大,假如所有的事件都原始

移谩来都不行,造檄的言舌,言午多暹行事件的自勤屋缩。我

想弓金道檬的屋缩是不是能够优企棠的需求出彝做定制,

不是^把原来的丢掉瞭迤行屋缩。

建立垩固事件的基碘遢有一部分是我相号不需要^某彳固交换

檄的某彳固交换端口宕瞭,我出?1r迤行什麽影簪,我任I彳健事

件分析、居朝到黑制也好,我凭需要彳走最基磁的IT事件告

我相力比如^是某一彳固管渠部彝生瞭中断,道棣的信息曾

比某一彳固断口出II瞭端口宕造檬的信息。不管是封於IT

怎麽判断侵先级,与渠矜来者着,都要有可视化。

彳险我凭的目木票来吉心翥可能地采集更多的事件,但是优

繁徨亲隹的事件迤行分析,告^我凭真正跟棠矜相n哥耳箭的事

件是什麽,适些跟蕖矜后眼箭羟生的事件,才是我相号^雉遇

程富中需要核心地虑理与解决的冏题。造是第一彳固方面建

立一偃1笺固的事件基碘。

第二僭I方面,我凭怎麽檬彳兔我凭各彳固基碘常中做性能的分

析支持我年号的性能管理、彳爰^的容量规副能力上的管理。

适值I地方聚瞭雨值I例子,一值I是基於基^的性能分析,不

是每一彳固罩次、罩黑占的分析,而是优我凭整彳固的渠矜屣史

表现看。比如^金融棠来声着,像^金艮的表现,每周一到星

期天,与每天的Array黠到5黠,整彳固的流量建化超势是

不一棣的。我凭通谩基留泉的分析,我什!怎麽棣去狸得僵化

现在系统的容量,与现在的系统容量是否能匏)支持渠矜不

新增晨的需要。

在性能分析道部分,我凭要迤行一值I予就刖,我凭要彳隹罩褐

的女且件,与整彳固渠矜鹰用^件的^合木里面,我凭分析现在

提供的容量与性能是不是能贺J满足我凭整低I渠矜增辰的需

要。然彳度大概1t在什麽黠的畴候,假如常我凭的H矜增是

到什麽规模,我现在的IT基磁架横要迤行^容与升级,11

棣的吉舌,我件"故?i先的n■副,避免常棠矜的快速增是,而

使我凭的IT系统造成封渠矜增辰的瓶第凯

第三僭^方面51a套怎麽檬去瞭解我凭整彳固的IT的资羟

包含我杷号的^^、鹰用、鹰用之^的li系等等,包含^^

之IW的^系,彳能而封我件号整彳固的IT资羟^施操纵,

化地使用提供一他基碘。

造是一些例子,^於IT的资羟的辍表。我相,要去瞭解我俨

常前的使用率是多少,是不是有^置的,是不是我凭的容

量。造部分的言舌,我凭1r去愤同我凭刚才到的容量的分

析,卷我凭规副未来IT的服矜坐寸渠矜的支撑能力提供基

%

第四偃]方面,彳亲子系统的管理来Bt,是怎麽檬建立一彳固流

程化的平耋,使大彳家日常^雉的工作能够在流程化的平耋

上来迤行一彳固可效的^施,所有的建雄人具都曾定羲他的

建雉角色与^雉的殿责,最彳度通谩流程化的平耋去履行他

ig雉上的一些要求。

造是一些祝IS的呈壬嵬下面遢有一彳固视H。在造他I地方,

前面我凭的演音聋桂面也醵到瞭我相号怎麽檬堂寸一些效等等

暹行考量,琪在我件号看到的视H,整偃1故障彝生持^状熊

的^^的祝II。

我相号再回惊一下刚才^到金字塔的服矜模型,刚才我杷脂毒

瞭最基碘的一部分,也就是言兑整彳固IT事棠令第或的管理,与

在造彳固事渠令黑或管理上的^雉目檄,有雨黑占,一低I是怎麽

檬保瞪整低I系统的可控性。第二低I是封系统迤行押估与分

析规副未来的樊展。另一方面除瞭雨值I建雉目襟来髓,跟

大保分享瞭一些在n内的建言殳常中,我粗肚匕较多的四彳固方

面的^蹑,建立一偃1可视化的祝H,与建立一彳固非常好的

事件的基磁,迤行性能与容量的分析。最彳爰是^建立流程

化的平毫保瞪建雉能够在一值I企棠所要求的一些制度的璟

境下面迤行非常良好地il行。在彳爰面造部分内容狸面,我

我凭上面的雨眉。刚才造部分,我相号更多地去看怎

麽棣做基磁架情的il雉,彳度面央言毒,我凭偏重於怎麽檬把

基磁架情的建雉跟我杷号的棠矜目檄求迤行幺吉合,最^^我

优的渠矜来服矜。

现在大彳家看到的适张2船吉的片子,是^我粗悭寸整彳固曾聚管

理,就刚才中^的造眉,寅除上常我在Bt基磁架情的各他I

事渠子系统的管理的畴候,大彳家有一些疑冏瞭,女罔格集看

^的,系统集看系统的,鹰用集看鹰用的,存储集看存

储的,施来看渠矜,施来封整彳固的渠矜目檄负责,与保n

IT雉真正是^^棠矜目襟的,因此我粗号要做彳爰面的情

况。

第一步我凭所到的是做一偃11r聚的建雉管理,在造彳固管

理桂面,不管是余用格的、存锯的、主檄的^放平耋、系统、

鹰用、^音等等各彳固璟境子系统的数撼,上是需要送

到畲聚的平耋,由曹聚的平耋迤行虑理,最琨棠矜目

檄建立我相号的服矜模型来服移。

在造彳固畲聚的平叠未里面,我件?在道他地方也名恩系吉瞭它的一

些雉目本票。适值I曰寺候,我粗号要做集中的ITil雉管理,不

再是^^看^络、系统看系统,^与系统的建雉人员在

整偃I醴系常中燮成瞭二幺泉,在一^来言普,我相?要看整他IIT

的状熊,与擘寸常前的IT的建雉来迤行一彳固快速警鹰。

在it方面来Bt,我什号也^^吉瞭一些成功的建践,是建

立一彳固整合的事件平耋,道彳固畤候不是面向事蕖的子令生或

的,是面向整他I基磁架横的整合平耋,与如何迤行一些可

视化的方式来去看现在的IT基磁架情的状熊,与垣在棠矜

的行状魅。

基於我什旺兄在所^到的一偃I刚才^瞭基碘架情自身的管理

冏题,畲聚的建雉平耋,我件号最^是要^^一他更高的目

檄是怎麽檬暹行一偃1棠才务服矜的管理。在道他I地方求言着,

我相亚兄在看到道张IH跟大保看到基磁架情管理的II非常^

似。最下面是我凭整彳固基磁架横的内容,在基磁架播的内

容来辛菁,我相号要通谩一些基磁手段封整彳固数撼迤行采集,

包含依赖^系的采集、事件性能的采集、数撼的采集,其

他第三方的数撼的采集。不管是彳俭蕖矜部I3号看可视化的视

m,遢是棠矜部口号来看居找主的不彳堇彳堇是我凭IT提供的指

檄,可能遢包含棠矜的基碘指襟,比如^常前的琪境下,

某一偃।核心的渠矜吞吐量是什麽。因此大保曾看到,我件?

在整偃।艘系管理的畴候,大保能够熬卷,前面雨部分是言炎

IT的数撼,道遏的数撼不彳堇催是来自IT系统自身的数撼,

遢曾乘自於棠矜系统的数撼。

造些数撼搜集到之彳爰,我相号需要封他优迤行服矜n哥耳脚与服

才务化。

我凭怎麽棣建立可视化的视圈I,它的一些辞细的情况是什

麽,棠矜人具所n者主的棠矜的指襟、常前的状熊是什麽,

IT建雉的主管领醇所^心的建雉指襟是什麽,与言羊黜的建

雉人员后器主的建雉信息又是什麽,我凭怎麽檄去狸得,怎

麽棣去虑理,最^保瞪我伤去我凭的服矜管理的最

的目黑

在道桂,我系合瞭大保一彳固事例,道彳固事例看起来是彳住一值I

事件的角度我相号鲁吉式去年我主一彳固基磁架横的冏题,怎麽檬

跟我凭的棠矜迤行^^的。在造偃1事例常中,我凭看到最

上面的事件,彳健基碘架情搜集谩来的事件,是彝生在一彳固

服矜器的名字叫做ERP-APP-01是利用率超高的事件,适是

原始的。我件号忽略瞭中^很多傅统的事件,看到最彳爰,可

视化的系统告^瞭我凭什麽檬的信息。他告^我相号CPU使

用率超高的事件,溥致瞭鹰用服矜器速度的下降,而鹰用

服矜器是ERP的li维余且件,它又支持瞭鹰用,最彳爰,

上遢在告^你一些箔箭缸因卷CPU鹰用服矜的下降,醇致

超谩瞭1偃1Min的损失,即使是造檄的事件。先不看堂寸整

彳固高眉领厚有影簪,棠矜人具最彳爰集后依主造一黠,我的影

警是什麽。但是封我优的IT建雉人具来Bt,适檬的信息非

常有意羲。我伪看到瞭it些信息我件号怎麽做我凭il雉的僵

先级的副分,我凭确信是能做出来的。

MPPT未里面^瞭怎麽檬彳徒第一步到我俨现在所看到的渠

矜信息的一步中^的一些谩程,因卷畤^的居司系不言粽田做

解释,怎麽檬做规范化、瞿富、怎麽檬彳俭外部的数撼富中

掩得li耳缸最^^一彳固曾军的信息告^我优棠矜影簪的^

系,怎麽檬去做不是我凭今天的重黠,假如有檄曾以彳爰希

望能贫)跟大保做一些辞细地黜WJ地潢通。

我相号上已^^一彳固事例的角度来看瞭一下IT的基磁

架横跟棠矜之嗡福身系地一角。我凭怎麽檬来建立一彳固

IT的基磁架横跟IT之^的^月船首先要瞭解一件情况,

现在大彳家看到左下角基碘架情正在彝生什麽情况,我年号明

白彝生瞭什麽情况之彳度,我凭需要采取什麽檬的行勤做解

赛与造些情况是如何影簪到瞭棠矜。

我相号把造棣的一他1彳徒基碘架情的事件的彝生到封棠矜的影

警,与^^我乃整彳固渠才务管理的目襟,我件号把它分解卷6

彳固步骤,或者者是叫做6大方面可能曾更合逾。

第一部分是盛控,盛控所要^施的要紧的目上票是如何去掩

知基磁架横现在彝生瞭什麽。第二他I步骤是醴瞬,我除瞭

彳隹盛控的造彳固角度上能箜)狸取道檬的数撼之外,我逮要明

白我杷号琪在的一些愿用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论