CNS_DOC_12102506ITIL服务运营Ver400_第1页
CNS_DOC_12102506ITIL服务运营Ver400_第2页
CNS_DOC_12102506ITIL服务运营Ver400_第3页
CNS_DOC_12102506ITIL服务运营Ver400_第4页
CNS_DOC_12102506ITIL服务运营Ver400_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、C h i n a N e t w o r k L e a nNetwork Intelligence我们的特色:管理和技术结合我们的产品:为IT组织提供管理方案IT系统集中监测;IT系统运维平台;IT服务管理平台;我们的历史:2004年成立,专注IT服务管理9年总部:北京分支机构:广州、长沙,西安,武汉,济南我们的成就:产品销售总数量:370+使用者数量:5300+汉远网智Network Intelligence关于岗位、流程、价值链的说明;关于事态、事件、问题管理的说明;关于服务台和协控中心的协调模式说明;议题没 有 人 能 面 面 俱 到 , 且 能 时 时 刻 刻 的 盯 着 I T

2、系 统 。基本概念Event ManagementNetwork Intelligence职责职责职责职责任务任务任务任务岗位职责 Specialization岗位岗位岗位Network Intelligence岗位与职责Framing The Value Of Services职责职责职责职责任务任务任务任务开发主管IT管理者运营主管项目一组项目二组项目三组应用管理系统管理基础设施管理负责咨询咨询批准告知负责咨询杨文明负责齐雷王培旭批准批准史纪元批准胡嘉负责负责负责批准咨询咨询告知批准回访关闭升级记录分级分类活动RACI是负责(Responsible)- 批准(Accountable)- 咨

3、询(Consulted)- 告知(Informed)的简称,是一种用来帮助确定角色和职责的模型。RACI就是一种帮助我们计划由谁在什么时候做哪些事情的工具。Network Intelligence流程与活动Service Strategy 逻辑:人在推进“Action”,“Action”改变了“State”。状态机:关于状态机的一个极度确切的描述是它是一个有向图形,状态机通过响应一系列事件而“运行”。评估中评估审批中一次审批二次审批三次审批授权和排期中授权和排期标准变更开发管理评估中评估If执行“评估”Action,then进如“评估中”State。有向图“State”中有“Action”在“

4、状态S01”下,如果“事件E01”,那么执行“行动A01”,并且状态保持不变,或者转移到“状态S02”下。Network Intelligence职责职责职责职责任务任务任务任务流程与活动Service Strategy UU U开发主管IT管理者运营主管项目一组项目二组项目三组应用管理系统管理基础设施管理流程2流程3流程围绕着目标;流程定义了活动相互依赖和相关的顺序;流程是可度量的;Network Intelligence局部视角Service Strategy 开发主管IT管理者运营主管项目一组项目二组项目三组应用管理系统管理基础设施管理流程1流程2流程3流程5流程4往往服务过程的各个环节

5、由于职责所限,不可避免的出现了局部视角,也就是关注局部行动的效率、局部行动的价值。这样就带来了局部效益,而每个行动都是需要消耗资源的,而资源是有限的,这就可能使得资源没有投放在最需要的地方,而不需要资源的地方可能会带来产能过剩。Network Intelligence流程链Service Strategy 事件管理问题管理部署管理变更管理测试管理开发管理需求管理服务目录业务用户业务需求需求分析批准情况开发过程用户申告受理情况分析测试记录部署记录信息链流程链当组织中的每一个人能够站在链上看问题的时候,要比站在单个环节上看问题的视野和格局更大。流程链:将创造价值的各个行动和流程关联起来的作业链。让

6、每一个人能正确的做事,让每一件事都能发挥价值;信息链:将各个行动和流程的信息,按照派生关系关联起来。避免人员流动而产生的信息丢失;避免信息传递的长鞭效应;Network Intelligence服务台Coordinate and Service Desk服务台即成为事件的起点又是事件的终点,所以具备着全盘掌控突发事件的能力业务部门 供应商IT部门业务部门业务部门一线IT运维小组IT运维小组IT运维小组IT运维小组业务流程:OA、ERP系统业务部门与IT部门之间服务流程IT部门内部支持流程供应商供应商供应商供应商监测、分析、调整、实施请求与服务评估与支持事件Network Intelligenc

7、e服务台Coordinate and Service Desk程序安装服务;数据查询服务;数据操作服务;维修服务;巡检服务;网络接入服务;程序功能修改服务;事先将以前出现过的服务定义清楚,使得原本纷繁的服务请求,变得有序响应。统计故障处理和请求的比例;统计各类请求的比例;统计各客户的服务请求数量;Network Intelligence财务管理需求管理服务组合管理PlanDoCheckActionAction记录调查研究诊断升级突发事件管理事态管理解决临时解决方案知识管理转换/发布转换为可用的知识升级捕获信息服务请求实现服务请求记录评估履行交付标准服务访问管理访问请求检验提供权限执行策略监视和

8、跟踪服务安全访问监测过滤动作回顾自动和控制问题管理已知错误问题控制错误控制解决预防和消除问题80%的服务质量下降,来自于20%的问题。治标还是治本没 有 人 能 面 面 俱 到 , 且 能 时 时 刻 刻 的 盯 着 I T 系 统 。事态管理Event ManagementNetwork Intelligence事态管理Event Management,这一能力通过出色的监控系统来实现,主要采用以下两种途径:主动监控工具:轮询主要CI,以便从其中了解其性能和可用性。被动监控工具:收集日志或告警。存 储Storage数 据 库Database服 务 器 硬 件Server中 间 件Meddle

9、 ware服 务 器 系 统System网 络NetworkNetwork Intelligence事件感知Event Notification and Detection存储数据库中间件基础服务SNMPSNMPTelnet/SSHWMISDKSNMPCLISQLJMX管理协议的调度规则 和 阀值事态问题的关键在于如何定义什么该生成事态、在什么情况下生成事态。通常的做法是通过反复试验来定义声称哪些事态,采用默认的标准事态作为一个起点,然后不断调整,根据需要增减事态。Network Intelligence事态管理Event Management事件关联触发器记录的事态自动响应警告故障/问题/变

10、更?故障管理问题管理变更管理人工干预审查活动有效?关闭事件信息异常情况警告否是故障问题变更事件监测到的事件重要性过滤事件生成事件通知n信息n告警n异常情况治 标 还 是 治 本 ? 有 序 的 快 速 。突发事件管理Incident ManagementNetwork Intelligence术语:突发事件Definitions list : IncidentIT服务意外中断或IT服务质量降低。尚未对服务产生影响的配置项失效也是一种故障,例如镜像集合中的某一块硬盘发生失效。An unplanned interruption to an IT service or reduction in th

11、e quality of an IT service. Failure of a configuration item that has not yet impacted service is also an incident。Network Intelligence术语:突发事件Definitions list : Incident突发事件可能变为重大事件,而问题是导致一个或多个突发事件的根源。突发事件问题突发事件服务请求故障与服务请求并非一类,服务请求并不代表会对约定的服务造成中断,它们通常用来满足客户的需求,或者实现在服务级别(SLA)中规定的目标。服务请求通过单独的流程进行处理。突发事

12、件事态Event 有可能是正面的,也可能是负面的;但 Incident 是专指负面的。Network Intelligence宗旨/总体目的Purpose/goal 突发事件管理的目标是在内恢复服务,将对业务运营的负面影响降至最低,进而确保能够保持最高的服务质量与可用性级别。以达到目标的服务级别协议(SLA)。这里所说的“正常服务运营“是指在服务级别协议(SLA)范围内的服务运营。Incident Management ObjectivesTo restore normal service as as possibleon business operations that the best p

13、ossible levels of service quality and availability are maintained according to Incident managementObjective:To restore agreed service to the business as soon as possible or to respond to service requests.目标:承诺的服务或响应服务请求。 ISO/IEC 20000-1:2005Network Intelligence讨论性问题Incident Identification 运营小组服务台研发小

14、组请各组画一个事件管理的流程图。背景:IT团队有三个岗位,分别是”运营小组”、“服务台”、“研发小组”。业务应用:网银系统支持服务:信息协查、数据修改、技术咨询。规定:只有”运营小组”可以直接接触生产环境。Network Intelligence故障确认Incident Identification 故障记录分级/分类匹配知识库服务请求?解决?初始诊断调查诊断解决恢复关闭调查诊断解决?内部自动监测事态外部业务用户提交请求服务请求测试和判断监测测试接听小组T1:协控中心/服务台故障确认系统维护组应用维护组T2:专业技术岗T3:.厂商Network Intelligence故障记录Incident

15、 logging每一个故障 需要的信息通常包括:n 唯一的参考编号n 故障类型n 故障紧急度/影响度/优先级n 记录的日期/时间n 记录事件的人员和/或小组的姓名(名称)与IDn 通知方法(电话、自动、邮件、相关人员亲自通知等)n 用户姓名/部门/电话位置/回应方法(电话、邮件等)n 症状描述n 故障状态n 相关CIn 负责故障的支持小组/人员n 相关问题/已知错误n 解决故障采取的活动n 解决日期和时间n 关闭类型n 关闭日期和时间WHY记录?n 已有的事件记录可帮助对新发生的事件进行诊断;n 问题管理可通过对事件的记录来发现问题的原因;n 如果所有的来电呼叫都被记录下来,那么对于某一事件的

16、影响度的判断会容易一些;n 如果没有事件记录,那么将不能监控SLA是否得到履行;n 避免在解决问题时出现几个人同时解决同样的问题;Network Intelligence故障分类Incident categorization故障确认故障记录分类分级服务请求重大事件初始诊断功能升级职能升级2/3级别调查诊断解决恢复关闭结构升级管理升级重大故障流程Event Mgmt.Web用户致电技术人员鸽笼(Pigeonholing)把运营人员分成若干类,然后放入相应的位置里。既然岗位已经分工,那么事务也就可以按照岗位分工进行分类和派发,这样做是尽力的把不确定因素限制在每一位专业人士的工作当中。网络服务器OA

17、ERPNetwork Intelligence故障分级Incident prioritization故障确认故障记录分类分级服务请求重大事件初始诊断功能升级职能升级2/3级别调查诊断解决恢复关闭结构升级管理升级重大故障流程Event Mgmt.Web用户致电技术人员ImpactHigh MediumLowHigh123UrgencyMedium234Low345Priority codeDescription Target resolution time1Critical1 hour2High8 hours3Medium24 hours4Low48 hours5Planning Planned

18、Network Intelligence故障升级Incident escalationn 职能性升级:一旦明确服务台本身无法解决故障(或者当已超出一线解决的目标时间),必须立即升级故障以便获得进一步支持。n 管理性升级:如果故障严重,则必须通知IT经理,使其了解这一情况。故障确认故障记录分类分级服务请求重大事件初始诊断功能升级职能升级2/3级别调查诊断解决恢复关闭结构升级管理升级重大故障流程Event Mgmt.Web用户致电技术人员 Hierarchical (authority)Functional (competence)Network Intelligence解决和恢复Resoluti

19、on and Recoveryn 成功完成对事件的分析解决之后,负责解决问题的支持小组应在系统中记录故障的解决方法;n 对某些解决方法来说,必须要向变更管理发送一个变更请求(Request For Change,RFC )n 最糟糕的情况是,如果没有找到解决事件的方法,那么事件依然保持开发(Open)状态;故障确认故障记录分类分级服务请求重大事件初始诊断功能升级职能升级2/3级别调查诊断解决恢复关闭结构升级管理升级重大故障流程Event Mgmt.Web用户致电技术人员Network Intelligence故障关闭Incident Closure服务台应检查故障是否真的得以解决,用户是否满意

20、,并同意关闭故障。满意度调查故障重打开故障确认故障记录分类分级服务请求重大事件初始诊断功能升级职能升级2/3级别调查诊断解决恢复关闭结构升级管理升级重大故障流程Event Mgmt.Web用户致电技术人员Network Intelligence触发条件、输入、输出和接口Triggers, inputs, outputs and interfaces问题管理已知错误、临时方案变更管理变更信息配置管理配置信息服务级别管理SLA的约束报告业务关系管理容量管理相关信息可用性管理可持续性管理事故记录提交变更请求事故管理Network Intelligence日常服务请求处理说明ITIL Version

21、3服务台待办处理完成趋势状况专业岗位专业岗位日会服务请求业务用户业务和用户统计人员执行统计服务效率测量Network Intelligence日常故障处理说明ITIL Version 3协控中心专业岗位专业岗位日会事态整合监测LoadBalanceWANLANSecurityApplicationDatabaseStorage待办处理完成趋势状况业务和用户统计人员执行统计服务效率测量斩 草 不 除 根 、 春 风 吹 又 生 。问题管理Problem ManagementNetwork Intelligence宗旨/总体目的Purpose/goal 问题管理是负责管理所有问题生命周期的流程。主

22、要目标是防止问题和故障的发生,避免故障的重复发生,以及最大限度减少不可避免的故障的影响。Problem managementObjective:To minimize disruption to the business by proactive identification and analysis of the causes of incidents and by managing problems to closure. ISO/IEC 20000-1:2005Network Intelligence问题分类Problem Categorization问题分类:问题的分类方式必须与故障分

23、类方式相同,以便未来能够轻松跟踪到问题的实际特性并获得有意义的管理信息。问题检测问题记录分类服务台事件管理故障管理主动寻找问题分级调查诊断规避措施创建已知错误需要变更解决关闭主要问题结束主要问题审查需要变更供应商Network Intelligence问题管理Coordinate描述问题:什么、何时、何地、发生了什么、多么严重、目前状态;频率、数量和时间;时序分析痛值=范围(受影响的人员)X 持续时间(中断持续时间)临时解决方案:减少:降低频率和数量。控制:控制负面影响。消除:消除症状。问题检测问题记录分类服务台事件管理故障管理主动寻找问题分级调查诊断规避措施创建已知错误需要变更解决关闭主要问

24、题结束主要问题审查需要变更供应商Network Intelligence规避措施Workarounds在某些情况下,可能需要为由问题导致的故障找出一种规避措施,作为临时问题解决办法。在找到规避措施的情况下,还需做的一项工作是,保持问题记录处于开放状态,并始终在问题记录中详细记录规避措施的信息。问题检测问题记录分类服务台事件管理故障管理主动寻找问题分级调查诊断规避措施创建已知错误需要变更解决关闭主要问题结束主要问题审查需要变更供应商知 识 库Network Intelligence调查与诊断Investigation and Diagnosis80%100080060040020042910075502542132.6%31.99%24318.47%15711.93%40263.04%1.98%ERP系统BUG存储交换机故障核心交换主板死机楼层交换机故障硬盘损坏人为导致服务停止64.59%83.06%94.99%98.03%32.60%关键的少数。大多数的结果( 80% ),都是由一部分少数原因(20%)引起的。列出全部。重要的多数不可以被忽略。Network Intelligence什么是问题Purpose/goal 让我们来认识一下,什么是“问题”。问题是横

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论