某部委数据中心IT运维系统解决方案_第1页
某部委数据中心IT运维系统解决方案_第2页
某部委数据中心IT运维系统解决方案_第3页
某部委数据中心IT运维系统解决方案_第4页
某部委数据中心IT运维系统解决方案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

某部委数据中心IT运维系统解决方案第1章IT系统运维现状分析经过多年的建设,各省〔市〕厅〔局〕信息中心的信息化建设已经处在一个比拟高的水平。其网络规模庞大,网络应用系统紧密结合工作流程,具有特别的重要性和特殊性;其环境复杂,多系统、多数据库和多应用平台,多厂商网络及系统设备,多业务应用等复杂的管理环境。“三分建设、七分管理”,其运行维护质量与工作水平将直接关系到该部委所建的信息资源库以及各个应用系统能否发挥效益和业务专网能否平安、高效运行。按照ITIL的效劳理念和效劳水平的成熟程度要求,某部委数据中心在信息技术的管理标准、效劳流程和效劳质量上还有待改善,目前的IT效劳管理水准与实现信息技术资源共享、信息技术专业效劳的要求相比拟,有一定差距。主要表现在:缺乏统一的集中监控与管理平台。IT系统日常运行管理条块分割,网络、应用、平安、IT根底环境等根本上是各管一摊,缺乏一个统一的、主动的集中运行监控平台,既浪费了人力资源,也难以做到快速发现故障。缺乏统一的标准的有效的IT效劳管理流程以及与其配套的管理制度,支持IT系统的运行维护。对于日常故障和效劳请求的处理,重大故障的处理,以及系统变更等运行维护工作,很难监督处理过程,改善处理效果,提高处理效率。IT部门对整个IT根底设施和效劳的配置信息〔包括硬件,软件,文档,合同,过程,人员等〕缺乏全面有效的管理,跟踪和控制,不能为日常运行维护提供准确的信息。对事件和问题的管理比拟被动,缺乏效劳的前瞻性,不能形成从监控系统发现事件和问题到IT效劳管理平台处理事件和问题的闭环工作流。第2章系统建设思路随着数据中心信息系统规模的不断扩大,业务应用的持续增加,IT根底架构已经变得越来越复杂。仅仅依靠某个工具或个人,已经不能胜任如此巨大的工作量并满足业务紧迫性的要求。因此,必须有一套完整的IT运维管理解决方案帮助数据中心完成系统的运营和维护。通过IT运维管理工程建设,将做到信息系统故障早发现、早解决,确保计算机系统、网络和应用的连续、可靠、平安运行,降低发生故障的可能性,提高数据中心的系统运行管理水平和效劳保障能力,为相关业务工作提供高效、贴身效劳。2.1全方位的运维管理广通BroadviewIT运维平台解决方案是“IT管理思想+系统工具”的组合,它不仅是管理软件产品本身,而且还包括管理流程(Process)、管理标准(Policy)、业务(Business),并将管理流程、管理标准、业务贯彻到软件产品中去的实施方法。因此,广通公司为数据中心提供的IT运维管理解决方案不仅提供软件产品工具,还包括管理流程与标准、业务及实施方法在内的全方位建设。通过IT运维管理工程建设,将做到信息网络故障早发现、早解决,确保计算机系统、网络和应用的连续、可靠、平安运行,降低发生故障的可能性,提高数据中心的系统运行管理水平和效劳保障能力,为该部委相关业务工作提供高效、贴身效劳。2.2满足多角度的管理需求ITIL运维管理可以看成由效劳支持和效劳提供两局部工作组成。效劳支持是对根底IT设施的综合管理并帮助维护人员完成日常运营工作,工作重点偏重数据中心IT运维系统解决方案于IT技术。效劳提供是将管理数据转化为决策信息和业务层面的支持,工作重点偏重于从业务视角来看待问题。BroadviewIT运维管理解决方案面向不同层次的工作人员,可以满足多角度的管理需求。2.2.1面向根底设施的管理(1)全面管理系统资源提供对网络、主机、操作系统、存储设备、数据库、中间件及应用软件等IT资源的全面管理;包括纵向资源的配置与拓扑管理。(2)性能管理与优化面对网络、效劳器、数据库、中间件系统等性能进行监控,建立性能处理的基线。定期提供性能报表和趋势表,可以根据趋势分析,提出性能优化的建议,如修改系统参数、系统扩容等。(3)故障管理提供一个集中管理故障和事件的中心,能够收集各种管理功能产生的故障事件〔例如:网络事件、主机事件、存储藏份事件、平安事件等〕。完成故障事件收集、过滤、关联和处理等工作,以实现对故障的快速处理。2.2.2面向维护管理者(1)运维效劳管理运维效劳管理基于人与流程的结合,提供方便,灵活工作流程的管理功能,使工作人员维护管理工作的自动化和信息化,其中包括帮助台、事件、问题、变更、配置管理以及值班管理等根据客户量身定制的业务管理功能;(2)资源监控通过实时动态视图显示管理系统的实际数据,一目了然地看到当前IT系统的运行状态及趋势。可以综合监控IT系统中各种资源的实时状态和性能信息等所有运行情况,帮助管理人员快速发现问题,分析和确定问题所在;(3)知识库使工程师在处理系统故障的时候,能够参考相关故障处理的方法,让有较低技术水平的工程师也能够进行系统维护,从而降低IT运维管理对个人的依赖。2.2.3面向领导决策者(1)综合报表对IT系统运行状况信息进行汇总,并以图表的方式为管理人员提供直观的分析结果,帮助领导更全面的了解网络、主机、数据库、应用系统的运行状况和运行趋势,为领导决策提供支持信息。(2)绩效评估通过运维平台的工单处理数据,领导可以对系统维护人员的工作绩效有一个直观的了解。从而通过预定的关键绩效指标对工作人员进行绩效评估。2.3系统建设内容搭建IT运维管理体系包括四个层次的工作:一是实现数据中心IT系统的故障信息采集和统一处理。即对网络、效劳器、数据库、中间件、磁盘阵列、应用系统及机房环境进行有效的管理和监控,将网络管理、IT运维管理、平安管理、IT根底环境管理等功能整合在一起,实现统一的监控数据采集、一体化的报警数据处理、统一的故障流程处理。二是管理流程整合和统一管理。统一网络管理、IT运维管理、平安管理、IT根底环境管理相关的各个业务流,如值班管理、工单管理、资产管理、知识库管数据中心IT运维系统解决方案理等,形成数据中心运行维护的标准化流程。三是统一的信息展示和运行考核。根据资源监控系统采集的各类数据,提供网络、业务应用的信息展示功能,并与运行管理的绩效考核相结合。四是实现地市IT运维管理平台向省〔市〕厅〔局〕IT运维管理平台系统的数据上报,省〔市〕厅〔局〕可以全盘掌握各地市的运行情况,并生成各种统计分析报表。第3章系统架构3.1逻辑架构IT运维管理平台是一个完整的网络与系统管理、平安管理、IT根底环境管理、运维流程管理解决方案,可以最大限度的保护网络中的投资,并充分考虑到将来管理需求扩展。其中每一个层次之间的描述如下:图1.BroadviewIT运维系统逻辑架构3.1.1管理对象层管理对象层能够管理数据中心信息平台,涵盖了机房环境、网络设备、主机系统、业务应用软件、网络平安设备等。同时系统可以管理由网络设备和线路构成的多种链路。3.1.2组件管理层组件管理层通过各类探针(Probe)获得各类被管对象的数据。采集方式支持多种网络协议和采集方式,对于不符合标准网络协议的设备,系统提供二次开发的数据采集接口。采集协议与方式主要包括:SNMP、SNMPTRAP、Agent、WMI、SYSLOG、Telnet、Socket等。采集的数据类型主要包括:网络设备、主机系统、系统软件〔中间件和数据库〕、业务应用软件等。3.1.3数据会聚层来自不同被管对象的,通过各种采集手段获取的告警、性能、配置数据在数据会聚层按照预定的规那么和流程进行处理。3.1.4功能展现层展现层主要是将其下层模块所提供的功能的整合,为用户提供一个图形操作界面、浏览器访问等用户操作和使用功能。在其下层模块所提供的功能根底之上,我们提供效劳器、事件管理、问题管理、变更管理、日常作业管理、配置管理等ITIL效劳提供管理流程功能。3.2产品架构BroadviewIT运维效劳方案面对用户日益复杂的IT环境,整合以往对网络、效劳器与业务应用、平安设备、客户端PC和机房根底环境等的分割管理,实现了对IT系统的集中、统一、全面的监控与管理;系统通过融入ITIL等运维管理理念,到达了技术、功能、效劳三方面的完全整合,实现了IT效劳支持过程的标准化、流程化、标准化,极大地提高了故障应急处理能力,提升了信息部门的管理效率和效劳水平。图2.Broadview产品架构Broadview运维效劳方案由网络管理NCC、业务应用管理BCC、平安管理SCC、桌面管理DCC及集中运行管理COSS五大局部组成。1.网络监控(NCC)(1)自动、准确、及时地发现各类异构复杂网络的拓扑结构(2)可持续地监视、报告网络的运行情况(3)提供网络运行状态和性能的多角度分析与统计(4)拦截非法接入,保障网络系统平安(5)监控异常流量及ARP欺骗等病毒2.应用监控BCC)(1)资源监测子系统监控企业的效劳器、中间件、数据库、业务应用、平安设备及根底支撑系统〔如机房、空调、UPS等〕的运行状况;建立性能基线;发现系统异常并及时告警。(2)运行展现子系统围绕IT业务和IT资源,采用人性化多层导航呈现模式,由全局到局部、由粗线条到细颗粒度地逐层展现业务应用的运行状况。3.平安监控(SCC)(1)对各类平安设备告警事件进行采集和跨类型、跨厂商的分析(2)可将处理后的告警信息自动精确关联到平安知识库(3)实时的、翔实的、准确的呈现告警事件及信息4.桌面监控(DCC)(1)桌面资产统一管理(2)桌面平安策略的强制执行(3)终端用户行为审计(4)补丁发布(5)实现用户桌面系统的标准化5.集中运行管理(COSS)(1)IT资源监测结果综合展现(2)提供各种报表和视图,呈现IT资源的运行状况和运行趋势(3)基于ITIL的运维流程化管理(4)知识库管理第4章功能实现4.1NCC实现对网络的管理(1)网络拓扑发现■自动、准确、及时发现各类大型网络的拓扑结构,持续监视、报告网络的运行情况。■直观和自定义化的界面拓扑呈现。图3.广域网拓扑图(2)网络异常监测通过监测网络系统的各项运行参数,全面全面掌控网络的异常和性能情况,发现异常及时告警。■设备故障与链路阻断告警■设备与链路性能告警■异常流量告警,如病毒爆发、BT下载等图4.网络异常报告(3)终端合法性监控内置设备合法性监测引擎,自动监测网内终端设备的根本属性,自动比对资源表,告警非法终端设备。图5.网络异常报告

(4)网络链路管理图6.网络异常报告(5)统计报表提供了性能、告警、状态、资源多个角度的统计和分析报表。图7.运行报告4.2BCC实现对业务应用的管理4.2.1资源监控系统提供了近200种监测器。支持通过SNMPPolling、SNMPTrap、Syslog、CLI〔Telnet、SSH〕等协议或者UniAgent代理,对整个网络运行参数进行全面、系统、深入的采集。系统不仅能够对网络中的效劳器、网络设备进行监测,同时还具有强大的应用监测功能。组合使用它们可以对WEB、Email、DNS、FTP、ERP、CRM、MIS、中间件、财务、电子商务等应用系统从应用可用性、系统资源占用和性能指标三个层面进行全面深入的监测管理。(1)业务系统监测

(2)效劳器监测略

(3)数据库监测图略

(4)中间件与群件管理图略

(5)根底应用监测图略

(6)存储监测

图略

(7)扩展接口

图略

4.2.2运行展现(1)全局展现〔一级视图〕图8.BroadviewBCC主页(2)全局的健康排名〔一级视图〕对所有被管对象分类展现,根据负荷情况排名分析。图9.BroadviewBCC效劳器负荷排名(3)效劳器节点展现〔二级视图〕图10.BroadviewBCC节点运行展现页面-效劳器(4)数据库节点展现〔二级视图〕图11.BroadviewBCC节点运行展现页面-Oracle4.3COSS实现ITIL运维流程管理运维流程化管理系统提供了简洁直观地界面,将当前IT环境的运行情况直观地呈现给值班员,实现效劳器、事件管理、问题管理、变更管理、配置管理等ITIL效劳支撑管理功能。4.3.1效劳台作为用户与IT部门的唯一连接点,效劳台能够确保用户找到帮助其解决问题和请求的相关人员。效劳台不仅负责处理事故、问题和客户的询问,同时还为其它活动和流程提供接口。包括客户变更请求、维护合同、效劳级别管理、配置管理、可用性管理和持续性管理等图12.效劳台4.3.2事件管理所谓事件,是指数据中心IT运行维护范围内的所有与IT根底架构和应用相关的故障报告。这个流程是为了使业务部门和最终客户尽快回到正常工作状态而设计的。它是事件驱动的,所关心的是对事件的响应速度和和尽快恢复业务运作。图13.事件统计4.3.3问题管理在尚未查明事故产生的原因前,事故所对应的潜在原因被称为问题。问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。问题管理的主要目标是找到用户IT系统所存在的问题、防止事件发生,提升帮助台/事件管理的一线事件/故障解决率,提升整体效劳质量和客户满意度。图14.问题管理

4.3.4变更管理变更是指IT环境的各要素〔如网络根底设施、主机及操作系统、数据库和应用软件等〕的变动和更改的一切活动。变更管理是指从变更请求的处理、变更的批准、变更的准备、变更的实施、变更实施后确实认或拒绝、恢复管理、变更的控制和跟踪、发布变更结果,到最终形成变更管理报告的一系列管理过程和活动。变更管理的主要目的是为了保证所有的生产环境变化内容都经过评估和记录,从而控制风险。变更管理和其他管理的关系为:●

事件管理和问题管理在管理流程中,会向变更管理提出变更需求,变更管理创立工单解决事件或者问题。●

变更管理为发布管理提供变更方案〔发布方案〕。●

配置管理保存了平台中的所有配置项,和配置项之间的关系,为变更管理提供数据依据,变更管理的输入就是配置管理的数据。●

日常运作管理通过作业方案,值班调度控制,支撑变更管理。新建变更请求4.3.5配置管理配置管理指对生产环境中的软硬件资产、配置信息及各配置项的相互关系进行记录,形成集中的配置管理数据库〔CMDB〕,并对生产环境中的配置信息进行定期审计,以保证配置管理系统中的数据与实际生产环境一致。配置管理是其他效劳支持流程的根底,配置管理涉及的活动有规划、识别、控制、状态管理、效验和审计等内容。配置管理流程由规划和设置流程开始,包括创立配置管理数据库〔CMDB〕。当最初的设置工作完成后,配置管理流程负责日常配置数据结构、配置数据的管理和维护工作,同时提供配置信息相关的报告/报表,并定期进行审计。4.3.6日常作业管理日常作业管理是指对生产系统的日常运行维护工作进行管理,是信息系统运维的一些周期性的、相对固定的日常维护作业的管理。其主要目的是标准日常作业方案、标准日常作业内容、标准维护人员的维护行为、为人员考核提供根底数据。4.3.7知识库管理系统建设的目的不仅仅是标准、记录、催促、自动化管理工作,而且要帮助各级支持人员提高技能水平,简化IT效劳任务。同时也是降低对具体某个个人赖的手段。这些需要通过知识经验的积累和共享来完成。知识库模块主要包括以下功能:(1)提供支持人员提交经验和知识的输入接口或界面。(2)提供知识库内容的审查功能。(3)提供完善的查询功能,例如:查询关键字、知识列表等。(4)具有不同等级用户环境的区别,不同等级的用户管理不同的知识库内容。(5)提供知识库的分类整理,易于扩展、调整。(6)知识库支持Word/Excel/TXT等格式文档作为附件的输入。图16.添加知识库文章第5章公司介绍及典型案例5.1公司介绍北京广通信达科技〔以下简称“广通信达公司”〕成立于2002年,5年来一直

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论