计算机专科毕业论文-企业IT运维管理体系建设方案设计_第1页
计算机专科毕业论文-企业IT运维管理体系建设方案设计_第2页
计算机专科毕业论文-企业IT运维管理体系建设方案设计_第3页
计算机专科毕业论文-企业IT运维管理体系建设方案设计_第4页
计算机专科毕业论文-企业IT运维管理体系建设方案设计_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要随着IT信息化的不断发展,企业中有大量的网络设备、安全设备、服务器和数据库,许多重要的业务系统都在这些IT基础设施上运行。许多网络设备、服务器设备和安全设备构成了一个庞大的网络体系结构。在网络环境下,当设备故障导致业务中断时,我们的管理者通常采用传统的故障排除方法对所使用的硬件逐一进行故障排除。这种方法不仅费时费力,而且难以准确定位故障点。为了解决上述企业在IT信息运维方面存在的问题,运维管理系统应运而生。通过对网络设备、服务器、日志信息、配置管理等基础设施的监控,实现信息系统的事前管理,使运维人员能够快速了解问题的原因,对症下药,尽快消除问题,确保信息系统及其业务系统的稳定运行。基于以上问题和解决方案,本文提出了一种结合ITIL流程的IT资源监控与管理方案。关键词:IT资源管理;网络监控;服务器监控;流程管理

前言随着IT信息化的不断发展,目前企业中有众多的网络设备、安全设备、服务器和数据库,在这些IT基础设施之上运行着多个重要业务系统。众多网络设备、服务器设备、安全设备构成一个庞大的网络架构。当网络环境中出现设备故障导致业务中断问题的时候,我们的管理人员通常采用传统式的排查方法,找出问题是出在交换机上,还是路由器上,或者是线路上。在这情况下,管理人员就需要耗费大量的时间去逐一排查,如遇到重要业务数据传输,管理人员很难做到定位故障点的时间短,处理故障及时,把损失降至最低。项目背景与需求对于业务系统的稳定性(CPU、内存运行率、关键业务进程运行情况、磁盘空间利用率)、链路连通性的监控也是十分的重要。业务系统是信息中心核心业务,要保证业务的顺利、平稳、无故障的运行,我们管理人员经常要一台台的登入业务系统检查各个指标参数运行状态,同时还要检查与业务系统息息相关的中间件、数据库运行状况。对于管理人员来说工作耗时、工作量大,无法及时发现存在的隐患。一但业务系统运行环境中的某个环节上出了问题,都很难及时判断故障点,做出及时、合理、有效处理。在此面临的诸多网络、应用的问题上我们就需要IT管理部门能够行之有效的对网络进行把控,因此需要有一套好用、高效的IT运维管理软件来帮助用户进行相关的运维活动。运维监控软件具备以下特点:事先监测系统危机,提出预警,根据预警解决掉潜在隐患。而IT运维解决方案也正基于此:把被动管理主动化;把复杂管理简单化;把分散管理集中化;变事后管理为事前管理。运维管理建设目标项目强调管理体系和管理平台的结合,通过管理体系指引管理平台的建设,通过管理平台来推进管理体系的成熟,从本质上提升信息部门的运维管理水平。在追求企业信息化效益最大化的基础上,更要形成企业信息化科学管理体系的创新。IT运维管理平台项目的两大方向目标如下图所示:图1.业IT运维管理平台建设蓝图该IT运维管理平台的建设在战略层的目标设立为构架好企业整体的信息化战略服务体系,从信息化服务管理创新以及提高的角度进行IT运维管理服务体系的建设,项目完成后将实现以下目标:建立集中统一的信息化运维模式;建立安全可靠的运维平台;建立符合企业自身需要的运维流程;建立面向业务系统的运维方式;建立合理的员工考核KPI;图2.企业IT运维管理体系提升战略思路IT运维管理平台建设的核心功能主要包括:IT资源监控:对信息网络、机房、业务应用等集成化的监控管理;IT资源管理:通过ITILCMDB的理念和技术,对IT资源进行梳理,建立IT资源的集中配置信息库;企业知识库:沉淀知识,提升企业运维人员的整体技能水平;服务管理:可以通过软件制定和梳理符合企业运行模式的服务流程,从而提高企业信息中心的服务水平,使得服务水平可以量化;统一运行展现:借助门户技术,建立以统一的运行展现界面和运维工作桌面,形成运维管理的工作化平台。图3.IT运维管理平台系统核心功能目标运维管理方案设计项目建设的过程,均采用“双向靠拢、持续改进”的建设方法论,通过规范的项目管理体系来确保项目的进展和质量,在项目建设中,始终贯彻既遵循IT运维国内外和行业标准,又充分结合企业的发展状况和远景,通过分析评估、设计规划、实施控制、建设总结不断滚动前进。网络监控对企业广域网及本部局域网核心网络设备进行监控,实现拓扑自动发现、设备的性能管理、故障管理、安全管理、流量管理、报表管理。IT运维管理软件基于国际标准的SNMP协议提供标准网络管理功能,能够支持SNMP的版本为v1、v2c和v3,构架上提供层级式部署和数据统一处理的特性,在同一数据总线上提供可插拔式的功能模块的开发与接入,实现扩展管理。在软件中通过设置网络设备的搜索范围,软件会按照输入的信息自动搜索该范围内所有配置了SNMP协议的完了设备,这些设备包括交换机、路由器、防火墙等,还可以自动绘制出企业目前的网络真是连接状态。在生成的物理拓朴图之上,企业用户的网络监控就可以实现如下的功能:1)跨厂商网络产品的统一管理2)所管理网络设备的所见即所得的面板图展示3)事件接收、事件转发和事件的告警功能(支持短消息、微信和邮件等告警的输出方式)4)网络中PC终端的连接管理5)企业网络中的IP地址资源的分布管理6)所有被管理的网络设备负载与端口流量的查看和告警管理7)企业网络中连接线路的流量管理和分析告警8)设备运行的历史信息记录和统一的报表分析9)能够实现发现问题后,系统自动隔离问题源软件采用了CPD、LLDP、路由协议、STP协议、ARP表和MAC表等多种信息混合而成的高效拓扑图搜索算法,能够准确的搜索企业网络内的所有可网管设备,自动分析网络拓扑结构情况,利用绘图引擎自动勾画出整个网络的目前的网络结构图,并在生成的拓扑图上实时反馈每个设备的运行状态和告警状态。在软件所生成的拓扑图上,用户可以查看设备的连接和分布情况、性能状况以及设备属性设置,以及各个设备之间链路的动态流量;通过不同的颜色区分负载和流量的压力级别,主动告诉用户网络当中的隐患在什么地方,实现事情预警管理。在软件自动生成的拓扑图中,拓扑图上的设备和连接的链路可以自定义增加注释,方便用户进行监控管理,用户可以从图上看到这些设备的地址、厂商型号、等,并能够自动辨别线路的类型。用户可以根据实际的运维需要对图上的设备进行分布方式的调整和标识,还能够设置背景,以及导入/导出拓扑图。设备之间线路的粗细以及颜色支持自定义,如下图:图4.网络的可视化管理系统监控IT运维软件提供应用服务管理,将主机、中间件、数据库、标准应用等IT组件纳入到日常运维体系中,化繁为简,以最直观、最便捷的方式帮助用户实现对“业务相关IT组件”的实时监控,辅助用户执行高效率、高质量的业务管理。在上述被管对象的数据采集方式上,IT运维软件采用SNMP、JDBC、SSH、JMX、HTTP和仿真等,这样可以兼顾不同使用群体和不同类型的管理单元的需求。应用服务管理的对象和监控参数类型包括:主机主机类的参数通过软件可以采集到如下KPI指标:服务器的配置信息:获取服务器名称、IP地址、系统版本、CPU个数、磁盘大小、内存大小等;服务器的运行状态:服务器运行状态、服务器磁盘状态、网卡状态、进程总数服务器CPU运行情况:CPU用户时间百分比、CPU系统时间百分比、CPU运行队列进程个数服务器内存使用情况:内存利用率、虚拟内存(交换区)的使用率、交换SWAP分区页数量(换入/换出);服务器磁盘运行指标:磁盘空间利用率、磁盘读/写速率、磁盘TPS指标。服务器文件管理指标:各文件系统分区的使用率和空闲空间、指定的关键文件是否存在和当前大小;服务器关键进程运行指标:包括进程ID、进程名、进程状态、占用CPU时间、内存占用大小等;服务器日志告警:检查服务器的关键日志文件,提取相关的错误日志信息(Warning/error/fail)并生成告警;实时监控操作系统,数据库和应用系统中制定的日志文件,并可根据其中的特定信息,执行用户预定义的操作;HACMP状态监控:对HACMP的状态、系统间切换和节点间切换等状态进行主动监测,并记录每一次发生切换发生的时间、相关服务器名称等信息。对硬件错误的监控:通过监控ERRPT日志,将连接结果发送到BTIM,我们可以做到对系统主机上硬件错误信息进行监控。数据库运维软件可以实现对多种数据库的监控和管理,方便用户对多种业务平台进行统一管理。实现对数据库容量、命中率、会话信息、日志信息等实现全面监控,并为用户提供直观的数据报表,方便掌握数据库的运行状态。可以关联告警系统,对数据库关键指标的异常状态进行告警,让用户可以及时的知道并进行处理。支持动态数据流转图,可图形化多角度动态全方位展现数据库诸如CPU、缓存、表空间、锁、缓存、读写速度多种信息。可以对服务器上的ORACLE、Sybase、LotusNotes、MSSQL等数据库系统提供状态监测和管理。数据库服务监视主要是对大型数据库系统的性能、事务、连接等性能数据进行监视。运维软件能够通过ODBC连接到指定的大型数据库服务上,执行管理人员指定的SQL语句,然后对所获得的结果进行分析处理,如果大于指定的阈值,则自动触发数据库服务监视告警。通过SQL语言对数据库的系统表进行监视,可以对数据库的表空间(空闲率)进行容量规划,并能够对表空间的使用情况进行定期分析和预警;可以实时监控当前连接数据库的会话,并能够在连接数据库出现问题触发告警;可以获取会话级的数据库运行性能参数,并对性能参数进行关联性分析,进行告警监测;可以处理数据库的事务提交数、事务回滚数、顺序扫描总数、排序总数、排序所使用的最大磁盘空间等系统运行状态参数的监测和告警;可以对数据库的磁盘IO参数如读取数、缓冲区读取数、写入数、缓冲区写入数等数据进行监测;可以对数据库的内存使用率、数据库容量、交易量、数据库连接数、进程状态、数据库资源使用率等信息进行监测;软件可以对数据库的表空间(空闲率)进行容量规划,并能够对表空间的使用情况进行定期分析和预警。可以处理数据库中的各数据表的记录数、锁模式、索引、Extents、总页数、使用页数等性能指标进行监测。可以对数据库的交易日志进行监视。对数据库系统监视包括但不限于以下指标:1.数据库状态:监听器是否工作,数据库是否工作;2.数据库的基本配置信息:数据库名、版本、32/64位、并行状态、归档模式、归档目录,基本配置等。3.数据库进程监测信息:进程占用CPU时间、内存大小、数据库进程总数;4.数据库自身告警信息:获取数据库的告警信息并告警;5.数据库SGA监测信息:高速缓冲区大小、重做日志缓冲区大小、共享池大小、数据字典缓存大小、共享库缓存大小、SQL缓存大小;6.数据库SGA性能监测:高速缓冲区命中率、共享库缓存命中率、共享数据字典缓存命中率、磁盘排序/内存排序比率;7.实时SQL监测:要求能够捕捉瞬时的或一段时间内执行的SQL语句,使管理员可以有效地获取关于正在执行的事务的详细信息;8.数据库表空间运行监测:制定表空间的使用空间大小,表空间使用率等、表空间碎片FSFI比率、读/写表空间平均时间;9.数据库表空间配置信息:表空间名称、初始大小、Next扩展值大小、扩展次数;10.数据库文件性能:数据文件名、数据文件大小、状态、读写次数、读写时间;11.数据库回滚段监测:回滚段名、回退段当前大小、命中率(取得次数和等待次数的比率),压缩次数;12.数据库会话信息监测:会话ID、用户名、占用CPU时间、内存排序次数、扫描表次数、读写次数、提交次数、所占用游标数、缓冲区命中率、已连接的用户数、空闲的连接数;13.数据库会话安全监测:判断是否有未经授权的IP地址、用户、时间段、使用特殊工具访问数据库的行为;14.数据库资源锁监测:监测数据库资源锁的情况,对超过锁定时间、锁过滤条件的资源锁生成相应告警。日志管理运维软件提供完备的操作日志管理、故障日志管理,支持按不同时段、不同对象查寻日志,支持日志打印输出、报表输出。运维软件可以记录和查询系统管理员和各级操作员的所有操作,信息包括用户名称、用户登录时间、操作内容等;运维软件提供有关指定设备的最近故障日志查询,可以查询某台设备或所有设备某时段或所有时段日志记录,可以打印输出;运维软件提供实时查询功能,可指定过滤条件;运维软件提供统计、输出等功能,可指定保存路径和多种格式打开方式;权限管理提供灵活可控的权限控制体系。运维软件具备超级管理员和普通管理员两种角色。超级管理员可以新增、编辑、删除普通管理员,可以对每一个普通管理员进行个性化的权限定义:根据不同网络层次中不同级别管理员角色的工作内容为其命名,并定义其可视、可操作内容,确保整个网管体系的安全。超级管理员可以根据工作内容的变化,再次编辑已定义的普通管理员的权限内容。Syslog管理运维软件通过监听UDP514端口,接收指定IP地址发送来的SYSlog信息,并按IP地址进行保存,提供用户进行实时查看和分析查看等。运维软件的SYSlog接收支持同步关联告警功能,可指定一或多个关键字,当接收到的SYSlog中包含这些内容的时候,即触发告警。在实时查看状态下,可以指定查看的消息类型,来源,严重级别等等信息,支持正则表达式智能筛选。在级别统计中,运维软件能够以饼图的方式展示消息的分布状况。在分析查看状态下,用户可以选择要查看的时间段,消息来源、消息类型和严重级别,并且支持正则表达式智能匹配,将关注的结果直接呈现。以及支持进行密度分析和级别统计。运维软件的SYSlog分析为用户提供了安全审计的良好平台,令全网的安全审计结果及时、直观地呈现在用户面前。配置管理配置管理功能提供了一个对交换机、路由器配置管理的平台,此功能对IT网络系统的关键设备的关键状态以及参数进行监控,通过telnet、ssh进行相关信息的备份,并且在当所选的设备的相关配置信息发生变动时能够及时进行进行告警,帮助管理人员能够及时分析问题,排除问题等。图5.配置管理流程图ITIL流程管理统一资源库(CMDB)CMDB是IT运维管理的核心和基础,是对资源整合管理的积累和升华。通过建立CMDB,建立符合企业IT环境的CMDB资源模型,并且导入资源数据,建立资源之间相互的关联匹配关系,形成贯穿网络、业务系统、主机、应用软件、人力资源、文档资源等的统一资源数据库。CMDB将为IT运维管理提供完整的资源数据支撑。图6.CMDB配置库资源模型IT运维流程管理对企业的IT运维管理流程进行评估和分析,制定符合企业信息化发展规范的、符合企业信息化管理实际情况的IT运维流程。通过事件管理、问题管理和变更管理,实现IT运维工作的规范化管理。通过建设IT运维管理流程,规范日常维护工作以及事件、问题、变更等工作,以流程控制运维工作环节。以制度建设保障流程建设,同时通过流程建设保障制度建设。图7.事件管理流程图8.问题管理流程图9.变更管理流程知识库管理建设运用IT管理平台的知识库,通过在日常处理事件单和请求单的过程中,积累处理故障或请求的解决方案;还可以通过问题管理模块中的问题处理流程积累相应的处理经验;最后还可以通过外部知识库的导入来完善企业内部的知识库,主要一来就可以逐步建立和完善信息中心知识管理体系,稳步提升信息中心业务管理以及服务管理水平,在今后的运维管理过程中提高处理问题的效率。系统建设阶段项目的整体工作内容大致阶段如下:序号工作内容实施时间备注1商务洽谈、合同签订2项目实施启动5个工作日项目启动会议、成立项目组、明确项目推进计划。3需求调研分析半个月调研表4运行环境准备5个工作日对部署的服务器、网络环境等做准备和调整5产品安装部署3个工作日相关软件产品的安装部署,进行初步设置。6网络监控管理的实施1个月依照设计方案,进行网络管理的实施,并针对实际情况调整和初步优化。7系统和业务监控配置1个月依照设计方案,进行主机、应用、业务的监控实施,并针对实际情况调整和初步优化。8机房动力环境监测系统集成调研半个月根据集成接口,配置系统集成。9网络拓扑FLEX展现编辑7个工作日编辑广域网拓扑和局域网拓扑在FLEX上的展现。10业务拓扑FLEX展现编辑半个月编辑主要业务系统的业务拓扑展现。11机房机柜的FLEX编辑半个月根据各机柜的物理分布,编辑FLEX图。12CMDB模型初始化配置1个月CMDB模型树各资源节点的属性项、录入表单设计、展现表单设计等。13CMDB数据导入及审计2个月CMDB资源数据的导入,并且由配置管理员审计并维护数据。14IT服务管理评估1个月对IT服务管理现状进行分析和评估15IT服务流程设计及配置2个月设计、讨论并确定流程,然后配置流程。16应用培训2个工作日应用培训17系统试运行3个月18正式运行以上某些工作阶段,可以并行建设,因此大致估算建设IT运维管理平台需要8个月至1年的时间。结束语在方案的构建过程中,存在各种问题,主要集中在托管对象的检索上,如:无法从交换机获取数据:交换机的OS版本比较旧。与设备厂家沟通后,需要升级操作系统版本解决。无法从windows获取数据:系统中的WMI服务未启动或SNMP服务器未安装,因此应在安装启动后解决。无法显示从交换机接收的系统日志:系统日志的级别设置不一致。重置级别后,您可以正常接收真实的日志信息。目前,报警设置的阈值不能达到最佳值,但是根据经验值设置的,存在一定程度的误报。其中一些是不可管理的设备,因此不包括在用于监视的软

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论