运维体系和一体化监控平台项目咨询方案_第1页
运维体系和一体化监控平台项目咨询方案_第2页
运维体系和一体化监控平台项目咨询方案_第3页
运维体系和一体化监控平台项目咨询方案_第4页
运维体系和一体化监控平台项目咨询方案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、运维体系和一体化监控平台项目咨询方案 目 录 TOC o 1-3 h z u HYPERLINK l _Toc501054164 第1章 项目背景和目标 PAGEREF _Toc501054164 h 3 HYPERLINK l _Toc501054165 1.1 项目背景 PAGEREF _Toc501054165 h 3 HYPERLINK l _Toc501054166 1.2 建设目标 PAGEREF _Toc501054166 h 3 HYPERLINK l _Toc501054167 第2章 项目总体方案 PAGEREF _Toc501054167 h 4 HYPERLINK l

2、_Toc501054168 2.1 项目建设目标分析 PAGEREF _Toc501054168 h 4 HYPERLINK l _Toc501054169 2.2 系统总体架构 PAGEREF _Toc501054169 h 4 HYPERLINK l _Toc501054170 2.2.1 逻辑架构 PAGEREF _Toc501054170 h 4 HYPERLINK l _Toc501054171 2.2.2 物理架构 PAGEREF _Toc501054171 h 5 HYPERLINK l _Toc501054172 2.2.3 所需服务器配置 PAGEREF _Toc501054

3、172 h 6 HYPERLINK l _Toc501054173 2.3 建设原则 PAGEREF _Toc501054173 h 7 HYPERLINK l _Toc501054174 第3章 咨询解决方案 PAGEREF _Toc501054174 h 8 HYPERLINK l _Toc501054175 3.1 管理范围梳理 PAGEREF _Toc501054175 h 8 HYPERLINK l _Toc501054176 3.2 管理制度、流程分析 PAGEREF _Toc501054176 h 8 HYPERLINK l _Toc501054177 3.3 组织架构分析 PA

4、GEREF _Toc501054177 h 8 HYPERLINK l _Toc501054178 3.4 智慧岛运维总体规划 PAGEREF _Toc501054178 h 8 HYPERLINK l _Toc501054179 3.5 运维能力评估体系、评估指标 PAGEREF _Toc501054179 h 8 HYPERLINK l _Toc501054180 3.6 运维能力资格认证分析与规划 PAGEREF _Toc501054180 h 9 HYPERLINK l _Toc501054181 3.7 外聘运维专家 PAGEREF _Toc501054181 h 9 HYPERLI

5、NK l _Toc501054182 3.8 运维的三年规划 PAGEREF _Toc501054182 h 9 HYPERLINK l _Toc501054183 3.9 运维的安全风险管控 PAGEREF _Toc501054183 h 9 HYPERLINK l _Toc501054184 3.10 运维管理宣导 PAGEREF _Toc501054184 h 9 HYPERLINK l _Toc501054185 3.11 人力配对与招聘规划 PAGEREF _Toc501054185 h 9 HYPERLINK l _Toc501054186 3.12 现有工作优化 PAGEREF

6、_Toc501054186 h 10项目背景和目标项目背景新区目前信息化建设已比较完善。新区全岛类信息化资源非常多,包括:全岛wifi、电子围网、地下综合管廊、电子联网、传输网络等;同时新区大数据平台上目前运行着政务办公桌面云、OA 协同办公、工程建设电子监察系统、GIS 地理信息系统、智慧门户、网上办事大厅、跨境电商、数字城管等数十套应用系统;最后还包括承载系统运行的服务器、数据库、存储等软硬件设备。为确保新区信息化系统高效运行及数据中心运维正常和符合国际化发展趋势的要求,根据新区数据中心对运维管理体系的规范性要求,结合 ISO20000/ITIL 的建设理论做指导,大公司计划建立先进适用的

7、一体化运维平台。在原有的大数据中心建设的基础上,在运维体系规划和建设方面,启动咨询项目;启动监控平台建设、运维平台建设等方面,统一规划,相互支撑,最终实现针对管理范围的统一运维管理的实现。对所有机房、全岛资源、应用系统等实现统一管理、集中管控、规范化运维。建设目标本项目针对“统一运维”的实际要求,通过运维综合监控管理的建设,构建一体化运维平台的统一系统架构;规范运维管理体系与平台架构,统一管理各子系统运维管理工具,为运维管理平台立体化扩展构建基础框架;构建一体化运维平台的统一访问门户;将运维管理信息与工具集中管理,统一访问入口,运维管理信息共享与联动;构建一体化运维平台的统一展现视图;规范运维

8、管理信息展现平台框架;规范大屏(运维墙)展现内容与视图。本期项目建设,为一体化的运维管理打下良好基础,改变当前运维管理工作点多面广、维护力量不足、维护工作难于开展等一系列问题现状,实现以业务为中心,变“报障处理”的传统被动管理为“预测优化”的新锐主动管理,充分适应当前新区发展及信息化建设的需求。项目总体方案项目建设目标分析结合新区的运维管理现状,从“可视化,可控化,自动化”三个角度,理解本项目目标为:本项目具体建设目标为实现对数据中心内的所有基础架构组件(包括机房环境、存储设备、服务器设备、网络设备、操作系统、虚拟化、中间件、数据库等)的集中监控和事件处理,包括各类事件的报警和性能趋势分析,可

9、以根据用户的需求灵活定制各类监控策略。更具体分解如下功能模块:建设集中性能管理平台,具体包括网络管理、服务器管理、存储管理、中间件和数据库管理,以及集中告警管理平台建设。并对应用实现初步的性能监控功能,包括应用的进程、端口、URL、日志的监控。建设集中事件管理平台,事件是运维管理的核心驱动,集中事件管理平台将所有IT运维管理对象的告警事件进行集中管理,统一处理、分析、关联。建设自动化配置发现管理平台;以自动化工具为平台,配以基于网络、服务器、桌面、应用等方面的自动化技术和工具,实现IT系统的自动化管理及云平台资源、作业等的自动化管理。建设基于 WEB 的集中报表平台,针对历史运维数据进行指标建

10、模、统计分析。建设基于 WEB 的大屏展现系统,对实时的运维数据进行统一的动态展现。建设通信资源管理平台,实现对通信资源的可视化管理;建设集中远程管理平台,实现对多机房设备的远程管理;系统总体架构逻辑架构结合新区的运维需求和运维现状,建议规划逻辑架构如下:物理架构结合新区的运维需求和运维现状,规划物理架构如下:所需服务器配置功能说明硬件配置台数操作系统软件配置备注服务器1:集中监控/应用管理监控服务器2CPU, 4核,内存16G,硬盘600G1RedHat Enterprise Linux 64位IT资源监控软件/应用监控软件服务器2:报表服务器/存储监控管理服务器2CPU, 4核,内存16G

11、,硬盘600G1RedHat Enterprise Linux 64位报表软件/存储监控软件服务器3:事件集中管理服务器2CPU, 4核,内存32G,硬盘600G2RedHat Enterprise Linux 64位事件集中管理软件要求HA服务器4:网络监控服务器2CPU, 4核,内存16G,硬盘600G1RedHat Enterprise Linux 64位网络监控软件服务器5:3D展示管理服务器2CPU, 4核,内存16G,硬盘600G1Windows2003 64位3D展示管理软件服务器 6:集中远程管理服务器2CPU, 4核,内存16G,硬盘600G2Windows2003 64位集

12、中远程管理软件要求HA建设原则 运维平台建设必须遵从以下原则:满足新区大数据中心IT服务管理及IT基础监控的业务发展需求。所提供的用于建设IT管控基础平台的相关软件产品及模块必须是同一厂家的软件产品或是利用同一厂家所提供的平台通过开发定制而提供的模块,且能集成已有的第三方品牌的监控产品。提供的软件应是确保系统正常运行所需的管理、运营、实施、客户化、维护等有关的全部软件,并是成熟的最新版本的软件系统。开放性要求:系统应支持多种操作系统平台,如Unix、Windows,linux等;支持主流数据库,例如:Oracle,SQL Server等;至少支持B/S访问方式,支持快速客户化定制和开发;系统应

13、提供多种接口方式,实现与邮件系统、短信平台等集成。稳定性要求:系统应能够连续724小时不间断工作,出现故障应能及时告警。可靠性要求: 系统不能影响已有的IT系统的稳定性和性能。安全性要求:提供完善安全的用户授权和访问控制;权限控制应精确到每个设计元素或对象。维护性要求: 系统具有详细的帮助信息,并具备对系统自身的集中维护、配置和监控功能。网络要求:支持TCP/IP协议,支持穿越防火墙;支持地址映射。可扩展性需求:系统设计同时应支持在不改变系统架构和支持模式的情况下,通过增配软硬件和用户许可证的数量或二次开发,实现系统在功能、性能及规模上的平滑升级和扩展。咨询解决方案管理范围梳理我方会通过调研、

14、访谈等方式对需要管理的对象搜集数据, 例如搜集统计新区的运营管理范围, 以及新区对他的客户不同系统的管理范围。根据对运营商的了解对管理范围统计。并进行服务等级和分级的区分。管理制度、流程分析 我方会梳理新区的业务类型、服务目标、与第三方供应商的合作内容作为三大要素进行梳理与流程分析, 包括 现有运维管理流程、报障流程、供应商管理流程、事件管理与跟踪、库存管理等。组织架构分析 我方会分析公司运维体系组织架构的现状, 提供整体的组织架构图, 根据运维的对象改善与优化现有的流程达到各个专业人才支持专业的系统板块, 整体业务流程统一监控管理、相互支持的目的。并制定组织机构优化的实施计划、路线图。智慧岛

15、运维总体规划 基于一体化监控平台, 统一收集所有运维对象的运维状态、关联事件进行多维度分析,达到运维的统一分析、统一资源分配、统一管理的目的。并根据不同职责成立灾难救急小组,定期进行灾难演练,确保应急措施适用性与有效性。紧急事件发生后整个团队对事件进行回顾与检讨,随时根据现有情况进行流程优化。运维能力评估体系、评估指标根据运维的三大因素指定评估体系并建立评估指标。(1)根据网络的关键指标, 例如网络的丢包、抖动、可用率等关键指标统一管理进行数据分析,提出优化建议。(2)设备故障修复时间, 例如在设备故障导致用户服务停止至服务恢复的时间统计,进行数据统计分析,提出优化建议。(3)人员响应速度,

16、包括处理时间的效率与时间进行统计,配合KPI的制定与人员培训的安排指定优化建议。 运维能力资格认证分析与规划结合业内知名的资格认证,ISO9001,ISO20000,ISO27001和ITIL 等,协助新区运维能力规划。外聘运维专家根据对运维专家人员技能情况具体分析, 并指定针对外聘运维专家考核审计机制,统计当年各个指标的完成表现,为未来外聘合同制定规划。运维的三年规划针对根据新区的三十多个客户现状与未来服务发展目标进行分析, 对每一个项目目标进行三年的改进规划, 规划内容以项目的形式, 包括对软件、系统、人力资源分配的三方面规划。运维的安全风险管控以新区客户现状为目的分析,将未来可能出现的风险进行汇总并按其影响程度进行排列,针对每项进行具体分析提出解决方案。 例如硬件的冗余备份要求、 其余灾难的应对方案。影响重大的要立即实施, 可控的风险可以放在未来三年规划。运维管理宣导根据新区运维管理理念宣导的优先级、需求、目标、时间进度等进行制定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论