集团公司智慧IT运维平台-技术路线方案_第1页
集团公司智慧IT运维平台-技术路线方案_第2页
集团公司智慧IT运维平台-技术路线方案_第3页
集团公司智慧IT运维平台-技术路线方案_第4页
集团公司智慧IT运维平台-技术路线方案_第5页
已阅读5页,还剩103页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.3与企业运维支撑系统的集成。备份方案备份方案备份是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。备份技术介绍LAN-free指数据不经过局域网直接进行备份,即用户只需将磁带机或磁带库等备份设备连接到SAN中,各服务器就可把需要备份的数据直接发送到共享的备份设备上,不必再经过局域网链路。数据经由局域网备份到备份设备上。备份策略介绍全备份每天对系统进行完全备份。例如,星期一用一盘磁带对整个系统进行备份,星期二再用另一盘磁带对整个系统进行备份,依此类推。优点:当发生数据丢失的灾难时,只要用一盘磁带(即灾难发生前一天的备份磁带),就可以恢复丢失的数据。不足:首先,由于每天都对整个系统进行完全备份,造成备份的数据大量重复,占用了大量的磁带空间,增加成本。其次,由于需要备份的数据量较大,因此备份所需的时间也就较长。增量备份星期天进行一次完全备份,然后在接下来的六天里只对当天新的或被修改过的数据进行备份。优点:节省磁带空间,缩短备份时间。缺点:当灾难发生时,数据的恢复比较麻烦。例如,系统在星期三的早晨发生故障,丢失了大量的数据,现在要将系统恢复到星期二晚上的状态。这时系统管理员就要首先找出星期天的那盘完全备份磁带进行系统恢复,然后再找出星期一的磁带来恢复星期一的数据,然后找出星期二的磁带来恢复星期二的数据。这种方式很繁琐。另外,这种备份的可靠性也很差。在这种备份方式下,各盘磁带间的关系就象链子一样,一环套一环,其中任何一盘磁带出了问题都会导致整条链子脱节。比如在上例中,若星期二的磁带出了故障,那么管理员最多只能将系统恢复到星期一晚上时的状态。差分备份管理员先在星期天进行一次系统完全备份,然后在接下来的几天里,管理员再将当天所有与星期天不同的数据(新的或修改过的)备份到磁带上。差分备份策略在避免了以上两种策略的缺陷的同时,又具有了它们的所有优点。首先,它无需每天都对系统做完全备份,因此备份所需时间短,并节省了磁带空间,其次,它的灾难恢复也很方便。系统管理员只需两盘磁带,即星期一磁带与灾难发生前一天的磁带,就可以将系统恢复。备份技术要求为了保证系统的可靠性和稳定性,除了考虑各个平台组件的技术要求。还对在故障情况下的数据丢失和恢复进行考虑,针对备份方面,关键的几个要求如下:完备的备份策略:支持定时备份和达到定量时备份的两种机制;当数据生命周期结束、或容量达到一个配置的峰值时,可自动触发备份/清理工作。备份策略方面包括数据物理存储、操作系统和应用系统的备份和恢复。可以对安装后的操作系统和应用程序进行备份。以后操作系统补丁升级或者应用程序版本更新时再作增量备份。备份类型能够支持全量备份、增量备份、差分备份等多种备份方式。可以按月定期作全量备份,备份所有数据。按天做增量备份,备份增量数据。按周做差分备份,备份上次全量备份以来所有的数据。为了保证备份磁带的安全,要同时保留两套磁带备份。一份保存在数据中心的磁带库中,另外一份保存在数据中心外的安全地点。恢复策略,应该在满足数据实效性的前提下优先采用恢复时间短的方式。根据不同的故障情况制定不同的恢复策略。有条件的省公司可以考虑容灾方案。容灾的主节点和灾备节点可以支持互备方式或者N+1的灾备方式。重点备份内容系统备份:在不影响现有平台正常运作情况下完成系统备份。要求制定平台恢复计划,在系统崩溃的极端情况下快速恢复到最近的拷贝。数据备份:数据备份可以根据需要通过完全备份、增量备份方式实现。参数设置:备份方式、备份内容、备份时间和备份介质等参数设置。恢复方案恢复时间与策略必须保证关键业务和关键功能的运作,备份修复时间不得大于12小时。在制定备份恢复方案时,必须对各个系统的各个方面进行考虑,检查每一个核心业务流程,确定其关键度等级,并根据关键度等级分配人力、物力和时间,确保关键业务的持续运作。必须为所有可能出现的各种异常情况制定备份恢复方案。我们无法预知哪个系统将出现问题,因此必须制定全面、详细的备份恢复工作计划,记录成文档,并进行测试、准备和演练,以便在需要时启用。估计中断持续时间,制定备用方案。对一两个小时的中断处理与对一两个星期或更长时间的中断处理完全不同,因此必须根据中断可能持续的时间,选择相应的备份恢复措施,制定具有实用性的备份恢复方案。备份恢复处理流程备份恢复处理流程图如下:备份恢复处理方案由于本项目涉及产品较多、覆盖面广,因此在平台运行过程中技术故障的出现将是不可避免的,针对这种情况,我公司设计了完善的技术故障备份恢复方案。当技术服务中心收到项目单位平台出现故障的技术支持与售后服务需求时,我们将在2小时内作出实质性响应,联系项目单位技术人员核实故障情况,收集故障信息,并根据需要派出技术服务中心本部或本地分支机构服务人员到达项目单位故障现场,以最快的速度分析故障原因,确定故障点,再根据故障类型和项目单位的需求,进行故障排除。根据我公司多年的IT运维平台集成后售后服务经验,我们总结出IT运维平台中出现的几种典型技术故障情况,同时针对不同情况提出了相应的预防措施和备份恢复办法。具体内容如下表所示:紧急情况预防措施备份恢复处理方案硬件故障保障机房环境满足设备工作要求;严禁带电操作。若发现设备内部损坏(如某CPU板不能工作),自检不能通过,及时拆除损伤的设备(如损坏的CPU板),用设备的最小配置启动系统,暂时使系统运转起来,再对损坏的设备进行相应处理同时申请备件更换;软件故障我们提供的全部软件产品均经过严格的测试,在安装时也会安装好相应的补丁程序,很大程度上减少了软件故障发生的可能。了解问题的详细情况,根据具体问题,提出相应的备份恢复策略,同时负责将问题通知相关的设备、软件厂商,督促厂商及时地提供软件补丁或者软件修正方案,在得出相应的解决方法何软件补丁后,及时与项目单位技术人员一起解决故障问题。操作失误我们在技术培训中会把设备、软件的操作作为重点内容讲授给项目单位的技术人员,减少操作错误的可能,并且强调系统备份的重要性,讲授系统备份的方法。同时,协助项目单位制订系统运行管理制度及规范,尽量减少误操作的发生。项目单位技术人员可以独立或者在客户服务中心技术人员的指导下,按照正确的操作步骤,利用事前的系统配置备份完成系统恢复工作。配置丢失对项目单位各级技术人员强调系统备份工作的重要性,同时提供系统备份与恢复工作的培训内容,使得项目单位技术人员掌握对于设备配置、各类关键数据文件等多种类型的系统备份与恢复步骤。项目单位技术人员可以独立或者在客户服务中心技术人员的指导下利用事前的配置备份完成系统恢复工作。非法入侵我们在进行方案设计时,已经充分考虑到系统的安全性,采用了多种成熟的安全技术和产品,大大降低了非法入侵的可能性。客户服务中心的技术人员利用专门的工具,对线路进行监控,及时地查找到入侵根源和系统的安全隐患,并且提供相应的解决方案。软硬件配置方案软件配置清单运行监控配置清单产品名称

或服务项目软件模块功能说明或服务内容自主软件统一采集云平台软件V7.0网络采集适配器实现各种网络设备自动发现,采集网络安全设备的状态、流量、日志、性能、连接数、服务、告警等数据服务器采集适配器采集Windows/Linux/Unix各种操作系统的服务器(小型机、PC服务器、工作站)的状态、故障、日志、性能、文件、进程等数据虚拟机采集适配器采集集成各种虚拟化系统的物理机与虚拟机资源映射、性能、变化、告警等数据数据库采集适配器采集oracle/Sybase/SQLServer/MySQL/DB2等各种数据库及实例的状态、性能、表空间、连接数、日志等数据中间件采集适配器采集MQ/Websphere/Tomcat/IIS等中间件的队列、通道、会话、WEB应用、线程池、JVM、JMS等数据存储采集适配器采集光纤交换机、存储阵列、带库的状态、性能、故障、容量等数据基于J2EE应用软件采集适配器采集J2EE应用组件(JSP、Servlet、JDBC、JavaBean、EJB等)的响应时间、吞吐量、并发量、延迟量、队例、内存、用户、线程等数据.NET应用软件采集适配器采集.NET应用组件的响应时间、吞吐量、并发量、延迟量、服务、内存、用户等数据基于Domino应用系统采集适配器采集Domino应用组件的名称、状态、请求数、成功请求数、失败请求数、错误率、响应时间、完成率、平均负载等数据适配器集中管控可对适配器进行注册、卸载、查询、卸载等操作,支持采集单元的新增、复制、删除操作采集策略管理包括采集策略的设置、查询、存储和补采策略配置采集数据共享管理实现数据消费者、消费者授权、数据订阅、数据分发、数据重传采集负载均衡管理包括采集节点管理、采集任务管理、采集状态监控采集数据质量管理采集完整性、及时性、合理性监控管理,数据补采、质量分析、采集日志等BrightView企业网络管理系统软件V7.0告警策略管理包括告警策略的增、删、改、查告警分析处理对告警的重定度、关联、根源性分析、过滤、压缩,以及性能动态基线管理告警通知与转发告警转发配置,实现将告警按照范围、类型、级别、接收人、接收方式等条件定义,通过短信/邮件/统一通讯/声光电/移动终端的告警通知性能分析管理对网络设备、服务器、虚拟资源、数据库、中间件、存储、应用软件等专业特性,对其各种性能KPI指标数据进行计算、聚合、分析自动化巡检提供实时和定期巡检方式,对设备运行指标进行电子化、自动化巡检,生成相应的巡检报告统一告警视图实时告警信息的查看、实时滚动刷新,并通过闪烁、声音、弹出信息框等多种方式进行提醒,提供历史告警信息的分类查询与统计网络拓扑视图生成相应的Web网络拓扑结构图,提供拓扑灵活定制,直观实时展现整个网络的连接、分布、配置、故障、性能综合运行情况网络流量分析支持对路由器和核心交换机的Netflow/Netscream/IPFIX/Sflow等流量协议的深入分析机房视图采用机房仿真监控的方式,直观监控与展现信息机房的布局、机架设备部署、服务器运行状态、服务器运行性能分析服务器监控对Win/Linux/Unix等各种平台服务器的通断、故障、CPU、MEM、DISK、文件、I/O、接口流量、进程服务等监控管理SAN网络拓扑自动发现数据中心的存储、备份设备,并形成相应的存储备份拓扑图存储设备监控实现光纤交换机、存储阵列、带库等存储设备配置、性能、故障、读写状态的实时动态展现数据库监控定期对oracle/Sybase/SQLServer/MySQL/DB2数据库进行量化健康体检,对体检结果进行细化分析,对数据库的运行情况、服务提供情况、性能情况进行实时监控中间件监控对WMQ/Websphere/Tomcat/IIS等应用中间件的jvm内存堆使用情况、servlet执行情况、JMS消息处理、web应用、jdbc连接池等进行监控管理可用性管理建立业务关联模块,基于应用可用性算法,实现对各应用系统可用性、健康程度的量化体检和综合诊断,并定位挖掘影响业务可用性的业务元素业务影响分析关联业务模型,分析业务网元故障对应用系统的影响,定位影响应用系统可用性的最终故障根源终端用户模拟对模拟终端用户访问各应用系统(如登录、查询、报表、退出等)的过程进行监测,监测终端用户访问应用系统的可用性与响应时间端到端监控从用户请求、到WEB服务器、到应用服务器、到数据库及返回的整个过程的端到端监控应用监控展现从网络层、系统服务层、应用层等不同层次综合监控展现各应用系统的运行情况,监控软件故障情况,提供应用系统的整体监控展现统计分析报表对应用系统、网络、服务器、存储、数据库、中间件等监控对象各种性能指标,生成各种时间粒度的统计分析报表报表订阅支持各种报表的PDF\EXCEL导出,同时支持定期邮件订阅和主动推送系统管理包括多租户管理、网元管理、用户权限管理、数据自动清理、系统日志管理等服务管理配置清单产品名称

或服务项目软件模块功能说明或服务内容自主软件BrightView服务管理系统软件V2.0流程引擎流程引擎,实现运维服务工单的流程图形化和界面构件基础服务个人工作台提供运维日常操作服务台、管理控制台,方便运维人员、管理人员的日常运维操作管理,及时处理待办事宜,掌握工作进展情况服务水平管理服务级别的制定、跟踪、控制、评估的管理流程服务请求管理服务请求的发起、审批、提供、满意度调查等流程管理服务目录以目录方式向最终用户提供的标准化服务内容,实现服务目录的制定、日常维护事件管理快速恢复故障或响应用户请求,包括事件的记录、分类、诊断、处理,并监控、跟踪处理情况问题管理对IT故障根本原因进行分析、解决的服务管理流程变更管理对故障管理、问题管理产生的变更请求进行响应,分析变更影响、评估变更风险、安排变更计划、调配变更资源发布管理对发布所需的发布计划、系统测试、培训计划、发布实施等环节进行控制,规范发布的过程流程配置管理IT资源配置项的识别、记录、管理的流程知识管理运维故障处理工单解决方案入库,及运维知识的检索、查询、排名、推送作业计划管理对周期性任务制定计划,跟踪执行情况,对执行结果进行反馈值班管理运维排班、交接班、值班日志管理,对值班时间、值班人员、排班计划进行管理系统管理提供系统的权限管理、角色管理、菜单管理、组织管理等配置管理配置清单产品名称

或服务项目软件模块功能说明或服务内容自主软件综合资源管理系统软件V3.0配置数据自动采集定期自动采集网络设备、安全设备、服务器、虚拟资源、数据库、中间件、存储、应用软件的配置数据,可定义配置采集范围、采集频率、采集时间配置数据联邦调和实现配置数据的联邦调和,对多个数据源,支持配置项数据的调和,避免配置项数据不一致配置项管理策略定义配置管理范围、定义CI命名规划、定义信息收集模板、定义CI项的审核周期等规划配置项定义与标识配置项的标识,收集CI属性和标识CI关系,维护CI模板配置项实例维护配置项的增删改查,提供表单维护、配置项信息的批量导入导出、批量创建和维护配置项关联关系维护包括关联关系定义、关联关系视图、业务影响分析配置项审计管理审核某类CI信息、审核总结/流程KPI、更新配置管理策略配置项基线管理配置项基本快照生成、配置项查询、配置基线回退配置项统计报表配置项的查询,配置项统计报表、配置项分析报告资产管理实现采购、入库、资产办理、出库、清单、进出机房、维护、变更、报废及处置的全生命周期管理系统管理包括多租户管理、用户权限管理、数据自动清理、系统日志管理等运维门户配置清单运维门户系统软件采用微软Sharepoint平台,根据需求进行二次开发,来实现信息服务、自助服务、集成服务、运维论坛、栏目管理、布局管理、页页生成管理、展现策略管理、后台服务、代办提醒、用户登录、用户管理、搜索管理等内容。大屏展示配置清单产品名称

或服务项目软件模块功能说明或服务内容自主软件综合监控系统软件V2.0数据采集与抽取管理从呼叫中心、服务管理、运行监控、CMDB、运维门户中同步集成、抽取所需的数据可视化展现管理可视化展现相关的控件管理、画面管理、布局管理等数据处理对采集和抽取数据的计算和维护,包括指标模型计算、业务数据计算处理任务调度管理包括对数据处理的同步管理、维护管理可视化视图组件管理包括列表组件、图表组件、拓扑组件、MAP组件、三维组件等组件的管理综合展示控制台提供欢迎辞编辑、阈值设置、换肤功能、告警配置等功能,通过IPAD控制各种展现模式的切换数据挖掘与分析提供数据仓库、BI报表工具硬件配置清单配置建议

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论