智慧冷链物流平台领域运维方案_第1页
智慧冷链物流平台领域运维方案_第2页
智慧冷链物流平台领域运维方案_第3页
智慧冷链物流平台领域运维方案_第4页
智慧冷链物流平台领域运维方案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智慧冷链物流平台领域运维方案

1.1.1运维服务目标、范围与期限

运维服务目标:保证系统设备安全有序的良好运转。

运维服务范围:包含网络系统运行维护;计算环境运行维护;

存储备份运行维护;应用系统运行维护;机房运行维护;安

全运行维护;网络客户端运行维护。

运维服务期限:10年

1.1.2运维服务内容

1.1.2.1工作内容

日常的运维工作内容包括:网络系统运行维护;计算环

境运行维护;存储备份运行维护;应用系统运行维护;机房

运行维护;安全运行维护;网络客户端运行维护。

1.1.2.2工作方案

(1)网络系统运行维护

运行维护内容和任务包括:

1)网络节点和拓扑管理

保持全网拓扑结构的自动生成及实时更新。以便于直观

的观察和监控。拓扑图包括骨干线路的拓扑图、基于设备物

理连接的物理拓扑图、按照地理位置的网络分布图、楼宇的

网络结构视图、重要网络设备的管理视图、核心网段的网络

拓扑图、根据网络管理员日常工作的维护视图等。

2)网络性能管理

根据被管理对象的类型及其属性,定时采集性能数据,

如流量、延迟、丢包率、CPU利用率、内存利用率、温度等,

自动生成统计分析报告;可对每一个被管理对象,针对不同

的时间段和性能指标进行阈值设置,通过设置阈值检查和告

警,提供相应的阈值管理和溢出告警机制;监控网络系统节

点之间的网络时延,搜索从源节点到目的节点的网络路径和

从目的节点返回源节点的网络路径,并把沿途线路带宽和设

备状态直观地显示出来。

3)网络故障管理

实时监控网络中发生的各种事件,根据需要定制监控的

对象和内容,当出现预定义的故障或超出性能阈值时,将按

照管理员指定的处理方式自动报警或动作处理;使用网管系

统的连通性故障自动定位和诊断功能,对于故障事件能进行

自动关联,得出最直接的故障原因,并将明确的故障发生定

位信息通过告警系统发送到网络管理员;告警系统提供多种

报警方式,如电子邮件,声音,告警信息、发手机短信等;

管理员定期完成网络连通可用性分析报告;通过与帮助台联

动,实现故障处理的规范化。

(2)数据库系统运行维护

数据处理与数据库运行维护内容和任务包括:

1)服务器系统维护。具体如下:

•硬件系统管理。实时监控主机内温度、风扇状态、电

源状态、主机板、CELL状态、盘阵状态;实时监视系

统CPU的利用率,显示CPU运行队列的长度;对内存使

用情况进行管理;观察硬盘及磁盘阵列的使用率,统

计用于文件读或写操作的磁盘I/。利用率以及虚拟内

存的使用率。

•系统进程管理。实时监视系统进程的运行状况,并在

系统进程出现异常时给出告警,针对出现异常和长时

间占用内存或CPU的用户进程进行重点监控。

•网络性能管理。监控服务器网络通断、冲突和错误的

情况以及其网络流量的情况。

・性能报告管理。监控系统资源的实时变化,设置异常

门限值,当正监测的系统性能参数达到门限时产生报

警,并按时间段生成系统资源的历史性能报告。

•文件系统空间管理。实时监视文件系统空间的使用情

况,并在文件系统达到一定的阈值时给出告警;对系

统中的重要文件进行管理,监视重要文件的存在与文

件的大小变化情况,监视文件系统的挂载情况,出现

不能正常挂载文件系统时给出告警。

•群集管理。实时监控Unix服务器群集和包的运行状态

信息。

2)数据库系统维护

•监视数据库的状态、SGA的各种参数、日志事件(警告)、

侦听器状态、进程状态、可用性如死锁、资源争用、

不一致性以及会话和SQL活动、等待状况、数据库碎

片情况等。

•监视关系型数据库归档日志和可用空间量,以及关系

型数据库归档日志目的地中可用空间的百分比;监视

转储目的地目录的使用空间百分比。

•监视并警告当前分配的扩展数据块数超出指定阈值的

数据库对象。

•对表空间的使用情况和增长情况进行定期分析和预

警。

•针对数据库中的I/O情况进行实时监控。

•定期提供数据库运行性能的分析、帮助提出诊断和优

化调整建议。

•将监控到的数据库性能指标保存下来,生成性能趋势

报告,为管理者提供决策依据。

•定期检查系统日志和备份作业日志,根据日志解决存

在潜在问题。

3)数据存储备份运行维护

运行维护内容和任务包括:

•对IT环境中的存储和备份资源集中监控,统一管理,

实时得出设备性能参数,如I/O请求的数量、物理I/O

读写响应时间和数据传输峰值、cache使用的统计数

据等;规划总体存储空间,分析数据量随时间增长的

趋势图表,合理分配资源,并对系统性能进行优化。

•对应用进行数据迁移前,进行风险分析和评估,制订

应用迁移方案,提交风险回退方案;数据迁移后对数

据一致性、完整性和可用性进行测试,确认移植成功。

•制订主机操作系统、文件系统和应用软件系统数据备

份策略,制订自动或人工备份介质管理规范。

•检查日常备份任务的完成情况,确保数据按要求成功

备份。

•定时进行备份恢复演习,保证操作系统、文件系统和

数据库出现异常时能够迅速解决。

4)应用系统运行维护

运行维护内容和任务包括:

・日常基本维护

实时监控应用系统服务和进程的运行状态,对关键进程

占用系统资源的情况进行管理;在服务出现异常时给出告

警,并能在进程终止时给予自动重启该进程的操作;定期针

对应用系统运行中生成的记录文件进行监测,从而判断应用

中的重要错误、警告以及性能等问题;实时监控关键服务的

响应时间,当服务响应时间不正常时予以排查处理。

・专项高级维护

配合应用系统建设工作,完成应用程序的bug修改和功

能拓展;针对应用程序特点,完成网络、数据库、主机内核

参数、存储设备的调整和优化,提高应用系统性能。

5)机房运行维护

运行维护内容和任务包括:

・计算机各类机房的安全性、稳定性、可靠性是药监业

务应用系统运营的基础。为保证机房安全连续不间断

运行,与之配套的机房动力系统、环境系统、消防系

统、保安系统必须时时刻刻稳定工作。机房动力及环

境设备一旦出现故障,轻则影响全系统的运行,重则

造成服务器及网络设备故障,使系统陷入瘫痪,后果

不堪设想。因此对计算机机房的动力及环境系统进行

实时集中的监控极其必要,提供综合有效的运维管理

手段至关重要。

・机房管理方案分为设备运维和人员管理两部分。具体

如下:

设备运维:主要设备运转状况、环境参数实时监控;设

备故障及环境参数报警信号实时通报。

人员管理主要是通过门禁系统对进出机房的工作人员

进行授权,限定人员工作区域,杜绝随意走动造成的安全隐

患。

(6)网络客户端运行维护

本系统主要针对计算机终端运行过程中遇到的问题。计

算机终端作为信息存储、传输、应用处理的基础设施,广泛

涉及每个用户,由于其分散性、不被重视、运维管理手段缺

乏的特点,已成为应用系统体系连续运行的薄弱环节。终端

安全是一个综合的系统问题,涉及管理计算机本身、计算机

应用、计算机操作者、计算机使用单位规范等多个方面的要

求性因素。

网络客户端运行维护方案主要从终端的状态、行为、事

件三个方面着手解决十大类功能,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论