_iMC智能管理中心使用规范与常见故障排除_第1页
_iMC智能管理中心使用规范与常见故障排除_第2页
_iMC智能管理中心使用规范与常见故障排除_第3页
_iMC智能管理中心使用规范与常见故障排除_第4页
_iMC智能管理中心使用规范与常见故障排除_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、业务软件产品使用规范业务软件产品使用规范日期:杭州华三通信技术有限公司 版权所有,未经授权不得使用与传播n 为了最大程度地避免人为因素引起的故障,对规范为了最大程度地避免人为因素引起的故障,对规范性的要求贯穿网络管理系统的整个建设和运维过程。性的要求贯穿网络管理系统的整个建设和运维过程。引入引入课程目标课程目标学习完本课程,您应该能够:学习完本课程,您应该能够:n 理解产品使用规范的重要性理解产品使用规范的重要性n 掌握业务软件产品的使用规范掌握业务软件产品的使用规范n 产品部署规范产品部署规范n 服务器配置规范服务器配置规范n 产品运维规范产品运维规范目录目录5iMC服务器整体要求服务器整体

2、要求l服务器专机专用,除必要的软件之外,不再安装其他应用软件服务器专机专用,除必要的软件之外,不再安装其他应用软件l服务器的操作系统和数据库软件为合法版本(不允许使用盗版软件)服务器的操作系统和数据库软件为合法版本(不允许使用盗版软件)l服务器需要安装防病毒软件并确保病毒库及时更新服务器需要安装防病毒软件并确保病毒库及时更新l建议不允许建议不允许iMC服务器访问服务器访问Internetl对于关键业务,要求必须使用双机备份机制,避免服务器单点故障对于关键业务,要求必须使用双机备份机制,避免服务器单点故障l对于单台对于单台iMC服务器,要求必须开启本机的数据库定期备份功能服务器,要求必须开启本机

3、的数据库定期备份功能l建议服务器仅开放建议服务器仅开放iMC产品相关端口,并使用防火墙、入侵检测等产品相关端口,并使用防火墙、入侵检测等安全设备保护安全设备保护iMC服务器服务器6iMC产品整体部署建议产品整体部署建议l为了使得为了使得iMC系统能够达到基本的运行环境要系统能够达到基本的运行环境要求,需根据各组件的特点结合现网环境,采用求,需根据各组件的特点结合现网环境,采用合理的分布式部署方案合理的分布式部署方案liMC Platform独立服务器liMC UAM/EAD推荐独立服务器liMC UBA/NTA独立服务器(可分布式多台服务器)liMC WSM独立服务器7iMC产品升级规范产品升

4、级规范l升级前基本步骤和操作规范升级前基本步骤和操作规范阅读待升级版本的版本说明书制定正确的升级顺序将升级包以原始的.zip格式上传至服务器手工停止iMC的所有进程备份数据库以及客户化的配置文件按顺序执行升级操作升级完毕后重新启动iMC并检查各进程运行情况n 产品部署规范产品部署规范n 服务器配置规范服务器配置规范n 产品运维规范产品运维规范目录目录9iMC系统对服务器的整体要求系统对服务器的整体要求liMC系统对服务器的整体要求系统对服务器的整体要求CPU系统物理内存iMC Web server的Java进程占用的内存iMC的安装路径所在磁盘空间iMC的部署路径所在磁盘空间10iMC平台服务

5、器配置平台服务器配置l配置配置iMC平台服务器需要考虑的关键因素平台服务器需要考虑的关键因素管理设备数量设备轮询间隔性能采集单元数量在线操作员数量11UBA/NTA服务器配置服务器配置l配置配置UBA/NTA服务器需要考虑的关键因素服务器需要考虑的关键因素待分析流量中包含的会话数(NetStream或DIG日志)日志设备产生流记录的速率(NetStream日志)使能日志采集的网络设备接口数(SFlow日志)待分析的流量大小(DIG日志)n 产品部署规范产品部署规范n 服务器配置规范服务器配置规范n 产品运维规范产品运维规范目录目录13iMC系统每日巡检规范系统每日巡检规范l外部环境检查外部环境

6、检查外部状况(供电、火警、烟尘、雷击等)温度湿度机房清洁度l检查服务器操作系统环境检查服务器操作系统环境网络连接正常操作系统中不存在无用账号操作系统中不存在与iMC产品无关的软件操作系统是否存在可用的补丁更新服务器上的防病毒软件是否存在可用更新操作系统的时区和时间配置正确14iMC系统每日巡检规范(续)系统每日巡检规范(续)l通过通过iMC部署监控代理检查部署监控代理检查服务器CPU利用率是否正常服务器内存利用率是否正常服务器磁盘空间使用情况iMC各进程的状态及启动时间liMC平台及各组件的平台及各组件的License显示正常显示正常liMC服务器的操作日志中无异常记录服务器的操作日志中无异常

7、记录l检查服务器冗余备份的工作情况检查服务器冗余备份的工作情况15iMC系统定期巡检规范系统定期巡检规范l至少每半年更新一次操作系统、数据库至少每半年更新一次操作系统、数据库管理员以及管理员以及iMC各操作员的密码各操作员的密码l建议至少每月一次使用具有最新病毒定建议至少每月一次使用具有最新病毒定义的防病毒软件执行服务器全盘扫描义的防病毒软件执行服务器全盘扫描16iMC平台运维规范平台运维规范l网络设备添加完整,设备类型识别正确网络设备添加完整,设备类型识别正确l设备与网管之间的设备与网管之间的SNMP参数及参数及Telnet/SSH参数配置合理且相互匹配参数配置合理且相互匹配l拓扑绘制完整,

8、建议使用自定义拓扑拓扑绘制完整,建议使用自定义拓扑l性能监视任务配置合理性能监视任务配置合理l告警转发、过滤和转储策略配置合理告警转发、过滤和转储策略配置合理17NTA/UBA运维规范运维规范l当前磁盘当前磁盘/数据库空间使用率符合预期数据库空间使用率符合预期l合理配置数据空间管理相关参数合理配置数据空间管理相关参数l日志采集设备(或探针服务器)的时区日志采集设备(或探针服务器)的时区和时间配置正确和时间配置正确l流量趋势报表或行为审计结果符合预期流量趋势报表或行为审计结果符合预期n 产品使用规范贯穿于方案规划、实施和运维的全流程产品使用规范贯穿于方案规划、实施和运维的全流程中,能够有效杜绝问

9、题的发生,减少后期维护的工作中,能够有效杜绝问题的发生,减少后期维护的工作量。在方案规划之初,首先要根据业务的实际情况,量。在方案规划之初,首先要根据业务的实际情况,同时考虑扩容因素,评估需要的服务器软硬件规格和同时考虑扩容因素,评估需要的服务器软硬件规格和部署方式;方案实施时,必须严谨、规范地完成初始部署方式;方案实施时,必须严谨、规范地完成初始配置;后期运维时,需根据运维要求,结合产品特点配置;后期运维时,需根据运维要求,结合产品特点建立完善的巡检制度和操作规范,防患于未然。建立完善的巡检制度和操作规范,防患于未然。本章总结本章总结杭州华三通信技术有限公司业务软件产品排错指导业务软件产品排

10、错指导日期:杭州华三通信技术有限公司 版权所有,未经授权不得使用与传播n 业务软件产品的日常运行与服务器、网络以及被管业务软件产品的日常运行与服务器、网络以及被管对象都关系密切。因为环境复杂,维护时可能遇到对象都关系密切。因为环境复杂,维护时可能遇到各种各样的问题。掌握产品排错的技巧能够加快问各种各样的问题。掌握产品排错的技巧能够加快问题分析和排查的速度,有效提高维护的效率。题分析和排查的速度,有效提高维护的效率。引入引入n 掌握产品排错技巧掌握产品排错技巧n 掌握收集信息的要求掌握收集信息的要求n 掌握典型问题的分析思路掌握典型问题的分析思路课程目标课程目标学习完本课程,您应该能够:学习完本

11、课程,您应该能够:n 信息收集整体要求信息收集整体要求n iMC 平台排错指导平台排错指导n iMC UBA/NTA排错指导排错指导目录目录24业务软件产品排错信息收集整体要求业务软件产品排错信息收集整体要求liMC软件的版本软件的版本l服务器硬件信息服务器硬件信息l服务器软件信息服务器软件信息l故障现象的详细描述故障现象的详细描述l故障发生前后的操作故障发生前后的操作l被管对象信息被管对象信息l组网信息组网信息liMC相关模块的日志信息相关模块的日志信息n 信息收集整体要求信息收集整体要求n iMC 平台排错指导平台排错指导n iMC UAM/EAD排错指导排错指导n iMC UBA/NTA

12、排错指导排错指导n iMC WSM排错指导排错指导目录目录26iMC平台资源管理典型问题排查举例平台资源管理典型问题排查举例l问题现象问题现象设备添加失败或设备类别无法识别l基本排查步骤基本排查步骤检查iMC与设备之间的网络状况检查iMC与设备上的SNMP配置是否一致检查设备当前的CPU利用率是否过高收集并分析资源模块的日志条件允许时,收集复现问题时iMC侧的抓包 27iMC平台告警管理典型问题排查举例平台告警管理典型问题排查举例l问题现象问题现象设备上产生了告警但iMC上无记录显示l基本排查步骤基本排查步骤检查设备上的SNMP Trap配置是否正确检查iMC服务器上的告警过滤策略配置排查网络

13、中是否存在访问控制列表将Trap消息过滤检查iMC的告警转储文件中是否存在记录关闭未知告警过滤并尝试复现问题对照告警定义列表中的Trap OID与设备告警信息中的Trap OID是否一致收集并分析iMC告警模块的日志条件允许时,收集复现问题时iMC侧的抓包28iMC平台性能管理典型问题排查举例平台性能管理典型问题排查举例l问题现象问题现象iMC WEB配置台上显示的数据与设备命令行查询的结果有差异l基本排查步骤基本排查步骤确认设备命令行查询结果的含义和统计方法确认iMC针对该性能指标的计算公式和统计方法使用MIB工具读取公式中各MIB节点的值并按照iMC公式计算结果收集并分析iMC性能模块的日

14、志29iMC平台拓扑管理典型问题排查举例平台拓扑管理典型问题排查举例l问题现象问题现象设备之间实际有连接,而iMC拓扑上显示无连接l基本排查步骤基本排查步骤检查设备上是否正确配置了邻居协议收集并分析设备的诊断信息收集并分析iMC拓扑模块的日志收集平台的config_db数据库或拓扑内存信息(条件允许)n 信息收集整体要求信息收集整体要求n iMC 平台排错指导平台排错指导n iMC UAM/EAD排错指导排错指导n iMC UBA/NTA排错指导排错指导n iMC WSM排错指导排错指导目录目录31用户行为审计无记录典型问题排查举例用户行为审计无记录典型问题排查举例l问题现象问题现象DIG采集

15、方式下,UBA服务器的用户审计无最新数据显示l基本排查步骤基本排查步骤检查探针服务器上名为probe的进程是否正常运行检查探针服务器的/data目录下是否有日志文件生成检查部署监控代理中的相关进程是否正常运行排查网络中是否存在访问控制列表将UBA服务器下发给探针服务器的配置消息过滤检查UBA服务器磁盘空间是否达到阈值检查UBA服务器上的FTP主目录下是否接收到文件检查服务器的时区/时间设置是否正确收集并分析服务器配置以及调试级别的处理器日志32流量统计报表无数据典型问题排查举例流量统计报表无数据典型问题排查举例l问题现象问题现象采集Netstream日志,NTA服务器的流量统计报表无数据显示l基本排查步骤基本排查步骤确认设备的日志缓冲区中是否有日志生成确认设备和服务器配置是否匹配检查设备与服务器之间的网络是否可达检查部署监控代理中的相关进程是否正常运行排查网络中是否存在访问控制列表将Netstream报文过滤检查接收器和处理器的工作目录下是否有临时文件生成检查日志设备和NTA服务器的时区/时间设置是否正确收集并分析调试级别的接收器和处理器日志n 排错是日常运维中必不可少的一环,掌握业务软排错是日常

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论