iManager_U2000_故障处理课件_第1页
iManager_U2000_故障处理课件_第2页
iManager_U2000_故障处理课件_第3页
iManager_U2000_故障处理课件_第4页
iManager_U2000_故障处理课件_第5页
已阅读5页,还剩41页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Security Level: IntervaliManager U2000 故障处理网络产品服务部OSS与服务导入组Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 2Page 2前言前言本课程通过介绍U2000网管常见的故障和处理方法,帮助工程师理解和掌握U2000网管故障定位和处理的思路和方法。Copyright 2006 Huawei Technologies Co

2、., Ltd. All rights reserved. Page 3Page 3iManager N2000 BMS GCRMS Tp 10问题排障指导书 V3.0-20100730-A下载地址:http:/ 下载地址:http:/ 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 4Page 4课程目标学习完此课程,您应能:p了解U2000常见的故障以及处理方法p掌握U2000故障定位和处理的思路和方法p掌握U2000例行维护内容和方法Copyright 2006 Huawei Technologies Co., Lt

3、d. All rights reserved. Page 5Page 5目录U2000 U2000 常见问题分析与处理常见问题分析与处理U2000 U2000 故障处理思路和方法故障处理思路和方法U2000 U2000 例行维护与预防例行维护与预防Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 6网管安装注意事项 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类存放安装软件包的目录不能出现空格、中文字符等非法字符,如桌面、我的文档、 d:inst u

4、2k等目录均不符合要求;参考产品手册中安装指南下载正确的安装软件包,如OS补丁、数据库、U2000基础组件是必选的软件包,对于传送域组件、IP域组件、接入域组件需按照现场实际情况选择下载;正确的解压安装软件包,全选需要解压的软件包,然后右键选择“解压到当前文件夹(Extract Here)”;如果计算机上曾安装过网管软件,重新安装前一定要保证之前的网管软件已彻底卸载;如果计算机上已安装过数据库,如果需要重新安装时,一定要先卸载数据库相关的补丁,然后再卸载数据库。Windows 系统系统Solaris 系统系统存放安装软件包的目录不能出现空格、中文字符等非法字符,如桌面、我的文档、d:inst

5、u2k等目录均不符合要求;参考产品手册中安装指南下载正确的安装软件包,如OS补丁、数据库、U2000基础组件是必选的软件包,对于传送域组件、IP域组件、接入域组件需按照现场实际情况选择下载;安装软件包需用FTP bin方式上传到工作站服务器上;License文件必须用FTP ASCII方式上传到工作站服务器上;安装双机时,需注意区分集中式系统和分布式系统,一定要参照正确的安装指导书进行安装。 网元管理类网元管理类 其它类其它类Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 7网管安装前的环境清理Win

6、dows版本重装 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类Step 1 网元管理类网元管理类 其它类其它类卸载已安装的网管,如果是安装网管失败的情况,直接将网管的安装目录删除;Step 2检查”我的电脑”中的环境变量,删除HWENGROOT 、IMAPROOT 、所有带T2000和U2000的环境变量(注意:PATH变量不能全部删除,只删除里面带T2000或U2000相关字段即可);Step 3在控制面板卸载SQL Server 数据库,若安装了SQL Server补丁,一定要将补丁卸载掉,否则安装数据库会失败,然后使用下面这个脚本清

7、理数据库环境: Step 4删除c:HWENGR目录 、删除网管安装目录,如D:U2000,并重启操作系统;Step 5重启完成后再检查是否有以下注册表项,若有则删除 :HKEY_LOCAL_MACHINESYSTEMCurrentControlSetControlSession Manager:PendingFileRenameOperationsHKEY_LOCAL_MACHINESOFTWAREMicrosoftMSSQLServerHKEY_LOCAL_MACHINESOFTWAREMicrosoftMicrosoft SQL ServerHKEY_LOCAL_MACHINESYSTE

8、MCurrentControlSetServicesMSSQLServerHKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesSQLSERVERAGENTHKEY_LOCAL_MACHINESYSTEMCurrentControlSetServicesMSSQLServerADHelperHKEY_LOCAL_MACHINESOFTWAREMicrosoftWindowsCurrentVersionSetupExceptionComponentsCopyright 2006 Huawei Technologies Co., Ltd. All rig

9、hts reserved. Page 8网管安装部署常见的问题处理方法(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类 网元管理类网元管理类 其它类其它类序号序号问题描述问题描述解决方法解决方法1在Windows操作系统上,重新安装网管过程中提示已经创建了挂起文件.这是由于上一次安装时产生的挂起文件导致,在地址拦输入如下命令,并按Enter键: %tmp%.查找并删除 ClearInstallDiskDir.bat 文件.2安装过程中提示端口被占用. 在Windows环境下,在任务管理器中查找并结束java、msserver、msda

10、emon或javaw进程. 在Solaris或者SUSE Linux环境下,执行如下命令查看进程号:ps-eflgrep java. 通过kill命令结束该进程. 进程关闭后的端口释放的等待时间大概在两分钟左右,请耐心等待.3在Solaris或SUSE Linux操作系统上执行install.sh提示找不到SYBASE.sh.查看/etc/profile文件中是否有”./opt/sybase/SYBASE.sh”的内容,如果有,但是不存在/opt/sybase目录,则在/etc/profile文件中删除相关内容.Copyright 2006 Huawei Technologies Co., L

11、td. All rights reserved. Page 9网管安装部署常见的问题处理方法(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类 网元管理类网元管理类 其它类其它类序号序号问题描述问题描述解决方法解决方法4在Window操作系统,在数据库配置页面提示isql连接检查失败.首先确认环境变量path是否包含以下路径,并且没有配置其他数据库的环境变量: C:Progrm FilesMicrosoft SQL Server80ToolsBINN.选择”开始 程序 Microsoft SQL Server 查询分析器”. 在 ”连接

12、到 SQL Server”页面页面. 使用本机IP作为服务名称, 勾选如果 SQL server已停止,则启动它, 输入 sa 用户密码,单击”确定”, 检查 SQL Server 是否可以正常连接.5在配置数据库服务的页面,弹出”选择软件库路径”对话框. 此问题是由于系统找不到数据库安装包导致.请选择安装盘目录或安装包解压后的目录.6在数据库配置页面提示数据库的排序方式必须是二进制. 如果在安装数据库的时候不是选择的二进制排序方式,将会导致网管安装失败,需要手工卸载数据库并重新安装. 如果在安装数据库的时候选择的是二进制排序方式,并且数据库正常运行,则在安装网管的时候不需要再安装数据库.Co

13、pyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 10网管安装的典型问题(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类启动安装时提示无法创建虚拟机,无法继续安装,如下图 :解决方法解决方法设置的虚拟机最大内存参数过大,把engineeringHWICMRsetup.bat中的-Xmx750m改为-Xmx512m就安装下去了,这个值不能大于空闲的内存总数。说明:该问题主要在便携机上或低端服务器上安

14、装才会出现,对于正常发货的服务器不会出现该问题。(如果是1G以下内存的低端机也建议将内存调小)Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 11网管安装的典型问题(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类安装U2000网管报解压SQL Server(或sybase)安装数据库失败,如下图: 解决方法解决方法1、在logslogsInstallServerbundlelogbundle

15、log目录下的u2kInstall.log日志中(有时可能是u2kInstall.log.1)搜索“is not enough for install and extract.Search for another disk ”字样,如有,则安装数据库的磁盘目录空间不足,一般是C盘(或/opt目录),需释放足够的空间再重新安装; 2、如果上面这种原因,就可能是数据库软件包存在问题,该问题一般是传文件时出问题错误所致,需要重新上传数据库软件包。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 12网管安装的

16、典型问题(3) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类安装U2000网管报安装过程中提示BCP support error解决方法解决方法数据库的这个文件损坏:C:Program FilesMicrosoft SQL Server80ToolsBinnResources1033bcp.rll从其他装有数据库并且没有问题的操作系统中拷贝并覆盖损坏的文件即可。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved

17、. Page 13网管安装的典型问题(4) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类如何在工程师便携机上安装U2000网管,并满足现场开局和维护应用需求?解决方法解决方法1、对便携机的配置要求如下: CPU:1.73G及以上 物理内存:物理内存的大小决定与可以运行网管进程的多少。仅运行单域网管需 要1G内存,运行双域需要2G内存,运行全域需要4G内存。(低于此配置物理内存 的便携机能保证在其上正常使用)2、按照iManager U2000 V100R002C01SPC001便携机网管

18、软件安装指导书进行安装(该文档可从随产品发布文档包中获取):3、启动服务器的前台和后台需要通过网管启动工具来进行按域启动,具体操作方法为 执行D:U2000clienttoolsstartu2000.bat(D:U2000为网管安装目录),打开网管 启动工具的界面,如下图:Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 14Solaris操作系统典型故障(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其

19、它类其它类操作系统重启后进入单用户模式,屏幕提示“WARNING - Unable to repair the / filesystem. Run fsck manually (fsck -F ufs /dev/rdsk/c*t*d*s*)”。说明:告警提示“Unable to repair the / filesystem”,这里的“/”可能是其它目录。 解决方法解决方法1、以root用户登录操作系统。 2、执行如下命令修复文件系统: # fsck -y 注意:如果磁盘较大,且文件系统损坏比较严重的话。使用fsck -y修复时可能需要较 长时间,此时候不要对服务器做任何操作,否则,操作系统无

20、法恢复。 fsck 命令只能修复一般性的错误。对于异常断电引起的Solaris 启动参数错误或者内 核损坏,将不能使用fsck命令来修复。3、观察屏幕输出。确认所有分区文件系统是否正确,受损分区的文件系统是否修复。 如果还有出错信息或者需要修复的信息,需反复执行fsck -y,直至没有任何错误信息 和需要修复的信息。 4、执行如下命令同步文件并重新启动操作系统: # sync;sync;sync;sync;sync;sync # init 6 原因分析原因分析服务器非法关机或异常掉电会导致正在运行的文件系统受到损坏。供电恢复后,服务器启动时会进行自检,如果发现文件系统损坏则系统自检失败,启动过

21、程会进入单用户状态。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 15Solaris操作系统典型故障(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类单机系统下,屏幕提示“Cannot open/etc/path_to_instProgram terminated”,随后系统反复重启。 解决方法解决方法1、以root用户登录操作系统。在操作系统自检时(进入操作系统以前)按“STOP+A”组

22、合键退出启动,进入“OK”提示符状态。 2、插入Solaris 10安装光盘,执行如下命令从光盘启动并进入单用户模式: ok boot cdrom -s 3、执行如下命令查找系统根目录对应的祼设备名: # cat /etc/vfstab 3、根据以上屏幕显示可以找出根目录(“/”)对应的裸分区,如: /dev/dsk/c1t0d0s0 /dev/rdsk/c1t0d0s0 / ufs 1 no 4、将根目录对应的裸设备设置到“/mnt”上,修复被破坏的操作系统。 # mount 裸分区 /mnt 例如,在本例中执行如下命令将根目录对应的裸设备设置到“/mnt”上: # mount /dev/d

23、sk/c1t0d0s0 /mnt 5、如果是“/etc/path_to_inst”丢失,可以执行以下命令通过系统在“/etc”目录下预留的 “path_to_inst-INSTALL”模板恢复: # cd /mnt/etc # cp path_to_inst-INSTALL path_to_inst 6、执行如下命令同步文件并重新启动操作系统: # sync;sync;sync;sync;sync;sync # init 6 7、系统正常重启后,以root用户执行fsck -y对文件系统进行修复。 原因分析原因分析由于服务器异常断电或其它异常操作,导致操作系统受到损坏,系统文件“path_to

24、_inst”无法打开,从而操作系统无法启动。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 16Solaris操作系统典型故障(3) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类工作站启动后系统提示:显示器不适配,在“/var/dt/Xerrors”文件中有错误。解决方法解决方法1、以根据屏幕提示修复外设(如,鼠标、键盘和显示器)连接。 2、停止网管进程和数据库进程。 3、执行如下命令重新启动工

25、作站: # sync;sync;sync;sync;sync # shutdown -y -g0 -i6 (可使用telnet 连接到工作站后,执行以上操作)原因分析原因分析工作站外设没有正确安装,如鼠标或键盘未连接或连接异常。 Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 17Solaris操作系统典型故障(4) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类Solaris启动后无法进入图形界

26、面 解决方法解决方法1、以Solaris系统启动后,根据提示输入root用户密码,进入命令输入状态。 2、反复执行几次如下命令,自动修复错误: # fsck -y 3、执行如下命令重新启动工作站: # sync;sync;sync;sync;sync # shutdown -y -g0 -i6 原因分析原因分析异常关机可能造成文件系统的损坏,导致Solaris启动后无法进入图形界面。此时,使用fsck命令修复文件系统。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 18Solaris操作系统典型故障(

27、5) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类部分操作异常,如无法登录操作系统、操作系统运行缓慢、数据库无法启动、U2000无法启动等 解决方法解决方法1、以root用户登录Solaris操作系统,执行如下命令查看磁盘使用情况 # df -k 在输出的屏幕显示中查看“/”、“/opt”和“/opt/U2000”等目录的使用情况,并进行清理2、以root用户执行如下命令检查内存使用情况: # vmstat 2 屏幕显示:kthr memory page disk faults cpu

28、r b w swap free re mf pi po fr de sr s0 s1 s3 - in sy cs us sy id0 0 0 16940400 763008 7 30 20 6 13 0 12 2 -1 0 0 384 1773 380 1 1 98 0 0 0 16968504 737784 2 10 24 0 0 0 0 0 0 0 0 365 450 328 0 0 990 0 0 16968504 737832 0 0 0 0 0 0 0 2 0 0 0 386 1416 337 1 1 99 如果“sr”列数值长时间在200至300page/sec,则可能是物理内存不

29、足,关闭不必要的 程序; 最后一列“id”表示CPU空闲的比例,如果空闲比例长时间小于10%,那么CPU的主频 是运行效率的主要瓶颈,需要关闭不必要的程序。 原因分析原因分析1、磁盘空间不足导致操作异常2、内存不足导致系统运行缓慢 3、CPU占用率过高导致系统运行缓慢Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 19双机操作系统典型故障(6) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类双机服

30、务器内存不足解决方法解决方法1:检查双机运行状态。 确保双机运行正常;2:网管在主节点正常运行的情况下,将备节关机,增加备机内存;3:启动备机,检查双机复制状态,如果复制异常,参考章节“双机复制异常恢复”进行修复;4:将网管倒换到备机运行;5:关闭主节点服务器,增加主机内存;6:启动主机,检查双机复制状态,如果复制异常,参考章节“双机复制异常恢复”进行修复;7:进行主备倒换,观察网管运行状态。 (可参照双机常见问题帮助手册处理,见下页附件)原因分析原因分析内存不足Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved.

31、Page 20双机操作系统典型故障(7) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类重启后磁盘无法访问解决方法解决方法正常状态下的双机硬盘列表如下:#vxdisk -o alldgs listDEVICE TYPE DISK GROUP STATUSc1t0d0s2 auto:sliced rootdisk rootdg online c1t1d0s2 auto:sliced rootmirror rootdg onlinec1t2d0s2 auto:sliced datadisk d

32、atadg onlinec1t3d0s2 auto:sliced datamirror datadg online (如结果不符合,请参照以下文档双机部分处理)原因分析原因分析尝试修复后仍无法访问,就可能是磁盘已经损坏,需要更换磁盘Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 21Sybase数据库典型故障(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类数据库备份失败,部分在数据库备份工具

33、的备份任务中指定的路径下没有备份文件 解决方法解决方法1、确保数据库已正常启动。 以sybase用户执行/opt/sybase/ASE-*/install/showserver,如果有“dataserver”和 “backupserver”两个进程则说明数据库服务进程已启动;2、检查磁盘空间,并进行清理;3、检查备份目录的权限和属主。 执行ls -al可查看备份目录的权限。要求存放备份文件 的目录的属主为sybase、权限为可读可写可执行。 原因分析原因分析1、磁盘数据库未启动2、磁盘空间已满3、备份路径的权限不正确Copyright 2006 Huawei Technologies Co.,

34、 Ltd. All rights reserved. Page 22Sybase数据库典型故障(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类Sybase数据库启动失败 ,Sybase数据库无法启动是指启动Sybase数据库一段时间后查询不到“dataserver”和“backupserver”进程。 解决方法解决方法1、检查磁盘空间,并进行清理;2、sybase用户组、sybase用户 、sybase用户的“home”目录下的“.profile”文件是否存在,如果不存在则需创建;如

35、果存在,还需要确认“.profile”文件内容是否正确,如果不正确,需要修改;3、如果日志有“Permission denied”字样一般说明文件权限不够,导致该文件无法读取,进而引发数据库服务器无法启动,修改设备文件权限;4、如果日志有“Shared memory segment *.krg is in use” ,一般是由于sybase数据库服务器没有按照正常手段关闭,导致“$SYBASE”或“$SYBASE/$SYBASE_ASE”目录下,还存留垃圾文件“DBSVR.krg”和“DBSVR.srg”,将其删除即可;5、如果日志提示没有配置正确的共享内存,在“/etc/system”文件中

36、配置正确的共享内存即可;6、如果日志提示无法打开“lv_master”,需要重新安装数据库并初始化数据库来解决。 原因分析原因分析1、磁盘空间不足2、sybase用户的配置文件错误 3、通过“ $SYBASE/$SYBASE_ASE/install/DBSVR.log”日志分析具体原因Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 23Sybase数据库典型故障(3) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管

37、理类 其它类其它类Sybase数据库无法自动启动,启动Solaris或SUSE Linux服务器后,数据库无法自动启动 解决方法解决方法1、查看“/opt/sybase/ASE-*”目录下是否存在“DBSVR.krg”文件,若存在,需要删除此文 件;2、修改“/opt/sybase/ASE-*”下的“DBSVR.cfg”文件,将其中“number of devices”配置项 的值修改为255;3、以sybase用户登录操作系统;4、执行如下命令手工启动数据库: $ cd $SYBASE_ASE/install $ ./startserver -f ./RUN_DBSVR $ ./starts

38、erver - f ./RUN_DBSVR_back 原因分析原因分析不同的用户手工启动过sybase数据库,会造成“DBSVR.cfg”文件中的“number of devices”配置项恢复成默认值,导致数据库进程无法自动重启。 Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 24SQL Server数据库典型故障(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类修改Windows密码后S

39、QL Server无法登录 解决方法解决方法1、查看选择“控制面板 管理工具 服务”;2、在Windows自动启动SQL Server相关的服务中,选择“MSSQLSERVER”,单击右 键,选择“属性”,在“登录”页签下,修改为更改后的密码;3、选择“SQLSERVERAGENT”,单击右键,选择“属性”,在“登录”页签下,修改为更改 后的密码; 4、进入SQL Server的服务管理器,启动“SQL Server”和“SQL Server Agent”服务。原因分析原因分析 SOL Server服务的密码和系统用户密码不一致 Copyright 2006 Huawei Technologi

40、es Co., Ltd. All rights reserved. Page 25SQL Server数据库典型故障(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类初始化数据库失败 解决方法解决方法1、如果DOS窗口界面上提示“登录数据库失败” ,检查数据库是否启动 ,如果已经启 动,需要检查并修复数据库服务器别名和ODBC数据源配置;2、如果DOS窗口界面上提示“java虚拟机参数错误” ,可能是IMAP环境变量的末尾多了一 个“” ,重新设置正确的IMAP环境变量,并初始化数据库

41、;3、如果日志中提示“无法打开数据库U2000DB”,先手工删除该数据库,然后再初始化数 据库; 4、如果日志中提示“导入静态数据TrailServiceType失败” ,可能是Microsoft SQL server 数据库的字符集不是中文,但所使用的网管为中文,如果检查后确实如此,只能重新 安装数据库。原因分析原因分析 1、DOS窗口有界面提示,根据界面提示信息分析故障原因; 2、DOS窗口没有界面提示,可以通过查看“U2000serverdatabaselog”下的日志信息分析故障原因。 Copyright 2006 Huawei Technologies Co., Ltd. All r

42、ights reserved. Page 26网管服务器典型故障(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类网管服务器无法启动,系统提示License不生效 解决方法解决方法1、检查操作系统日期是当前日期;2、License文件中的MAC地址必须与服务器实际使用的网卡的MAC地址一致。如果不同,需要重新申请正确的License ; 3、License文件与网管版本必须配套;4、对于Unix工作站,License文件必须以ASC的格式上传。 原因分析原因分析1、如果是U2000无法

43、启动或某些功能无法使用,可能是License项错误2、操作系统时间设置错误也会导致License不生效 Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 27网管服务器典型故障(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类Unix工作站上U2000网管服务器的一些进程启动失败 解决方法解决方法1、重新启动操作系统。2、建议日常操作使用nmsuser用户启动或停止网管进程。原因分析原因分析未启

44、动的进程之前使用root帐号启动过又异常退出导致 Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 28网管服务器典型故障(3) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类修改操作系统时间导致部分网管功能运行异常解决方法解决方法正确关闭网管和数据库系统后再重启服务器系统,即可恢复正常。 说明:要求在安装网管系统前正确设置服务器的系统时间,禁止在网管系统运行过程中修改服务器系统时间,如果必须修改,

45、一定要先停止网管服务,修改完成后再重新启动网管服务器。原因分析原因分析在网管系统运行过程中若修改了服务器操作系统时间,根据定时器原理实现的一些系统功能将有可能运行异常,比如安全后台的定时转储操作日志等。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 29网管客户端典型故障(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类在U2000客户端的登录界面中输入用户名和密码后无法正常登录 解决方法解决

46、方法按照上面的原因进行排查,如网管服务器安装在Windows系统中,如果是动态端口设置错误,可以通过如下步骤解决: 1、单击“开始 所有程序 Microsoft SQL Server 客户端网络实用工具”; 2、在“别名”页签查看动态端口号是否为1433,若不是,需要修改为1433。原因分析原因分析以下原因可能导致U2000客户端无法登录: 1、U2000服务器端故障2、当服务器安装在Windows系统,U2000服务器端ODBC数据源配置错误或没有配置3、当服务器安装在Windows系统,U2000服务器端的数据库动态端口设置错误4、客户端与服务器的网络问题5、客户端与服务器端版本不一致6、

47、客户端与服务器端使用的通信协议不一致(SSL模式、普通模式) 7、客户端登录的用户被锁定,有可能是登录错误次数过多导致 8、License允许的客户端数量限制9、客户端的操作系统时间设置错误10、客户端的IP不在服务器设置的ACL之中Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 30网管客户端典型故障(2) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类在U2000网管客户端中,打开某些设备的网

48、元管理器界面时灰屏或显示不正常 解决方法解决方法1、检查默认浏览器的设置是否符合要求。对于Windows操作系统,默认的浏览器必须为 IE(Internet Expoler);对于Solaris操作系统,默认的浏览器必须为Mozilla;2、检查Windows操作系统下IE浏览器的版本。浏览器的安全级别设为高时,会影响脚本 的运行,导致界面灰化。若要正常显示页面,应将安全级别设置中级以下级别。在 Windows 2003操作系统中会默认安装IE增强性安全设置功能,该功能会导致安全级 别始终处于高级别状态,因此需要取消该功能;3、检查浏览器是否设置了代理服务器。若设置了代理,取消代理或者设置U2

49、000服务器 的IP地址不使用代理服务器;4、检查U2000客户端的安装目录。目录名称中只能有字母、数字、下划线,不能有空格 、括号、中文字符等。 原因分析原因分析对于某些设备(如PTN系列、RTN系列、NG WDM系列、SLM 3160等设备)的网元管理器,浏览器的设置不正确会导致界面显示异常 Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 31网元管理典型故障(1) 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元

50、管理类 其它类其它类在U2000网管上部分网元频繁登录和退出登录 解决方法解决方法1、查看网元数量是否超出网管管理能力。可参考Huawei iManager U2000 产品描述 中的性能指标;2、检查服务器磁盘空间,正常情况下磁盘空间占用率不应高于80%。如果已经超出,请 进行磁盘清理。可以删除、备份相关文件释放磁盘空间。原因分析原因分析1、网元数量超过网管管理能力2、磁盘空间不足导致 Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 32网元管理典型故障(2) 安装类安装类 操作系统类操作系统类 数

51、据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类网管与网元间通信异常,网管界面上该网元的图标显示为灰色,如果是网关网元通信异常,一般会有“NE_COMMU_BREAK”网元通信中断告警解决方法解决方法1、如果只是个别网元在网管上不可达,则重点检查该网元的各项设置及其到网关网元的 ECC路由情况;2、如果是多数网元在网管上显示不可达,则重点检查对应的网关网元的各项设置以及到 网关网元与网管间的网络连通性。 原因分析原因分析1、网管或网元的通信参数设置错误2、网管与网元间的DCN故障 3、不同子网的ECC互扰5、网关网元所带的非网关

52、网元数目过多6、ECC误码7、网元用户冲突Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 33网管系统维护工具典型故障 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类问题描述问题描述 网元管理类网元管理类 其它类其它类在Solaris平台,网管系统维护工具图形化客户端启动文件为“/opt/U2000/engineering/startClient.sh”,执行此文件时提示权限更改错误 解决方法解决方法1、以root用户登录操作系统;2、修改提示信息

53、中权限错误的文件的属主。执行如下命令: # chown nmsuser /opt/U2000/engineering/conf/launch/client/org.eclipse.osgi 这里以修改“/opt/U2000/engineering/conf/launch/client/”文件为例,将它的属主修改 为nmsuser。原因分析原因分析使用nmsuser启动startClient.sh之前用root用户启动过,会导致权限错误Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 34网管故障数据采集

54、 安装类安装类 操作系统类操作系统类 数据库类数据库类 网管客户端网管客户端 网管服务器类网管服务器类操作方法操作方法 网元管理类网元管理类 其它类其它类1、在网页浏览器的地址栏中输入http:/:12201/quickstep。此处必须 使用12201 端口号。进入QuickStep 工具登录页面,如下图所示。例如:输入http:/ 0:12201/quickstep,其中0 为网管服务器IP 地址;2、输入“用户名”和“密码”,并登录进入工具首页面;说明:l 在Windows 操作系统下,可以登录QuickStep 工具的用户为:Administra

55、tor 或拥有管理员权限的用户。Administrator 或拥有管理员权限的用户使用各自的密码登录QuickStep 工具。l 在Solaris 或SUSE Linux 操作系统下,QuickStep 工具使用root 做为用户,并使用root 的密码登录QuickStep 工具。l 用户名不区分大小写,密码区分大小写。3、进入信息收集工具,按照业务模块或故障场景收集网管故障数据。Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 35Page 35本章节我们主要学习了:U2000 各类场景的典型故障U2000 故障数据采集小结Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 36Page 36目录U2000 U2000 常见问题分析与处理常见问题分析与处理U2000 U2000 故障处理思路和方法故障处理思路和方法U2000 U2000 例行维护与预防例行维护与预防Copyright 2006 Huawei Technologies Co., Ltd. All rights reserved. Page 37U2000网管主要故障类型主要故障类型操作系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论