zxun icxmscsv4.1410msc服务器故障处理指导_第1页
zxun icxmscsv4.1410msc服务器故障处理指导_第2页
zxun icxmscsv4.1410msc服务器故障处理指导_第3页
zxun icxmscsv4.1410msc服务器故障处理指导_第4页
zxun icxmscsv4.1410msc服务器故障处理指导_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ZXUNMSC服务器故障处理指导产品版本:中兴 :传真技术支持 电子邮件 法法本资料著作权属中兴通讯所有。 著作权人,任何单位或个人不得以任何方式摘录、或翻译。。和是中兴通讯的商标。中兴通讯产品的名称和标志是中兴通讯的专有标志或商标。在本手册中提及的其他产品或公司的名称可能是其各自所有者的商标或商名。在中兴通讯或第商标或商名所有者事先同意的情况下,本手册不以任何方式授予阅读者任何使用本手册上出现的任何标记的或权利。本产品符合关于环境保护和人身安全方面的设计要求,产品的存放、使用和弃置应遵照产品手册、相关合同或相关国法律、的要求进行。如果本产品进行改进或技术变更,恕不另行专门通当出现产品改进或者技术变更时,您可以通过中兴通讯技术支持http 修订历史资料版发布日更新说2014-08-手册第一次发资料编号:SJ-20140804163444-发布日期:2014-08-前手册说明手册说明本手册介绍 读者对象读者对象本手册适用于工程师阅读内容介绍内容介绍本手册的主要内容如下。章概第1章故障处理概述介绍了常见故障的类别、对人员的要求、故障处理的流程、故障处理常用工具和常用方法。第2章硬件类故障介绍了单板、电源、风扇等硬件发生故障时的故障原因分析和故障处理建议。第3章类故介绍了发生各类故障时的处理流程第4章业务类故障介绍了业务类故障的处理方法,包括位置更新业务、基本呼叫业务、短消息业务。附录A操作一览列举了常见的操作,提醒人员注意安全操作附录B故障处理记录表介绍了故障处理后记录故障现象、处理方法的表格模相关手册相关手册与本手册有关联的其他手册包括: 《ZXUNiCX(MSCS)MSC 《ZXUNiCX(MSCS)MSC服务告警处理 《ZXUNiCX(MSCS)MSC 《ZXUNiCX(MSCS)MSC服务器数据配置指导(基本数据)》《ZXUNiCX(MSCS)MSC服务器数据配置指导(业务数据)》《ZXUNiCX(MSCS)MSC服务器日常操作指导》 《ZXUNiCX(MSCS)MSC服务器部件更换指导》 《ZXUNiCX(MSCS)MSC服务器硬件描述》 《ZXUNiCX(MSCS)MSC服务器软件安装指导(单机) 《ZXUNiCX(MSCS)MSC服务器管理操作指导本书约定本书约定在本手册中可能出现下列安全符号,它们所代表的含安全符意说明表示该内容是正文的附加信故障处理概 1常见故障分 1对人员的要 2故障处理一般流 2重大故障处理流 5故障处理常用工 7故障处理常用方 7硬件类故 1单板故 2 2 3 4 5 6 6单板扳手上下电异 7 7电源故 8电源模块热插拔状态指示灯长 8电源模块热插拔状态指示灯闪 9整框或半框设备掉 10拔插单个电源模块时半框设备掉 11系统运行中部分单板突然掉 12风扇故 13 13 14 15 类故 1通讯类故 3-本地终端传送数据到OMP超 2 3权限类故 4数据库类故 6连接数据库失 6本地终端的导出功能无法使 7性能管理类故 8性能数据上报延 8性能数据无法上 9告警管理类故 10告警过滤规则无法生 11告警无法到达连接正常的告警 11业务类故 1基本呼叫业务故 1故障案例1(对接参数不一致导致呼叫失败 4故障案例2(漫游用户无法作被叫 5故障案例3(欠费用户呼叫特服号码失败 5短消息业务故 6故障案例1(无法接收到短消息 10故障案例2(无法收到 10位置更新业务故 12故障案例1(周期性位置更新设置错误导致被叫无法接通 14故障案例2(位置更新无法完成 15操作一览表 A-故障处理记录表 B-缩略 故障处理概述本章包含如下ü常见故障分 ü对人员的要 2ü故障处理一般流ü重大故障处理流ü故障处理常用工ü故障处理常用方常见故障分类ZXUNiCX(MSCS)的常见故障一般可分为以下几类 硬件类故在ZXUNiCX(MSCS)网元中,常见硬件故障可以分为以下几种 2.1单板故 2.2电源故 2.3风扇故 类故在ZXUNiCX(MSCS)网元中,常见故障可以分为以下几种 3.1通讯类故 3.2权限类故 3.3数据库类故 3.4性能管理类故障 3.5告警管理类故障 业务类故在ZXUNiCX(MSCS)网元中,常见业务故障可以分为以下几种 4.1基本呼叫业务故障 4.2短消息业务故障 4.3位置更新业务故障本手册针对以上几类故障,给出故障定位过程及故障处理步对人员的要求专业技能要求专业技能要求 熟悉移动通信原理、软交换原理等通信专业知识 l 熟悉以太网、C/IP、浏览器/服务器架构、WEB应用、数据库等计算机网络知识。 熟悉Windows、CGSL 熟悉ZXUNiCX(MSCS)产品的工作原理、系统结构、接口、信令协议、业务流程 熟悉电信ATCA 熟悉哪些业务中断最容易导致用户设备操作要求设备操作要求 熟悉 熟悉ZXUNiCX(MSCS)的所有操作。如哪些操作将导致部分或全部业务中断、造成设备损坏。操作参见“A操作一览表”。 熟练掌握 熟练掌握 熟练掌握 仪器仪表使用要求仪器仪表使用要求能够熟练使用各种仪器仪表定位故障。常用的仪器仪表包括万用表和SS7信令分析仪等故障处理一般流程故障处理流程故障处理流程图1-1故障处理一般流程故障处理操作故障处理操作发生故障时,人员一般需要依序完成以下操作确定故障情况:故障发生时,进行简单业务测试,确定故障情况收集原始信息:故障发生时,尽量详细记录故障发生时的现象、告警管理中的告警信息或运行信息、故障处理所做的操作,运用系统自带工具(如信令、失败观察、性能统计等)收集故障发生时的相关信息并进行保存。故障分类判断:根据故障现象以及通过工具收集的故障相关信息,对故障原因进行初步判断、分类。故障具体原因定位:结合故障发生时的情况,进行流程、网元分析,对可能引起故障的原因进行甄别,确定具体的原因。故障排除:根据定位出的具体原因,进行相应处理,排除故障故障记录:故障处理后需要详细记录故障现象、处理方法,以利于以后出现类似情况时参照解决。推荐按照“B故障处理记录表”所示格式填写,也可以自行设计相关的表格。故障处理注意事项故障处理注意事项l应建立完善的机房故障处理制度,对人员的故障处理工作进行规范。只允许l人员操作时要按照相关手册的说明来进行,接触设备硬件前应佩带防静电手环,l处理故障前应尽可能备份业务数据和运营参数。对系统的故障现象、版本情况、数据变更情况、故障处理情况做好详细的记录,尽可能故障数据,便于进行分析和故障排除。l应有详细的故障处理日志,对故障处理情况做好详细的记录,便于进行分析和处l发现故障应及时处理,无法处理时应及时与联系中兴通讯。在以下情况发生时,请及‡‡ 通过掌握的、已知的处理方法无法解决问题 参考以前发生类似故障时的处理方法无法解决l 将中兴通讯的联络方式放在醒目的地方,以保证在需要技术支持时联络,注意时常更新的联络方式。 国内 (免费 国际 传真: 邮箱 l获取中兴通讯技术支持时,需要提交如下信息 事实详情,包括时间、地点、 主被叫号码、呼叫时间 告警管理、性能管理、信令、失败观察的数 故障发生后采取的操作步骤 登录方法和联系人重大故障处理流程重大故障的定义重大故障的定义重大故障的定义为:设备运行出现异常而不能提供基本业务(如设备瘫痪)、无法正常运行时间超过0分钟、使用产品对人身安全造成危害,以及其他紧急情况发生时必须立即解决的问题。设备重大故障列表如下:l 不能提供基本业务(无论设备瘫痪、环境、人为等任何原因),经过初步处理未能恢复,需要紧急处理。 系统接通率、语音应答率等重要指标突然下降5%以上,或者有大量用户、重要客 用户数据失败,或者用户数据完整性和一致性被破坏 无法设备 影响其他设备提供基本业务。 重大故障处理原则重大故障处理原则当接到故障报告或发现故障时以尽快恢复为原则,应立即按照如图2所示的重大故障工作流程进行处理,同时联系中兴通讯以获得技术支持。系统出现故障的环节包括全局或部分掉电、网络故障、数据库故障、其他原因故障,可据此进行系统排查。在排除掉电和通讯问题后,可以借助告警管理功能定位问题发生的节点。重大故障处理流程重大故障处理流程重大故障发生后,除组织相关人员、相关单位紧急处理外,还应立即逐级向通信主管部门、主管报告。事后需补送故障专题报告,还必须组织相关人员、相关单位及设备供货商查明原因,并吸取经验教训,采取有效措施,防止故障再次发生。重大故障处理完毕要认真填写并保存故障处理的详细记录。重大故障处理工作流程如图1-2所示。图1-2重大故障处理工作流程故障处理常用工具故障处理过程中常用的软硬件工具如下: OMM自带了告警管理、信令、失败观察、日志管理、性能管理等工‡ 通过告警管理可以查询故障发生时的相关告警,甚至对于某些告警可以通过查看告警的详细信息直接定位故障的产生原因。 通过信令和失败观察可以实时业务,对当前的业务故障进行准确定位 通过日志管理可以查看的操作日志通过操作日志可以查看故障发生前执行了哪些操作,进而可以判断故障的产生是否与这些操作有关。‡ 通过性能管理一般不能直接定位故障,但通过分析性能数据,对故障定位具有辅助作用。 Etherealtheal抓包工具为通用工具,用于将网络接口上的数据保存下来并转换为可阅读的格式,便于分析数据。 工具和仪应配备常用的工具和仪表,如螺丝刀(一字、十字)、试电笔、网线测试仪、水晶头压线钳、万用表、信令仪等。故障处理常用方法常用方法常用方法l对比对比法比较简单,只要把导致故障的数据配置或设备与正确的数据配置或设备相比较,找到不同点并分析解决问题。l替代替代法是一种简单实用的故障排除法,对于出现故障的硬件或单板使用同样功能(最好是同样型号)的板件进行替换,如果替换后问题,则可以确定是被替换的板件存在问题。l最小最小系统法就是去掉系统中的其他硬件设备,只保留最简单的部件,观察最小系统是否有故障。如果有,则可排除其他硬件的问题,而故障来自于现有的几个硬件中。如果没有,则将其他硬件一一添加,查看在添加哪个硬件后出现故障,发现故障所在后,将其更换即可。说明:使用最小系统法时要谨慎,不能影响业务。最小系统法只能在开通局点时使用,设备正常运行过程中不能使用这个方 信令分析信令分析法是一种在局间和局内业务对接、调试时最基本的方法,通过信令分析来确定问题的所在。由于信令有统一的标准性,所以能准确地定位问题。 失败码分析失败码分析法用于诊断本局业务上的故障。在业务中每一次呼叫都有相应码和失败原因值,通过对失败码的解释就可以方便地定位故障原因。 性能统计性能统计法用于定位故障发生的具体时间、故障影响的业务数量,便于有效掌握故障的影响范围和具体影响的业务种类。使用建议使用建议l在处理硬件方面的问题时,通常需要观察硬件本身的指示灯并结合替代法、对比法等l在处理软件、业务方面的问题时,可以通过中的工具,结合系统记录的日志l在实际工作中遇到的问题,可能无法立即判定是软件方面还是硬件方面的问题,这时就需要灵活运用多种方法来处理。因此熟练掌握以上几种常用的故障处理方法,将有助于快速地解决故障。常见故障硬件类故障常见故障硬件类常见故障参见表2-1表2-1硬件类常见故障故障类参考章单板故2.1单板故障电源故2.2电源故障风扇故2.3风扇故障设备指示灯说明设备指示灯说明硬件设备出现故障时,观察设备状态指示灯是比较直接的方法。常用设备状态指示灯含义参见表2。表2-2设备状态指示灯说明指示灯标指示灯含颜说服务状态指示红热插拔状态指示蓝健康状态指示红绿绿灯闪烁:正常运红灯亮:工作异常,有告红绿绿灯闪烁:工作正红灯闪烁:工作异常,有告警,且频率越高表示告警级别越高硬盘状态指示红绿绿灯闪烁:硬盘读写操红灯长亮:硬盘故障或不在绿绿灯闪烁:正常运绿灯熄灭:工作异常,不处于服务状指示灯标指示灯含颜说红本章包含如:ü单板故2-ü电源故2-ü风扇故2-单板故障的常见故障现象如下:故障现象参考章节2.1.1单板H/S2.1.2单板H/S2.1.3单板OK2.1.4单板OK2.1.5单板HOST2.1.6单板HD1/HD2单板扳手上下电异.8单板运行过程中异常下电且H/S单板H/S指示灯长故障现象故障现象故障分析故障分析单板处于工作状态时,热插拔状态指示灯(H/S指示灯)应该是熄灭状态。H/S指示灯长亮表明单板处于非工作状态。可能原因如下 单板扳手未扣紧。 前插板和后插板接触不良。根据以下操作步骤进行故障处理。确认单板扳手是否合紧,即扳手上滑动块是否扣紧 是→步骤3 否→步骤2合紧单板扳手,确认扳手已合紧的情况下H/S指示灯是否在闪烁后转至长灭状态 是→结束 否→步骤3打开单板扳手再次合紧,确认扳手已合紧的情况下H/指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤4说明: 单板H/S指示灯闪烁”进行处理故障处理结果确认故障处理结果确认单板H/S指示灯长灭。单板H/S指示灯闪故障现象故障现象GPBB0、GPBX1、SLB、SWBB0/SWBB1、NCMM的H/S指示灯()长时间闪烁故障分析故障分析单板处于工作状态时,热插拔状态指示灯(/指示灯)应该是熄灭状态。H/指示灯长时间闪烁表明单板没有正常启动。故障处理故障处理根据以下操作步骤进行故障处理。打开单板扳手再次合紧,确认扳手已合紧的情况下H/指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤2打开主用NCMM扳手进行主备倒换(倒换完后再合上NCMM扳手)H/S 是→结束 否→步骤3打开单板扳手再次合紧,确认扳手已合紧的情况下H/指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤4故障处理结果确认故障处理结果确认单板H/S指示灯长灭。单板OK指示灯熄故障现象故障现象故障分析故障分析健康状态指示灯(OK指示灯)熄灭表明单板没有正故障处理故障处理根据以下操作步骤进行故障处理。确认此时是否在升级该单板的IPMC 是→步骤2 否→步骤3等待升级完成后确认OK指示灯是否绿灯闪烁 是→结束 否→步骤3 是→步骤4 否→步骤5等待单板启动完成后确认OK指示灯是否绿灯闪烁 是→结束 否→步骤5重启单板后确认OK 是→结束 否→步骤6故障处理结果确认故障处理结果确认单板OK指示灯绿灯闪烁。单板OK故障现象故障现象故障分析故障分析健康状态指示灯(OK指示灯)红灯亮表明单板存在故障处理故障处理根据以下操作步骤进行故障处理。在本地终端的告警管理页面,查看是否有相关告警 是→步骤2 否→结束根据告警管理中的处理建议进行处理,查看告警是否消除 是→结束 否→步骤3故障处理结果确认故障处理结果确认单板OK指示灯绿灯闪烁。单板HOST指示灯红灯闪故障现象故障现象故障分析故障分析运行/告警指示灯(HOT指示灯)红灯闪烁表明单板工作异常、有告警,红灯闪烁的频率越高表示告警级别越高。故障处理故障处理根据以下操作步骤进行故障处理。在本地终端的告警管理页面,查看是否有相关告警 是→步骤2 否→结束根据告警管理中的处理建议进行处理,查看告警是否消除 是→结束 否→步骤3故障处理结果确认故障处理结果确认单板HOST指示灯绿灯闪烁。单板HD1/HD2指示灯红灯长故障现象故障现象故障分析故障分析故障处理故障处理根据以下操作步骤进行故障处理。 是→结束 否→步骤2故障处理结果确认故障处理结果确认单板扳手上下电异常故障现象故障现象单板合上扳手上电后,HOST故障分析故障分析当合上扳手单板无法上电或者打开扳手单板无法下电时,可能是单板下扳手的滑动块已经损坏。故障处理故障处理根据以下操作步骤进行故障处理。检查单板的滑动块是否损坏。 是→步骤2 否→步骤3更换单板后确认HOST 是→结束 否→步骤3故障处理结果确认故障处理结果确认单板正常上电,HOST指示灯绿灯闪烁。单板运行过程中异常下电且H/S故障现象故障现象单板在运行过程中出现H/S指示灯长亮,且异常下电,重新拔插单板后还可以正常上电工作。该故障现象与单板的内部管理机制有关。可能是由于单板温度过高,启动了自我保护流程,从而导致单板下电。故障处理故障处理根据以下操作步骤进行故障处理。在本地终端的告警管理页面,查看是否有温度相关告警 是→步骤2 否→步骤4检查机房温度,是否高于单板正常工作要求的温度 是→步骤3 否→步骤4 是→结束 否→步骤4联系中兴通讯故障处理结果确认故障处理结果确认单板已上电且H/S指示灯熄灭。电源故障的常见故障现象如下:故障现参考章电源模块热插拔状态指示灯2.2.1电源模块热插拔状态指示灯长电源模块热插拔状态指示灯2.2.2电源模块热插拔状态指示灯闪整框或半框设2.2.3整框或半框设备掉拔插单个电源模块时半框设备系统运行中部分单板突然2.2.5电源模块热插拔状态指示灯长亮故障现象故障现象电源模块的指示灯 )长亮电源模块处于工作状态时,热插拔状态指示灯(指示灯)应该是熄灭状态。指示灯长亮表明电源模块处于非工作状态。根据以下操作步骤进行故障处理。使用的工具(如镊子)按一下电源模块面板上内陷的热插拔按键(按键),查看指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤2重新拔插一次电源模块,确认在电源模块已插紧的情况下指示灯是否在闪烁后至长灭状态。 是→结束 否→步骤3说明:若指示灯一直处于闪烁状态,参见“2电源模块热插拔状态指示灯闪烁”进行处理。故障处理结果确认故障处理结果确认电源模块指示灯长灭电源模块热插拔状态指示灯闪烁故障现象故障现象电源模块的指示灯()长时间闪烁故障分析故障分析电源模块处于工作状态时,热插拔状态指示灯(指示灯)应该是熄灭状态。指示灯长时间闪烁表明电源模块没有正常启动。根据以下操作步骤进行故障处理。使用的工具(如镊子)按一下电源模块面板上内陷的热插拔按键(按键),查看指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤2打开主用NCMM扳手进行主备倒换(倒换完后再合上NCMM扳手),查看电源模块的指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤3使用的工具(如镊子)按一下电源模块面板上内陷的热插拔按键(按键),查看指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤4故障处理结果确认故障处理结果确认电源模块指示灯长灭整框或半框设备掉电故障现象故障现象整框或半框设备突然掉电。故障分析故障分析可能是外部电源无法供电。故障处理故障处理根据以下操作步骤进行故障处理。检查UPS 是→步骤2 检查机框电源模块面板上的电源状态指示灯(-48VA或-48VB指示灯)是否红灯 是→步骤3 否→步骤5 是→步骤4 否→步骤5合上机框电源模块的两个电源开关后确认问题是否解 是→结束 否→步骤5使用万用表测试电源模块上- 是→步骤8 否→步骤6根据施工文档检查机架给机框输入电源的开关或接线是否有问题 是→步骤7 否→步骤8根据施工文档重新设置机架给机框的输入电源后确认问题是否解决 是→结束 否→步骤8故障处理结果确认故障处理结果确认电源系统正常上电,设备运行正常。拔插单个电源模块时半框设备掉电故障现象故障现象拔插单个电源模块导致机框掉电。故障分析故障分析机框两个电源模块是冗余和热备份的。若拔插单个电源模块时导致半框设备掉电可能和电源线的连接有关。故障处理故障处理根据以下操作步骤进行故障处理。 是→步骤3 否→步骤2根据施工文档重新连接电源后确认问题是 是→结束 否→步骤3联系中兴通讯故障处理结果确认故障处理结果确认拔插单个电源模块时,设备运行正常。系统运行中部分单板突然掉电故障现象故障现象系统运行中部分单板突然掉电。故障分析故障分析可能由以下因素导致: 机框的供电电压、功率不正 电源线接触不故障处理故障处理根据以下操作步骤进行故障处理。确认机框的供电电压是否正常、功率是否足够 是→步骤2 否→联系电源相关部门排除故障确认电源线是否接触良好,无发热松动的情况(特别是分线盒上电源线压接的地 是→步骤4 否→步骤3根据施工文档重新连接电源后确认问题是 是→结束 否→步骤4单板恢复上电,设备运行正常。风扇故障的常见故障现象如下:故障现参考章2.3.1风扇模块H/S2.3.2风扇模块H/S2.3.3风扇RUN指示灯绿灯闪烁但风扇一直全速2.3.4风扇RUN风扇模块H/S指示灯长故障现象故障现象风扇模块的H/S指示灯()长亮故障分析故障分析风扇模块处于工作状态时,热插拔状态指示灯(H/S指示灯)应该是熄灭状态。H/S指示灯长亮表明风扇模块处于非工作状态。故障处理故障处理根据以下操作步骤进行故障处理。使用的工具(如镊子)按一下风扇模块面板上内陷的热插拔按键(H/S按键),查看H/S指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤2重新拔插一次风扇模块,确认在风扇模块已插紧的情况下H/指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤3说明 故障处理结果确认故障处理结果确认风扇模块H/S指示灯长灭。风扇模块H/S指示灯闪故障现象故障现象风扇模块的H/S指示灯()长时间闪烁故障分析故障分析风扇模块处于工作状态时,热插拔状态指示灯(H/S指示灯)应该是熄灭状态。H/S指示灯长时间闪烁表明风扇模块没有正常启动。故障处理故障处理根据以下操作步骤进行故障处理。使用的工具(如镊子)按一下风扇模块面板上内陷的热插拔按键(H/S按键),查看H/S指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤2打开主用NCMM扳手进行主备倒换(倒换完后再合上NCMM扳手),查扇模块的H/S指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤3使用的工具(如镊子)按一下风扇模块面板上内陷的热插拔按键(H/S按键),查看H/S指示灯是否在闪烁后转至长灭状态。 是→结束 否→步骤4风扇模块H/S指示灯长灭。风扇RUN指示灯绿灯闪烁但风扇一直全速运故障现象故障现象故障分析故障分析可能由于系统存在温度告警或风扇器件损坏。故障处理故障处理根据以下操作步骤进行故障处理。在本地终端的告警管理页面,查看是否存在温度过高的告警 是→步骤2 否→步骤3根据告警管理中的处理建议进行处理,查看告警是否消除 是→步骤3 否→步骤4检查风扇器件是否损坏。 是→步骤4 否→步骤5更换风扇后确认问题是否解决。 是→结束 否→步骤5故障处理结果确认故障处理结果确认风扇可以正常调速。风扇RUN故障现象故障现象风扇一直全速运转,且面板上的RUN一般是由于NCMM无法控制风扇所致。故障处理故障处理根据以下操作步骤进行故障处理。 是→结束 否→步骤2故障处理结果确认故障处理结果确认风扇可以正常调速。类故障类常见故障参见表3-1表3-1类常见故故障类参考章通讯类故3.1通讯类故障权限类故3.2权限类故障数据库类故3.3数据库类故障性能管理类故3.4性能管理类故障告警管理类故3.5告警管理类故障本章包含如下ü通讯类故 1ü权限类故 4ü数据库类故 6ü性能管理类故 8ü告警管理类故 10通讯类故障的常见故障现象如下:故障现参考章本地终端传送数据到OMP超3.1.1本地终端传送数据到OMP超3.1.2使用IE浏览器无法连接OMM本地终端传送数据到OMP超故障现象故障现象故障分析故障分析故障处理故障处理根据以下操作步骤进行故障处理。在OMM服务器上OMP的IP地址,查看是否能通 是→步骤6 否→步骤2 是→步骤3 否→步骤6 是→步骤4 否→步骤5插紧网线,查看故障是否消除。 是→步骤5 否→步骤6在本地终端令终端页面,执行SYNA:STYPE="ALL"命令,传送数据OMP 是→步骤6 否→结束在本地终端令终端页面,执行CHECKOMCLINK命令,查看OMP和 是→步骤7 否→步骤8在本地终端令终端页面,执行SETOMP:RELINK="YES"命令,重新建链 是→结束 否→步骤8故障处理结果确认故障处理结果确认执行SYNA:STYPE="ALL"命令,传送数据到OMP,系统返回成使用IE浏览器无法连接OMM故障现象故障现象故障分析故障分析可能的原因如下: OMM OMM服务器上的HTTP故障处理故障处理根据以下操作步骤进行故障处理。在本机OMM服务器IP地址,查看是否可以通 是→步骤4 否→步骤2 是→步骤4 否→步骤3插紧网线,查看故障是否消除。 是→步骤4 否→步骤5 是→结束 否→步骤5在OMM服务器的终端窗口中,输入命令ps–ef|grepservice,查看进程是否都已启 是→步骤7 否→步骤6重启OMM 是→步骤7 否→步骤8 是→结束 否→步骤8在OMM服务器的终端窗口中,输入命令servicehttpdstatus,查看HTTP服务是否启 是→步骤10 否→步骤9在OMM服务器的终端窗口中,输入命令servicehttpdstart启动HTTP服务后,查看 是→步骤10 否→步骤11 是→结束 否→步骤11故障处理结果确认故障处理结果确认故障现象故障现象创建用户并赋予预定权限后,出现如下现象: 无法登录OMM 登录后不能正确运用约定的权故障分析故障分析可能的原因是在安全管理中权限没有赋予完全,或者是用户权限被限制,例 用户没有相应角色。 角色没有被赋予正确的权限。故障处理故障处理根据以下操作步骤进行故障处理。在本地终端令终端页面,输入命令 USER,查看用户是否有效 是→步骤3 否→步骤2在本地终端令终端页面,输入命令SETUSER,把用户是否有效修改为有 是→结束 否→步骤3使用Admin权限用户登录,在本地终端令终端页面,输入命令SHOWUSER 是→步骤7 否→步骤4 是→步骤6 否→步骤5使用Admin权限用户登录,在本地终端令终端页面,输入命令ADDROLE, 是→结束 否→步骤6在本地终端令终端页面,输入命令ADDUSERROLE,为用户增加角色后, 是→结束 否→步骤7使用Admin权限用户登录,在本地终端令终端页面,输入命令SHOWROLE 是→步骤9 否→步骤8在本地终端令终端页面,输入命令ADDROLECMDSET,增加角色权限 是→结束 否→步骤9故障处理结果确认故障处理结果确认可以登录,且能正确运用约定的权限数据库类故障数据库类故障的常见故障现象如下:故障现参考章连接数据库失3.3.1连接数据库失败本地终端的导出功能无法使3.3.2本地终端的导出功能无法使连接数据库失败故障现象故障现象执行OMM上令,系统上报Dbnotconnect,重启OMM服务器后执行上令仍然失败故障分析故障分析可能的原因: OMM服务器上的Firebird Firebird故障处理故障处理根据以下操作步骤进行故障处理。在OMM服务器的终端窗口中,输入servicefirebirdstatus命令,查看数据库服务是否 是→步骤3 否→步骤2执行 start命令启动数据库服务后确认问题是否解决 是→结束 否→步骤3进入 ,执行如下命令,查看数据库是否可以连接成功./isql-uSYSDBA-pSYSDBA/home/ngomm_data/ngomm_db/局号/FIREBIRD_CM.其中,-u后面为ieid用户名,p后面为(根据实际情况填写),局号中的局号根据实际情况填写。 是→步骤5 否→数据已经损坏,步骤4iCX(MSCS)MSC服务器软件安装指导(单机)》中的“配置系统服务”。 是→结束 否→步骤5故障处理结果确认故障处理结果确认可以执行OMM上令本地终端的导出功能无法使故障现象故障现象本 终端登录OMM服务器后,导出功能无法使用,如性能管理中的导出功能故障分析故障分析本 终端的导出功能需启用IE的ActiveX控件选项,而该选项IE默认是未启用的故障处理故障处理根据以下操作步骤进行故障处理。在本 终端打开IE图3-1安装控 说明仅首次OMM服务器时,弹出该框单击该框,选择快捷菜单运行加载项在弹出的提示框中单击运行按钮,安装“ZteOMMAssistantActiveXControlModule” 是→结束 否→步骤6故障处理结果确认故障处理结果确认本地终端登录OMM服务器后,导出功能使用正常性能管理类故障性能管理类故障的常见故障现象如下:故障现参考章性能数据上报延3.4.1性能数据上报延迟性能数据无法上3.4.2性能数据无法上报性能数据上报延故障现象故障现象在本地终端的性能管理中,创建并激活性能测量任务,等待0个粒度后,有性能数据上报,但上报的性能数据小于0个粒度。故障分析故障分析故障处理故障处理根据以下操作步骤进行故障处理。在本地终端令终端页面,执行SHOWTIME命令,查看OMP的时间是否OMM 是→步骤3 否→步骤2在本地终端令终端页面,执行UPDTIME命令,修改OMP的时间。确认性能数据上报延迟故障是否解决。 是→结束 否→步骤3故障处理结果确认故障处理结果确认在本地终端的性能管理中,创建并激活性能测量任务,等待0个粒度后,上报的性能数据等于0个粒度。性能数据无法上故障现象故障现象在本地终端的性能管理中,创建并激活性能测量任务,等待0个粒度后,没有性能数据上报。故障分析故障分析可能原因如下 OMP和OMM OMP和OMM OMM故障处理故障处理根据以下操作步骤进行故障处理。在本地终端令终端页面,执行SHOWTIME命令,查看OMP的时间是否OMM 是→步骤3 否→步骤2在本地终端令终端页面,执行UPDTIME命令,修改OMP的时间。确认性能数据上报故障是否解决。 是→结束 否→步骤3在本地终端令终端页面,执行CHECKOMCLINK命令,检查OMP和 是→步骤5 否→步骤4在本地终端令终端页面,执行SETOMP:RELINK="YES"命令,重新建链 是→结束 否→步骤5在OMM服务器的终端窗口中,输入命令ps–ef|grepservice,查看进程是否都已启 是→步骤7 否→步骤6重启OMM 是→步骤7 否→步骤8重启单板后确认问题是否解决。 是→结束 否→步骤8故障处理结果确认故障处理结果确认在本地终端的性能管理中,创建并激活性能测量任务,等待0个粒度后,有性能数据上报。告警管理类故障告警管理类故障的常见故障现象如下:故障现参考章告警过滤规则无法生3.5.1告警无法到达连接正常的告警3.5.2告警无法到达连接正常的告警箱告警过滤规则无法生效故障现象故障现象在本地终端的告警管理页面中,创建了告警过滤规则,但发现规则不生效,当前的告警无法被过滤。故障分析故障分析告警过滤规则的原则是向后生效,所以只有在告警过滤规则创建之后上报的告警才可以被过滤。故障处理故障处理根据以下操作步骤进行故障处理。 是→结束 否→步骤2故障处理结果确认故障处理结果确认在告警过滤规则创建之后上报的告警可以被自动过告警无法到达连接正常的告警箱故障现象故障现象在本地终端的告警管理页面中创建了告警箱且告警箱连接正常,但发现告警无法到达告警箱。故障分析故障分析告警箱接收告警的原则是向后生效的,即对于创建告警箱之前上报的告警是无法到达告警箱的,只有创建告警箱之后上报的告警才可以到达告警箱。故障处理故障处理根据以下操作步骤进行故障处理。 是→结束 否→步骤2故障处理结果确认故障处理结果确认在告警箱创建之后上报的告警可以到达告警箱。业务类故障业务类常见故障参见表4-1表4-1业务类常见故障故障类参考章基本呼叫业务故4.1短消息业务故4.2短消息业务故障位置更新业务故4.3本章包含如 ü基本呼叫业务故ü短消息业务故ü位置更新业务故基本呼叫业务故障背景知识背景知识呼叫业务是ZXUNiCX(MSCS)完成的基本功能,基本呼叫分为移动主叫和移动被叫两种情况。当移动用户拨打移动用户时,整个呼叫的流程如图4-1所示。图4-1基本呼叫流程流程说明如下MSCS1分析被叫用户MS2的,找到MS2所属的HLR,向HLR发送路由申请HLR查询MS2的当前位置信息,获得MS2服务于MSCS2/VLR2,HLR向请求路由信息。HLR将MSRN送给主叫MSCS1MSCS2/VLR2向被叫用户MS2MSCS2/VLR2收到MS2MSCS2与向MGW2MGW1和MGW2之间完成承载的建立过程,同时完成GW和MS之间的呼叫电路建立过程。MC1向主叫用户回铃音;如果此时被叫用户摘机,被叫局会向主叫局发送应答信号,双方MCS分别指示MGW接通话路,主叫和被叫就可以正常通话了。故障现象故障现象 用户位置更新成功后,不能正常进行主被叫呼叫 故障处理故障处理呼叫业务故障的处理流程如图4-2所示。图4-2呼叫业务故障处理流程根据以下操作步骤进行故障处理。打开信令系统,使用存在呼叫故障的终端进行呼叫业务,检查是否到信令如果不到任何信令,检查用户终端是否存在故障,更换终端进行试呼如果到信令,则分析信令。如果故障可能为本局原因,打开失败观察,查看失败观察系统提示原因,找出内部故障所在。如果为对端局故障,请和对端局联系,共同处理该故如果大量用户出现呼叫失败,检查本局和重要局向之间的链路状态是否正常、本局所有P状态是否正常。故障案例1(对接参数不一致导致呼叫失败故障现象故障现象ZXUNiCX(MC)与其他厂家UMTS互通测试时,对端用户拨打本局用户。本局ZXUNiCX(MCS)给对端R发送了漫游号码,在收到对端MSCS发来的AM消息后,本局直接给对端MCS回REL消息,释放呼叫。故障定位与分析故障定位与分析定位过程如下在NiCX(MCS)端查看MM消息,发现消息呼叫已经建立起来,其信令流程正确。 在ZXUNiCX(MSCS)端查看SRIAck消息中漫游号码为 F,这个F是对根据定位过程得出以下结论: 对端设置的漫游号码位数为11位,而本局是10位。对端MSCSF,在第11位后再加上一个F,这就是IAM消息中漫游号码存在两个F的因l F这个号码送至本局MCS,进行号码分析。最后一个F本局MCS只对 F进行号码分析,未发现匹配的号码分析数据,认为这是一个空号,所以发送REL给对端,导致业务失败。故障处理故障处理根据以下操作步骤进行故障处理。 令终端页面,执行 MRNPFX命令,增加11位的漫游号码进行拨打测试,发现可以正常呼叫,问题解决故障案例2(漫游用户无法作被叫故障现象故障现象A地HLR下某用户漫游在B地某局,能正常位置更新及做主叫,但做被叫时,只能做本地本网用户的被叫,其他移动、固定 拨打该用户皆失败。故障定位与分析故障定位与分析定位过程如下核查T局及本地关口局上关于该用户的G数据,发现该T数据指向错误,指向了本地其他HLR。根据定位过程得出以下结论:l外地的移动、固定拨打该用户时候,信令应该送到本地的关口局,由本地关口局向HLR发起路由信息请求。问题可能出在本地关口局上,未做该用户的GT分析指 本地MSCS端局与HLR为直连方式,而本地关口局与HLR为准直连方式,通过本地故障处理故障处理根据以下操作步骤进行故障处理。在T 令终端页面,执行 在本地关口 令终端页面,执行SETGT命令,将本地关口局GT数据指进行拨打测试,发现可以正常呼叫,问题解决故障案例3(欠费用户呼叫特服号码失败故障现象故障现象 故障定位与分析故障定位与分析初步判断应该是欠费用户触发了智能业务,导致其在SCP上对呼叫进行了限制查询该用户的VLR信息,发现其签约了欠费控制业务的智能业务SCP的GSMSSF信令消息,发现SCP下发“yAnnouncement”消息通知SSP放音故障处理故障处理根据以下操作步骤进行故障处理。在SSP侧,把特服号码设置成“不触发主叫智能业 SET进行拨打测试,发现可以正常呼叫,问题解决短消息业务故障背景知识背景知识短消息故障是指移动台发送短消息时屏幕提示发送失败或接收短消息的目的移动台未收到短消息。短消息业务处理流程分为三个部分:l移动台发起短消息处理流程(MO)l移动台终止短消息处理流程(MT)l提醒(Alert)消息的传送常用的流程是MO流程和MT流程。l移动台发起短消息处理流程如图4-3图4-3移动台发起短消息业务流程流程说明如下MS给MSCS/VLR发CM_SER_REQ业务请求消息,MSCS/VLR给MS返回CM_SER_REQ_Ack业务响应或CM_SER_RJT业务拒绝消息。如果发送了MS给MC/VLR发送短消息CPDAA。MC/VLR收到此消息后,检查是否受补充业务的限制或。如果不短消息的处理,MC/VLR就把它传送到IWMSC(互通C),由MSC完成与C的交互。SC收到移动用户发来的短消息后,给MS返回处理结果。MSCS/VLR收到DeliveryReport消息后,发证实消息给MS。 移动台终止短消息处理流程如图4-4图4-4移动台终止短消息业务流程流程说明如下C收到的短消息如果是给移动用户的,把它传送到所属的GMS。MSCS发送RI给HLR,获取MC/VLR的路由信息。MCS根据路由信息找到MS所属的MC/VLR,并把短消息传送给MC/VLR。MC/VLR收到rwrd_hage消息后,如果LR中没有MS的相关数据,则直接给CS返回传送失败消息。如果R中有S的有关数据,则给S发送GE消息,等MS返回AGE-RSP后,进行鉴权,证明用户为合法用户。证明用户为合法用户后,MC/VLR给MS发送短消息。S收到短消息后给MC/VLR返回处理结果:处理成功则返回证实消息;处理失败则返回失败原因。如果MS没有足够的空间短消息时,这时在失败原因中会告诉C容量不够。MSCS/VLR收到MS的证实消息后,转换成MAP信令传送给GMSCS,再由转发给SC 发送短消息总提示不成功 接收不到短消息故障处理故障处理短消息业务故障处理流程如图4-5所示。图4-5短消息故障处理流程根据以下操作步骤进行故障处理。检查是否移动用户自身设置问题,如用户设定的短消息中心号码不正确检查是否数据配置错误,主要检查S数据和短消息相关的安全变量故障案例1(无法接收到短消息故障现象故障现象故障定位与分析故障定位与分析在IW/GMCS上进行信令,发现O流程已经成功,但没有看到MT流程,因此怀疑C没有下发短消息。在C侧进行信令,看到C已经发出了一条MT消息,但在W/GMCS侧没有收到该消息。继续分析该消息,发现消息发送的局号为C的局号,而/GMCS是采用的另外一个局号,因此根据该局号以及模块号,C无法将MT消息正确的发送到W/GMCS。故障处理故障处理根据以下操作步骤进行故障处理。增加W/GMCS的局号以后,在C系统配置中,修改对应W/GMCS局号的P模块。进行收短消息测试,发现可以接收到短消息,问题解决故障案例2(无法收 故障现象故障现象某网P与W的互通时的信号方向如下l 入局,W向P发出的消息是从WGMSCS发到MCS,经P送到HLR的消息是从MCS发到WVMCS,经P回到MSS。 出局,与入局信号方向相反入局路由由原先的MCS割接到新MCS后,无法接收到。组网图如图6所示。图4-6组网图故障定位与分析故障定位与分析在LR、MCS上同时入局号码。R上能到入局请求路由的消息,且HR已返回路由响应消息,而MCS上无法到下发消息。说明PGMSCS转发S层消息到HR没有问题,问题可能出在MCS向VMCS转发消息或TP向VMCS转发消息。检查PGMSCS的GT配置,发现所有的GT数据(包括PVMSCS、HLR、WGM-SCS、SMC)都已配置,并且注意到PGMSCSGT是直接指向PVMSCS,而不是通过检查PGMSCS上对PVMSCS的相关配置,发现SIO定位AS配置中缺少PGMSCS-PVM-SCS的S协议配置。无需S转发故不存在问题;割接后,需经S转发而PVMSCS间未配置S协议,故导致业务失败故障处理故障处理根据以下操作步骤进行故障处理。在 令终端页面,执行ADDSIOLOCAS命令,增加PGMSCS-的SIO定位AS配置,其务指示语选择S进试,发现接收正常,问题解决IP组网时,需要在SIO定位AS配置中按需选择邻接局的局间信位置更新业务故障背景知识背景知识位置更新包括一般位置更新、周期性位置更新和SI的附着/分离。一般性位置更新的信令流程如图7所示。图4-7一般位置更新流程流程说明如下MS向MC/VLR发起位置更新请求,MC/VLR接收到S发送来的位置更新请求,检查用户数据的正确性,判断位置更新的种类,以确定一系列的后续操作。MC/VLR根据一些条件决定是否向HLR发起位置更新请求。通常在以下三种情况下会引起本操作: 用户漫游了MSCS/VLR系统 前MC/VLR(VLR)从HLR接收位置删除请求,根据参数中的用户标识IMSI用户数据中删除该记录,释放用户的TMI。MSCS/VLR从HLR接收到Activate_Trace_Mode请求,直接向HLR返回Acti-MSCS/VLR向HLR发送位置更新请求,引起HLR发起用户数据插入操作,以将中的用户数据传送给VLR使用周期性位置更新和IMSI的附着/分离的信令流程和一般位置更新流程基本类似,因此在进行故障处理时,可以依据一般性位置更新的处理方法进行处理。在位置更新流程中,MC/VLR完成用户的接入、鉴权;HR提供用户的签约数据;MS发起位置更新/IMSI附着请求;MGW完成信令网关(G)的功能,完成将接入侧的信令转接到MCS上,并不进行任何处理。故障现象故障现象位置更新故障的主要故障现象有以下几种: 用户开机后,在VLR 位置更新失败引起的呼叫故障。故障处理故障处理根据以下操作步骤进行故障处理。对存在故障的用户进行分析,确认是单用户故障还是多用户故障,打开信令工具,故障用户。如果是单用户故障,用户的信令后,如果是不到任何信令,故障可能出现在用户侧,联系用户进行处理。如果能够到用户的位置更新请求信令,但被HLR,检查该用户是否签约了漫游限制数据。如果为多用户故障,需要对故障用户信息进行分析,分析方法如下l分析用户所处位置是否处于同一位置区或者小区。如果是,联系无线侧人员检查该位置区的无线侧设备是否正常;检查本局的无线相关数据(位置区、小区数据等)是否有人改动,数据是否正确。l分析用户的MI是否有规律,检查故障用户IMS负荷分担对应的M状态是否正l分析用户是否归属于同一个HRT配置和MTP配置;检查该HLR的状态,联系HLR人员进行信令,共同解决问题。 故障案例1(周期性位置更新设置错误导致被叫无法接通故障现象故障现象在进行一般语音呼叫时,从主叫听到的放音是“被叫已关机”,但实际上被叫一直是开机状态。将被叫关机重启,呼叫正常。这种情况发生过多次。故障定位与分析故障定位与分析定位过程如下+位置更新保护时间)为45分钟,而RNC侧设置的一般位置更新时间是60分钟

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论