软交换故障处理手册_第1页
软交换故障处理手册_第2页
软交换故障处理手册_第3页
软交换故障处理手册_第4页
软交换故障处理手册_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1软交换故障处理RPHM-ARPHM-BCP-A&BFanFan2主讲人:韩成贵临沂网络维护中心交换1班3

BTS

NodeB

BTS

BTS

BTS

BTS

BTS

NodeB

BTS

BTS

MSCserverpoolMGW

MSCserverpoolMGWMGWMGWMGWMGWExternalNetworks随着移动通信的发展,软交换设备在现网中占据着越来越重要的地位,在全省各地软交换设备已经超过了普通的TDM设备,并且在即将到来的3G时代软交换在核心网中将占据着绝对统治地位。4软交换故障处理讲座

第一章

GARP板等硬件故障处理

第二章设备软件版本引起的故障处理

第三章电路故障处理

第四章录音通知故障处理

第五章信令配合故障处理

第六章从ENUM事件告警和EOS统计发现的软交换故障处理5定期解闭GARP板来防止信令瞬断

爱立信软交换设备由于GARP板问题经常导致至MGW的信令瞬断,关于MGW瞬断的问题,是由于GARP板的某些counter溢出,导致GARP板每50天发生启动,从而导致MEDIAGATEWAYUNAVAILABLE告警。目前临时性的解决方法为:在第49天的时候,手动闭解GARP板RP,可避免该问题出现。日常维护建议:每月定期闭解一次GRAP板。GARP板等硬件故障处理6解闭有问题的RP解决M3UA链路问题通过MGW侧告警得到哪个Association出现问题,即哪条链路出现问题通过命令M3RSP:DEST=ALL;来检查MSC侧对应的Association通过命令IHALP:EPID=ALL;来检查该Association对应的IP地址通过命令IHCOP:IPPORT=ALL;来得到该IP地址对应的IPPORT通过命令EXEMP:EM=ALL,RP=ALL;得到该IPPORT对应的RP闭解该RP,然后检查MGW侧告警是否消除,如果没有消除,立即通知爱立信技术支持部请求技术支持。GARP板等硬件故障处理7更换低版本的GARP板来解决M3UA瞬断经爱立信确认:对于版本ROJ20816/3R1A的RP硬件,有个别板子有硬件问题,主要体现在消息处理上的容忍限度,在很小干扰的情况下,RP就可能出现RP错误,导致RP闪断,出现M3UA的瞬断,如果该RP在10分钟内出现3次闪断,RP将倒换到备用RP上。通过两个现象可以决定M3UA的瞬断是由于RP的硬件错误造成的

1、RP的eventcode来决定通过RP的EVENTCODE来看,如果ERWORKING是H'06AH'0002H'0055,证明该RP的硬件有问题,应该及时更换

2、通过RPDUMP来判断通过TERDI打印可以看出,如果打印出现FATALSDRAMECCERRORDETECTEDAT0xxxxxx,证明该硬件有故障,更换硬件GARP板等硬件故障处理8更换低版本的GARP板来解决M3UA瞬断建议更换的RP版本为ROJ20816/3R1B/B,如果没有这种版本,可以更换成版本为ROJ20816/1R3A,如果这2种版本都没有,可以更换一块新的版本为ROJ20816/3R1A板子,大多数这种板子都没有这种问题。GARP板等硬件故障处理9

爱立信mgw硬件错误故障的处理步骤:如果是普通硬件错误,把板子lock,换板,unlock。

Scb板子故障会导致mgw重启,把scb板子lock,拔线,拔板子,插板子之前,先把线插上,再把板子插上(否则mgw会启动)。Etc41板子中的交换功能坏了,会出现hardwarealarm,会导致msrn吊死,需要把etc41板子重启一下,如果还不行,则重启mgw。GARP板等硬件故障处理10软交换故障处理讲座

第一章GARP板等硬件故障处理

第二章设备软件版本引起的故障处理

第三章电路故障处理

第四章录音通知故障处理

第五章信令配合故障处理

第六章从ENUM事件告警和EOS统计发现的软交换故障处理11LYIGM9以前因缺软件补丁经常出现资源吊死经常导致下面的用户不能正常通话,临时性的解决办法是在夜间做冷启,后来联系省公司打上补丁后才彻底解决。SERVER中的ET1551光板因RP软件版本问题经常出现瞬断现象,后来降低RP软件版本后瞬断次数大大减少,但仍然偶尔发生。设备软件版本引起的故障处理12LYIGM8、LYIGM9以前因SCB板子存在缺陷经常出现媒体网关不可用的告警,后来更换了LYIGM8、LYIGM9两个MGW共16块SCB板子。更换完成并冷启动以后,交换机一直工作正常。从以上可以看出,对于因设备软件版本引起的问题的解决办法就是积极联系厂商进行软件升级或者更换单板。设备软件版本引起的故障处理13软交换故障处理讲座

第一章

GARP板等硬件故障处理

第二章设备软件版本引起的故障处理

第三章电路故障处理

第四章录音通知故障处理

第五章信令配合故障处理

第六章从ENUM事件告警和EOS统计发现的软交换故障处理14数据添加后MGW上E1、TDM状态正常,SERVER上DEVICE状态正常,而SNT状态为ABL。一般在MGW上闭解一下terminalgroup,重新向server发送teminition状态改变通知可以恢复。关于爱立信软交换和华为软交换电路状态的故障,是双方信令配合的问题。可以对状态不正确的电路进行双方的闭塞和解闭,必要时重新添加一下数据。如仍旧不能解决问题,可在爱立信交换机侧用testsystem指令强制复位电路状态。电路故障处理15数据添加后MGW上E1、TDM状态正常,SERVER上SNT状态正常,而DEVICE状态为ABL。将设备在SNT上重新添加一遍,先在MGW侧闭掉相应的TERMINALGROUP,然后执行EXDAE-EXDRE-NTCOE后再重新定义,解闭的时候先在MGW侧解闭TERMINALGROUP,再解开SNT和DEV。这种情况还有一种原因是数据设置有误,去年临沂曾发生过因对端济南某局设置的路由参数SPN有误导致DEVICE状态为ABL,后来修改了SPN之后电路才恢复正常,这种错误比较隐蔽,需要联系双方共同检查数据后才行。电路故障处理16软交换故障处理讲座

第一章

GARP板等硬件故障处理

第二章设备软件版本引起的故障处理

第三章电路故障处理

第四章录音通知故障处理

第五章信令配合故障处理

第六章从ENUM事件告警和EOS统计发现的软交换故障处理17根据用户投诉或登陆到相应非主机框GPB板上使用mesc_info_im-all查看是哪条录音通知出问题。在SERVER上使用tctdi:bo=99,bnb=;指令监听录音通知是否正常。对于GMPV3版本来说录音通知一般放在主机框12、13板位,使用totalcommand工具登陆到相应的MGW文件夹,进入p001200/im_basic_messages/phrases目录下查看具体的录音通知是否存在,可用播放软件测试一下是否正常。如不正常可用其它MGW上正常的录音通知覆盖掉。录音通知故障处理18如果上述检查录音通知本身没有问题,打开EMAS平台上配置选项IM中对相应的录音通知闭解锁一下,如果仍然不起作用的话可能是进程吊死或相应的MSB板子坏了,如果是进程吊死的话,在EMAS平台上从右框中选择reliableprogram为msp_msa_im_streamer的进程,点击右健选择“Properties”,在弹出的对话框点击”Switch”,将进程重启一下即可,如果是MSB板子坏掉的话则更换相应的单板。对于平常不使用的录音通知但是使用指令查看REJECT次数一直在增长的情况,我们可以在SERVER上使用指令exaue:pos=pos删除32位-16位映射关系。录音通知故障处理19软交换故障处理讲座

第一章

GARP板等硬件故障处理

第二章设备软件版本引起的故障处理

第三章电路故障处理

第四章录音通知故障处理

第五章信令配合故障处理

第六章从ENUM事件告警和EOS统计发现的软交换故障处理20由于各个厂家对于BICC消息规范的理解存在偏差,因此VOIP改造后不同厂家间的BICC消息配合存在很多的问题,尤其是关口局又存在互联互通问题,信令消息配合问题更多。出现这种情况通过对信令消息跟踪和分析来发现问题、解决问题是一个比较好的途径。解决不同厂商信令消息配合差错的根本途径是使双方协商的消息达到一致,因此可以通过联系厂商打补丁修改消息格式或者采用屏蔽消息错误参数的方式来解决。

信令配合故障处理21临沂曾发生过爱立信VoIP局下手机用户无法拨打华为VoIP局下无线座机的情况,是由于被叫无线座机不能正常上报承载,被叫华为VOIP端局回送默认编解码AMR,而主叫选择的是AMR2,从而造成双方编解码协商失败,呼叫无法接续。联系厂家说需要打补丁才能彻底解决此问题,在打补丁之前,暂时将两局间话务改走TDM路由,这样就不需要进行编解码协商,从而保证话务可以正常接续。信令配合故障处理22临沂华为软交换关口局VOIP改造后,联通C网用户拨打爱立信VOIP局下的手机无法接通,用户听空号的录音通知,G网用户拨打正常,TDM局下用户被叫正常。该问题是由于爱立信VOIP端局不识别联通C网发来BICC-IAM消息中的USI信源的3.1KHz传输能力所致,因此爱立信端局可以使用screeningmasks将该信源丢弃。在3GPP规范中IAM消息的USI参数编码为00011101(即29),因此我们可以使用BISMI指令定义名为DISCARDUSI的BICCscreeningmasks将此信源屏蔽掉,然后使用BIRMC:SM=DISCARDUSI,R=LYDS1O;指令使该BICCscreeningmasks在华为软交换关口局路由上生效。这样就能保证通话的正常建立。信令配合故障处理23软交换故障处理

第一章

GARP板等硬件故障处理

第二章设备软件版本引起的故障处理

第三章电路故障处理

第四章录音通知故障处理

第五章信令配合故障处理

第六章从ENUM事件告警和EOS统计发现的软交换故障处理24通过对ENUM事件、EOS统计和历史告警的分析,我们能挖掘到软交换中存在的一些隐患,通常这三者是关联的,我们可以多个侧面看到交换机上存在的一些问题。对于在SERVER上出现的DISTURBANCESUPERVISIONLIMITREACHED,要先用EREPP:ENUM=*查看ENUM=*中错误代码的ERRCODE代表什么意义,再查看EMAS上的告警情况,从资料中找到错误代码表示的意义(属于录音通知的问题还是传输瞬断引起),从历史告警查看定位具体是哪块板子出问题再进行后续处理。从事件和EOS统计发现的软交换故障处理25去年青岛通过统计发现QDAGS15每个小时出100次左右EOS3748的现象,交换机没有出直接告警,但可以看出QDAGS15存在ENUM=1009,MGW20侧出现GCP500错误。EOS3748表示收到原因为SwitchingEquipmentCongestion的释放消息,具体表现为Server侧出现ENUM1009事件,通过到相应机框的GPB板用telogread打印分析tracelog可以发现发送有问题的Context的时隙及对应的PCM设备号:对上述电路进行闭解,重新定义电路数据后恢复正常,观察统计EOS3748消除。从事件和EOS统计发现的软交换故障处理26RA告警处理

lyigm22的subrack=2,slot=6的msb板故障导致出现告警Media

Stream

Function

Resource

Access

Failure,将此msb板更换后,故障解决,但是告警一直没有消除。登录网元,查看原始告警信息包含“SpecificProblem:Media

Stream

Function

Resource

Access

Failure”,查询ALEX,按其步骤解决。1、EMAS->Resource

Access,进入后右键SHOW

LDN查到与告警信息中相同的LDN(...ResourceAccess=3);2、可看到该条ResourceAccess中PIU

id

containing

active

RPU“...

ManageElement=1,Equipment,Subrack=2,Slot=2,pluginunit=1”

;3、LOCK该块GPB

;4、RESTART该块GPB;

5、UNLOCK该块GPB

,按此步骤操作告警消除。从以上可以看到有些告警是关联在一起,对于这种RA方面的告警一般可以通过重启相应的板子可以解决。从事件和EOS统计发现的软交换故障处理27通过统计发现交换机隐患案例临沂检查交换机各项指标发现爱立信voip软交换局lyigs13到同是爱立信voip软交换的lyigs15、lyigs16的切换成功率很差,几乎是0,但是到其他局的切换成功率都正常。在交换机上查看有enum告警,查看errcode确定是M3UA问题导致切换不成功。根本原因在于LYIGS13到上述局向MAP切换信令走的是TDM,而上述局向到LYIGS13走的是VOIP,当主用ET1551发生倒换的时候GS13到GS15的切换信令暂时无法送出,而GS15到GS13的切换信令通过IP送到GS13以后,GS13的M3UA相关BLOCK处理收到的信令以后无法将响应送给GS15。这样,GS13的M3UA相关BLOCK认为出现了故障导致统计指标异常。因此结合统计和ENUM我们能够发现一些不易察觉的隐患。从事件和EOS统计发现的软交换故障处理28日常维护中需要注意的事项

做好备份工作做好安全巡检和作业计划注意查看统计指标和历史告警,关注用户投诉29从广西爱立信MGW重大宕机事件可以看出备份对MGW的故障恢复时间的重要性。MGW的备份包括,数据盘(c,d盘)备份和DT(cv)备份。一般平常操作维护做的都是cv备份。全备份需要备份文件:整个C盘、D盘文件,P001200或P001300;RollbackList的设定:完成CV备份后要重新设定RollbackList,RollbackList的设定原则为:RollbackList里的第一个文件为最近一次CV备份的上次DUMP文件,第二个文件为上次RELOAD成功的DUMP文件;MGW中ConfigurationVersions的数量必须保持在40以下;CV备份不要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论