朗讯传输设备排障案例分析_第1页
朗讯传输设备排障案例分析_第2页
朗讯传输设备排障案例分析_第3页
朗讯传输设备排障案例分析_第4页
朗讯传输设备排障案例分析_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、朗讯传输设备排障案例分析 及操作技巧1. Wavestar ADM16/11.1 Wavestar ADM16/1环保护倒换故障调查报告及解决方案【产品名称】:Wavestar ADM16/1【分类】: 故障排除系统概述:整个网络是由Wavestar ADM16/1设备组成,LTDS为中心节点,从SZF到JHJ的节点都按箭头方向将交叉连接做到通往LTDS的时隙上。某天环中一段光缆意外中断,需对该段光缆进行熔接,熔接前电路未受影响。故障描述:在光缆熔接过程中,发生了业务中断的现象。一、第一次业务中断情况:10月21日,SHYU和SHYA节点间光路中断。在SHYU节点作了LS2的强制倒换,随后进行

2、光缆熔接,SHYU至SHYA的光纤先熔好,在熔SHYA至SHYU的光纤时,网管报告有80多个基站业务中断。所有中断基站均为SHYA经NGB一线到SZF所带的。将SHYU站点的光纤拔掉,业务恢复正常。二、第二次业务中断情况:11月2日下午,SYANG和YHE节点间光路中断。同样在光缆熔接过程中,出现20个基站死站现象,范围是YHE、SHONG、SZF。故障分析及处理:由于熔纤过程导致节点的光收信号侧收到的误码情况发生变化,致使节点收到的SDH信号中K字节混乱,从而影响节点的MSSPRING状态所致。由于熔纤必定会对光纤的物理特性性能有影响,而且此过程应是非线性的。对于其过程是如何对光纤中SDH信

3、号产生影响以及是何种影响,目前是无法模拟的。而对于K字节出现异常情况时的判断,在ITU-T建议中也并无具体定义。对此, 我们现场做了实验来验证:01:42:38,JHJ和LTDS的2根光纤全部剪断,网络倒换。01:51:36,JHJ发、LTDS收的光纤熔接好。此后开始熔接LTDS发、JHJ收的光纤。01:59:52,JHJ光丢失告警消失。01:59:54,环网倒换回来了。结论及建议:纵上所述,对此次问题我们决定采取如下措施并提出以下建议:由于熔纤技术或其他新技术的发展,在日后可能会出现新的不确定性因素导致新问题的出现,因此朗讯建议对在以后的熔纤操作工程中,在条件许可的情况下,可以预先在光纤两侧

4、的节点上均对相应光盘执行“强制倒换”操作或拔除光纤,直到熔纤结束时清除。1.2 收光功率偏低造成系统大量误码,信令电路中断【产品名称】:Wavestar ADM16/1【分类】: 故障排除系统概述:本网络为以多端Wavestar ADM16/1设备组成的环网,采用MSSpring保护方式。故障现象:某日接到用户电话报障,称有大量通过Wavestar ADM16/1传输设备的信令电路中断;经检查其他设备均无问题,故障点应发生在传输侧ADM 16/1设备上。但在网管上整个传输网络没有任何告警。故障分析及处理:1、 首先在DDF架侧用仪表检查部分2M电路,结果发现部分2M电路有大量误码。2、 由于2

5、M误码分散在多块支路盘上,故判断可能是光路或CC盘出现问题,但在本站作CC盘倒换后故障仍未排除,于是将疑点集中在光路上。3、 在网管上逐个检查各站的收发光功率,发现本站A向收光功率显示为0dB,不正常;对A向做线路强制倒换后误码消失,信令电路恢复正常。之后用光功率计测试发现A向收光功率实际为-32dBm,超出灵敏度范围;经检查发现是用户光缆发生故障,光缆修复后将强制倒换清除,设备工作正常,故障排除。结论及建议:1 设备灵敏度指标为-28dBm,但实际都有部分裕量,一般在-30-31dBm时也可正常工作。继续降低则可能出现误码,但并不会立即引起复用段倒换,要等误码率超出门限或LOS,LOP等告警

6、才会发生倒换。 2 ADM16/1默认的误码门限是3072000EB/s(MS-16),折换成误码率约为1.25E-3。这一门限对于传输语音信号是正常的,但如果传输信令、数据等信号就偏低了。信令信号对误码率的要求一般在1E-7左右,也就是约246EB/s(MS-16)。故在这次故障中信令电路全部中断,而语音业务尚保持正常。因而对于不同的业务要求,我们应该设置不同的误码门限。1.3 更换子架风扇控制板【产品名称】:Wavestar ADM16/1【分类】: 操作技巧描述:Wavestar ADM16/1设备的散热风扇出现故障后,需及时进行更换;而 更换方式分为带电和断电两种。操作步骤:一、 中断

7、子架的电源。(整个过程中需要佩戴防静电手环) 1、2、 拔下架头给子架供电的电源插头。整个子架断电。 摘掉防尘过滤网。3、4、5、6、7、8、9、卸下左侧和右侧的两个风扇(中间的风扇可以不用卸),留出空间以便拧风扇控制板上的螺丝。 拧下风扇控制板的螺丝,拔下上面的风扇电源接头和风扇控制板电源接头。 取出新的风扇控制板,用螺丝固定好,并连接好风扇电源接头和风 扇控制板电源接头。 固定好风扇。并检查各个电源接头是否连接正确。 插上架头给子架供电的电源插头。整个子架加电。 风扇启动,系统启动完毕以后,用CIT登陆,检查系统和风扇的告警。 插回防尘过滤网。二、 不中断子架电源。(整个过程中需要佩戴防静

8、电手环) 1、2、3、4、5、6、7、8、9、10、11、12、 摘掉防尘过滤网。 拔掉风扇控制板和子架后方的电源接头(连接标示:xp00) 卸下左侧和右侧的两个风扇(中间的风扇可以不用卸),留出空 间以便拧风扇控制板上的螺丝。 卸下风扇后,拧下风扇控制板上的两个螺丝。 拔掉3个风扇和风扇控制板的接头。 拔掉风扇控制板的电源接头(子架前面的接头),卸下损坏的风 扇控制板。 取出新的风扇控制板,连接好3个风扇和风扇控制板的电源接 头。 连结风扇控制板的电源接头(子架前面的接头)。 将风扇控制板用螺丝固定好。 将2个卸下的风扇恢复原来位置并用螺丝固定好。 接好子架后面的风扇控制板电源接头(连接标示

9、:xp00)。 风扇启动。检查风扇运行是否正常,并用CIT检查是否有关于风扇的告警。13、注意事项: 插回防尘过滤网。连接风扇控制板的电源接头时(包括子架前面和后面的接头),注意其接头为6列5行的方形连接头,如果旋转90度或连接错误,将造成电源线和数据线接错,烧毁相应设备。1.4 如何将CC16更换为CC32【产品名称】:Wavestar ADM16/1【分类】: 操作技巧描述:在某些情况下,需将Wavestar ADM16/1的CC16更换成CC32。操作步骤:1、更换CC盘的次序必须先换CC2然后再换CC1盘;2、更换时可以直接将槽道设为新盘的型号;如果先换CC1后换CC2的话,在将槽道设

10、置成新盘型号时,系统将会报错而无法成功。1.5 在MSSpring环中拔纤影响业务【产品名称】:Wavestar ADM16/1【分类】: 故障排除故障现象:在MSSpring环中做插拔纤时部分2M电路中断,表面上看似乎是MSSpring的保护机制未被激活。故障分析及处理:1、首先检查各站的收发光功率,结果正常。2、在MSSpring环上A、B方向分别做人工倒换,结果正常,并未发生影响业务的情况。3、在上次发生业务中断的站做拔纤试验,倒换成功,业务未受影响。我们怀疑在重新插上尾纤时,由于尾纤尚未完全插好,处于不稳定状态;这时电路已倒回至工作时隙,因此电路受到影响。结论及建议:在插拔尾纤前,需先

11、将电路强制倒换至另外的方向;待确认尾纤已经插好后,再将倒换清除,这样可以避免类似的影响业务的情况发生。1.6 PT1盘失效告警【产品名称】:Wavestar ADM16/1【分类】: 故障排除故障现象:某一Wavestar ADM16/1 框PT1板红灯常亮, 网管显示有“PT1 equipment failure”告警故障分析及处理:该故障既可能是PT盘自身的故障,也可能是其它盘的故障导致;因为PT板是ADM16/1的核心组件,它向框内其它各盘提供时钟及电源。1、替换PT1槽道的盘,故障不消失。2、依次拔出或更换其他槽道的盘,故障依旧。3、检查母板PT1槽道的针脚,正常;检查底板其它槽道的针

12、脚,发现LS2槽道有一个针脚歪斜。4、校正歪斜的针脚,故障清除。结论及建议:对于Wavestar ADM16/1设备SC、PT、CC是其核心组件,该三块盘与其它盘均有相互联系。当发生硬件故障,替换故障盘后不能解决问题,则完全有可能是“故障”盘与核心盘之间的“连接”导致的问题,此时应从其它盘入手解决问题。2. Wavestar ADM4/12.1 如何设置ADM4/1的跟踪字节【产品名称】:ADM4/1【分类】:操作技巧描述: 由于LCS-CIT的菜单比较复杂繁琐,用户经常无法找到设置跟踪字节如J0,J1和J2 的界面。操作步骤:以下是设置跟踪字节的操作步骤:1. 用LCS-CIT登录网元2.

13、等待电脑上数据库与网元同步完毕后。选择transmissionconfigure 菜单,在弹出的对话框选择OK按钮。CIT将弹出一个包含ADM4/1子架的图形界面。更改J0:3. 在图形界面中点亮STM1群路盘4. 单击子框图形界面下STM1按钮5. 在弹出的对话框中点击Modify按钮用户将能够看到更改J0字节的界面更改 J1:1. 同上述第三步, 在图形界面中点亮STM1群路盘2. 单击子框图形界面下VC4按钮3. 在弹出的对话框中点击Modify按钮4. 用户将能够看到更改J1字节的界面更改J2:1. 在图形界面中点亮2M支路盘2. 在下面图片中点亮你想要更改J2字节的2M端口图标3.

14、单击所有2M图标右面的图标4. 在弹出的对话框中点击Modify按钮5. 用户将能够看到更改J2字节的界面2.2 ADM4/1的电源需求【产品名称】:ADM4/1【分类】:故障排除故障现象:某站点出现市电断电后,当备用电池用完,设备进入断电状态。当市电恢复后,发现ADM 4/1设备业务不能恢复;要重新插拔所有的盘后才能恢复业务。故障分析及处理:ADM4/1的电源模块没有象ADM16/1一样的电源稳压保护功能。当电源断电恢复时,一定要一个非常稳定的48伏电压供电才能让ADM 4/1设备正常启动。在断电的站点上市电恢复时同时向整个机房的设备供电,因此电源输出有可能不满足ADM 4/1设备的电源供电

15、要求。结论及建议:在实际应用过程中可以在ADM4/1设备和电源头柜之间加一个稳压开关,在电源恢复到稳定的48伏以后再向ADM4/1设备输出电流,以保证设备能够正常启动。2.3 关于ADM4/1的通道跟踪字节的匹配问题【产品名称】:ADM4/1【分类】:故障排除故障现象:客户报告ADM4/1设备上的业务中断,ADM4/1的STM1有“AU4AIS”告警,与之相连的ADM16/1设备的155M口无告警。故障分析及处理:一般来说发现业务不通,先检查是否有丢光及LOS告警(本故障现象无);再检查是否有电路不完整的地方;而后检查是否因为开销字节不匹配导致。缺省状态下,ADM4/1及ADM16/1都不检测

16、STM1的J0字节,当ADM4/1打开对J0的检测,而ADM16/1不检测时,发生ADM4/1有告警而ADM16/1无相关告警,业务中断。故障处理过程:1、检查ADM16/1及ADM4/1的交叉连接数据,完整无缺;2、检查ADM4/1设备无设备硬件告警;3、登录ADM4/1设备,关闭检测STM-1的J0跟踪字节,业务恢复。结论及建议:注意开销字节的运用, 特别是通道跟踪字节的匹配问题(尤其是不同设备类型之间, 不同厂家的设备之间互通时)2.4 关于ADM4/1的告警灯问题【产品名称】:ADM4/1【分类】:故障排除故障现象:当设备有告警时,ADM4/1的主控板告警灯不指示,架顶告警灯也不亮。

17、故障分析及处理:对于ADM4/1设备,告警灯的指示是SUPV+SVE板控制。当告警灯显示不正常时,应考虑是否因为告警设置、硬件故障或者是其它条件不满足。对于ADM4/1设备,它需要输入负48V的告警电压,这样主控盘才能驱动面板告警灯及架顶告警灯。故障处理过程:1、检查ADM4/1的告警信息,没有设备故障提示。2、测量架顶向ADM4/1输入的告警电压,结果无电压。3、重新做告警线,故障排除。结论及建议:对于ADM16/1设备,不需专门的告警电压来驱动主控板既架顶的告警指示灯。但ADM4/1和ISM2000均需要。3. DACS VI20003.1 Lucent DACS VI2000与某厂家的S

18、MA16c+互联互通【产品名称】:DACS VI2000【产品版本】:R2.1.3【分类】:故障排除故障现象:DACS VI-2000和某厂家的SMA16c+通过STM1互联后,DACS VI2000报HPcPTI告警,该厂家SMA16c+报HP FERF告警。故障分析及处理:该厂家SMA16c+只支持一种Path Trace ID Mode,即由15 Byte J1和1 Byte CRC构成。DACS VI-2000默认为16 Byte J1。结论及建议:由于两套设备的Path Trace ID Mismatch不同导致该问题,可以通过修改DACS VI2000的J1字节格式,以配合其他厂家

19、的设置。3.3 MO磁光盘无法备份【产品名称】:DACS VI2000【分类】:故障排除故障现象:两端DACS6设备无法进行备份,并且原备份磁光盘可能被破坏,系统处于危险状态。控制框进行倒换,并更换了备份磁光盘,但问题并未解决。检查系统告警,未发现异常情况。怀疑问题与硬件有关。故障分析及处理:在对第一端系统进行MC重启时,发现系统硬件检测过程中出现非致命错误:磁光驱无法读写数据。怀疑磁光驱损坏引起故障。对磁光驱进行了更换,故障排除,备份功能恢复正常。在对第二端系统进行排障时,发现也是由于磁光驱损坏引起。更换磁光驱后,备份正常。结论及建议:此次二个站的所有4个磁光驱同时损坏,情况极为罕见。经分析

20、,认为 原因可能有以下两点:1。机房防尘条件不好。在换盘过程中,我们发现机盘上积有很多灰尘。由于磁光头比较娇嫩,长期工作在这种条件下严重影响光驱寿命。2。所用备份磁光盘质量不好。原来所用光盘非专用备份盘,并且已经使用34年,其中不少已损坏,遇到这种光盘时光驱会频繁尝试读取,加速光头老化。解决方案(Solution):鉴于以上原因,建议:改善机房防尘条件,定期对机房设备进行清洁。定购专用备份磁光盘,且如果备份频繁的话,应每隔一年左右更换一次。 轮流使用两张备份磁光盘做备份,每次完成后注明备份时间。如果某次备份失败,千万不要再用另一张备份盘尝试,以确保至少有一份完好备份可用。 备份完成后应及时将光

21、盘取出,并存放在干燥、防尘处。4. WaveStar DACS4/4/14.1 电源问题引起设备重启【产品名称】:WaveStar DACS4/4/1【分类】:故障排除故障现象:某本地网三端WaveStarDACS4/4/1曾因电源问题先后发生了业务中断的事故。A局 WaveStarDACS4/4/1故障情况如下:该日电信工程人员在此机房施工新增 10G设备(与DACS不在同列),无意中造成此列电源头柜正负极短路,影响到整个机房的供电,包括其他如SLM,ISM,155C等设备,都瞬时发生业务中断,在恢复供电后立刻恢复业务.但WaveStar DACS4/4/1 断电后再恢复供电,系统软件需重新

22、启动,只有启动成功后才能恢复业务.但当时,WaveStar DACS4/4/1在一段时间后仅MC主控框和MS同步框启动成功,但PORT端口框没有启动成功,导致业务不能恢复,后经电信维护人员将PORT框的所有机盘插拔后才恢复业务. B局情况A局类似, 而C局则是施工时影响到机房保护地以致WaveStarDACS4/4/1因瞬时断电而重新启动,但该次系统重启成功,使业务在短时间内得以恢复.故障分析及处理:经过分析后,我们认为系统断电造成故障的根本原因.具体如下:1. DACS4/4/1的工作电压范围在-40.5V至-57V之间,当机房电源因短路等原因 出现瞬间电压降,导致电压低于或超出DACS4/

23、4/1所需工作电压范围之外,DACS4/4/1所有机架,包括MC主控架,MS同步架及PORT端口架都会断电并在恢复供电后进行重启,必然会中断业务一段时间。2. 由于DACS4/4/1的核心平台由UNIX语言编译,所以整套设备重启所需的时间较一般的设备长,另外DACS4/4/1作为业务枢纽的重要设备,其本身的设备配置也很复杂,一般设备如ISM,SLM和155C等的控制部分都由一块机盘承担,再统一由ITM-SC控制而DACS4/4/1的控制部分就是一个包括近十块盘的机 框构成,其功能类似于ITM-SC.这也从另一方面延长了DACS4/4/1的重启时间。3. DACS4/4/1的UNIX系统平台的关

24、机程序需要用特定操作步骤,和朗讯的ITM-SC,NMS网管一样,在硬关机的情况下并不能保证100%的重启成功,因为在断电时,系统可能正在对某些文件进行操作,突然断电使其无法正常退出.从实际情况看,A局重启没有成功,而C局却在10分钟之内重启成功了. 此外,朗讯建议在重启失败的情况下,先BOOT主控框,然后插拔同步框的SRC盘,使之重起,最后插拔PORT框的SRC,没有必要插拔PORT框中的所有机盘. 再从CIT观察每块盘的状态,待机盘状态从Initial转为Equip后, 即告重启完毕.4. 在一般情况下,当某个机架发生电源问题时,此机架中的SRC会将电告警上传至主控框,再由主控框报告给网管,

25、但这三次故障由于是MC,MS和PORT框同时断电,告警无法在无电源的情况下储存下来,因此事后在网管中没有相应的纪录.结论及建议:DACS4/4/1作为传输网络中的承载大量业务的重要设备,一般无特殊原因,不能轻易断电,因为这样的后果有可能是大面积的业务阻塞.而且UNIX的系统平台也并不能保证每次都能重启成功.即使重启成功也需一定时间,故必会影响业务时间较长.同时频繁断电不仅对DACS4/4/1,且对其它设备如ISM,SLM等造成不良影响.希望有关施工与维护人员予以关注.4.2 MSU故障的处理【产品名称】:WaveStar DACS4/4/1【分类】:故障排除故障现象:某日一用户申告MC框断电,

26、上电后重启失败。MC框里所有机盘红灯常亮。故障分析及处理:将CIT线接入设备MC-1口,打开软件Hyper Terminal。重启设备,观察进程。发现设备重启时,自检到MPU和MSU的接口时出错。更换了MSU后,安装软件,并倒入数据库。启动设备。故障排除。结论及建议:WaveStar DACS4/4/1设备有两种接入方式,一种是安装了相关版本CIT后,通过网线接入LAN口;该接入法一般用来察看故障和做配置。另一种是通过CIT线接入设备MC-1口,用Hyper Terminal平台进行操作;该接入法一般用来安装软件。5. SLM-2000, ISM-20005.1 ISM环网由于站时钟问题影响业

27、务【产品名称】:ISM-2000【分类】: 故障排除故障现象:某用户反映一个ISM环从某一厂家的设备引入站时钟信号后, 整个环的业务在经过若干天后会突然中断.【故障分析及处理】:首先用频率计对该厂家的设备输出的站时钟信号进行测试,信号正常。 然后检查了整个网络的同步设置, 设置均正确。但是一旦断开站时钟, 整个网络工作正常.经过现场测试调查,查明原因是由于从某一厂家的设备引入ISM设备的站时钟线不符合要求所致。我们发现现场所做的时钟线采用的是50欧姆阻抗的线材;焊接的9针接头的管脚为:信号线接管脚2,地线接管脚7。同时,我们和机房人员查阅了该工程的设计文件,发现设计上也是如此。 但是依据朗讯现

28、场提供的安装手册,ISM设备站时钟的接线应该是:采用75欧姆阻抗的线材;焊接的9针接头的管脚为:信号线接管脚2,地线接管脚6。由于接地不正确, 因此时钟信号会出现漂移, 等累计到一定限度, 整个网络的业务就会受到影响.查实后,机房人员重新制作了时钟线,再从某一厂家的设备中引2路站时钟信号进入到ISM设备。经过长时间观察,没有任何问题出现。5.3 ISM2000环网由于减少节点引起SNC保护失效【产品名称】:ISM-2000【分类】:故障排除故障现象:原先六个节点的ISM2000环,在拆除掉2个节点后,在测试SNC保护时发现保护失效。故障分析及处理:检查配置数据,发现SNC保护路由配置正常,而且

29、在原未拆除节点时SNC保护是正常的。检查整个环上所有告警,发现拆除节点两端的节点均有VC4通道跟踪标识不匹配告警(VC4 path trace identifier mismatch)。检查有告警的各个VC4通道跟踪设置,发现相邻两个节点的VC4通道跟踪设置不一致,其中一个为Enable,而另一个为Disable。结论和建议:将各个有告警的VC4通道跟踪设置均改为Disable;经过测试,SNC保护已恢复正常。5.4 网管显示Racktop Fuse failure告警【产品名称】:SLM-2000【分类】 : 故障排除故障现象:网管ITM-SC显示Racktop Fuse failure告警

30、故障分析及处理:1. 检查Fuse是否真的损坏2. 检查设备至架顶告警线,发现告警线芯断开, 引起Fuse failure告警.结论和建议:出现Racktop Fuse failure告警时不一定保险丝损坏, 告警线问题也会导致这一告警。5.7 unknow node name 告警的处理【产品名称】:SLM-2000【分类】 : 故障排除故障现象:在一个SLM-2000设备的环内,去掉一个站点的SLM-2000设备,然后重新组成一个环;这时在ITM-SC网管上,看到在这个环内,有部分SLM-2000设备产生unknow node name 告警。对这些产生告警的设备进行reset,但告警仍旧存在。故障分析及处理:必须对在环内的所有SLM-2000设备做reset;Reset开始后,在ITMSC上这些节点将变灰;Reset结束后,它们将重新与ITM-SC网管取得联系,选择对这个环上的所有SLM-2000设备做MIB upload。这时,我们将看到所有的unknow

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论