基站隐性故障排除指导书_第1页
基站隐性故障排除指导书_第2页
基站隐性故障排除指导书_第3页
基站隐性故障排除指导书_第4页
基站隐性故障排除指导书_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 基站隐性故障排除 目目 录录 1基站隐性故障处理的一般方法及案例分析基站隐性故障处理的一般方法及案例分析.3 1.1发现问题的方法 .3 1.2基站故障的分类 .4 1.3基站隐性故障处理的一般方法.5 1.3.1看基站当前的状态及告警.5 1.3.2检查基站传输的状态.14 1.3.3检查基站的数据定义.19 1.3.4检查并分析error log.20 1.3.5对基站进行检查.23 1.3.6使用仪表设备对基站进行检测.41 2一点建议一点建议 .43 1基站隐性故障处理的一般方法及案例分析基站隐性故障处理的一般方法及案例分析 所谓基站的隐性故障是指那些没有明显的告警但对基站的性能有影

2、响的故障,或者是那些 反复出现后又往往能自行消失的告警。这些告警的存在将使得系统的性能指标受到影响。 由于这些问题的隐蔽性,往往无法直接发现它们,因此我们需要借助其他方法才能发现这 些潜在的故障。 1.1发现问题的方法发现问题的方法 话务统计话务统计 话务统计提供了各种指标去衡量系统服务的好坏。基站的很多故障都会反映到话务统计 的某项指标上来。常用的指标有信道完好率,掉话,切换,无线接入性等。如果基站存 在问题,则有可能影响到其中一项或者几项指标。因此如果这些指标的变化,特别是在 没做任何参数修改的情况下发生了变化,我们应该考虑基站硬件的因素。 路测路测 路测能够最直接的反映系统真实运行情况和

3、最终用户的感知。因此对路测文件的分析也 往往能帮助我们发现问题。 bsc 中基站的历史告警记录中基站的历史告警记录 有些告警产生了之后能够自行恢复,因此当打印网络中现存的故障的时候不一定能发现 这些故障。但是它们往往会在 bsc 的历史告警记录中留下痕迹。通过分析这些记录,能 够帮助发现一些基站潜在的问题。 用户投诉用户投诉 用户的投诉可能会是由基站的硬件引起,如基站的发射功率不稳定导致用户手机信号不 稳。对投诉信息加以提炼和分析,能帮助我们发现存在问题的区域。 在下面的案例分析中我们可以看到这几种发现问题的方法的具体应用。 1.2基站故障的分类基站故障的分类 就基站的故障对系统指标的影响而言

4、,我们可以将它们分为话务敏感型故障和非话务敏感 型故障。象天馈线驻波比过高的告警,能够直接影响下行信号的输出强度,影响通话质量, 属于话务敏感型故障。而象风扇告警这类故障,不会对话务产生直接的影响,属于非话务 敏感型故障。但这类故障往往会间接的影响到系统的性能,更具隐蔽性,所以同样不能忽 视它们。 从基站对信号的处理流程来看,我们又可以将基站的故障分为两大类。一类是对基带信号 处理时产生的告警。另一类是发生在射频信号处理时的故障。基站中处理基带信号的硬件 有 dxu 和 tru 中的部分功能模块,dxu 中包括 cf,tf,is,con,dp 等功能模块。 tru 中处理基带信号的功能模块是

5、trxc。基站中对射频信号的处理主要是由 tru,cdu 和天馈线来完成的。tru 内部是由 tx 和 rx 两个功能模块来完成对基带信号 的调制和解调功能的。 分清楚告警的类型有助于我们分析问题,不至于产生方向性的错误。 1.3基站隐性故障处理的一般方法基站隐性故障处理的一般方法 当我们发现某个基站可能存在问题时,我们一般从以下几个方面着手来处理。 1.3.1看基站当前的状态及告警看基站当前的状态及告警 常用的命令如下: rxtcp:moty=rxotg,cell=4001a;从小区名找到相连的 tg 号。 rxcdp:mo=rxotg-69;检查 tg 下面的 mo 的配置情况。 rxms

6、p:mo=rxocf-69;检查 mo 的状态。关于 mo 状态的含义见下面详细说明。 rxasp:mo=rxotg-69;检查 tg 下面的 mo 是否有告警。 rxmfp:mo=rxotrx-69-0;检查有故障的 mo 的告警代码。再根据告警代码查找相应 解释。 rlcrp:cell=4001a;检查小区的资源使用情况。如是否有人占用小区,小区的时隙是 否有 blocked 的,小区是否存在上行干扰等。 rlslp:cell=4001a;检查小区信道使用的情况。 通过以上命令,我们可以大致知道一个基站当前的工作状态。 关于 mo 状态的详细说明。 熟练掌握这些 mo 状态的含义对我们分析

7、网络中存在的隐性问题很有帮助。因为很多基站 问题并没有明确的告警指示,而是通过 mo 状态的变化反映出问题的存在的。 rxmsp:mo=rxotrx-3-4; radio x-ceiver administration managed object status mo state blstate blo bla lmo bts conf rxotrx-3-4 noop blo 0040 000a res globle state:从 bsc 的角度来看的 mo 的状态。globle state 有以下几种状态: globle state block state block reason bts

8、 state def:mo 在 bsc 中被定义。 com:mo 已经和 bsc 建立起通讯。 preop:这是 mo 由 com 到 oper 的一个过渡状态。 oper:mo 处于正常工作状态。 noop:mo 暂时处于非工作状态。 fail:mo 永久性地处于非工作状态。 block state:表明 mo 是由于何种原因处于 block 的状态的。block state 有以 下几种状态: mbl:人工将 mo 闭掉的。 blo:mo 自动被闭掉的。如 mo 产生错误,或者 oml link 断了等等。 bla:由于需要对 mo 进行操作而进入 block 的状态。 bll:mo 在下

9、载软件时的状态。 blt:mo 由于测试而进入的 block 状态。 block reason:通过代码解释 block 的原因。 值得注意的是 lmo 代码,其含义是指从 traffic 的角度来看,mo 已经不能承载话务了, 虽然从 o radio x-ceiver administration managed object configuration data mo result arfcn mismatch rxorx-109-0 config hop none rxorx-109-1 config hop none rxorx-109-2 config hop none rxorx-

10、109-3 config hop none rxorx-109-4 config hop none rxorx-109-5 config hop none mo result arfcn txad tn bpc chcomb offs xra icm rxots-109-0-5 config hop hop 1 2398 tch 0 no on rxots-109-0-6 config hop hop 0 2395 tch 0 no on rxots-109-0-7 config hop hop 2 2290 tch 0 no on rxots-109-1-0 config hop hop 7

11、 2423 tch 0 no on rxots-109-1-1 config hop hop 6 2419 tch 0 no on rxots-109-1-2 config hop hop 5 2415 tch 0 no on rxots-109-1-3 config hop hop 4 2411 tch 0 no on rxots-109-1-4 config hop hop 3 2407 tch 0 no on rxots-109-1-5 config hop hop 1 2399 tch 0 no on rxots-109-1-6 config hop hop 0 2396 tch 0

12、no on rxots-109-1-7 config hop hop 2 2291 tch 0 no on rxots-109-2-0 config hop hop 2 2405 sdcch8 0 no on rxots-109-2-1 config hop hop 7 2424 tch 0 no on rxots-109-2-2 config hop hop 6 2420 tch 0 no on rxots-109-2-3 config hop hop 5 2416 tch 0 no on rxots-109-2-4 config hop hop 4 2412 tch 0 no on rxo

13、ts-109-2-5 config hop hop 3 2408 tch 0 no on rxots-109-2-6 config hop hop 1 2400 tch 0 no on mo result arfcn txad bspwr c0f mismatch rxotx-109-0 config 22 0 41 yes none rxotx-109-1 config 2 1 41 no none rxotx-109-2 config 69 2 41 no none rxotx-109-3 config 81 3 41 no none rxotx-109-4 config 1000 4 4

14、1 no none rxotx-109-5 config 1018 5 41 no none end 但用 rlcrp 查看发现 4001a 小区上总有部分时隙受到干扰。 rlcrp:cell=4001a; cell resources cell bcch cbch sdcch nooftch zhewja1 1 0 32 43- 86 chgr bpc channel chrate spv state icmband chband 64k 0 2425 tch-4742 fr 1,2 idle 1 p900 none tch-17729 hr 1 idle 1 p900 tch-17728

15、hr 1 idle 1 p900 2424 tch-4741 fr 1,2 idle 1 p900 none tch-17727 hr 1 idle 1 p900 tch-17726 hr 1 idle 1 p900 2423 tch-4740 fr 1,2 idle 4 p900 none tch-17725 hr 1 idle 4 p900 tch-17724 hr 1 idle 4 p900 2422 tch-4739 fr 1,2 idle 1 p900 none tch-17723 hr 1 idle 1 p900 tch-17722 hr 1 idle 1 p900 . 2396

16、tch-4717 fr 1,2 idle 4 p900 none tch-17679 hr 1 idle 4 p900 tch-17678 hr 1 idle 4 p900 . 2399 tch-4720 fr 1,2 idle 4 p900 none tch-17685 hr 1 idle 4 p900 tch-17684 hr 1 idle 4 p900 2400 tch-4721 fr 1,2 idle 1 p900 none tch-17687 hr 1 idle 1 p900 tch-17686 hr 1 idle 1 p900 2406 tch-4723 fr 1,2 busy 1

17、 p900 none tch-17691 hr 1 lock 1 p900 tch-17690 hr 1 lock 1 p900 2407 tch-4724 fr 1,2 idle 4 p900 none tch-17693 hr 1 idle 4 p900 tch-17692 hr 1 idle 4 p900 2408 tch-4725 fr 1,2 idle 1 p900 none tch-17695 hr 1 idle 1 p900 tch-17694 hr 1 idle 1 p900 end 不难发现,受干扰的时隙都集中对应为同一个 trx 所控制的时隙。具体方法如下: 1rlcrp

18、的打印列表中 bpc 为 2423 的时隙的 icm=4。 2在 rxcdp 的打印列表中 bpc 为 2423 所对应的时隙为:rxots-109-1- 0。 3用类似的方法将所有的受干扰的时隙找出来,可以发现它们都是 trx-109- 1 所控制的时隙。 将跳频关掉,情况更明显。所有受干扰的时隙仍然都集中在 tru1 上。 rlcrp:cell=4001a; cell resources cell bcch cbch sdcch nooftch zhewja1 1 0 32 43- 86 chgr bpc channel chrate spv state icmband chband 64

19、k . 1 2770 tch-1452 fr 1,2 idle 4 e900 none tch-11673 hr 1 idle 4 e900 tch-11672 hr 1 idle 4 e900 2773 tch-1453 fr 1,2 idle 5 e900 none tch-11675 hr 1 idle 5 e900 tch-11674 hr 1 idle 5 e900 2776 tch-1479 fr 1,2 idle 4 e900 none tch-11679 hr 1 idle 4 e900 tch-11678 hr 1 idle 4 e900 2774 tch-1478 fr 1

20、,2 idle 4 e900 none tch-11677 hr 1 idle 4 e900 tch-11676 hr 1 idle 4 e900 2779 tch-1480 fr 1,2 idle 4 e900 none tch-11681 hr 1 idle 4 e900 tch-11680 hr 1 idle 4 e900 2780 tch-1481 fr 1,2 idle 4 e900 none tch-11683 hr 1 idle 3 e900 tch-11682 hr 1 idle 4 e900 2782 tch-1482 fr 1,2 idle 4 e900 none tch-

21、11685 hr 1 idle 3 e900 tch-11684 hr 1 idle 4 e900 2783 tch-1483 fr 1,2 idle 4 e900 none tch-11687 hr 1 idle 4 e900 tch-11686 hr 1 idle 4 e900 end 该载频使用的是 1000 号频点,用 fas 查看,其受干扰的情况和其它频点差不多。不应该 单单这个频点产生这么高的上行干扰。但为了保险起见,还是通过 fas 选择了一个更好的 频点 1021 号频点。但发现该载频上的干扰仍然很强。 于是将该载频所对应的时隙全部闭掉。rxbli:mo=rxots-109-1

22、-0 此时用 rlcrp 观察,发现干扰基本消失了。 resetting isl channel. islresetcnt=10 (since last dxu reset) 03-10-14 20:38:37.482 oms_so_main so.c:19798 traceh:sap disconnected 03-10-14 20:38:37.492 oms_hwu hwu.c:33071 fault: lb:0, raise i2a missing ru tru 1 03-10-14 20:38:37.670 oms_hwu hwu.c:33071 fault: lb:0, raise

23、i2a missing ru tru 2 03-10-14 20:38:37.772 oms_hwu hwu.c:33071 fault: lb:0, raise i2a missing ru tru 3 03-10-14 20:38:37.852 oms_hwu hwu.c:33071 fault: lb:0, raise i2a missing ru ecu 0 dtqup:dip=rblt28; dip t1 t2 slip slip2 uas uasr uav1 uasb1 uav2 uasb2 rblt28 12 9 0 0 0 0 0 0 0 0 section esv sesv

24、dmv esvr sesvr dmvr sfv sfti 0 0 0 0 0 24 section es2v ses2v dm2v es2vr ses2vr dm2vr smi 0 0 0 0 0 end 在四个 tru 中都读到如下记录。 在 ecu 中读到如下记录。 03-10-14 20:38:37.332 pls_hx_int0 hx_int.c:3494 traceh:isl protocol error 03-10-14 20:38:37.576 pls_hx_main hx_main.c:376 traceh:dxu lost activate command in state

25、connected 03-10-14 20:38:37.588 pls_hx_main mps_temp.c:185 traceh:trlr091s (pls-tru/r8 cxc1121202_1.r8_12), start cause: dxu_lost, appl. type: 1 90-01-01 00:00:00.034 noname debug_main.c:2492 traceh:no restart info 03-10-14 20:38:37.366 pls_hx_int0 hx_int.c:3494 traceh:isl protocol error 03-10-14 20

26、:38:37.580 pls_hx_main hx_main.c:376 traceh:dxu lost activate command in state connected 03-10-14 20:38:37.594 pls_hx_main mps_temp.c:185 traceh:eclr091s (pls-ecu/r8 cxc1121202_1.r8_12), start cause: dxu_lost, appl. type: 1 90-01-01 00:00:00.046 noname debug_main.c:2492 traceh:no restart info 可以看出四个

27、 tru 和 ecu 都检测到 isl protocol error 的错误,触发重启动的条 件都是 dxu_lost。当 dxu 检测到和 tru,ecu 失去联系后,发出 resetting isl channel 的命令。 我们可以看出从上次 dxu 重启以来 isl channel 共重启了 10 次(islresetcnt=10)。 关于关于 isl 的简介。的简介。 isl(internal signaling link)是一种点对多点的信令协议,用于 dxu 和 tru 及 ecu 之 间的通讯。例如在基站启动时传递 idb 配置参数,各子系统之间的通信都要用到 isl。读 取

28、ecu 和 tru 的 log 文件也是通过 isl 进行的。 isl 和 lapd 信令一起在 local bus 上传递。local bus 是基站内部用于在 dxu 和 tru,ecu 之间传递语音及信令的一条串行总线,其带宽为 2.048mbit/s,也分为 32 个时 隙。isl 占用 tso-ts2 时隙,lapd 信令占用 ts3ts8 时隙,ts15-ts26 则分配给 tch(每个 tru 占用两个时隙)。 其逻辑结构如图所示。 isl lapd tch 在 dxu 中 isl 是由 concentrator hw 来处理,在 tru 中则是由 pls(platform su

29、bsystem)子系统来实现的。如图所示。 话音和信令通过 local bus 传到 tru,在 tru 内部 isl 和 lapd(oml 和 rsl)是由 cpu 来处理的。而话音数据则是由 tora 模块来处理。 因此从物理上来看,和 isl 相关的硬件有 dxu,背板连线及插座,tru 和 ecu。任何相 关的部分出现错误都有可能引起 isl protocol error 的告警。 鉴于所有的 tru 及 ecu 上都检测到该错误,我们首先怀疑是 dxu 中处理 isl 的功能模 块出现问题。于是我们将 1 小区的 dxu 和 3 小区的 dxu 进行互换,然后观察是否还有自 动重启的

30、现象。 到目前为止,1 小区和 3 小区都没有观察到 tru/ecu 有自动重启的记录。 这说明原 1 小区的 isl protocol error 的告警应该是由该小区的 dxu 和背板插座之 间接触不良造成的。 1.3.5.4 使用使用 omt 对基站的性能进行监测对基站的性能进行监测 基站对一些重要的性能提供了实时监测功能,如发射功率,反射功率,驻波比等。通过对 这些数据的监测,我们可以知道基站目前的工作是否正常。 对tru和cdu的输出功率进行监测 可以监测的项目有 tru 的前向功率和反向功率,cdu 的前向功率和反向功率,天馈线的 驻波比。注意:只有发射共用或单发射天线才能监测出它

31、的驻波比,单接收天线是不能用 这种方法来监测其驻波比的。 对基站的同步性能进行监测 读取完基站的 idb 后在 mo 所指的页面上,选中 tf 图标,然后单击鼠标右键,选择 monitor,可以看到有些选项,其中比较重要的是:phase diff error pcm a,tu internal state 和 vco control value 等项目。 phase diff error pcm a 用来检测基站内部时钟源和外部时钟源之间的相位差。正 常情况下测量值应该是在 0 附近波动。如果测量值的绝对值很大并且保持恒定则有可能是 dxu 内部时钟源有问题产生了漂移,但还在可控制的范围内。如

32、果测量值波动太大则有可 能由于传输信号不稳定造成的。 tu internal state 表示基站的内部时钟源的同步状态,它有几种取值,0 表示正在建 立同步,1 表示已经建立同步,2 表示基站是处于 hold over 状态,也就是用基站自己 的时钟源。 vco control value 这个测量值反映了对基站内部 vco 电路调控的情况。正常的范 围是 273-16111,超出这个范围将产生告警。 案例分析:驻波比高引起的手机接收信号不稳的案例。 故障现象:小区所覆盖的范围内进行路测时发现手机接收信号有时很强,有时很弱,变化 很大。 故障分析: 在分析该基站的 error log 时发现该小区时不时的出现驻波比过高的告警。 驻波比是一个反映天馈线对无线信号藕合程度的指标。驻波比比值越接近 1,表明天馈系 统的藕合程度越高,也就有越多的无线信号发射到空中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论