LTE故障排查与日常问题处理_第1页
LTE故障排查与日常问题处理_第2页
LTE故障排查与日常问题处理_第3页
LTE故障排查与日常问题处理_第4页
LTE故障排查与日常问题处理_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LTE故障排查与日常问题处理第一页,共34页。目录LTE故障排查流程和故障处理方法常用故障分析思路业务类故障处理设备类故障处理第二页,共34页。故障排查流程LTE故障排查流程序号步骤说明1备份数据需备份的数据包括数据库、告警信息、日志文件等。2故障信息收集故障信息是故障处理的重要依据,任何一个故障的处理过程都是从维护人员获得故障信息开始,维护人员应尽量收集需要的故障信息。3确定故障范围和类别根据故障现象,确定故障的范围和种类。4定位故障原因根据故障现象,结合故障信息,从众多可能原因中找出故障原因。5排除故障确定故障原因后,采取适当的措施或步骤排除故障。6确认故障是否排除在执行故障排除步骤后,还需要验证故障是否已被排除。如果故障已排除,故障处理结束;如果故障未排除,返回到确定是否可以判断为另一个故障范围和类别。7联系华为技术支持如果无法确定故障的范围和种类,或者无法排除故障,请联系华为技术支持。第三页,共34页。故障处理方法LTE故障处理方法第四页,共34页。目录LTE故障排查流程和故障处理方法常用故障分析思路业务类故障处理设备类故障处理第五页,共34页。故障分析思路常用故障分析思路第六页,共34页。目录LTE故障排查流程和故障处理方法常用故障分析思路业务类故障处理设备类故障处理第七页,共34页。接入类故障接入类常见故障处理类别常见问题现象问题原因常规场景接入问题某市已开站点测试发现,终端拨号软件显示没有信号,但是从Probe连接终端查看无线参数可以看到PCI、RSRP、SINR值。终端显示无信号MME配置错误,导致Nas拒绝。某站点在开站完成后进行单站验证时发现UE无法接入。S1-U故障,SGW的IPPATH不可用。某市一个站点在10号出现VIP用户接入失败,失败原因是没有可用的无线资源。PCRF流量策略变更导致释放。某市反馈新开站无法接入。HSS开户问题,OPC设置错误。某地市A站点无法接入。eNodeB加密和完整性保护设置错误。特殊场景接入问题某市修改PLMN后,部分终端无法接入参数整改时将移动网络码由46005改为了46003,部分终端插的UIM卡为46005,并且终端设置成为禁止漫游,所以无法接入,将终端设置允许漫游后问题解决。现阶段未规模放号,问题主要为单用户类故障,网络KPI中的接入类问题不在这里讨论。由上表可以看到,接入过程涉及几乎LTE所有网元,每个网元都可能出现接入失败的问题。因此,快速掌握该阶段的问题定位能力,尽快进入网络运维阶段,是本次接入类问题交流的重点:首先掌握LTE接入的基本流程。掌握快速找到问题的方法。第八页,共34页。接入类故障接入流程总体介绍-Attach流程终端开机后,首先选择合适小区驻留,然后发起Attach流程。RRC建立原因值为:Mo-SignalingAttach流程可以分为四个步骤:随机接入RRC连接建立鉴权等NAS过程E-RAB建立在Attach时数据卡终端通常只建立一个默认承载,支持VOIP的LG终端以及有些智能终端如HTC往往同时还建立专有承载。第九页,共34页。接入类故障接入流程总体介绍-ServiceRequest流程RRC建立原因值分为:Mo-data:上行有数据需要发送Mt-Access:响应寻呼ServiceRequest流程可以分为三个步骤:随机接入RRC连接建立E-RAB建立因为核心网侧已有终端的注册信息和能力信息,ServiceRequest流程通常不需要进行鉴权和UE能力查询。

用户Attach之后,如果UE回到Idle模式,再发起业务时使用ServiceRequest流程。

第十页,共34页。接入类故障信令跟踪快速找出接入失败原因1.善于利用释放消息中的Cause找原因2.信令对比快速查找异常点第十一页,共34页。互操作类故障CL互操作常见故障4G信令4G业务3G信令3G业务优化切换新增eAN无会话时需进行鉴权(可选)切换时延终端需要支持CL双模能力,即支持LTE业务和eHRPD业务。单卡单号双IMSI,需要在3G和4G同时开户。终端优选LTE网络驻留,移动过程中,根据网络信号情况选择覆盖更好的网络。eHRPD接入时,基于PDN连接采集计费信息。HSGW生成基于PDN级的时长和流量信息的HSGW-CDR;PGW基于PDN连接生成离线计费PGW-CDR,或与OCS进行在线计费。实现eHRPD和LTE网络之间的切换,关键技术在于切换前后P-GW保持不变:eHRPD接入,P-GW支持与3GPPAAA/HSS之间的S6b接口,将用户当前PDN连接的P-GWID(P-GWIP或者PGWFQDN)和APN等信息更新到3GPPAAA/HSS,用于切换到LTE网络后,MME从HSS得到源PGWID,向源PGW发起会话建立。LTE接入,MME支持与HSS之间的S6a接口,将用户当前PDN连接的P-GWID(P-GWIP或者PGWFQDN)和APN等信息更新到HSS,用于切换到eHRPD网络后,HSGW从3GPPAAA/HSS得到源PGWID,向源PGW发起会话建立。第十二页,共34页。互操作类故障CL互操作时延问题处理要点从信令上看切换中最耗时的过程为:信号搜索。信号搜索的关键在:目标小区的设置,即异系统邻区设置。近3S的信号搜索过程1、是否需要像C网一样规划网络邻区,复杂且容易出错。2、是否能否使用SON添加异系统邻区。担心、疑虑1、LTE系统内ANR可以自动添加邻区,CL异系统ANR需要依赖终端能力。2、华为NEP可由C网自动生成LTE邻区华为方案1231.导入CDMA脚本和LTE工参表2.执行对应的邻区自配置任务3.导出LTE自配置数据第十三页,共34页。互操作类故障CL互操作关键短板CL双模用户从3G区域回到3G/4G共覆盖区域,如果用户一直处于激活态,将无法回到4G享受高速业务服务。CDMALTE热点、城区用户网络行为当前状态PS业务LTE与CDMA状态迁移暂不支持LTE->HPRD(激活态):√LTE->HPRD(空闲态):√eHRPD->LTE(空闲态):√eHRPD->LTE(激活态):X目前无配套终端。短板:3G激活态难以回到4G阶段一【由3G网络主动发起快速重选】1、基于eHRPD与LTE同站址建设,以eHRPD估算LTE信号强度。2、eHRPD配置LTE同层邻区。3、迟滞切换机制,避免频繁切换。4、CBSS10.0版本提供,2014年3月。华为方案阶段二【由终端主动发起快速重定向】1、终端在激活态主动测量LTE信号强度,主动进行切换。2、eHRPD配置LTE同层邻区。3、暂无配套的终端,暂不考虑。第十四页,共34页。流量类故障LTE吞吐量计算LTE物理层速率(bits)=

每个传输控制块大小(bits)

x传输控制块的个数/每子帧

x1000子帧数/每秒÷1000000

=

????Mbps

每TTI中TB个数与码字个数相同,LTE规定最大2个码字参考TS36.213Table-1

【下行理论吞吐量】MaxThroughput=(75376*10)*2*100/1000000=150.752MbpsMaxThroughput=75376*10*100/1000000=75.376Mbps【上行理论吞吐量】UECategoryMaximumnumberofDL-SCHtransportblockbitsreceivedwithinaTTIMaximumnumberofbitsofaDL-SCHtransportblockreceivedwithinaTTITotalnumberofsoftchannelbitsMaximumnumberofsupportedlayersforspatialmultiplexinginDLCategory110296102962503681Category251024510242Category3102048753762Category4150752753762Category52995521497764UECategoryMaximumnumberofbitsofanUL-SCHtransportblocktransmittedwithinaTTISupportfor64QAMinULCategory15160NoCategory225456NoCategory351024NoCategory451024NoCategory575376Yes36.306协议:下行UE能力对应的物理参数36.306协议:上行UE能力对应的物理参数第十五页,共34页。流量类故障LTE吞吐量故障处理下行流量问题排查上行流量问题排查Iperf进行UDP灌包Iperf反向灌包空口排查返回日志分析空口排查1、检查Server出口量是否足够。2、检查eNodeB入口流量是否足够3、UDP环回,eNodeB进行灌包4、服务器/PC性能不足来水不足1、BLER目标10%,峰值速率时为0。2、RSRP/SINR/CQI排查3、AMBR是否限速4、在线用户数/License5、同频干扰/UE天线不平衡6、其他算法。快速ANR/频选调度/PDCCH符号数/ICIC空口排查通过TCP手段排查1、RTT排查2、发送窗口/接收窗口TCP排查TCP排查从PC向服务器反向灌包同时关注反向RSSI第十六页,共34页。流量类故障案例1:接收窗口未优化导致TCP速率低E39820M小区

下行FTP:接收窗口128K,平均时延30ms,速率=128*8/0.03=34Mbps第十七页,共34页。流量类故障案例2:丢包导致TCP流量掉坑某局点E398下行TCP速率掉坑:1、服务器侧:tcp.analysis.retransmission过滤:2、使用tcp.seq==xxxx作过滤条件,进行多点抓包文件过滤,找出错误发生位置。3、空口丢包(A.PDCP丢包定时器时长,RLC模式;B.UEPC),S1AP_INITIAL_CONTEXT_SETUP_REQ4、LSTSTANDQCI查询QCI对应的RLCPDCP参数组ID,LSTRLCPDCPPARAGROUP:

在大流量情况下,丢包定时器设置过短,加上非确认UM模式,导致空口丢包。

将PDCP丢包定时器设置为1500ms,AM模式,速率“掉坑”现象不再出现。第十八页,共34页。切换类故障切换原理概述与常见故障切换的过程就是终端在移动过程中与网络连接交互发生变化的过程,简单的图示如下图:LTE系统的整个切换过程完全由网络侧(eNB)控制,所以eNB需要监测UE所处的无线质量环境,这个过程是通过eNB下发测量控制让UE在满足一定条件时上报测量报告来实现的:触发:当前我司eNB是采用A3事件触发同频切换,主要通过A2、A4事件来触发异频切换切换:eNB下发切换命令给UE,UE收到切换命令后,中断与源小区的交互,按切换到目标小区判断是否存在切换,通常以信令为判断依据,在终端侧,以发出触发切换的测量报告为开始,以切换完成消息为结束。切换成功时,从UE侧观察表现为UE从一个源小区到一个新的小区(可从PCI变化来观察)进行正常业务交互。如果切换失败,则大多表现为掉话、RRC重建等现象。常见切换问题:邻区漏配、切换不及时、弱覆盖等导致切换失败。切换失败有很多种原因,通常表现在S1,UU等接口的信令交互出现信令丢失,所以切换问题的首要定位方法是比对标准流程看是哪里信令缺失了。源侧信令目标侧信令第十九页,共34页。切换类故障切换失败故障处理邻区漏配切换失败故障信号陡降切换失败故障弱覆盖切换失败故障UE侧表现基站侧表现解决方法邻区漏配【表现】随着UE移动服务小区RSRP越来越差,SINR越来越差,而邻区RSRP越来越好。【解决方案】手工添加邻区配置打开ANR算法开关弱覆盖【表现】当邻区无线质量满足切换门限时,服务小区和邻区的RSRP都十分弱。【解决方案】调整功率配比调整天线倾角增加基站、载频如果从“邻区质量满足切换门限”到“服务小区质量陡降”之间的时间间隔太短(如小于1秒),可通过修改服务小区与邻区的偏置CellIndividualOffset(为大于0的值)来提前切换如果从“邻区比服务小区质量好”到“服务小区质量陡降”的时间间隔比较短(如小于0.5秒),则可通过修改服务小区的延迟触发时间IntraFreqHoA3TimeToTrig来提前切换eNodeB侧:收到测量报告,但不发起切换(X2口没有切换请求,空口没有下发切换命令)当邻区无线质量满足切换门限时,服务小区的RSRP突然陡降eNodeB侧表现为下发切换命令后收不到切换完成消息,或者连测量报告也收不到eNodeB侧表现为下发切换命令后收不到切换完成消息,或者连测量报告也收不到第二十页,共34页。目录LTE故障排查流程和故障处理方法常用故障分析思路业务类故障处理设备类故障处理第二十一页,共34页。传输类故障传输类故障处理类别

常见问题现象传输类典型问题信令终端/吞吐量异常上层应用链路不通(SCTP、IPPATH、OMCH)IP冲突、路由错误等导致业务异常VLAN错误、ARP异常导致链路不通光纤/光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通第二十二页,共34页。传输类故障传输故障处理思路总体思路:分层/逐段排查定位分层法:根据协议层,逐层定位,定位出实际故障点;逐段法:完成故障隔离,对数据流进行分段,逐段环回,逐段定位;具体排查项:物理层故障排查ARP/IP层故障排查IPPATH异常处理SCTP异常处理第二十三页,共34页。传输类故障传输故障逐层排查方法简介协议层常见问题现象L5信令终端/吞吐量异常L4上层应用链路不通(SCTP、IPPATH、OMCH)L3IP冲突、路由错误等导致业务异常L2VLAN错误、ARP异常导致链路不通L1光纤/光模块故障,物理端口连接不良,光电模式协商不正确等导致物理链路不通排查方法应用场景PING通断检测+MTU检测TRACERT传输路径排查、MTU探测UDP环回检测S1/X2链路质量IPROUTE路由排查排查方法应用场景DSPARPARP表项查询DSCP/VLANDSCP与VLAN优先级映射抓包第二十四页,共34页。传输类故障传输问题案例问题现象:一线测试时发现终端入网20s后自动发起释放,无法进行上网业务。问题处理步骤:从信令上分析,UE的Attach流程已经完成,过了20秒之后eNodeB在S1口上发送上下文释放消息,原因值是UserInactivity,由于释放原因是UserInactivity,并且释放时间固定为20s,查看基站脚本信息,发现UE不活动定时器配置为20s,因此确定是由于UE不活动定时器超时导致释放。2.终端与服务器之间进行ping操作,发现终端无法Ping通服务器,确定用户面链路不通,导致UE不活动定时器超时,UE释放空口链接。3.当前站点已经开启了GTPU静态检测和IPPATH的Ping检测,可以确定eNodeB与UGW之间的IPPATH链路不存在异常,需要进行端到端的问题定界。4.基站侧通过IP跟踪确定Ping报文的收发情况,通过下图可以看到终端发起的Ping报文基站已经发送给UGW,但是没有收到UGW返回Ping响应报文。5.经过核心网定位发现报文已经从UGW发送出去但是一直没有收到响应,通过排查发现核心网下一级的LANSwitch发现是由于没有配置回程路由导致所有下行报文都无法返回。1信令面正常,eNB<->MMEOK2用户面异常,IP层手段PING检测第二十五页,共34页。中射频类故障中射频类故障处理123RSSI外部干扰互调驻波CPRI接口第二十六页,共34页。中射频类故障RSSI故障处理RSSI过低RSSI不平衡RSSI过高RSSIRSSI理论值带宽FDDdBmTDDdBm20M-98-9715M-99-9810M-101-1005M-104-1033M-106-1051.4M-110-10913频谱扫描OKNOK通道衰减值检查互调干扰检测2方法1方法21、记录空载时的RSSI值;2、通过ADDCELLSIMULOAD加载模拟负载;3、在M2000跟踪RSSI差值是否大于4dB。1、通过STRRFTEST进行反向通道干扰检测;第二十七页,共34页。中射频类故障驻波故障处理第二十八页,共34页。中射频类故障CPRI接口故障处理CPRI协议接口定义CPRI接口CPRI接口光模块光纤的单双模不一致;两端设备较近时使用了距离过大的光模块;光模块故障(对端发送光功率过大)光纤接头或光模块安装松动,或光模块老化。光纤接头不洁净,存在灰尘等异物。光模块的型号(单模/多模、速率、距离)不匹配。光纤线路存在弯折、挤压或老化,或光纤线路过长导致光信号出现较大衰减;光口接收无信号还可能是没有光纤有断点、对端未连接或单板硬件故障;CPRI光口故障的可能原因第二十九页,共34页。中射频类故障中射频故障处理案例第三十页,共34页。维护通道类故障维护通道类故障处理

eNodeBDHCP站点2、自动发现M2000

Config

Config

ConfigS/WCME中心机房Support网站1.1、提取版本包1.2、组织配置数据1.4、打开开站工具、上传数据、启动开站上报ESN4、调测License下发1、安装上电3、自动配置

ConfigS/W限制和约束:在开站之前,必须:硬件安装完毕,M2000调测完毕,eNodeB与M2000之间的传输正常;eNodeB的软件版本必须从Support网站上取得,并且已经上传到M2000Server。1.3、导出开站列表1.VLAN自学习失败2.DHCP自发现失败典型故障第三十一页,共34页。维护通道类故障VLAN自学习失败故障处理【eNodeB】上电主动发起DHCP,无VLAN,网关上设置VLAN,报文被网关丢弃。【eNodeB】上电主动发起DHCP,无VLAN,被网关丢弃。ARP广播ARP广播eNodeB被动学习VLAN学到VLANVLAN学习原理VLAN自学习失败案例【问题现象】从Switch(A设备)侧检测不到基站和ATN间交互的数据流量;【问题原因】A设备端口设置为1000M/FULL,与eNodeB协商失败,ARP无法广播ConfigurationModeNegotiationResulteNodeBPortPeerEndTransmissionPorteNodeBPortPeerEnd

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论