LTE_KPI问题分析定位指导书.doc_第1页
LTE_KPI问题分析定位指导书.doc_第2页
LTE_KPI问题分析定位指导书.doc_第3页
LTE_KPI问题分析定位指导书.doc_第4页
LTE_KPI问题分析定位指导书.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

LTE网络KPI分析与定位目录1整体定位思路22LTE重点关注指标:33可接入性43.1RRC建立成功率43.1.1定义43.1.2信令流程43.1.3问题定位思路43.2eRAB建立成功率53.2.1定义53.2.2信令流程53.2.3问题定位思路63.2.4Counter关系式63.3CQI占比63.3.1定义 统计周期内,小区内UE上报的CQI(CQI015)数量在整个CQI上报数量中的比例。63.3.2CQI与SINR关系63.3.3问题定位思路7动作补充说明73.3.4KPI定义检查73.3.5问题范围确认71问题特征确认82关联分析83.3.6故障与告警核查83.3.7参数核查84可保持性84.1重建成功率84.1.1定义84.1.2信令流程94.1.3问题定位思路94.1.4Counter关系式104.2掉线率104.2.1定义104.2.2信令流程104.2.3问题定位思路114.2.4Counter关系式115移动性115.13.4G回流比(4G回流/重定向到3G的比例)115.2问题定位思路115.2.1RF优化115.2.2修改重定向到3G的 A2门限值121 整体定位思路Step1、掉话KPI趋势分析-找到Top小区和Top时间段Step2、Top小区异常原因分析-找到占比最大原因Step3、Top小区分析是否存在Top用户2 LTE重点关注指标:CQI大于等于7的比例(%)、RRC连接建立成功率(%)、E-RAB建立成功率(%)、RRC重建比例(%)、E-RAB掉线率(%)、LTE重定向到3G的比例(%)3 可接入性3.1 RRC建立成功率3.1.1 定义定义RRC建立成功率 (L.RRC.ConnReq.Succ / L.RRC.ConnReq.Att) * 100%。L.RRC.ConnReq.Succ统计的是小区接收UE返回的RRC Connection Setup Complete消息次数,L.RRC.ConnReq.Att是指小区接收UE的RRC Connection Request消息次数(不包括重发)影响影响呼叫成功率,降低用户接入体验3.1.2 信令流程3.1.3 问题定位思路No.失败原因触发因素问题分析定位思路1L.RRC.SetupFail.ResFail资源分配失败而导致RRC连接建立失败的次数RRC建立阶段需要向小区申请的空口物理资源包括:SRI,SRS和CQI资源。当申请小区资源失败导致RRC建立失败时,eNodeB会向UE发送RRCConnRej消息,并且统计L.RRC.SetupFail.Rej, 和L.RRC.SetupFail.ResFail。2L.RRC.SetupFail.NoReplyUE无应答而导致RRC连接建立失败的次数eNB下发RRC Connection Setup消息之后,如果在等待RRCConnSetupCmp消息定时器(15s)内没有收到RRC Connection Setup Complete消息,则会统计为L.RRC.SetupFail.NoReply。1.确认版本升级前后等待定时器时长是否有变化。2.确认RRC Connection Setup信令HARQ状态,分析上行信道质量,是否为弱覆盖或强干扰。3.如果L.RRC.ConnSetup比L.RRC.ConnReq.Att少很多,说明L3处理msg3或者下发msg4存在异常,转L3定位。4.终端异常。3L.RRC.SetupFail.Rej小区发送RRC Connection Reject消息次数L.RRC.SetupFail.Rej是指发送RRC Connection Reject消息次数。当前主要有三种场景:1) 小区资源申请失败。2) 超过eNB的规格用户数(小区内最大用户数)。3) CPU占用率过高触发消息流控。(CPU占用率是否接近100%)采集Debug日志进一步分析。3.2 E-RAB建立成功率3.2.1 定义定义e-RAB建立成功率 (L.E-RAB.SuccEst(E-RAB建立成功次数) / L.E-RAB.AttEst (E-RAB建立尝试次数)) * 100%。L.E-RAB.AttEst统计的是eNODEB接收MME的ERAB SETUP REQUEST消息次数,L.E-RAB.SuccEst是指MME接收eNODEB的ERAB SETUP RESPONSE消息次数(不包括重发)影响E-RAB是承载用户业务数据的接入层承载,它在小区内的建立成功率,直接反映了小区为用户提供E-RAB承载建立的能力。3.2.2 信令流程3.2.3 问题定位思路No.失败原因触发因素问题分析定位思路1L.E-RAB.FailEst.NoReply因未收到UE响应而导致E-RAB建立失败的次数eNB下发空口信令后,如果在等待消息定时器内没有收到终端回复消息,则会统计为L.E-RAB.FailEst.NoReply。1.确认版本升级前后等待定时器时长是否有变化。2.确认eNodeB发送空口信令 HARQ状态,分析上行信道质量,是否为弱覆盖或强干扰。3.终端与基站兼容性问题。2L.E-RAB.FailEst.MME核心网问题导致E-RAB建立失败次数1.消息合法性检查失败(消息错误,E-RAB ID重复)2. 初始UE上下文建立流程与其它S1AP层流程交叉导致无法处理该消息(初始UE上下文建立过程中收到MME发送的UE CONTEXT RELEASE COMMAND消息)3L.E-RAB.FailEst.TNL传输层问题导致E-RAB建立失败次数1. IPPATH和IPRT配置错误:查看IPPATH是否配置正确,如果已经配置正确,则请查看初始上下文建立请求消息(INIT_CONTEXT_SETUP_REQ消息)中transportlayeraddress的信元值是否为配置的IPPATH对端IP,如果不一致则需要确认一下是基站配置错误还是核心网填写错误。2. 传输链路故障,可以根据告警进行分析(如链路闪断)。4L.E-RAB.FailEst.RNL无线层问题导致E-RAB建立失败次数详见子原因分析5L.E-RAB.FailEst.NoRadioRes无线资源不足导致E-RAB建立失败次数1.通过Debug日志查找对应时间段有没有资源受限/资源失败的打印;并确认受限资源的类型。2. 通过配置信息、产品规格、License等信息分析该类型资源受限的可能性。3.转开发定位6L.E-RAB.FailEst.SecurModeFail安全模式配置失败导致E-RAB建立失败次数弃次数1. 终端会对Security Mode Command消息进行完整性校验时,如果完整性校验失败,就回复Security Mode Failure,可能为算法配置或终端兼容性问题。2.转开发定位。3.2.4 Counter关系式指标子指标L.E-RAB.FailEst.RNLL.E-RAB.FailEst.NoReplyL.E-RAB.FailEst.NoRadioResL.E-RAB.FailEst.SecurModeFail3.3 CQI占比3.3.1 定义 统计周期内,小区内UE上报的CQI(CQI015)数量在整个CQI上报数量中的比例。计算方式:CQIk占比= CQIk上报数量/ CQI上报总数量,k=0153.3.2 CQI与SINR关系CQI:信道质量指示,本质上反应了当前的信道质量,即当前支持的信道效率越低,表明信道质量越差。提升CQI从根本上需要提升SINR。UE CQI上报值跟信道效率的对应关系见下表:CQI是UE通过测量下行SINR而得到并进行上报,所以通过提升SINR来提升CQI是根本措施,主要进行常规网络优化来解决。3.3.3 问题定位思路整体的排查分5个大的动作,每个动作会再细分成几个子动作。每动作步骤动作名称入口条件分析内容动作1KPI定义检查无条件1.公式统计是否一致。动作2问题范围确认无条件1.特征分析:地理特征(TOP小区)、时间特征(恶化时间点)、分布特性(室内外)、频段特征(双频组网)。2.根据场景进行关联指标分析动作3外部事件与历史操作检查恶化场景1.确认eNodeB异常操作的影响。2.确认外部事件(新手机发布、重大集会等)的影响。3.确认是否存在周边去激活/断站/禁止接入的情况。动作4故障与告警核查无条件1.针对TOP小区,核查TOP小区及其周围小区是否有告警/故障日志,相关告警/故障发生的时间点与指标恶化时间点是否一致;动作5参数核查无条件1.恶化场景关注参数变化的影响评估。图6.1CQI低问题分析排查动作动作补充说明3.3.4 KPI定义检查不同厂家的指标定义公式可能不相同3.3.5 问题范围确认问题范围确认与分段隔离,就是深入掌握问题的现象和特征。出现CQI问题时,需要从以下方面进行分析。1 问题特征确认时间特征(恶化场景):鉴别为缓慢恶化场景还是突降场景,对于突降场景确认恶化时间点。地理特征(受影响的物理网元的范围确认):需要鉴别问题为全网问题/TOP小区问题。分布特征:鉴别问题为室内站还是室外站。频段特征:对于多频段组网局点,需要隔离每个频段上的用户速率和用户数变化情况。2 关联分析对于TOP小区恶化场景:TOP小区与非TOP小区共用网元(核心网/FTP服务器/部分传输/测试终端等)可以直接排除,重点排查不同之处,如基站配置、无线环境、告警等。外部事件与历史操作检查对于恶化问题,首先执行本步骤,确认外部事件/历史操作与恶化事件在时间/范围等方面的关联性。对于整网问题,需要关注网络级的操作及是否有外部放号,新终端发布等事件;对于基站级操作,推荐挑选TOP10小区进行分析。对于TOP小区问题:进一步识别正常和异常站点的事件和操作差异。3.3.6 故障与告警核查对于TOP站点恶化场景,需要分析告警/故障日志在上报的时间和范围上是否与指标恶化对应。另外需要关注周边站点在恶化时段是否有新增告警,站点异常后会导致周边小区远点用户增加。3.3.7 参数核查恶化场景:1、对于全网恶化场景,挑选TOP 10小区,排查恶化时间点前后的参数修改动作,并输出排查结果。2、对于TOP小区恶化场景,除了排查恶化时间点前后的参数修改,还可以排查TOP站点与正常站点的参数修改差异,进一步缩小可疑参数修改范围。4 可保持性4.1 重建成功率4.1.1 定义定义RRC建立成功率 (L.RRC.ReEst.Succ /L.RRC.ReEst.Att) * 100%。L.RRC.ReEst.Att RRC重建请求次数L.RRC.ReEst.Succ RRC重建成功次数影响RRC重建过程是用户发起的RRC资源恢复过程。根据36331协议,重建触发条件如下: 底层上报完整性检测失败 UE检测到无线链路失败 系统内切换失败 系统间切换失败 RRC重配置失败RRC重建成功需要具备两个条件:1.只有当UE发起重建请求的小区有可用的UE上下文,重建才能成功。根据UE重建请求消息中的c-RNTI和PCI来查找UE的上下文,只有c-RNTI和PCI是本站配置的c-RNTI和PCI,才能找到UE的上下文信息,重建才能成功。否则重建会失败。协议中对UE设置重建请求的描述如下:系统内或系统间切换失败场景,UE使用源小区的c-RNTI和PCI,重建原因为切换失败。非切换失败场景,UE使用触发重建的小区的c-RNTI和PCI,重建原因为RRC重配失败或者其他类型失败。2.为了提高系统的安全性,LTE系统中除SRB0和SRB1外的所有无线承载必须在AS安全激活后才能建立。且RRC重建过程也必须在AS安全性激活后才能发起,否则UE将释放链接,返回IDLE模式。重建过程:重建触发后,挂起除SRB0的以外的所有RB,停止其数据传输,然后根据连接态下UE对邻区信号的测量情况对邻区信号排序,选择信号质量最好的小区,并试图驻留在该小区,向网络发起重建请求。协议规定三种重建原因:handover failure/reconfiguration failure/other failure。4.1.2 信令流程4.1.3 问题定位思路No.失败原因触发因素问题分析定位思路1L.RRC.ReEst.ReconfFail.Rej重配置失败触发RRC重建拒绝1.确认重配原因。2.分析重建点信号,确认是否上行信号差导致eNB没有收到重配完成消息。3.分析重配信令,确认是否携带的NAS和MAC信元非法导致重配失败。2L.RRC.ReEst.HoFail.Rej切换失败触发RRC重建拒绝1.终端切换过程中收到eNB下发的重配命令,T304定时器超时前都没有回复RRC连接重配完成消息。2.重建请求中携带的PCI与C-RNTI与切换重配命令中的是否一致,切换时下发的newUE-Identity就是重建请求的RNTI(高通芯片如E392存在此情况)3L.RRC.ReEstFail.ResFail资源分配失败而导致RRC重建失败DBG日志分析具体原因4L.RRC.ReEstFail.NoReplyUE无应答而导致RRC重建失败分析重建点信号,确认是否上行信号差导致eNB没有收到重建完成完成消息。5L.RRC.ReEstFail.RejRRC重建拒绝参考子原因定位思路6L.RRC.ReEstFail.NoCntx无UE上下文导致RRC重建失败次数重建在源小区和同站小区失败则是异常场景4.1.4 Counter关系式指标子指标L.RRC.ReEstFail.RejL.RRC.ReEst.ReconfFail.Rej L.RRC.ReEst.HoFail.RejL.RRC.ReEstFail.RejL.RRC.ReEstFail.ResFail L.RRC.ReEstFail.NoCntx4.2 掉线率4.2.1 定义定义掉线率 L.E-RAB.AbnormRel(E-RAB 不正常释放)/ (L.E-RAB.AbnormRel(E-RAB 不正常释放) + L.E-RAB.NormRel(E-RAB正常释放))* 100影响E-RAB是承载用户业务数据的接入层承载,E-RAB释放过程是用户接入层业务承载资源的释放过程,反映了小区为用户释放接入层业务数据承载资源的能力。4.2.2 信令流程4.2.3 问题定位思路No.失败原因触发因素问题分析定位思路1L.E-RAB.AbnormRel.Radio无线层问题导致的激活的E-RAB异常释放次数1.确认是否存在TOP用户,TOP终端类型。2.确认是否弱覆盖,强干扰,信号突变导致。2L.E-RAB.AbnormRel.TNL传输层问题导致的激活的E-RAB异常释放次数主要是由于eNodeB与MME之间传输异常,如S1接口传输闪断导致。1.确认是否有传输故障告警3L.E-R

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论