kpi绩效指标_网优kpi指标优化工作指导手册_第1页
kpi绩效指标_网优kpi指标优化工作指导手册_第2页
kpi绩效指标_网优kpi指标优化工作指导手册_第3页
kpi绩效指标_网优kpi指标优化工作指导手册_第4页
kpi绩效指标_网优kpi指标优化工作指导手册_第5页
已阅读5页,还剩84页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

TD-LTE 网优网优 KPI 指标优化指标优化 工作指导手册工作指导手册 项目名称 文档编号 版 本 号 作 者 版权所有 大唐移动通信设备有限公司 本资料及其包含的所有内容为大唐移动通信设备有限公司(大唐移动)所有,受中国法律及适用之 国际公约中有关著作权法律的保护。未经大唐移动书面授权,任何人不得以任何形式复制、传 播、散布、改动或以其它方式使用本资料的部分或全部内容,违者将被依法追究责任。 文档更新记录文档更新记录 日期更新人版本备注 2013-7-17 王学斌 V0.0.1 创建 2013-7-31 王学斌 卢颢 V0.0.2 添加RRC、ERAB、掉线CDL信令流程及失败原因 2013-9-20 王学斌、张发 厚、索志刚、魏 晓东、闫俊霖、 徐世勋 V0.0.3 编写案例 2013-9-29 徐世勋 V0.0.4 增加章节2.KPI优化的工作流程及内容 2013-10-23 王学斌、周晓 华、王会庆 V0.0.5 增加案例 2013-10-24 徐世勋 V0.0.6 汇总及增加KPI问题处理工单模板 2013-11-5 徐世勋 V0.0.7 根据评审意见进行修改 2013-11-8 童志坚 V0.0.8 增加童志坚整理的案例:3.5.2小区上行功控参 数设置问题 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 3 页 共 89 页 目目 录录 1 前前 言言5 2 KPI 优化的工作流程及内容优化的工作流程及内容 .5 2.1KPI 优化工作总体流程.5 2.2KPI 优化工作内容.6 2.2.1KPI 数据生成.6 2.2.2KPI 数据分析.7 2.2.3问题处理7 2.2.4问题跟踪和核查8 2.3KPI 优化工作逻辑图.8 2.4KPI 优化工作模板和示例.9 3 RRC 连接建立成功率优化连接建立成功率优化10 3.1理论介绍10 3.2指标定义10 3.3CDL 信令流程及失败原因.11 3.3.1正常过程11 3.3.2异常过程11 3.4优化方法介绍12 3.4.1上行随机接入的问题14 3.4.2小区重选参数问题14 3.4.3下行初始发射功率偏低问题15 3.4.4上行初始功控问题15 3.5相关案例介绍分析15 3.5.1小区重选参数问题15 3.5.2小区上行功控参数设置问题17 3.5.3小区测试开关参数问题19 3.5.4内存池耗尽导致信令发送失败问题21 3.5.5全频带高干扰导致接入失败问题24 4 ERAB 建立成功率建立成功率 .27 4.1理论介绍27 4.2指标定义29 4.3CDL 信令流程及失败原因.29 4.3.1正常过程29 4.3.2异常过程30 4.4相关案例介绍分析33 4.4.1路由关系未配无法接入的问题33 4.4.2网关 IP 配置错误导致无法附着35 4.4.3安全参数配置问题36 5 切换成功率优化切换成功率优化37 5.1理论介绍37 5.2指标定义38 5.3CDL 信令流程.39 5.3.1正常过程39 5.4优化方法介绍40 5.4.1切换信令流程41 5.4.2涉及话统打点43 5.4.3切换问题分类45 5.5相关案例介绍分析48 5.5.1硬件和传输故障48 5.5.2邻区漏配问题50 5.5.3邻区数据配置不当52 5.5.4切换算法参数配置不当54 5.5.5小区个性偏移参数调整案例55 5.5.6切换时终端接入到非源和目标小区导致核心网释放用户问题57 5.5.7邻区移动网络码配置错误导致 S1 切换失败60 5.5.8开启防乒乓切换开关导致不切换62 5.5.9终端发 A3 切换测量报告后,不触发异频切换66 6 无线掉线率优化无线掉线率优化68 6.1理论介绍68 6.2指标定义71 6.3CDL 失败原因.71 6.3.1空口超时引起的掉话71 6.3.2激活检测UE 不活动.78 6.3.3激活检测UE 丢失.78 6.3.4其他错误引起的掉话79 6.4相关案例介绍分析80 6.4.1切换不及时问题80 6.4.2核心网问题82 6.4.3激活检测 UE 不活动和 UE 丢失造成的掉线分析85 6.4.4帧头未对齐导致的干扰问题88 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 5 页 共 89 页 1前前 言言 话统 KPI 是中国移动考核项之一,也是对网络质量的最直观反映。日常话统监测是进 行网络性能检测的一种有效手段。通过日监测,识别突发问题小区,将问题消除在初级阶 段。通过周监测,识别网络性能持续短木板小区,针对性的进行提升优化。 话统 KPI 主要包括以下几大类:接入性指标、保持性指标、移动性指标、业务量指标、 产品运行类指标、系统可用性指标和网络资源利用率指标。 通过上述重点话统 KPI 指标的监测,可以达到:识别突发问题、风险提前预警、话统 KPI 的稳定与提升,目前 TD-LTE 系统需要重点关注的话统 KPI 指标如下表: 指标分类数据来源具体的 KPI 指标 RRC 连接建立成功率 ERAB 建立成功率接入性指标 无线接通率 保持性指标无线掉话率(ERAB 异常释放) 小区 eNodeB 内切换出成功率 移动性指标 小区 eNodeB 间切换出成功率 上、下行业务平均吞吐量量 业务量指标 无线侧 上、下行 PRB 平均利用率 单板 CPU 最大占用率 产品运行类指标无线侧 单板 CPU 平均占用率 系统可用性指标无线侧无线网络退服比例 上行 PRB 资源使用的平均个数 网络资源指标无线侧 下行 PRB 资源使用的平均个数 2KPI 优化的工作流程及内容优化的工作流程及内容 2.1KPI 优化工作总体流程 KPI 优化工作流程图 2.2KPI 优化工作内容 2.2.1KPI 数据生成 工作内容: 使用预定义和自定义的统计项及模板生成 KPI 性能报表,通过 OMC Client 提取 KPI 报表,输出 KPI 报表和重要指标失败原因列表给 KPI 数据分析人员。KPI 报表生成和提取 相关操作请参考LTE KPI 模板指导手册 。 根据 KPI 报表数据,选择 KPI 指标最差 Top N 小区。TOP N 小区的选择:对某项指标 按照失败率最高进行排序,选取前 20 个小区,再对这 20 个小区进行失败次数分析,失败 次数大于 20 次的(RRC 连接、切换、掉线等按失败次数大于 20 次为标准,ERAB 建立失 败指标按次数大于 10 次为标准)作为 TOP 小区进行分析 ;另外需要对指标再进行失败次 数的降序排序,如果有小区失败次数很多失败率也较高但是未在之前选的 TOP 小区中,也 需要将这些小区作为 TOP 小区分析。 KPI 数据生成工作所需输入、工具和技术、输出如图所示: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 7 页 共 89 页 2.2.2KPI 数据分析 工作内容: KPI 指标变化趋势分析:根据 KPI 报表数据,分析全网 KPI 指标变化趋势,尤其是存 在设备版本升级或参数全网性修改后,需要持续至少一周重点监测 KPI 指标变化趋势; TOP 小区分析:根据 TOP 小区列表、重要指标失败原因列表、历史告警信息、网管数 据、CDL 日志、IOT 数据、复测终端 LOG 等信息进行分析。先查看告警信息,确认有设 备故障类告警是否和 TOP 小区关联,再使用与基站软件版本匹配的 CDLBrowser 工具进行 指标统计和失败信令流程分析确认 TOP 小区产生的原因,CDLBrowser 工具使用方法请参 考CDL 分析工具使用手册 。 KPI 数据分析工作所需输入、工具及技术、输出如图所示: 2.2.3问题处理 工作内容: 1)通过 CDL 分析能够明确定位 TOP 小区问题后,给出问题处理建议输出给相关问题 处理人员:参数修改问题导给维护人员调整(和标定参数不一致的大规模参数修改需和 SE 确认) ;网络优化问题给出优化建议导给网优人员;由于设备故障引起的 KPI 指标恶化问 题导给排障人员处理;定位确认为产品缺陷要及时提交 BUG 推动和跟踪版本解决。 2) 通过 CDL 分析无法明确定位 TOP 小区产生原因的问题,需要复测后结合终端侧 log 再进一步分析。 问题处理工作所需的输入、工具及技术、输出如图所示: 问题处理:输入、工具及技术、输出 2.2.4问题跟踪和核查 工作内容: 问题跟踪和核查环节,主要依据问题列表、KPI 问题处理工单、BUG/CR/RR 编号,内 部讨论推动和核查问题解决,和外部其它环节沟通确认问题进展,以形成问题闭环,最终 输出 KPI 优化报告。 问题跟踪和核查工作所需的输入、工具及技术、输出如图所示: 问题跟踪和核查:输入、工具及技术、输出 2.3KPI 优化工作逻辑图 综合 KPI 优化工作流程和内容,KPI 优化工作逻辑图如下: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 9 页 共 89 页 KPI 优化工作逻辑图 2.4KPI 优化工作模板和示例 1.KPI 优化工作参考模板 TOP小区处理跟踪表 .xlsx KPI参数修改记录表 .xlsx KPI问题处理工单.d oc KPI 报表示例 KPI报表示例.xlsx重要指标失败值示 例.xls 3RRC 连接建立成功率优化连接建立成功率优化 3.1理论介绍 RRC 连接建立过程分为两个阶段:准备阶段和实施阶段。在准备阶段中,UE 会根据 NAS 层的触发原因和系统广播中的接入限制信息,通过一系列检查来判断自己是否被允许 进行接入过程,如果可以,则执行后续的实施阶段;否则 UE 的 RRC 将启动相应的定时器, 在该定时器超时前 UE 无法发起任何接入过程。上述机制的目的是负荷拥塞控制,当网络 负荷较重时限制某些 UE 进行接入。 3.2指标定义 RRC 连接建立是指处于空闲状态的 UE 或待开机的 UE 准备发起一个呼叫或响应寻呼 时发起的过程。出于降低接入时延的考虑,LTE 系统将 RRC 连接建立过程设计发生在 ENB 和 MME 之间的 S1 连接建立前,也就是在 ENB 尚未从 MME 获得任何 UE 上下文前, ENB 需要将 RRC 连接建立完毕,因此该过程主要建立最基本的 SRB1。RRC 连接建立成 功意味着 UE 与网络建立了信令连接,是进行其他业务的基础。 RRC 连接建立成功率主要通过话务统计结果获得,推荐的公式为: RRC 建立成功率= RRC 连接建立完成次数/RRC 连接请求次数(不包括重发); 公式中相关各指标的具体统计方式如下所示: 指标指标指标描述指标描述 RRC 连接请求次数小区接收 UE 的 RRC Connection Request 消息次数(不包括重发) RRC 连接建立完成次数小区接收 UE 返回的 RRC Connection Setup Complete 消息次数 资源分配失败而导致连接建立失败的次数 UE 无应答而导致连接建立失败的次数 RRC 建立失败次数 小区发送 RRC Connection Reject 消息次数 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 11 页 共 89 页 3.3CDL 信令流程及失败原因 3.3.1正常过程 MMEeNBUES1接口UU接口 RRC Connection Request RRC Connection Setup RRC Connection Setup Complete 图 RRC 建立过程正常流程 每当在 CDL log 中发现一条 UU 接口 RRC Connection Request 消息时,代表某一个 UE 连接建立的开始,此后所有的消息都可以提取相同的 CellUeIndex 和 CELL ID。当看到 RRC Connection Setup 和 RRC Connection Setup Complete 消息时,标志着 RRC 建立正常流 程的结束。 3.3.2异常过程 i.RRC 连接建立完成超时 RRC_OVERTIME MMEeNBUES1接口UU接口 RRC Connection Request RRC Connection Setup 图 RRC 连接建立完成超时 每当在 CDL log 中发现一条 UU 接口 RRC Connection Request 消息时,代表某一个 UE 连接建立的开始,此后所有的消息都可以提取相同的 CellUeIndex 和 CELL ID。当看到 UU 接口的 RRC Connection Setup 和 RRC 事件类接口的 RRC_OVERTIME 消息,并且第 3 条消 息的定时器类型字段为 RAC_TIMER_W_RRC_SETUP_CMPLT 时,标志着 RRC 连接建立 完成超时。 ii.RRC 连接建立拒绝 MMEeNBUES1接口UU接口 RRC Connection Request RRC Connection Reject 图 RRC 连接建立拒绝 每当在 CDL log 中发现一条 UU 接口 RRC Connection Request 消息时,代表某一个 UE 连接建立的开始,如图 2.10 所示。 第 1、2 条消息为 UU 接口的 RRC Connection Request、RRC Connection Reject,2 条消 息有相同的小区标识与 UeIndexCell,是连接建立发生时基站为 UE 新分配的索引。 3.4优化方法介绍 LTE 系统内 RRC 连接建立失败问题的可能原因大概分为如下几条: RRC 建立失败主要的原因有:上行随机接入信道功率问题、小区重选参数问题、下行 初始发射功率偏低、上行初始功控问题、拥塞问题或设备异常问题等。 当出现 RRC 连接建立成功率低的问题时,首先按照上述问题分类,了解相关问题的范 围,然后根据空口信号质量、参数配置、干扰和上下行功率调整及设备告警等方面入手逐 一排查解决,排除这些影响 RRC 连接建立成功率的客观因素,逐步提升该指标的成功率。 RRC 连接建立的过程主要包括以下 3 个个步骤: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 13 页 共 89 页 RRC 连接建立成功信令流程 (1)首先 UE 通过 SRB0 发送 RRC Connection Setup Request 消息(注: SRB0 一直 存在, 用来传输映射到 CCCH 的 RRC 信令。 )此消息主要携带 UE 初始(NAS)表示以 及该连接建立的原因等信息, 此高层消息会触发 UE 的底层试题进行基于竞争的随机接入 过程,RRC 连接建立请求消息就对应于底层随机接入过程中的 Msg3 (2)通过底层的竞争接入冲突解决机制,UE 接收到 ENB 的 RRC Connection Setup 消 息,建立了 UE 与 ENodeB 之间的 SRB1,NodeB 为 SRB1 配置 RLC 层和逻辑层信道的属 性。ENB 还在此信令中对 PHY /MAC/RLC /PDCP 等各个实体的配置参数进行配置, RRC 连接建立消息就对应于底层随机接入过程中的 Msg4。UE 收到 NodeB 的 rrcConnectionSetup 信令后,UE 和 ENB 之间的 SRB1 就建立起来了。 (3)在 UE 接收到 RRCConnectionSetup 消息后,向 ENB 发送一个 RRC Connection Setup Complete 消息。此消息中携带有上行方向的初始 NAS 层的信令消息(如 Attach Request,TAU Request,Service Request 等) ,ENB 收到此消息后,将其中的 NAS 消息转 发给 MME 用于建立 S1 连接。 在第(2)步中,如果 ENB 拒绝为 UE 建立 RRC 连接,则通过 SRB0 回复一条 RRC 连接拒绝消息 RRC Connection Reject。在该 RRC 连接拒绝消息中,网络侧可以可选地携带 一个禁止呼叫的定时器 T302,该定时器和系统广播中的接入限制信息共同决定了 UE 是否 被允许发起接入过程。 一般 RRC 连接建立问题的定位方法如下,通用流程: 3.4.1上行随机接入的问题 UE 发出 RRC Connection Request 消息,ENB 没有收到,如果此时的下行信道质量正 常,一般是随机接入参数中的初始接收目标功率设置偏低的问题。 3.4.2小区重选参数问题 ENB 收到 UE 发的 RRC 建立请求消息后,下发了 RRC Connection Setup 消息而 UE 没 RRC 连接建立问题 UE 是否发 出请求消息 ENB 是否收 到请求消息 ENB 是否发 出建立消息 UE 是否收到 RRC 建立消息 UE 是否发出 RRC 建立完成消息 ENB 是否收到 建立完成消息 设备异常问题 调整随机接入上行初始 接收目标功率相关参数 ENB 相关其他问 题 是否发生 小区重选 调整下行公共信道功率 优化小区重选参数 调整下行初始发射功率 调整上行专用信道开环 功控参数 Y Y Y Y Y Y N Y N N N N N N 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 15 页 共 89 页 有收到。查看此时的 SINR,如果偏低,而且监视集中没有质量更好的小区,那么是覆盖的 问题可以适当提高下行公共信道的功率。如果此时监视集中有更好的小区,则可能是小区 重选的问题,可以适当调整小区重选参数加快小区重选。 3.4.3下行初始发射功率偏低问题 UE 收到 RRC Connection Setup 消息而没有发出 RRC Connection Setup Complete 消息, 如果此时下行的信号质量正常,那么可能是手机异常,否则可能是下行初始功率过低导致 下行不能同步。 3.4.4上行初始功控问题 UE 发出 RRC Connection Setup Complete 消息而 ENB 没有收到,由于上行初始功控会 让 UE 的发射功率上升,如果是 UE 的发射功率不足导致,可以适当提高上行信道的初始 期望功率和调整量等参数。 3.5相关案例介绍分析 3.5.1小区重选参数问题 问题描述: 华电集团专项 2 小区接入率很低,且主要集中在 15 点到 16 点之间,查看小区无告警。 由于接入失败次数过多,影响全网一天的 KPI 指标数据。 问题分析:问题分析: 从 CDL 信令看 UE 发起随机接入申请,UE 发出 RRCConnectionRequest 后 ENB 下发 RRC connection setup 消息,终端无响应,造成 RRC 连接建立完成超时,导致 RRC 建立失 败。 定位过程:定位过程: 从最近一次的测量上报消息中可以看出,源小区 PCI 为 254,此时测量到的 rsrpResult 值为 23,由此可以计算出 RSRP 的值为 23-141=-118dbm 左右。而测量到的相 邻目标小区 PCI 为 62 ,rsrpResult 值为 34,小区 RSRP 在-107dbm 左右。由此可以初步分 析相关的场景是 UE 所处位置的信号质量不好,且存在模 3 干扰,最终导致 RRC 连接建立定 时器超时后 RRC 连结建立失败。 解决建议:解决建议: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 17 页 共 89 页 查看基站配置后,该小区的参考信号功率为 15,已经为最大。故不存在下行初始发射 功率偏低问题。通过现场复测抓取 log 进一步分析,排除天线安装问题以及工参设置问题、 排除存在大面积的弱覆盖问题。通过 log 分析,发现存在 PCI 模三干扰严重,重新进行规 划,修改小区的 PCI。 解决效果:解决效果: 修改 PCI 后,RRC 接入率有所提,KPI 指标数据恢复正常。 3.5.2小区上行功控参数设置问题 问题现象问题现象 NBYZ 技侦大楼 FHTL-0 从 7 月 13 日开始,RRC 接入请求次数变多还有伴随着大量 失败,每天 RRC 成功率基本在 20%左右,失败发生在忙时时段,影响全网 KPI。 问题分析:问题分析: 查看小区状态以及通道驻波均没有问题,从 CDL 中看:均是 ENB 下发 RRC set up 之 后终端无响应造成 RRC 连接超时,导致 RRC 接入失败。查看基本上是 UE ID 为 1 和 3 的 用户的失败,但是查看最近的 RSRP 均较高。 定位过程:定位过程: 查看小区的 IOT 以及小区状态正常,对此小区进行核查,发现参数在非持续调度功率 设置上出现问题,当此小区是-95,全网当时都已经改成-70,通过对全网此参数的核查, 发现还有 NBYZ 理工学院 2FHTL-2 也是设置为-95,指标也很差。 解决建议:解决建议: 效果:效果: 把小区的非持续调度功率从-95 修改到-70 以后指标明显有提升: 网元友好名时间 RAB 建立 成功率 分母单 位:次 RAB 建立 成功率 分子单 位:次 RRC 连接 建立成 功率分 母单位: 次 RRC 连接 建立成 功率分 子单位: 次 RRC 建立 成功率 NBYZ 技侦大楼 FHTL-0 2013/7/115151787798.72% NBYZ 技侦大楼 FHTL-0 2013/7/123535545398.15% NBYZ 技侦大楼 FHTL-0 2013/7/134440956063.16% NBYZ 技侦大楼 FHTL-0 2013/7/1420141273023.62% NBYZ 技侦大楼 FHTL-0 2013/7/1520141273023.62% NBYZ 技侦大楼 FHTL-0 2013/7/161351752514.29% NBYZ 技侦大楼 FHTL-0 2013/7/171271272318.11% 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 19 页 共 89 页 NBYZ 技侦大楼 FHTL-0 2013/7/1834315316011.30% NBYZ 技侦大楼 FHTL-0 2013/7/1954501218771.90% NBYZ 技侦大楼 FHTL-0 2013/7/201919262596.15% NBYZ 技侦大楼 FHTL-0 2013/7/2113132020100.00% NBYZ 技侦大楼 FHTL-0 2013/7/2247475151100.00% NBYZ 技侦大楼 FHTL-0 2013/7/2322222828100.00% 3.5.3小区测试开关参数问题 问题现象问题现象: 在月苑二试扩 L-3 小区下收不到该小区信号,无法接入该小区,导致该路段信号较弱, 较大区域形成弱覆盖。 问题分析:问题分析: 测试车辆在月苑南路自西向东行驶至和墨香路交叉口区域,在交叉口区域该站下无法 收到该小区信号,导致该路段覆盖较差,严重影响下载速率,机房核查小区状态正常,无 告警情况。 图一 在后台对比核查参数发现,小区加载开关打开,且带真实用户的模拟快开关关闭,导 致用户终端无法接入。MAC 测试开关里有小区加载开关和带真实用户的模拟加载开关,小 区加载开关打开的话,带真实用户的模拟加载开关就会生效。当需要加扰测试时需要把小 区加载开关打开,而此时如果带真实用户的模拟加载开关关闭,表示小区处于模拟用户加 载情况,真实用户不能接入,如果带真实用户的模拟加载开关打开,表示是用真实用户进 行加载,则真实用户可以接入。月苑二试扩小区正是由于小区处于模拟加载状态,且关闭 了带真实用户的模拟加载开关导致测试终端搜不到小区信号,无法正常接入; 解决建议:解决建议:关闭小区加载开关 解决效果:解决效果: 关闭小区加载开关后,终端能正常搜到小区信号,且接入正常。如下图: 问题总结问题总结 对于无法接入小区的问题,建议处理措施: a)核查小区状态和告警以及硬件问题情况。 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 21 页 共 89 页 b)核查是否由参数问题导致 小区加载开关默认关闭,在现网中进行模拟加载等测试时,测试完成后需要对参数及 时进行恢复。 3.5.4内存池耗尽导致信令发送失败问题 问题描述:问题描述: 南京 F 鼓楼四条巷专项 L 基站 RRC 接入失败率很高,查看指标时段趋势,在有业务 的时段都有 RRC 接入失败率较高的问题存在。实时查看小区无上行干扰,由于 RRC 接入 失败次数较多,影响全网全天的 KPI 指标数据。 问题分析:问题分析: 从指标劣化趋势看,在 7 点左右统计的 RRC 接入失败次数最多,一个时段内高达 22 次的失败。 从 CDL 信令看,UE 在不断的在做 TAU 更新,RRC 接入失败时是由于在随机接入过 程中,UE 上发 RRCConnectionRequest, ENB 回复 RRCConnectionSetup 但可能 UE 未收到, 导致 RRC 接入超时,ENB 侧未收到 RRCConnectionSetupComplete 消息,具体 CDL 信令情 况如下: 通过 NAS 解码可以得出此为 TAU 过程: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 23 页 共 89 页 定位过程:定位过程: 从 mapinfo 中,目标基站 F 鼓楼四条巷专项 L 所处位置属于边缘覆盖,F 鼓楼四条巷 专项 L-2 和 F 鼓楼四条巷专项 L-3 小区覆盖方向无其他小区衔接覆盖。 查看 EXCEPTION 日志,对应失败的时间点事 6:50 7:11 7:34 7:40,每个时间点都对 应下面两条告警。未知的消息和定时器超时,从 CDL 中统计失败原因都是收到 RRC 建立 完成消息超时。 通过分析日志,发现:半小时之间没有发送接收成功任何 信令;存在很多信令发送失败的情况,原因为内存池耗尽。查看号 日志以及控制台日志,和配置文件里,发现对端 100.68.131.214 和 100.68.131.221 同 时配置为客户端和服务器,导致了基站 SCTP 内存池耗尽,消息发不出去,造成 RRC 接入 失败。 解决建议:解决建议: 1、 由于对端 IP:100.68.131.214 和 IP:100.68.131.221 同时配置为客户端和服务器,这 个配置触发了内存耗尽,导致信令发送失败的现象,删除并只保留对端 100.68.131.214 和 100.68.131.221 配置为客户端和服务器的其中一条。 2、 升级新版本对此配置错误加保护,同时解决内存泄露的问题,以及增加对内存耗 尽后的保护,来根本解决此问题的再次发生。 3.5.5全频带高干扰导致接入失败问题 干扰定义:在每个子帧轮询一次后都会统计出在 100 个 PRB 中每个 PRB 的 IOT 值, 当 IOT 值高于 10 的 PRB 个数大于等于 3 时为高 IOT,查询 18 次(早 9:00 到晚 18:00 每个小时一次数据,统计上行两个时隙) ,如果同一个站点(包括 3 个小区)超过 6 次干扰判定为干扰小区,其中 IOT 超过 20 为干扰严重小区,IOT 在 1020 之间的为干 扰普通小区;如同一个小区多于 6 次超过 80 个 PRB 的 IOT 大于 15 判定为全频带高干 扰小区。 问题描述:问题描述: 宁波城市元年-2 小区无线接通率只有 59.38%,从信令流程上看到的是存在大量基站 收不到终端发上来的 RRCConnectionSetupComplete 消息: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 25 页 共 89 页 问题分析:问题分析: 检查基站状态正常,查看小区无相关原因告警,从指标趋势看,平均分布在每个时段; 从 CDL 信令看 UE 发起由于 enb 给 UE 发起 RRCConnectionRequest 后 ENB 下发 RRC connection setup 消息,但未收到终端上发的 RRCConnectionSetupComplete 消息,造成 RRC 连接建立完成超时,导致 RRC 连接建立失败。查询上行低噪,发现较多 的 PRB 都存在较高的 IOT 值。 对小区的 IOT 进行监控,可以看到高干扰,并且邻区并无大量用户。 解决效果:解决效果: 6 月 21 日将城市元年-2 小区 PGC 开关打开,该小区前后一周的 KPI 数据如下: ERAB掉线率 无线接通率无线掉线率 2013-6-140.56%59.38%5.26% 2013-6-153.59%85.71%60.00% 2013-6-160.00%82.14%0.00% 2013-6-171.44%82.54%11.54% 2013-6-180.68%89.31%3.57% 2013-6-192.71%57.25%27.27% 2013-6-200.00%100.00%0.00% 14 日-20 日平均值 1.28%79.48%15.38% 2013-6-21 (打开 PGC 开关) 0.33%97.44%0.00% 2013-6-220.52%100.00%5.88% 2013-6-230.00%98.39%0.00% 2013-6-241.44%62.79%12.50% 2013-6-251.18%92.86%6.82% 2013-6-260.36%92.98%2.00% 2013-6-270.73%96.00%2.38% 2013-6-280.89%97.30%3.23% 22 日-28 日平均值 0.73%91.47%4.69% 其中 6 月 20 日 KPI 数据异常,在未打开 PGC 开关的情况下各项 KPI 指标都非常好, 查看 KPI 原始数据确认是当天业务量太少: RAB 建立 成功率分 母单位: 次 RAB 建立 成功率分 子单位: 次 RRC 连接 建立成功 率分母 单位:次 RRC 连接 建立成功 率分子 单位:次 无线接通 率 1919643859.38% 1010282485.71% 1313282382.14% 2726494282.54% 5756888089.31% 22221387957.25% 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 27 页 共 89 页 4455100.00% 6767787697.44% 如上述表格数据说明,在打开 PGC 开关后,无线接通率有所提升。 4ERAB 建立成功率建立成功率 4.1理论介绍 涉及话统打点涉及话统打点 图 1 图 2 如图 1 或图 2 中 A 点所示,当 eNodeB 收到来自 MME 的 INITIAL CONTEXT SETUP REQUEST 或者 E-RAB SETUP REQUEST 消息时统计该指标。如果 INITIAL CONTEXT SETUP REQUEST 或者 E-RAB SETUP REQUEST 消息中要求同时建立多个 E-RAB,则相 应指标根据业务的 QCI 按具体的 E-RAB 建立数目分别进行累加。 如图 1 或图 2 中 B 点所示,当 eNodeB 向 MME 发送 E-RAB SETUP RESPONSE 或者 INITIAL CONTEXT SETUP RESPONSE 消息时统计该指标。如果 E-RAB SETUP RESPONSE 或者 INITIAL CONTEXT SETUP RESPONSE 消息中同时携带多个 E-RAB 的建 立,则相应指标按各个业务的 QCI 分别进行累加。 指标指标指标描述指标描述 小区 E-RAB 尝试建立总次数用户尝试发起 E-RAB 建立流程的总次数 小区 E-RAB 建立成功总次数用户发起 E-RAB 建立流程,建立成功的总次数 核心网问题导致 E-RAB 建立失败次数小区 E-RAB 建立失败原因 传输层问题导致 E-RAB 建立失败次数 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 29 页 共 89 页 无线层问题导致 E-RAB 建立失败次数 无线资源不足导致 E-RAB 建立失败次数 安全模式配置失败导致 ERAB 建立失败次数 此外,话统还针对各 QCI 进行了 ERAB 尝试建立次数和 ERAB 建立成功次数的统计。 由于目前很少用到不同的 QCI,业务基本以 QCI6 的业务为主,所以不需要关注具体的 业务类别的 ERAB 统计。 4.2指标定义 ERAB 建立成功率小区 E-RAB 建立成功总次数/小区 E-RAB 尝试建立总次数 100 小区无线接通率RRC 建立成功率ERAB 建立成功率。 4.3CDL 信令流程及失败原因 4.3.1正常过程 上下文建立过程基本流程 MMEeNBUES1接口UU接口 S1 Initial Context Setup Request S1 Initial Context Setup Response 上下文建立过程基本流程 上下文建立流程是以 S1 Initial Context Setup Request 开始,此后所有的消息都可以提 取相同的 eNBUEID。S1 Initial Context Setup Response 消息标志着上下文建立基本流程的结 束。S1 Initial Context Setup Request 消息的详细解码结果中,E- RABToBeSetupListCtxtSUReq 里面的承载个数等于 1 时,意味着这次上下文建立过程只是 建立默认承载;而当此值大于 1 时,则意味着这次上下文建立过程除了建立默认承载外还 要建立专用承载。在 S1 Initial Context Setup Response 消息的详细解码结果中,E- RABSetupListCtxtSURes 里面的承载个数代表建立成功的默认承载和专用承载数目,E- RABList 里面的承载个数代表建立失败的默认承载和专用承载数目。 专用承载建立基本流程 MMEeNBUES1接口UU接口 S1 ERAB Setup Request S1 ERAB Setup Response 专用承载建立基本流程 专用承载建立流程以 S1 ERAB Setup Request 消息开始,此后所有的消息都可以提取相 同的 eNBUEID。S1 ERAB Setup Response 消息标志着专用承载建立基本流程的结束。 4.3.2异常过程 i.上下文建立过程中等待 UE 能力信息超时 MMEeNBUES1接口UU接口 UE Capability Enquiry S1 Initial Context Setup Request S1 Initial Context Setup Failure 上下文建立过程中等待 UE 能力信息超时 当看到 UE Capability Enquiry 和 S1 Initial Context Setup Failure 消息并且第 3 条消息的 value Cause 字段的值为 failure-in-radio-interface-procedure 时,标志着上下文建立流程中 UE 能力信息超时。 ii.上下文建立过程中等待安全模式完成超时 MMEeNBUES1接口UU接口 S1 Initial Context Setup Request S1 Initial Context Setup Failure Security Mode Command 上下文建立过程中等待安全模式完成超时 当看到 Security Mode Command 和 S1 Initial Context Setup Failure 消息并且最后一条消 息的 value Cause 字段的值为 failure-in-radio-interface-procedure 时,标志着上下文建立流程 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 31 页 共 89 页 中安全模式命令消息超时。 iii.上下文建立过程中等待 RRC 重配完成超时 MMEeNBUES1接口UU接口 S1 Initial Context Setup Request S1 Initial Context Setup Failure RRC Connection Reconfiguration 上下文建立过程中等待 RRC 重配完成超时 当看到 RRC Connection Reconfiguration 和 S1 Initial Context Setup Failure 消息并且最后 一条消息的 value Cause 字段的值为 failure-in-radio-interface-procedure 时,标志着上下文建 立流程中空口重配置消息超时。 iv.上下文建立过程中 AS 安全失败 MMEeNBUES1接口UU接口 S1 Initial Context Setup Request Security Mode Failure S1 Initial Context Setup Failure Security Mode Command 上下文建立过程中 AS 安全失败 当看到 Security Mode Failure 消息时,标志着上下文建立流程中安全配置失败。 v.上下文建立过程中传输错误 MMEeNBUES1接口UU接口 S1 Initial Context Setup Request S1 Initial Context Setup Failure 上下文建立过程中传输错误 当看到 S1 Initial Context Setup Failure 消息并且其详细解码中的 value Cause 字段为 transport-resource-unavailable 时,标志着上下文建立流程中传输错误。 vi.上下文建立过程中内部其他错误 MMEeNBUES1接口UU接口 S1 Initial Context Setup Request S1 Initial Context Setup Failure 上下文建立过程中内部其他错误 当看到 S1 Initial Context Setup Failure 消息并且其详细解码中的 value Cause 字段不为 failure-in-radio-interface-procedure、transport-resource-unavailable 和 encryption-and-or- integrity-protection-algorithms-not-supported 时,标志着上下文建立流程中内部其他错误。 vii.专用承载建立过程中等待 RRC 重配完成超时 MMEeNBUES1接口UU接口 S1 ERAB Setup Request RRC Connection Reconfiguration S1 UE Context Release Request 专用承载建立过程中等待 RRC 重配完成超时 当看到 RRC Connection Reconfiguration 和 S1 UE Context Release Request 消息并且最后 一条消息的 value Cause 字段的值为 failure-in-radio-interface-procedure 时,标志着专用承载 建立流程中空口重配置消息超时。 4.4相关案例介绍分析 4.4.1路由关系未配无法接入的问题 问题描述:问题描述: 兰州 LTE 示范站,连接的是华为核心网,基站开通后,SCTP 链路正常建立,小区正 常,但是终端无法附着成功。 问题分析:问题分析: 通过信令流程分析,在终端 RRC 建立完成,鉴权、安全流程完成后,核心网下发了终 端上下文建立的请求 ,之后基站直接回复了上下文建立失败,失败原因 value Cause : transport : transport-resource-unavailable,如下图: 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 33 页 共 89 页 定位过程:定位过程: 根据信令流程提示,通过查看失败信令的前一条信令,核心网下发上下文建立请求消 息中,携带的 sgw iP 地址如下图,转化成十进制是:100.89.1.1: 而在基站的传输配置中,检查路由配置关系中发现,基站路由中没有添加到 100.89.1.1 这个网段的路由,所以导致了终端由于没有传输路由而上下文建立失败。 解决效果:解决效果: 现场添加完成该网段路由后,终端附着成功,业务正常。 4.4.2网关 IP 配置错误导致无法附着 问题描述:问题描述: 南京统计 KPI 指标发现南体分校试扩 L ERAB 建立全部失败,全天失败次数在两万多次, 严重影响了全网指标。 问题分析:问题分析: 通过提取该站的 CDL log 分析发现,终端 RRC 建立已完成,鉴权和安全也已通过,核 心网下发了终端上下文建立的请求后,基站直接回复了上下文建立失败,失败原因 value Cause : transport : transport-resource-unavailable,通过 ATP 跟踪信令流程和 CDL 看到的结 果一样,如下图: 定位过程:定位过程: 从 CDL log 中的 InitialContextSetupRequest 消息中 transportLayerAddress B 对应的 大唐移动通信设备有限公司 TD-LTE 网优 KPI 指标优化工作指导手册 第 35 页 共 89 页 是 100.68.253.17,通过核查确认核心网侧的 SGW IP 确定是 100.68.253.17。对 enb 侧的路 由设置进行检查,S1 链路断链恢复后,该基站的路由中包含 100.68.253.17 的路由。 而后通过仔细核查该路由关系,发现该条路由关系中网关 IP 地址:100.68.132

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论