VoLTE集中分析方法与应用_第1页
VoLTE集中分析方法与应用_第2页
VoLTE集中分析方法与应用_第3页
VoLTE集中分析方法与应用_第4页
VoLTE集中分析方法与应用_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录一工作背景及成效二VoLTE集中分析方法三下一步工作思路第一页,共24页。分析优化规则不完善端到端分析方法欠缺评估指标统计标准不统一VoLTE集中分析与优化存在的问题前期集中分析优化规则均为LTE数据业务,VoLTE新增大量流程环节,分析优化规则需重新探索;端到端网元种类多,目前无相关分析定界规则;性能分析未有效结合信令关联分析。端到端流程长,涉及专业多,问题定位难。如VoLTE接入失败,原因可能涉及无线网、EPC、传输、IMS、增值业务平台等;各网元失败原因值不同,关联分析困难。如eSRVCC切换基站侧统计主要失败原因为7种,信令监测为10种,之间关系不统一,没有统一关联;单维分析不能精确定位问题。需建立多维数据的关联分析方法,提高问题定位精度。各系统节点统计差异大,如eSRVCC切换成功率指标网优平台为96.2%,信令监测为94.1%,eMSC网元统计为89.3%;部分用户原因导致的失败,仍然计入失败统计,浪费大量的资源去分析定位,指标统计需进一步规范。VoLTE集中分析与优化目前主要面临分析优化规则不完善、端到端分析方法欠缺、质量评估指标统计标准不统一等问题。第二页,共24页。VoLTE集中分析优化工作成效问题定位准确率高优化工作效率提升质量指标改善明显我省通过开展VoLTE集中分析与优化工作,有效提升了问题定位准确率和工单处理效率,网络质量得到明显改善。7-9月共产生VoLTE工单593张,运用集中分析方法准确定位问题493个,问题定位准确率达83.14%。已定位无线问题的主要原因为弱覆盖、干扰、故障,分别占36.27%、23.44%、13.64%。通过智能分析系统落地集中分析优化方法,平均每张工单处理时长较人工方式节省30分钟,全省7-9月工单集中分析共节省50人天,后续随着系统不断完善和工单量增加,效益将更加明显。通过开展VoLTE集中分析优化,各项关键指标较年初得到明显改善。8月份VoLTE接通率从98.3%提升至99.6%,VoLTE掉话率从0.27%下降至0.12%,eSRVCC切换成功率从90.3%提升至96.18%。数据来源:网优平台第三页,共24页。目录一工作背景及成效二VoLTE集中分析方法三下一步工作思路集中分析总体架构及方法原因值分析定界法语数协同关联定界法增强八步定位法多维指纹库定位法集中优化方法综合应用第四页,共24页。VoLTE集中分析架构及方法(1/2)系统架构:分为采集层、数据存储层、应用层系统界面:多维呈现

我省在原有的LTE集中分析优化体系基础上,完善了VoLTE集中分析与优化方法,其中新增功能模块5个,改造功能模块3个,已通过智能专家分析系统全面落地。无线侧数据网络侧数据其他数据应用层:集中分析LTE性能工单智能分析算法引擎数据存储层数据清洗数据适配采集层MRO/MRSDT/CQT/扫频数据PM/NRM数据告警数据XDR/CHRHadoop平台SQLServer数据库高价值密度结构化数据低价值密度半结构化、非结构化数据其他引擎八维度算法引擎路测算法引擎信令算法引擎量化关联法引擎时间相关性引擎数据过滤业务关联时间关联空间关联Volte性能工单智能分析MR工单智能分析室分工单智能分析路测工单智能分析Volte路测工单智能分析干扰工单智能分析地理信息数据栅格场景数据问题属性库厂家OMC数据网优平台路测系统厂家OMC信令系统MR地图栅格化系统系统互联(1)性能评分(2)问题表征(3)问题原因(4)分析模块(5)分析元素(6)关键KPI展示(7)多维度指标呈现(8)多维度自查报告(9)优化方案建议采集层系统互联:打通不同平台的数据接口,与其他平台交互数据多维数据解析:对原始数据清洗、过滤等粗加工;完成隐私加密确保数据安全;数据存储层数据仓库:完成数据汇总、问题原因和问题表征标准化;算法引擎:各维度算法模块化;应用层集中分析:针对各种类型的工单进行集中分析,输出工单预处理方案建议。第五页,共24页。针对VoLTE网络特点,我省从拓展发现手段、创新分析方法、完善分析规则三个方面进行研究,形成了一套VoLTE集中分析优化方法,提升了VoLTE集中分析效率与准确率。性能实时性能非实时性能测试ATU测试商用终端测试掌上网优MRMRO/MRS/MREVoLTE性能指标的原因值VoLTEXDR信令软采拓展数据源八步分析法干扰分析覆盖分析故障分析资源分析参数分析Counter分析邻区分析两两邻区对分析精准定位八步量化关联分析:挖掘历史数据,量化具体权重时间拟合关联分析:精准拟合影响根因立体多维指纹库分析:多维数据关联,定位端到端问题精确定界原因值分析定界法语数协同关联定界法终端、用户聚类分析定界方案输出方案执行效果评估规则完善创新分析方法拓展发现手段创新分析方法完善分析规则系统自学习案例收集方案匹配规则梳理目前系统已实现580条规则梳理VoLTE集中分析架构及方法(2/2)第六页,共24页。精确定界:原因值分析定界法(1/2)我省从无线入手,深入分析VoLTE各类指标对应的无线失败原因值,总结问题根因,梳理处理规则,探索基于失败原因值的定界分析方法。定界分析思路针对VoLTE接通率、掉话率、eSRVCC切换成功率、重建、丢包等VoLTE关键指标各自对应失败原因值进行详细分析,研究各种失败原因值对应的失败码或信令流程,定位问题原因,确定问题排查方法。针对VoLTE5个关键指标,39个失败原因值形成了各原因值对应的分析流程,梳理了120多条无线和端到端的分析规则,在集团指导下输出《VoLTE无线性能集中分析》指导手册。同时把规则在平台进行固化,提高问题定界准确性。规则梳理成果原因值梳理基于原因值的信令分析问题定界及排查规则涵盖各厂家无线失败原因值及相应定义失败码分析信令流程分析制定各具体失败原因值对应的排查方法第七页,共24页。规则梳理举例如eSRVCC切换失败主要有六大类原因,确定失败原因主要对应3个关键信令节点,针对信令节点及错误代码分析故障可能的原因,最终确定问题的排查规则。以“LTE到GSM的切换出准备失败次数,等待切换响应定时器超时”为例:问题定界及规则梳理eSRVCC失败原因值LTE到GSM的切换出准备失败次数,等待切换响应定时器超时LTE到GSM的切换出准备失败次数,目标侧准备失败LTE到GSM的切换出准备失败次数,其它原因LTE到GSM的切换出执行失败次数,源侧发生重建立LTE到GSM的切换出执行失败次数,等待UECONTEXTRELEASE消息超时LTE到GSM的切换出执行失败次数,其他原因源侧发送HandoverRequired后在定时器时间内未收到HandoverCommand命令eNodeB定时器参数、传输问题、MME、eMSC、GSM侧参数配置错误、基站故障核查eNB参数“S1HO时等待HOCOMMAND的定时器”是否小于5s。MME是否收到HandoverRequied消息:“否”,则核查eNB与MME之间的传输;MME是否向eMSC进行PstoCsReq消息转发:“否”,则协调MME共同进行排查;eMSC是否收到PstoCsreq消息:“否”,则核查MME与eMSC之间的传输;eMSC是否回复PstoCsRsp:“否”,则协调GSM侧共同进行排查;eMSC回复PstoCsRsp后MME是否收到:“否”,则核查MME与eMSC之间传输;MME是否向eNB发送HandoverCommand:“否”,则协调MME共同进行排查;eNB是否收到HandoverCommand:“否”,则核查eNB与MME传输。精确定界:原因值分析定界法(2/2)问题定界及排查规则基于原因值的信令分析原因值梳理梳理eSRVCC失败的各类原因值备注:信令采样点2/4/9即表示在定时器时间未收到响应消息。备注:中兴基站统计第八页,共24页。目前部分VoLTE指标的失败原因值存在定界指向不明确问题,分析总结经验数据发现:如果为无线原因造成指标劣化,则VoLTE业务与数据业务指标趋势相关性较强;如果为核心侧及终端原因造成,则VoLTE业务与数据业务指标趋势相关性较弱。目前系统已对VoLTE接通率、掉话率、丢包率等指标实现了语数协同关联定界,准确率达到95%以上。针对部分定界不明确的原因值(如“E-RAB建立失败次数,其他原因(QCI=1)”),因无线、核心侧及终端均有可能存在问题,无法清晰定界。本方法对VoLTE业务与数据业务在无线侧的相关性进行分析,挖掘无线指标的拟合趋势特征,辅助VoLTE原因值定界。如下图所示,当VoLTE与数据业务相关性强,则定界无线问题(情形一);当VoLTE与数据业务相关性弱,则重点转入核心侧及终端排查(情形二)。拟合分析:VoLTE与数据业务指标相关性强情形一:重点转入排查无线网问题(EPC以下)情形二:重点转入排查核心侧及终端问题语数协同关联定界思路精确定界-语数协同关联定界法(1/2)拟合分析:VoLTE与数据业务指标相关性弱第九页,共24页。关联分析算法通过上述定界思路在智能分析系统进行固化,确定反映指标间相关性强弱程度的皮尔逊公式(右图),

为变量x和y相关系数,

为变量x的第i个采样值、为变量x采样均值,为变量y的第i个采样值、为变量y采样均值;根据相关性系数临界标准(0.8~1.0为极强相关、0.6~0.8强相关、0.4~0.6中等相关、0~0.4弱相关)、结合优化经验验证,确定相关系数大于0.6为强相关(准确率90%以上)、相关系数小于0.4为弱相关。精确定界-语数协同关联定界法(2/2)语数协同关联定界法固化举例图1小区,VoLTE业务与数据业务的E-RAB建立成功率相关性弱(相关系数为0.25、小于0.4),属核心侧或终端问题,经VoLTE信令监测验证、未接通均为同款终端导致(奥乐LT28)图2小区,VoLTE业务与数据业务的E-RAB建立成功率相关性强(相关系数为0.82、大于0.6),问题归属无线侧,通过八步法验证问题根因是告警导致(“天馈驻波比异常”)图1图2第十页,共24页。如果初步界定为终端问题,进入终端问题抓包定位环节;如果初步定位为用户原因,对用户行为无线环境及终端进行进一步分析。针对语数协同关联分析中,相关性较弱的VoLTE劣化小区,我省建立了小区维度的VoLTE终端、用户问题定界方法,提升了集中分析工作效率。精确定界-终端、用户聚类分析定界法运用VoLTE信令监测系统,首先把终端、用户失败次数及原因回填到小区中,形成了劣化小区的TOPN质差终端、用户进行统计,再关联质差、用户终端在全网的性能进行对比分析,对终端、用户问题进行初步定界。TOP小区终端维度聚类分析TOP小区用户维度聚类分析小区级TOPN终端、用户KPI统计全网级终端、用户KPI统计某终端/用户KPI指标是否仅在劣化小区表现差关联分析劣化小区下其他终端/用户KPI指标是否同样表现差初步定界为终端/用户问题初步定界为小区问题否是是否第十一页,共24页。精准定位-增强型八步定位法(1/2)VoLTE指标劣化八步法原因(如故障、干扰、覆盖、容量等)细化原因(如过覆盖、互调干扰、邻区漏配等)如何准确定位?目前确定指标劣化的关键原因、以及原因的处理优先级,主要通过网优人员经验判断,缺少理论依据及量化标准,为提升定位准确性,考虑借助历史大数据(量化关联法)以及时间相关性(时间拟合关联法)等特性实现精准关联定位。某小区核查共有三个主要问题原因,其中网外干扰影响无线接通率指标劣化的重要程度归一化系数最大、为0.50,邻区漏定义影响指标重要程度系数为0.37,过覆盖影响指标重要程度系数为0.13。从关联系数大小可以看出,本小区应该优先处理干扰原因。案例问题原因变化趋势同时段指标变化趋势问题原因与指标量化关联形成规则历史案例大数据数学建模:模型输出结果:规则库:大量的原因与指标之间的关联规则积累归一化处理:实际应用中,八步分析法会同时核查出多个原因影响劣化指标。基于前期形成的规则库结果,通过归一化处理,输出原因影响指标的相对重要程度,即关联系数。如左图:互调干扰影响无线接通率指标的关联系数为0.76,弱覆盖影响指标的关联系数为0.24。总体思路确定问题原因与指标劣化之间的关联规则,用于提示各类问题原因与某个(组)指标劣化的相关性,供网优人员准确地判断造成该指标劣化的核心原因,目前已完成36种细化原因与381个指标间的关联匹配规则。应用量化关联,提升准确率第十二页,共24页。精准定位-增强型八步定位法(2/2)针对各类指标劣化,在量化八步定位基础上,通过时间拟合关联分析进一步实现精确定位。为实现精准定位,将VoLTE指标与八步法各元素的时间分布趋势进行两两拟合分析,进一步确定各类问题原因的优先级,提高问题定位准确性。右图举例为干扰导致VoLTE掉话的拟合分析情况。拟合分析:干扰与VoLTE掉话的时间分布趋势强相关举例:干扰与VoLTE掉话的时间分布趋势强相关思路以下图为例,借助时间拟合关联分析法、准确定位VoLTE接通率劣化的关键原因为网外干扰,相关系数为0.87。案例时间拟合关联分析①VoLTE接通率劣化时间分布趋势②干扰产生时间分布趋势③拟合关联分析确定关键原因为

“网外干扰”,相关系数为0.87第十三页,共24页。VoLTE端到端定位问题困难:1)从统计上分析,存在一个原因对应多个网元多种问题,单维度分析无法精确定位问题;2)问题分析需要熟悉多网元信令各步流程,人员素质要求高。在前期大量问题分析经验的基础上,我省整理出一种VoLTE多维指纹库端到端精准定位分析法。输入小区级多维网元原因值性能统计和相关的XDR信令,经过多维指纹库匹配分析,输出小区维度端到端失败问题的准确原因。多维指纹库定位法思路端到端精准定位-多维指纹库分析方法eNodeBBTSUEUEMME/eMSC/SBC…UULTE侧GSM侧核心网侧Um数据输入多维指纹库分析网元定界根因定位S1口失败原因码和次数基站失败原因码和次数Sv口失败原因码和次数XDR关键信令覆盖问题干扰问题参数配置故障问题参数配置传输链路故障问题流程冲突参数配置资源拥塞干扰问题传输链路用户原因………………终端问题TOP小区关键信令特征交互时长特征失败原因特征第十四页,共24页。端到端精准定位-多维指纹库建立方法第一特征第二特征第三特征关键交互信令反馈时长(反映到达网元)基站失败原因S1口失败原因Sv口失败原因HandoverPreparationFailureUEContextreleasecommandSRVCCPSTOCSCANCELNOTIFICATIONPStoCS

responseeNodeB:handoverrquired-HandoverPreparationFailure(2ms,40ms,80ms,200ms)eMSC:pstocsreponse-SRVCCPSTOCSCANCELNOTIFICATION(2s,6s)关键信令差异(不同域问题反馈的信令存差异)各网元失败原因(关联分析)多维特征获取指纹库建立方法通过对现网大量问题进行分析及原因定位,梳理能对相关问题进行精准定位特征。抽取对指标分析定位具有关键作用的特征,如针对eSRVCC指标分析确定了三类特征:第一特征:TOP小区的多网元联合原因值。通过关联分析解决单个网元原因值定位模糊问题,如基站某类原因值对应8种可能的问题,通过使用多个网元/接口的原因联合分析可把问题定位为1-2种可能的问题。第二特征:关键信令差异。通过同一接口失败信令的不同,可进一步判断问题网元。第三特征:关键交互信令反馈时长。可通过信令反馈时长判断是哪个网元反馈的失败,定位问题网元。多维指纹库建立

分析流程简单,可操作性强;

定位问题准确,通过第一类特征+指纹库分析,就能快速精确定位95%以上失败原因;发现问题多,已经完成500多个问题的定位,发现了很多前期未关注或者未定位的问题,如基站定时器设置问题、切换请求不规范、MME链路监测机制问题、不同厂家原因码不规范、无线、核心网数据配置等问题。应用效果第十五页,共24页。针对该小区关联基站、S1、Sv口三个维度的失败统计:基站失败95次原因为:目标侧准备失败;S1口失败95次原因为:radioNetwork:unknown-targetID(11);Sv口未发现失败。获取特征后,利用指纹库分析。问题现象湘潭狮子岭小区3TOP小区基站统计失败95次,eSRVCC切换成功率仅为46%,失败原因为目标侧准备失败;信令监测上统计该小区切换成功率为100%,失败为0次。问题指纹库分析该TOP小区问题定界网元是MME,具体原因是由于MME未配置目标小区TAC数据问题。端到端精准定位-多维指纹库应用分析(1/3)问题3:基站统计准备失败81%都是该类原因,涉及端到端排查8个步骤,进行原因排查,无法短时间进行精确定位。问题1:信令监测没有失败统计,单纯从信令监测分析会遗漏部分问题;问题2:信令监测无失败无法进一步钻取信令分析,现场复测很难复现,对该问题定位存在困难。问题定位分析结果第十六页,共24页。端到端精准定位-多维指纹库应用分析(2/3)目前通过单维原因值分析存在多类问题定位不明确,如基站侧最多的失败原因值为“LTE到GSM的SRVCC切换出执行失败次数,其它原因”占比65%;S1口失败原因为9-65535占比61%;信令监测失败原因为cause2占比77%。各个网元/接口统计的失败原因值定义不同,缺少关联,无法准确定位问题。通过指纹库第一特征多维原因值关联分析,把问题定位更加明确。S1口失败原因基站失败原因信令监测失败原因原因占比定界网元定位原因1-6LTE到GSM的SRVCC切换出准备失败次数,目标侧准备失败73_3:Noresourcesavailable_Handover/RelocationFailurewithTargetsystem7%eNodeB、BSC参数问题,LTE-GSM外部邻区LAC、CI配错、BSC未开启“异系统入BSC切换允许”开关1-6LTE到GSM的SRVCC切换出准备失败次数,目标侧准备失败73_7:Noresourcesavailable_NoRadioResourcesAvailableinTargetCell4%BSC资源问题,GSM侧资源拥塞9-65535LTE到GSM的SRVCC切换出执行失败次数,源侧重建立Handover/Relocation

cancelled

by

source

system(2)38%空口终端或者无线问题,切换执行阶段切换失败,回滚重建立源小区9-65535LTE到GSM的SRVCC切换出执行失败次数,其它原因Unspecified(1)

5%空口终端或者无线问题(诺基亚基站),切换执行阶段切换失败,回滚重建立源小区9-65535LTE到GSM的SRVCC切换出执行失败次数,其它原因Handover/Relocation

cancelled

by

source

system(2)18%空口终端或者无线问题,切换执行阶段失败,回滚重建立在其他小区1-6LTE到GSM的SRVCC切换出准备失败次数,目标侧准备失败Handover/Relocation

cancelled

by

source

system(2)5%用户切换过程中用户挂机。17%基站统计各种原因值分布S1口统计各种原因值分布Sv口统计各种原因值分布第十七页,共24页。针对第一特征库未定位的问题,如下表通过第一特征关联分析该问题可能为BSC或者eNodeB参数配置问题,需要运用其他特征库进行分析。S1口失败原因基站失败原因信令监测失败原因定界网元定位原因1-6LTE到GSM的SRVCC切换出准备失败次数,目标侧准备失败73_3:Noresourcesavailable_Handover/RelocationFailurewithTargetsystemBSCeNodeB参数问题,BSC未开启“异系统入BSC切换允许”开关参数问题,LTE-GSM外部邻区LAC、CI配错HandoverrequireeNodeBMMEHandoverPreparationFailure不同的返回失败间隔时间,判断问题网元HandoverPreparationFailure(1)80ms后返回切换准备失败(2)200ms后返回切换准备失败80ms--MSC返回错误,问题定位为eNodeB问题,如外部邻区参数配置错误;200ms—BSC返回错误,问题定位为BSC问题,如未开启“异系统入BSC切换允许”开关。端到端精准定位-多维指纹库应用分析(3/3)通过关键信令交互反馈时长特征,进一步精准定位问题。第十八页,共24页。步骤①原因值定界:“空口失败”,定界无线问题,初步确定重点核查故障、干扰、覆盖等集中分析方法综合应用-VoLTE接通率某小区8月14日VoLTE接通率从99.54%劣化至80.07%:

步骤①:通过原因值定界法判断为无线问题、重点核查故障、干扰、覆盖等;

步骤②语数协同关联定界:无线接通率(QCI=1)与无线接通率拟合后为强相关,进一步明确为无线问题步骤④输出方案:优化方案为通过处理射频单元故障解决问题,步骤③时间拟合关联:将无线接通率(QCI=1)与八步法分析元素进行拟合关联分析,其中故障问题与VoLTE接通率指标强相关,判断根因是射频单元告警。步骤④:优化方案为处理射频单元故障解决问题;步骤⑤:现场处理射频单元故障、相关问题得到解决,统计掉线率恢复为99.63%,VoLTE接通率恢复正常。步骤③:通过时间拟合关联法、判断根因是射频单元告警;步骤②:通过语数协同关联定界法,进一步明确为无线问题;第十九页,共24页。步骤①原因值定界:“ENB其他异常原因”,需进一步定界集中分析方法综合应用-VoLTE掉话率某小区在8月29日VoLTE掉话率从0%劣化至18%。

步骤②语数协同关联定界:E-RAB掉线率(QCI=1)与E-RAB掉线率弱相关,定界为核心侧或终端问题步骤③终端聚类分析:该小区掉话均为同一用户使用沃普丰WPV1手机导致步骤④终端测试抓包分析:IMS承载更新时,终端更新了不带前缀的IPV6地址给IMS,因地址错误UE无法发送语音包,导致对端收不到语

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论