广东省LTE优化经验交流201503_第1页
广东省LTE优化经验交流201503_第2页
广东省LTE优化经验交流201503_第3页
广东省LTE优化经验交流201503_第4页
广东省LTE优化经验交流201503_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2015年3月广东省LTE优化经验交流 传统话音网络的运维只需要关注网元/网络维护;移动互联网时代,网络维护需要逐步从单纯面向网元/网络维护向面向终端、网络和业务平台端到端客户感知管理转变 网络KPI好不代表用户感知好,还需从客户角度、业务角度(如微信、视频)做好客户感知管理 端到端业务质量分析缺乏有效的评估分析和定位手段,LTE信令分析系统尚在建设优化中。业务质量分析、互操作等质量问题难以进行分析和优化,支撑手段和维护经验相对欠缺(2014年)。移动互联网时代,业务端到端感知依赖业务过程涉及的各个专业设备、网络与终端及业务平台间的密切配合和性能;业务链长且更加开放,运营商主要对业务管道实施管

2、理和控制,无法完全把控整个业务链。背景简介:LTE业务端到端感知保障的挑战LTE业务端到端质量优化思路及目标 工作思路: LTE业务端到端质量分析以 接入快、能驻留、够通畅为目标,建立LTE端到端质量指标体系。以指标为抓手,在传统模糊定界基础上,依靠三维定界分析开展精确预判,实现与专业工作界面无缝对接。 工作目标:结合当前业务及网络发展趋势,项目主要以4G信令分析为主、2/3G信令分析为辅,结合各地市公司分析需求(工单收集)及LTE业务端到端质量指标体系,以常态化分析(侧重KPI/PI指标)和专项分析(侧重QOE/KQI指标)相结合的模式开展网络性能分析优化工作。 实现以下目的:(1)以常态化

3、体检分析和专项优化分析的形式对各地市2/3/4G网络进行业务质量分析专项优化、网络质量健康体检工作,挖掘地市网络质量短板,有针对性协同地市公司开展优化工作。(2)通过信令追踪,对各地市日常数据网络优化和疑难问题的处理提供深度支持,并结合各地市个性化分析需求开展专项优化,实现网络质量提升。(3)针对4G建网初期互操作是导致用户投诉主因之一的问题,根据现有互操作指标体系,从驻留时长、频繁重定向、频繁重选、TAU异常等方面开展质差区域、小区、用户的问题挖掘, 提升网络互操作性能。指标类型指标类型指标名称指标名称责任单位责任单位指标阈值指标阈值网元维度网元维度时间粒度时间粒度备注备注KQIKQI视频类

4、业务(下载速率)数据室1500kbpsSP/IP/URI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周剔除用户原因导致的小区质差判断规则:以用户粒度统计失败次数,失败次数TOP10的用户产生的失败占比超过小区90%,作为用户原因导致进行剔除。浏览类业务(下载速率)数据室2500kbpsSP/IP/URI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周HTTP速率数据室1500kbpsSP/IP/URI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周HTTP时延数据室450m

5、sSP/IP/URI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周HTTP掉线率数据室上行:5%下行:10%SP/IP/URI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周KPIKPIDNS成功率数据室90%目标IP/域名、DNS、终端周DNS成功时延数据室150ms目标IP/域名、DNS、终端周GET/POST成功率数据室90%/90%SP/IP/URI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周GET/POST成功响应时延数据室300ms/800msSP/IP/U

6、RI/cache/IDC、SGW/SGW POOL、cell、CMNET/CMWAP、终端周上行TCP重传率数据室0.2SP/IP/URI/cache/IDC、SGW、CMNET/CMWAP、cell、终端周下行TCP重传率数据室0.1SP/IP/URI/cache/IDC、SGW、CMNET/CMWAP、cell、终端周TCP连接成功率数据室0.9SP/IP、GW、cell、终端周TCP上行连接成功率数据室80%SP/IP、MME/GW周TCP下行连接成功率数据室0.9CELL、IMSI、终端周PIPIAttach核心室95%GW、HSS、MME、ENB、CELL、IMSI、终端周Detac

7、h核心室1MME、ENB、CELL周PS-Paging无优中心95%MME、ENB、CELL、imsi、终端周CS-Paging无优中心95%MME、ENB、CELL、imsi、终端周Service_Request成功率核心室0.95HSS、MME、ENB、cell、imsi、终端周Extended_Service成功率核心室0.95HSS、MME、ENB、CELL、IMSI、终端周E-RAB_Setup无优中心0.95MME、ENB、CELL、imsi、终端周PDN_Connectivity核心室0.85APN、HSS、GW、MME、ENB、CELL、IMSI、终端周Activate_Def

8、ault_EPS_bearer_context核心室0.95APN、GW、MME、ENB、CELL、IMSI、终端周Modify_bearer_context核心室0.95GW、MME、ENB、CELL周TAU核心室0.95HSS、MME、DNS、ENB、TAC、cell、imsi、终端周LTE端到端质量指标,面向业务质量、网络性能、网元性能,建立KQI指标5项、KPI指标11项、PI指标11项,网络互操作指标4项。以网元聚类、错误码定界等方法进行问题的定界、定位分析。指标体系:LTE业务端到端质量指标创建业务质量接入类(2/3/4G互操作)指标定义互操作指标的算法、统计维度、数据来源和统计时

9、间粒度根据4G与2/3G跨系统切换的信令特征,抽取影响用户感知的关键节点,设计互操作指标互操作指标系统落地性能管理平台,支撑日常运营 分析发现互操作问题引起的投诉占比超过50%,为发现用户在跨网络交互的问题,创建4个互操作KQI指标,包括互操作TAU成功率、用户级/网格级4G驻留时长、4G频繁回落23G小区、频繁重定向小区,填补了KQI指标体系在多网协同环境下互操作方面的空白。 从用户维度对质差小区进行分析,可以区分小区质量问题是由于单用户还是多用户引起,由此指导专业部门制定针对性解决方案,提高了质差小区定位准确率和问题解决效率,弥补了专业部门无法从用户视角进行问题发现和分析的不足;4G驻留时

10、长占比(空闲态+业务态):以用户维度统计4G用户在LTE网络时长(空闲态和业务态),4G网络体验好于2/3G网络体验,4G驻留时长占比越高,感知越好TAU成功率:以用户维度统计TAU次数及成功次数,发现用户个性问题还是小区普遍问题4G用户重定向占比:以用户维度考虑业务态4G用户重定向至2/3G的占比,发现异常频繁重定向到2/3G的4G小区和用户TAU成功率/TAU请求次数环比用户业务态频繁重定向分析驻留时长分析感知差用户 VIP客户感知保障 客户投诉预警分析 客户投诉溯源分析 终端性能优化 小区性能优化信息知会工单派发监控室、数据室无线优化中心TAU成功率/TAU请求次数环比小区业务态频繁重定

11、向分析小区空闲态频繁重选分析区域4G驻留时长占比分析指标质差小区/区域 重点区域保障 小区覆盖优化 小区性能优化 参数配置优化 LTE网络规划优化工单派发无线优化中心规划技术部核心室分析切入点分析维度应用场景应用流程接收部门用户空闲态频繁重选分析增值室 用户行为引导 终端性能优化市场部数据部信息知会终端集中度分析用户集中度分析终端集中度分析2/3/4G互操作指标体系分析思路互操作指标从跨系统重选性能、重定向性能、4G驻留时长等互操作场景着手,挖掘质差用户、小区、网格、终端,组织开展网络性能分析优化工作。三维网络路径:终端、无线接入、核心网、承载网、业务平台业务过程:CSFB业务(登记、呼叫、寻

12、呼、回落、返回)HTTP业务(附着、激活、域名解析、连接消息、业务交互)分析视角:容量、性能、承载效率、匹配、调度四方法聚类:对数据进行特征分析,把问题聚焦到某些区域、过程或网络设备的方法对比:进行同期比对发现波动性异常问题分解:把指标问题分解到影响指标和不同业务活动进行分析的方法趋势:通过趋势变动发现偶发性异常,辅助排除分析终端 无线接入核心网 承载网 业务平台容量分析性能分析承载效率分析匹配分析调度分析业务交互连接消息域名解析激活消息附着消息三维四方法分析模型网络路径业务过程分析角度分析方法:三维四方法q构建三维四方法溯源模型,以劣化的感知评分结果或业务质量指标为起始,利用聚类、对比、分解

13、和趋势四个分析方法,分别从业务过程、网络路径和分析角度三个维度进行问题分析和原因判定,实现对影响客户感知和业务质量的问题溯源闭环流程:制定明确的派单规则,提高跨部门协作效率网元维度派单规则指标名称指标阈值规则1:派单部门:无优中心; 派单周期:每周派单内容:感知较差而且无线因素影响较大的小区、下载速率较低的小区质差SP+IP地址视频类业务(下载速率)1000kbps规则2:派单部门:互联网室; 派单周期:每周派单内容:感知差的cache/IDC服务器IP地址、感知差的SP规则3:派单部门:互联网室; 派单周期:每周派单内容:下载速率低的CMNET/CMWAP、集中度高且下载速率低的终端CELL

14、驻留时长占比CELL:TOP10规则6:派单部门:无优中心; 派单周期:每周派单内容:TOP10质差小区MME、ENB、TAC、CELLTAU成功率95%规则4:派单部门:核维室; 派单周期:每周派单内容:成功率低的MME或cause值:8、10、11、14、15、16、17、18、40、42、95、96、99、100、111.规则n:.规则5:派单部门:无优中心; 派单周期:每周派单内容:成功率低的ENB、CELL、TAC或cause值:12、13、22 以全量数据为基础,覆盖了业务质量共计31个性能指标集,以“三维定界”为理论基础,在系统上固化指标告警和分析方法,实现端到端业务质量的可视、

15、可控、可分析、可溯源。 制定了66项指标派单规则,针对不同指标、不同网元维度、不同专业部门明确了指标派单规则和派单周期,真正做到责任部门明确、问题定界准确。派单内容中附带定界结论,如SP IP地址,错误码等,有利于专业室快速定位问题,解决问题支撑SOC建设的QOE算法 针对手机上网的各环节指标,构建简单直接的评估体系,通过端到端分析定界终端侧、无线侧、核心侧、SP侧问题。网络类输出结果供无线专业、核心网专业等专业班组使用,非网络类输出信息知会市场部、互联网中心、客服中心等相关部门。有业务传输质量评分的,按接入性感知评分+业务传输质量感知评分;无业务传输质量评分的按接入性判断客户的规律【是正常沉

16、默还是异常接入,若正常沉默则设置一个分值60分,异常则直接用接入性评分;接入分数在10分以上的,QOE得60+接入性评分; 接入分数在10分以下的,QOE得接入性评分。 QOE评分接入性评分+业务传输质量评分业务接入感知评分=40*【附着成功率*承载建立成功率*DNS解析成功率*TCP连接成功率*业务接入成功率*TAU成功率*4G驻留时长占比/max(1,(重定向次数/统计周期里的业务流量)/(1次/100MB)】-异常事件评分业务传输质量评分(业务传输时延评分 or 业务下载速率质量评分)掉线率评分。掉线率扣分=0或者30;当在某统计时间无掉线,则为0,若有则为30; 成效介绍:项目成果概述

17、10地市28专题36指标网络短板65项p截至2015年2月,已完成佛山,江门,云浮,肇庆,惠州,河源,梅州,湛江,茂名,阳江十个地市LTE网络的S1-C,S1-U,Sgs,S6a和S11口一周的信令数据采集和分析工作。p完善LTE性能评价指标体共计36个指标的算法定义、门限阈值、原因归类、问题定界思路、和派单规则的梳理。p完成业务性能、网络质量、互操作指标等专题28项;p累计发现互联网云端问题38项;核心网问题12项;无优问题11项;终端和WAP网关问题4项.以上问题累计输出专题报告118份,派发性能工单65张。无线共性问题分厂家设备共性问题终端问题重点专题互联网端共性问题 DNS性能问题全省

18、共性问题解决进度:已提出反向域名统计,并协同互联网室与腾讯开展优化。解决进度:已完成酷狗音乐扩容,速率从1.3M提升到3M。优酷已基本完成扩容,现等待机房资源分配。解决进度:各地市持续优化中。解决进度:优化中。 工作进展:已完成算法的制定、验证,正依托算法开展互操作衍生指标的研究。工作进展:共梳理无法上网、上网慢、掉线等场景共41项案例,持续优化中。网络质量情况-4G网络共性问题解决进度:华为P7对第一次访问的域名都会发起反向解析请求,该问题已反馈华为公司,尚未回复。云端质量问题(1) 问题描述:对惠州一周会话大于500KB的优酷视频业务流量和速率情况统计发现优酷视频的速率偏低,如下表所示:

19、问题分析:对两天会话大于500K的优酷视频业务进行域名维度流量TOP20统计得:进一步统计12月19日/24IP段和非/24IP段的视频流量及视频速率情况:分析结论:183.232.42.%的IP段占优酷视频流量的79.85%,拉低了整个优酷视频的视频速率。由上图表可知,在该两天内,会话大于500K的优酷视频业务的流量TOP20域名都集中在/24的IP段,而且流量分布较均匀,速率分布也较为均匀,平均在900kbps左右。问题跟进:优酷视频业务的流量TOP20域名都集中在“182.232.42.*”的IP段,而该IP段为广东

20、IDC网段,由于广东IDC网段该网段存在拥塞,所以导致了下载速率较低的情况。已联系政企部和优酷推动带宽和服务器扩容优化工作,目前已基本完成链路扩容,正等待机房资源分配。p截至15年3月,通过对业务维度开展下载速率、时延、掉线等维度分析,共挖掘质差业务问题38项,涵盖主流的浏览类、视频类、音乐类、即时通信类、下载类业务。部分共性问题如下:云端质量问题(2)n 酷狗音乐4G速率优化问题描述:信令统计分析发现江门、佛山片区”酷狗音乐”业务4G速率明显偏低(部分时段低至1Mbps以下)。原因定位:经提取S1口信令数据分析,原因为酷狗音乐服务器利用率高。经联合互联网室协调SP进行业务扩容,互联网侧新增访

21、问IP ()做业务分流。优化效果:优化后,9流量有所下降(下降至40%左右),速率提升至3M以上(统计500K 4G流量速率)。注1:通过SOC平台分析,在12月广州DPI已识别4G流量中,酷狗音乐流量排名第2。注2:本问题虽然对江门信令分析发现,实际为全省性问题。云端质量问题(3)问题描述:分析佛山LTE现网TCP连接成功率为85.96%,成功率正常但有进一步优化空间。TCP连接返回的错误码分别为网络无响应、服务提供商发起TCP连接重置和用户发起TCP连接重置,占比分别为79.14%、5.54%和15.32%。其中TCP连接网络无响应主要集中在

22、上海移动IDC(腾讯业务)的4个IP以及苹果公司的部分IP。指标问题如右表:问题处理:经上海移动反馈,该4个问题IP归属于上海IDC腾讯客户,主要是由于腾讯进行业务调整导致。12日前后,派单给上海公司,并协调腾讯对问题SP进行了修复;优化效果:核心网络问题(1) 问题描述:DNS去除用户原因成功率在78%左右,成功率较低,但去除%类反向域名成功率在97%左右,如下表:分析结论:“No such name”查询失败主要由“”类的查询请求引起,并且发现腾讯类域名个数比例为60.80%,请求次数比例和域名不存在失败次数比例却分别占了98.94%和99.

23、07%,说明大量反向域名DNS查询请求及大量域名不存在失败是由腾讯公司相关应用产生。 问题分析:统计12月30日数据,不剔除反向域名成功率为78.31%,域名不存在整体占比13.16%,网络无响应整体占比8.20%;剔除反向域名成功率为97.39%,网络无响应整体占比1.75%,域名不存在整体占比0.81%。说明反向域名对DNS整体指标有较大影响。对反向域名的正向IP对应的域名进行归类统计如下:p依托LTE端到端指标,从KQIKPIPI层面共挖掘核心网质差业务问题12项。部分地市共性问题如下:与互联网室确认核心网络问题(2)问题描述:湛江爱立信片区LTE网络发现Inter TAU的成功率较低。

24、正常情况下,inter TAU的成功率都较高,在97%以上,以OLDTAC小于20000划分,取数据量TOP10如下(取1月12号数据):问题分析:可见Inter TAU的成功率较低,特别是TAC为30620到10396的TAU。失败原因为#9 UE identity cannot be derived by the network。信令如下:原因分析:在佛山LTE现网中,爱立信与中兴MME之间的TAU存在大量#9失败。对造成#9失败原因初步排查有以下可能:可能一:爱立信MME按照3GPP协议规范(29.274)认为中兴MME回复的Context Response消息里面带了FQDN,而FQD

25、N却为空的情况不符合协议规范,所以拒绝了UE的TAU请求,并发送#9给UE,导致用户无法从中兴的MME TAU到爱立信的MME。可能二:DNS上TAC与MME之间的映射数据没有配置。最后经佛山移动排查得出:爱立信与中兴MME之间的TAU存在大量#9失败是由于跨MME的context FQDN不符合规范导致。1、建议规范中兴MME的消息内容,在有FQDN的情况下带有该IE,如果没有则不带该IE,以解决爱立信MME和中兴MME关于FQDN为空的配合问题;2、建议爱立信MME对异厂家MME发起的TAU有兼容机制。优化建议:核心网络问题(3)问题描述:目前惠州现网中,PDN连接拒绝原因中,UE Con

26、text Release - Normal Release的原因较多,占了失败占比的49.88%。问题分析:失败场景在位置更新响应消息中鉴权为未知EPS签约数据,最终以为#4101015和#4101901两种失败原因ATTACH失败。因此,怀疑PDN连接#4103870失败原因主要是由于停机欠费或未签约4G用户ATTACH失败而造成的。下面对#4103870失败次数TOP20用户进行ATTACH失败原因统计分析:由上表可以看出,#4103870失败次数TOP20用户ATTACH基本上都为失败,而且都主要以#4101015和#4101901的失败为主,说明这些用户均可能是因为停机欠费或未签约4G

27、而造成ATTACH失败,进而造成PDN连接失败。问题处理:经排查是临近月底(12月)用户由于套餐用完,4G附着失败增多,部分可能为冬至日原因。核心网络问题(4)问题描述:目前江门现网中,PDN连接拒绝原因中,Multiple PDN connections for a given APN not allowed的原因较多,占了失败占比的88.33%。问题分析:信令回溯如下:根据3GPP TS23.060规范中的Valid Combinations of APN Restriction表得出:如果同一个APN激活两个上下文,是没有互斥关系,如下表所示: 如上图,从信令流程可以看出,eNodeB(

28、IP:04)发起PDN connectivity request请求,MME(IP:09)回复PDN connectivity reject拒绝。随后eNodeB多次发起PDN connectivity请求,MME都回复PDN connectivity reject拒绝。根据3GPP TS24.301规范#55Multiple PDN connections for a given APN not allowed定义初步判定#55是由于MME不允许同一APN有多个PDN连接。综上,同一UE相同的APN可以有多个PDN连接,#55 原因导致PDN

29、Connectivity reject问题初步判定是MME不支持同一UE相同APN存在多个PDN连接引起的。优化建议:建议联系设备厂家对MME的配置进行排查(目前已联系中兴厂家,反馈说通过打补丁方式解决该问题)无线网络问题 (1)寻呼黑洞小区定义:发现PS-Paging失败的小区,一个寻呼消息没有寻呼响应,但在此条寻呼消息前后某段时间内进行信令流程的关联,用户可能在某个小区进行了上下文、位置更新、GET、POST等操作,则大致可以匹配到寻呼失败发生时用户所处的小区。该类小区需要重点排查无线侧问题。p依托LTE端到端指标,共挖掘无线网质差业务问题11类,包含业务建立过程(TCP连接性能等)、业务

30、使用过程(下载速率、时延等)、互操作类(重定向、频繁重选等)。部分地市共性问题如下:处理措施(佛山):根据寻呼黑洞小区定义,对佛山现网进行统计分析,并提交网优中心分析优化。如右图所示,无忧已经做优化调整的9个寻呼黑洞小区进行指标对比:其中南海桂城千灯湖-LH3,南海黄岐中南花园-LH2,禅城石湾佛山气象局-LH1和南海桂城花苑广场-LH1四个小区的寻呼失败次数有明显下降,其余小区指标变化不大,需要继续排查频点干扰以外的其他问题。无线网络问题 (2)频繁重定向小区定义:“对UE_Context_Release(原因值为:interrat-redirection (28))事件进行统计,按以下多重规则和多重筛选条件挖掘现网中存在较多次数重定位的4G小区。3.00%8.00%13.00%18.00%12月16日12月17日12月18日1月28日1月29日1月30日优化前后重定向比例对比优化前后重定向比例对比19029221902923682361369560016956933695993169599

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论