GSMBSS网络性能PSKPI(下载速率)优化手册_第1页
GSMBSS网络性能PSKPI(下载速率)优化手册_第2页
GSMBSS网络性能PSKPI(下载速率)优化手册_第3页
GSMBSS网络性能PSKPI(下载速率)优化手册_第4页
GSMBSS网络性能PSKPI(下载速率)优化手册_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、GSM BSS 网络性能PS KPI(下载速率)优化手册内部公开产品名称密级GSM BSS内部公开产品版本Product version共29页GSM BSS 网络性能PS KPI(下载速率)优化手册(仅供内部使用)拟制:GSM&UMTS网络性能研究部日期:2008-2-29审核:日期:审核:日期:批准:日期:华为技术有限公司版权所有 侵权必究修订记录日期修订版本修改描述 作者2008-2-291.0初稿完成王光华2008-11-11.1重新整理耿海建001054432008-12-171.1依评审意见修改耿海建001054432009-7-301.1新增“涉及特性”杨召青目 录1总体介绍71

2、.1E)GPRS网络在端到端应用中的地位71.2CQT和DT简介81.3E)GPRS网络的性能基线81.4信道资源管理算法简介91.5链路质量管理算法简介121.6链路同步/信道同步的机理152下载速率问题定位思路152.1闲时、大文件、CQT下载定位问题152.1.1不能分配四条信道或不能稳定占用四条信道172.1.2不能稳定占用高编码172.1.3误块182.1.4控制块比例过高192.1.5TBF异常释放222.1.6RLC层速率高但应用层速率低232.2CQT下载比拼测试232.3闲/忙时DT下载比拼测试243总结253.1问题定位253.2日常优化274附录284.1附录1:相关叁数

3、说明284.2附录2:服务器和便携机优化参数说明28图目录 图1 GPRS组网图7图2 GPRS协议栈的有效负荷9图3 信道分配示例10图4 理想情况下大文件下载TEMS LOG文件显示信息16图5 理想情况下大文件下载应用层跟踪文件16图6 分组上行指配(左)和时隙重指配(右)消息中指配的时隙17图7 Packet Downlink ACK/NACK中位图来判断丢块情况18图8 MS的PDP上下文19图9 PCU上报给SGSN的MS流控数据20图10 MS侧跟踪的应用层数据21图11 通过分组ACK消息来判断是否是TBF异常释放23图12 搬迁前(左)和搬迁后(右)无线环境比较24图13 邻

4、区配置和重选参数不合理导致的频繁重选25表目录 表1 BEP和编码方式的对应表格12表2 各种编码方式的空口要求13表3 各种编码方式Abis口时隙要求14文档摘要和缩略语关键词: CQT、DT、下载速率、摘 要:下载是一个从MS端到FTP服务器端的一个端到端的服务过程,GPRS网络在其中充当一个传输层的作用。本文阐述这样一个端到端的过程,说明如何排查端到端过程中各个节点对下载速率的影响,然后重点说明如何优化GPRS网络。缩略语清单:缩略语英文全名中文解释GPRSGeneral Packet Radio Service通用分组无线业务EGPRSEnhanced GPRS慢速随路控制信道MSMo

5、bile Station移动台CQTCall Quality Test呼叫质量测试DTDrive Test驱车测试FRFrame Relay帧中继GBRGuarantee Bit Rate比特速率保证PCUPacket Control Unit分组控制单元SGSNServing GPRS Support NodeGPRS服务支持节点BSSBase Station System 基站系统BSCBase Station Control基站控制器BTSBase Transceiver Station基站收发信台GBGSN-BSS InterfaceGSN-BSS 接口UmRadio Interfac

6、e for GSM BSSGSM 无线接口TBFTemporary Block Flow临时块流RLCRadio Link Control 无线链路控制MACMedia Access Control 媒体接入控制MCSModulation and Coding Scheme调制编码方案LALink adaptation链路适配IRIncremental redundancy增量冗余参考资料1EDGE DT下载速率优化思路和案例汇总,Support网站,2008-6-262TCP/IP详解 卷1:协议,W.Richard Stevens,2008-43GPRS网络技术,摩托罗拉工程学院,2005

7、-6-1GSM BSS 网络性能PS KPI(下载速率)优化手册1 总体介绍本文前几章对下载过程,性能分析做比较详尽的阐述。对于只关心GPRS网络优化的,可直接从第三章看起。本文说明定位问题的工具主要是TEMS,Ethereal/Wireshark,各网元的消息跟踪和浏览工具。本文主要基于传输类型为:Abis口TDM方式,GB接口FR方式。对其它传输方式后续再补充。1.1 E)GPRS网络在端到端应用中的地位从端到端的应用来说,MS相当于客户端的网卡,通过GPRS网络连接到路由器(GGSN),再连接到Internet。与我们正常有线上网的网络连接过程是相同的。区别在于我们通过网线直连路由器的方

8、式变成了通过GPRS网络来连接。这GPRS网络较之100M(或更高带宽)网线来说,有较大的RTT时延,较小的带宽;且时延容易突变,带宽容易振荡。而GPRS网络,从下载速率的角度讲,优化的目标就是较大的带宽和较小的时延(小时延对下载小文件是很有利的)。下图是一个GPRS的组网图:图1 GPRS组网图这是一个比较典型基于E1传输的组网图,其中,每一个接口均可以采用直连方式,GB接口传输也可同Gabis口一样采用时隙交叉设备(简称DXX设备)。PCU如果采用外置,则PCU提供GB接口,PCU与BSC之间存在Pb接口,一般采用E1直连方式。1.2 CQT和DT简介运营商主要通过CQT和DT两种方式来考

9、核GPRS网络在速率方面的性能。那运营商为什么要选择CQT和DT来考核网络性能呢?CQT即定点测试,一般选择无线环境比较好,且C/I波动较小的地方进行测试,闲时的CQT测试,可以验证从Um口到Gi口所有网元、传输有没有问题,此时的CQT测试可以绝对的反映设备性能;忙时的CQT测试,还可以验证资源(如信道、abis资源、Gb资源等)管理算法的优劣。但忙时的CQT测试,也带来了很大的随机性,比如当测试时有另外一个用户也在做下载业务,下载速率就可能会受到较大影响,此时的CQT测试不能绝对的反映设备性能,因为资源配置多少影响较大,只能用于搬迁前后对比。DT,即Drive Test,较之CQT来说,存在

10、较大的C/I波动;存在小区重选。较之CQT测试的考察对象来说,还可以考察无线覆盖、干扰等情况;可以考察编码方式调整算法的优劣;可以考察小区重选时PCU处理上的优劣(基于现在还未实现PS切换的功能)。但也带来一定的随机性,比如遇到红灯时,处于C/I较好还是深衰落点对整个DT的平均速率有较为明显的影响。& 说明编码方式调整算法,也称之为链路质量控制算法,或IR/LA算法。调整的原因是各种编码方式需要的无线质量(C/I)是不同的。对于一定的C/I条件,选择一个合理的编码方式,可以在单位时间内发送的数据量和重传率方面取得一个最好的平衡。从而使速率最大化。1.3 E)GPRS网络的性能基线首先要计算一个

11、在资源保证的情况下,产品的性能是可以达到的理论极限值的。假设服务器与手机协商的TCP的MSS值为1460(此为以太网上运行的TCP/IP的默认数据段长度),采用Ethernet封装,加上20字节长的默认TCP包头和20字节长的默认IP包头;且中间网络MTU值均为1500,即不会分片;手机与SGSN协商的LLC PDU的长度为506;空口采用MSC9编码方式,数据拆分和封装如下图所示:图2 GPRS协议栈的有效负荷& 说明实际上,如果MSS值为1450字节,正好拆成3个SNDCP包,封装效率最高。可以计算,当MSS值为1460字节时,至LLC层效率为:1460/(1460+20+20+13+24

12、)94.99%;当MSS值为1450字节时,LLC层效率为:1450/(1450+20+20+10+18)95.52%。我们知道,对于EGPRS,采用MCS9编码,单信道的理论速率为59.2Kbps,如果采用4个信道来传输,有一个信道作为控制信道,在未合入“上行扩展模式下Uplink ACK/NACK优化方案”时,控制消息大概占该信道数据的19%;合入优化方案时大概占2%。所以,速率为59.2*(4-2%)235.616kbs,再乘以LLC层的效率,则理想情况下的应用层最大速率为235.616kbps*95.52%225.06kbps。那么,什么情况下,才能接近这个理论值呢:首先要下载一个大文

13、件,因为在下载文件的初期,TCP连接刚建立,TCP采用慢启动机制,所谓慢启动,可以认为是TCP层在不了解网络传输带宽和质量,以及已知网络传输带宽变小或质量变差时,采用缓慢下发数据以保证不会导致网络拥塞。所以,初始下发数据量是不够的。其次每一个环节都尽可能不丢包/帧/块,如图1所示,包括IPBB、核心网、GB接口、PCU、Gabis口、BTS和Um。再次,每一个接口流控都不应控制到数据不够空口带宽发送的程度。最后,要保证无线口的带宽:占用尽可能多的信道(现在大部分测试手机多时隙能力为10或11,下行最多占4时隙);无其它手机复用;并且能稳定采用MCS9编码方式。1.4 信道资源管理算法简介给MS

14、分配尽可能多的信道是保证无线口带宽的一个基础。现在信道资源管理算法基于手机的最大能力进行分配(即手机的多时隙能力对应几个信道,则尽可能的给它分几个信道),尽可能的使TBF在信道间均衡。块资源的分配基于保证GBR用户的基础上,公平性最好的原则,即对复用在一个信道的所有TBF采用轮流调度。整个信道资源管理算法体系包括:信道分配、动态信道转换/释放和负载均衡。信道资源包括CS的信道池(CSD)和PS的信道池(PSD),在配置完成以后,静态PDCH信道被划为PSD中,动态信道被划到CSD中。动态信道转换就是把CSD中的部分信道划到PSD中,包括由于多时隙能力不满足、EGPRS手机分配到GPRS信道上、

15、以及负荷超过“上/下行复用动态信道转换门限”等原因触发;信道分配就是在PSD中寻找到最优的信道组分配给MS;负载均衡则是在一个定时周期内对所有的TBF进行一次重分配,尽量使每个信道上的负荷达到均衡。信道资源管理算法非常复杂,我们采用一个典型配置,手机做下载过程为例来说明。下图给出了一个信道分配示例。配置:“小区下最大PDCH比率门限”100;“上/下行复用动态信道转换门限”12/12;“PDCH上/下行复用门限”70/80;“载频上最大的PDCH数”8; 图3 信道分配示例1)初始接入时(此时不管是否知道手机的多时隙能力),PSD中仅有一条信道,则将上下行均分配在该信道上。并且发现不满足多时隙

16、能力,多时隙能力支持下行4时隙,但现在仅占1时隙,开始动态转换,将3个TCH信道转成PDCH信道。2)经过4.5S后触发负载均衡的流程,对该TBF再一次进行信道分配,由于此时一般流量检测还检测不出来,认为属于中性业务,按3(下行)+2(上行)的形式进行分配,此时分配5、6、7给手机的下行。3)经过4.5S后的业务类型判断,此时判断为下载业务,重新给该手机指配为4+1的形式,分配4、5、6、7给该手机的下行。4)此时,又一个手机接入,初始为中性,分配4、5、6给该手机。(因为上行6时隙已经被第一个手机占用,该手机来时,会尽量上行不复用在一起,故会先配置5时隙给该手机,然后依据多时隙的限制,分配4

17、、5、6给该手机的下行)。5)此时发现不满足该手机的多时隙能力,需要再转一条信道过来,于是根据优先级,将时隙3转过来,对该手机触发一次时隙重分配。6)此时,所有信道上的TBF总数为8个,占用信道5个,所以,复用度为8/51.61.2,由负荷高开始触发动态信道转换,转换数目为8/1.25+12(即“小区中总的TBF数/动态信道转换门限已经占用的PDCH数目+1”,其中1是为了取整考虑),且满足“小区下最大PDCH比率门限”和“载频上最大的PDCH数”的限制,则将时隙1,2转过来,在对该TBF进行负载均衡时,触发将该TBF分配到1,2,3,4上去。最后说明一下,信道分配的约束条件,当信道分配不满足

18、MS的多时隙能力,可从以下这些情况进行考虑: 信道类型,如果配置为EGPRS专用信道不能分配给GPRS手机;配置为EGPRS优选信道,如果已有EGPRS手机在该信道上,则不能分配给GPRS手机,如果有GPRS手机在该信道上,则会把该GPRS调整出去。 当信道复用达到“PDCH上/下行复用门限”时,该信道不可分配。 信道异常(如信道失步)时不可分配。 非连续信道不可分配。 当“是否允许E下G上”设置为不允许时,如果有EGPRS手机的下行TBF在该信道上,上行不可分配给GPRS手机,如果有GPRS手机的上行TBF在该信道上,则下行不可分配给EGPRS手机。 当“是否允许跨载频重指配”设置为否时,即

19、使初始分配的载频不能满足手机的多时隙能力,也不能重新指配。 当“分组域内外圆切换策略”设置为“不允许内外圆之间的切换”或“只允许内圆到外圆的切换”时,内圆信道不可分配。 无可用Abis口时隙时,该信道不可分配。 对于外置PCU,无可用PCIC资源时,该信道不可分配。动态信道转换的约束条件如下: 当“(静态PDCH信道数+已转换的动态信道)/所有的业务信道数”达到“小区下最大PDCH比率门限”时,不可再转动态信道。 当载频上PDCH数达到“载频上最大的PDCH数”时,不可再转动态信道。 当载频上已用Abis口时隙达到“载频上最大的Abis口时隙数”时,不可再转动态信道。 语音业务占用时不可转换。

20、 当同心圆信道转换属性设置为“仅在外圆转换时”,内圆信道不可转换。& 说明MS的多时隙能力是指MS最大能支持的下行信道数和上行信道数,以及在上/下行信道之间应间几个时隙。一般的测试手机多时隙能力为10、11,支持3(下行)+2(上行)和4+1两种分配方式。对于打开EDA功能且支持EDA的手机,还支持2+3的分配方式MS的多时隙能力,在两阶段接入或11bit一阶段接入时,PCU可以获取。对于8bit一阶段接入时,PCU初始不知道MS的多时隙能力。但MS在附着请求消息中会带上多时隙能力,此时,SGSN便会获取得到,在该MS的TBF建立成功后,PCU和SGSN之间会通过定时的RA能力更新流程来获取该

21、MS的多时隙能力。1.5 链路质量管理算法简介链路质量管理可以通俗的称为编码方式调整,因为高编码可以提供更高的速率,但对无线环境的要求也越高。编码方式调整算法是在更高的速率和更低的误块率之间取得最好的平衡。编码方式调整是基于MS上报的BEP来调整的,是属于滞后的调整方式,所以,编码调整的目的不是要完全跟随链路质量的变化,而是要跟随链路质量变化的规律,即其包络。而对于不同的场景(如高速),需要跟随的程度也不同,协议和算法对外也提供这个接口可调:“BEP周期”,用于控制上报BEP时,是对多少个块进行滤波。BEP周期越大,则滤波的块数越多,则滤波越平稳。BEP周期越小,则最新的BEP值占的比例越大。

22、对于高速场景建议将该值设置小一些。对于BEP的值与编码方式的关系,可以参见下表:表1 BEP和编码方式的对应表格CV_BEP01234567MEAN_BEP0MCS-3 MCS-3 MCS-3 MCS-3 MCS-3 MCS-3 MCS-3 MCS-3 1MCS-5 MCS-5 MCS-5 MCS-5 MCS-3 MCS-3 MCS-3 MCS-3 2MCS-5 MCS-5 MCS-5 MCS-5 MCS-3 MCS-3 MCS-3 MCS-3 3MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 MCS-3 MCS-3 MCS-3 4MCS-5 MCS-5 MCS-5 MCS-5 M

23、CS-5 MCS-3 MCS-3 MCS-3 5MCS-6 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 6MCS-6 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 7MCS-6 MCS-6 MCS-6 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 8MCS-6 MCS-6 MCS-6 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 9MCS-6 MCS-6 MCS-6 MCS-5 MCS-5 MCS-5 MCS-5 MCS-5 10MCS-6MCS-6MCS-6MCS-6MCS-5MCS-5

24、MCS-5MCS-511MCS-6MCS-6MCS-6MCS-6MCS-6MCS-5MCS-5MCS-612MCS-6MCS-6MCS-6MCS-6MCS-6MCS-6MCS-6MCS-613MCS-6MCS-6MCS-6MCS-6MCS-6MCS-6MCS-6MCS-614MCS-7MCS-6MCS-6MCS-6MCS-6MCS-6MCS-6MCS-615MCS-7MCS-6MCS-6MCS-6MCS-6MCS-6MCS-6MCS-616MCS-7MCS-7MCS-6MCS-6MCS-6MCS-6MCS-6MCS-617MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7M

25、CS-718MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-719MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-720MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-721MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-7MCS-722MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-823MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-824MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-825

26、MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-826MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-8MCS-927MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-928MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-929MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-930MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-931MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9MCS-9以上是发送新块选

27、择编码的方法,对于重传块呢,对于GPRS来说,采用与第一次发送的编码方式相同的块;对于EGPRS来说,可以采用较低的编码,根据三个因素来决定:刚才发送该块时的编码方式、与发新块的相同方式选择出编码方式、链路质量控制模式(IR还是LA)。会选择同簇的编码方式(如MCS3、MCS6、MCS9为一簇),根据IR还是LA决定是降几级,如刚才用MCS9,采用LA的方式有可能会要求降到MCS3,但是IR的方式可能降到MCS6就够了,因为在IR方式下,MS会缓存刚才未正确解出来的块的部分信息,再根据重传块的信息软合并进行解码,则有可能解出来。所以,我们推荐测试时采用IR的方式。但有些MS软合并功能做得不好,

28、或根本不做,有可能IR功能会带来负增益。需要考察编码方式选择的限制因素:1、 无线环境。下表给出了各种编码需求的无线信号的质量:表2 各种编码方式的空口要求编码方式手机接收电平要求(dBm)TU3下载干比要求(dB)MCS1-10213MCS2-10115MCS3-9916.5MCS4-9719MCS5-9818MCS6-9620MCS7-9323.5MCS8-90.528.5MCS9-86302、 Gaibs口的传输质量:如果副链失步,会导致编码调不上去。因为高编码不带同步头,在出现较为严重的滑码情况时,会限制选择高编码,而采用带同步头的低编码来进行传送。3、 Abis口时隙数目,下表给出了

29、各种编码方式需求的16kbps的Abis时隙数目:表3 各种编码方式Abis口时隙要求EGPRSGPRS需要的Abis口16kbps时隙数目MCS1MCS2CS1CS21MCS3MCS6CS3CS42MCS73MCS8MCS94Abis时隙有如下几个用途:信令链路(OML,每个基站一条;RSL,每个载频一条)统计复用;语音信道(每个信道需要一条16kbps的时隙,);PDCH信道(每个信道需要若干条16kbps的时隙,其中一条称为主链路,其它称之为副链路)。在Abis口时隙为非FlexAbis的情况下,语音信道和PDCH信道在信道配置时就固定绑定一条16kbps的时隙。然后对于正在做分组业务的

30、手机,如果需要调整编码方式,且需要Abis资源,则去申请Abis口空闲时隙,申请成功后,进行编码方式调整。当编码方式下调时,不会触发Abis资源释放。在信道空闲时,在“Abis时隙释放定时器长度”超时时进行释放。在Abis口时隙为FlexAbis的情况下,信道配置时并不绑定Abis口时隙,在信道激活时才去申请绑定Abis口时隙,即原来的主链路也同样被划到了空闲的Abis资源池里面。基于CS业务优先的原则,在CS业务信道可分配,却无Abis资源时,会去抢占正在做分组业务信道上的Abis资源。所以,对于空闲时隙不足的问题,在配置为非FlexAbis的情况下,把剩余未配置时隙均配置为空闲时隙(需要注

31、意客户是否采用DXX设备来做时隙交叉,如果采用,则可分配的时隙数不一定是整条E1的所有时隙数,需要向客户问清楚可用时隙情况);根据话务模型计算信令链路复用比,增大信令链路复用比可以省出Abis口资源出来;也可选择采用FlexAbis的功能来更好的实现Abis口的资源共享。& 说明华为的Abis口资源采用基站为单位的资源池,一个站下面的所有小区进行Abis资源共享。另外,对于级联站的情况,前一级基站的Abis口时隙资源有一部分要划分为下一级站使用。另外,可通过“载频上最大的Abis口时隙数”来限制载频上最大可绑定的Abis口时隙数。1.6 链路同步/信道同步的机理每个PDCH信道会绑定若干条Ab

32、is口时隙,其中一条称为主链,其它若干条称为副链。在信道转换过来的初期,会有1秒左右的信道同步过程,PCU通过主链路给基站发送同步帧,基站回复一个同步帧,这样,就可以计算两帧之间的帧号,块号的差别。这样,后续PCU则按该提前量下发数据。在发送同步帧时,如果同步头搜索不到,或者搜索到同步帧后校验失败。则信道无法同步。每个信道包括多个Abis口链路,每个链路单独进行同步,后续在发送帧时,都会带同步头(对于MCS6/7不带),当然,主链路上还会发送CS1编码的信令帧,副链路上会发送空闲信息帧都有同步头。所以,同步头发生一定的变化是可以忍受的。但是如果平均每10分钟变化一次,则PCU会限制高编码的传送

33、。如果主链失步,则会导致信道失步。副链失步,则编码将会调整。而Gabis口传输质量差到一定程度时,则导致链路失步,G-Abis口的传输质量通过G-Abis口误帧率来衡量,G-Abis口误帧率(接收校验错帧的个数+接收失步帧的个数)/(发送有效帧的数目+发送空帧的数目)。1)误帧率都小于10e-5,此时链路质量较好,手机能稳定进行数据传输。2)误帧率在10e-5至10e-4之间,此时对正在传输态的手机速率有一定的影响。3)误帧率大于10e-4,说明链路已相当不稳定,容易出现失步,此时,已经很难进行大数据量的数据传输。如下情况可能导致Gaibs误帧高或链路失步:E1时钟和BTS的空口时钟不同步;传

34、输不稳定等。可以通过在BTS侧采用近端和远端环回的方法来排查是否是传输的问题,当然也可以通过在两侧挂表截取数据来分析。2 下载速率问题定位思路如1.31.3节阐述,DT较之CQT来说,就是存在C/I波动导致编码方式改变(事实上链路质量控制算法会在更高的编码和更小的重传之间取得平衡,编码方式的改变带来空口实际带宽变化)和小区重选,而下载小文件较之下载大文件来说TCP连接刚建立时的慢启动过程影响占的比例较大。所以,当下载速率很差时,需选择C/I很好的地方,闲时进行大文件下载测试以排查各环节的是否存在问题。2.1 闲时、大文件、CQT下载定位问题如下图所示,为闲时,无线环境好,大文件下载了时TEMS

35、 LOG显示的速率图形:图4 理想情况下大文件下载TEMS LOG文件显示信息& 说明Dummy控制块:PCU每20ms调度一个块来发送,发送顺序是NACK块VS块PACK块,当PCU内无以上这些块可发送时,则发送Dummy控制块。TEMS将其统计为控制块,即TEMS统计的控制块包括真正的控制消息块和Dummy控制块。在MS侧应用层的跟踪消息来看,一般每个块时延比较固定,MS每两个TCP包回送一个TCP的ACK消息,没有丢包或乱序。一个严格的测试者一次下载过程中的测试结果应该除了与FTP服务器的交互消息以外,没有与其它IP的交互消息。应用层的跟踪消息如下图所示:图5 理想情况下大文件下载应用层

36、跟踪文件现在说明一下,从TEMS LOG文件和应用层的抓包文件来初步判断问题原因的思路:2.1.1 不能分配四条信道或不能稳定占用四条信道首先说明一下,从TEMS上如何看分配了几个信道,如图4所示,从黄色所占的格数可以判断,但TEMS的该显示不是特别准确。另外,则是依据“GSM data timeslot”中的显示,但也不是特别准确。最准确的方法,是依据你所考察位置之前,最近的一个“Packet Downlink Assignment”或“Packet Timeslot reconfiguration”消息来判断。如下图所示: 图6 分组上行指配(左)和时隙重指配(右)消息中指配的时隙根据1.

37、3节描述,可以知道,对于闲时下载的情况,可能会经历从分配1时隙,到3时隙,再到4时隙的过程。正常都可以分配满足下行多时隙能力。那么,如果不能占用,首先检查信道配置,是否有足够的PDCH信道(包括静态和动态),如果不满足,则需要进行配置,一般在主B上配置足够的PDCH信道。其次则需要检查是否存在信道失步等故障。可以通过PCU的故障告警来检查是否存在信道失步,最好通过命令来查询一下,如外置PCU,通过“mt pdch show state all”可以检查该小区下所有PDCH的状态。内置PCU,通过MML命令“DSP PDCH”来查询信道状态。对于不能稳定占用四条信道,包括语音业务抢占,这在闲时测

38、试的情况下应该不会出现。另外,则仍然是信道故障的问题。2.1.2 不能稳定占用高编码该问题又可以分解为三种情况,一是一直占用低编码,有两个如下可能原因:一是固定了下行编码方式;二是Abis口资源不足。对于前者,需要设置为非固定编码方式,对于后者,则按照1.5节描述增加可用的Abis口时隙。第二种情况是编码调整的不够及时,往下调整不及时,导致误块率较高,则可以通过减小“BEP周期”的方式来解决。往上调整不及时,则还有另外一种可能,是Abis口时隙绑定比较慢,对于测试,如果初始调整很慢,可以将“下行缺省MCS类型”设置为MCS9。2.1.3 误块误块,简单的讲,就是PCU发出了某个数据块,但是MS

39、没有收到。对于误块率多少合适现在还没有一个定量的衡量标准,也因为对不同的信道模型,相同的参数设置下误块率也会是不一样的。从什么地方来查看误块率呢,如图4所示的“BLER/TS(%)”即为TEMS对收到的一定块数所计算出来的百分比,这是一种统计值。对于固定的点,还可以看“Packet Downlink ACK/NACK”消息来查看,如下图所示图7 Packet Downlink ACK/NACK中位图来判断丢块情况图中所示,TEMS对EGPRS的Packet Downlink ACK/NACK消息解释是有误的,需依图中所解,对GPRS的,则TEMS解出的NACKed Block numbers是

40、正确的。从这个位图中,我们可以知道具体丢了哪些块,那么这些块为什么丢掉,如果认为空口和Gabis口均没有可能导致丢块,则根据消息之前是否有接收邻区的系统消息等行为导致不能够接收这些块。没有接收到数据块的原因可能有以下几种可能:1、 空口误码率偏高且集中误码导致误块;由于选择无线环境比较好的地方,所以,空口应不会导致较多的误块。顺便说明一下,对于DT测试,如果误块率较高,则可以通过微调“BEP周期”和IR/LA算法软参“BEP滤波因子”和“BLER滤波因子”。2、 G-Abis口错帧和失步帧导致。3、 MS有其它必须要做的事情,导致不能正常接收数据块。协议规定:MS至少在30s内对新载波的BCC

41、H数据进行解码。当存在信号波动且邻区配置较多时,有可能造成MS经常要去解析邻区系统消息。在这种情况下,要减少邻区数目,尽量减少不必要的邻区配置。2.1.4 控制块比例过高基于我司产品的实现,只会给MS分配一个控制信道,由于控制信道是双向的,所以,上行和下行必然占用同一个同隙作为控制信道。这样,我们可以确定控制信道的位置,如图4所示,TS4为控制信道。也就是说,真正的控制消息只会在TS4上发送,对于未合入“上行扩展模式下Uplink ACK优化方案”的控制消息比例大概在17%21%波动,合入优化方案的控制消息比例大概在2%左右。如果非控制信道存在控制块(实际上是Dummy块)或控制信道的控制块比

42、例比较多。则说明肯定是PCU无数据可发,而发送的Dummy控制块。PCU发送数据的原则是,先发送NACK块(即MS在Packet Downlink ACK/NACK消息中确认没有收到的块)、再发送VS块(即新块,RLC负责按照不同编码方式承载的字节数对LLC PDU进行分割)、再发送PACK块(即MS还未确认收到与否的块)。如果无以上数据块可发送,则发送Dummy控制块。另外,需要特别说明的是:仅在PCU的发送窗口未满时,才可发送VS块。那么,控制块比例过高的问题可能有如下几种可能:1、 签约峰值速率不够高,从TEMS中显示的PDP上下文可以看到,如下图所示,峰值速率为128000octets

43、/s128000*8/1024kbps1000kbps,大于我们的理论极限速率。图8 MS的PDP上下文2、 LLC层采用确认模式,LLC层采用确认模式的情况下,采用I帧发送机制,只有对端确认了该帧,才可进行下一帧的发送。且LLC确认机制的情况下,需要进行LLC层连接的建立和释放,无疑增加了LLC层的信令传送。总之,LLC层采用确认模式对下载速率的影响非常大。LLC层的操作方式也可以通过TMES中MS的PDP上下文下确定。如果采用LLC确认模式,需要在SGSN侧将数据配置修改为非确认模式,同时,需要修改SIM卡的开户信息。3、 发送窗口Stall,这一般在GPRS中才存在,因为GPRS只支持6

44、4的窗口,不管什么原因造成误块,我们产品的RRBP时延一般在200ms左右,等到MS上报对该误块的接收情况,200ms过去了,如果此时是MS占用4时隙,则PCU已经发送200ms/(20ms/块)*440块,很容易导致窗口Stall。有两种方法可以确认该问题:一是通过增大置RRBP的频率,看是否有改观;二是数一段时间内GB接口接收到的数据量,是否大于PCU下发的数据量。4、 GB接口流控不合理:通过查看GB接口跟踪的Flow Control MS消息上报流控数据,看上报的值是否小于PCU下发的速率。如果小于PCU的下发速率,则说明流控不合理,GB接口流控数据如下图所示:图9 PCU上报给SGS

45、N的MS流控数据& 说明为什么要执行GB流控,因为GPRS网络属于长瘦型的管道,所以,服务器一直往下发包,直到服务器的窗口stall,下发的这么多包需要在这个管道内进行缓存,但PCU内存有限,不能够缓存所有的包,所以,需要SGSN分担一些,但是SGSN发给PCU的数据又不能不够PCU发送的,所以,由协议规定由PCU给SGSN发送流控参数(缓存大小和速率)来执行流控,SGSN根据PCU上报的流控参数,对每个下发的包进行判断:假设PCU按上报速率发包,即缓存中的数据按该速率减少,SGSN发送该包和前一个包之间的时间内,PCU减少多少数据,SGSN如将该包发下去,则PCU会增加该包大小的数据,通过一

46、增一减的判断,是否会超出PCU的缓存。如果超出,则不发。我们的产品实现流控时首先是在TC定时器超时,则上报流控消息。如果桶中数据量大于90%或小于10%时,也上报流控消息。上报流控消息后,如果SGSN不回ACK,则在FC定时器超时后再重发流控消息。5、 GB接口带宽不足:SGSN和PCU通过FR方式相连时,采用多个NSVC进行负荷分担,每一个NSVC承载在BC上面,BC由E1上的多少个64kbit/s的时隙组成,此时可以计算物理带宽,即时隙数目*64kbit/s。那么GB带宽是否足够呢,建议采用SGSN侧的“Downlink data kbytes sent to FR per NSVC”的话

47、统,且登记五分钟的。通过“该值*8/(5*60)”与实际带宽比较,如果不超过实际带宽的70%,可以认为带宽充足,否则,则说明带宽不足。6、 丢包导致服务器进入拥塞控制状态:需要检查哪段发生了丢包,通过在各个接口上进行抓包,可以确认哪段接口存在丢包。传输链路上丢掉TCP包,或者在非确认的接口上丢包(如GB接口),丢包需要通过Ethereal抓包来分析,如果手机侧丢掉某个包,通过跟踪TCP包号可以确认该包在哪边被丢掉。如下图所示:图10 MS侧跟踪的应用层数据从图中可以看到,92064556的前一个包丢掉了,因为每个TCP包的长度为1368bytes,换算成16进制为558,则丢掉的包的包号为:9

48、206455655892063FFE。在GGSN侧可以将Gi口、Gn口映射到镜象端口,SGSN进行单用户跟踪,可以将其转换成Ethereal抓包文件,所以,这些接口通过该TCP号可以确认在哪丢的包。关于GB接口丢包,要详细进行说明,通过PCU侧GB接口跟踪文件,通过Nu(Nu为NS-PDU的编号)是否连续可以确认是否发生了丢包。通过PCU解析出的TCP包头,如果该TCP包分割成的若干个NS PDU丢掉一个或多个,则会导致整个TCP包被丢掉。那么GB接口丢包有哪些可能呢,接口单板、传输都需要排查;帧校验模式;如果中间网络通过FR传输,FR的拥塞控制参数也需要排查。帧校验模式SGSN和PCU侧一定

49、要一致,如果中间存在传输网络,建议传输网络配为不校验的方式;FR的拥塞控制参数包括Bc、Be和CIR,它的含义是当TcBc/CIR周期内,如果数据速率超过Bc,小于Bc+Be,则该包在传输过程中有可能被丢弃,如果数据速率超过Bc+Be,则该包在传输过程中一定会被丢弃。另外,即使不超过Bc,如果FR传输网络带宽不足,它也会按一定的规则进行丢包。PCU丢弃LLC PDU,有两种可能:一是该包在PCU内缓存的时间超出了30s。(因为PCU认为在这么长的时间内还不把那个包下发下去,服务器由于RTO超时会发起重传,此时,PCU再把该包发下去是浪费空口资源),这是一个极低概率的事件;二是发生跨PCU的小区

50、重选,此时称为Flush LL丢包。这两种情况的丢包可以通过PCU侧的“下行LLC PDU超时丢弃次数”和“下行LLC PDU因为flush丢弃次数”(这里的次数不太准确,其实就是丢弃的包数)。Gabis口导致丢包,这属于低概率事件,但需要说明一下,Gabis口如果出现误码,且BTS在执行校验时未能正确校验出,然后在空口发送出去,至MS组包为LLC PDU时,会发现不能正确组包,则丢弃,由于LLC层一般采用非确认模式,也可能导致应用层丢包。& 说明只有非确认端口才会导致应用层丢包,因为即使空口或Gabis口发生丢包,因为RLC层为确认模式,RLC层会保证把该包发送到MS。拥塞控制:拥塞控制机制

51、主要包括慢启动和拥塞避免,实现方法是发送端的TCP层维护一个拥塞窗口和慢启动阀值。拥塞窗口初始为1个数据包(有的TCP实现可能是多个数据包,但大小不能超过4380字节),拥塞窗口+已确认的数据包的最大序列号是TCP所发送的数据包序列号的上限值。当拥塞窗口小于慢启动阀值时,每确认一个包,拥塞窗口呈指数增长;当拥塞窗口大于慢启动阀值时,每确认一个包,拥塞窗口呈线性增长。当发生丢包时,慢启动阀值减半;当超时重传时,慢启动阀值减半且拥塞窗口变为1个数据包。7、 上行较差导致TCP ACK消息上得较慢,在服务器必须等待该ACK才能下发数据时,会导致下发数据变慢。包括以下几种情况:a) 上行编码调整不合理

52、,现在还是采用根据下行来调整上行,如果上行存在干扰或上行电平较差时,编码调整不合理导致上行数据发送不上去。上行电平较差可以参考“上下行平衡”的话统;上行干扰可以参考“测量报告干扰带分析测量”话统;依下行来调整上行的情况下(进入超级用户模式,查看“配置BSC属性内部软参支持动态调整EGPRS上行编码方式”,是否是dl ack中下行信号质量),可以通过在选择的基础上下降3个等级来实现(进入超级用户模式,“配置BSC属性内部软参DSP控制开关表2”第5位置1)。b) 置RRBP频率不宜置得太高(进入超级用户模式,“配置BSC属性内部软参EGPRS TBF RLC下行数据块置RRBP的周期(块)”,默

53、认为20,最好不要设置小于12),使MS没有机会上上行数据块。8、 服务器或测试便携TCP参数设置不合理,比如TCP的窗口设置过小,这容易导致TCP窗口满的情况;比如MSS值设置过小,导致利用率低,设置过大,而中间传输网络的MTU值如果较小,则导IP包在传输过程中被分片。在4.2节中介绍如何设置较好的参数。2.1.5 TBF异常释放首先需要说明一点,TBF异常释放不一定导致丢包,因为TBF异常释放后,PCU在30S内会保存该MS未发送和发送后但未确认的数据。MS一般会很快发起重建TBF,此时因为TLLI不会变,依据TLLI可以找到该MS的上下文,然后将未发送完的数据重新发送给MS。如何判断TB

54、F是否是异常释放,根据TBF释放流程,我们知道,下行TBF正常释放时,MS会在Packet Downlink ACK/NACK中的FAI位置1,上行TBF正常释放时,PCU会在Packet Uplink ACK/NACK中的FAI位置1。如果没有置1,则说明是异常释放。因为如果网络侧发送Packet TBF release来释放TBF,则说明是异常释放(如果原因值为正常释放,说明是因为N3105超时导致的异常释放)。图11 通过分组ACK消息来判断是否是TBF异常释放TBF异常释放对速率的影响主要是在异常释放的一段时间内无法进行数传,TBF异常释放需要查找原因,一般有如下的原因可能导致:1) N3101、N3103超时导致的上行TBF异常释放。2) N3105超时导致的下行TBF异常释放。3) 控制信道被抢占导致的TBF异常释放。4) 小区重选导致的TBF异常释放。5) 一些内部处理异常导致的TBF异常释放。2.1.6 RLC层速率高但应用层速率低这种情况,一般是由于测试者操作不严谨导致。测试者在测试时必须关闭会自动连接网络的软件和服务(如自动更新),否则,但这些软件或服务自动连接网

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论