流量抑制模型研究及其回归分析_第1页
流量抑制模型研究及其回归分析_第2页
流量抑制模型研究及其回归分析_第3页
流量抑制模型研究及其回归分析_第4页
流量抑制模型研究及其回归分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

-精选财经经济类资料- -最新财经经济资料-感谢阅读- 1 流量抑制模型研究及其回归分析 【摘 要】为满足用户 4G 数据业 务需求,预警数据业务流失,研究了 4G 数据业务中的流量抑制现象及其影 响因素,选取页面显示时长作为流量抑 制现象的表征指标,并建立了预测分析 模型,应用相关性和回归分析方法研究 无线网络各因素的影响程度。结果表明, 建立的多元线性回归模型对页面显示时 长的解释有效,上下行覆盖的信号强度 和质量以及小区负荷因素对影响页面显 示时长有重要影响。 中国论文网 /8/view-13007989.htm 【关键词】LTE 流量抑制 页面 显示时长 线性回归 中图分类号:TN929.5 文献标志 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 2 码:A 文章编号:1006-1010(2017) 19-0015-06 Research on Data Traffic Suppression Model Using Linear Regression HAN Ming1, PENG Xuan2, SUN Kexiong1, CHEN Ming3 Abstract In order to meet the users requirement of 4G data traffic and warn the loss of data traffic, the traffic suppression and influencing factors in 4G data service were investigated. The page display duration is used as the indicator of traffic suppression. The prediction and analysis model was built. The correlation and linear regression analysis method were used to study the impact of different wireless network factors. Results demonstrate the multiple linear regression model can effectively interpret the page display duration. Besides, both the -精选财经经济类资料- -最新财经经济资料-感谢阅读- 3 uplink and downlink signal strength and quality and the cell load have the significant impact on the page display duration. Key wordsLTE traffic suppression page display duration linear regression 1 引言 随着 4G LTE 技术发展以及运营 商对终端用户消费习惯的引领,移动数 据业务收入占比越来越高,据 2016 年 底统计,无线数据业务已成中国移动第 一大收入来源1,其运营情况越来越得 到重视。但在实际的无线数据运营过程 中,由于多种原因的影响,部分数据业 务不能得到及时有效的释放,会造成资 源承载效率降低、数据业务流失、客户 感知下降等问题。 为了充分释放用户数据业务需求, 预警数据业务的流失,本文提出流量抑 制的概念并选取了其表征指标,建立了 基于网络 KPI 的多元线性回归模型。线 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 4 性回归作为一种回归预测方法在各行各 业有着广泛的应用,可将定性问题定量 化,确定各特征对结果的影响程度,用 于指导工作实践。 2 流量抑制及模型构建 2.1 流量抑制现象的产生 在无线数据业务中,由于各种网 络原因导致部分数据业务不能及时有效 地释放,造成数据业务流失及用户体验 降低的情况称为流量抑制。比如下载速 率低而导致用户页面浏览减少,或者是 音质差画面卡顿等因素导致用户放弃使 用即时通信、视频浏览等。 根据 LTE 用户数据业务模型统 计,基于 HTTP 协议的 Web 业务类型 占据主导地位2。在假设用户数据业务 模型一致的情况下,小区流量会随着用 户数增加而线性增长,公式如下: 数;a 为单用户数据量,受用户 模型影响;统计时长一般为 1 小时。 实际小区流量由于受各种网络因 素影响,不能满足以上线性关系,当用 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 5 户数增加时出现流量增长缓慢甚至下降 的情况,如图 1 所示,比如用户数超出 小区限制后,潜在用户不能有效接入小 区导致业务流失,流失业务量即为流量 抑制的损失量。流量损失公式表示如下: LTE RRU 小区并发用户数增加 会对多个网络 KPI、用户感知、小区流 量等指标产生影响3。根据实际网络性 能统计,当小区用户数低于 200 时,小 区流量基本线性增长;超过 200 时小区 流量增长变缓,甚至有下降的可能,如 受故障、覆盖、干扰等因素影响时。 2.2 流量抑制的表征指标选取 单用户页面浏览一般是脉冲式突 发行椋如图 2 所示。对于单个用户 的流量损失,假设一个用户在 t1t6 时 间内正常情况下有 4 次页面请求,柱体 宽度标示平均页面显示时长 t2.5 s4。 t2 时刻页面显示正常,t3 时刻由于网络 因素影响,页面显示时长增加?t 而延长 到 t4 时刻,原来 t4/t5 时刻的流量需求 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 6 就会顺序后延,原 t5 时刻的流量需求延 迟到统计时间 T(t1t6 期间)之外或 直接放弃,则在统计时间内由于流量抑 制而导致的流量损失量 Loss=0.7 MB。 用户突发式页面请求的业务量可 以转换为连续值近似代替,假设统计时 间 T 内的用户正常业务需求量是 B,?t 为增加的时延,则流量抑制损失量可以 用公式(3)表示: Loss=?t() (3) 公式(3)可以近似且定量地反 应流量抑制现象和时间因素的关系,页 面显示时长增加时用户流量需求会被抑 制,小区所有用户流量损失之和为小区 流量损失量,因此可用页面显示时长这 项感知指标来表征流量抑制现象。 2.3 模型构建及特征变量选择 页面显示时长过大引起的流量抑 制受多重因素影响,包括网络覆盖、无 线干扰、规划容量、信令流程、网络结 构、编码方式等。从通信全流程来看 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 7 (端到端分析) ,流量抑制既有 SP 运营 商的内容、服务器路由等因素,也有网 络质量、用户终端行为等因素,如图 3 所示: 在移动通信网络中,无线网质量 更易受外界因素的影响,性能波动性较 大,是影响流量抑制的关键,其他则视 为固定因素,暂时不在本文研究范围内。 流量抑制的无线侧流量模型如图 4 所示。 特征变量是多维度描述一个模型 的量化指标,各变量之间相互影响,会 由于相关性、冗余性等问题导致模型出 现偏差。各特征间最好能保持独立,有 时需要剔除一些不相关或冗余特征,从 而减少特征个数提高模型精确度。 特征提取是数据预处理过程,可 以选取与目标变量关联性强的一些特征。 但是如果对数据了解程度不够的话,还 可以采用相关性分析对数据进行处理。 最终选取的特征应是所有特征的一个子 集。流量抑制模型部分特征变量的说明 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 8 如表 1 所示,页面显示时长作为目标变 量。 3 相关性及回归模型分析 首先用相关性分析对已知特征变 量做预处理,了解各变量对目标变量的 相关程度以及各特征变量之间的独立性, 再结合回归模型系数权重,了解特征变 量对目标变量的重要程度。 3.1 特征变量的相关性分析 相关性分析是指对两个或多个具 备相关性的变量进行分析,从而衡量两 个变量因素的密切程度。当两个变量带 有测量误差时,它们之间的相关性会削 弱。常用相关性计算方法是 Pearson 相 关系数4-5 ,计算公式如下: 其中 n 是样本个数,Xi 是特征变 量,Yi 是目标变量,X_和 Y 分别是其 对应变量的均值。相关系数 r 的范围在- 1 和 1 之间,|r|值越大,表示连个变量 之间影响越显著。 选取某地区 LTE 忙时(中午 11 点)数据作为分析样本,剔除异常样本 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 9 后,各特征向量与目标变量之间的相关 系数如表 2 所示,其中重叠覆盖度、切 换成功率等特征变量与页面显示时长的 相关系数极低,为精简模型可以考虑将 这些特征变量从模型中剔除。 另外为检验各特征变量之间的独 立性,建立特征变量之间的相关系数矩 阵,因矩阵较大这里仅列出矩阵中相关 系数较高的几个特征变量:RRC 连接平 均数与 PRB 利用率的相关系数是 0.74;高 CQI 占比与下行 64QAM 编码 比例之间的相关系数是 0.7。为保证特 征指标的独立性及模型精度,删除相关 系数为零的切换指标、冗余指标 PRB 利用率(保留 RRC 连接平均数是因为 其更直观且 PRB 利用率容易受限)以 及下行 64QAM 编码比例。 3.2 多元线性回归方程 多元线性回归是一种应用较为广 泛的预测模型,可通过多个特征值来解 释目标值7。其数学模型如下: 其中 Y 是目标变量,本文指页面 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 10 响应时长; 是线性回归系数;X 是特 征变量矩阵;b 为偏置常数。 多元线性回归模型的计算目的是 得到回归系数 值和偏置常数 b,常用 计算方法包括最小二乘法的矩阵解法8、 梯度下降法9等。Matlab 软件作为一种 常用数据处理工具,简单易用,编程效 率高,可以比较方便地得到线性回归方 程并对其做显著性检验10。 根据相关性选取的 12 个特征变 量构建模型 1,用 Matlab 做标准化处理, 然后采用梯度下降算法得到多元线性回 归模型系数和偏置常数,该结果如表 3 所示: 回归模型的权值大小反应特征变 量对目标变量的影响程度,结合相关性 分析,MR 覆盖率、上行丢包率、eNB 接收干扰、UE 高发射功率占比、RRC 连接平均数等 5 项对目标变量有显著影 响,如图 5 所示: 选取图 5 中有显著影响的 5 项特 征建立模型 2,应用多元线性回归得到 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 11 权重系数如表 4 所示: 对于权重系数的理解有助于了解 其对应特征对页面显示时长的影响程度, 比如 MR 覆盖率与页面显示时长负相关, 覆盖率下降则页面显示时长增加。 3.3 回归方程显著性检验及偏差 分析 所建立模型的多元线性回归方程 对目标变量的解释是否准确,需要对回 归方程进行统计意义上的显著性检验 11。检验方法包括:判定系数检验 (R2 检验) 、回归方程显著性检验(F 检验)等。若回归方程-显著性检验未 通过,可能是选择特征变量时漏掉了重 要影响因素,或是特征变量与目标变量 间的关系非线性。 模型 1 是建立的基本模型,设定 显著性水平 =0.05,对其检验结果如表 5 所示: 整体相关系数 R=0.226,判定系 数 R2=0.051 较小,说明预测结果与目 标变量之间关联性较低,预测准确性有 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 12 待提升。F 检验 (6) 模型 1 和模型 2 的特征变量选取 数目不同,得到的回归方程也有差别。 它们的预测结果差别如何就可以通过偏 差分析,了解特征变量对目标变量的解 释是否满足要求以及模型的预测精度。 模型 1 和模型 2 的偏差及准确度情况如 表 6 所示: 从表 6 可以看出,两个模型的预 测偏差差别不大,说明模型 2 的 5 项特 征也可以较好地反应页面显示时长变化, 在优化工作中可以重点关注。比如覆盖 率不足将直接影响小区性能与用户感知, 页面显示时长增加,进而抑制用户的流 量需求。 决定系数以及预测偏差显示得到 的多元线性回归方程精度还存在不足, 原因可能是特征变量的选取有偏差,也 可能模型中某些变量与页面显示时长非 线性关系。特征变量的选取可在工作中 继续完善,至于特征变量和页面显示时 长是否非线性,比较简单的方法是用单 -精选财经经济类资料- -最新财经经济资料-感谢阅读- 13 变量的多项式拟合来检验。以 RRC 连 接数和覆盖率两个变量与页面显示时长 的关系为例,多项式拟合的结果显示具 有非线性特征,所以采用线性回归分析 时对目标变量的解释偏差会大些,如图 6 和图 7 所示: 一般硭担当 页面显示时长超过均值时就可以认为存 在流量抑制现象(大约 3 000 ms,如图 6 的 A 点) ,实际工作中可选择平均页 面显示时长显著增加区域为流量抑制重 点关注区,如图 6 的 B 点和图 7 的 C 点,大约 4 200 ms。 4 结论 流量抑制模型的建立便于网络运 营和优化人员了解 LTE 数据业务流失 的基本原因,在工作中采取针对措

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论