




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、智慧园区网络智能运维技术白皮书华为园区网络智能运维技术白皮书摘要摘要网络是数字化的基座,数字化转型带来终端和网络规模的增加、业务模型的多样和复杂, 但网络运维的资源和人力,却没有得到同比例的增长。传统“以设备为中心”的网络运维, 无法感知用户和业务体验,被动响应“故障”发生,难以满足数字化转型时代的用户和业务体验保障需求。这份白皮书描述了“以体验为中心”的园区网络运维理念,以及华为基于大数据和 AI 实现园区网络智能运维的解决方案。华为 CampusInsight 园区网络智能分析器,颠覆传统聚焦网络和设备资源状态的监控方式,通过 Streaming Telemetry 实时采集网络数据和指标
2、,利用大数据分析、人工智能算法学习网络模型并识别故障模式,帮助运维人员主动发现 85%的潜在网络问题, 并识别根因和主动修复,打造高品质的园区网络业务体验。华为园区网络智能运维技术白皮书目录目录 HYPERLINK l _bookmark0 摘要ii HYPERLINK l _bookmark1 背景和挑战1 HYPERLINK l _bookmark2 数字化转型时代1 HYPERLINK l _bookmark3 以设备为中心的“救火式”运维,难以满足数字化空间需求1 HYPERLINK l _bookmark4 “以体验为中心”的网络运维理念2 HYPERLINK l _bookmark
3、5 华为基于 AI 的园区网络智能运维解决方案4 HYPERLINK l _bookmark6 相比传统运维方案,网络架构有什么变化4 HYPERLINK l _bookmark7 流程是怎样的4 HYPERLINK l _bookmark8 关键技术6 HYPERLINK l _bookmark9 指标采集/边缘分析音视频业务指标采集和分析6 HYPERLINK l _bookmark10 秒级的海量数据汇集7 HYPERLINK l _bookmark11 体验可视化管理8 HYPERLINK l _bookmark12 质量评估体系8 HYPERLINK l _bookmark13 用户
4、旅程回放8 HYPERLINK l _bookmark14 数据分析基于大数据分析和机器学习识别故障和根因定位9 HYPERLINK l _bookmark15 基于故障知识库,对汇集的数据进行关联比对,发现异常9 HYPERLINK l _bookmark16 基于机器学习构建动态基线,识别潜在故障11 HYPERLINK l _bookmark17 相关性分析/关联指标分析,寻找根因12 HYPERLINK l _bookmark18 智能运维应用举例15 HYPERLINK l _bookmark19 通过“用户旅程回放”定位历史频繁掉线问题15 HYPERLINK l _bookmar
5、k20 “主动运维”及时发现弱信号覆盖问题16 HYPERLINK l _bookmark21 智能运维快速识别“无线网络拥塞”的根因18 HYPERLINK l _bookmark22 “主动运维”发现无线网络干扰源20 HYPERLINK l _bookmark23 “主动运维”发现“高信道利用率”问题,并诊断根因21 HYPERLINK l _bookmark24 智能运维快速检测“AP 离线”故障根因23 HYPERLINK l _bookmark25 实时检测IP 电话视频会议质量,并诊断故障原因24 HYPERLINK l _bookmark26 通过 KPI 关联分析,检测某用户
6、差体验的问题根因26 HYPERLINK l _bookmark27 通过“协议回放”,诊断某用户的接入失败故障根因27 HYPERLINK l _bookmark28 A 缩 略语30华为园区网络智能运维技术白皮书1 背景和挑战1 背景和挑战数字化转型时代我们处在快速的数字化转型时代,包括教育机构、制造工厂、办公大楼、政府机构、医疗机构等行业都在构建数字化空间,从而提升研发、生产和市场效率,并且更好地满足客户期望、提升客户体验。IDG 的数字化商业转型状况报告指出,52%的高管认为“成为数字化业务意味着通过移动、数据访问和辅助流程等工具来提高员工的生产率”。接近一半的高管(49%),也将数字
7、化转型视为“通过数据可用性和可见性更好地管理业务表现的能力”。对于 46%的决策者来说,数字化转型意味着满足客户体验期望。另外有 44%的人认为这意味着可以通过数据收集和分析来理解客户需求。1以设备为中心的“救火式”运维,难以满足数字化空间需求数字化转型提升生产效率和客户体验的同时,也带来园区网络的巨大变化。首先是终端数量的急剧增长。以 IoT 终端为例,2018 年的全球物联网联接数量已达到70 亿,其中 80%为无线个域网和无线局域网,而且仍然在以 17%的年增长率增长。2 除此之外,更多的数字化办公、生产、视频监控等终端接入网络。1 IDG 2018 年数字化商业转型白皮书: HYPER
8、LINK /tools-for-marketers/2018-state-of-digital-business-transformation-white-paper/ /tools-for-marketers/2018-state-of-digital-business-transformation-white-paper/2 IOT-ANALYTICS 2018 年关于IoT 终端数量的预测报告: HYPERLINK /state-of-the-iot-update-q1-q2-2018-number-of-iot-devices-now-7b/ /state-of-the-iot-upd
9、ate-q1-q2-2018-number-of-iot-devices-now-7b/其次,终端类型、操作系统类型、业务类型、流量模型的持续多样和复杂化。但同时,网络运维的资源和人力,没有得到同比例的增长,这使得“以设备为中心”的“救火式”运维难以满足数字化转型的需求。最后,数字化空间对故障的处理和恢复时间的容忍度在降低。越来越多的面向生产和客户服务的数字化业务产生,比如医疗场景的自动分药系统、商业的无人支付系统、仓储的自动导引运输车(AGV),这些数字化业务对故障的处理和恢复时间的容忍度远远低于普通的办公业务。以设备为中心的“救火式”运维,是当下园区网络的主要运维手段。它有两个典型特征:以
10、设备为中心,无法感知体验。传统的网络管理是以设备为中心的,网管提供设备管理、拓扑管理、告警配置等功能, 运维人员通过网管监控拓扑、告警来获知网络的异常。然而,随着终端数量的增多、数字化业务的多样化,设备的正常运转已经无法代表用户和业务体验的正常。举例:AP 设备正常运转,但如果存在很强的同频干扰,将导致 AP 服务的无线终端体验很差;网络设备正常运转,但如果存在 QoS 的配置错误,将导致某些应用的体验指标很差。被动响应“故障”发生,依赖现场定位和修复,故障恢复时间长。网络运维人员,时刻等待着响应故障,尤其是一些重大活动、重大事件需要保障时。一旦出现故障,运维人员第一时间查看网络拓扑,命令行登
11、录设备定位故障,60%以上的情境需要到达故障现场,针对已经消失的故障,需要等待故障复现或者尝试对故障进行复现。同时无线化进一步加剧了故障修复的复杂度,因为无线环境的复杂导致 90%以上的问题需要现场定位。3“以体验为中心”的网络运维理念基于“以设备为中心”的网络管理运维手段,无法满足数字化新空间的需求。“以设备为中心”的运维理念,需要升级为“以体验为中心”的运维理念。“以体验为中心”的运维理念, 包含两个方面:3 基于华为自身的园区数据统计和交付的园区网络项目的统计1)感知体验、对体验进行可视化管理,包括:对单个用户的 360体验可视化和旅程回放对全局用户的体验可视化2)主动识别用户和业务的体
12、验问题,发现潜在故障并识别根因,最终给出修复建议甚至自动修复,而非被动响应:故障发生,第一时间感知识别出体验差的用户和应用识别潜在问题,提前消除问题对问题或故障,进行根因定位,给出修复建议甚至自动修复华为园区网络智能运维技术白皮书2 华为基于AI 的园区网络智能运维解决方案2 华为基于 AI 的园区网络智能运维解决方案相比传统运维方案,网络架构有什么变化基于“以体验为中心”的运维理念构建的园区网络架构,相比较传统的园区网络运维方案, 有如下变化。最大的变化是,通过网络智能分析器基于大数据和 AI 的智能分析,感知用户和应用的体验、发现故障/潜在故障和并识别根因。并将结果通过符合 IT 运维人员
13、的工作思路, 友好地展示出来。为了支撑网络智能分析器的智能分析,网络设备具备数据采集和一定边缘智能分析能力,并进行实时地数据上报。流程是怎样的指标采集/边缘分析网络设备作为网络的触手,采集终端、设备和应用各个维度的指标和信息,包括终端接入的日志(包括协议交互)、终端 KPI、射频 KPI、设备 KPI、音视频业务 KPI 等等。有些指标(比如音视频业务 KPI)需要在边缘设备进行初步分析。数据汇集网络设备将采集的指标数据上报给分析器。智能分析器汇集秒级的海量数据。数据存储智能分析器对汇集的数据进行存储。数据分析智能分析器基于大数据分析和 AI 算法识别潜在故障和根因定位。结果展示智能分析器友好
14、地展示分析结果,包括业务和用户体验、潜在故障、故障根因等。修复建议对故障给出修复建议,包括具体修复步骤。华为园区网络智能运维技术白皮书3 关键技术3 关键技术指标采集/边缘分析音视频业务指标采集和分析设备在业务交互中会自然产生和记录用户接入信息、终端和设备的性能指标/日志。但音视频业务指标是无法直接获取的。由于音视频业务花屏、卡顿类故障短时间出现,故障难以复现,需要基于业务流实时采集指标数据。当前业界基于真实音视频业务检测技术有: vMOS 和 MDI。其中vMOS(Video Mean Opinion Score)解析报文太深,算法复杂,网络设备无法海量支持, 不能大规模部署。而MDI(Me
15、dia Delivery Index)解析开销较大,并且只能支持 UDP 承载的 TS 视频流,无法正确评估使用了 FEC、RET 增强的视频流。eMDI(Enhanced Media Delivery Index,增强型媒体传输质量指标)是华为专为音视频流设计,用于实时检测真实业务报文的丢包、乱序、抖动等质量指标的质量监控和定位算法。相比较MDI,eMDI 降低了解析开销,并增加了评估 FEC、RET 特性的指标,解决了 MDI 无法正确评估使用了 FEC、RET 增强的视频流的问题。具体采集流程为:交换机和 AP 通过 SIP Snooping 技术主动感知 SIP+RTP 音视频流,实时
16、探测音视频会话的建立与结束。并自动启用 eMDI 技术监控分析会话过程中的音视频流质量,包括丢包率、连续丢包数、乱序率和抖动等指标统计,并计算 MOS 值;同时 AP 还会补充计算下行空口丢包、时延等指标,从而识别质差音视频流。秒级的海量数据汇集传统网络管理系统采用 SNMP 来获取设备指标,但它有明显的缺陷,无法满足“以体验为中心”运维理念的需求。具体来说,首先 SNMP 使用“网管查询-设备响应”的拉模式(Pull Mode)采集数据。数据采集器与设备之间是一问一答的交互,一次查询对应一次响应。设备压力大,大量数据查询时效率低。其次 SNMP 使用刚性数据结构,完成一次有效采集需要多次数据
17、请求。基于这样的设计机制,SNMP 的数据查询的典型频率是 5 分钟, 如果查询频率过快会严重影响设备的正常业务。Streaming Telemetry 是从设备上远程高速采集数据的网络监控技术。设备通过推模式(Push Mode)主动向采集器上送信息,提供更实时、更高速、更精确的网络监控功能。具体来说,Streaming Telemetry 按照 YANG 模型组织数据,利用 GPB(Google Protocol Buffer)格式编码,并通过 GRPC(Google Remote Procedure Call Protocol)协议传输数据,使得数据获取更高效,智能对接更便捷。其中:YA
18、NG 模型是一种标准数据建模语言,可以为各种传输协议操作的配置数据模型、状态数据模型、远程调用模型和通知机制等。GPB(Google Protocal Buffer)编码是 Google 提出的与语言无关、平台无关、扩展性好的序列化结构数据格式。GRPC 协议是 Google 开发的基于HTTP/2 传输层协议承载的开源远程过程调用系统。总结,Streaming Telemetry 的几个优点:采用推模式主动推送数据,降低设备压力。周期性推送数据,避免网络延时造成数据不准确。可以监控大量网络节点,弥补传统网络监控方式的不足。Streaming Telemetry 效率比 SNMP 效率高 20
19、 倍以上,可以实现 10 秒级的数据采集频率。体验可视化管理“以体验为中心”的运维理念,首先要感知体验、对体验进行可视化管理。可视化的体验管理需要有两个关键问题需要解决。1)如何综合评价一个网络的业务体验?2)如何综合评价一个用户当前和历史的体验?所以需要一个综合的体验评估体系对网络的业务体验进行评价,同时能够感知某一个具体用户的业务体验。质量评估体系体验评估体系是指对某个网络进行综合体验评估的体系。对关键体验指标的详细披露和诊断。包括该体验指标的健康度、影响该指标的各方面因素的情况。影响园区网络业务体验的关键指标包括:接入成功率、接入耗时、覆盖、漫游达标率、容量达标率、吞吐达标率、设备在服率
20、。基于加权算法,给出对该园区网络的整体健康度的评估。该加权算法综合对该园区网络关键指标进行综合评估。对不同网络或同一个网络的不同区域,进行综合体验评估的排名。从而识别整体健康度排名靠后的、或者某些关键指标排名靠后的网络或区域。网络运维团队可以不断地通过改进排名末尾的指标,来提升该园区网络的整体健康度。网络质量自动评估,主动发送评估报告,提供专业评估报告服务。基于“全网概况” 、“指标详情” 、“整改建议”,实时或周期自动生成网络质量评估报表,提供可量化的网络体验。用户旅程回放通过对用户旅程回放,可以感知某一个具体用户的业务体验,包括当前的情况,以及过去发生了什么?尤其是过去的情况可以帮助网络运
21、维团队诊断在过去某一时刻因为什么影响了用户的业务体验。要做到用户旅程可回放,包括两方面:网络节点通过 Telemetry 和 Syslog 向网络智能分析器上报用户在网络中的旅程。网络智能分析器对采集的海量数据进行大数据分析,并将用户旅程按照时间轴进行全方位的图形化展示。展示内容包括什么时间接入网络、认证结果、体验如何、什么时间发生了漫游以及遇到什么问题等。数据分析基于大数据分析和机器学习识别故障和根因定位随着业务云化、终端无线化和物联网等带来业务模型的变化,使得网络节点增长,业务故障点、故障原因也成倍增长。传统的“以设备为中心”“救火式”运维已无法满足数字化时代对故障响应的需求,工程师人工分
22、析的手段已无法胜任对海量数据进行分析。让机器基于故障特征库在秒级采集的大数据仓库中自动关联分析、挖掘,并结合专家经验识别异常;而同时,海量大数据的汇集也给通过机器学习从海量数据中发现未知关联和因果关系,创造了条件。机器学习通过对海量数据持续学习,从而识别出复杂的业务模式、构建动态基线预测数据趋势、挖掘未知的关联关系,从而识别潜在故障和根因定位。所以基于大数据和机器学习的智能网络运维算法应运而生。华为园区网络智能运维算法主要包括如下几类。基于故障知识库,精确推理故障场景,精准根因分析基于专家经验和机器学习构建故障知识库,精确推理故障场景,自动识别故障根因,并给出最合理的修复建议。当前基于此算法可
23、实现的 Use Case 包括有:非 5G 优先接入的问题检测以同时广播 2.4GHz、5GHz 两个频段的 AP 为统计维度,统计一段时间内接入的支持5GHz 频段的终端,是否时常接入 2.4GHz 频段,并超过基准值,会导致用户体验可能下降。如果此 AP 下持续出现此场景,则判别为非 5G 优先接入问题。弱信号覆盖的问题检测统计每个 AP 下历史接入用户的信号强度,如果某个 AP 下大部分接入用户信号较弱, 且持续时间较长,超过规则基准,则判别此区域存在弱信号覆盖问题。乒乓漫游的问题检测统计两个 AP 在短时间内,其下某用户在 AP 间产生多次漫游记录。如果漫游次数达到规则基准,则判别发生
24、乒乓漫游问题。高干扰的问题检测统计一段时间内受到同频、邻频、非Wi-Fi 频段等各种信号干扰的射频超过学习到的基线值(基于每个射频历史干扰数据学习产生),并持续一段时间,则命中高干扰问题。高信道利用率的问题检测统计一段时间内射频持续处于繁忙状态,包括正常Wi-Fi 数据传输对信道频段占用,以及信号干扰对信道频段占用,如果利用率的占用超过学习基线值(基于每个射频的历史信道利用率干扰数据学习产生),并持续一段时间,则命中高信道利用率问题。基于协议回放实现用户接入故障的根因定位传统的业务故障定位,通过网管和其它工具,可以将问题定位至某个网元或某个业务阶段,但如果故障现象不复现的话,往往难以进一步地排
25、查出问题的根因。比如针对用户接入问题的故障定位,最普遍的定位手段是对接入过程模拟和重现来证明哪一个阶段的问题,比如是认证失败导致的接入失败。然后通过报文抓取进一步检测失败的原因,比如是认证证书过期。这种定位手段依赖工程师到达问题现场的故障模拟重现,是低效的。而且对一些偶发性的故障往往束手无措。“协议回放”针对已经发生的故障进行过程回放,通过将终端在接入的 3 个阶段(关联、认证和 DHCP)进行“协议回放”,把过程解剖至最小颗粒,也就是每一个协议的报文交互,并基于故障知识库,精准给出本次个障出现的具体原因。具体过程是:网络设备上报终端在接入的 3 个阶段(关联、认证和DHCP)的协议报文。园区
26、网络智能分析器细化分析各个协议交互过程的结果与耗时。分析器进行相关性分析,给出用户接入过程个障的深层次原因。基于机器学习构建动态基线,识别潜在故障动态基线是对某一个指标构建的动态随时间变化的基线,用以定义该指标的正常范围, 并预测该指标变化趋势。动态基线不是简单的静态基准线,而是随时间变化动态生成的趋势,包含了对未来走势的预测。所以可以用动态基线来检测判定是否发生异常。如下图所示,基于动态基线预测的范围(灰色阴影部分)与实际网络产生的数据(绿色折线图)对比,对于超出动态基线的数据时刻,可以初步判定为异常事件,从而识别潜在故障。动态基线的算法包括 3 个环节:数据集预处理、动态基线生成和异常检测
27、。数据集预处理是指网络智能分析器对汇集的数据进行预先处理,使得数据是准确和完备的,尤其是去除噪声数据。预处理过程包括基于专家经验构建初始数据、数据清洗和多维度合并、对丢失的数据进行补齐、去除不合理的异常数据、对尾部数据进行修正、以及对波动大的数据进行合理化处理。动态基线生成是指通过算法来构建动态基线。包括使用周期序列算法、高斯回归算法和多元幂指算法进行阈值模型训练与预测,并通过均值和方差计算调整阈值边缘,最后根据经验进行灵敏度修正。当前基于此算法可实现的 Use Case 包括有:认证类的问题检测统计一段时间内认证失败/认证超时/认证慢的终端数量在总的终端数量中的占比,当此比例超过动态基线值,
28、则判别发生认证类问题。关联类的问题检测统计一段时间内关联失败/关联慢的终端数量在总的终端数量中的占比,当此比例超过动态基线值,则判别发生关联类问题。DHCP 类的问题检测统计一段时间内 DHCP 失败/DHCP 慢的终端数量在总的终端数量中的占比,当此比例超过动态基线值,则判别发生DHCP 类问题。设备类故障的问题检测统计网络设备指标(CPU、内存、端口拥塞、光模块异常等),并持续一段时间超过动态基线值,则判别发生设备类故障。相关性分析/关联指标分析,寻找根因园区网络存在多类业务节点和网络节点,同一个节点有很多指标。这些不同的节点、不同的指标之间存在很多关联,使得网络的故障模式是复杂和多变的。
29、针对同一个问题现象(比如用户认证失败)可能有不同的根因(弱覆盖、证书错误),而不同的现象(带宽低体验差、信道利用率高)可能指向相同的根因(区域干扰)。所以通过对海量数据进行关联性分析,找出未知的关联、因果关系,从而有效地帮助运维人员寻找问题的根因。当前基于此算法可实现的 Use Case 包括有:无线信道利用率高的根因分析对于无线信道利用率过高的现象,通过关联分析终端数量变化、干扰情况、终端信号强度和空口协商速率,识别出规律和关联性,从而寻找问题的根因是负载急剧增多、出现干扰源或者是个别低速或低信号终端长期占用无线资源。音视频应用质量感知和故障根因检测对各个网络节点上报的同一音视频业务流的 M
30、OS 值进行综合对比,可以判别哪一段网络的业务质量不达标。同时对相关的空口指标、设备指标、端口拥塞等信息进行汇总分析,识别关联性,从而寻找问题的根因是无线网络质量、设备高负载或者是有线网络的节点拥塞。质差用户的根因分析对于业务体验长时间差的用户,可以基于 KPI 关联分析算法进行根因定位。具体过程为:基于用户的历史 KPI,通过机器学习构建用户业务指标劣化的阈值,以此判定和识别出业务体验差的用户。对影响业务体验的各种指标(4 大类、9 小类)进行全方位的分析,根据各指标的劣化情况,以及基于专家经验和机器学习持续优化的指标相关性权重,得出各指标对影响业务体验的关联程度,从而最终得出根因。应用业务
31、体验的相关指标:大类小类指标覆盖类RSSI干扰类干扰率吞吐类非 5GHz 优先信道利用率反压计数上行协商速率下行协商速率华为园区网络智能运维技术白皮书3 关键技术大类小类指标设备类CPU 占用率内存占用率华为园区网络智能运维技术白皮书4 智能运维应用举例4 智能运维应用举例通过“用户旅程回放”定位历史频繁掉线问题问题现象某用户报障,上周五下午 4 点 15 左右Wi-Fi 不稳定,时常掉线,网络无法正常使用。问题分析1、 获取此用户MAC 地址,在用户中搜索找到此用户。2、 进入用户全旅程页面,发现此用户当天的平均场强较差,平均时延也较高。3、 用户全旅程中找到用户报障的对应时段(16:15
32、左右),发现用户在时段前后频繁发生漫游,且漫游前后的 AP 上平均场强都较低。4、 打开漫游时段前后关键 KPI 监控,发现此用户场强在漫游时段内持续较弱,用户频繁更换 AP 接入,导致网络体验较差。问题解决进一步现场排查,发现此区域存在弱覆盖,导致此用户频繁发生漫游,经过补盲后问题消失。“主动运维”及时发现弱信号覆盖问题问题现象某公司运维人员在故障分析页面,发现 H 区 1 楼编号 AP46 的 AP 出现了弱覆盖问题。问题分析1、 在故障统计页面中,发现此 AP 当天长时间(从早上 8:00 至下午 16:00)被识别为弱覆盖区域。2、 打开详情页面,发现其下历史时段接入的用户几乎全部为弱
33、信号接入。3、 运维人员与该 AP 的维护人员沟通发现,此区域的弱覆盖出现在访客 Wi-Fi 上,而一般内部办公区域是不开放访客 Wi-Fi(访客 Wi-Fi 用于访客,仅可访问互联网), 且该楼层也只有这一个 AP 开启了访客 Wi-Fi。进一步沟通发现,由于最近公司新来了合作方员工,为方便他们对网络使用单独对此 AP 开放了访客Wi-Fi,但后续合作方位置做了调整,远离了此 AP,导致合作方信号接入体验下降(全部为弱信号接入)。问题解决根据合作方新的办公位置,在最近 AP 上开启了访客 Wi-Fi。原来的 AP46 关闭了信号, 此弱覆盖问题不再出现。此主动运维及时发现了问题并快速修复调整
34、,主动提升了用户体验。智能运维快速识别“无线网络拥塞”的根因问题现象某公司运维人员接到多个用户报障,在 x 月 x 日 11 点 10 分左右,Wi-Fi 网络使用体验下降,出现网页打开慢,通话语音闪断,还伴有异常下线等现象。问题分析1、 根据报障的多个用户,发现这些用户集中在某个区域。2、 运维人员通过 CampusInsight 系统的故障统计页面中发现 11 点 10 分钟左右,此AP 出现空口拥塞问题,影响了 34 个用户。3、 进入此问题详情页面,发现在 11 点 10 到 11 点 19 时间段内,射频上的反压次数飙升,超过了 99%的同时段其他射频,且射频下流量持续较高。反压计数
35、:射频在数据传输过程中,如果信道占满导致数据无法即时转发,则射频会缓存数据, 每次缓存则计一次反压次数。反压用户数据会导致用户时延增大,影响用户上网体验。4、 进入此 AP 详情页面查看对应时段数据,在反压次数增大时,对应 5G 频段的信道利用率增高,同时其下所有接入用户的平均时延加大(最大达到 173ms),体验较差。5、 从同时段下接入用户使用流量分布统计来看,发现有三个用户在 10 分钟内使用了超过 1G 的流量,初步怀疑为个别用户流量超大导致其他用户体验较差。6、 针对此三个异常大流量用户调研,发现这三个用户为刚入职新员工,当时正在一起下载培训视频资料,导致短时间内流量冲高,占据了所有
36、带宽,造成此 AP 下其他用户体验下降。问题解决该区域 AP 之前一直开启网络限速,但由于某次活动有 VIP 用户造访,为保证 VIP 体验临时关闭了限速,之后忘记调整配置导致此问题。重新开启网络限速,限制单用户的网路速率,此区域没有再次出现此问题。“主动运维”发现无线网络干扰源问题现象某公司运维人员在故障统计页面,发现 23 个 AP 累计出现 260 多次高干扰问题。问题分析1、 高干扰问题统计页面,历史出现大量的高干扰问题,且大部分出现在 2.4GHz 信号, 出现问题期间用户数为 0,流量很低。2、 具体查看某一个问题详情,干扰率非常高。其它 AP 在 2.4GHz 频段的干扰率也非常
37、高。在这种情况下,终端基本无法上线,或上线后体验很差。据此可以判断周边出现重大干扰源。问题解决进一步现场调查,发现此区域有实验室进行某无线设备的测试,导致干扰持续发生。联系实验室人员,降低设备的发射功率,故障消失。“主动运维”发现“高信道利用率”问题,并诊断根因问题现象出现高信道利用率问题,利用率持续在 75%以上,高峰达到 100%。问题分析1、 VIP 区域出现持续 10 分钟以上的高信道利用率问题,峰值达到 100%2、 从同时段内接入的人数与干扰率来看,都不高,说明并非用户量大及干扰导致的信道利用率冲高3、 但从同时段内接入用户的协商速率分布来看,有三个用户协商速率低于 10Mbps,
38、 属于低速率用户接入网络。4、 排查其中 2 个用户的流量较少,没有大量占用信道资源。但其中一个用户在该时段10 分钟内产生了 1.11G 流量,属于低速用户长时间占用空口信道资源,导致信道利用率冲高,但实际网络吞吐量较低。问题解决设备上开启空口资源调度时间均衡机制,减少低速率用户对空口的信道占用时间,屏蔽低速率用户长期占用信道。智能运维快速检测“AP 离线”故障根因问题现象某公司运维人员在故障分析页面,发现有一个 AP 离线。问题分析1、 AP 离线统计页面,发现 AP(10-47-80-af-fe-a0)从 15:00 开始离线。2、 同时发生 PoE 供电问题。3、 从 PoE 故障对象
39、管理器中,是因为配置的 PoE 最大供电功率较低导致 AP 离线。问题解决调整 PoE 端口的最大供电功率。实时检测 IP 电话视频会议质量,并诊断故障原因问题现象某用户使用 IP 电话进行视频会议,发现音视频的业务体验不佳。问题分析1、 运维人员通过 CampusInsight 检测实时或历史的音视频会话质量。并发现该用户提及的会话,其下行MOS 值低于 4。2、 打开该回话详情。CampusInsight 展示了该段会话的网络路径,而 MOS 值从S5730HI-3 此台交换机之后的链路开始降低。3、 CampusInsight 告知问题发生在 S5730HI-3 交换机的 GE0/0/24 端口。4、 并且 CampusI
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第19课 资本主义国家的新变化 课件-【知识精研】高一下学期统编版(2019)必修中外历史纲要下
- 2025年公务员招聘考试行测常识题库及答案
- 江苏省镇江市2024-2025学年高三下学期开学质量监测化学试题(原卷版+解析版)
- 农业产业链监管体系建设指南
- 2024年六年级品社下册《地球在哭泣》教学设计 未来版
- 12《我们小点儿声》(教学设计)-2024-2025学年统编版道德与法治二年级上册
- 9雪梅教学设计-2024-2025学年四年级上册语文统编版
- 11 别伤着自己第二课时(教学设计)2023-2024学年统编版道德与法治一年级上册
- 2《用水计量时间》教学设计-2024-2025学年科学五年级上册教科版
- DB3713-T 255-2022 大棚黄瓜农机农艺融合栽培技术规程
- 13诗第十二-整本书阅读系列《经典常谈》名著阅读与练习
- 小学美术-湘美版四年级下册第10课中国龙教学设计学情分析教材分析课后反思
- 一年级下册劳技教案
- 部编版四年级语文下册第4单元大单元整体教学作业设计(教案配套)
- 大一逻辑学全部
- 游戏法缓解小班幼儿入园焦虑的个案研究
- 2023年包头轻工职业技术学院单招综合素质题库及答案解析
- 地下室顶板裂缝防水处理方案(完整资料)
- 宫颈锥切日间手术临床路径(妇科)及表单
- GB/T 23111-2008非自动衡器
- GB/T 18877-2020有机无机复混肥料
评论
0/150
提交评论