版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、案例脚本初稿确少标题故事案例:华为设备隐性缺陷导致GPRS上网故障案例处理过程:1. 客户投诉外景:2011年8月5日 8:00 大量用户投诉 上不了网;2. 同时,客服发大面积投诉预警到网管中心 3. 网管中心监控处理通知数据专业值班专家4. 值班专家通知GPRS、WAP专业专家处理 5. 2011年8月5日 8:05,正在食堂吃饭的专家直接赶到现场分析处理故障;6. 2011年8月5日 8:25经过处理,故障被排除,但是隐患未消除;7. 专家讨论,技术分析,找出根本原因,解决隐患;处理过程在下节展开,中间可以回溯拍摄专业平台分析8. 隐患解决并根除,形成故障案例;9. 总结故障过程中需要改
2、良的方法、技术手段;配音移动互联网时代的到来给移动数据流量带来了爆炸性增长,也对移动网络提出了更高的要求与挑战!如何更有效的支撑保障用户良好的上网体验,如何预防与监控网络的安全平稳有效运行,如何在网络故障发生时及时有效的处理,中国移动通信集团湖北网管中心作为维护生产第一线,面临着前所未有的机遇与挑战!中国移动通信集团湖北网管中心是中国移动通信集团湖北直属生产单位,主要负责湖北移动全省网络设备的集中监控、全省省级骨干层和本地骨干层设备的集中维护、全省网络设备的生产管理等工作。目前,拥有职工170余人,平均年龄32岁。其中:博士、硕士、大学本科学历职工160多人,占90%;集团公司、省公司技术专家
3、20多人,是湖北移动网络维护的龙头。少了引入的话题或介绍:主题:详细的案例处理:针对5、6、7点展开1. 快速分析定位:GPRS专家根据投诉分析、金硕业务检测系统、GPRS专业维护平台确定用户投诉地点为四个华为BSC覆盖区域,WAP专家通过业务测试确定WAP侧并没有问题,确定问题在GPRS侧,考虑到8月5日凌晨恩施移动将四个华为BSC从爱立信SGSN割接到华为SGSN27,当晚割接成功,并且测试正常。对部分投诉用户进行信令跟踪,没有发现问题。查询BSC下统计数据,发现:下行TBF建立成功率下降近3个百分点;通过分析华为SGSN27上的Gb模式寻呼话统发现,寻呼成功率远低于同为华为的SGSN18
4、。投诉现象为用户能够上网,但是等待一段时间几分钟后,或者发生下去切换后不能网络出现无响应。所有证据似乎指向华为的BSC与新版本SGSN的配合出现问题。2. 保业务、快速处理:8月5日8:15,经过对投诉情况的评估,决定8月6日将四个华为BSC割回原SGSN,同时将测试BSC挂接到华为SGSN,进行测试和故障定位。8月6日8:25倒回后,故障现象消失。分为两个组分别查无线设备和核心网设备。3.分析原因,找出隐患:8月7日,无线设备的检查没有发现问题,而且在8月7日将测试设备挂接到SGSN27上即出现相同问题,割接到其他华为SGSN后问题消失。基本可以肯定是SGSN27的问题。核心网的处理完全没有
5、头绪,在设备的告警和日志中没有发现任何问题。但是不能将设备重启,一旦重启,故障原因将永远不能查出一直到故障再次发生。8月8日,分析,华为设备之间的兼容性问题可能性很小。以为与其他同版本的SGSN完全没有问题。决定深入设备内部,进行话统、信令、与其他正常设备比较,查明产生问题的根源。话统分析:故障现象:下行TBF建立失败次数增多,失败的原因主要是 无响应信令分析:可能之一:因为SGSN丢包产生 发送的CELL UPDATA的NULL FRAME SGSN未正常收到,任然在原小区发送下行PDU,导致TBF建立失败。可能之二:用户在这个小区发了NULL帧后,重选到这个小区,但是一直没有收到任何下行数
6、据。这两种情况都不成立。对信令进行字节级得比对和分析发现: SGSN27上抓到的Gb接口跟踪分析,发现SGSN分配使用的PTMSI中的段号值与数据库中查找出来的不一致,段号是PTMSI中的假设干位,用来表示某个SPP进程。后经打印SPP进程内存里的记录段号的全局变量发现确实与数据库里保存的不一致。8月12日,比对所有华为SGSN的硬件版本、配置、近期的操作日志列表,发现SGSN与其他SSGN唯一的不同是进行过板卡移除操作,同时使用过SET SYS指令。分析指令SET SYS,该指令会修改段号表的值。增加删除单板和进程组操作后,又执行了SET SYS命令,因为这些操作都会修改段号表的值即,而SE
7、T SYS命令里存在BUG,没有考虑增删进程组导致段号表也修改的场景。8月12日凌晨,对SGSN27进行了重启,经测试问题解决8月15日,在华为实验室,重现了故障场景,故障被彻底定位。经过一周的故障处理,不但解决了问题,而且发现了厂家软件的BUG。4.故障总结:1. 此故障最终定位的原因隐藏较深,所以高度的责任感、扎实的专业技能、追根溯源的工作精神为最终准确定位故障,解决隐患的必备条件,这体系了网管中心专家良好的职业技术水平、兢兢业业的工作态度、永不放弃的精神!2. 完善的故障处理流程为确保故障发生时网络的及时恢复提供了坚实的保障!此故障处理过程中监控及时上报,专家及时处理,处理时先保业务后排
8、故障,最后分析故障思路清晰!讲话一:在网管中心,这样的大大小小的故障随时都有可能发生,我们的专家也随时做好了为保障网络平稳运行,为解决故障第一时间出现在现场做好了技术上、精神上的准备!讲话二:经过几年的建设和完善,实现了网上核心设备和主要设备的三集中,大大加大了设备管理维护优化力度,加大了对客户服务的力度。并得到了上级部门的认可和赞赏。获得了一批国家、省市奖项。网管中心专家 某某某 因为事件得到省公司网络部发文通报表扬!网管中心绿色网络班组也获得了集团优秀班组的荣誉!到时候可以把荣誉室的那些荣誉都拍一拍 这个基本就ok了未来网管中心会以更好的保障全省网络安全稳定的运行,将继续完善监控手段、优化
9、故障处理流程、总结故障案例,为网络的可靠运行提供坚实的基础!说明:拍摄涉及到的场景:估计有:1. 用户投诉; 2.客服处理; 3.监控通知专家 4.专家在专业平台处理,5.专家分析原因 6.总结 actively carry out the law on civil air defense education, drawn out of the air defense in Pingliang city Building under easy fare, daily special inspection and regulation, overfulfilled the province uppe
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论