《机房故障检测流程》PPT课件.ppt_第1页
《机房故障检测流程》PPT课件.ppt_第2页
《机房故障检测流程》PPT课件.ppt_第3页
《机房故障检测流程》PPT课件.ppt_第4页
《机房故障检测流程》PPT课件.ppt_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机房故障处理的一般流程 和常用方法 -Written by wws 几点说明 介绍常见故障的分析思路和处理方法 ,以实用为主。 以程控为蓝本做穿插介绍,其思路和 方法也适用于机房其他大多数设备。 以听为主。 预备知识 应该具备的基础知识 对维护人员的基本要求 具备一定的专业素质和技能 对系统和组网的熟悉 对设备的操作 对仪器、仪表的掌握 专业素质和技能 维护人员应做到以下应知应会: 1.熟悉PCM原理、SDH原理、交换原理等 通信专业知识。 2.熟悉交换机的功能结构、呼叫流程、业 务流程等产品相关 知识。 3.熟悉中国一号信令、No.7信令、DSS1 信令、V5.2协议等相关信令协议。 4.熟悉相关国标技术规范。 5.熟悉计费原理及流程。 6.了解以太网、TCP/IP、Client/Server 、数据库常识等计算机网络基础知识 。 7.熟练掌握程控交换机日常操作及计算机 基本操作。 对系统和组网的熟悉 熟知C&C08的硬件结构及性能参数。 熟知C&C08各模块在网络中的地位。 熟知C&C08各模块间及到各局所的路由 组织。 熟知C&C08与各组网设备所使用的信令 或协议。 熟悉相关传输设备的网络结构和信道分 配。 对设备的操作 哪些操作将导致部分或全部业务中断。 哪些操作将造成设备损坏。 哪些操作将对计费产生重大影响 。 哪些操作将导致用户投诉。 有哪些应急或备份的措施。 对仪器、仪表的掌握 万用表 七号信令分析仪 PCM分析仪 光功率计 示波器 E10表 故障处理的一般流程 信息收集 故障判断 故障定位 故障排除 信息收集 尽可能详尽地获取各种原始信息 1 of 4 故障信息来源的四种途径 用户或客服中心申告 相邻局维护人员的通告 交换机告警系统的告警输出 日常维护或巡检中所发现的异常 信息收集 必要性 实用性 机房巡视路线图 交换 传输/其它 电源 发电机房 巡视内容 设备运行状况 机房卫生 空调运行情况(夏季) 机房其它异常情况 维护建议之一 维护人员要有收集相关信息的强烈意 识,在遇有故障特别是重大故障时, 一定要先弄清楚相关情况后再决定下 一步的工作,切忌盲目处理。 维护建议之二 维护人员要加强业务学习,特别是系 统原理和信令知识,这样,在故障的 情况下才能快速联想,把思路引向问 题的焦点。 维护建议之三 在接听故障申告(通告)电话时,维 护人员要善于引导,尽量从多方面、 多角度提问或询问相关问题。 维护建议之四 维护人员应加强横向、纵向的业务联 系,建立与其他局所或相关业务部门 (如传输机房等)维护人员的良好业 务关系,这对于信息交流、技术求助 等都是很有帮助的。 故障判断 确定故障的范围与种类 2 of 4 确定故障的种类与范围 种类-故障发生的所在区域 范围-故障性质 故障定位 确定故障的具体原因 3 of 4 故障定位就是“从众多可能原因中找出这 个单一原因”的过程,它通过一定的方法或 手段分析、比较各种可能的故障成因,不断 排除非可能因素,最终确定故障发生的具体 原因。 准确而快速的定位不仅有利于提高故障 处理的时效,而且还可以有效避免因盲目操 作设备而导致故障扩大化等人为事故,为采 取何种手段或措施排除故障提供指导和参考 ,是故障处理过程中的重要环节。 故障排除 采取适当的措施或步骤,清除故障、 恢复系统 4 of 4 故障排除 在故障原因最终定位以后,就进入了 故障处理程序的最后一步排除故障 。 排除故障是指采取适当的措施或步骤 清除故障、恢复系统的过程。如更换 故障单板、修改配置数据、倒换系统 、复位单板等。 故障判断与定位的常 用方法 原始信息分析 告警信息分析 指示灯状态分析 电话拨测辅助分析 仪器、仪表辅助分析 话务统计分析 接续、信令跟踪 测试、环回 对比、互换 倒换、复位 请求厂家技术支持 原始信息分析 原始信息是指通过用户故障申告、其他局所 故障通告、维护中所发现的异常等所反映出 来的故障信息,以及维护人员在故障初期通 过各种渠道和方法收集到的其他相关信息的 总和,是进行故障判断与分析的重要原始资 料。 原始信息分析主要用来判断故障的范围、确 定故障的种类,在故障处理的初期阶段,为 缩小故障判断范围、初步定位问题提供判据 。如果维护经验丰富,甚至还可以直接定位 故障。 告警信息分析 告警信息是指交换机告警系统输出的信息,通常以 声音、灯光、LED显示、屏幕输出等形式提供给维 护人员,具有简单、明了的特点,其中告警维护台 输出的告警信息,包含故障或异常现象的具体描述 、可能的发生原因、有哪些修复建议等等,涉及硬 件、链路、中继、计费、CPU负荷等交换机的各个 方面,信息量大且全,是进行故障分析和定位的重 要依据之一。 告警信息分析主要用于查找故障的具体部位或原因 ,由于C&C08告警台输出的告警信息丰富、全面, 因此常常可以用来直接定位故障的原因,或配合其 他方法共同定位故障的原因,是故障分析的主要手 段之一。 告警窗口 告警信息输出 指示灯状态分析 C&C08交换机的每块单板上都有相应的运行 、状态指示灯,有的还有功能或特性指示灯 ,这些指示灯除了直接反映相应单板的工作 状况以外,大部分还可反映诸如电路、链路 、光路、节点、主备用等的工作状态,是进 行故障分析和定位的重要依据之一。 指示灯状态分析主要用于快速查找大致的故 障部位或原因,为下一步的处理提供思路。 由于指示灯所包含的信息量相对不足,因此 ,它常常与告警信息分析配合使用。 设备指示灯面板 灯名颜色含义说明 正常 状态 RUN红色运行指示灯 1秒亮1秒灭:单板正常运行 灭:DTM与NOD通信失败 1秒亮1 秒 灭 CRC1绿色 第1路CRC4检验出错指 示灯 亮:表示第1路CRC4检验出错 灭:表示检验正常 灭 LOS1绿色第1路信号失步指示灯 亮:表示第1路信号失步 灭:表示信号正常 灭 SLP1绿色第1路信号滑帧指示灯 亮:表示第1路信号有滑帧 灭:表示信号正常 灭 RFA1绿色 第1路信号远端告警指示 灯 亮:表示第1路信号远端告警(对告 ) 灭:表示信号正常 灭 CRC2绿色 第2路CRC4检验出错指 示灯 亮:表示第2路CRC4检验出错 灭:表示检验正常 灭 LOS2绿色第2路信号失步指示灯 亮:表示第2路信号失步 灭:表示信号正常 灭 电话拨测辅助分析 在交换机所提供的所有业务中,语音占很大 部分,因此,与交换机有关的大部分故障原 因,往往会直接或间接地影响到用户的正常 呼叫功能,因此,利用电话拨测这一最直接 的方法来判断交换机的呼叫处理功能和相关 模块是否正常,是一种简单、快捷的方法, 常常用来判断用户外线、交换网络、中继系 统、计费系统等是否正常。 仪器、仪表辅助分析 应用仪器、仪表进行故障分析与定位 ,是交换机故障处理常用的技术手段 。它以直观、量化的数据直接反映故 障的本质,在外线分析、电源测试、 信令分析、波形分析、误码检测等方 面有着广泛的应用。 话务统计辅助分析 接通率是程控交换机的一个重要技术指标, 它直接影响到运营商的经济效益和客户服务 满意度,是电信运营商核心竞争力的要素之 一,因此,提高接通率并降低呼损,是运营 商们普遍关注的重要内容。 但是,影响程控交换机接通率的因素纷繁复 杂,而且偶然性大,难以有效地加以预测。 因此,提高接通率的关键就在于要能够及时 地找出引起呼损的主要因素并加以有效地防 范,话务统计就是这样一个有力的分析工具 。 接续、信令跟踪 接续、信令跟踪在分析用户呼叫接续 、局间信令配合等过程的失败原因方 面有着重要的应用。利用跟踪的结果 ,常常可以直接得到呼叫失败的原因 ,找出问题的症结所在,或者从中得 到启发,为后续分析提供宝贵的思路 。 测试环回 测试主要是指借助于仪器仪表、软件测试工具等手 段,对可能处于故障状态的用户线路、传输信道、 中继设备等进行相关技术参数的测量,根据测量的 结果判断设备是否已经故障或者正处于故障的边缘 。 环回主要是指采用硬件或软件的方法,对某一传输 设备或传输信道采取自发自收(自环)的方法,通 过判断自环后传输设备、传输信道、业务状况、信 令配合等情况的正常与否,来确定相关硬件设备的 状况、软件参数的设置是否正常,是定位传输问题 、中继参数设置是否准确等的最常用方法之一。 特别提示 软件环回有时由于疏忽往往容易忘记 取消环回,从而给交换机的运行带来 一定的操作隐患,因此,为了避免此 类事件的发生,我们建议维护人员应 养成经常记录的习惯。 对比/互换 对比是指将故障的部件或现象与正常的部件 或现象进行比较分析,查出不同点,从而找 出问题的所在,一般适用于故障范围单一的 场合。 互换是指用备件进行更换操作后,仍然不能 确定故障的范围或部位,此时将处于正常状 态的部件(如单板、光纤等)与可能故障的 部件对调,比较对调后二者运行状况的变化 ,以此判断故障的范围或部位,一般适用于 故障范围复杂的场合。 特别提示 互换操作具有一定的风险性,例如, 将处于短路状态的单板换到正常的机 框后又造成正常机框损坏等,因此, 互换方法的使用需要谨慎行事,要以 确保不导致新故障为前提。 倒换/复位 倒换是指将处于主备用工作方式下的交换机进行人工切换的操 作,也就是说将业务从主用设备上全部转移到备用设备上,对 比倒换后系统的运行状况,以确定主用设备是否异常或主备用 关系是否协调。 复位是指对交换机的部分或全部进行人工重启的操作,主要用 于判断软件运行是否混乱、程序是否“吊死”等软件BUG问题, 是不得已采取的极端操作行为。 相对于其他方法而言,倒换或复位不能对故障的原因进行精确 定位,而且由于软件运行的随机性,倒换或复位后故障现象一 般难以在短期内重现,从而容易掩盖故障的本质,给交换机的 安全、稳定运行带来隐患,因此,该方法只能作为一种临时应 急措施,在迫不得已的情况下谨慎使用。 特别提示 对主控类单板的倒换操作一定先执行备份操 作,避免话单、系统数据丢失。 由于复位操作常常会导致系统业务的中断, 甚至可能由于操作不慎而导致系统瘫痪,给 交换机的日常运营带来严重的负面影响,因 此,该操作仅适用于影响范围小、有备份措 施或经上级批准操作的场合,一般情况下, 不建议使用复位操作来进行故障的定位。 寻求厂家技术支持 交换局点的详细名称(全称) 联系人姓名、电话号码 故障发生的具体时间 故障现象的详细描述 交换机的主机软件版本 故障后已采取的措施和结果 问题的级别及希望解决的时间 华为联系方式 8008302118 S 课程回顾 预备知识(应知应会基本要求) 故障处理的一般流程 故障定位、分析常用的方法(11种) 谢谢 大家! Wws May 18 2011 课程笔记之一 对维护人员的基本要求 具备一定的专

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论