网络故障诊断与解决专家系统_第1页
网络故障诊断与解决专家系统_第2页
网络故障诊断与解决专家系统_第3页
网络故障诊断与解决专家系统_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、文章题目网络故障诊断与解决专家系统该项目主要的研究内容是制作一个网络故障诊断与解决的系统。该系统可以帮助用户智能的诊断计算机网络上出现的问题,包括硬件方面、网络配置及病毒影响等。可以形象地向用户报告诊断结果,并且依据软件本身存储的解决方案有效快速地自动解决问题(使一切非物理故障得到有效解决)。其工作原理概括如下:确定问题出现的环节(如网线故障、网络配置等)9从数据库中检索到相应的问题类型9从库中找到解决方案9问题得到解决。网络故障诊断与解决专家系统邓鹏摘要:为了使系统能够高效地对各种复杂网络进行管理,本文提出了基于产生式的故障诊断专家系统。归纳总结了网络 故障的知识范围,构成故障知识库。在该知

2、识库的基础上采用故障定位向导程序进行推理,实现管理和诊断网络故障。关键词:网络故障诊断 专家系统 定位向导 层次推理Network faults diagnosis and resolution of expert systemDENG Peng(Department, City, City Zip Code, China)Abstract:In order to manage all kinds of complex network efficiently ,fault diagnose Expert Database System based on productionsystem is

3、introduced in this paper. In this system ,network fault knowledge is collected and fault knowledge database is set up. Fault detecting guide is designed for managing and diagnosing network fault。.Key words: Network fault detection ;Expert system ;Fault detecting guide ;Level reason专家系统(Expert System

4、, ES),也称基于知 识的系统(Knowledge Based System,KBS),是人 工智能(Artificial Intelligence,AI)的一个新 的分支,也是发展最快的一个分支。ES实际上是 AI计算机程序系统,它能利用目前大量人类专家 的专门知识和方法来解决现实生活中某些复杂的重 要问题。1网络故障我们可以根据网络故障的性质把网络故障分为 物理故障与逻辑故障,也可以根据网络故障的对象 把网络故障分为线路故障、路由故障和主机故障。1.1物理故障物理故障指的是设备或线路损坏、插头松动、 线路受到严重电磁干扰等情况。比如说,网络管理 人员发现网络某条线路突然中断,首先用pin

5、g或 fping检查线路在网管中心这边是否连通。ping 的格式为:ping HYPERLINK 或 ping ( 是 IP 地址,可以是主 机的IP也可以是网络中另一台计算机的IP)。ping 一般一次只能检测到一端到另一端的连通性,而不 能一次检测一端到多端的连通性,但fping 一次就 可以ping多个IP地址,比如C类的整个网段地址 等。顺便多说一句,网络管理员经常发现有人依次 扫描本网的大量IP地址,不一定就是有黑客攻击, fping也可以做到。如果连续几次ping都出现Requst time out信息,表明网络不通。这时去检查端口插 头是否松动,或者网络插头误接,这种情况经常是

6、没有搞清楚网络插头规范或者没有弄清网络拓扑 规划的情况下导致的。另一种情况,比如两个路 由器Router直接连接,这时应该让一台路由器的 出口连接另一台路由器的入口,而这台路由器的入 口连接另一路由器的出口才行。当然,集线器Hub、 交换机、多路复用器也必须连接正确,否则也会导 致网络中断。还有一些网络连接故障显得很隐蔽, 要诊断这种故障没有什么特别好的工具,只有依靠 经验丰富的网络管理人员了。1.2逻辑故障逻辑故障中最常见的情况就是配置错误,就是 指因为网络设备的配置原因而导致的网络异常或 故障。配置错误可能是路由器端口参数设定有误, 或路由器路由配置错误以至于路由循环或找不到 远端地址,或

7、者是路由掩码设置错误等。比如,同 样是网络中的线路故障,该线路没有流量,但又可 以ping通线路的两端端口,这时就很有可能是路 由配置错误了。遇到这种情况,我们通常用“路由 跟踪程序”就是traceroute,它和ping类似,最 大的区别在于traceroute是把端到端的线路按线 路所经过的路由器分成多段,然后以每段返回响应 与延迟。如果发现在traceroute的结果中某一段 之后,两个IP地址循环出现,这时,一般就是线 路远端把端口路由又指向了线路的近端,导致IP 包在该线路上来回反复传递。幸好traceroute可 以检测到哪个路由器之前都能正常响应,到哪个路 由器就不能正常响应了。

8、这时只需更改远端路由器 端口配置,就能恢复线路正常了。逻辑故障的另一类就是一些重要进程或端口 关闭,以及系统的负载过高。比如也是线路中断, 没有流量,用ping发现线路端口不通,检查发现该 端口处于down的状态,这就说明该端口已经关闭, 因此导致故障。这时只需重新启动该端口,就可以 恢复线路的连通了。还有一种常见情况是路由器的 负载过高,表现为路由器CPU温度太高、CPU利用 率太高,以及内存剩余太少等,如果因此影响网络 服务质量,最直接也是最好的办法就是一一更换路 由器,当然换个好点的。1.2.1线路故障线路故障最常见的情况就是线路不通,诊断这 种情况首先检查该线路上流量是否还存在,然后用

9、 ping检查线路远端的路由器端口能否响应,用 traceroute检查路由器配置是否正确,找出问题逐 个解决。方法在前面已经提过,这里就不多说了。1.2.2路由器故障事实上,线路故障中很多情况都涉及到路由 器,因此也可以把一些线路故障归结为路由器故障。 检测这种故障,需要利用MIB变量浏览器,用它收 集路由器的路由表、端口流量数据、计费数据、路 由器CPU的温度、负载以及路由器的内存余量等数 据,通常情况下网络管理系统有专门的管理进程不 断地检测路由器的关键数据,并及时给出报警。而 路由器CPU利用率过高和路由器内存余量太小都将 直接影响到网络服务的质量。解决这种故障,只有 对路由器进行升级

10、、扩大内存等,或者重新规划网 络拓扑结构。1.2.3主机故障主机故障常见的现象就是主机的配置不当。像 主机配置的IP地址与其它主机冲突,或IP地址根 本就不在子网范围内,由此导致主机无法连通。主 机的另一故障就是安全故障。比如,主机没有控制 其上的finger,RPC,rlogin等多余服务。而攻击 者可以通过这些多余进程的正常服务或bug攻击该 主机,甚至得到Administrator的权限等。还有值 得注意的一点就是,不要轻易的共享本机硬盘,因 为这将导致恶意攻击者非法利用该主机的资源。发 现主机故障一般比较困难,特别是别人恶意的攻击。 一般可以通过监视主机的流量、或扫描主机端口和 服务来

11、防止可能的漏洞。最后提醒大家不要忘了安 装防火墙,因为这是最省事也是最安全的办法。2专家知识库的建立因为建立的故障管理专家系统需要达到实时 故障识别及非实时故障分析的任务。为了实现故障 的判别,我们建立了网络故障识别知识库,判断网络 运行情况是否发生故障。为了实现故障分析,我们建 立了故障分析知识库,对用户待分析的故障进行故 障原因分析。故障识别产生的结果是进行故障分析 的条件,二者有着必然的联系。两个知识库都根据 该领域专家的经验进行创建,为应用程序判断分析 的准确性提供了必要的保障。2.1故障识别知识库目前,网络故障识别主要采用在应用程序中添 加判断语句实现。针对故障的类型多,而且每种故

12、障的判别方式多种多样,我们采用对MIB4 数据库 和网络轮询监测对象进行分析后做处理,得出具体 的故障类型。本算法最多只要有限次的二目运算就 可完成。以下是6种网络故障识别的规则。设MIBObj为网络代理(Agent)中的MIB数据 库中的对象,MIBObj1、MIBObj2为中间变量,Const 为常量,则:(1) MIBObj1 =MIBObj1 - MIBObj2 ; (2)MIBObj1 =MIBObj1 +MIBObj2 ; (3) MIBObj1 =MIBObj1 3 MIBObj2 ;(4) MIBObj1 = MI2BObj1/MIBObj2 ; (5)MIBObj Const

13、 。结构说明:序列号为该表的主键。故障名称 为网络中出现的故障。产生式序列号为引用故障识 别产生式的外键。故障事件计算顺序表明在应用多 个产生式计算时的产生式应用顺序。第一个参数标 志可以是输入参数、常数或应用中间结果。其后的 第一个参数字段根据该标志确定,其中输入参数通 过MIB中的OID值表示,应用中间结果通过其序号 表明是前面哪一步计算的中间值。第二个参数标志 可以是输入参数、常数或应用中间结果。其后的第 二个参数字段根据该标志确定,其中输入参数可以 是与第一个参数相同或不同的MIB对象,通过他们 的OID值表示,而应用中间结果通过其序号表明是 前面哪一步计算的中间值。2.2故障分析知识

14、库故障原因分析是网络管理中的重要组成部分, 故障分析知识库包含了网络领域专家的众多经验, 使故障管理系统真正提供分析问题解决问题的能 力。该故障分析库包括故障类型(规则前件库)故障 原因(规则后件库)组成。3推理机设计推理机设计得好坏的主要依据是推理的效率 高低和准确性的高低。为了提高网络故障管理的效 率,我们对故障识别和故障分析采用不同的推理机 制。3.1故障识别推理由于网络故障的发生具有随机性和不确定性, 一旦轮询到网管代理,获得其中MIB数据库中的某 轮询对象的数据,就必须能及时判断出该轮询对象 是否发生故障。本文设计多线程的推理机方式,即每 做一次故障识别启动一工作者线程,完成推理工作

15、, 提高了网络的单位时间被轮询监测点的密度并且保 证一定程度的数据实时性。根据构建产生式与MIB 关联表获得对某轮询对象的处理方法和处理步骤, 计算每一步时获得产生式表中对应的处理方法,在 最后一步判断条件是否满足,从而判断该轮询监测 点是否出现故障。3.2故障分析推理结合目前大多数网络采用的TCP/ IP5 协议的 特点,本文设计了(层次-节点-弧)模型,如图1 所示。在故障诊断过程中采用分层次定位故障方法 将有利于快速找到故障。将网络故障按照所发生的 网络层次划分为4层,所有属于某层次的网络故障 均在该网络层中。节点代表故障匹配规则的前件(网 络故障)和后件(故障原因)。弧为规则库中故障匹 配规则,箭头指向的是由网络故障所匹配的故障原 因。当使用某条弧时,该弧被标记为激活弧,其中与 条件是指必须考虑弧的所有前件条件是否都满足, 当且仅当条件都满足时,规则后件成立。或条件是指 只要该弧中的某个前件条件满足,规则后件成立。在 算法中对节点做规则匹配,以找出规则后件的节点 称为扩展节点。等待将要做规

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论