主从通信系统可靠性-第060组(韦建)课程设计报告(初稿).doc_第1页
主从通信系统可靠性-第060组(韦建)课程设计报告(初稿).doc_第2页
主从通信系统可靠性-第060组(韦建)课程设计报告(初稿).doc_第3页
主从通信系统可靠性-第060组(韦建)课程设计报告(初稿).doc_第4页
主从通信系统可靠性-第060组(韦建)课程设计报告(初稿).doc_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多机通信系统的可靠性评估的建模和仿真组号 060 姓名:韦建 学号 : 5090309218 ,姓名 :戴泽宇 学号:5090309221摘要:本实验通过仿真一个一主三从的多级通信系统,在3种提高系统可靠性的措施的不同组合下,估算100个系统运行10年情况下因元件故障等原因造成的人工修理次数,系统故障平均发生次数,系统重大故障平均发生次数,平均无故障时间,平均无故障连续时间,平均无重大故障连续时间一系列运算指标。关键词:主从多级,仿真,可靠性Modeling and simulation about a multicomputer communication systemABSTRACT: The experimental simulation a Lord SanCong multi-level communication system, in three kinds of improving the reliability of the system, under the different combination measures estimated 100 system run 10 years cases of a component failure causes artificially repair times, the average number of system failure happens, the average number of major fault occurred system, MTBF, average trouble-free continuous time, average no major fault continuous time series of operation index.Key words:Master-slave multi-stage, simulation, reliability1 引言1.1问题的引入1系统中有1台通信主机和3台通信从机。所有通信主/从机使用共享信道建立物理连接。每台通信机内部有两块电路板:控制电路板和接口电路板。控制电路板上有微处理器,运行相应的软件程序。接口电路板负责与通信总线联系,它的某类故障,会引发总线阻塞。光电隔离器完成电-光-电信号转换,通过电气隔离增加安全性。其内部采用了提高可靠性为目的的元件冗余设计。光电隔离器无法阻止接口电路故障引发的总线阻塞。集线器是一个通信线缆的汇接装置。1.2 部件划分和元件的组合方式2l 控制电路板可看作两个部件组成:“控制硬部件”对应硬件电路部分,“控制软部件”对应软件程序部分。l 控制硬部件可看作由35个统计特性独立元件构成,并适用串联组合。l 控制软部件可看作单元件构成。l 未使用措施2前,接口电路板可看作由10个统计特性独立元件构成的“接口部件”,并适用串联组合;使用措施2后,接口电路板可看作由15个统计特性独立元件构成的“接口部件”,并适用串联组合。l 光电隔离器可看作由5个统计特性独立元件构成的“光隔部件”,其中任意3个元件无故障即能使该部件正常发挥效能,适用k-out-of-n组合,k=3,n=5。l 集线器可看作由7个统计特性独立元件构成的“集线器部件”,并适用串联组合。1.3 故障后果3l 控制硬部件、集线器部件、接口部件组成元件的故障需要依靠人工修复。l 未采取措施1时,控制软部件组成元件的故障需要依靠人工修复;采取措施1以后,控制软部件组成元件的故障中有97%可以通过自动重启恢复(故障状态的持续时间可认为1小时),还有3%的故障需要依靠人工修复。l 未采取措施2时,接口部件组成元件的故障中有7%会引发总线阻塞;采取措施2以后,可完全避免引发总线阻塞,但并不能降低元件故障发生率。l 未采取措施3时,通信主机子系统一旦有故障即刻完全失效。l 采取措施3以后,在互为备份的双机同时失效时,子系统失效,即双机适用并联组合。但这不是严格意义上的并联组合,如果未同时采取措施2,双机热备配置中的单机接口电路硬件故障的引发总线阻塞,仍会造成系统失效。l 光隔部件组成元件的故障可以自动恢复(故障状态的持续时间可认为1小时)。1.4 理论模型41.5 仿真实验要求5根据前文提出的理论假设、基本参数和理论模型,确立仿真算法,利用蒙特卡洛法模拟100套同型系统连续运行10年的各种状况。分别在1) 不采取措施1、2、3;2) 单独采取措施1;3) 单独采取措施2;4) 单独采取措施3;5) 同时采取措施1、2、3这5种情形下,求解以下系统指标:l (10年中)人工修理平均次数l (10年中)系统故障平均发生次数l (10年中)重大系统故障平均发生次数l (10年中)平均无故障运行时间 l 平均连续无故障运行时间l 平均连续无重大故障运行时间2 研究思路和研究过程(1)无措施对于这样一个一主三从的通信模型,因为每个部件里的元件数量都已经知道,为了能够求解系统指标,我们小组的思考方法是分别对每个元件用数字进行标注,从而建立3个矩阵,分别对应系统所有元件的前1小时,当前以及后一小时是否故障的情况。pre = zeros(1,201);next = zeros(1,201);ppre=zeros(1,191);以无措施为例,因为各个部件里的元件发生故障的概率不同,加上人工修复成功与否,我们设立了4个概率常数。p1 = 1 - exp(-1/300000);p2 = 1 - exp(-1/8);p3 = 1 - exp(-1/20000);p4 = 1 - exp(-1/7000);以此常数,我们可以通过每一小时的检测,判断元件的工作情况,分别分为控制硬部件,集线器,接口部件;控制软部件;光电隔离器三个部分。同时对于已坏的元件是否已经人工修复进行检测,得到此元件的前中后三个情况。其中因为光电隔离器发生故障后会自行恢复,所以如果此刻故障,则下一小时必会恢复正常。下面是程序中的第一部分为例。 %控制硬部件,接口部件, 集线器部件 for i=1:187 if(pre(i) = 0) if(rand(1) p1) next(i) = 0; else next(i) = 1; end; else if(rand(1) p2) next(i) = 1; else next(i) = 0; end; end; ppre(i) = pre(i); pre(i) = next(i);end; 接着,我们开始对主机,从机1、2、3,和集线器从整体上判断故障情况。其中因为从机与光电隔离器相连,对于3-out-5模式我们要和其他串联模式区分开。以下以主机为例 %通信主机子系统故障状态判断if(sum(pre(1:45)+pre(188) = 1) system1err=1;else system1err=0;end;对于从机接口部件会造成7%的总线阻塞情况,我们做了如下处理for i=1:4 for j = 45*i - 9 :45 *i if(pre(j)=1 & ppre(j)= 0 & rand(1) 0.93 & interface_jam(i) = 0) interface_jam(i) = 1; else interface_jam(i) = 0; end; end;end; if(sum(interface_jam(1:4) = 1 ) ) jam =1;else jam =0;end;对于系统重大故障判断以及次数统计,我们的解决方法是如果主、集线器均无故障,不超过一个从机发生故障以及没有发生总线阻塞则系统未发生重大故障,如果相反则发生,且重大故障次数+1。同时为了求取无重大故障运行时间,我们首先建立了一个零矩阵,如果这一小时系统无重大故障,则矩阵的当前一位数+1,如果系统经检测发生重大故障,则矩阵当前位先后前进一位。最终将此矩阵的每一位上的数字加和即可获得无重大故障的时间。对于系统故障判断和次数统计,采用相同的方法。此处是如果不包括光隔在内的其他元件只要有一个故障或每个光隔内的元件有3个及3个以上发生故障即为系统故障,且次数+1。以下为系统故障部分。%系统故障次数统计 err_cnt = sum(pre(1:191); if(sum(pre(192:196) = 3) err_cnt = err_cnt + 1; end; if(sum(pre(197:201) = 3) err_cnt = err_cnt + 1; end; if(err_cnt) = 1 y=1;else y=0;end;系统无故障运行时间以及故障次数可以采用马尔可夫模型,用同样的方法得到。关于人工维修次数,除去光隔内可自行修复的元件,其他元件只要前一小时故障,下一小时正常即人工修复次数+1。(2)措施1措施1采用watchdog,未采取措施1时,控制软部件组成元件的故障需要依靠人工修复;采取措施1以后,控制软部件组成元件的故障中有97%可以通过自动重启恢复(故障状态的持续时间可认为1小时),还有3%的故障需要依靠人工修复。此处需要改动的地方即控制软部件部分,如下%控制软部件for i=258:262 if(pre(i) = 0) if(rand(1) p3) next(i) = 0; else next(i) = 1; end; else if (rand(1) 0.97) if(rand(1) p2) next(i) = 1; else next(i) = 0; x=x+1; end; else next(i) =0; end; end; ppre(i) = pre(i); pre(i) = next(i);end;同时在计算人工维修次数时要将软部件与其余部件分开,因为它的故障有很大程度是可以自行解决的。(3)措施2未采取措施2时,接口部件组成元件的故障中有7%会引发总线阻塞;采取措施2以后,可完全避免引发总线阻塞,但并不能降低元件故障发生率。即将有关总线阻塞的部分设定屏蔽掉。(4) 措施3措施3采取主机双击热备,即增加一个主机部件。未采取措施3时,通信主机子系统一旦有故障即刻完全失效。采取措施3以后,在互为备份的双机同时失效时,子系统失效,即双机适用并联组合。3 实验过程中遇到的问题(1) 在求解平均连续无故障运行时间的时候,我们小组起初将平均连续无故障运行时间放入一个样本里算出,然后求和再除以100得到,实际上与题目给出的定义不符。后来我们将所有的系统指标都从小循环中脱出,先将100个样本得到的连续无故障时间加和算出,再除以100个样本所有无连续的完整时间片段数目。(2) 在求解平均连续重大故障运行时间的时候,我们小组原本错误地将分母单纯地设置成重大故障次数,后来发现一次故障将时间分成两断,对于一个样本,分母应为重大故障次数+1,对于100个样本,即+100。4 实验结果与分析采取的措施无措施1措施2措施3措施1、2、3平均修理次数72.5555.277.8392.1375.96平均故障次数71.9172.3177.2291.2497.15平均重大故障次数20.0520.0821.63.332.23平均无故障运行时间8698387107869398681586929平均连续无故障运行时间11921187.21110.5973.1708884.6882平均连续无重大故障运行时间4153.44148.938682022727115运算耗时(s)2597.82657.82889.93896.53447从实验结果可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论