版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、附件5 SCADA系统信息安全常见故障处理方法1、 PLC通讯中断 . - 2 -2、站控机中毒导致工程运行不正常或不能启动 . - 3 -3、站控数据不更新. - 6 -4、第三方设备通讯故障. - 8 -5、 RCI自动停机 . - 10 -6、由于RCI需要轮询点数过多导致的故障 . - 12 -7、阀室数据上传故障. - 14 -8、甪直站调压橇压变PT5802传输数据错误的故障处理 . - 17 -9、压气站HIMA ERROR故障分析和处理报告 . - 19 -10、控制网组网不正常. - 43 -11、 ANYBUS COMMUNICATOR与ESD系统通讯中断. - 46 -1
2、2、 I/O模块通讯故障. - 48 -13、 AB PLC系统ETHERNET冗余网络通讯A网失败后B网不能工作. - 49 -14、北调无法看到ESD系统中的模拟量 . - 54 -15、通讯服务器冗余配置失败. - 55 -16、配置路由器时在配置界面上出现乱码 . - 60 -17、 DDN通讯中断 . - 61 -18、站场与北调的通讯频繁闪断. - 62 -19、路由器用户名、密码失败,无法登录及配置 . - 62 -20、第三方设备与上位机通讯无法建立或通讯不正常 . - 64 -21、机柜间到站控室的1#光纤不通. - 70 -22、 HIRSCHMANN交换机IP地址设置.
3、- 72 -23、交换机及路由器对应端口通讯方式配置 . - 78 -24、洛阳分输站与北京调控中心通讯中断 . - 84 -1、PLC通讯中断1、故障现象站控机中有“PLC通讯中断”报警,且相应的NOE模块会显示“Fault”红灯亮。2、故障原因3、解决方法(1首先确认PLC、交换机、RCI间各网线接口没有虚接或掉落的。 (3在笔记本上打开Concept软件,打开原先备份好的工程,可以通过网线或串口线连接PLC(如果两个NOE模块的地址实在找不到的话,按照(2中的方法重新设置好网络后,重新下载程序到PLC的控制器中。(4断开笔记本电脑与PLC的链接,对PLC的备机进行热备设置。将备机 CHS
4、热备模块的钥匙开关拨到“Xfer”挡,按下程序更新按钮,然后松开按钮,会看到备机架的CHS模块显示“Standby”橙色灯亮,当该灯常亮以后则表示热备完成,这时备机架CPU模块的“Run”绿灯将变亮,主机架CHS模块的“Primary”绿灯常亮。(5PLC与RCI的通讯恢复以后,站控机电脑屏幕上“PLC通讯中断”报警可以确认掉。2、站控机中毒导致工程运行不正常或不能启动1、故障现象站控机工程运行不正常或不能启动。2、故障原因站控机外接移动存储设备而中毒,病毒影响Viewstar软件的正常使用。3、解决办法采用瑞星杀毒软件、病毒专杀工具(如Worm.LovGate爱情后门专杀对站控机进行杀毒。
5、(22009年12月16日,红柳站站控机工程无法启动,每次启动后提示“LSASS.EXE出错,系统将在60秒内自动关闭!”,然后在指定的时间内自动重启。然后维护人员在安全模式下用瑞星对站控机进行病毒查杀,杀出了大量的“packer.main007”木马。查杀结束后重启站控机和工程,Viewstar运行恢复正常。(a使用prockiller进程杀手终止LSASS.EXE进程;(b删除病毒文件(有的文件可能没有:C:/Program Files/Common Files/INTEXPLORE.pifC:/Program Files/Internet Explorer/INTEXPLORE.comC
6、:/WINDOWS/EXERT.exeC:/WINDOWS/LSASS.exeC:/WINDOWS/Debug/DebugProgram.exeC:/WINDOWS/system32/C:/WINDOWS/system32/MSCONFIG.COMC:/WINDOWS/system32/(c使用Free Window Registry Repair注册表清理工具清理注册表中的垃圾信息。也可手动清除,下面是手动清除的需要删除的项目:HKEY_CLASSES_ROOT/WindowFilesHKEY_CURRENT_USER/Software/VB and VBA Program Settings
7、HKEY_CURRENT_USER/Software/Microsoft/Internet Explorer/Main下面的Check_Associations项KEY_LOCAL_MACHINE/SOFTWARE/Clients/StartMenuInternet/INTEXPLORE.pifHKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows/CurrentVersion/Run 下面的ToP项(d使用RegC瑞星注册表修复工具修复注册表;(e重启站控机后可再进行一次全盘杀毒。3、站控数据不更新1、故障现象一个简单的例子:比如某分输站的电动调压阀采用压
8、力PID控制出站压力时,门站用气量突然减小了(如气罐车停止加气,但门站没有事先通知我分输站值班人员,而PID控制具有一定的滞后性,使得出站天然气因憋压而迅速上升。但是这时由于站控数据不能及时更新,造成值班人员未能及时发现,使得出站压力在有限的时间内能超过安全泄放阀设定压力,使得安全泄放阀放空。这本来是一个完全可以避免的情况。 2、故障原因(1站控机与RCI间的日期时间不一致;(2RCI长时间不间断工作,硬件老化,工作性能下降;(3RCI内部配置不高;(4第三方设备(如流量计算机、UPS又不断地增加,数据采集量增大,工作负担加重;(5网络中有网线虚接或断开的地方。这些使得RCI不能及时采集各种第
9、三方设备的数据,即发生数据丢失现象,从而影响数据库中数据的准确性。3、解决办法RCI与很多第三方设备进行通讯,包括PLC、UPS、低压配电盘、流量计算机和燃气发电机等等,因为它与PLC的通信量最大,所以在此以它与PLC的通讯为例进行说明。解决数据不更新的步骤如下:(1在站控机上打开校时软件,对站控机进行校时,将其时钟与RCI同步。(2在站控机操作的系统配图界面,从中找到图标,点击弹出一个对话框。 在该对话框中将“轮询”勾选上,点击应用。通常情况下,站控数据都会进行一次刷新,原先不变的数据都会发生变化,橙色变成白色即恢复正常。如果变化不大,可再轮询几次。(3如果以上都不起作用,可以对两台RCI进
10、行切换,将原先为备用的切换到主用,并可重复(1、(2步,看看数据显示是否恢复正常。(4如果以上都不起作用,可以将站控机工程停掉,然后再重启工程,再观察数据显示是否恢复正常。(5如果以上都不起作用,可以先将站控机工程停掉,然后把两台RCI分别重启,之后再重启工程,再观察数据显示是否恢复正常。(6如果以上都不起作用,可以将站控机工程停掉以后对站控机进行重启,主要还是为了刷新站控电脑的网络连接,然后重启工程,再观察数据显示是否恢复正常。(7如果以上都不起作用,可以用站控机的备份工程替换现有工程,再观察数据显示是否恢复正常。(8通常经过以上工作都可以恢复站控机数据的更新,如果上工作都不起作用,则需查看
11、网络连接上有没有虚接的或断线的,交换机是否工作正常等。确认网络连接无问题后,可对RCI进行更换或硬件升级,提高其工作性能。4、第三方设备通讯故障1、故障现象在站控机上出现第三方设备通讯故障报警,如UPS通讯故障、流量计算机通讯故障、低压配电盘通讯故障、燃气发电机通讯故障等。2、故障原因(1第三方设备停机或断电。(2通讯回路断路或有源1转2接口插头接触不良。3、解决办法(1对于由设备停机或断电造成的通讯故障,无非是去查找设备本身停机的原因,以重新起机恢复通讯。(2而由通讯线路引起的通讯故障通常都集中在LSU 232_2防雷有源1转2接口上。LSU 232_2是用来将第三方设备的数据分别同时传到两
12、台冗余的RCI通讯服务器用的: LSU 232_2的“A on ”灯对应A line ,“B on ”对应B line ,这两个灯亮则表明第三方设备到对应的1#RCI 和2#RCI 是接通的,“TxD ”或“RxD ”灯闪烁则表示目前第三方设备正在与RCI 进行数据的发送或接收。通过观察这些指示灯的情况即可判断当前的第三方设备通讯情况。通常第三方设备通讯故障都是由于“C line ”处的串口插得不稳所至,因为该口串口的固定螺丝不容易固定住插头(硬件设计造成,开关机柜门时容易碰到该插头串口线,导致插头松动,从而引起通讯故障。这时只需要紧固一下该插头既可。(3如若发现LSU 232_2的指示灯都不
13、亮了,可以用万用表检测其电源输入端电压,看看供电是否正常。如果电压为0,则需检查电源线路情况,以恢复供电。如果电压正常(24VDC ,且无串口虚接情况,则需判断LSU 232_2是否故障。可用调试笔记本接到来至第三设备的串口,通过在电脑上运行串口调试工具,来检测是否能够接收到第三方设备的数据。(a 可以接收到第三方设备的数据,则将来至第三方设备的串口接至 C line 口,分别用笔记本电脑接A line 和B line 口,检测到是否可以接收到第三方设备的数据。如果接收不到,则表明LSU 232_2故障,需维修或更换。(b 不可以接收到第三方设备的数据,则需查看来至第三方设备的数据线路是否有断
14、路或设备本身存在故障。5、RCI自动停机1、故障现象:RCI自动停机,蓝色运行指示灯熄灭,绿色电源指示灯闪烁(正常运行下蓝灯、绿灯都常亮,断电并重新上电启动后设备能运行,但只维持一段时间后会再次停机,有的RCI甚至不能重新启动。2、故障原因:RCI长期不间断运行,致使其电源(型号HP-U280EF3内部芯片老化损坏,或电源风扇损坏,无法给RCI正常供电,致使设备自动停机。3、解决办法:更换RCI电源。但如能检查出电源的损坏部件,则可对该部件进行更换,以减少成本,如淮安站就曾经有一个电源是K419 TNY2684 28021B芯片损坏(过电流或过热导致损坏。电源更换步骤如下:(1对故障的RCI下
15、电,将后板插槽上的串口线、网线断开,取出RCI,打开设备上盖板。 (2找到RCI的电源,将与电源相连的各插头拔下,然后松开固定螺母,将故障电源取出。 (3换上新的电源,重新固定好,并将各插头插上,整理好内部电线后盖上盖板。将串口线、网口重新接上,重新上电,观察电源灯绿灯、运行灯蓝灯是否常亮,常亮为正常。在上位机中使用指令对RCI进行切换,将更换好的RCI切换为主(为了减少对设备的损害,最好是采用软切换,但也可用硬切换,即关掉原先无故障的那台RCI,观察当前已维修的RCI是否能自动切换为主,测试设备运行是否正常。如果在上位机中的各种操作均无问题,则说明当前RCI工作正常,故障已排除。6、由于RC
16、I需要轮询点数过多导致的故障1、故障现象郑州站改造过程中在升级HIMA程序后,发现站控系统ESD休眠命令下发后,站控机不断有新的休眠报警提示,确认复位后,仍不断弹出,逻辑上站控机休眠状态灯正常时应该是变红,不闪烁的,但现场情况为郑州站的休眠状态灯不断闪烁。2、故障原因开始以为是添加地址冲突造成,对所有新添加的数据点地址进行核查,未发现地址冲突问题。用调试笔记本与PLC联机发现上位机中的ESD休眠命令已经下发,确认故障只存在于站控机系统中。经过一段时间的检查后发现,由于郑州站的HIMA 模块有9个之多,添加的报警点有50多个,在加上原来系统需要扫描的地址,改造后郑州站每次站控机轮询需要检测的地址
17、有近200个,根据经验,一般轮询地址点超过100后,就会造成数据采集不准。这么多的地址如果同时扫描的话,很容易造成信号不稳和紊乱。故此,考虑将轮询地址分两批扫描。3、解决办法(1用Total Commander软件登陆RCI,在修改文件之前首先将配置文件拷贝到当地硬盘进行备份。 (2将RCI中的MBPOLL_XXX_YYY.POL文件拷贝到当地硬盘下,其中XXX 为RCI NUMBER,例如南京为175;YYY为通讯端口号,例如PLC为17。打开MBPOLL_XXX_YYY.POL: (3可以看到配置文件中第四行MbAnz为160,大于100,所以将其修改为两次轮训: (4保存后,将修改后的配
18、置文件DOWN回到RCI中: (5最后使用INIT 6命令重启RCI使配置生效,对另一台RCI进行同样操作即可。修改后,故障现象排除,系统恢复正常。7、阀室数据上传故障1、故障现象RTU阀室数据不能上传到北京调度,数据不能更新,调度也无法对阀室设备进行操作。2、故障原因(1机柜供电系统掉电;(2DI或AI模块数据没采集上;(3RTU控制器工作不正常;(4RCI与路由器间通信故障。3、解决办法(1检查机柜是否掉电,机柜掉电了的话,自然所有设备都无法工作,数据也无法上传。进入阀室大门,先看TEG发电机是否还在工作,如果已经不工作了,则很有可能RTU机柜和通信机柜内设备已经掉电。如果没掉电则表示蓄电
19、池仍有电,但是请尽快重启TEG发电机。(2打开RTU机柜门,查看各DI或AI模块(16点开关量输入模块AS-BDEP-256、4通道模拟量输入模块AS-BADU-256等的输入端指示灯是否红色常亮,亮则表示接通,正常情况下DI和AI模块的输入通道指示灯亮均会有亮的,因为都涉及到通道的使用。因为有发生过DI或AI模块的供电回路保险丝烧断的情况,致使输入模块无法采集现场数据,这种情况下更换保险即可。如果保险没有烧断,确认模块供电正常后,所有输入端的灯仍不亮。 也可通过模块识别来判断哪个模块连接不上。使用计算机登陆到RTU上,进入RTU的硬件配置,进入I/O Map,弹出以下窗口: 上图中,在Det
20、ected下是红色背景的,证明这几块模块不被系统识别,它们的数据将无法通过背板传送到RTU的CPU中,是灰色背景的表示这部分硬件配置和实际完全一致。(3如果DI和AI模块工作指示灯正常,则检查RTU处理器模块PC-E984-258。首先查看它有没有掉电,因为它也有自己的保险,如果没有掉电则通过观察控制器的各LED灯即可判断它工作是否正常。各LED灯的含义如下:CPU的LED灯含义LED名称颜色含义R EADY黄色已供电,CPU正在运行R UN黄色用户程序正在运行B AT LOW红色电池电量低或已没电M ODBUS 1 黄色传输活跃M ODBUS 2 黄色连接笔记本用如果其中的Ready灯或Ru
21、n灯不亮黄色,则说明控制器有问题,对控制器进行重启,并连接笔记本电脑,打开Concept软件,在线查看程序工作情况是否正常,各现场设备的数据是否能正常传输被采集到RTU。如果程序出问题,可采用备份程序重新下装到控制器中,再运行查看数据采集情况是否恢复。 假如这些工作都做了以后仍然连接不上控制器,无法恢复程序,或采集到的数据仍然传不出去,则表明是控制器硬件问题,前提是确认网线没问题,则需更换控制器,并将更换下来的控制器进行维修。(4如果现场数据能够被正常采集上来,则问题将出在通信上,这时需对RCI 和路由器进行检查。检查网线或其他数据接头是否有虚接的,将它们紧固,查看网口处指示灯的闪烁是否正常。
22、确认网络线路连接没有问题以后,如若数据的上传仍然没有恢复,可以对RCI和路由器进行重启,如果硬件没有问题的话,通常情况下数据通信链路都能恢复,因为软件配置都不会有什么改变。(5如果还是有问题的话,可能是RCI的串口损坏或者RCI其它硬件出现问题,可以更换RCI测试一下,具体方法是,将RCI断电后取下,将RCI内的一块内存卡SDCFB-64-101-80取下,插入新的RCI内部,在恢复连线上电,检查通讯是否正常,如果通讯仍然不正常,就需要将旧的RCI及卡和一套新的RCI及卡寄到中油龙慧自动化公司,由工程人员对旧的RCI进行检测,对新的RCI进行配置,得出结论及配置好新RCI后一并返回管理处。8、
23、甪直站调压橇压变PT5802传输数据错误的故障处理1、故障现象甪直站更换了一个调压撬压力变送器以后,该压力取样点传输上来的数据跟实际现场压力表数据严重不符。2、故障原因由于更换了压力变送器,将原先量程压力范围为0-6Mpa的压力变送器换为量程为0-10MPa的压力变送器,而原先的上位机中数据库和PLC程序都还是按照原来0-6MPa的量程进行运算和执行的,因此造成传输后数据换算结果发生错误。3、解决办法将上位机viewstar的数据库跟PLC程序中的对应的压力量程0-6Mpa改为0-10Mpa,数据就对应上了真实值。具体修改办法如下:(1在concept中打开PLC程序。找到相应的SCALWTO
24、R功能块,它用来将所采集到的模拟量电信号换算压力值: 其中,PI12020,4095,rPI12020.0,10.0,两者间的换算关系如下式:V ALOUT=(MININMAXINSCALBMINSCALBMAXMININVALUE_-+SCALBMINrPI1202=4095120210PI修改压力上限,即对SCALBMAX进行修改既可,将6改成10。然后将更改后的程序进行下装,在“Online”选项中选择“Download changes”。(2Viewstar数据库中的数据点的更改:数据点的更改在组态环境Graphical Editor点击Para 图标,进入数据库。数据库中,温变跟压变
25、是在MIA下面,找到要修改PT所对应的阀号。文件夹如下图所示: 在value下的数据里面更改具体的参数。其中address为6位的IEC地址, Alert_hdl为报警设置,archive为归档设置,common为描述,单位及数据点位数设置,msg_conv为量程转换设置,pv_range为量程范围设置。在此只需在pv_range 中更改量程,将原来的0-6MPa更改为0-10MPa即可。9、压气站HIMA ERROR故障分析和处理报告1、适用对象SCADA ESD系统2、故障现象从2009年11月22日,红柳站第一次发生4块HIMA F3DIO 20/8系列模块(F3A、F3B、F3C和F3
26、D同时Error故障报警,至2010年1月29日期间,四道班、轮南、红柳、玉门、靖边和中卫站6座场站发生HIMA ERROR共34次,涉及模块39块。其中红柳、靖边、中卫站为与西二线联络站,共发生27次,占总故障数的79.4%,轮南、玉门站各发生1次,四道班站发生5次。当发生ERROR时,相应的Remote I/O模块将停止运行,看门狗信号会被切断,所有的输出将置off,ERROR灯变红,ERROR code0。最终造成ESD系统无法正常运行,严重影响场站的安全平稳运行。下表为绝大部分的HIMA ERROR情况统计:HIMA ERROR情况统计序号站名日期HIMA模块ERROR信息1 轮南站1
27、2月19日F3B 因为HIMA的日期和时钟未调整,所以诊断日志上缺少记录。2 四道班站11月27日F3D IOTUNEXPECTED COMPARATORINTERRUPT3 四道班站11月29日F3D IOTUNEXPECTED COMPARATORINTERRUPT4 四道班站12月22日F3D IOTUNEXPECTED COMPARATORINTERRUPT5 四道班站12月26日F3D IOTUNEXPECTED COMPARATORINTERRUPT6 四道班站1月8日F3D IOTUNEXPECTED COMPARATORINTERRUPT7 红柳站11月22日F3A、F3B、F
28、3C、F3DIOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDCPU S TATE FAILURE STOP8 红柳站11月24日F3A、F3B、F3C、F3DCPU S TATE FAILURE STOP9 红柳站11月26日F3A、F3B、F3C、F3D、F3EIOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDCPU S TATE FAILURE STOP10 红柳站12月19日F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED11 红柳站12月26日F3E IOTTIMEOUT OF CPU W
29、ATCHDOG TIME OCCURRED12 红柳站1月6日F3A、IOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDF3B、F3D、F3ECPU S TATE FAILURE STOP13 红柳站1月20日F3E IOTTIMEOUT OF CPU WATCHDOGTIME OCCURRED14 玉门站12月17日F3E IOTUNEXPECTED COMPARATOR INTERRUPT15 靖边站12月4日F3E、F3G IOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDCPU S TATE FAILURE STOP16 靖边站1
30、2月5日F3E、F3G IOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDCPU S TATE FAILURE STOP17 靖边站1月3日F3A、F3B、F3C、F3D、E3E、F3F、F3G IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP18 中卫站12月26日F3A、F3B、F3C、F3D、F3EIOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDCPU S TATE FAILURE STOP19 中卫站12月30日F3E IOTTIMEOUT OF CP
31、U WATCHDOG TIME OCCURRED20 中卫站1月1日F3A、F3B、F3D、F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP21 中卫站1月2日F3B、F3D、F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP22 中卫站1月3日F3B、F3C、F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP23 中卫站1月10日3:11 F
32、3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED24 中卫站1月10日17:33 F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED25 中卫站1月11日12:54 F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED26 中卫站1月11日16:30 F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED27 中卫站1月12日16:53 F3B、F3C、F3EIOTTIMEOUT OF CPU WATCHDOGTIME OCCURREDCPU S T
33、ATE FAILURE STOP28 中卫站1月12日23:20 F3B、F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP29 中卫站1月13日1:29 F3B、F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP30 中卫站1月25日F3B、F3C、F3E IOTTIMEOUT OF CPU WATCHDOG TIME OCCURREDCPU S TATE FAILURE STOP31 中卫站1月29日F3E IOTUNEXP
34、ECTED COMPARATORINTERRUPT注:红色标记为F3 DIO 20/8 02型IO模块,未标记的为F3 DIO 20/8 01型模块。3、总体故障分析以下3种原因之一均会导致HIMA模块ERROR:CPU检测到自身有一个硬件故障;CPU检测到操作系统有一个软件错误;Watchdog触发ERROR STOP,因为CPU的运行周期Cycle time超过了Watchdog time。HIMA模块发生ERROR后,其CPU将停止应用程序的执行,所有硬件和软件的测试都会结束,所有的输出将被重置,只能在PADT(Programming and debugging Tool中通过“Rebo
35、ot Resource”命令将CPU重启。然而,具体情况还需要结合各站HIMA Remote I/O Diagnostics log(诊断日志进行分析。模块的ERROR信息大体为以下三条:IOTUNEXPECTED COMPARATOR INTERRUPT,其中IOT表示CPUself tests,即CPU在自检时发现未知的比较器中断;IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED,即CPUWatchdog time(看门狗时间超时;CPU StateFAILURE STOP,即CPU为故障停运状态。下边分别对这三个ERROR信息进行说明。(1UNEXPECT
36、ED COMPARATOR INTERRUPT第一种情况中关于Comparator,由于HIMA模块有与安全相关的central module(中央模块,它基于SIL(Safety Integrity Level,according to IEC 61508标准,由2个处理器系统组成,因此能够在运行时自检和比较运算结果。即所谓的比较器中断指的就是HIMA中央模块里的两个处理器在进行运算结果的比较时被中断了,具体原因是unexpected(未知的。Central module结构图: (2TIMEOUT OF CPU WATCHDOG TIME OCCURRED第二种情况中HIMA 模块的wat
37、chdog time (WT 超时,即CPU 的运行周期cycle timeWT 。WT 是CPU 运行周期的最大允许值,一旦运行周期大于这个值,CPU 将会ERROR STOP 。下边为WT 取值的2个约束条件: (1 10ms WT (safety time/2(2 max CTS +execution time of the application WT 5000ms其中safety time (ST 是控制器的安全时间,但不是整个程序的安全时间。CTS (communication time slice ,通信时间段是cycle time 的一部分,该值大一些不会有负作用,只是当网络负
38、担重时,CTS 会增大,从而会使cycle time 增大。相反,CTS 小一些的话,可以减小cycle time 受到网络的影响,在一定程度上限制cycle time 的大小。但如果CTS 太小的话,将存在并非所有通信任务都能在一个CPU cycle 内执行完毕的风险,因而降低了数据传输的质量,一旦时间参数间发生冲突的话会引起通信路径的关闭。max CTS 即CTS 的最大值,2,5000ms ,为完成通信任务需要时间段的最大设定值。尽管max CTS 不可以直接被计算出来,但是CTS 的最小值min CTS 却可以计算出来,可以根据min CTS 来估取max CTS 。min CTS 的
39、计算方法如下: (3FAILURE STOP观察红柳站和中卫站ERROR 信息会发现“FAILURE STOP ”单独发生的情况极少,通常发生在“IOTTIMEOUT OF CPU WATCHDOG TIME OCCURRED ”之后,也就是说WT 溢出有可能接着引发CPU 故障停运。由于硬件故障或软件错误都能引起ERROR STOP ,仅仅靠“CPU StateFAILURE STOP ”信息是不能明确故障原因的。如果通过“Reboot Resource ”命令能够重启CPU ,则说明故障是暂时性的,即目前故障已经消除;如果不能则说明HIMA 模块可能已经损坏。通过以上对ERROR 信息的介
40、绍,对故障情况有了大致了解,下边将做进一步深入分析。4、具体原因分析(1网络中存在的计算机病毒(2网络环路形成的网络风暴HIMA公司认为场站之前的站控网络里HIMA F30模块的两个网口分别接到两台交换机,这两台交换机之间又用一根网线连接的方式,形成了一个物理上的环路,有可能造成网络风暴,进而影响HIMA模块的正常工作。结合表2.1进一步观察会发现,ERROR机率较高的HIMA Remote I/O模块为F3 DIO 20/8 02型,而F3 DIO 20/8 01型ERROR的情况相对要少,F30控制器模块则没有ERROR过。下表为各站HIMA Remote IO型号:各站HIMA Remo
41、te IO原先的型号统计站名HIM ATRIX F3DIO20/8F3A F3B F3C F3D F3E F3F F3G F3H轮南站01 02 01 01 02 02 02 02 四道班站01 01 01 02 01 / / / 红柳站01 01 01 01 02 / / / 玉门站01 01 01 02 02 / / / 中卫站01 01 01 01 02 / / / 靖边站01 01 01 02 02 02 02 /结合HIMA公司的意见,原因分析如下:首先需要对HIMA Remote I/O模块硬件结构进行了解,F3 DIO 20/8 01型和F3 DIO 20/8 02型的硬件结构:
42、 由以上两图可知,01和02型模块硬件上的区别在于前者较后者多了COM和DUAL PORT RAM(双口RAM。01型模块内部有COM和CPU两个控制单元,与F30模块类似,COM单元专门负责通讯数据处理,CPU单元则专门负责通讯以外的数据处理和运算,两个控制单元通过DUAL PORT RAM同时异步地访问存储单元。而02型只有CUP一个控制单元,因此CPU即负责通讯数据处理又负责数据运算,自然要比01型CPU的负担重。网络风暴形成的大量广播包导致了某个情况下HIMA Remote I/O模块全部或部分故障停机。F30和F3 DIO 20/8 01模块因为有COM单元专门处理通讯数据,虽然大量
43、的广播包在模块以太网端口大量复制传播导致COM 单元工作负荷加大,但是不会影响CPU 单元,不会导致其系统cycle time 加长直到watchdog timeout 的情况发生。而F3 DIO 20/8 02因其内部CPU 即负责运算又管理通讯,无用的广播包使CPU 通讯处理工作负荷加大,进而使系统cycle time 加长,当cycle timeWT 时会导致TIMEOUT OF CPU WATCHDOG 。因此,02型模块比01型模块ERROR 机率大很多。(3HIMA 模块时间参数的设定过小已经提到WT 、ST 和max CTS 三个时间参数对HIMA 模块的影响,它们的值过小虽然可
44、以提高系统的灵敏性,但同时也会增加报ERROR 的几率。而且从WT 超时报警信息来看,WT 值的适当增大确实可以改善模块停机的敏感情况。下表为原先各站HIMA 模块的时间参数配置:各站HIMA 模块ST 、WT 和maxCTS 原先的实际配置站名参数HIMA 模块F30F3A F3B F3C F3D F3E F3F F3G F3H 轮南站ST 100 100 100 100 100 100 20 20 20 WT50 50 50 50 50 50 10 10 10 maxCTS 10 10 10 10 10 10 10 10 10 四道班站ST 100 24 24 24 24 24 WT50
45、12 12 12 12 12 maxCTS 10 10 10 10 10 10 红柳站ST 100 20 20 20 20 20 WT50 10 10 10 10 10 maxCTS10101010105玉门站ST1020 20 20 200 20 WT 50 10 10 10 100 10 maxCTS10 10 10 10 5 5 中卫站ST5020 20 20 20 20 WT2010 10 10 10 10 maxCTS10 10 10 10 10 5 靖边站ST1020 20 20 20 20 20 20 WT 50 20 20 20 20 20 20 20 maxCTS10 10
46、10 10 5 5 5 5 5、故障处理经过以上分析,为了解决HIMA ERROR故障,除了对SCADA系统站控机进行杀毒以外,我们也采纳了HIMA公司的意见,从站控网络下手,用Wireshark (Ethereal软件对几个压气站的站控系统网络都分别进行了抓包,深入分析网络数据组成结构和各种数据包流量,并于今年1月底进行了统一处理,效果显著,目前为止再没有出现ERROR。主要处理方法及步骤如下:1向调度进行汇报,对相关程序如路由器、交换机、PLC程序、ESD程序进行备份,将ESD休眠并将DO输出拔下。2配合北京调控中心对站场路由器、交换机配置进行修改。路由器配置的修改:(a将路由器与两台交换
47、机相连接的端口配置由原来的半双工“half-duplex”改为全双工“full-duplex”。(b对路由器连接两台交换机的端口进行配置,比如端口为interfaceFastEthernet0/0和interface FastEthernet0/1,则相应地增加“passive-interface FastEthernet0/0”和“passive-interface FastEthernet0/1”语句,目的是禁止路由器的这两个端口向局域网中发送信息,避免环网。交换机配置的修改:(a在交换机与两台路由器相连接的端口增加“duplex full”和“speed 100”(速率100Mbps语句
48、;(b对两台交换机互连的24口进行配置,增加“switchport mode trunk”和“spanning-tree vlan 1 cost 10”语句,目的是阻塞网络中的环路,使网络快速达到收敛。3对RCI文件进行修改,并将上位机和RCI原来的网桥改为网卡绑定。这样更改后RCI在重新启动时就不会重新产生网络拓扑结构,使两台冗余RCI服务器之间达到无扰切换,避免了RCI切换期间通讯设备会短暂中断的现象。修改步骤:(a将UPDATE_DELL_650_750.tar这个文件放到var目录下;(b执行gunzip命令将UPDATE_DELL_650_750.tar文件进行解压;(c用tar x
49、vf命令执行UPDATE_DELL_650_750.tar文件;(d用cd UPDATE_DELL_650_750命令进入该目录下;(e执行/copy命令将执行文件考入UPDATE_DELL_650_750目录下;(f打开route.csh文件,将其中的“br”改为“bond”;(g执行init 6重新启动RCI后,修改完成。4将PLC程序中关于采集匀速管流量计的程序删除。因为现场匀速管流量计已经停用,匀速管流量计与PLC为Modbus TCP/IP协议,PLC会在网络上会一直轮询匀速管流量计IP,删除匀速管流量计程序后,会减少PLC在网络上广播包的发送量。6将站控机上所有的共享目录取消,并安
50、装瑞星杀毒软件,进行全盘杀毒。7备份更改后的路由器、交换机、PLC程序、ESD程序。8关键作业步骤前后用Wireshark软件的抓包分析。9恢复设备正常状态。除了以上主要处理方法外,个别压气站还做了其它处理,下边分别做些具体介绍。其中,靖边站已在去年12月初完成了相关工作,在此不在复述。(1四道班站故障处理1月5日对四道班站控系统网络进行9.5min的抓包,包出现的频率为1835.5packets/min,其中有86.68%为ARP(Address Resolution Protocol,地址解析协议Broadcast(广播包: interface BVI1另外,1月19日再次检查网络时,发现
51、该站1#压缩机控制屏、2#压缩机控制屏、压缩机站控机这三台计算机都将本地卡和远程卡的IP配反了,虽然不会影响压缩机内部的通讯,但是会使流经SCADA系统站控网络的数据量增大,即会增加一定量的网络负担,因此对其进行了改正。经过统一处理后,又进行了8.6min的抓包,包出现的频率又减小到166.2packets/min,ARP广播包的数量已经减少到2.52%,可见网络负担大大减轻。 IO Graphs上看,四道班站作业后,网络数据流峰值明显降低,由55降到了8。从这个程度而言四道班站已经不存在网络负担了。 (2红柳站故障处理1月8日对红柳站站控系统网络进行了8.5min的抓包,包出现的频率为122
52、9.6packets/min。此次抓包我们需要注意的协议包为NBNS协议包(占43.60%和TCP协议包(占21.67%。TCP协议包中包含NBSS协议包,NBSS协议包中又包含SMB协议包: 再结合两处典型浪涌数据流,可见浪涌的真实组成,其中DCERPC 、IOXIDRes 均属于TCP 协议。 在进行下一步处理之前,我们需要简单了解一下NBNS、NBSS和SMB三种协议,从而才能做出正确的处理。1NBNS:NetBIOS Name Service,NetBIOS名称服务。NetBIOS是Network Basic Input/Output System的简称,一般指用于局域网通信的一套AP
53、I(Application Programming Interface,应用程序编程接口。NetBIOS是一个网络协议,在上世纪80年代早期由IBM和Sytec联合开发,用于所谓的PC-Network。虽然公开发表的文档很少,协议的API却成为了事实上的标准。随着PC-Network被令牌环和以太网取代,NetBIOS也应该退出历史舞台。但是,由于很多软件使用了NetBIOS的API,所以NetBIOS被适配到了各种其他的协议上,比如IPX/SPX和TCP/IP。使用令牌环和以太网传输的NetBIOS现在被称为NetBEUI。在Microsoft Windows 98发布之前,一直广泛使用。在TCP/IP上运行的NetBIOS称为NBT,由RFC 1001和RFC 1002定义。NBT的基本思想是在基于IP的络上模拟基于NetBIOS 的PC-Network。NBT在Windows 2000中引入,是现在首选的NetBIOS传输。不管使用哪一种传输方式,NetBIOS提供三种不同的服务:名字服
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二四年度汽车制造车间装修合同
- 汽车赠予合同范本
- 玻璃报价合同范本
- 二零二四年度商标许可使用合同标的及许可条件具体描述
- 2024年度房屋买卖合同:详细描述房屋基本信息、买卖价格及付款方式
- 2024年度广告发布合同的媒体选择与费用分配
- 2024年度个性化盘扣购销合同
- 二零二四年度联合研发合同研发项目与分工合作
- 2024专利申请权的转让合同
- 防水单位合同范本
- 十年(2015-2024)高考真题数学分项汇编(全国)专题02 复数(学生卷)
- 适老化改造项目施工方案
- 2021版:ST段抬高型心肌梗死基层合理用药指南
- 部编版五年级道德与法治上册第7课《中华民族一家亲》精美课件
- 吸烟管理标准规定
- 烘焙店入职合同范文
- (高清版)JTGT 3610-2019 公路路基施工技术规范
- GB 44017-2024燃气用具连接用金属包覆软管
- JT-T-398-2013港口输油臂行业标准
- 暖通工程 投标方案(技术标)
- 2024春期国开电大专科《社会调查研究与方法》在线形考(形成性考核一至四)试题及答案
评论
0/150
提交评论