




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章监控中心的软硬件维护第一节硬件与传输设备的维护一、检查服务器供电电源市电停电时是否能保证服务器不掉电。若供电电源不能保证服务器的正常运行,请及时维护。服务器的供电必须使用不间断电源,通常使用整流器48V逆变或UPS电源。采取这种供电方式时,电池组是并在电源上的,市电停后,一般不会出现电池无法供电的情况。但为预防突发情况,必须进行此项测试。测试时将服务器上运行的所有应用程序退出,包括操作系统和数据库管理软件,并推出到服务器可关机的模式下,此时人为切断市电进行测试。如果电池未能切换成功导致掉电,也不会损坏服务器的软件和硬件。二、检查传输设备工作状态可通过观察设备指示灯来判断设备的运行状况。传输资源是否有不通或不稳定的现象。若全部不通,请检查公共部件及设备,如集线器,路由器远程存取服务器等;若个别局不通,请按顺序检查网线是否插好,连线是否有松动现象,检查接入设备是否正常,若都是好的,请有关部门人员协助检查线路。详细操作,请参考有关设备手册。传输资源是否稳定可以根据日常维护的积累。例如,哪些局经常通信中断,每月中断5次以上的可以视其传输不稳定。第二节数据库、服务器及应用软件系统维护一、服务器和数据库系统服务器是否有剩余空间的信息提示。若有请及时利用数据管理软件进行数据备份并利用数据库调测工具删除数据。详细操作可参考相关数据库管理软件操作说明。检查数据库剩余空间,以此判断写入量是否正常、是否有突发的大量写入。可以使用数据库调测工具来进行历史数据分析和数据库运行状态检查。详见数据库调测工具使用方法。二、应用软件系统1、各工作站是否通讯正常。检查系统有无出现较高频率的工作站通讯中断告警。如有可从两个方面检查。一个是端局工作站是否正常,另一方面,检查传输是否稳定。2、远程启动前置机测试。在业务台上进行远程启动前置机操作,保证紧急情况下前置机能够被正常的启动,以便迅速排除前置机死机等故障。三、病毒检查计算机病毒的检查。定期检查计算机病毒可以有效的防止系统发生突然故障,而导致的措手不急。可以安装诸如瑞星杀毒软件、KILL98等防止、清除病毒的软件。第三节艾默生PSMS常见故障处理(一)业务台和数管台1、监控模块中实时数据刷新速度很慢【问题描述】从业务台进入监控模块查看某端局的实时数据,进入后信号处于未知状态,要等待几分钟后,信号值才被刷新,信号变为有效状态,有时长达5分钟。【原因分析】(1)为了降低端局数量,在配置时将二十多个基站合成一个端局,于是造成每个端局的信号量很大,而业务台发控制命令让前置机上送实时数据的单位是端局,于是每次前置机需要上送上千条的实时数据;(2)前置机与监控中心的传输是通过拨号方式进行通讯的,带宽很窄(19.2K),数据传输很慢;这样,要传输的数据量很大,传输速率又很低,于是导致数据刷新很慢。【解决方法】(1)将端局减小,可以几个基站合成一个端局,从而减少每次前置机上报的实时数据量;(2)改善传输通道,增加带宽;(3)减少每个基站配置中的不重要信号,从而减少整个系统的信号量。2、SC与SS告警内容不一致【问题描述】系统运行一段时间后,在SC有许多未结束告警和已结束告警无法确认掉;在对应SS查看这些告警时,发现这些都已经被移到历史告警表中,从而导致SC的这部分告警永远存在。【原因分析】对于SC和SS告警数据的一致性系统一直无法保证,特别是告警数据,每一条告警可能被分成三步上送到SC,第一步是告警产生;第二步是告警结束;第三步是告警确认;(其中,二、三步可能调换)如果在这三步中的第一步就丢失了复制数据,则在SC丢失该告警,如果在第二、三步丢复制数据,则是告警无法结束或结束告警无法确认。随着三级结构的增多和系统运行时间的增长,SC和SS告警数据的一致性问题将越来越突出。【解决方法】方法1可以通过如下步骤去同步SC与SS的告警:步骤1在确认SC与各个SS连接都正常的情况下,删除SC当前告警表中2个小时前的告警,假设当前时间是2000-02-2211:50:00,使用SQL语句(deletefromRunAlarmMsgewhereStartTime<"2000-02-2210:00:00");步骤2通过SC业务台连接到某个SS,执行SQL语句(select*intotempAlarmfromRunAlarmMsgewhereStartTime<"2000-02-2210:00:00");注意,where条件中的时间"2000-02-2210:00:00"要与步骤1条件中的时间"2000-02-2210:00:00"一致;步骤3将步骤2生成的表tempAlarm中的数据倒到文本文件中,在命令行使用命令(bcpdatabase_name..tempAlarmoutalarm.txt-Sserver_name-Uuser_name-Ppassword-c),其中斜体部分需要根据具体SS的数据库名和用户情况替换;步骤4将步骤2生成的临时告警表tempAlarm删除,使用SQL语句(droptabletempAlarm)步骤5将步骤3生成的文本文件alarm.txt中的告警数据倒入SC当前告警表中,在命令行使用命令(bcpdatabase_name..RunAlarmMsgeinalarm.txt-Sserver_name-Uuser_name-Ppassword-c),注意:该处的server_name和database_name是SC数据库的;步骤6对每个SS重复步骤2~步骤5;步骤7将SC业务台告警模块卸载,然后重新加载;方法2如果SC告警SS告警频繁出现不一致现象,并且局方对此问题很重视或会影响验收,甚至市场时可以考虑将PSMS435升级到PSMS436,在PSMS436的业务台中已做了SC与SS的告警同步处理。3、前置机通讯中断告警【问题描述】前置机通讯中断告警【原因分析】首先,需要判断前置机通讯中断是否是因为网络通讯中断引起的,至于判断方法可以在前置机通讯中断时在业务台Ping前置机,如果是网络问题则找网管了解网络情况;其次,在确定不是网络本身中断后,在业务台报表模块查询系统告警,观察前置机通讯中断时间及时间间隔,可能有两种情况,一是很多前置机在晚上0点左右总出现通讯中断告警;另一种可能是前置机通讯时好时坏,每次通讯中断时间很短,一般不超过一分钟就恢复通讯;对于第一种情况,是由于前置机在晚上0点左右需要上报前一天的统计数据,由于前置机较多或部分前置机上报信号量较大,导致数据库表锁,上报统计数据效率降低;对于第二种情况,如果前置机真正中断或重启,至少需要3~5分钟,因此可以断定前置机运行是正常的,而通讯中断应该是由于业务台判断前置机报到超时引起的,即前置机的超时时间设的太短。【解决方法】(1)对于网络本身中断引起的前置机通讯中断告警,解决网络存在问题;(2)对于在晚上0点左右的通讯中断,可以通过将存储过程spro_staticsdata_report升级成PSMS435补丁版或以后的版本;(3)对于前置机通讯时好时坏,在业务台的工作站管理中将通讯中断频繁发生的前置机的超时时间改为180秒;但需要注意的是,如果不修改配置中的工作站超时时间,在下次刷新配置时又会出现同样的问题,因此,建议在每次修改配置时都从数据库中下载,然后再修改刷新数据库,已保证数据库中的配置是最新的。4、业务台出现“数据库空间不足,剩余XXk字节”的告警【问题描述】在业务台出现“数据库空间不足,剩余XXk字节”的告警,但通过sp_helpdb查看该数据库,发现该数据库还有XXM剩余数据空间。【原因分析】数据管理台在检测到数据库的剩余数据空间小于(数据库总数据空间*安全因子/100)时就会产生该告警。但告警信息中的“剩余XXk字节”的单位k是错误的,应该是M(兆)才对,该错误在PSMS436中已修改;另外,数据管理台的INI文件DbBackup.ini中的安全因子SafeFactor缺省值为25,该值设置较大,例如某数据库数据空间为2G,那么当数据剩余空间小于500M时就会产生数据库空间不足告警,因此,建议在发现有该告警的数据管理台上将安全因子减小,只要不低于10就可以了。【解决方法】(1)退出数据管理台;(2)打开数据管理台的INI文件DbBackup.ini,将安全因子SafeFactor减小到10;(3)重新运行数据管理台。(二)服务器和数据库1、服务器在异常掉电后操作系统无法启动【问题描述】服务器在异常掉电后,操作系统不能启动。【原因分析】服务器在异常断电后使硬盘被损坏,NT启动时ScanDisk不能通过。【解决方法】(1)在确认操作系统无法恢复后(如果有紧急恢复盘,可用紧急恢复盘恢复系统),重新安装NT操作系统;(2)备份原数据库的MASTER设备、系统存储过程设备;(3)重新安装SYBASE,但不创建数据设备和日志设备,也不创建应用数据库;(4)在控制面板的服务里停掉Sybase,将原来备份的数据库的MASTER设备、系统存储过程设备拷贝到新安装Sybase的对应目录下覆盖新的MASTER设备、系统存储过程设备;(5)启动Sybase来恢复原数据库中的数据。注意:该方法只能恢复数据库设备所在硬盘扇区没有被损坏的情况;如果数据库设备所在硬盘扇区被损坏,可能会导致数据库无法正常恢复,这时就只有通过磁盘修复工具修复硬盘,如果能修复,则直接重装整个数据库,如果不能修复,则只有格式化硬盘后再重装整个数据库。2、做大事务操作导致数据库日志满【问题描述】对数据库做需要记录日志的操作(update、delete或insert)时,系统提示数据库日志已满,等待日志空间恢复信息。【原因分析】1.数据库选项“trunclogonchkpot”没有设置,导致数据库日志累计,是数据库日志空间满;2.数据库的日志空间太小,做一个较大的事务就导致数据库日志空间不足;【解决方法】步骤1使用SQL语句“sp_helpdbdatabase_name”查看数据库database_name中的日志使用情况,如果确实是日志满,则继续以下步骤;步骤2使用SQL语句“dumptrandatabase_namewithtruncate_only”清除数据库database_name中的日志;步骤3重复步骤1,如果数据库database_name的剩余日志空间已恢复,则跳到步骤5执行,否则进行步骤4操作;步骤4使用SQL语句“dumptrandatabase_namewithno_log”直接截断数据库database_name的日志,使数据库database_name的日志空间释放;步骤5检查数据库日志空间,如果小于100M,则增加数据库设备,扩展数据库日志空间到200~300M。3、复制服务通讯经常中断【问题描述】(1)复制服务器在数据库重启或服务器重启后,长时间不能自动恢复数据复制,导致SS的告警等数据不能复制到SC;(2)复制服务器与数据库通讯一会儿正常,一会儿中断。【原因分析】对于现象1,首先通过Ping判断SC与SS的网络是否中断,如果网络中断,需要找网管,如果网络正常,则查看复制服务器的版本,如果是PSMS435补丁版以前的版本,可以通过升级复制服务器来解决;对于现象2,首先通过Ping或其它工具判断SC与SS之间的网络是否稳定,如果不稳定,则找网管了解情况;如果很稳定,则查看复制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 支票影像截留管理办法
- 收留管制人员管理办法
- 改革项目申报管理办法
- 政务中心车辆管理办法
- 提高表达能力优化沟通效果
- 新鲜水果分级管理办法
- 株洲市疫情管控管理办法
- 桐城科技特派员管理办法
- 楚雄州共享单车管理办法
- 樱桃西红柿管理办法视频
- 天然气泄漏应急演练方案及总结
- GA 254-2009警服衬衣
- 化学水处理安全检查表
- DB34-T 4102-2022废旧锂离子动力蓄电池贮存安全技术条件-高清现行
- 景陵峪构造报告构造地质学
- GB∕T 8163-2018 输送流体用无缝钢管
- T∕ASC 17-2021 电动汽车充换电设施系统设计标准
- 机动车排放检验检测方法内部审批程序
- 2MW工商业分布式光伏电站项目可行性研究报告
- 普外科优势病种诊疗常规
- 江苏省专业技术人员年度考核表(标准版)(共2页)
评论
0/150
提交评论