版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
实用标准文案实用标准文案文档大全文档大全中国移动通信CHINAMOBILE移动-5―i―5―iPTN网络维护指导规范目录TOC\o"1-5"\h\z\o"CurrentDocument"前言 3运维规范及建议 错误!未定义书签。\o"CurrentDocument"维护概述 3\o"CurrentDocument"维护分类 3\o"CurrentDocument"机房维护制度 3\o"CurrentDocument"例行维护 4\o"CurrentDocument"例行维护项目列表 4机房环境检查 6设备运行状态 6\o"CurrentDocument"配置检查 8保护倒换测试 9\o"CurrentDocument"网管服务器计算机环境 10\o"CurrentDocument"数据备份检查 10维护及发展 10\o"CurrentDocument"网络维护故障类 10\o"CurrentDocument"网管无法正常使用设备的 LLDP功能怎么办? 102LOOPBACK1地址自动丢失造成网元脱管怎么办? 11\o"CurrentDocument"上载数据库不成功提示“设备未登录(没有权限)”怎么办? 11如果升级中 ZXR10.ZAR无法删除和重命名怎么办? 12如果网管设备管理器查询不到这个网元的任何配置,但网元确实有业务在跑,如何处理? 12\o"CurrentDocument"网络技术规范类 12\o"CurrentDocument"2.1155M端口和 2M端口环回规定? 12伪线双归保护应用场景和配置规范? 12\o"CurrentDocument"异常业务如何产生,该如何避免? 132.4PTN网络中, TUNNEL如何配置合理,需要注意什么? 14\o"CurrentDocument"网络在业务承载和流量规划配置需要注意什么? 14前言为适应中国移动通信的高速发展,加强长沙移动 PTN传输网络维护及后续优化管理,合理利用网络资源,使网络运行质量达到最优,提高网络的运行服务质量,为业务网提供良好的传输网络支撑,传输维护中心根据现网运行和建设情况,结合集团规范,针对如何建设 PTN网络“可发展、可持续、易管理”的网络运维要求,提出相关规范和建议,用于后续传输网络发展、维护指导。维护概述维护分类设备维护可以分为日常维护和突发性维护。日常维护日常的周期性例行维护,主要是对设备运行情况的周期性检查。及时处理检查中出现的问题,以达到发现隐患、预防事故发生、及时发现故障并尽早处理的目的。突发性维护突发性维护也称为故障处理。因为传输设备故障、网络调整等原因带来的维护任务。例如:设备损坏、线路故障时需进行的维护、在日常维护中发现并记录的突发事件。1.1.2 机房维护制度为保证机房环境满足设备运行要求,更好地完成设备维护工作,机房应建立完善、有效的维护制度,所有维护人员应共同遵守。机房工作制度保持机房内的整齐、清洁、有序。做到进门换鞋,地面清洁,设备无尘且排列规整。仪表准确,工具到位,资料齐全。不准在机房内吸烟、吃东西、玩游戏。不准在机房内大声喧哗。不得在机房内乱摆放私人物品。不做与工作无关的事。不将易燃、易爆等物品带入机房。无关人员未经批准不得进入机房。操作设备时必须佩戴防静电手环。爱惜机房内的公共财物。不得泄露有关机密,做好保密工作。做好各种原始记录的登记、统计工作,保证技术资料和原始记录真实、完整。工作人员在机房值班时,必须严守岗位,发现重大障碍和事故应及时处理及上报。机房管理要有领导负责定期检查,不断改进。机房交接班制度做好上、下班之间的交接工作,是保障通信不间断的一项重要制度,要求每个工程维护人员必须严格遵守。值班人员在上、下班时,必须认真交接,做到责任明确、手续清楚、衔接顺畅。交班人员在下班前要把本人值班情况介绍清楚,接班人员在上班前要认真核对检查。交接班时要求做到:设备运行状况、工具、仪器仪表等情况明确,各种图纸资料记录等完备。接班人员未到,交班人员应坚守岗位,直到接班人员到来并完成交接后方可离班。交接完毕后,双方应在值班记录上签字,作为书面记录,表示设备已移交接班人员维护。如在交接班时出现设备故障,交班人员及接班人员共同承担维护维修设备的义务,不可相互推诿。1.2 例行维护例行维护项目列表例行维护项目及间隔周期见表项目项检查内容说明检查情况周备注机房环境检查1温度,湿度温度: 15 C~30 C,湿度:40%~65%,有空调设备□ 合周□ 不2防雷、防电磁干扰有无防雷设施,附近有无强电磁场□ 合月格 不3防尘门窗完好,设备干净无灰尘□ 合月□ 不4电压范围交流: ~220V口10%,直流: -60V~-40V□ 合周□ 不5机柜防口袋检查检查防鼠袋是否破损□ 合月□ 不6消防设备检查是否配置合适的消防设施□ 合月□ 不7后备电源有后备电源,并有足够的容量□ 合月格 不硬件安装检查8口线和电缆编号走线规范整齐,电缆有明确编号□ 合季度格 不9网线制作网线按标准制作,尽量短□ 合季
10保护地、工作地有良好接地,接地电阻 <1口□ 合□ 不季度系统硬件检查12系统风扇机架和系统风扇应该正常转动□ 合格 不周13电源模块电源主、备用是否正常,有无告警□ 合□ 不周14单板运行情况单板有无告警□ 合□ 不天15端口状态端口状态有无告警,工作是否正常□ 合□ 不天备份检查18配置备份配置文件和配置信息应该备份到后台服务器上□ 合□ 不周19数据库备份检查检查网管数据是否正常备份□ 合□ 不天告警日志检查20告警记录查看告警记录是否正常,一方面看能否nnnnnn,nnnnnnnnnn□ 合□ 不天21日志记录查看日志记录是否正常,一方面看能否将操作记录下来,更重要的是看有无异 □ 合□ 不天22性能检测查看性能记录是否正常,看有无反映设备运行异常的性能,如误码等□ 合□ 不天设备运行状态23设备温度温度是否超过范围,要求 >=-40℃,并且<=70℃□ 合□ 不天24系统时间查看是否北京时间超过 3分钟□ 合□ 不周25CPU使用率当前和历史 CPU使用率是否异常□ 合□ 不天主要关注核心26内存使用率当前内存使用率是否异常□ 合□ 不天节点关注核心27以太网端口流量查看端口出方向流量,关注Interfacepeakrate/Interface□ 合□ 不天节点关注核心28以太网端口口包多次查看端口计数确认下面计数是否增加: CRC-ERROR\Errframe\□ 合□ 不天节点关注核心29以太网端口对接查看对接端口是否配置一致电口工,协商模式)□ 合□ 不周节点网管服务器检查30内存检查检查服务器内存使用率是否过高,要求小于80%□ 合□ 不周31cpu检查检查服务器 cpu使用率是否过高,要求小于60%□ 合□ 不周32登录密码检查要求密码不能过于简单,一个月更换一次□ 合□ 不周33硬盘空间检查要求网管安装目录所在硬盘空间剩余空间大于 10G□ 合□ 不周口口测试34主备用主控板倒口测试检查备用主控板是否正常□ 合□ 不季度35业务工作保护倒口测试检查备用保护路径是否正常□ 合□ 不季度版本检查36软件版本软件版本是预期的版本,是否全网一致□ 合□ 不季度37硬件版本( PCB、PLD)硬件版本是预期的版本,是否全网一致□ 合□ 不季度业务配置规划化检查38telnetline参数是否符合 idle-timeout30,absolute-timeout0□ 合□ 不季度39业务保护是否有配置业务保护路径,配置齐全□ 合□ 不季度40TMPLSOAM是否有配置 TMPLSOAM,配置齐全□ 合□ 不季度□不度E 合季41检查VLAN配置检查VLAN配置是否会导致环路□ 不度机房环境检查设备运行时的环境温度和相对湿度要求温度:15 C~30C,湿度:40%~65%,有空调设备。设备供电电源使用直流标称-48V电源,允许波动范围: -60V~-40V。机房直流电源线安装的路由、路数及布放位置等应符合一般电信工程的规定。导线(铝、铜条或胶皮线)的规格、器材绝缘强度及熔丝的容量等均应符合设计要求。电源线应采用整段的线料,不得在中间接头,当需要使用保护套管时,应参照相应的邮电规范施工。消防设备机房应配备有适用的消防器材。如一定数量的手提式干粉灭火器,确保消防器材设在机房附近明显而又易于取用的位置。对于规模较大的机房,应有配套的自动消防系统。设备运行状态查看设备风扇、电源状态检查目标: 检查电源、风扇状态,避免出现风扇半速运行、单电源工作影响设备稳定性和可靠性。检查内容与操作 :Showpowerfanstate检查电源、风扇的工作状态,如果状态未 OnlinebutnotWork则说明电源或者风扇不正常需要检查。系统版本检查检查目标 :确保系统软件版本为最新可用版本,全网版本统一,避免因版本问题导致的网络隐患。检查内容与操作:showversion查询系统软件版本,软件编译时间,FPGACPLDPCB版本口系统温度检查检查目标 :系统温度处于正常工作范围内,排除温度过高导致的运行风险。检查内容与操作 :设备上showversion查询系统系统温度,要求 >=-40℃,并且 <=70℃。查看单板,端口告警、运行状态检查目标: 检查单板是否存在异常告警,及时发现排除单板或端口故障带来的影响,如果存在分析处理消除设备隐患。检查内容与操作 :网管,设备上 showloggingcurrent-alarm查看单板及端口是否告警,或查看端口,单板运行指示灯,并进行记录系统运行时间检查目标: 核对系统运行时间是否准确,确保全网设备及网管服务器、客户端系统运行时间同步。防止时间不符导致网管告警不准确。检查内容与操作: 查看系统运行时间是否超过北京时间 3分钟,如果不准确重新进行设置。-showclock查询当前系统时间-clocktimezone设置时区-clocksethh:mm:ssMonthDayYear]置日期时间查看设备CPU,内存处理情况检查目标:通过查看 CPU是否出现长时间高占用率,了解内存资源占用情况,确认有无内存泄露【内存占用长时间高达 90%以上或者间隔(24小时以上)观查内存值持续升高,此时就需要关注是否存在内存泄漏!】等问题,初步分析系统是否运行正常。防止]备资源占用过高导致的业务中断风险检查内容与操作: 主要查看当前主控 CPU(5s)占用率和内存使用情况,口史上PeakCPU占用率,如果有高占用率【一般情况下长期在 50%或者瞬间70%就认为占用率高】需要进一步分析,排除网络存在的隐患。以太网端口对接检查目标: 查看对接以太网端口的双工、速率配置是否正确和状态是否正常。对于光端口查看光模块(必须是支持数字诊断的光模块)的光功率是否正常,避免因端口协商或光功率影响业务通信。检查内容与操作:--]备上执行 showinterfacebrief以太网端口数据包统计检查目标: 多次查看端口收发包统计情况,查看端口出方向流量,关注Interfacepeakrate/Interfaceutilization是否在正常范围,建议值一般低于端口带宽 70%,过大需进一步分析或考虑扩容,防止因流量过大导致的业务丢包;确认 CRC-ERROR\Fragments\LittUndersize计数是否增长以及Dropped是否大量增长,口则要分析产生原因,消除故障。检查内容与操作: showinterfacexgei_10/1端口性能检查目标:通过网管查询E1,STM端口15分钟及24小时当前、历史性能,查看是否有PDH误码等异常性能,有则进一步进行分析定位处理,排除故障,避免影响业务正常运行。检查内容及操作: 在网管上进入性能管理界面后,选中需要查询网元 -板卡-端口后,在查看菜单选项中选择当前性能,设置粒度周期后点击查询按钮即可获取15分钟或者24小时当前性能统计。1.2.4配置检查Vlan配置检查目标:查看vlan、ip设置是否与规划要求以及实际应用相符合,避免由于这些问题导致监控、业务通信出现异常。检查内容与操作:showvlan□主要关注 NNI端口的Pvid是否为1,若为1则要修改之,防止由于vlan成环,产生广播风暴,导致业务中断。showinterfacevlanxxxx查看协议是否up,ip地址是否配置正确。showipinterfacebrief查看Vlan、IP地址是否和规划设计的一致。telnetline参数配置TOC\o"1-5"\h\z检查目标:查看 telnet(absolute-timeout)绝对超时时间是否为 0,避免参数为默认值 1440,导致网元24小时出现一次网元断链告警;查看telnet]idle-timeouft相对超时时间是否为 30,避免参数设置大于 30,有大量空闲telnet链接占用TCP链接资源。检查内容与操作: Showrunning-config|includetelnet查看telnetline配置的参数---设置 telnet相对超时时间和绝对超时时间分别为 30,0。业务保护
检查目标: 查看是否有配置业务保护路径,隧道保护配置信息是否齐全(和下列命令显示信息相比较缺少保护类型、模式、下一跳等即为不齐全)。防止因保护未配置保护导致的业务中断风险检查内容与操作:Showrunning-config|begintunnelgroup查看所有配置的保护组信息或在网管TNP内查看是否存在保护组,保护组状态是否一致。TMPLSOAM配置oam配置检查目标:查看是否有配置 TMPLSOAM1oam配置不全导致的网络保护失效及 oam维护操作失败等。检查内容与操作: Showrunning-config|beginpwe3查看伪线 OAM配置是否齐全 Showrunning-config|begintunnelx查看隧道 OAM配置是否齐全 Showrunning-config|begintms刈看段层OAM配置是否齐全.2.5保护倒换测试.2.5保护倒换测试主备主控倒换测试主备主控倒换测试•检查目的:•检查目的:检测备用主控是否正常,是否能够起到保护作用。•检查内容与操作:命令行操作:•检查内容与操作:命令行操作:redundancyforce-switchove网管操作:拓扑视图右键点击网元,依据路径设备管理器->PTN业务配置网管操作:拓扑视图右键点击网元,依据路径设备管理器->PTN业务配置->主控板主备倒换路径进入操作界面业务主备路径倒换测试板主备倒换路径进入操作界面业务主备路径倒换测试•检查目的:•检查目的:检测备用保护路径是否正常,保护功能设置是否有效。••检查内容与操作:首先在业务视图->业务管理->TNP管理->选中测试保护组首先在业务视图->业务管理->TNP管理->选中测试保护组->图形显示,查看工作路径和保护路径,确认实际路由后关闭界面。路径和保护路径,确认实际路由后关闭界面。然后在业务视图->业务管理->TNP管理->选中测试保护组然后在业务视图->业务管理->TNP管理->选中测试保护组->保护组信息接着在弹出的界面中对A/Z端进行倒换设置后,通过观察倒换状态,倒换告警,接着在弹出的界面中对以及和运营商维护人员确认承载业务是否有瞬断等情况确认备用链路及倒换功能是否有效。1.2.6网管服务器计算机环境检查目标: 及时发现网络维护瓶颈,防止因网管服务器硬件资源导致的维护问题,提高维护效率。检查内容与操作:T3网管系统在网管服务器上运行时占用的内存、 CPU情况。要求服务器内存使用率小于80%,cpu使用率要求小于 60%2口检查网管安装目录磁盘是否有 10G以上剩余空间。防止因空间不足导致的数据备份失败等1.2.7数据备份检查检查目标: 1,检查设备配置文件是否备份,便于配置丢失或更改后及时恢复业务。 2,检查网管数据库是否正常备份,并能够将近期自动备份的网管数据恢复,用于发生故障时实现业务的快速恢复。检查内容与操作:点击系统管理视图口备份恢复口数据备份,将出现如下对话框,输入文件名以及存放目录,然后按备份按钮,网管备份功能是否正常。2 维护及发展 FAQ网络维护故障类网管无法正常使用设备的 LLDP功能怎么办?口:众所周知, MAC主要工作在第二层,两台电脑即使 MAC地址相同,只要不在同一个广播域中就不会有冲突,这样产生冲突的概率就小多了,当然,即使有冲突了电脑也不会报告警的( IP冲突电脑软件会识别)。而现场 PTN网管用到的LLDP功能,首先要通过 MAC地址确定设备,一旦冲突了就无法工作,这个冲突检测是跨广播域的,因此发生冲突的概率要大一些。处理方法:在D:\NetNumen_T31\ums\ums-clnt\log目录下选择相应时段的日志00,00 00DOD0□如果存在,则从中可以看出是哪个网元出现了问题。如果发现有问题的站点,登录网元激活 MAC地址:在特权模式下输入: olleh进入隐匿模式⑴输入mac—base—addrenablemaster激活MAC地址输入reload使激活生效。当然根本的解决方法还是在开局前查看一下设备的MAC地址以保证全网唯一。2.1.22.1.2loopback1地址自动丢失造成网元脱管怎么办?□:该故障是由于现场配置了loopback1]□没有配置tmplslsr-idloopbackl致的(如果没有配置tmplslsr-idloopbackl上载后,网元属性中的环回地址仍为
0.0.0.)0。按照设计思想,网元由离线变为在线后,网管会自动下发离线时所做的网元属性到设备上,以此来保证网管数据和设备数据保持一致。所以,现场在离线配置设备时,要注意在配置了loopback1后,一定还要配置tmplsIsr-idloopbackl否则当设备在线时,由于此时网元属性中的环回地址为0.0.0.0时,要注意在配置了loopback1后,一定还要配置tmplsIsr-idloopbackl否则当设备在线时,由于此时网元属性中的环回地址为0.0.0.0,会下发以下命令因此导致设备上loopbackl值为0:interfaceloopback1noipaddressloopback1exitloopback1所以在离线创建网元时一定要填写环回地址且环回地址一定为真实的的IP地址。2.1.3上载数据库不成功提示“设备未登录(没有权限)”怎么办?2.1.3答:【故障现象】对设备上载数据库时,网管提示告警“发送命令失败,设备未登录(没有权限)”。【故障分析】用户模式进入特权模式要执行命令enable密码是:用户模式进入特权模式要执行命令enable密码是:zxr10zxr10在showrun显示的所代表的字符串为:RcMluUKvnFZX9kNAV6A/UA==,通过查看现场采集的表的字符串为:RcMluUKvnFZX9kNAV6A/UA==,通过查看现场采集的showrun信息发现如下:enablesecretlevel155Sd90g2CfYMc5m27HBE9PbQ==,可见此设备息发现如下:的enable密码不是的enable密码不是登陆告警。【规避方法】现场通过cmd登陆到设备,现场通过cmd登陆到设备,采用用户名为zte,密码为ecc,可以进入的特权模式,然后再进入到配置模式,将enable密码进行修改,修改为zxr10即可。具体修改命令为:enablesecretlevel15zxr10。修改之后网管管理设备就正常了,同步上载就不会报错了。如果升级中zxr10.zar□□□□□□□□□□□?答:方法一:ZXR10(config-increte)#deixaecmpmacmdchkdsk“/flash/”,2——强制修复 flash,然后再看看能不能删除 zxrlO.zar.方法二:更换主控板如果网管设备管理器查询不到这个网元的任何配置,但网元确实有业务在跑,如何处理?口:这可能是该网元以 ros方式重启以后没有做同步操作,可以按以下步骤实施telnet登录网元,进入 \dataset录检查是否有initDataSrcFiag,如果没有就拷贝一个initDataSrcFiag。执行write命令保存网元配置,执行 syncstartruntoag命n同步数据库到agent网管上执行数据同步,将 agent网元配置上载到网管。然后删除 initdata标志文件。要求现版本均以 agent]式启动。2.2 网络技术规范类155M端口和 2M端口环回规定?口:目前 6200和6300设备支持 2皿155M端口环回功能; 9008设备的 155M光00000级的环回口0,000针对单个 VC12进行口回口伪线双归保护应用场景和配置规范?答:【伪线双归保护倒换触发条件】主要有:TMC-CSFTMC-SSFTMC-LOCPTN和BSC/RNC间断口,TMC-CSF发伪线倒口与 BSC/RNCD接的 PTN掉电,TMC-SS印发伪线倒口 PTN网络内部故障,TMP-LOC发隧道口口【保护类型使用现状】双发双收属于早期的应用,目前已经不再应用;单发双收在现场暂时用的不是很多。【隧道保护组类型】若伪线双归的主伪线要绑定隧道保护组,那么这组隧道保护组必须配置为 1:1的LSP保护。【1:1保护与1+1保护的区别】仅在于单发和双发的差别口PW保护方式与RNC对接模式】(1)以太网业务:PW0护方式RNC---LAG模式是否能实现双归保护1+1并收(双发双收)主备是1:1并收(单发双收)负载分担是目前针对主备的 LAG或负载分担的LAG,在和伪线双归对接的场景中, PE节点均不能使用LACP协议,对端RNC必须使用静态(我口) /手工(华为)的方式。口2)CES2M业务:PW0护方式RNC/SDH——PTN对接方式1+1(双发单收 )推…… ……一一,一…PTN两台与一台设备对接 MSP1:1/1+1/^000荐+1(双发单收 )PTN两台与两台SDH设备对接通道保护【现网版本设备 TMC-OAM配置规范】TMC-OAMCV配置原则:AGENT版本的设备均支持 TMC-SSF(该告警主要应用于PE尾节点设备掉电情况 )触发伪线倒口。主备工作隧道都上报 TMP-LOC,对其承载的伪线下插TMC-SSF。现场配置OAM时不开启“CC检测”功能,以防止单条 PW误报TMC-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论