智能运维解决方案-_第1页
智能运维解决方案-_第2页
智能运维解决方案-_第3页
智能运维解决方案-_第4页
智能运维解决方案-_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

智能运维解决⽅案-温度管理智能运维解决⽅案上海**电⼦科技有限公司⽬录第⼀章项⽬背景(3)第⼆章基站系统现状(5)2.1:基站系统设备组成(5)2.2现有基站设备系统性影响(5)2.2.1建设的影响(5)2.2.2维护的影响(6)2.3其他问题(7)2.3.1维护费⽤(7)2.3.2批量事故(7)第三章⽤户需求(8)第四章解决⽅案(9)4.1总体原则(9)4.2智能运维系统的最后⼀⽶(FSU)(10)4.2.1上海**基站FSU产品(微环境管理单元)功能介绍(10)4.2.2微环境管理单元功能结构图(11)4.3**基站温度管理解决⽅案(12)4.3.1产品简介(12)4.3.2系统组⽹(12)4.3.3⽅案阐述(13)4.3.4产品使⽤环境(13)4.3.5产品设计依据(14)4.3.6系统特点(14)4.3.7系统功能(15)4.3.8监控中⼼基本功能(微环境管理单元系统功能)(15)第六章价值收益(19)第七章成功案例....................................................................................................错误!未定义书签。第⼋章关于上海**................................................................................................错误!未定义书签。第⼀章项⽬背景全⾯运维⾯临三⼤挑战2016年是中国**全⾯承接运⾏维护的第⼀年,超过150万座**的维护⼯作将⾮常艰巨和复杂。中国**⾃有运维⼈员七⼋千⼈,远⽐原来运营商少,平均下来每⼈要维护180多座**,⽽这仅是他们的部分⼯作职责。按照中国**与三家运营商签订的服务协议,

其服务标准以电信企业的最优标准为参考,品质保障向上看齐。最重要的,是运营商对中国**的维护品质有严格的量化考核,⽐如断电时长的考核,障碍修复时间的考核等,维护标准由原来运营商内部要求变为运营对**公司的外部要求,这些考核与租⾦是有直接联系资产接收后,所有站点的服务都纳⼊考核,⼀些难以预见的问题会对中国**的维护⼯作带来挑战。并且,作为⼀家新成⽴的在IT⽀撑、管理模式等⽅⾯都致⼒于创新的公司,第⼀年承接全⾯运⾏维护任务,各⽅⾯能⼒存在⼀定不⾜是客观存在的。记者认为,中国**全⾯运维的挑战主要来⾃组织保障体系、IT系统⽀撑、⼈员队伍专业化素质等三个⽅⾯。维护⼯单直派模式能否适应巨量基站维护?原来运营商处理故障通常是以省为单位向下派发故障⼯单,后来移动公司进⾏集中化故障管理改⾰,历经三年实现了⼯单直派到⼀线班组。现在,中国**采取的故障派单⽅式也是这样,通过⼀级架构的IT系统总部直接将维护⼯单派发到维护⼀线,省级、市级分公司有相应的授权进⾏调度管理。分析⼈⼠认为,这样扁平化、穿透化的派单⽅式更有利于提升管理的透明度,提升服务管控能⼒。⽬前,中国**对⾃建站点的故障⼯单直派,做得还是不错的。但上百万巨量站点接收后,维护⼯作量将呈裂变式增长,有的故障告警系统可以⾃动修复,有的故障需要派⼈前往查看。截⾄去年年底,中国**已在全国设置342个维护中⼼。公司现有的组织架构、组织形式能否⽀撑如此⼤规模的任务承接?故障能否及时处理?流程能否真正闭环?这些挑战是现实存在的。动⼒环境监控系统建设不会⼀蹴⽽就,过渡期内如何进⾏有效监控?中国**的故障⼯单直派模式很⼤程度上依赖其⼀级架构的动⼒环境监控系统,⽽这套系统的关键设备是FSU。据中国**相关⼈⼠介绍,FSU是连接监控端局和监控中⼼的桥梁,其主要功能是对端局采集器的原始数据进⾏采集,并将处理结果发送给监控业务台和数据服务器,同时接受业务台的控制命令对端局设备进⾏控制。要想对150多万个站点看得见、摸得着,必须对所有站点加装FSU设备。据记者了解,⽬前中国**⾃有新建基站的FSU覆盖率尚不到100%,存量基站中的监控改造和更新还需要⼀定时间。在过渡期内,中国**对动环系统没覆盖到的地⽅只能⽤运营商原来的监控系统,⽽运营商存量基站中的监控缺失率达31%以上,这更需要双⽅做好协调和对接。维护队伍的专业能⼒能否达到⾼服务标准要求?运营商经过多年锤炼,有着具备强⼤技术能⼒的维护队伍,建⽴了技能培训和认证机制,每年组织⼤量专业技术培训和技能竞赛,据了解其维护⼈员平均培训覆盖率达70%以上。⽽新成⽴的中国**维护专业⼈员数量和能⼒都存在⼀定不⾜,技术培训机制尚未完善,相对⽽⾔中国**⽬前的技术能⼒储备和运营商相⽐是有⼀定差距的。⽬前,中国**已选定了新建代维队伍和存量代维队伍,但代维队伍的能⼒整合也需要⼀个过程。维护队伍的能⼒能否达到**公司承诺的⾼服务标准要求,让运营商认可?这是第三重挑战。三管齐下应对维护⼤考中国**在2016年⼯作会上已经将“确保维护品质达标”定为全年的主要任务⽬标,提出要全⾯构建⼀级平台、三级管理的维护管理体系,做到责任清晰、流程顺畅、全⾯落地,实现100%客户响应,运维服务承诺达标率⼒争达到100%,让三家运营商满意放⼼。针对维护⼯作存在的三重挑战,中国**表⽰,要按照体系建设、系统建设与队伍建设三位⼀体的思路,集约⾼效地做好维护承接,让客户满意放⼼,打造良好的维护⼝碑。构建常态化沟通对接机制,夯实基础数据,提升维护管理能⼒,让**公司的维护体系适应巨量基站维护⼯作,就应该提⾼维护⼯作的有效性和针对性。这就需要中国**将维护⼯作常态化落地,与运营商建⽴有效的对接机制,同时沟通摸清相关各站点的历史数据,做到⼼⾥有数。记者获悉,针对新维护模式的流程和组织保障问题,中国**正着⼒加强维护制度和流程建设,推进发电保障、故障处理、上站配合、⽇常巡检等维护全流程的优化贯通,构建常态化的维护对接、沟通协调、投诉反馈等机制,夯实维护基础管理。中国**要求各分公司要建⽴站址现场巡查制度,对标服务协议,以断电时长为重点,建⽴历史和过渡期数据库,分省地市与电信运营企业进⾏确认,确保“底数清、数据明”。中国**还将基于内外部考核,建⽴全⾯覆盖运⾏质量及维护管理的指标考核体系,落实维护责任,实现管理精细化。全⼒加快动⼒环境监控系统建设,尽快提升系统⽀撑能⼒。动⼒环境监控系统是维护管理⼈员的“千⾥眼”,⾮常重要。记者获悉,中国**总部已要求相关部门积极协调⼚家保证FSU设备持续稳定供货,并要求各省分公司充分调动各⽅资源,设备到货⼀周内必须快速安装上线。按照中国**的计划,该系统将在上半年建成,实现全量数据采集。当然,所有IT系统都不可能⼀下具备最完善的能⼒。中国**也表⽰,要不断优化运维监控系统功能,充分发挥⼀级平台优势,确保⾼效⽀撑维护⼯作。中国**将分阶段实施与各省运营商的运维系统对接,积极研究推进双向数据共享,满⾜客户要求,以及⽀撑企业内部关联分析与应⽤。内外兼修,蓄⼒借⼒,提升维护队伍能⼒。针对维护队伍专业能⼒尚存不⾜的现状,中国铁塔提出,对内构建精⼲⾼效的维护管理队伍,保障维护中⼼专岗⼈员、区域经理、项⽬经理等快速到位,结合岗位认证与专业化培训,提升⼈员素质与管理⽔平;对外强化代维队伍管理,依托系统平台,强化⽇常管理与考核。在资产交接过渡期结束后,中国**将对代维队伍进⾏整合,提升维护效率,进⼀步锻造专业化代维队伍。针对应急通信保障层⾯,中国铁塔正组建“⾃有⼈员+合作伙伴”的应急保障队伍,完善应急预案,通过加强与政府部门、电信企业的沟通协作和指挥联动,全⾯增强对突发事件的应急处理能⼒

第⼆章基站系统现状2.1:基站系统设备组成⼀.基站主要设备、各类线缆⼆.基站电源:交流、直流配电箱开关电源、远供电源、电池设备三.基站设备:LTE等主要设备BBU-RRU、分组交换.6100.6200.6300.9800设备四.**类型、天馈线和GPS系统五.附属设备光纤、ODF、DDF2.2现有基站设备系统性影响2.2.1建设的影响2.2.2维护的影响2.3其他问题2.3.1维护费⽤维护费⽤占据的⽐重过⾼,远远超过了建设费⽤的标准2.3.2批量事故因为基站环境温度相关引起的运维事件占总事件⽐例为40%以上。第三章⽤户需求1.提升运维管理效率,降低故障率,提升客户满意度2.最⼤限度减少基站内因为⾼温引起的设备故障,做到事前预警,⾃动维护和⼈⼯维护相结合。3.可远程监控管理,智能分析。4.满⾜未来扩展需求第四章解决⽅案4.1总体原则**公司的成⽴为整个中国通信⾏业的发展注⼊了新活⼒,也推动了整个运维体系的变⾰,在这⼀体系中的企业致⼒于将⾃⼰打造成为具有创新思维的“互联⽹+企业”.如何在“互联⽹+”这⼀⼤背景下,构建智慧的下⼀代运维服务体系,在跨界融合、企业化⽹络引进以及提⾼资源利⽤率等⽅⾯提供保障,是**公司也是设备和服务提供⼚商需要共同研究的话题。过去经常说运维⼈员三件宝,⽛签、改锥、万⽤表,⽽下⼀代运维的三件宝变成智能终端、⽆⼈机和APP。从更深层次分析下⼀代运维的发展⽅向,有三⼤特征:⼀是简洁化,第⼆是精准化,第三是聚焦价值创造。从复杂到简洁,利⽤便携式这种移动式的终端⼿段,可以打开现场运维管理的⿊匣⼦,使得现场维护管理可视、可管、可控。从粗放到精准,可以通过对资产、对数据的深⼊挖掘和分析来实现。通过对站电⼦与效率的分析,可以聚焦这种价值的最⼤化,资产价值的最⼤化。基于这些特征的研究和运⽤,同时⾯向⽹络的运维⽅向转化,安全运维、智慧运维和价值运维是下⼀代运维的核⼼,也是基于过往实验总结出来的核⼼思想。**公司希望代维企业将运维定义为三个阶段:安全运维(MS1.0)、智慧运维(MS2.0)和价值运维(MS3.0)。安全运维是保障,需要对信息、⽣产的安全实施全⽅位的保障。智慧运维是抓⼿,它需要对运维过程中需要使⽤到的各类⼯具进⾏排列组合,寻找到最佳运维⼿段。价值运维是核⼼,来⽀撑整个运维的发展。在MS1.0时期关注安全,通过⼈海战术来确保⽹络的安全。但到2.0时期,期望投⼊更多的技术⼒量、技术改造来增加对⽹络安全的保障。当然2.0时期更关注是智慧,如何更智慧的去运维。3.0关注如何体现运维的价值,⽐如说运维对市场的⽀撑,关注如何使资产实现最⼤化。⽬前整个**产业正处于2.0时代,主要关注的是,寻找关键点,保障资源安全,⾃动排查隐患以及通过对⽇常⼯作数据分析,绘制资源数据画像,锁定安全漏洞,从⽽规避风险。对于未来的MS3.0,⽬前针对价值运维的研究已经进⼊深⽔阶段。对于**来说,需要构建站点的画像,对站点资源进⾏分析,有业务画像和价值画像,⽽在以往这两个画像是三⼤运营商需要考虑的问题,⽽今**需要关注,只有了解了运营商的业务之后,才能更加清楚地指导**站点的运维⼯作重点在哪⾥。价值运维当中⼀个最⼤的亮点是价值最⼤化,通过加减平衡实现价格递增,运维过程会提供实时海量数据的⽀撑,然后分析⽬前的资产。欧盟在今年的⼀份报告中也提出来,未来**包括运营的发展,需要通过构建⾃⼰的数据分析系统,⽽这个数据分析系统需要强有⼒的伙伴来⽀撑。通过全天候的合作伙伴,不仅在⼀线的运维服务⽅⾯,⽽且在资产规划、咨询等⾓度都能够给客户提供全⽅位的服务。4.2智能运维系统的最后⼀⽶(FSU)

4.2.1上海**基站FSU产品(微环境管理单元)功能介绍4.2.2微环境管理单元功能结构图4.3**基站温度管理解决⽅案4.3.1产品简介4.3.2系统组⽹4.3.3⽅案阐述系统采⽤分散式采集,集中式管理,设备部署实施简便,前置采集设备分散部署安装,数据采集包含整个基站设备所有环境温度信息,采集数据通过⽹络上传⾄监控管理平台服务器,管理⼈员通过动环平台完成集中分析和统⼀管控。管理单元通过系统动环监控平台的FSU上联到中⼼端,管理单元通过⾃带和外部传感器侦测环境温度,管理单元同时可以作为插座给空调供电。通过动环中⼼端设定的温度阀值(区间)进⾏报警,如果有必要,通过动环中⼼端设定的风扇控制系统⾃动启动,确保基站主设备⼯作环境温度在正常⼯作范围。确保基站持续⼯作,⾃动维护。4.3.4产品使⽤环境●⼯作环境⼯作温度:-40℃~+70℃;相对湿度:5%-100%;⼤⽓压⼒:70kPa~106kPa海拔⾼度:≤2000m抗风强度:≥60m/s5.1.3.2储存环境储存温度:-45℃~+85℃;储存湿度:5%-95%;存储期限:3年●IP等级要求满⾜IP20要求●盐雾试验要求中性盐雾PH值在6.5~7.2(352℃)之间,满⾜连续72⼩时要求,⽆腐蚀现象4.3.5产品设计依据4.3.6系统特点系统对前端集成设备的数据进⾏采集和监控,采⽤分布式采集、集中式管理进⾏管理与分析。实时监控设备的温度状态,实现各个⽆⼈值守⽹点的智能化,⾃动化管理。系统主要特点如下:1.全⾯细致的数据监测与管理设备的监控完全符合⾏业监控规范要求,涵盖了前端集成设备的监控需求。2.实时可靠的告警分析与管理实时采集各个监控点状态,并对监控点分析与判断,状态改变或超过设定阀值即触发告警,告警反应时间10s以内,及时有效预期故障发⽣。3.全⾯有效的⾃动化管理系统根据实时监测的设备运⾏数据,实现相关的联动控制策略,实现资源的整合与优化,提⾼设备利⽤率,真正实现各个⽹点的智能化、⾃动化管理。4.灵活⽅便的操作模式●系统采⽤C/S和B/S模式,实现图形化的⼈机管理界⾯,提供多元化、多维度的报表分析功能,为维护管理及扩容扩展提供了客观、可靠、全⾯的辅助决策依据。●通过智能接⼝⽆缝整合到客户现有的动环平台,稳定可靠的被管理和被控制(平台发送控制指令到微环境管理单元)。4.3.7系统功能4.3.7.1数据采集基本功能现场监控数据采集器是监控系统的基本单元,通过它实现数据的采集、处理与传输。4.3.7.2数据接⼊功能采集器通过I/O输⼊输出完成设备的模拟量、数字量采集和控制;具有RS485透传通道和以太⽹接⼝。4.3.7.3数据处理控制功能采集器完成对监控对象的数据采集,把这些数据上⾏传送给监控中⼼。采集器接收监控中⼼下⾏传送过来控制命令,实现远程控制功能。4.3.7.4断电后监控管理,⾃动重起功能系统具有电源状态监控,来电⾃动重合功能,后台管理中⼼可以及时研判前端设备状态,减少不必要的现场维护。通过本系统可实现机箱(柜)内的动⼒环境的实时监测和远程维护。当系统中有箱(柜)内的微断因环境、⼲扰等因素导致跳闸时,微断复位控制器会依复位时序进⾏复位控制(⽆需系统⼲预)。如果能够复位,则系统可以马上恢复正常⼯作;如果仍然跳闸,说明负载侧有故障没有恢复,则控制器等候下⼀个复位节点再进⾏复位。15分钟内共计复位六次。如果六次复位均不成功,则复位器不再⾃动复位。如果系统通信链路⼯作正常,则在维护⼈员去现场维护之前也可进⾏远程控制复位操作,以减少可恢复性抢修⼯作量和⼯作时间。4.3.8监控中⼼基本功能(微环境管理单元系统功能)4.3.8.1监控功能监控中⼼能够接收现场监控单元上⾏的数据,动态显⽰监视对象的当前状态及参数。监控平台通过各种⼈机接⼝⽅式,接受管理维护⼈员发出(或预先设置)的设备控制、参数设置命令,能够下⾏向现场监控单元发送的设备控制、参数设置命令,来实现对设备的控制及参数设置功能。并根据要求,可保存设备控制、参数设置命令的历史操作记录。监控平台具备监控系统的基本功能:遥信、遥测、遥控和遥调功能、告警管理、配置功能、安全管理功能、报表功能、通信管理功能、显⽰功能和打印功能。具有查询各种操作⽇志的功能。监控平台中的告警数据、操作数据和监测数据等能够保存⼀年以上。并可对每⼀个测点的保存策略进⾏设置;系统应能对数据库按⼀定周期进⾏⾃动备份。能够按每⼩时、每⽇、每⽉保存每个测点的最⼤值、最⼩值、平均值、整点值及最⼤、最⼩值产⽣的时间。监控平台提供登录⽤户的管理功能,包括增加、删除、修改、级别定义和密码修改。密码应采⽤暗码,定期提⽰修改,超期禁⽤。可以根据实际情况分⽚区、局站类型、设备类型进⾏分类处理。4.3.8.2告警管理功能1)告警等级及管理系统告警分为四级,各级告警的说明如下⼀级告警:引起系统退出服务导致所服务的核⼼业务退服的告警定义为⼀级告警。⼆级告警:可能对系统造成整体退出服务或运⾏性能下降的告警定义为⼆级告警。三级告警:系统中发⽣的设备部件故障但不影响设备整体运⾏性能的告警定义为三级告警。四级告警:系统中设备发送的维护提⽰性告警信息定义为四级告警。其中,⼀级告警以红⾊标识,⼆级告警以浅红⾊标识,三级告警以黄⾊标⽰,四级告警以浅蓝⾊标识。告警产⽣条件、告警等级及告警门限值可在线配置和修改并可分别定义到每⼀个信号量。当系统的容量超出系统的限制后,发出预警提⽰,如服务器性能⽆法满⾜现有组⽹要求时发出预警提⽰。2)告警预处理告警过滤功能:系统能对不需要做出反应的告警进⾏相应的过滤,过滤条件可以根据局站、设备、监控信号量等由⽤户进⾏设置。告警屏蔽功能:系统能⾃动屏蔽由其它告警引起的⾮主要告警的功能,只呈现主要告警;当局站或设备处于⼯程状态时,设定屏蔽后告警信息不上传;当多地点、多设备、多事件并发时,不应丢失告警信息,告警信息准确率必须为100%。。告警延时设定功能:系统具有当告警在延时的范围内消除时,将不上送告警,告警延时时间可由⽤户设定。告警⾃动升级功能:系统具有当告警产⽣后,在指定的时间内没有消除,可以设置升级到更⾼级的告警,如由⼀般告警升级到重要告警等,以便提醒值班⼈员的注意。3)告警处理告警优先呈现功能:⽆论监控系统业务台处于任何界⾯,当告警发⽣时均可及时⾃动提⽰告警,显⽰告警信息,并提供告警信息的打印功能。所有告警均可以设置为可视、可闻声光、语⾳告警等⽅式提醒或通知,对于不同级别的告警可以发出不同的提⽰声⾳。告警确认功能:发⽣告警时,由值班⼈员进⾏告警确认。如果在规定时间内未确认,可根据设定条件通过短信、语⾳等形式通知相关⼈员。(语⾳及短信告警属于系统扩展功能,设计时需要配置相应的语⾳卡、短信modem及管理程序)告警⾃动清除功能:告警发⽣后⼀段时间内⼜⾃动恢复,系统⾃动清除告警窗内的显⽰并保存告警记录。告警统计分析功能:系统能对各种历史告警按区域、局站类型、设备类型、信号类型、告警等级、发⽣时间、确认⼈员、确认时间等关键字段进⾏查询、统计和打印,同时能够查询与告警相关的遥测量及遥信量数据。告警信息不能在任何地⽅通过监控系统进⾏更改或删除。系统本⾝的故障应能⾃诊断并发出告警,能直观地显⽰故障内容。系统具有联动操作性。即当监控系统中某⼀条件成⽴后,⽴即执⾏相应的动作。例如,当环境温度过⾼时,⾃动开启风扇;当环境温度过低时,⾃动关闭风扇。4.3.8.3配置管理功能1)系统数据的配置配置管理功能⽤于监控对象、监控系统⾃⾝的增加、修改和删除的管理。配置管理操作简单、⽅便、扩容性好;在增加新的配置数据或修改配置数据时不影响系统正常运⾏。2)配置数据的查询提供⽅便、快捷的配置数据查询功能,能够按照区域(县市分公司或其它⽤户定义的区域)、局站类型、设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论