机房运维方案_第1页
机房运维方案_第2页
机房运维方案_第3页
机房运维方案_第4页
机房运维方案_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机房运行维护工作提议书为加强********单位数据中心机房各系统运行维护和管理工作,确保系统长久稳定、高效运行。依照**************信息化工作管理要求,编制适合于******机房运维方案。运维现实状况分析******数据中心机房现在由*******部门管理,由指定外协企业承接基本运维工作,其职能限定于出入安全、配件管理、设备管理、运行物理环境管理。对于设备本身及其运行维护、软件运行维护等工作,仍由各个供给商按项目订立协议提供无偿服务,现在这些无偿服务大部分处于过期或者即将到期状态。现在机房运维没有涵盖桌面终端、大楼综合布线、楼层配线间与设备间等,未组成一个完整运维体系。故障连带现象多方运维造成机房出现中止或者服务不良情况时有发生。********企业机房因为一直未能受到规范统一运维管理,加上机房作为数据关键,由各种外部单位组成运维团体不论在数据安全性、人员责任感、技术全方面性等方面,都难以保持机房连续性运转。我们没有精准数据来说明机房运行情况,这也是现在运维工作还未达标一个表现,一样,这也造成我们对现实状况无法进行精准描述。不过,经过一些现象依然能够发觉机房运维工作应该大幅度改进。长时间断网详细原因不详,但因为机房服务器大部分无法接通,成都地域二级单位网络依赖DHCP服务无法使用等现象连续多个小时,发觉晚,响应慢。上班时间网速慢详细原因不详,但简单归结为SEP或者人多并不能完全解释网速慢问题,因为网络是信息化建设基础,充分发挥机房内部与外部资源是运维工作主要职责。服务意外退出当虚拟机系统开始引入后,我们时常发觉挂载在虚拟机系统上一些服务器无故宕机且不知道任何原因,当用户需要使用时,因为无法自动恢复,影响正常工作。不易寻找责任人机房是一完整整体,包括到环境、网络、服务器、存放、操作系统、数据库、应用软件等,当一个故障发生时,难以判定故障原因,而现在机房是各个外协单位各施其责,最终造成故障排除时间迟缓,相互推诿情况时有发生。半自动化运维现实状况现在许多企业IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户交流中发觉其中很多企业IT运维管理还只是处于“半自动化”运维状态。因为这种IT运维依然是等到IT故障出现后再由运维人员采取对应补救方法。这些传统式被动、孤立、半自动式IT运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面:运维人员被动、效率低在IT运维过程中,只有当事件已经发生并已造成业务影响时才能发觉和着手处理,这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量极难提升,造成IT部门和业务部门对IT运维服务满意度都不高。现在绝大多数企业IT运维人员日常大部分时间和精力是处理一些简单重复问题,而且因为故障预警机制不完善,往往是故障发生后或报警后才会进行处理,,使到IT运维人员工作经常是处于被动“救火”状态,不但事倍功半而且经常会出现恶性连锁反应。缺乏一套高效IT运维机制现在许多企业在IT运维管理过程中缺乏自动化运维管理模式,也没有明确角色定义和责任划分,使到问题出现后极难快速、准确地找到根本原因,无法及时地找到对应人员进行修复和处理,或者是在问题找到后缺乏流程化故障处理机制,而在处理问题时不但欠缺规范化处理方案,也缺乏全方面跟踪统计。缺乏高效IT运维技术工具伴随信息化建设深入,企业IT系统日趋复杂,林林总总网络设备、服务器、中间件、业务系统等让IT运维人员难以从容应对,即使加班加点地维护、布署、管理也经常会因设备出现故障而造成业务中止,严重影响企业正常运转。出现这些问题部分原因是企业缺乏事件监控和诊疗工具等IT运维技术工具,因为在没有高效技术工具支持下故障事件极难得到主动、快速处理。现在伴随IT运维管理工作复杂度和难度大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业开始需要利用专业化、标准化和流程化伎俩来实现运维工作自动化管理。因为经过自动化监控系统能及时发觉故障隐患,主动告诉用户需要关注资源,以达成防患于未然。比如,全天候自动检测与及时报警能实现IT运维“全天候无人值守”,大大降低IT运维人员工作负担。而且,经过自动化诊疗能最大程度地降低维修时间,提升服务质量。所以,对于越来越复杂IT运维来说,将纯粹人工操作变为一定程度自动化管理是一个主要发展趋势。规范制度不健全IT系统三分建、七分管,运维管理十分复杂,技术要求高,包括范围广,实施难度大,突出有“三难”。职责难明IT系统运维管理离不开使用、建设、运维三方共同努力。不能将全部运维责任归于运维部门,运维部门与其余部门相互配合程度低,造成运维人员压力大,处理事务多。哪些由使用部门负责,哪些由运维部门负责,难有明确职责界定。资料难全网络设备价格和系统集成复杂度不停降低,部门自建“网中网”、“小系统”现象愈加普遍,资料准确性和完整性不停降低,给清查设备和排查故障带来很大困难,运维部门掌控系统资源越来越难,运维管理资料难求完整。绩效难估运维部门有个“两难”境界:系统问题越多,工作量越多,但有些人认为维护水平越低;维护水平越高,问题越少,但他人认为工作量越少。运维部门绩效评定难以用业务部门类似指标来衡量,不能受到公平评定。所以运维人员主动性越来越低,人员流失率高。总体目标机房运维管理规范化、流程化、制度化鉴于最终用户对信息化服务连续性供给要求,******数据中心机房运维工作急需由被动式变更为主动式,针对以下内容进行规范化管理,确保其连续运行时间与工作性能满足生产需求。机房环境,包含温度、湿度、供电、防雷、消防、承重等;机房设备,包含服务器、交换机、存放、网络安全、通讯等设备;机房链路,包含骨干光缆、机房跳线、收发与中继等;机房应用软件运行监控,包含门户、办公、生产、财务、网络等应用软件等;机房软性资源,包含IP地址、VLAN等。对于以上各个项目类别,基本上都包含监察、报警、故障排除、优化等工作,因为应用软件等受到供给商限制,其故障排除与优化往往只能由供给商提供,但对其运行进行实时监控依然是机房运维职责范围内工作。统一管理和集中授权机房运维现在存在很多问题,造成工作较为混乱,职责不清,相互推诿时有发生,这与运维本身所需要快速排除事故,综合性根本性处理潜在问题要求是不一致。除了技术上需要一个中央平台以外,显然管理上也应该形成一个统一运维团体,这个团体应该对机房内各项内容都负担对应职责,这种职责是深入,而不但仅是简单碰到事故时一个通知者角色。设备厂商、应用软件开发商都是在不停改变中,而运维管理团体却是不变。地研院信息中心认为,运维管理团体应该保障运维行为合理性。不允许在事故排除、问题诊疗、连续改进过程中,出现互不负担责任,尤其在一些业务交叉点上;对运维配置项识别方法是统一,工作单、知识库等格式是标准一致;对石油钻探行业知识了解是一致,包含不一样应用主要性等级、不一样部室数据安全性等级等;团体内应共同对运维服务工作推进负担责任;内部区分不一样安全等级,比如管理员账号与密码属于高安全级,而外部人员工作则是适度授权。在业务与管理上达成集中统一要求后,就形成了“******数据中心机房运维一体化”工作模式,因为这种模式加强了运维内部凝聚力,所以易于在运维流程、技术等方面进行连续改进,从而不停提升********企业在信息化运维工作上能力,也就为********企业信息化建设解除了后顾之忧。那么,我们再看一看现在现实状况,能够反射出多方运维所形成一些后果。集中监控平台机房是企业信息化关键,不论是应用服务、关键网络、骨干链路,都将牵动全企业信息化使用。而机房软硬件通常都是由不一样渠道采购,这就造成了多厂商与多供给商共同维护局面,因为不一样厂商有不一样管理平台,不一样集成商有不一样运维方式,运维队伍良莠不齐,在运维及时性、有效性、安全性上,都无法满足********企业业务需要。实际上,我们需要以下所述一个平台。统一而且固化可执行流程,确保不论何人来都能够按标准执行,以降低运维风险;集中监控预警系统,经过集成机房环境、网络、服务器等系统,任何系统出现故障,都将在第一时间发觉并报警,同时,管理人员也只需在一个统一门户上进行操作管理,而无需面对各种各样管理体系,在减缓学习曲线同时也提升运维品质;集中知识库,知识包含历史实施过程、技术方案、原始资料等,因为运维延续性非常主要,所以,具备高度参考价值历史运维资料是一笔相当宝贵财富;集中运维队伍管理;统一规范基础配置项数据库。只有经过一个中心平台,封装不一样厂商与集成商所提供不一样内容,最终达成运维工作可执行,业务延续而不受到厂商或者集成商过分牵制。不过,业务上或者说技术上只是提供了一个系统,而运维要落地依然需要各类人员来完成,那么,确保运维工作实施与落地就需要统一管理。运维自动化首先,IT运维流程自动化能够提升流程可控性,能够基于业务需求来制订个性化流程,使企业领导有机会看见他们业务流程,对企业流程有一个深刻分析和了解,进而改造和优化流程。其次,IT运维流程自动化能提升透明度。因为伴随业务需求改变可能会有多个版本出现,手工流程不透明将会给流程定制和优化带来相当大困难,而自动化流程能够使用户能够一目了然看到整个流程各个节点运转情况,自动化工具潜移默化地提升业务保障能力。再者,运维系统实施了自动化监控以后,经过工具自动监控对人工作是一个减负,也是一个降低成本表现。建设方案******数据中心机房运维是一个整体化工作,不论在电信、金融等信息化程度较高行业,都是由一个运维团体来负担运维工作,鉴于行业信息安全需求,通常是由一个内部服务机构进行统一管理,外协单位辅助来统一开展工作。地研院信息中心作为距离******数据中心机房较近,信息化人员有一定运维经验,有足够意愿为******数据中心机房运维提供良好支持,现在地研院信息中心与一些有经验外协单位通力合作,正在努力向ISO/0标准所要求运维服务规范化流程化方向前进,并依照本身对机房运维工作了解,已经开发出一些流程与制度,为机房运维奠定足够基础。自顶向下设计机房运维涉众自顶向下牵系到各个层面诉求,******数据中心机房运维是一个分层次服务,整个运维过程将会包括多类人员。依照********企业现实状况与实际情况,我们分析以下人员将组成整个运维生命周期中干系人,并行使各自角色权利。终端用户终端用户是我们最终客户,其满意度是我们运维工作是否良好主要评判标准。终端用户不局限于大楼内办公用户,也包含骨干网络联通对端用户、机房服务器上各类应用使用者、集团企业远程网络管理者,等等。终端用户也是运维费用负担者,我们职责就是让其满意度逐步提升。内部服务管理部门企业信息管理部作为内部服务管理部门,负担了确保终端用户满意度责任。因为内部服务管理部门负担了大量管理工作,再负担运维服务工作实际上不具备可行性。所以,信息管理部应负担运维管理工作,包含选择运维工作负担单位、审批管理流程、传递集团企业管理规范或者制订企业内部企业规范,等等。内部服务管理部门也是运维费用评定方与支付方,为整个运维工作推行管理职责。运维承接单位地研院将作为运维工作承接单位,将落实落实服务管理部各项指标,并为终端用户提供服务界面。运维承接单位必须是中石油内部单位,其一是因为信息安全要求,其二是为了愈加好遵照企业规范,其三是不停提升内部队伍运维水平。运维承接单位本质上还是一个内部服务单位,在一些技术与业务无法支撑情况下,需要外部协作单位提供运维技术工作支撑。外部协作单位外部协作单位为运维工作提供了附加人力资源与技术教授服务,是整个运维工作主要组成部分,其通常会负担实际工作执行者角色。作为外部协作单位,必须恪守企业规范与要求,并按需提供对应数据资料与过程文档。因为机房技术复杂性,外部协作单位可能不只一家,这些外协单位将由运维承接单位进行统一管理,形成统一运维团体。供给商与厂商供给商与厂商,包含软件与硬件,这两部分都需要他们提供配件服务与修复服务,不论在无偿服务期还是收费服务期,这些商家都属于运维体系中一部分。供给商与厂商,也包含一些项目研究与测试阶段参加者,这些商家也必须恪守机房对应管理要求。采取自底向上与自顶向下相结合******数据中心机房运维现在处于一个被动式工作状态,距离主动式运维还有很长一段距离,这是因为各个运维单位没有标准工作流程与数据规范,造成基础数据极度欠缺,这些工作现在都必须一步一步经过坚实工作来逐步补充和完善。同时,我们不能将运维工作简单看成一个软件系统或者平台,我们必须要按照ITILv3等国际标准,结合********企业实际,制订自已标准,这么展开工作才有章可循,有法可依。按照这自底向上与自顶向下结合标准,我们提议采取以下步骤来实施******数据中心机房运维。建设运维团体运维团体建设主旨,就是满足运维工作PDCA循环,结合内部与外部工作人员,构建一个良性不停自我成长运维生态圈。因为对IT运维不够重视,很多企业并没有建立良好运维团体来系统而规范进行运维管理,这在一定程度上引发了IT运维人员流失,使得企业IT运维无法在质量上得到最大程度提升。另外,伴随企业IT应用深入,运维已无法单纯依靠几个“运维先锋”以及“技术大鳄”来处理。运维专业化细分,需要企业能够充分了解IT运维以及运维人员特征,才能让运维人员在适宜细分空间不停进行运维经验积累,从而提升运维质量。而这恰恰是很多企业无法正视问题,运维中总是采取消极应正确态度,使得众多“运维先锋”以及“技术大鳄”也因为受重视程度不够等很多原因选择离开。在运维管理中,团体质量直接影响着服务质量,只有连续投入管理精力,建立对应晋升培训机制方能确保较高服务水平和较稳定服务质量。我们将在后续章节详解我们运维团体组成计划,因为工作都是由人开展,所以这是最紧迫工作,也是******数据中心机房运维工作主要部分。因为中石油属于国家战略行业,我们必须在考虑到人员技术性同时,也要考虑到内外部人员信息安全性。建立规章制度加强IT系统运维制度建设事半功倍,经过运维工作制度化,全方面落实各项管理责任,可有效确保IT系统安全、稳定、可靠运行。伴随IT系统在各行各业迅猛普及,IT部门工作重点,逐步由系统建设转向运维管理,确保IT系统高效稳定运行、提升服务水平成为重心。近年来,IT系统运维管剪发展了一些先进理论方法,诸如以ITIL为关键IT服务管理十大流程、IT外包等,推进了信息化服务水平提升。不过,对于IT系统规模较小、功效简单单位来说,运维部门人力弱,经费投入少,利用实施这些理论方法存在着较大难度。所以,处理运维管理“三难”问题,惟一方法就是建立较为完整运维管理制度,形成一套职责、流程和指标,做到事事有章可循、有规可依。依照********实际情况,参考行业内一些经验,我们已经确定了一些规章制度初稿,能够在后续章节中看到。不过仍需要在实践过程中不停改进,以适应我们实际情况。采集基础配置项数据库******数据中心机房运维基本工作欠缺较多,尤其是在基础数据方面,一直难以提供一份完整资料,对运维工作开展造成巨大障碍。配置项管理数据库即CMDB,经过识别、控制、维护,检验企业IT资源,从而高效控制与管理不停改变IT基础架构与IT服务,并为其它流程,比如事故管理、问题管理、变更管理、公布管理等流程提供准确配置信息。伴随IT技术进步与发展,企业IT环境越来越复杂。数量庞大、品种繁多IT设备极难被有效管理,更不用说管理以这些IT设备为基础各种IT服务。同时,企业IT环境在不停改变,怎样评定某个设备或服务发生事故或变更所造成影响,以及怎样为其它流程提供IT资源当前准确配置信息都是企业面临重大挑战。CMDB正是为了处理以下这些问题而诞生。信息整合怎样将众多IT设备、IT服务、甚至使用它们部门与人员整合在一个完整库中?这么整合信息将使有效与高效管理IT设备与服务成为可能。可自动发觉各种主机、网络设备、应用。同时支持全网发觉、指定子网、指定配置项三种发觉方式。关系映射怎样将硬件、软件以及IT服务之间物理和逻辑关系映射可视化?使得IT人员能够看到其相互之间依赖关系,并确定该IT组件对客户带来潜在影响。若IT人员能够实时看到其对企业或客户业务影响,将大大有利于提升IT服务水平。展示IT资源、部门、人员之间关联关系,实现关联关系定义与维护。CMDB不但仅存放IT资源属性与关联关系,还自动关联IT资源与其发生过事故、问题、变更、公布。流程支持怎样为其它IT运维流程提供准确IT设备、IT服务配置信息(包含当前设备或服务发生过事故、问题、变更、公布等信息)对服务台、事故管理、问题管理、变更管理、公布管理来说,准确配置信息将极大提升流程运作效率。在服务台、事故、问题、变更、公布流程中,均能够快速查看当前流程包括到IT资源全方面、准确信息。软件库与硬件库怎样确保应用到IT环境软件与硬件均是经过授权与测试?这是确保IT环境质量与提供稳定IT服务前提条件。经过支持DSL(DefinitiveSoftwareLibrary,最终软件库)与DHS(DefinitiveHardwareStore,最终硬件库),确保在公布管理中使用软件与硬件均是经过授权与测试。CMDB是IT运维一个关键,不过因为每个企业对CMDB要求都会有些差异,所以CMDB灵活性很主要。********企业机房配置项即使不比电信或者互联网应用服务商,但因为其具备远比电信、互联网应用复杂性,在分析、采集CMDB资料时,将面临更多挑战。研发********运维平台******数据中心机房运维,假如依然延续大量人工,规章制度、业务流程难以落地,执行时轻易偏离,大量基本数据无法采集或者采集困难,造成好运维理念最终依然无法落实。伴随信息时代连续发展,IT运维已经成为IT服务内涵中主要组成部分。面对越来越复杂业务,面对越来越多样化用户需求,不停扩展IT应用需要越来越合理模式来保障IT服务能灵活便捷、安全稳定地连续保障,这种模式中保障原因就是IT运维(其余原因是愈加优越IT架构等)。从早期几台服务器发展到庞大数据中心,单靠人工已经无法满足在技术、业务、管理等方面要求,那么标准化、自动化、架构优化、过程优化等降低IT服务成本原因越来越被人们所重视。其中,自动化最开始作为代替人工操作为出发点诉求被广泛研究和应用。IT运维从诞生发展至今,自动化作为其主要属性之一已经不但仅只是代替人工操作,更主要是深层探知和全局分析,关注是在当前条件下怎样实现性能与服务最优化,同时保障投资收益最大化。自动化对IT运维影响,已经不但仅是人与设备之间关系,已经发展到了面向客户服务驱动IT运维决议层面,IT运维团体组成,也从各级技术人员占大多数发展到业务人员甚至用户占大多数局面。所以,IT运维自动化是一组将静态设备结构转化为依照IT服务需求动态弹性响应策略,目标就是实现IT运维质量,降低成本。能够说自动化一定是IT运维最高层面主要属性之一,但不是全部。运维团体最低配置满足PDCA循环运维团体组成与职责分配是******数据中心机房运维是否能够达成预期目标一个保障,依照********企业组织结构与信息化建设现实状况,结合ISO/0标准,我们以一个完整PDCA循环作为建立团体组织组成依据,建立一个完整成体系运维队伍。以上图示表示了整个团体基本配置情况,每个步骤都负担对应职责不可或缺,在图中并未表示在机房运维过程中可能出现供给商与厂商人员,但一旦出现,也一样纳入团体管理规程中,并形成对应制度与评定考评体系。客服人员客服工作人员是与用户沟通主要渠道之一,需具备一定话术要求和基本技能。要保障7x二十四小时不间断服务质量,需要最少4名员工进行轮班工作,人员需求量相当较大。鉴于******数据中心机房现在运行需求,能够安排2名客服人员轮值,每日12小时,其余时间由驻点运维工程师提供客服服务。依照实际运行情况进行人员调整。运维工程师运维工程师是一线工作人员,包含驻点工程师和移开工程师,运维工程师是与用户交流零距离界面,沟通主要渠道之一,需具备一定话术要求和基本技能。接收工作任务单,登记处理过程与结果现场故障排除远程故障排除提出流程改进提议每日工作汇总提供技术知识与业务知识积淀帮助用户工作,提供技术支援运维工程师属于一线员工,在接人待物、沟通以及基本技术水准都需要达成一定要求。运维工程师在排除故障或者技术支援时候,必须严格按流程进行,对于无法处理问题,需要通知客服中心,加派或者另派技术教授帮助。******数据中心机房运维现在需要2-4名工程师轮班,这些人员可能由运维承接单位与外部协作单位共同组成。行为督查员行为督查员主要工作是检验流程符合度与运维最终效果,同时也起到一个工作过程监管作用,形成运维工作连续改进依据。检验工作流程执行情况,派发工作整改单实施客户满意度调查实施客户新需求调研工作检验情况汇总统计运维KPI指标,提供改进依据运维质量确保体系内部评审现在,行为督查员同时负担了劳动监察与客户反馈双重角色,作为PDCA循环中“检验”这一主要步骤,行为督查担负了为运维工作连续改进提供量化依据职责。行为督查员需要1-2人,无需轮班。技术教授作为运维工作关键,技术教授将负担对整个运维技术、流程、规范制订与改进工作,同时,当一线人员碰到难以处理问题时,技术教授会从二线转为一线,为用户排除故障。制订与改进运维流程与规章制度帮助运维工程师处理技术难题研制新服务内容追踪问题及处理方案研发运维自动化产品研发运维配套软件维护配置数据库技术教授是一个团体,通常依照各自熟悉业务,分为多个技术教授。技术教授通常集中办公,按需提供技术支撑保障。技术教授是PDCA循环中计划制订者,也是改进实施者,承前启后,而且为工程师和用户提供专业技术支持,是整个团体灵魂。现在,在******数据中心机房运维教授团体中,需要机房环境、IT设备、数字网络、操作系统与数据库、软件研发方面教授,因为各能一人多项,所以教授人数约在3-5人左右不等。文档管理员文档管理员是为了确保运维工作受控,建立企业知识库,提升运维水平所必须配置。文档管理员首先是实现了纸质文档与电子文档归类方便于查询,另首先则是整理出知识形成知识库。搜集运维过程文件,分类归档搜集外来文件,分类归档电子档案历史版本管理维护运维知识库业务资料查询文档规范化管理******数据中心机房运维文档管理员需要1名专职或者兼职人员。管理人员为了团体管理与实际工作扩展,可能还需要增加一些人员配置,方便于工作开展。这些人员通常能够在前述角色中寻找人员兼任。运维团体总责任人,主要进行管理工作,调配人员运维管理人员,负责运维工作中日常管理,跟帮助配全等工作。其中运维团体总责任人可能会由运维承接单位人员兼任。自动化建设自动化建设依照(基础设施类、业务系统类、应用能力类)进行划分。提供自动告警提供短信、邮件和声光等伎俩通知监控人员。监控人员能够看到业务系统实时未处理告警数目、告警详情。并能够对告警进行故障预判,系统会统计下告警处理过程,对有通用性处理方案能够归入知识库。建立集中日志动态监控和分析系统,为了提升故障综合分析能力、经过关联关系分析故障原因;提供特定场景监控分析,比如重点商品下载性能、VIP用户使用性能分析等等;并快速响应新、甚至是自定义监控和分析需求。经过可视化界面从业务系统内部组成角度,即经过拓扑关系来对告警进行展示和处理,经过业务系统组成配置,能够把业务系统各个组成部分,各部分之间联络经过图形化界面方式直观展示。当其中某一点发生告警时,对应部分将会有颜色改变,监控人员能够看到该告警可能影响业务,从而有针对性加强监控。现有自动化软件及远景也伴随信息化管理********也迈向自动化设计及管理,现集团企业、各机关也在利用自动化工作及软件,如SEP、安全监控软件、包含辅助办公软件等。为完善更高运维要求,做到IT运维自动化监控和管理平台。总之,实现IT运维自动化管理是指经过将IT运维中日常、大量重复性工作自动化,把过去手工执行转为自动化操作。自动化是IT运维工作升华,IT运维自动化不单纯是一个维护过程,更是一个管理提升过程,是IT运维最高层次,也是未来发展趋势。运维工具介绍NagiosNagios是一款开源无偿网络监视工具,能有效监控Windows、Linux和Unix主机状态,交换机、路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常邮件或短信通知。Nagios能够监控功效有:监控网络服务(SMTP、POP3、HTTP、NNTP、PING等);监控主机资源(处理器负荷、磁盘利用率等);简单地插件设计使得用户能够方便地扩展自己服务检测方法;并行服务检验机制;具备定义网络分层结构能力,用"parent"主机定义来表示网络主机间关系,这种关系可被用来发觉和明晰主机宕机或不可达状态;当服务或主机问题产生与处理时将告警发送给联络人(经过EMail、短信、用户定义方式);能够定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;自动日志滚动功效;能够支持并实现对主机冗余监控;可选WEB界面用于查看当前网络状态、通知和故障历史、日志文件等。PUPPETpuppet是一个Linux、Unix、windows平台集中配置管理系统,使用自有puppet描述语言,可管理配置文件、用户、cron任务、软件包、系统服务等。puppet把这些系统实体称之为资源,puppet设计目标是简化对这些资源管理以及妥善处理资源间依赖关系。puppet采取C/S星状结构,全部客户端和一个或几个服务器交互。每个客户端周期(默认半个小时)向服务器发送请求,取得其最新配置信息,确保和该配置信息同时。每个puppet客户端每半小时(能够设置)连接一次服务器端,下载最新配置文件,而且严格按照配置文件来配置服务器。配置完成以后,puppet客户端能够反馈给服务器端一个消息。假如犯错,也会给服务器端反馈一个消息。开发puppet是为了让系统管理员能够相互交流和共享成熟工具,防止重复劳动.经过以下两个特征来实现这一目标:提供一个简练不过强大框架来完成系统管理任务系统管理任务能够描述成puppet语言,所以能够相互分享代码,就像分享其余语言代码一样,比如python,c等所以,作为系统管理员你能够更加快完成工作,因为你能够用puppet来处理全部管理细节,甚至你还能够下载其余管理员puppet代码来让你工作完成更加快。CACTICacti是经过snmpget来获取数据,使用RRDTool绘画图形,而且你完全能够不需要了解RRDTool复杂参数。它提供了非常强大数据和用户管理功效,能够指定每一个用户能查看树状结构、host以及任何一张图,还能够与LDAP结合进行用户验证,同时也能自己增加模板,功效非常强大完善。界面友好。Cacti发展是基于让RRDTool使用者更方便使用该软件,除了基本SNMP流量跟系统资讯监控外,Cacti也可外挂Scripts及加上Templates来作出各式各样监控图。Cacti是用php语言实现一个软件,它主要功效是用snmp服务获取数据,然后用rrdtool储存和更新数据,当用户需要查看数据时候用rrdtool生成图表展现给用户。所以,snmp和rrdtool是cacti关键。snmp关系着数据搜集,rrdtool关系着数据存放和图表生成。Mysql配合PHP程序存放一些变量数据并对变量数据进行调用,如:主机名、主机ip、snmp团体名、端口号、模板信息等变量。自主软件工具研发现在,地研院正在与外部相关企业共同组成研发队伍,在充分了解市场已经有产品(如北塔、摩卡等)优势与缺点后,结合中石油与********本身实际情况,研发符合需要运维软件工具。现在正在研发和计划研发内容包含:工单系统,跟踪任务流程,实现在线知识采集、客户反馈,由此来固化操作流程、搜集运维数据基本配置项数据库系统,整理机房运维资源与对象,是运维工作基础中基础知识库系统,是业务知识与技术流程固化主要伎俩运维数据统计分析系统中央运维门户平台,集成各个不一样厂商运维或者监控系统数据,并采取门户方式集中展现现在我们已经在开展一些工作,如工单创建与跟踪,以逐步规范运维管理工作。运维实施运维规范流程我们遵照ISO/0标准规范提出十大流程,其中一线员工通常提供巡检、排障、技术支持等工作,是客户可见部分,而客服中心、教授、督查、后勤等角色,与客户也会有接触,但其关键工作是不可见。鉴于流程与表单是运维服务工作关键组成部分,在此我们以数个规范流程作为示例,表述在ITILv3和ISO/0指导思想下,怎样结合******数据中心机房运维实际需求,开发满足本身需要操作流程。服务分工序号服务模块内容描述提供方1机房环境依照标准规范,对机房环境进行检验,是否防潮防尘地研院,外协2机房卫生对机房卫生检验,是否四处是垃圾地研院,外协3UPS检验UPS情况地研院,外协,厂商4综合布线、网络检验各电缆线、光纤、网线等是否有损坏地研院,外协5机房供电制冷设施确保机房供电与制冷正常工作地研院,外协,厂商6设备上架与更换操作设备上架实施,被放置位置列柜、机架等地研院,外协7系统安装依照需求对设备操作系统规范安装地研院,外协应用系统依照需求对系统应用系统维护地研院,外协8现场软件升级业务维护方负责对旧版本、低版本软件升级操作地研院,外协,厂商9现场故障诊疗对出现问题进行分析、诊疗地研院,外协10电话远程支撑对驻点工作人员不能处理问题进行给予帮助地研院,外协技术支撑对疑难问题技术分析、探讨、总结处理问题外协,厂家11问题管理系统负责对日常故障统计与分析、总结地研院,外协12门禁管理负责对外来人员登记管理地研院,外协设备上架流程设备上架流程,首先需求方提起需求申请,发起工单到运维服务台,填写需求申请表,相关领导审核经过后,流程提交到运维部门,到上架实施,上架验证,日常维护等工作。流程说明需求方提出新增服务器需求。服务台派发工单,判断上架设备类型,让申请需求都填写申请表,并将申请资源发给资产管理员。物理服务器由资产管理员指定特定物理位置组织人员服务器上架(安装电源线、网线)维护人员按需求安装操作系统。把回单回执给需求方。资产管理员更新资产列表。由需求方自于安装应用软件。软件运行正常后,由运维中心按需求进行安全检验。试运行正常,投入生产,纳入IT监控、业务监控、投入维护工作。设备申请如服务器、网络上架需要申请人或者申请部门填写设备申请表,得到签字同意后方可按照流程继续进行。资源核查本阶段主要包含以下工作需求确认与资源检验。申请部门填写《设备资源申请表》,设备申请部门各表单所填写客户信息、设备信息必须一致,经部门经理审核后,与《设备上架申请书》一并提交至运维部门备档管理,并对需求进行归口管理。资料检验包含被分配资源信息进行查对,详情见《设备验收上架表》,如检验合格后,需要签字确认,运维部分需存档。上架实施资源申请到位后,则执行上架实施工作,上架实施前,由维护人员发起上架实施工单至服务台,服务台进行统计,纳入到工单系统。对信息事件进行备档处理。上架后,需要维护人员依照上架信息表进行补充工单信息,包含上架位置、电源接口,所占U数据,上架时间,上架人员,维护人员等,而且需要需求方与设备方签字确认签字上架完成后,即完结工单。上架信息归档维护中心依照已经上架设备信息进行整理归档,上架信息表是对服务器已经上架后确实认信息表,确保上架设备信息完备性,便于运维资产信息管理。纳入日常运维从设备上架之日起,确定了责任部门及运维部分,就按照运维流程开始日常维护工作,包含日常巡检、故障处理、优化建设、作业计划等。过程表单********设备上架申请书项目名称联络人联络电话所属部门工作邮箱申请时间上架时间注:如特殊需求内容为加急或暂时(测试),则上架时间和申请时间间隔不得超出要求时间。需求事项1.加急上架(不超出要求时限);2.暂时上架(需给出下架时间);3.其余需求原因及操作内容:设备内容设备型号大小(U数)服务器配置数量资产编码IP需求核定功耗产权归属上架进机房人员姓名电话身份证号码姓名电话身份证号码姓名电话身份证号码姓名电话身份证号码申请部门经理签字:运维部经理意见:备注:

服务器类型请假依照客户自己服务器类型在对应位置做以下标识

设备需求与《******数据中心机房设备申请表》内容相对应******数据中心机房设备申请表项目名称使用周期编号申请事由申请内容项目类型□中大型申请环境□正式环境□小型□测试环境设备类型设备型号配置需求申请数量设备编号其余物资申请人(署名):审核人意见:申请人单位:审核人(署名):年月日年月日备注为确保******数据中心机房运维规范化、流程化、高效化、及上线应用稳定,控制项目应用上线质量,提升成功公布率,运维需依据项目新上线(流程控制)进行上线。注:

1)“中大型”项目必须填写此表,并以纸张形式走申请流程,书面签字确认,而且交由档案部备纸质管理;

2)“小型”项目填写此表后,以电子邮件系统审批确认,生成电子备档;设备验收上架表时间厂商防伪查询是□否□设备型号是□否□合格证有□无□序列号╱服务号设备类型服务器交换机╱路由器防火墙存放设备□□□□设备配置参数设备包装清单设备上架计划书上架时间上架人员上架位置设备开机测试质保周期工程监理(签字)乙方承包商(签字)甲方人员(签字)备注上架信息表服务器名称确认检验上架服务器名称,型号,占用空间大小,额定功率。上架服务器在试验台上电,是否能正常开机;能正常开机进入第三步,不能正常开机返厂。机房工作人员检验机柜空余空间,空余PDU插座。符合机柜安全用电、空余空间、空余PDU插座情况下,上架服务器在此机柜。安装服务器完成后,在此服务器贴标签(使用单位,维护单位,安装日期),电源线贴标签(使用了哪个PDU插座)。特殊情况:机柜空间满,不能安装服务器。机柜空间有余量,但用电超出机柜安全用电,提议不在此机柜安装。机柜空间有余量,PDU插座用完,服务器用电在机柜安全用电范围内,机房工作人员向管理中心申请,能否在增加一个PDU,能增加此服务器安装在此,不能增加PDU,此服务器不能安装在此。返回到第三步。机房工作人员统计此次上架情况在表单中。型号功率验电情况所在机房所在列柜所在U数所占U数PDU插座服务器标签使用单位维护单位安装日期安装人员确认人员云桌面管理机关个人(调入、借用、项目合作)等相关人员需要新增云终端时,由所在人员综合科在《协同办公系统》填写《********企业桌面云终端申请表》,并由所在部门主管领导审批后,报送机关事务办及信息管理部,由机关事务办发放物理终端设备,信息管理部负责数据配置,运维组负责云桌面实施。云桌面申请流程由业务需求者发起云桌面申请需求使用者填写业务申请单模版经过OA系统提交至部门文书审核部门文书审核经过后流程转至部门领导审批。部门领导审批经过后流程转至信息管理部。信息管理部审批经过后,流程转至运维组及机关事务办运维实施制作虚拟桌面,同时机关事务办发放设备及制卡最终申请者进行确认与验证云资源申请书云桌面申请表要包含使用信息,及申请业务介绍及所需资源信息等。申请中依照员工编号时行唯一索引。申请信息需由申请人部门领导、信息管理部签字审核经过后,运维组需保留申请表进行备档云桌面撤消流程若工作人员已申请桌面云资源因工作调动、离职或其它原因,致使资源闲置,需提出桌面资源注销申请。并由所在部门填写《机关办公用户资源回收表》,由注销所在存放资源并系统回收,并走云资源撒销流程。部门提交离职人员名单,提交至部门领导审批。审批通知后流程转至信息管理部审批信息管理部审批审核经过后,流程转至机关事务办,机关事务办时行对变更人员确认是否偿还设备各IC卡机关事务办确认后,由运维组进行实施,注销虚拟桌面云桌面统一安装云桌面安装由运维部指定运维工程师负责安装与事件协调云桌面安装应该依照云桌面数据配置规范进行默认需求安装。如申请者有特殊需求,填写申请表,备注清楚需求安装需求信息云桌面分配要符合安全基线要求,确保数据安全、信息安全、系统安全、帐户安全安装完成后,运维工程师需要填写工单信息,包含详细步骤及安装说明等信息工单完成后更新日常知识库内容云桌面信息归档云桌面回单完成后,由指定运维中心档案角色负责云桌面信息管理,便于信息检索与更新,包含日常版本信息、变更等。云资源分配时间业务介绍IP地址使用人责任人维护人变更信息备注操作系统规范流程为防止救火式运维服务,运维工作面对以后膨胀业务量,须要有一套完善操作系统安装规范,从而降低人力、物力、财力成本,达成高性能运维服务,另外建立此安装规范,对于知识继承达成了极好效果。web服务器操作系统安装前需做详细调研,方便运维部门完善地规划和安装服务器。服务器安装操作系统前需调研规划以下方面:服务器物理硬件配置规划需要进行安装操作系统以及版本是否集成虚拟化,以及虚拟化主机相关硬件资源分配登陆用户和口令管理所需业务以及相关应用网络、域名以及IP规划计算机域规划备注相关联业务、虚拟机、服务器之间网络联络以及链路数据服务器硬件配置调研以及操作系统、虚拟机规划安装基于windows操作系统,服务器磁盘最少分成三个区,用途分别为系统分区、安装软件分区、数据备份分区,每个分区格式大小依照服务器空间而定,类型必须为NTFS。Linux自定义分区(注意:一定把以下分区安装到第一块默认盘上面)分区:分区名大小说明Swap内存x2虚拟磁盘空间/2G根目录/usr5G安装应用程序/var5G暂时文件存放,日志等/boot100M系统引导文件/home余下全部存放用户数据依照运维要求,各目录要按照统一目录规范进行配置与管理。对于windows操作系统安全策略与帐号策略都应按照********服务器运维规范《********服务运维安全基线》进行配置。对于Linux安全策略,如root登录漏洞等,必须修改配置文件进行保护。日常行为准则必须注意环境卫生。禁止在机房内吃食物,抽烟,随地吐痰;对于意外或工作过程中弄污机房地板和其余物品,必须及时采取方法清理洁净,保持机房无尘洁净环境定时检验工作区操作终端运行情况定时对办公区和桌椅进行清洁和消毒机房用具要各归其位,不能随意乱放注意检验机房防晒,防水,防潮,维持机房温度在摄氏20~24度机房工作人员应有义务安全和小心使用机房任何设备,仪器等物品,在使用完成后应将物品偿还并存放于原处,不应随意摆放对于使用过程中损坏,遗失物品应汇报登记,并对责任人追究相关责任未经上级领导同意,不允许向他人外借或提供机房设备和物品运维制度监控值班制度********中心机房运维建立7x二十四小时监控值班制度机房监控人员在值班时间内要坚守岗位,集中精力。要求监控值班人员对告警系统实时监控,并对设备和各业务系统使用情况进行巡视和测试,机房监控人员若发觉异常情况,应立刻处理,并及时上报。异常情况包含但不限于:日常巡检异常(如设备指示灯异常、资源占用超出阀值、平台业务系统宕机、业务链接失效等)、IT监控系统告警、机房环境恶化、硬件故障、大量客户投诉等监控人员必须恪守业务和障碍处理流程,准确快速地处理业务和障碍,不得以任何理由推诿、拖延、隐瞒故障监控人员必须及时、准确、完整地填写值班日志和交接班统计等各种要求统计文档监控人员不得随意关闭设备告警,不得人为切断和私人占用业务电话,不得做与工作无关事情监控人员必须按时完成作业计划和上级交办其它事项监控人员必须严格恪守通信纪律、安全保密制度和其它各项规章制度交接班制度交接班必须按时,接班人未到岗,交班人不得离岗交接班内容:统合布线、障碍情况,备品备件、文件资料、工具仪表,相关通知,上级指示以及需由接班人继续处理问题交接方法:交接班人员应将交接内容逐项检验核实并确认无误,在值班交接班日志上签字后,交班人方可离岗。并由维护主管定时审核交接内容交接班过程中发生障碍或事故,应暂停交接,以交班人员为主,接班人帮助共同处理,直至障碍或事故消除,或处理告一段落后再继续交接因漏交或错交产生问题,由交班人员负担责任;因漏接或错接而产生问题,由接班人负担责任;交接双方均未发觉问题,由双方负担责任日常维护制度设备要清洁洁净,防尘防潮系统软件维护要求禁止在服务器上安装和运行与工作无关软件软件维护须由专员负责,并严格做好日常维护工作软件版本更新(升级)、软件修改必须恪守先审批后执行标准检验当前运行系统是否为最新版本,及时更新操作系统需要补丁程序包采取防病毒方法并定时查毒、杀毒数据维护要求 禁止随意改动数据,假如要修改数据,必须要取得主管人员同意,而且修改前要做好数据备份,修改后要做好修改统计,并在一周内确认设备运行正常维护人员应及时清理磁盘文件和数据库空间,删除过时或无用数据和文件,应随时确保磁盘空闲空间≥20%和数据库空间充分系统备份要求各业务维护平台负责制订备份计划,备份时间分为日备份、周备份、月备份备份数据选择磁盘、磁带或光盘存放,同时采取在线和离线存放方式。介质需用标签注明备份内容、备份时间在做系统割接、版本升级、参数变更之前,必须进行相关系统、数据配置备份,方便在变更失败时及时恢复每季度检验一次备份数据有效性系统安全要求平台设备口令要求专员负责,对于root用户密码,要求最少每个月修改一次,并建档备查平台要求具备容灾系统,每六个月或重大通信保障任务之前进行倒换测试每季度对平台进行安全扫描和巡检维护人员要求维护人员要求专员专岗,不得兼做与本职员作无关其它事务维护人员要求技术过硬,全方面深入掌握所维护系统系统架构和技术细节全部维护人员,必须7X二十四小时手机开机,若手机故障或较长时间(2小时以上)进入无信号区,应及时通知上级主管人员联络方式,维护人员对于未接听工作电话,必须在20分钟内回拨节假日工作制度在主要法定假日前一周内须开展安全巡检巡检内容包含但不限于:桌面、综合布线、机房环境、硬件设施、操作系统、数据库、磁盘阵列、应用软件、配置数据、数据备份等节假日前准备工作值班表:在节假日前5个工作日,服务台、维护中心应制订值班安排表,并报送各相关部门,节假日值班表,包含客服中心值班表和维保厂商值班表安全检验:在主要节假日或重大生产保障前3-5天,进行一次设备现场安全检验,如发觉隐患应及时排除自检:在重大节假日应提前3天内提前做好自检工作,以确保稳定性、可用性在节假日期间监控人员和当班维护工程师要严格执行各项维护流程,严守值班纪律,尽职尽责,维护工程师在当班期间必须留守在当地,以确保能第一时间赶至现场全部维护人员在任何时间、任何地点都必须确保二十四小时通讯通畅,若通讯工具存在障碍(无信号、无电等),必须要第一时间通知上级主管有效联络方式巡检制度生产维护单位每季度对系统巡检一次,在重大生产保障期和主要节假日前,也应对系统进行巡检,巡检后一周内出具巡检汇报巡检内容机器运行环境:散热性能、清洁度、电源硬件设备完好情况:指示灯有没有告警、系统有没有硬件报错硬件资源占用情况:CPU、内存、磁盘空间、I/0、网络带宽等软件资源占用情况:表空间、文件系统、卷组、交换区、license等使用情况系统日志、root用户邮件、hacmp.out、smit.log、bootlog等主要日志分析数据备份情况:系统自动备份任务是否正常运行网络状态:网卡、IP、DNS、路由表、hosts等检验磁盘阵列是否运行正常,有没有损坏盘系统补丁及安全软件更新各应用模块检验每季度对平台系统进行一次安全扫描,由业务维护平台对发觉安全隐患及时整改。对于平台系统存在主要问题,建立教授会诊制度,教授组员由信息管理部组织相关部门及支撑厂家维护部门等组成技术教授负责作业计划制订,作业计划制订后,报上级单位审核,审核经过后,由相关维护工程师严格执行,维护作业计划分为日作业计划、周作业计划、月作业计划、季度和六个月作业计划维护作业计划内容设备厂商维护手册提议预定义作业计划系统告警、资源占用状态观察性能指标观察和统计用户权限、安全日志审核,系统密码定时修改业务平台备份统计机房设备现场检验:温度、湿度、指示灯状态各系统页面连接测试,业务可用性测试各项作业计划必须按时完成,并认真检验分析作业计划结果,并留下作业计划原始数据备查运维管理方法规章制度严格按照ISO/0规范制订并进行自我完善机房运维团体必须遵照依照我们管理方法,遵照已定制度,大到巡检周期,小到水杯放置位置,都属于规章制度范围。经过制度来确保流程实施符合性,为连续改进提供保障。以下示例我们预计要实施一些规章制度,制度也属于文档范围,将在实际运维过程中不停演进和增补。故障处理要求各故障处理应遵照“先本端后对端,先全网后当地,先重点后通常,先抢通业务后处理故障”标准,可采取紧急代替,迂回路由,第三方转接等方法,在最短时间内恢复服务故障等级一级故障:指重大故障一个或一个以上点发生故障,造成服务大部分中止与某一外部(如主要接口)交互中止,造成业务流程不能正常运行因平台技术原因,引发客户群体性投诉事件主要资料或系统数据被损毁,比如,用户数据、计费数据、配置数据丢失或紊乱二级故障:指严重故障设备宕机或硬件损坏,造成系统单路运行设备资源占用超出阀值,对系统稳定运行产生实质性威胁系统业务拥塞,造成性能指标大幅下降三级故障:指通常故障不影响业务,不对系统正常运行产生实质性威胁故障用户级故障四级故障:指未定级故障未造成业务中止,且客户不能感知性能下滑故障处理时限重大故障(一级故障):处理时限60分钟严重故障(二级故障):处理时限4小时通常故障(三级故障):处理时限1天未定级(四级故障):处理时限48小时应急预案管理要求必须建立切实可行应急预案,有效预防、及时控制和最大程度消除突发事件带来危害和影响,应急预案总体标准是“先抢通,后修复”,在管辖内服务出现故障后,由信息管理部决定是否开启应急预案预案主要内容包含应急预案触发条件、组织机构、职责分工、通报流程、系统拓扑结构、设备详细列表、应急处理步骤、备品备件管理、软件备份情况、外部灾害应急方法等,若平台系统做了重大调整,应急预案也应随之做出调整,以确保应急预案有效性应急预案应每年依照上年度执行情况进行修订,在遇重大系统变更或重大平台事件发生后必须及时修订,以适应新系统环境每年或重大生产保障任务前进行一次应急预案演练,演练结束后进行总结分析,对存在问题及时整改应急演练包括到设备倒换测试等操作,可能会影响用户业务,须报送********信息管理部门同意档案及原始统计管理要求设备厂商进行工程移交时,需要提供详细、完整技术档案和资料系统设计文件各设备软硬件配置,各软件介质系统数据配置账号、口令表,包含账号用途、属性、权限等系统测试文档作业计划维护手册应急预案系统上线以来,重大故障汇报和原始统计各设备机历卡备品备件及剩下工程物资其它遗留事宜备忘录各业务平台日常维护工作,必须有详细工作日志值班日志(包含巡视统计及交接班统计簿)机历本、设备及部件更换统计,障碍统计维护作业计划设备日常检验和定时检修统计业务开通原始统计版本升级统计数据修改统计由档案管理员对所运维平台技术档案和资料,确保资料安全、完整、准确、有效备品备件管理制度应按照实际需要,配置足够备品备件,并指定专员负责备品备件管理备品备件管理要求确保备品备件版本、功效正常建立备品备件台账,要求帐、物相符备品备件取用方便,在发生故障时能快速更换定时检验备品备件可用性,软件版本要求和现网运行一致,不一致时及时通知厂家升级备品备件种类和数量考虑原因足以确保平台稳定运行,确保取用及时快捷备品备件价格昂贵程度备品备件易损性资源管理制度运维团体应负责网络平台资源管理,建立资源申请、分配、使用和回收机制,资源主要包含:IP地址、数据设备端口、传输端口、综合布线资源、硬件设备资源、及各设备所属机架等,并详细唯一资产编号所需大网资源,如大网业务接入、网络出口、IP地址等,由上级部门分配或协调处理分配资源,不得私自挪作他用,若需变更,由资源使用部门提出需求,经上级主管部门审批经过后方可变更设备资产管理,标准上由运维承接单位责任人为直接责任人需要新购设备参考物资采购业务流程执行,需要维修或升级现有设备按照固定资产维修业务流程执行每年应依照实际需要,单列维修资金,专用于设备损坏件维修或更换信息安全管理制度主机、网络设备、软硬件安全维护要求禁止在服务器上安装和运行与工作无关软件主机应采取防病毒、入侵检测等安全方法实时监控进程和系统资源占用情况,发觉异常及时处理不允许任何人在服务器,交换设备等关键设备上进行与工作范围无关任何操作值班人员对保密信息严加看管,不得遗失、私自传输未经许可,任何人不得携入软件、光盘使用,U盘、预防病毒传染。使用维护电脑或监控终端玩游戏,观看与工作无关电子书籍,看VCD,登陆暴力、黄色非法网站禁止使用维护电脑私自下载、安装非法软件、维护电脑必须安全杀毒软件并定时更新、杀毒,未经允计不得将电脑接入生产网络中接入生产网络需要事先向维护中心申请,经相关领导或安全管理员同意方可接入,接入需按网络管理指定IP及网络端口接入禁止员工私自将与工作无关文件信息以光盘、活动硬盘局域网及其它任何形式拷贝至硬盘及在生产网络中传输账号及口令安全管理要求各种帐号及口令,要按级别分配权限,严格管理,口令定时更改,超级账号口令每个月修改一次系统割接上线后,运维团体收回各系统超级账号,为便于厂家和外协单位工作,另行为设备厂商分配专用账号,并在工程验收移交后,全部收回账号厂商对系统进行重大操作时,需要使用超级账号时必须以邮件或书面方式向电信提起申请,操作完成后运维团体更改密码,操作过程中信息管理部全程监督;标准上,不允许厂商经过远程接入方式进行操作,若确需远程操作,需上级主管领导书面确认(紧急状态下应口头申请、事后补文字确认说明)方可开启适当权限暂时帐号,事后及时关闭帐号、修改暂时密码并登记最少每个月审阅一次账号操作日志统计在员工调动或离职等工作职能发生改变时,及时收回其拥有系统账号,并更改密码数据保密要求全部维护人员,要严格保密系统数据和用户数据系统管理员要定时备份操作日志统计,并进行交叉审核资料,文档,数据等必须有效组织,整理和归档立案禁止任何人员将机房内资料,文档,数据,配置参数等信息私自以任何形式提供给其它无关人员或向外随意传输对于牵涉到网络安全,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论