基础IT运维培训_第1页
基础IT运维培训_第2页
基础IT运维培训_第3页
基础IT运维培训_第4页
基础IT运维培训_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运维基础知识培训讨论:你认为什么是运维?运维的目标是什么?运维工作都包含哪些?什么运维?运维是指运行维护的简称,是指对网络、服务器、应用等进行维护、监控和管理,以确保它们能够稳定、高效地运行的一系列活动。运维的定义本质上是对网络、服务器各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态。顾名思义就是运行维护,运维工程师就是要做好生产系统的稳定运行维护工作,但稳定运行需要运维工程师们具备各方面的能力,因此个人无法完成全部维护工作,从而形成了各类运维工程师的分工协作。比如应用运维、系统运维、网络运维等。运维的目标运维工作的性质是保障用户的系统安全稳定运行,既要保证用户业务有持续运行的能力,做到7*24小时不间断运行,还要避免被黑客入侵攻击,造成数据资料丢失泄露,保证用户业务的数据安全。运维的日常工作1.监控:运维人员需要实时监控网络、服务器、应用等软硬件的运行状态,及时发现和解决潜在的问题,防止问题扩大,保证业务系统的稳定性和可靠性。2.网络管理:确保网络连通性,管理网络设备和带宽。3.日常维护:包括定期对操作系统、数据库、网络设备等进行补丁更新和安全加固。4.备份与恢复:定期对重要数据进行备份,确保数据安全。在发生故障时,能够迅速恢复数据和系统运行。5.资源优化:监控和分析系统资源使用情况,通过对系统、应用进行优化,提高其性能和稳定性。6.故障排查与修复:当系统或应用发生故障时,能够迅速定位并解决问题。7.安全防护:采取安全措施,包括设置防火墙、安装安全补丁、监测非法访问等,防止黑客攻击和病毒传播等安全事件的发生。8.日志分析:通过对系统、应用日志的分析,了解系统、应用的运行状态,及时发现和解决问题。9.文档与知识分享:维护系统配置和操作文档,以便团队成员共享知识和最佳实践。10.项目与变更管理:与开发团队合作,配合完成项目部署、BUG修复等工作,并管理系统变更。运维工作分类介绍系统运维:负责机房、网络、基础服务的建设;负责资产管理,服务器选型、交付和维修。应用运维:负责线上服务的变更、服务状态监控、服务容灾和数据备份等工作,对服务进行例行排查、故障应急处理等工作。数据库运维:负责数据存储方案设计、数据库表设计、索引设计和SQL优化,对数据库进行变更、监控、备份、高可用设计等工作。运维研发:负责通用的运维平台设计和研发工作,如:资产管理、监控系统、运维平台、数据权限管理系统等。提供各种API供运维或研发人员使用,封装更高层的自动化运维系统。安全运维:负责网络、系统和业务等方面的安全加固工作,进行常规的安全扫描、渗透测试,进行安全工具和系统研发以及安全事件应急处理。以IDC数据中心为例介绍相关运维工作IDC是数据中心是指InternetDataCenter(互联网数据中心)的缩写。IDC数据中心是专门用于存储、管理和处理大规模数据的设施。它提供了稳定可靠的网络、服务器和存储设备,以支持各种互联网服务和应用的运行。IDC数据中心通常由大型机房、服务器、网络设备、存储设备、备用电源、冷却设备等组成。它们具备高速、高可靠的网络连接,以保证数据的传输和交换。IDC数据中心还采取了多重的安全措施,包括防火墙、入侵检测系统、数据加密等,以保护存储在其中的数据的安全性。IDC数据中心提供的服务主要包括:服务器托管、网站空间租用、带宽批发、存储服务、云计算等业务。这使得很多企业、政府单位、教育机构等单位不用再去建设自己的机房,也无需聘请专门的技术人员去进行维护管理,这样以来便可以节省很大一部分的费用。数据中心运维工作内容1.硬件设备维护机房中的硬件设备包括服务器、交换机、路由器、防火墙、存储设备等,这些设备是机房运行的基础。机房运维人员需要定期对这些设备进行检查、维护和更新,确保其正常运行和高效工作。他们需要检查硬件设备的状态、温度、风扇运转情况等,防止硬件故障给机房带来不必要的损失。2.网络管理机房的网络是信息传输的关键环节,机房运维人员需要确保网络的稳定运行和高效传输。他们需要对网络设备进行配置和管理,实时监控网络的状态和流量,及时发现和解决网络故障,并制定网络安全策略,保护机房内部的信息安全。3.系统维护机房中运行着各种操作系统和应用软件,机房运维人员需要对这些系统进行维护和更新。他们需要定期进行系统巡检,及时安装软件补丁和更新,确保系统的安全性和稳定性。同时,他们需要备份系统数据,以便在系统故障或灾难发生时能够快速恢复。4.安全管理机房的信息安全是机房运维的重要任务之一。机房运维人员需要制定安全策略,包括访问控制、身份认证、数据备份和恢复等措施,保护机房内部的信息免受攻击和破坏。他们需要定期进行安全漏洞扫描和风险评估,及时修补漏洞,提高机房的安全性。什么是机房机房是指为确保计算机机房的关键设备和装置能安全稳定,可靠运行而设计配置的基础工程。计算机机房基础设施的建设不仅要为机房中的系统设备运营管理和数据信息安全提供保障环境,还要为工作人员创造健康适宜的工作环境。

通常是指在一个物理空间内实现对数据信息的集中处理、存储、传输、交换、管理,而计算机设备、服务器设备、网络设备、通讯设备、存储设备等通常认为是数据中心的关键设备,机房是提供这种关键设备运维的一种物理空间。机房管理机房管理牵涉面广,事务又多,是一项专业性强、“繁”、“杂”、“难”、“累”的工作,具有一定的不可预见性,且不同程度地存在技术难度。运维人员除了要掌握丰富的计算机软硬件知识和具有较强的动手能力外,还需要掌握一定的设备管理技巧,学习各种设备如配电系统、地线系统、空调、防火设备、UPS等的正确操作方法,从而杜绝因操作不当造成的人为事故。只有不断学习,总结经验,取长补短,才能做好机房管理工作。机房中涉及的设备及系统机房内涵盖了供电、照明、防雷、接地、UPS不间断电源、精密空调、环境监测、火灾报警、门禁、防盗、闭路监视、综合布线、系统集成等技术。总体来讲主要有五个部分组成:土建工程、电气工程、弱电工程、消防工程、空调工程等,每一个部分的组建又有具体的系统集成。机房包含的硬件设备有:动力设备:市电、UPS、蓄电池、发电机、高压配电屏、低压配电屏、通信电源;环境设备:精密空调、工业空调、通讯专用空调、中央空调、民用空调、新风机、除湿机、增湿机;整体环境:温度、湿度、漏水、火灾、粉尘、气体(甲烷、一氧化碳、二氧化碳);安防:视频图像、门禁系统、玻璃破碎、震动、红外;IT设备:服务器、交换机、路由器、防火墙。机房配电针对机房供电系统来说:常使用的交流电为380V和220V,直流电为48V;380V一般使用在机房专用空调,机柜供电均为220V交流或48V直流电,特殊情况除外。列头柜是针对数据中心机房能源末端而研发出来的一款产品,具备采集配电柜内各支路电能数据的功能,其主要运用于数据中心或工业企业数据机房,为网络服务器等重要设备分配电力,配电回路计量、保护、管理于计算机接地等服务。机房专用空调机房专用空调的定义:一种向机房提供空气循环、空气过滤、冷却、加热及湿度控制的单元式空气调节机。机房专用空调的三项基本功能:恒温、恒湿、洁净。UPS电源系统UPS是交流不间断电源系统(UninterruptiblePowerSystem)的简称,置于电网和设备之间,利用电池化学能作为后备能量,当市电中断等电网故障时,向用户重要设备不间断提供(交流)电能的一种能量转换装置。UPS电源系统的作用实现双路电源的不间断相互切换;隔离作用:将瞬间间断、谐波、电压波动、频率波动及电压噪声等电网干扰阻挡在负载之前;电压变换/稳压作用;频率变换/稳频作用;提供一定的后备时间。机柜介绍“U”在服务器领域是一种表示服务器外部尺寸的单位,是Unit的缩略语,详细尺寸由作为业界团体的美国电子工业协会(EIA)决定。其中最常见的就是1U。以厚度4.445cm为基本单位,1U就是4.445cm,2U则是1U的2倍为8.89cm。即1U尺寸为4.45*58*1550px(高*宽*深),而2U的宽和深不变,但高度增加一倍。也就是说,“1U的机架式服务器”,即外形满足EIA规格、厚度为4.445cm的产品。服务器介绍(TaiShan200服务器为例)TaiShan200服务器是基于华为Kunpeng920处理器开发的2U/4U双路机架服务器,面向互联网、分布式存储、云计算,大数据,企业业务等领域,具有高性能计算、大容量存储、低能耗、易管理、易部署等优点。TaiShan200服务器的主要组成部件动力环境监控系统的组成机房动力环境监控是指机房动力环境及图像集中监控管理,其监控对象主要是机房动力和环境设备(如:配电、UPS、空调、温湿度、漏水、门禁、安防、消防、防雷等)。监控对象:动力:UPS、市电电量、配电开关、蓄电池组、精密配电柜、ATS/STS、电源支路电流、PDU机柜电源、防雷器、发电机等;环境:空调、漏水、湿度、新风机、空气质量、光照度、粉尘含量、照明控制等;安防:视频监控、门禁管理、入侵检测、电子巡更、周界安全等;消防:烟雾探测、火灾报警、自动灭火系统、防排烟系统等;网络:网络设备、网络链路、服务器、操作系统、业务系统、数据库等监测;报警:支持告警分发管理、支持声光、邮件、短信、电话等多种报警通知方式。网络运维管理网络运维是指管理和维护计算机网络系统的过程。它涉及到监控、配置、故障排除和性能优化等任务,旨在确保网络系统的高可用性、稳定性和安全性。网络运维人员负责管理网络设备、服务器、路由器、交换机和防火墙等网络基础设施,以确保网络的正常运行。网络运维是管理和维护计算机网络系统的关键工作。网络运维人员负责监控网络设备、故障排除、配置和管理网络设备、优化网络性能以及确保网络安全。他们的工作对于保障网络系统的正常运行和提供可靠的网络服务至关重要。通过有效的网络运维,组织可以提高网络性能、减少故障时间,并增强网络系统的安全性。网络运维的职责和任务网络监控和故障排除:网络运维人员负责监控网络设备和系统,及时发现并解决网络故障。他们使用网络监控工具来检测网络性能、带宽利用率、流量分析和异常行为等。一旦发现故障,他们会迅速采取行动,修复问题并恢复网络服务。网络设备配置和管理:网络运维人员负责配置和管理网络设备,包括路由器、交换机、防火墙和服务器等。他们确保设备的正确设置和优化,以提供最佳性能和安全性。他们还负责管理IP地址分配、网络拓扑设计和网络安全策略等。网络性能优化:网络运维人员通过分析网络流量和性能数据,识别瓶颈和瓶颈原因,并采取相应的措施来提高网络性能。他们可能会优化网络配置、调整带宽分配、更新设备固件或升级硬件来改善网络性能。安全管理和漏洞修复:网络运维人员负责网络安全管理,包括防火墙配置、入侵检测和防范、漏洞扫描和修复等。他们定期更新和升级网络设备和软件,确保网络系统免受安全威胁。文档记录和报告:网络运维人员需要记录网络配置、故障排除过程、维护计划和策略等重要信息。他们还需要生成报告,汇总网络性能和安全状况,向相关部门和管理层提供准确的网络状态和建议。系统维护的工作要求系统维护是针对服务器维护的一个重要方面。它包括对服务器操作系统进行更新、升级和优化,以提高服务器的性能和稳定性。具体工作内容包括:定期对服务器操作系统进行安全补丁的安装和更新,以弥补已知漏洞和提高系统的安全性。对服务器操作系统进行性能优化,包括调整系统参数。清理系统垃吸文作和优化磁盘空间等,以提高服务器的性能和响应速度。对服务器操作系统进行定期备份,以防止数据丢失和系统故障,确保数据的安全性和可靠性。监控服务器操作系统的运行状态,及时发现和解决系统故障和异常情况,确保服务器的稳定运行。系统维护的工作内容系统升级,运维团队在维护系统稳定运行的同时,需主动收集系统关键补丁,软件补丁等信息,通过数据中心专家评审的前提下,对相关的系统进行升级服务,并在升级完成后配合应用方对系统进行测试,升级前后需要和应用方及时做好沟通确认工作,确保不会长沙兼容性导致的故障。操作系统稳定性,监控定时查看操作系统日志及IIS日志,查看CPU、内存占用率、排除故障。权限与文件管理,服务器应明确责任人及管理账号持有人,不应出现多人单账户,单人多账户,不利于在服务器出现问题后,对服务器进行操作维护,查找问题。定期检查磁盘空间进行磁盘文件排列的优化和错误扫描,并处理错误,安全地删除系统各路径下存放文件,无用文件、备份文件等,完全释放磁盘空间。维护系统注册表。定期备份操作系统用户数据、配置文件等重要数据。系统配置,优化系统配置,关闭无用服务和端口,以最适合系统运行方式,最小化安装等,维护系统配置文档。负责系统用户管理如增加,删除用户,重置用户密码,管理用户权限等,进行系统用户管理时,记录所有相关系统变更。对于新安装的服务器,运维团队应负责安装必要的应用软件:如远程监控工具,备份工具,防病毒软件等。什么是安全管理?这里说的安全管理是指网络安全管理,网络安全的基本原则和概念主要包括以下几个方面:机密性:确保数据和信息只能被授权的人或实体访问和查看,防止未经授权的访问和泄露。完整性:保护数据免受未经授权的修改、篡改或损坏,确保数据的完整性和准确性。可用性:确保网络和系统始终可用和稳定,防止服务中断、拒绝服务攻击等导致的系统不可用。身份认证:验证用户或实体的身份,确保只有合法的用户可以访问和使用系统资源。授权和访问控制:授予合法用户适当的权限和访问级别,限制和管理用户对系统资源的访问。审计和监控:记录、监控和审计系统的活动和事件,及时检测和响应安全事件,保障系统安全。强化和防御:采取各种技术和措施来加固系统和网络的安全性,包括使用防火墙、加密、漏洞修补等。教育和培训:通过教育和培训提高用户和管理员的安全意识和知识,防范社会工程学攻击和人为失误。响应和恢复:及时响应安全事件,采取措施限制损失,并恢复系统和数据的正常运行。综上所述,网络安全的基本原则和概念涵盖了保护数据机密性、完整性和可用性,确保身份认证和访问控制,进行安全审计和监控,加固系统和网络防御,提高用户和管理员的安全意识,并及时响应和恢复安全事件。安全管理的主要工作安全检测:包括核心路由配置、核心交换机网络设备配置合理性检测与分析,负载均衡与防火墙等安全设备的配置检测与分析等。安全检查:为了保证用户安全系统长期的工作,最大限度的降低系统的运行故障,延长设备的使用寿命,安全运维团队应定期对安全设备、业务系统进行健康检查服务,由被动服务变主动服务,通过健康检查服务排除故障隐患,降低故障率。安全整改加固:对操作系统和数据库系统进行安全配置加固,网路及安全设备安全加固。针对客户补丁管理提供的建议,帮助客户维护补丁管理系统和防病毒系统。安全运维:安全运维的本质,就是通过规范的流程,落实贯彻企业既定的安全政策方针,推行企业设计好的安全架构。比如进行防火墙的运维,本质上是维护企业的安全域规划,如果在运维中不按规章胡乱开策略的话,用防火墙进行安全域隔离的初衷就等于形同虚设。安全策略一旦放行,日后要收回来就很不容易,任何弱点都能成为黑客攻击的目标。系统维护:从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。安全巡检:定期安全巡检、阶段安全审计、出具巡检报告、提出安全整改建议、持续安全巡检。渗透测试:渗透测试是通过模拟黑客的攻击方法,来评估计算机网络系统安全的一种评估方法。这个过程包括对系统的任何弱点、技术缺陷或漏洞的主动分析,这个分析是从一个攻击者可能存在的位置来进行的,并且从这个位置有条件主动利用安全漏洞。漏洞扫描倾向于对目标系统进行安全漏洞扫描,及时发现并修补漏洞。应急响应:应急响应服务指当安全事件发生后,安全运维服务团队根据预案快速响应。应急响应预案应按照准备、检测、跟踪等一系列标准措施制定,保证网络安全无忧,预防危险发生。什么是等保和分保?在我们日常运维工作中经常提到等保和分保,那两者的全称是什么,有什么区别呢?等保:全称“信息安全等级保护”等保是指对国家秘密信息、法人和其他组织及公民的专有信息以及公开信息和储存、传输、处理这些信息的信息系统分等级实行安全保护,对信息系统中使用的安全产品按等级管理,对信息系统中发生的信息安全事件分等级响应、处置。分保:全称“涉密信息系统分级保护”分保是指涉密信息系统的建设使用单位根据分级保护管理办法和有关标准,对涉密信息系统分等级实施保护,各级保密工作部门根据涉密信息系统的保护等级实施监督管理,确保系统和信息安全。等保和分保的区别等级保护:是实施信息安全管理的一项法定制度,是针对非涉密网来说。等级保护坚持自主定级、自主保护的原则。分级保护:是国家信息安全等级保护的重要组成部分,是等级保护在涉密领域的具体体现,是针对涉密网来说。等保和分保管理归口不同等保管理归口公安部网络安全保卫局提出;公安部信息系统安全标准化技术委员会归口。分保管理归口国家保密局批准;国家保密局归口。等级保护分级根据等级保护相关管理文件,等级保护对象的安全保护等级分为以下五级:第一级(自主保护):等级保护对象受到破坏后,会对公民、法人和其他组织合法权益造成损害,但不损害国家安全、社会秩序和公共利益;第二级(指导保护):等级保护对象受到破坏后,会对公民、法人和其他组织的合法权益产生严重损害,或者对社会秩序和公共利益造成损害,但不损害国家安全;第三级(监督保护):等级保护对象受到破坏后,会对公民、法人和其他组织的合法权益产生特别严重损害,或者对社会秩序和公共利益造成严重损害,或者对国家安全造成损害;第四级(强制保护):等级保护对象受到破坏后,会对社会秩序和公共利益造成特别严重损害,或者对国家安全造成严重损害;第五级(专控保护):等级保护对象受到破坏后,会对国家安全造成特别严重损害。分级保护分级涉密信息系统按照所处理信息的最高密级,由低到高划分为秘密、机密和绝密三个等级:绝密级国家秘密是最重要的国家秘密,泄露会使国家安全和利益遭受特别严重的损害。机密级国家秘密是重要的国家秘密,泄露会使国家安全和利益遭受严重的损害。秘密级国家秘密是一般的国家秘密,泄露会使国家安全和利益遭受损害。分保与等保对应关系等级保护工作流程第一步:系统定级、备案;第二步:系统差距测评分析;第三步:安全建设整改;第四步:等级保护测评实施;第五步:等级保护监督检查。分级保护工作流程第一步:系统定级;第二步:方案设计;第三步:工程实施;第四步:系统测评;第五步:系统审批;第六步:日常管理;第七步:测评与检查;第八步:系统废止。等保和分保的测评频率等级保护测评频率第一级:两年至少进行一次等级测评;第二级:两年至少进行一次等级测评;第三级:一年至少进行一次等级测评;第四级:一年至少进行一次等级测评;第五级:根据特殊要求进行等级测评。分级保护测评频率秘密级:两年至少进行一次安全保密测评或安全保密检查;机密级:两年至少进行一次安全保密测评或安全保密检查;绝密级:每年至少进行一次安全保密测评或安全保密检查。等保和分保适用对象或领域等级保护重点保护对象是非涉密的涉及基础网络设施、信息系统以及数据资源对象。第一级:一般适用于乡镇所属信息系统、县级某些单位中不重要的信息系统。小型个体、私营企业中的信息系统。中小学中的信息系统。 第二级:一般适用于地市级以上国家机关、企业、事业单位内部一般的信息系统。例如小的局域网,非涉及秘密、敏感信息的办公系统等。第三级:一般适用于地市级以上国家机关、企业、事业单位内部重要的信息系统;重要领域、重要部门跨省、跨市或全国(省)联网运行信息系统;跨省或全国联网运行重要信息系统在省、地市分支系统;各部委官方网站;跨省(市)联接的信息网络;提供云计算平台的公司等。 第四级:一般适用于重要领域、重要部门

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论