版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、云计算运维技术概述技术创新,变革未来运维背景运维角色运维工作内容故障处理数据中心管理面临的挑战服务水平难以保证IT问题故障定位复杂缺乏资源统一管理能力缺乏混合云管理能力业务管理粗放业务上线时间长达30天以上无法精确匹配客户的组织和流程模型管理成本高70%的数据中心采用了3种以上的管理工具管理费用巨大,减缓了数据中心的建设资源利用不合理资源利用率低,存在能耗的浪费无法及时识别扩容需求运维工作的重要性云计算是IT产业的第三次变革,带来了降本增效、弹性扩展等技术层面的价值,所有用户的应用都运行在云计算的基础之上,运维工作保证了用户的业务有稳定的运行环境。数据中心运维的目标合规性可用性经济性服务性数据
2、中心架构 计算资源 网络资源 存储资源应用域服务域云通信管理部署服务应用服务数据库服务数据分析&AI服务安全服务网络服务存储服务计算服务资源池通信资源池应用资源池关系型数据库安全资源池对象存储资源池网络资源池块存储资源池物理资源池虚拟资源池基础设施 安全资源云运维架构 计算资源 网络资源 存储资源运维层服务域云通信管理部署服务应用服务数据库服务数据分析&AI服务安全服务网络服务存储服务计算服务资源池通信资源池应用资源池关系型数据库安全资源池对象存储资源池网络资源池块存储资源池物理资源池虚拟资源池基础设施 安全资源OperationCenter辅助工具云运维管理Portal系统资源管理容量管理租
3、户资源管理仪表管理告警管理运维安全性能管理敏捷报表FusionCareELKG-rayFusionNetDoctoreSightUpdateTool运维对象运维对象子对象描述基础设施服务器设备例如 RH2288存储设备例如 V3系列存储网络设备例如 交换机、防火墙资源池计算资源池计算资源池提供虚拟化计算资源,如:KVM、FusionCompute、VMware,存储资源池存储资源池提供虚拟化存储资源,如:FusionStorage Block、SAN网络资源池Neutron+、SDN云服务计算、存储、网络、安全等例如ECS、EVS、VPC、HWAF、RDS等云服务实例例如 CES实例、CCS实
4、例等应用OS、DB、中间件等运维背景运维角色运维工作内容故障处理运维场景 - 角色及其职责监控人员故障发现日常监控优化分析历史性能/报表分析维护人员故障定界日常维护快速、及时发现问题对问题进行初步定界完成定界的问题派发工单跟踪闭环问题处理过程工作目标关注内容工单派发关注内容故障处理问题快速处理定期了解数据中心健康情况,进行优化分析并给出建议工作目标资产管理风险告警风险预测系统管理员关注内容做为超级管理员,配置系统管理系统工作目标报表分析系统配置安全管理员关注内容做为安全管理员,用户管理日志审计工作目标License管理用户管理日志分析运维场景 - 日常运维运维场景 - 故障处理 运维场景 -
5、实时监控对于重要的设备或服务器,可以采用实时监控的方式以获取更及时的性能信息使用人员也可以导出性能数据以进一步分析运维场景 - 报表查看运维场景 - 日志审计运维背景运维角色日常运维工作内容故障处理前期准备工作账户信息账户管理环境信息维护资料准备系统/网络信息维护人力矩阵健康检查远程环境维护备件盘点前期准备工作账户信息账户管理环境信息维护资料准备系统/网络信息维护人力矩阵健康检查远程环境维护备件盘点运维工作内容 (1) - 运维工具部署运维工具包括:第三方工具,如:Putty、WinSCP、TeamView等华为自研工具,如:FusionCare、ManageOne等运维工作内容 (2) -
6、系统升级系统升级可分为设计阶段和实施阶段。设计阶段内容包括:升级需求分析、制定升级方案(信息收集、Checklist编写、升级时长评估、升级方式确定、升级影响和风险评估、详细升级步骤、升级验证方案、升级失败应急方案、升级失败回退方案)、升级方案评审。实施阶段内容包括:验证信息、准备升级包、Checklist验证、备份、创建升级工程、执行升级任务、检查升级进度、提交升级工程、清理升级数据、保存升级报告、检查升级效果、更新局点档案信息运维工作内容 (3) - 设备巡检设备类型检查项目频率服务器设备状态指示灯是否正常两小时1、定期进行Fusion Server Tools检查健康,了解系统的运行状况
7、;2、对检查出的结果进行分析,对不合格项进行处理;同时对于所列出指标要特别关注;3、导出检查结果,进行综合对比分析,了解指标走势,提前识别风险;4、推荐和邮件服务器系统对接,将检查结果自动邮件发送。每月存储设备状态指示灯是否正常两小时通过导出“运行数据与系统日志”检查存储设备的健康度。1、征得客户同意后在业务量低的时候操作;2、参照健康检查工具的说明文档,完成存储巡检,查看工具生成的结果,输出巡检报告;3、提交报告给客户,向客户提出改进建议;4、检查数据存储的使用情况,了解当前存储资源使用情况以及各个LUN的使用情况;5、检查业务运行状态,如RAID、LUN、资源池等状态。每月网络设备状态指示
8、灯是否正常并且呈绿色两小时检查网路设备的运行情况,链路状态。1、征得客户同意后在业务量低的时候操作;2、参照完成网络巡检,并输出巡检报告;3、提交报告给客户,向客户提出改进建议。每月UPS设备UPS、市电倒换测试是否成功每月负载不大于85%两小时查看运行日志是否有异常两小时输出、输入电压是否正常两小时配电设备电压范围是否正常两小时配电柜状态是否正常两小时环境监控采样数据是否正常两小时空调设备机房温度湿度是否正常两小时查看运行日志是否有异常两小时备件1. 备件库房环境,符合储存环境要求;2. 备件数量,满足设备维护的需要。每月运维工作内容 (4) - 云平台巡检巡检工具检查项目频率FusionC
9、are日常巡检(设置为定期自动执行,并在CNA或管理节点有变动时更新巡检列表)(选择收集时间段为业务低峰进行收集)每天深度巡检(手工执行,并在CNA或管理节点有变动时更新巡检列表)(选择收集时间段为业务低峰进行收集)每周升级前检查(手工执行,可对VM的热迁移前提条件等进行检查)事件触发信息收集(选择收集时间段为业务低峰进行收集)每季度ManageOneService Center健康检查(手工执行)每月ManageOneOperation Center健康检查(手工执行)每月ManageOneOperation Center告警检查(手工执行)每天FusionSphere OpenStack
10、CPS WebUI日常巡检(设置为定期自动执行,并在CNA或管理节点有变动时更新巡检列表)每周eSight检查eSight相关进程的运行状态,及时发现并解决异常,保障eSight系统高效运行。如果eSight进程出现异常,与该进程相关的网管服务将无法正常运行。每周灾备检查灾备平台运行状态每周运维工作内容 (5) - 日志和告警处理告警等级:一级问题:(Critical)立即处理二级问题:(Warning)立即处理三级问题:(Major)三天内完成四级问题:(Information)七天内完成并清理日志收集:VRM、CNAFusionSphere OpenStackManageOneeSight
11、运维工作内容 (6) - 性能与容量类别检查项目频率注释网络需求访问ManageOne每年复查建议最低带宽100M,网络延时在100ms内ManageOne与下层组件及其各组件内部通讯每年复查建议最低带宽100M,网络延时在100ms内eSight服务端与客户端带宽每年复查eSight服务器与客户端间带宽最低2M,建议10M以上性能基线处理器使用率实时监控,使用OC检查告警信息适用于Guest OS、Host OS、Dom0/DomU处理器队列实时监控,使用OC检查告警信息适用于Guest OS、Host OS、Dom0/DomU磁盘I/O实时监控,使用OC检查告警信息适用于Guest OS、
12、Host OS、Dom0/DomU内存实时监控,使用OC检查告警信息适用于Guest OS、Host OS、Dom0/DomU换页空间实时监控,使用OC检查告警信息适用于Guest OS、Host OS、Dom0/DomU网络实时监控,使用OC检查告警信息适用于Guest OS、Host OS、Dom0/DomU运维工作内容 (6) - 性能与容量类别检查项目频率注释容量基线处理器每月检查适用于Host OS与云平台各组件,对超出阈值的需要考虑进行扩容内存每月检查适用于Host OS与云平台各组件,对超出阈值的需要考虑进行扩容磁盘每月检查适用于Host OS与云平台各组件,对超出阈值的需要考虑
13、进行扩容网络每月检查适用于Host OS与云平台各组件,对超出阈值的需要考虑进行扩容License云计算产品License有效期每月检查License异常或失效后要及时处理,否则影响系统的稳定运行网络产品License有效期每月检查存储产品License有效期每月检查运维工作内容 (7) - 可用性管理数据备份灾备演练Guest虚拟机重启管理节点主备倒换生命周期检查应急事故处理故障演练运维工作内容 (8) - 安全管理检查项目具体描述频率注释账户角色权限定义必须使用最下权限使用原则,严禁对非管理账户赋予管理员权限每季度每季度对当前环境账户列表进行审视,清除离职或失效账户,重新审核账户权限是否符合最小权限原则密码安全设置检查所有密码策略设置每季度原则上不允许修改默认密码策略密码存储与修改原则首次登陆系统需要修改密码;定时修改密码90天禁止使用最近4次使用的密码作为新密码云平台接入安全严禁将云平台管理网段地址映射至公网,避免受到攻击每季度共享账户检查严禁使用共享账户,各管理员需创建个人账户,以便后续审计每季度
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 25042-2024膜结构用玻璃纤维膜材料
- 2024年度区块链技术应用与合作协议2篇
- 除法二年级教学课件教学
- 基于二零二四年度的智能家居产品销售合同3篇
- 533古典概型课件高一上学期数学人教B版
- 历史遗址保护区历史文化研究合同2024年
- 二零二四年度版权质押合同:金融机构与版权持有者之间的版权质押协议2篇
- 销售员离职后协议书
- 农村民房买卖合同范本
- 幼儿教学教学课件
- 大洋环流重点
- 国际航班保障流程
- 英文版肺功能检查课件(PPT 50页)
- 《有机合成》说播课课件(全国高中化学优质课大赛获奖案例)
- 高中地理经纬网PPT通用课件
- 城市景观生态
- 五年级英语上册第六单元(新版pep)完美版(课堂PPT)
- 2022年修理厂改革实施方案范文
- 败血症PPT优质课件
- 铁路建设项目工程质量管理办法
- 【课件】第六单元第十二节外国影视音乐课件-2021-2022学年高中音乐人音版(2019)必修音乐鉴赏
评论
0/150
提交评论