运维自动化操作管理平台解决方案(V1.1)_第1页
运维自动化操作管理平台解决方案(V1.1)_第2页
运维自动化操作管理平台解决方案(V1.1)_第3页
运维自动化操作管理平台解决方案(V1.1)_第4页
运维自动化操作管理平台解决方案(V1.1)_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运维自动化操作管理平台

解决方案

2014年3月31日2023最新整理收集do

something目录项目背景系统目标建设原则系统架构主要功能实施规范风险应对运维现状中国邮政储蓄银行依托邮政网络优势,按照公司治理架构和商业银行管理要求,不断丰富业务品种,不断拓宽营销渠道,不断完善服务功能,为广大群众提供更全面、更便捷的基础金融服务,成为一家资本充足、内控严密、营运安全、功能齐全、竞争力强的现代银行。

随着银行业务的迅猛发展,系统数量迅速增加,业务系统复杂多样,各个业务系统间关联关系复杂,运维压力越来越大。中国邮政储蓄银行运维系统随着业务系统的不断发展,也在不断地优化升级,在系统升级应用发布等方面已经逐渐形成了一套完整的流程。为了更好的适应业务发展,提高运维效率,实现运维自动化,建设一套独立运行、高度自动化的运维系统是运维管理发展的必然趋势。运维面临的挑战

由于中国邮政储蓄银行运维管理的难度和复杂度,运维管理面临着以下挑战:系统环境复杂庞大业务系统繁多人为手工操作风险高问题故障定位效率不高运维面临的挑战(一)系统环境复杂庞大:多种操作系统,如:hp-unix、linux、windows、AIX等。多种主机设备,如:应用服务器、数据库服务器、管理服务器、前置服务器等;运维面临的挑战(二)业务系统繁多:系统关联关系复杂,业务处理环节众多,业务关联性强。例如,中国邮政储蓄银行以储蓄逻辑集中系统和储蓄统版2.0系统为核心,连接着会计处理平台系统、中间业务系统、国际业务系统、汇兑业务系统、代理保险系统等多个外围业务系统;运维面临的挑战(三)人为手工操作风险高:在版本发布、巡检、配置管理、变更管理、联合排障等过程中多是手工操作执行,操作过程中缺乏透明度,标准化程度不高,应用发布时间长,误操作风险较大。运维面临的挑战(四)问题故障定位效率不高:在应用发布过程中,由于操作过程的复杂性和人为原因,容易发生误操作,却不能及时发现。问题出现后重现操作过程困难,不能快速准确地定位问题根源,最终影响业务系统的正常运行。目前应用发布流程目前邮储银行运维系统升级应用发布使用95580运维故障管理系统,其基本流程如下:(1)需求确认单(需求变更单)和升级申请单由相关领导签署后,版本管理员上传应用系统升级包到95580运维故障管理系统;(2)运维中心管理人员对95580运维故障管理系统中应用系统升级包审核批复后,下发到各省中心维护人员;(3)各省中心系统维护人员从95580下载升级包,按步骤手工操作发布应用程序;(4)项目组开发人员核查升级操作情况,各省中心维护人员记录升级报告单,提交相关领导。目录项目背景系统目标建设原则系统架构主要功能实施规范风险应对项目目标提高运维效率降低误操作导致的风险系统、应用和交易巡检的可视化规范化标准化应用发布流程实现发布应用及巡检的自动化项目目标项目目标-自动化运维管理自动化操作平台需要实现应用发布和巡检的自动化改变传统的运维模式中手工应用发布的流程,在系统中实现应用发布及巡检的自动化管理流程,建立运维自动化操作平台;减少应用发布过程中人为操作步骤,降低人工操作风险;减轻运维人员负担,提升工作效率,降低运维成本。例如:目前逻辑集中系统每日日终前都须手动检查各节点文件系统使用率,对于使用率过高的节点需要运维人员手动清理日志。该平台可以实现自动化巡检,可以灵活定制巡检任务,自动清理日志并生成巡检报告。项目目标-规范化

运维自动化操作在纵向上涉及应用系统和底层技术细节,在横向上涉及各级角色及组织。该体系的成功不仅依赖于平台自身的实施,还在于各管理部门、各管理人员的协同,并高效的进行推进,只有这样才能建设安全、高效、便捷的应用自动化系统。因此,在相关的开发中心、测试中心、运维中心各层面建立统一的规范,具体规范包含如下:应用发布管理规范应用发布操作规范发布脚本规范发布参数配置项目目标-可视化运维管理系统根据巡检内容,按照巡检模板生成巡检报告,便于各级管理者进行查看。巡检内容系统类:CPU、IO、内存、文件系统等数据库类:表空间利用率、日志检查中间件类:Tuxdeo、Weblogic等应用服务:应用交易、应用服务巡检目标减少管理员直接系统登录巡检脚本统一管理发布系统故障快速诊断推进巡检的标准化和规范化巡检周期、频率灵活定制项目目标-低风险运维管理自动化操作目的是降低由手工操作带来的潜在风险,减少人为因素带来的影响传统的的运维管理采用手工操作,在版本发布、巡检、配置管理、变更管理、联合排障等过程中多是手工操作执行,操作过程中缺乏透明度,标准化程度不高,误操作风险较大建立透明的、高标准、高规范的自动化运维管理系统,降低由于手工操作带来的风险自动对各个业务系统进行巡检,及时发现并解决问题,降低由于其他故障问题带来的影响项目目标-高效率邮储银行业务系统繁多,工作内容涉及比较多,需要各管理部门、各管理人员的协同共同推进传统的的运维管理模式在各职能部门的协调和各级管理人员的调度上不灵活,在突发情况下无法快速的解决问题运维自动化操作制定不同的角色,不同的角色根据权限的不同而担任不同的工作目录项目背景系统目标主要功能实施规范风险应对建设原则系统架构建设原则规范性易操作性可扩展性安全性稳定性建设原则建设原则-稳定性从外部来说,充分考虑邮政储蓄银行现有各系统间的关联关系和相互影响,设计阶段,尽量减少现有系统的改造;运行阶段,既不对其它业务系统的正常运行产生大的影响,又要保证自动化运维系统的正常运行;从内部分析,运维自动化系统应有充分的规范的异常处理机制,保证系统在出现错误,甚至严重错误时,没有人为因素的干预或较少干预下,仍能恢复正常运行状态。建设原则-安全性信息安全:针对业务系统、子系统及节点等对象,用户根据不同的角色分配不同的操作权限,保证各业务系统的安全。例如:不同用户登录系统会显示不同的操作界面。此外,对于某些重要的操作需要特定的角色授权;密钥安全:运维自动化平台与各业务系统间数据的传输有安全认证的机制。对于大数据量传输,可采用对称加密算法(如3DES),以提高数据加解密的速度;对于小数据,采用非对称加密(如RSA),提高数据安全性。此外,支持公私钥对对双方身份的认证机制。兼容多种加解密算法等。建设原则-可扩展性对于目前邮储银行日益复杂的各种业务系统,具备增加或减少业务系统、子系统或单个节点等功能;实现系统内不同角色及权限的增删改查,从横向和纵向上满足对业务系统的操作权限。例如:角色A对应的是业务系统B内某个子系统C,那么,角色A对子系统C内所有节点具有操作权限,而对业务系统B内其它子系统没有操作权限;灵活定制各种巡检目标及发布应用;支持与目前邮储银行各种主流操作系统平台对接,例如:hp-unix、AIX、linux等;建设原则-易操作性系统的设计应满足操作简单,便于理解和良好的用户体验。例如:适当减少和屏蔽目前版本升级上线过程中复杂的命令操作方式,实现升级流程配置化。用户与系统应有良好的交互性,每步的运行结果都应有实时的展现,并且方便事后查询。建设原则-规范性平台系统设计过程中应有尽可能多的定制规范性动作,例如:命令、脚本及内部程序的规范;运维自动化管理平台与外部系统的交互尽量使用通用的接口规范。对于系统使用到的命令、脚本程序及各类文件数据要满足定制的规范要求;目录项目背景系统目标建设原则主要功能实施规范风险应对系统架构系统逻辑架构系统逻辑架构1.WEB接入层:用户与运维自动化系统交互的门户,展示和操作的统一web入口。包括应用发布和巡检两大部分功能;此外,还包括两大支撑功能模块角色用户权限管理和应用系统管理。(1).应用发布:主要子功能及流程有发布配置、发布审核、发布执行、发布监控和发布结果评估等

(2).巡检:主要子功能有巡检检索、巡检配置、手工巡检及巡检报告等

(3).角色用户权限管理:主要包括角色管理、用户管理和权限管理等。完成角色、用户和权限的增删改查等操作(4).应用系统管理:主要包括应用系统管理、子系统管理和节点管理等。节点是应用系统管理的最小单元,一般与系统中服务器一一对应系统逻辑架构2.发布流程层:又名调度层,应用发布和巡检流程管控模块,是后台任务的核心,实现流程的配置,信息采集,权限管理维护,协助与步骤建模,环境建模,作业配置及资源管理等

(1)任务轮询调度:后台实时不间断轮询自动任务的到来,等任务到来后,自动调度对应的任务执行模块进行处理3.自动操作层:又名执行层,主要完成各种任务执行实施的功能;此外,在任务执行过程中,需要底层通讯和安全两大功能模块的支撑(1).任务执行:包括发布应用、巡检、权限、角色、应用系统等任务的执行

(2).安全认证:本系统与应用系统之间的数据的加解密、签验章等

(3).通讯协议:平台部署

运维自动化操作管理平台系统分两套环境部署,准生产环境和生产环境。上线前,首先在准生产环境进行应用发布及巡检的自动化测试,然后再导入生产环境,大大降低了上线操作的风险性,提高了运行效率。并且,生产环境和准生产环境支持逆向操作。

平台准生产环境

开发、测试中心进行自动化发布的测试平台生产环境运维中心实现对生产的应用系统的自动化发布平台部署目录项目背景系统目标建设原则系统架构实施规范风险应对主要功能功能概要功能概要功能功能简介应用发布实现应用发布过程的一系列流程。主要包含:发布模板、发布请求、发布过程、发布作业、发布步骤、环境、组件、作业、作业包、脚本、参数化巡检包含:对象化、巡检模板、巡检作业、巡检目标、系统级巡检、应用级巡检、定制巡检用户权限用户权限取决于登录系统的角色,包含:平台管理员、系统管理员、网络管理员、安全管理员、报表管理员、应用管理员等主要功能介绍-自动巡检功能点功能内容巡检对象包含:脚本对象化、命令行对象化、配置文件对象化巡检模板对同类检查规则的统一抽象、实现巡检规则的重用性巡检作业包含:巡检模板、目标服务器、巡检周期及频率巡检报告包含:界面查询方式、结果处理具体巡检内容系统类:CPU、IO、内存、文件系统等数据库类:表空间利用率、日志检查中间件类:tuxedo、weblogic等应用类:应用交易量、应用服务主要功能介绍-自动巡检执行设计自动巡检-设计巡检作业巡检时间巡检模板巡检指标巡检规则1nnn1n巡检目标n自动巡检-设计巡检指标巡检规则巡检模板自动巡检-作业定义自动巡检-模板自动巡检-服务器自动巡检-时间表巡检报告分类巡检系统巡检应用巡检常规巡检临时巡检AIX巡检……常规巡检临时巡检交易巡检CEMB……数据库NEXCH重保巡检定期执行手工执行深度巡检一日多次中间件巡检报告工作流程-巡检平台准生产环境平台生产环境制定巡检方案二线管理员应用DB中间件….变更审核变更评审审核结果管理员通过审核报告,确定系统的运行状态工作流程-巡检目标:减少管理员直接系统登录巡检脚本统一管理发布系统故障快速诊断推进巡检的标准化和规范化巡检周期、频率灵活定制权限控制二线管理员:根据SUMP权限,对相应的服务器OS用户下具有设计、执行的权限一线工程师:根据专业类别进行区分,具有相应专业类别下的临时巡检执行权限主要功能介绍-应用发布主要功能介绍-应用发布功能点功能内容应用发布模板将常用的发布流程固化下来,实现发布过程的重用应用发布请求一系列的发布流程的定义,包含:包含应用、环境、权限控制发布过程一组发布步骤的组合,实现发布流程的模块化发布步骤一个原子的发布执行步骤,包含:组件、目标服务器、权限控制、BSA作业绑定组件实现发布流程和目标服务器的解耦、绑定多个目标服务器实现负载均衡场景的并发发布应用发布-模型应用系统的分层架构发布面对不同环境多种形态的发布PortalDBAgileTeamDevQASIT,Perf,UAT…Stage512134135121341351213413DevDevDevQAProdDevOps1、建立应用组件模型,引入组件模型适用系统架构分层2、建立应用环境模型,将环境模型与组件模型组合,将应用与环境的关联性解耦3、建立应用发布模板,通过发布步骤原子化、规范化,实现发布步骤的复用,达到发布请求的重用应用发布-设计应用发布-执行应用上线设定原子化步骤脚本应用发布-执行发布步骤应用发布-变更控制表变化**T-4T运行态

两个环境:平台生产环境、平台准生产环境三个阶段:模板构建、投产准备、投产发布四个角色:开发中心-配置管理员、测试经理、应用管理员、变更经理需项目组支持应用发布-对比*执行权限体系WEB平台用户:IAM认证接入操作权限从SUMP同步数据行级权限控制(应用系统)C/S设计用户:设定用户的可操作范围通过作业限制用户可执行的操作针对读取类作业,设定只读用户机器人帐号:系统间的交互通过机器人帐号完成WEB平台用户:角色:菜单、功能按钮的访问控制用户:应用系统粒度的数据行级授权C/S设计客户:建立应用系统为路径的权限控制单元应用+角色=>角色的映射关系权限策略包AGENT:以ROOT用户执行OS用户参数化功能/数据权限矩阵功能角色生产环境开发/测试环境

应用团队系统团队操作团队开发中心测试中心

团队主管应用变更经理应用管理员平台应用管理员团队主管系统

管理员数据库

管理员中间件

管理员系统变更经理团队主管应用一线系统一线应用发布人员平台

管理员测试人员平台

管理员

系统安全管理

用户

菜单

角色

功能

权限

系统公共管理

应用系统同步

服务器同步

SUMP同步

应用环境/查看

○●

○●○●

新增/修改/删除

BRPM同步

BSA同步

日志查看●○○●●○○○○●○○○●○●

应用发布

发布流程定义

模板/请求定义

作业/脚本定义

组件绑定

参数定义

资源导出/导入

发布请求实施查看●○○●

授权

开发/测试环境无需授权排期/参数录入

执行(暂停、继续)

进度展现●●

日常巡检

巡检模板配置

○○○

巡检作业创建

作业发布

变更经理:平台管理员?作业执行

○○

执行结果查看●○○●●○○○○●○○

工具箱

脚本开发

○○○

工具定义

○○○

工具发布

变更经理:平台管理员?工具执行

○○○

○○

执行结果查看●○○●●○○○○●○○

功能/数据权限矩阵角色权限工具箱巡检应用发布一线工程师设计执行专业方向专业方向技术专家设计专业方向专业方向执行专业方向专业方向二线管理员设计SUMP权限SUMP权限应用系统执行SUMP权限SUMP权限应用系统开发中心设计应用系统执行应用系统质量中心设计应用系统执行应用系统在平台对相应的人员赋予所属应用系统权限根据同步的SUMP权限具有所属服务器的OS用户权限按应用、操作系统、中间件、数据库等方向划分外部接口接口系统功能接口方式SUMP权限同步日终批量配置管理服务器信息日终批量ITSM应用同步日终批量变更审批联机变更结果日终批量监控系统维护期设定联机批量工具调用联机IAM统一登录联机、批量动态口令授权联机外部接口运维自动化操作平台SUMP配置管理IAM动态口令ITSM监控系统权限同步服务器信息统一登录授权变更同步审批结果更新监控维护期工具调用系统自身监控JEDA:-CPU使用率-内存使用率-IO使用率-Weblogic的虚拟内存、线程、JDBC连接数-MessageQueue-监控日志文件BRPM:-CPU使用率-内存使用率-IO使用率-Tomcat的虚拟内存、线程、JDBC连接数-监控日志文件数据库:-Oracle日志文件-Server状态-表空间数据文件-索引空间数据文件-监控会话数-Listener是否存在BSA:-CPU使用率-内存使用率-IO使用率-文件系统空间-监控日志文件目录项目背景项目目标建设原则系统架构主要功能实施规范风险应对实施方案(一)目前,随着业务系统的升级,中国邮政储蓄银行运维整体流程管理也在不断完善。针对目前邮政储蓄银行运维的实际情况,提出如下两种实施方案,供各位领导和运维管理人员参考:方案1:95580和MAOP系统同时上传升级包流程:应用发布管理人员上传升级包到95580,并同时上传升级包到MAOP系统;实施方案(二)运维中心审查人员在MAOP系统对升级包进行审查批复,无需在95580系统审查批复升级包;MAOP根据升级操作手册中配置的升级节点、升级时间、操作步骤等信息,在指定时间发布升级包,自动完成升级;实施方案(三)MAOP根据审核手册自动完成升级审核并生成升级报告;优点:95580与MAOP系统无直接交互缺点:须手工上传升级包到MAOP实施方案(四)方案2:自动化运维系统与95580系统对接流程:应用发布管理人员上传升级包到95580系统;(与目前流程一致)运维中心审查人员对升级包进行审核批复;(与目前流程一致)运维自动化操作平台MAOP自动同步经过审核的升级包;MAOP根据升级操作手册中配置的升级节点、升级时间、操作步骤等信息,在指定时间发布升级包,自动完成升级;(与方案一一致)实施方案(五)MAOP根据审核手册自动完成升级审核并生成升级报告;(与方案一一致)优点:不需要审核批复流程缺点:95580系统需提供对接接口应用发布构建规范自动化平台在纵向上涉及应用系统和底层技术细节,在横向上涉及各级角色及组织。该体系的成功不仅依赖于平台自身的实施,还在于各管理部门、各管理人员的协同,并高效的进行的推进,只有这样才能建设安全、高效、便捷的应用自动化系统。因此,在相关的开发中心、测试中心、运维中心在自动化平台各层面建立统一的规范,具体概述如下:《应用发布管理规范》在邮储现有发布管理模式上进行梳理,在不影响现有的管理模式下,规范应用发布从开发中心制定到质量中心测试到运维中心的上线的各个环节的流程。主要包括如下几个层次:发布角色梳理规范:统一梳理发布过程的各角色,明确各角色责任。发布过程管理规范:对发布过程进行管控,开发、测试、导出、导入、投产等过程。《应用发布操作规范》对自动化平台的配置过程,如配置自动化发布环境模型、配置发布作业、配置发布请求等过程建立统一规范,在统一的标准和规范上进行构建,主要包括如下几个层次:应用发布环境规范:对发布环境的各项内容进行规范,如应用、组件、环境、服务器的构建配置规范;发布作业构建规范:对发布作业构建的各项环境进行规范,如发布脚本、发布参数、发布作业构建配置规范;发布请求构建规范:对发布请求的配置过程进行规范,包括发布请求、发布步骤的定义、命名、组件选择的方式等。

发布脚本构建规范

应用自动发布的调度的底层是发布作业,而发布作业的重点是落在发布脚本上,发布脚本的构建对应用发布的成功有着重要的作用,应通过参数化实现发布脚本和服务器的松耦合,因此应对发布脚本的构建做统一规范,开发中心、质量中心、运维中心在整个构建及运维过程中采用统一的标准进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论