民生银行自动化运维平台建设需求V1_第1页
民生银行自动化运维平台建设需求V1_第2页
民生银行自动化运维平台建设需求V1_第3页
民生银行自动化运维平台建设需求V1_第4页
民生银行自动化运维平台建设需求V1_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、民生自动化运维平台建设需求V1.1文档信息项目名称:项目经理:起草人:起草日期:复审人:复审日期:版本历史版本编号版本日期描述文件名 11.01.1保密Page 16 of 16目录1. 概述及需求 41.1. 项目背景 41.2. 项目目标 41.3. 项目需求服务器自动化 41.3.1. 跨平台支持要求 41.3.2. 配置信息发现和对比要求 51.3.3. 健康巡检要求 51.3.4. 应用软件部署要求 51.3.5. 权限控制要求 61.3.6. 脚本管理 61.3.7. 用户管理要求 61.3.8. Web操作门户及中文化 61.3.9. 报表 61.4. 项目需求网络自动化 71.

2、4.1. 设备配置管理 71.4.2. 设备配置检查 71.4.3. 设备配置变更 81.4.4. 安全操作审计 81.4.5. 报表 91.5. 项目需求【灾备调度自动化】 91.5.1. 多平台支持以及跨平台作业调度能力 91.5.2. 作业定义及调度功能 91.5.3. 作业流及依赖关系 101.5.4. 作业后续处理 101.5.5. 图形化监控界面及失败原因分析 101.5.6. 报表及审计功能 101.5.7. 高可靠性和高可用性 111.6. 项目需求【云计算】 111.6.1. 自服务门户 111.6.2. 服务管理 121.6.3. 配置管理数据库 151.6.4. 计算资源

3、池管理 151.6.5. 资源池容量管理 151.6.6. 资源池监控 161. 概述及需求1.1. 项目背景(一)我行服务器运维情况截止至 2009 年九月底,我行共有小型机48 台, 177 个分区;PC 服务器 294 台,刀片服务器92台;光纤存储交换机10 台;存储阵列共9 台,裸容量约为600T ,而服务器运维人员数量有限,且在运维过程中简单重复劳动过多,给运维工作造成极大压力。因此急需自动化工具帮助运维人员缓解工作压力,提高工作效率,从而对运维人员的工作结构进行有效调整。(二)运维工作存在的困难1. 传统运维带来大量繁琐、重复的工作,造成管理员大量低效劳动。2. 存在人为操作失误

4、隐患,且难以从根本上保障系统安全。3. 运维知识分散,缺乏集中管理,各系统运维工作过度依赖于管理员。4. 运维工作缺乏相关自动化工具的辅助,缺乏实现统一、规范、流程化的管理手段。(三)我行运维自动化工具的需求为解决以上困难,需要引进一套在行业中成熟的自动化运维解决方案。实现数据中心日常运维自动化、流程化、规范化和管理集约化,从而控制运维风险、提高运维效率、降低运维成本。并可以解决以下服务器运维需求:1. 配置信息自动采集,对我行拥有的服务器资产进行自动化的清查。2. 服务器自动化管理操作,包括操作系统自动化安装,补丁自动化管理,应用程序自动化分发。3. 服务器自动化日常巡检,运维工具自动反馈相

5、关服务器巡检信息。4. 服务器操作审计及相关合规检查的自动化。5. 和我行现有的工具平台有效结合,优化配置。6. 多样化的自动化脚本执行能力。7. 制作多维度的统计报表。1.2. 项目目标通过标准化和自动化的手段提高运维管理的一致性,减轻运维管理的手工工作负荷,并对关键应用的配置设定进行主动稽核和跟踪,从运维管理配置角度确保应用的整体可用性,提高运维人员的操作执行效率,降低操作任务执行时间,将人员手工误操作带来的风险降到最低。1.3. 项目需求服务器自动化1.3.1. 跨平台支持要求运维管理涉及多种系统和平台,自动化发布平台应实现跨平台的管理支持,实现异构环境的统一管理,需支持AIX、 HPU

6、x 、 Redhat Linux 、 Windows 等系统的主流版本,识别各系统的特征对象,采用通用性架构实现管理。1.3.2. 配置信息发现和对比要求系统对象的配置发现是后续配置操作系统化的基础,运维管理平台应能够对系统及应用对象各个层面的属性配置进行扫描和发现,并实现格式化、对象化的管理。运维操作变更成功后,需要对环境进行保护和控制,防止非授权的变更或误操作更改了系统及应用依赖的配置。1) 系统配置信息:直接解析操作系统及应用系统的配置文件,如hosts 、 security, 、 services 、group 、 fstab 、 ntp.conf 、 route 、 web.xml

7、、 init.ora 等等;对于应用配置文件,2) 应用配置信息:提供解析方法和机制,实现字段级配置项的解析,支持包括xml 、空格分隔、逗号分隔等主流格式的直接解析;对于通过应用命令获取的stdout 信息,可实现封装和格式化解析,能够针对输出信息的各种格式实现字段级配置项的解析。3) 对于不合规的对象,需能逐层展开显示特定巡检失败的细项,包括期望的设定值和当前扫描的实际设定值,从而获取对如何修正提供针对性的指导性信息。4) 当特定操作执行后,应有效的对系统设定和状态进行记录,并作为后续比较的基准,将其作为日常巡检的模板和基线。运维自动化平台应支持不基于脚本的配置基线创建,能够在需要时对特定

8、系统的特定范围(如目录、文件、配置范围等)进行全量或选择性子集的快照。5) 运维自动化平台应实现针对基线的多方位比对。例如对于文件对象,应包含文件内容(包括二进制文件)、大小、修改日期、用户、属组、权限等;对于关键配置文件,应定位具体字段级配置项内容等;从而实现完整、有效的比对稽核。6) 对于一组服务器中个别特殊的配置设定,可能与基线模板有差异,对于这种场景,需可设定例 外,使后续巡检时,不将该差异作为巡检异常。1.3.3. 健康巡检要求运维自动化平台应能够定期的对系统-应用环境进行健康检查,当发现关键配置与期望值不同时,及时报警甚至主动改写纠正。1) 检查关键系统服务状态,系统运行状态2)

9、检查操作系统信息:包括操作系统类型、IP 地址 /DNS 名称、网络设定、开放TCP 端口、文件系统、系统补丁、已安装软件包、用户/用户组、内核参数、守护进程/系统服务等。3) 健康巡检应能设定执行周期和时间,确保定期的触发运行。4) 健康巡检应支持异常报警,当巡检发现异常时,主动发出报警。报警应能够实现邮件发送;同时应支持trap 发送,从而实现与监控平台整合。5) 健康巡检结果可以导出为可读文件以供历史存档。1.3.4. 应用软件部署要求运维自动化平台需能实现应用软件的部署,包括Oracle 、 SQL Server 、 WebLogic 、 Tomcat 、WebSphere 、监控代理

10、、备份代理等等。1) 部署应保持强壮性,包括对系统包的校验更新,特定用户/ 组的创建,权限的调整等。2) 部署可充分定制化,包括实现安装后的个性化配置,如参数创建、环境数据导入等。3) 部署的过程应支持参数化,如在部署作业运行时给定变量等等。4) 部署需支持回滚。1.1.5. 权限控制要求支持细粒度的权限控制,提供细致的操作权限控制模型。能够对OS 及 OS 内细粒度层次(如用户、文件、系统对象)进行权限分割。提供集中的系统接入并实现指令级稽核(如通过自动化平台建立目标系统SSH 连接后,记录操作的指令)机制。1. 定时任务和自启动任务要求通过运维自动化平台统一对定时任务和自启动任务的管理,包

11、括查看,部署,修改,删除,支持不同用户实现不同的权限,支持查看任务运行状态,反馈任务是否执行成功。1.1.6. 脚本管理集中管理服务器脚本,排定脚本执行计划,批量执行脚本,收集脚本执行结果。关键系统配置参数的批量修改,如sysctl.conf,hosts,resolve,ifcfg-eth0,fstab,profile等,关键系统服务的统一启停和状态查看,如FTP、 NTP 、 NFS、 SSH 等。1.1.7. 用户管理要求通过运维自动化平台实现批量用户新增/删除/修改,批量密码修改,实现不同用户的权限修改,不同用户组的管理。1.1.8. Web 操作门户及中文化提供全中文的操作客户端,以及

12、基于web 的自动化门户,在操作过程中,尽量减少手工脚本编辑开发调试的工作量。1.1.9. 报表提供基于web ,可方便定制开发的商用报表引擎,同时内置资产,合规,作业,权限等内置报表。支持报表的定期运行及导出。1.4. 项目需求 网络自动化1.4.1. 设备配置管理配置备份,备份设备的运行或启动配置文件,要求支持定期、触发、手动三种方式。定期备份按照系统设定的备份计划进行;触发备份主要依靠系统监听来自设备的 SNMP TRAP 或 Syslog 的相关配置发生变更的信息后进行自动触发备份;手动备份即可通过手工执行系统提供的配置备份相关指令进行备份。对配置备份文件可设定保存期限,超过保存期限的

13、可实现自动定时清理。配置备份管理,要求提供对配置备份的检索,至少应提供设备地址、备份时间段等检索条件,应提供对配置备份文件的远程浏览,支持配置备份远程下载;应可对配置备份进行基准化设定,即可人为手动设定某一受信任的配置备份为其对应设备的基准备份。配置比对,要求可对任意的两配置文件进行内容比对,并应醒目标注差异部分。配置恢复,要求可基于基准备份对运行或启动配置文件进行远程配置恢复。接入层交换设备端口的日常配置管理,要求包括端口的开启/关闭操作,端口的边缘化配置,端口VLAN 划分,端口的802.1X 配置等,上述配置系统可根据不同设备厂商自动生成相应配置命令和配置回滚命令,允许手工输入配置命令进

14、行端口配置,能够保留所有针对端口执行的配置命令记录。1.4.2. 设备配置检查配置基线核查,应可根据用户定义的设备配置基准备份进行基线核查,系统在定时备份、触发备份时,应自动比对当前备份对与基准备份是否存在差异,对于存在差异的进行报警;应提供针对配置备份的手动基线核查机制,可以方便核查任一非基准备份与基准配置的内容差异,对于差异部分通过配置比对进行醒目标注,并提供 针对差异部分的修复接口。配置合规检查,根据规则检查配置是否符合一定的规范或要求,出现问题可自动告警;应支持合规检查规则的自定义,提供对合规检查规则的统一管理,合规检查规则应提供相应的修复建议或修复命令脚本;要求提供对合规检查结果的统

15、一管理,对不合规则要求的配置,可根据合规检查规则的修复建议提供快速修复接口。1.4.3. 设备配置变更配置变更模板,应可定义不同厂商不同设备种类的配置模板,系统可根据配置模板批量执行配置变更脚本,将以前手工执行的作业自动化。配置变更批量操作至少应支持两种模式,一种模式针对同类设备的批量配置操作,一种模式是针对同一设备的不同端口进行批量配置操作。配置恢复或回滚:配置变更应相应提供配置回滚脚本,保证可通过执行配置回滚实现配置的快速恢复。配置变更审批,任何配置变更均需通过审批后方可执行,配置变更申请和变更审批应在不同权限用户下进行。配置变更审计,对执行配置变更应该提供详细的审计,审计信息至少包括配置

16、变更命令的执行用户名,用户所在设备IP 地址,执行对象的IP 地址,执行时间,执行命令的详细内容以及执行结果等。1.4.4. 安全操作审计操作审计,应设立独立的审计帐号,对其他用户的所有操作提供审计,包括系统自身的日常使用、配置、运行、管理等方面的审计。针对设备配置变更应提供单独审计,详细记录配置变更命令的执行用户名,用户所在设备 IP 地址,执行对象的IP 地址,执行时间,执行命令的详细内容以及执行结果等,提供多条件的联合检索和相应报表输出。1.4.5. 报表提供基于web ,可方便定制开发的商用报表引擎,同时内置资产,合规,作业,权限等内置报表。支持报表的定期运行及导出。1.5. 项目需求

17、【灾备调度自动化】1.5.1. 多平台支持以及跨平台作业调度能力? 要求作业调度系统软件安装简单方便,能够支持交互及静默安装方式。? 要求作业调度系统支持多种操作系统,可以在Windows, Linux, AIX, HP-UX, Solaris,等系统上运行。? 要求作业作业调度系统可以调度多种操作系统,其Agent 代理程序可以运行在如下操作系统上:AIX、 HP-UX 、 Linux 、 Windows 、 Solaris ,、AS/400 等。? 要求作业调度系统支持无代理调度方式,能够通过SSH、 WMI 等方式调度目标服务器上的作业。1.5.2. 作业定义及调度功能? 要求作业调度系

18、统支持多种作业定义方式,其中包括:- GUI 界面作业创建- 文件导入作业定义- Utility 命令行创建? 要求作业调度系统支持作业的批量创建,并支持作业的批量更新。? 要求作业调度系统支持作业创建模板,能够通过模板创建作业。? 要求作业调度系统作业调度对象支持如下类型作业:- 各种可在命令行执行的程序及command ;- 各平台内置脚本编制的程序文件;- UNIX Shell Scripts- Windows Batch- CMD- 解释性语言编制的程序文件如Perl 、 WSH 、 PHP、 SQL Query 、 SP 等;- 文件传输(FTP)类作业;? 要求作业调度系统具备版本

19、管理功能,能够存储多个作业版本,支持版本之间相互进行比较,并支持版本自动回滚操作。1.5.3. 作业流及依赖关系? 要求作业调度系统调度的作业可以根据需要生成或去除自身或其它作业状态变量,并根据状态变量决定后续作业是否能够执行。? 要求作业调度系统作业流支持一对一、一对多、多对一以及多对多的逻辑关系。? 特别的对于多对一关系,作业调度系统可以指定前提作业之间的“或”“与”关系来决定后续作业是否执行,也可以手工定义作业依赖关系。? 要求作业调度系统的作业流支持人工参与,即必须经人工确认后作业流才能继续执行。1.5.4. 作业后续处理要求作业调度系统能够根据作业运行时作业状态、系统返回的状态码或系

20、统输出,决定采用何种后续动作对作业进行处理,这些后续动作包括:? 调度后续作业流程;? 发送信息;信息可以发送到系统的控制台、日志、报警窗、EMAIL 地址、某个用户等等,支持多种通知报警机制? 发送命令;可以发送系统的处理命令,或者调用某些程序? RERUN/RESTART 作业;可以自动或者人工地进行作业RERUN/RESTART,? 变更作业的状态;? 要求作业调度系统能够根据作业运行时的状态以及时间等信息,决定如何产生告警及日志等信息。1.5.5. 图形化监控界面及失败原因分析? 要求系统采用图形化界面进行管理,操作界面友好、易用。? 要求作业调度系统提供图形化的作业监控界面,能够实时

21、显示作业的运行状况。? 要求作业调度系统采用不同颜色表示作业状态:正在运行、等待资源、等待条件、需要确认等。? 要求作业调度系统对失败或异常的作业提供异常原因分析,告诉调度人员作业异常的原因。? 要求作业调度系统可在监控界面上由作业调度人员人工处理作业状态,并对作业提出重新运行、强制OK 等操作。1.5.6. 报表及审计功能? 要求作业调度系统提供相应的报表系统。? 要求作业调度系统报表系统具备报表生成指引。? 要求作业调度系统报表系统具备报表导出功能,能够以文件方式将报表导出系统并进行保存。? 要求作业调度系统能够记录大量系统运行时的信息并生成相应的日志文件、系统输出等供系统审计使用。? 要

22、求作业调度系统能够支持历史状态记录,并能够展示历史状态记录。1.5.7. 高可靠性和高可用性? 要求作业调度系统本身需具有Failover 机制,通过数据库镜像和主备机,当出现数据库故障、网络故障、调度故障的情况,备份的服务器(包括镜像数据库)可以接管作业调度管理工作,从而保证作业调度系统的高可用性。? 作业调度系统具有良好的容错机制,每个服务器都和企业管理平台连接,当它们之间的通讯出现故障时,调度平台本身可以继续运行,并且不影响相关平台上的作业调度,在通讯恢复后,调度平台和管理平台之间会自动地进行信息和数据的同步。? 要求作业调度系统能够监控自身各个模块的运行状态,当其中任何模块出现问题时,

23、能够以告警的方式通知管理人员。1.6. 项目需求【云计算】1.6.1. 自服务门户? 用户登录自服务门户后可以查看自己所申请成功的服务信息,服务信息中提供对已订购资源运行情况和使用情况进行统一查看。? 显示该 用户名下所有的资源情况及状态,如开/关机状态,内存/CPU 使用率,审批状态,部署状态,IP 地址,资源有限期等。? 用户只能查看已授权的服务目录。? 用户提交资源使用申请时,能够在申请过程中选择CPU 个数,内存大小, 或增加新的虚拟盘 (VMDK), 资源等级(SLA Level), 加装应用,是否纳入监控等。? 用户可指定服务的部署参数,如数据库实例名,安装路径,集群名等。? 门户

24、提供向导式申请服务界面,并根据用户选项动态计算服务费用。? 指定资源的使用期限,包括开始使用日期和结束日期。系统可以根据指定的周期自动判断资源池内是否具备足够的资源。? 用户可通过自服务门户,申请延长对某项服务的使用期限。? 支持用户提交修改资源配置申请,例如:CPU 个数,内存大小等。? 用户可针对已有的服务实例提交软件安装或补丁安装申请, 例如申请自动安装数据库软件或为某个软件自动打补丁。? 用户可针对已有的服务实例提交增加或删除虚拟网卡需求,可指定网卡所在的网络。? 用户可针对已有的服务实例提交增加或删除磁盘需求。?用户可提交系统自动巡检申请,例如,申请按照服务器安全标准CIS,对服务器

25、的配置进行巡检。并出具相应的巡检报表。? 用户可提交存储申请,例如,申请一定大小的裸盘或NFS 形式的存储,并能将已申请存储的全部或部分挂接到已申请的虚拟机实例中。? 用户可以对已有虚拟机实例进行控制,如启动、停止等操作。? 用户可提交申请增加服务实例的个数。? 允许提交批量资源申请,可以按照应用的实际部署情况在一次服务请求中同时申请异构环境下的多个虚机,并分别部署/配置软件模块。1.6.2. 服务管理. 支持服务的完整生命周期? 提供对云服务全生命周期的管理,包括服务的创建、申请、变更、审批、修改、发布,授权及回收等过程在一个统一的云管理平台上实现。? 服务创建后可由云平台管理

26、员进行发布。服务发布是对服务库和服务目录中服务在运营管理系统内进行变更、激活、挂起、撤销等过程的管理。用户只可对发布状态为激活,并经过授权的服务进行请求。. 服务模板管理? 支持通过管理平台的界面定制服务模板,无需编写代码即可完成服务定义。? 对于同一个模板,管理员可以根据需求为其配置不同的VLAN , IP 将根据与VLAN 相对应的 IP 地址池进行自动分配。? 支持对模板网络环境的定义,对于同一个模板中的不同组件模块(如 web 模块,应用模块,数据库模块), 管理员可以通过定义策略,将其配置到不同VLAN 中,配置不同的端口/防火墙策略。? 管理员可指定特定组件模块所对应

27、的软件安装源及相应的配置参数,如端口号,安装路径,实例名,集群名等。? 管理员可指定模块的部署顺序,如安装DB 中间件 Web 的顺序部署服务。? 管理员可指定安装后脚本或工作流,完成对服务模块的配置或定制操作。? 云管理平台支持根据用户的资源请求进行智能分析,根据资源实际使用情况和用户的相关要求自动进行服务模板的适配与推荐。? 服务模板支持导入、导出功能。. 服务目录管理? 通过标准化的服务目录对我司的云计算服务进行管理,建立IT 服务的使用者与IT 资源之间的标准接口。? 管理员在服务目录中可以定义、发布、更新和终止IT 服务,对IT 服务的名称、描述、资源类别、资源规模、费

28、用等做出规定,同时可以设定不同用户访问服务目录的权限。? 为适应业务的快速变化,管理员能够简便地设计和修改服务目录的项目,要求通过图形化的界面来实现设计,避免开发代码。? 管理员可以在服务目录中定义计费策略。? 服务目录与流程需进行高度的整合,可以实现服务目录与服务请求、事件、变更等流程的无缝集成,用户无需关心执行其请求的最终流程,只需要在服务目录中进行提交,系统自动根据预置的定义选择正确的流程进行执行。实现多请求的统一受理、有效提高用户的满意度。. 服务实例管理? 提供针对服务实例管理的用户界面,支持对服务实例的创建、审批、变更、终止等操作。? 管理员能够对服务实例基本信息、服

29、务请求流程执行状态等进行操作与查询。? 用户可通过自服务门户,申请延长对某项服务的使用期限。? 支持用户提交修改资源配置申请,例如:CPU 个数,内存大小等。? 用户可终止已提交的未到期的服务实例。提交服务终止请求后,所有相关资源开始释放,用户通过服务实例查询可查看终止的状态。? 用户可针对已有的服务实例提交增加或删除虚拟网卡需求,可指定网卡所在的网络。? 用户可针对已有的服务实例提交增加或删除磁盘需求。? 用户可提交申请增加服务实例的个数。. 审批管理? 审批管理可以根据用户的请求决定所需要的审批流程,该流程可以是串行、并行、单级、多级等各种模式,支持委托代理审批。? 根据用户的申请,管理员可以批准用户的申请。管理员也可以拒绝用户的申请。在审批过程中需要留下详细的审计记录。? 如果服务申请被批准或拒绝,在自动化操作完毕后,自动给申请人以及相关人员发邮件通知。? 审批管理模块需基于业界领先的、成熟稳定的、符合ITIL v3 标准的审批引擎,支持可视化界面定制和流程定制功能,可以全面满足IT 服务管理流程及其他流程定制的需求。? 审批管理模块支持全流程的合规审计功能,可以对运行在其上的所有流程进行合规审计,可以按照相关管理要求,对流程中所有信息的修改进行记录,包括修改时间、修改人、修改字段、修改前内容和修改后内容。? 审批管理模块应该与配置管理信息库采用统一的架构

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论