医疗信息平台运行维护设计方案_第1页
医疗信息平台运行维护设计方案_第2页
医疗信息平台运行维护设计方案_第3页
医疗信息平台运行维护设计方案_第4页
医疗信息平台运行维护设计方案_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医疗信息平台

系统运行维护设计方案目录TOC\o"1-5"\h\z1、总体设计方案31.1总体设计原则31.1.1建设原则31.1.2建设策略41.2建设目标与内容41.2.1建设目标41.2.2建设内容72、项目建设方案92.1运行维护系统设计92.1.1云运维与传统运维对比9运维管理思路102.1.3云管理平台建设方案122.1.4统一运维管理平台建设方案272.1.5运维组织体系建设522.1.6运维管理制度体系建设582.1.7运维考核指标体系建设621、总体设计方案1.1总体设计原则建设原则医疗保障信息平台建设项目应明确目标,找准方向,把握重点,规范有序开展工作。在项目建设过程中,要着重把握好以下建设原则:(一)统筹规划,分步推进为避免信息孤岛、重复建设等现象,医疗保障信息平台建设需进行“自上而下”的顶层规划设计,进行合理有序布局;通过“统一领导、统一规划、统一部署、统一标准”的统筹指导建设,集约管理,节约投资。同时,遵循“自下而上”的项目操作原则,立足现行管理体制与制度建设,打好基础,确立方向,稳步推进,均衡发展,实现项目落地,并为下一步制度完善、管理提升留有空间。(二)需求导向、务求实效以医保各部门间信息共享与业务协同作为原始需求驱动,进行医保基础平台的规划建设。再以此为基础,逐步拓展数据资源与数据资源服务能力,进一步进行医保大数据分析挖掘等高级应用,完善与丰富贴近实战的大数据应用服务,从而形成良性循环,并尽快体现出阶段性效果。(三)统一协同,资源共享统一管理、统一规划,就必须有一套统一的标准规范作为基础支撑。标准与规范应向上符合国家的标准与规范,向下规范医保行业业务范围内大数据建设与应用。遵循统一的标准,各相关职能部门根据权限的不同,共享信息资源。同时,各级医保管理部门共同参与,既能保障数据同步,也有利于实现信息共享和协同工作,实现资源的集约化管理。(四)整合共享,协作高效突破区域、部门之间的界限和体制性障碍,充分整合基础设施资源和智能终端获取的信息资源,通过医疗保障信息平台建设推进跨部门、跨领域的信息化协同共享,增强医疗保障的效率和决策能力,同时有效满足公众信息需求,提升医保资源的利用效率。(五)统一标准,开放接口通过明确和开放医疗信息平台的接口与标准,为后期其他相关行业的数据接入提供标准接口,最大限度地实现医保与政府、职能部门、医院、企业、百姓的信息对接。建设策略医疗保障信息平台应结合各级医疗保障部门职能划分、业务重构,发挥中央统筹管理效能,并为地方立足实践拓展服务功能留有空间;最终以“弱干预经办、强共享协同”的策略,实现“搭平台、强标准、重应用、严考核”的效果。主要坚持以下建设策略(1)坚持集约化建设。按照国家电子政务构建“大平台、大系统、大服务”的要求在国家医疗保障局职责框架内,以打破信息系统碎片化,实现数据共享、业务协同、资源整合、能力聚合、服务开放为出发点,如基础信息管理系统、医保业务基础系统、药品和医用耗材招采管理系统、跨省异地就医管理系统、宏观决策大数据应用系统、基金运行及审计监管系统、医疗保障智能监管系统、信用评价管理系统等,由国家医疗保障局统一建设。软件开发由国家局统一组织,并为地方立足实际拓展功能留有空间,硬件购置则由国家局和地方局分级安排。(2)坚持标准化建设。在国家医疗保障局职责框架内,建设基础性、基准性、全国性业务系统,支撑国家医保业务标准化制定与有效执行。如基础信息管理系统、医保业务基础系统、医疗服务价格管理系统、公共服务系统等。1.2建设目标与内容建设目标国家医疗保障局以习近平新时代中国特色社会主义思想为指导,按照党中央、国务院的决策部署,面向医疗保障的重点领域和关键环节,持续推进全国医疗保障标准化、智能化和信息化。本项目重点加强顶层设计、统一业务标准、打造基础平台、做好数据汇集、强化协同共享,依托国家基础信息资源,国家统一电子政务网络及数据交换平台,建设全国统一的国家医疗保障信息平台,不断提高国家医保治理能力和服务水平,支撑消解新常态下我国医疗保障领域重点、难点、热点问题,为国家医疗保障局构建更加公平、更加可持续的医疗保障体系,全面实施医疗保障精准扶贫,积极推进医保与医疗、医药“三医联动”,助力提高医改整体效能和实施健康中国战略提供信息化支撑。针对医疗保障全民覆盖、需求刚性、主体多元、业务复杂、发展不均衡及在线化服务要求高、专业化治理难度大等特点,国家医疗保障信息平台将致力于消除医疗保障信息化领域数据鸿沟、信息孤岛、技术壁垒、应用烟囱、部门藩篱等信息系统碎片化问题,注重顶层设计、标准引领、数据汇聚、资源整合、服务融合、平台建设及能力输出。医疗保障信息平台建成后将全面提高医疗保障标准化、智能化、信息化水平,有效支撑国家医疗保障局与地方医保部门规范、高效、科学履职,使信息化能在待遇保障、医药服务管理、医药价格和招标采购、基金监管、公共服务等方面发挥积极作用,促进建成更加公平、更加可持续的医疗保障体系,更好满足人民群众日益增长的医疗保障需求,增强人民群众的获得感。为逐步构建起全国医保便捷可及“大服务”、规范高效“大经办”、智能精准“大治理”融合共享“大协作”、在线可用“大数据”、安全可靠“大支撑”信息化支撑体系,到2020年,通过本项目建设,拟实现以下具体目标:(1)建设国家医保基础信息库和基础信息管理系统,支撑对全国医疗保障服务对象、医药机构、医保三目及支付标准、重点医疗服务资源等信息实施统一信息管理。全国医疗保障基础信息库覆盖全国95%医疗保障服务对象,覆盖100%建档立卡贫困人口、特困人口。确保全国医疗保障基础信息完整、准确、鲜活、可用,夯实医疗保障信息化全国统建和全域联动基础,支撑推进全国医疗保障跨区域、跨层级、跨业务、跨部门、跨系统的信息共享和业务协同。(2)建设国家医保业务基础系统,采用“弱化干预经办、强化共享协同”的策略,采集全国各地医保部门经办管理与经办服务信息,数据采集周期从1月缩短到1周,关键数据采集时限从1月缩短到1天,确保采集信息完整、准确、规范、可用,为规范指导全国各地医保部门的业务工作提供可靠信息化支撑环境,促进全国医保业务标准化、一体化及全域通办。(3)建设国家医保医疗服务价格管理、支付方式管理系统,支撑实现对医疗服务价格、医保支付方式的全国统一信息管理,掌握全国32个省级医保部门的支付方式改革工作信息,支持对全国90%以上药品价格信息实施采集、监测及信息发布。(4)建设国家医保信用评价管理系统,建立依托全国医保大数据的医保信用评价与信息披露机制,支撑国家医疗保障局掌握全国90%以上公立医院医保信用信息,支撑国家医疗保障局规范指导全国各地医保部门对90%以上定点医药机构实施信用监管和分级服务。(5)建设国家医保药品和医用耗材招采管理系统,为国家医疗保障局提供国家级药品和医用耗材招标采购应用支持,对全国32个省级医保部门的药品和医用耗材招标采购实施统一信息监测,支撑国家医疗保障局规范指导全国各地医保部门的药品和医用耗材招标采购工作。(6)建设国家医保公共服务系统,建立面向全国的医保公共服务统一入口,支撑构建面向全国的医保公共服务数据资源池、服务枢纽站、信息发布台。为跨省医保信息查询、资讯发布、证照流转、资格核验、异地就医服务备案等提供应用支持,支撑国家医疗保障局依法政务公开事项(法律法规、政策文件、办事指南等)网上公开率达100%。支撑国家医疗保障局规范指导全国32个省级、近400个市级医保部门按照国家医疗保障局业务标准开展公共服务体系构建。(7)升级改造跨省异地就医管理系统,支持将更多的基层医疗服务机构纳入跨省异地就医服务定点范围,支撑为外出农民工和外来就业创业人员提供跨省异地就医直接结算服务,为门诊、门慢跨省异地就医直接结算提供可靠的信息化支撑环境,跨省异地就医直接结算率大幅度提升,全国100%三级以上定点医院接入该平台,确保100%全国医保经办机构、定点医疗机构、就医结算信息及备案情况网上可查询。(8)建设国家医保智能监管系统,支撑国家医疗保障局依托全国医保大数据开展医保智能监管工作。指导全国32个省级医保部门规范采集定点医疗机构的进销存、病案首页、电子病历及医保结算、费用明细信息,构建智能化医保监控能力体系。支撑建立全国范围内医保稽核管理机制,为国家医疗保障局与全国各地医保部门之间的疑点问题发现、重大问题督办、全域联动监管提供大数据监控支撑环境。支撑建立与国家卫健委的医药机构及从业人员资格甄别机制,掌握全国90%以上执业医师、执业药师信息。(9)建设国家医保基金运行及审计监管系统,为国家医疗保障局提供医保基金监管和审计监管应用支持,对全国90%以上医保基金运行信息实施基金运行及审计监管。支撑国家医疗保障局规范指导全国32个省级医保部门开展标准化基金运行和审计监管工作。(10)建设国家医疗保障局医保运行监测系统、宏观决策大数据应用系统,支持国家医疗保障局从宏观、中观、微观三个层面,动态化掌握全国医疗保障制度运行情况,包括全国医疗保障目标达成、政策执行、资源配置、基金收支、待遇保障、医药服务管理、医药价格及招标采购、公共服务等方面,初步形成支撑国家医疗保障局宏观决策分析大数据能力体系,包括评价、风控、测算、精算、预测、预警、模拟等方面。支持国家医疗保障局对全国90%以上地区医保制度运行情况实行动态监测,向全国90%以上省级医保部门输出开展宏观决策分析工作的大数据能力。(11)建设内部控制系统,支撑构建国家医疗保障局廉政风险防控体系,实现面向国家医疗保障局全业务、全岗位、全人员业务风险防控。(12)建设内部统一门户系统,为国家医疗保障局工作人员提供信息系统的统一登录入口、内部工作台和邮件服务,便于国家医疗保障局工作人员便捷、畅达开展日常工作。(13)建立国家医疗保障局与国家发展和改革委员会、财政部、公安部、国家卫生健康委员会、人社部、教育部、民政部、国家市场监督管理总局、国家税务总局、国务院扶贫开发领导小组办公室、中国残疾人联合会等政府部门的信息共享与业务协同机制,共享交换国家人口库、国家法人库、经济社会发展宏观指标、医药服务资源、医保税务征收、扶贫工作、残疾人保障等数据。对应建立面向全国的医保服务对象身份、业务状态、待遇享受资格核查比对机制,支持实现医疗保障全民覆盖、应保尽保,同时有效控制基本医保的重复参保、重复享受待遇问题。(14)建立支持国家级层面的医保与医疗、医药“三医联动”数据共享、信息聚合、资源调度、业务协同信息支撑环境。支撑国家医疗保障局规范指导全国32个省级医保部门开展“三医联动”信息化支撑环境建设。(15)建设国家医保信息平台信息基础设施和业务支撑云平台,基本形成国家医保信息平台基础支撑能力,包括计算、网络、存储、备份、安全、标准、运维、灾备及应用支撑。实现医疗保障交互类业务平均响应时间1,查询类业务平均响应时间2,交易接口类单条记录交易接口平均响应时间1,多条记录(100条)交易接口平均响应时间3,为全国医疗保障信息化数据共享、业务协同、资源整合、渠道融合、能力聚合服务开放提供安全可靠的技术保障环境。建设内容本项目建设依托于国家医疗保障局政务目标,通过搭建基础平台及相关应用系统,统一采集全国32个省级医保局的经办业务数据,构建医保信息化的基础。同时,完成相关技术、业务标准规范的建设,满足系统全生命周期内的标准规范要求。本次医疗保障信息平台建设工程分为以下几个方面建设内容:(1)标准规范建设建设国家医保标准化体系,建设包括应用建设标准、应用支撑平台标准、外部数据交换标准、网络标准、安全标准、项目管理标准、医保业务类标准、定点医药机构及人员标准、医疗保险机构及经办人员标准、电子病历类标准、设施管理规范、运维管理规范共13个标准,为医保业务互连互通、信息共享、业务协同提供坚实的基础。(2)技术支撑平台建设建设完整的支撑体系框架,基于通用服务组件提高系统互连互通互操作和信息共享的能力,为本项目进行系统开发、集成、部署、运行提供一体化的技术支撑体系。(3)应用系统建设依托国家医疗保障局政务目标、业务目标及业务需求升级改造1个跨省异地就医管理系统,新建内部统一门户系统、基础信息管理系统、医保业务基础系统、药品和医用耗材招采管理系统、医疗服务价格管理系统、支付方式管理系统、信用评价管理系统、基金运行及审计监管系统、医疗保障智能监管系统、内部控制系统、运行监测系统、宏观决策大数据应用系统、公共服务系统共13个应用系统。(4)基础设施建设基于云计算、大数据技术以租代建方式建设国家医疗保障局数据中心,通过租用数据中心服务商物理机柜的方式进行软硬件部署,实现业务系统应用级容灾;建设监控中心,作为医保局信息化系统日常统一监控和运维场所。硬件方面新增X86服务器、阵列、虚拟带库、网络设备、安全设备等,系统软件方面主要新增数据库、中间件、操作系统等。(5)运维安全体系建设搭建运维管理体系,建设云管理平台、运维监控平台实现对云资源的运营和所有IT资源的运维监控,针对运维组织、运维管理制度以及运维考核指标制定管理体系;基于国家网络安全法和等级保护第三级的网络安全保护要求,夯实网络安全基础防护工作,形成整体的网络安全管理、技术和运营体系。2、项目建设方案2.1运行维护系统设计本次运维管理提交建设内容包括运维管理平台、运维组织体系、运维管理制度体系和运维考核指标体系建设,其中运维管理平台按实际运维分工需求,分为云管理平台和统一运维管理平台,云管理平台主要负责云平台相关的运维管理,其余基础机房、IT设备及业务系统由统一运维管理平台负责运维管理,由于系统分为公共服务区和核心业务区两个网络区并且物理隔离,因此本工程云管理平台和统一运维管理平台各建设2套。云运维与传统运维对比云计算技术体系架构下的运维管理较传统架构下的运维管理在管理对象,管理方法等都有较大的不同。在云架构中运维管理需要提供IaaS层、PaaS层、SaaS层资源的全生命周期的运维管理,实现物理资源、虚拟资源的统一管理,提供资源管理、统计、监控调度、服务控制等端到端的综合管理能力。引入分布式架构,从源头上提升系统可维护性系统的可维护性是指一个系统的可修复(恢复)性和可改进性的难易程度,传统集中式架构以系统最小颗粒度,系统间独立运营,当需要上线新的应用时,会优先考虑部署在既有的基础架构上,但因为不同的应用所需的运行环境、对资源的抢占会有很大的差异,更重要的是考虑到可靠性、稳定性、运维管理问题,将新、旧应用整合在一套基础架构上的难度非常大。而分布式架构能够降低系统间各类应用的耦合度,以应用或服务为最小颗粒度,可以对已有组件复用、重新编排或应用集成形成新的业务应用。本项目通过引入微服务中心实现业务系统的分布式架构,微服务中心组成主要包括两部分,一是服务化,实现各类中间件或工具或资源的服务化管理;二是应用容器化,通过应用的组件解耦及容器化,实现应用的灵活部署与运维。为满足大量应用、服务、数据存储资源的可弹性扩展、交互高并发,将构建分布式事务管理、分布式服务总线能力、分布式消息能力、分布式监控能力等;引入分布式数据库能力,满足多租户情况下数据隔离与访问能力;构建统一数据服务能力,通过提供统一数据API服务,实现应用与数据的解耦。系统建设,架构先行,只有从顶层设计上增加系统的可维护性,才能为日后的运维管理工作提供极大的便利。依托自动化运维技术,提升运维质量与效率IT运维自动化是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,自动启动故障响应和恢复机制。在云计算和大数据时代,集群规模和数据量爆发式增长,通过采用自动化运维技术可以实现设备的自动发现、监控告警和自动化故障处理,降低对运维人员的依赖、提升运维质量与效率,使运维人员的关注点可以聚焦到企业业务上来、轻松应对云计算环境下的业务变化和设备增加。通过引入智能化运维功能提高工作效率和准确性,用户只需从所有资源中选出巡检所关注的资源和指标,设定相应的巡检任务和巡检时间,系统会自动完成对选定设备指标的巡检工作,生成巡检报告并反馈给运维人员,对超标数据自动标识,节约用户对比时间。(1)健康检查。即自动巡检,日常巡检工作是日常运维工作中每天都要定时执行的工作,巡检工作内容简单但是需要重复执行。占用了IT运维人员的大量工作时间。通过自动化巡检可以将硬件状态,设备负载,系统时间,磁盘空间,线路流量,数据库表空间使用率、网络设备的端口状态、流量等进行自动巡检,并形成符合用户要求的巡检报告。(2)故障自愈。日常监控是传统IT运维软件的基本功能。当告警明确后,人员就需要进行故障处理。故障处理可以分为四个阶段:源头发现、告警确诊、修复授权和故障维修。在这四个阶段中,源头发现和告警确诊主要将大量的告警进行收敛,将真正需要处理的告警进行明确化,并找到故障的原因(如一个业务进程僵死或者进程宕机)。对已识别的故障类型,根据故障类型进行故障自动修复(例如重启服务进程),对未识别的故障类型,在修复授权下进行人工干预、故障确认和故障处理。(3)自动配置。配置库是记录和管理IT系统运行环境的基础组件,当运行环境越来越庞大时,对这些基础组件的管理变成了配置管理员的一个巨大的工作量,尤其是这些组件还在不停的变化和关联。最好的方式是能自动从生产环境中提取配置信息,自动更新到配置库中,保持配置库和生产环境的一致性。要实现对配置库的自动更新和同步,需要对应用系统进行标准化改造,比如规范化的安装路径、统一版本等,这将有助于工具能提取到应用程序的配置信息,最终实现配置信息自动更新与同步。

本方案建议采用基于云架构的运维方案。2.1.2运维管理思路以运维管理体系模型为基础,以体系管理内容为准则,搭建国家医疗保障局医疗保障信息平台运维管理体系框架,分为运维实体层和运维处理层,如下图所示。运维

实体层云云管理平台丨运维监控平台1资源管理!统一流程运维

实体层云云管理平台丨运维监控平台1资源管理!统一流程IT资源管理(含网络机房监控(含!i管理拓扑、链路监控等)3D可视化)!流程管理1业务管理自动化管数据采集可视化展1:理示:ii服务管理k报表>j!!iiiii11运维制度体系I运维处理层运维组织体系运维管理制

度人运维考核指标体系[DC机房安全设备主机存储系统应用干台图2.1-1运维管理思路运维实体层运维管理主要本建设项目的大部分业务是依靠庞大的信息技术设备系统完成的,是针对本次项目的信息技术环境。运维管理的对象有机房环境、网络和安全设备、主机和存储及业务系统等。运维人员的主要负责对实体层基础设施的管理。运维管理主要运维处理层运维处理层是运维管理体系的核心层,本项目运维采用集中管理方式,建设云管理平台和运维监控平台,其中云管理平台实现云资源的运营管理,运维监控平台实现云资源及运维实体层的运维监控。此外,运维处理层还需要制定各种运维管理的制度针对不同的维度,包含运维组织体系、运维管理制度体系一级运维考核指标体系。本项目以ITIL、IS020000、IS027001和服务管理相关方法论和理论为基础,以运维服务管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,结合用户运维管理需求、管理对象的特点、内外部环境进行运维管理体系规划的构建,如下图所示。

和口叽百咖与也対齣鲨牡「:僧轻黑尉问监awsw全雪產■:^t和口叽百咖与也対齣鲨牡「:僧轻黑尉问监awsw全雪產■:^t腥買刃■R^s?a图2.1-2运维管理体系规划THL1£02M»0I5OJ7O01d00BIT2.1.3云管理平台建设方案一、基础管理按资源的逻辑结构划分,从大到小可以分为管理域、资源池、集群,整个系统可以包含多个管理域,一个管理域中可包含多个资源池,资源池由物理主机、虚拟主机、网络资源、存储资源等组成,两台或多台具有一定管理关系的物理/虚拟主机可组成一个集群,关于管理域、资源池以及集群的具体功能要求如下:(一)管理域的管理(1)注册管理域:支持通过管理界面增加资源域,域属性包括域名称、域描述、域类别等信息。(2)更新管理域:支持域资源增加和删除之后,一定周期之后自动更新域信息以及手动立刻更新域信息。(3)删除管理域:支持管理员可以将不需要的域删除,同时删除所依赖的所有关系。(4)查询管理域信息:支持按域的名称、所有者、注册时间等的关键字进行查询。5)查询管理域列表:支持以列表或图表方式展现域资源。管理域资源的管理管理域资源的管理应包括如下功能:扫描管理域内计算节点:支持自动扫描和发现计算节点,并添加至相应的管理域中。注册计算节点到管理域:支持通过管理平台将计算节点注册添加至相应的管理域中。注销管理域中计算节点:支持注销选定管理域中的某一个或多个计算节点。查询组中计算节点列表:支持通过计算节点的名字、所属管理域以及IP地址等关键字进行查询。查看管理域中计算节点摘要:支持查看计算节点的摘要,主要包括节点IP、MAC地址、远程管理地址、所属组名称、资源使用情况、其上虚拟机情况等信息。查询计算节点虚拟机列表:支持通过虚拟机名称、虚拟机IP、虚拟机所对应使用者等信息查询计算节点上虚拟机列表。(7)管理域资源调度策略管理:支持管理域资源的调度策略管理,并支持对策略的优先级进行设置。(8)管理域访问权限管理:支持设置管理域访问权限,用户只能访问自己所对应的资源。资源池管理资源池管理应包括如下功能:(1)资源池总览:为用户提供资源调度有关的资源划分视图,并能够对资源池进行管理和配置操作,包括创建、修改、删除、配置调度策略等。(2)创建资源池:支持用户可以根据不同的资源类型创建不同类型的资源池,包括:物理主机池、虚拟主机池、混合池。创建资源池时可以配置资源池关联的调度器和调度策略。查询资源池:支持按资源池类型对资源池进行分类查询。(4)分类统计:支持按资源池类型、规模等统计资源池情况。(5)修改资源池:支持修改已有资源池的基本信息和配置信息。可以对资源池进行添加和删除子资源操作。子资源包括分区、集群、物理主机、虚拟主机等。6)删除资源池:支持删除指定的一个或多个资源池,无论资源池中是否关联资源。(7)资源池监控:支持监控集群的整体性能情况,包括CPU利用率,内存使用(四)集群管理集群管理应包括如下功能:(1)集群总览:为用户提供与其业务有关的资源划分视图。用户可创建集群,并将与业务有关的物理主机、虚拟主机等资源,添加到一个集群中,方便用户从业务层面上对资源进行管理。(2)创建集群:支持指定名称、类型、备注等信息,创建一个新的集群,并为集群添加资源。(3)查询集群:支持按集群类型、集群规模、资源类型对集群进行分类查询。(4)查看集群:支持查看集群详细信息,包括基本信息、配置信息和关系信息。(5)集群监控:支持监控集群内资源的整体性能情况,包括CPU利用率,内存使用率等。可以监控集群内资源集合的变化,当增加或减少资源时,发出事件。(6)修改集群:支持对集群基本信息和配置信息进行修改。可以向集群中添加或删除资源。(7)删除集群:支持将已存在的集群进行删除。仅删除集群对象,不删除集群中的资源。二、计算资源管理(一)物理主机管理本节中所描述的物理主机包括两类,进行云化的云主机和传统意义非云化的物理机。物理主机管理应至少包括如下功能:(1)支持禁用/启用主机部署、远程开关机、主机负载均衡设置。(2)支持添加主机到主机资源池,可从主机资源池中删除主机。(3)支持远程访问物理机。(二)虚拟机管理1、虚拟机实例管理(1)创建虚机:支持自定义和基于模板的两种创建模式。支持完全克隆和链接克隆两种模式。(2)批量创建虚机:支持批量创建相同配置的虚拟机。(3)修改虚机配置:支持能够对虚拟机的基本信息、启动顺序(光驱、硬盘)、虚拟磁盘、虚拟光驱、虚拟网卡、虚拟CPU、虚拟内存等信息进行重配置和更改。(4)删除虚机:支持删除不再使用的虚拟机,删除的时候会出现提示信息,避免用户误删除。(5)获取虚机信息:支持查看虚拟机列表中的某一虚拟机的详细信息,包含:基本信息、状态信息、软件配置信息、硬件配置信息、特性信息和关联信息。(6)虚拟机使用物理外围设备:具有把物理外围设备映射到虚拟机以及把物理外围设备从虚拟机移除的功能,物理外围设备包括但不限于光盘、USB设备。(7)虚拟机支持HA功能、DRS功能。2、虚拟机生命周期管理(1)启动虚机:支持通过系统启动相应的虚拟机,也支持批量选中虚拟机进行启动操作。(2)停止虚机:支持系统停止相应的虚拟机,也支持批量停止选中的虚拟机。(3)迁移虚机:支持虚拟机从一台云主机迁移到另外一台云主机中。(4)热迁移虚机:支持在不影响业务情况下,将虚拟机从一台物理主机迁移到另外一台物理主机。(5)暂停虚机:支持对选中的虚拟机进行暂停,系统进行休眠状态。(6)取消暂停虚机:支持对已暂停的虚拟机进行恢复操作。(7)挂起虚机:支持对正在运行的虚拟机进行挂起操作。(8)恢复挂起虚机:支持对已挂起的虚拟机机型恢复操作。(9)重启虚机:支持对选中的虚拟机进行重启操作。(10)远程访问虚拟机桌面:支持通过Web浏览器远程访问模式实现对虚拟机桌面的远程访问。3、虚拟机镜像管理(1)创建镜像:支持从本地磁盘或者模板创建虚拟机镜像。(2)修改镜像:支持对镜像文件进行修改,如CPU、内存、磁盘等内容。(3)删除镜像:支持将不再需要的镜像文件删除,释放资源。获取镜像信息:支持通过查看镜像的信息,得到镜像的配置信息等。镜像文件管理:支持上传、删除、修改镜像文件名称等基础管理。导入虚拟机:支持通过上传标准格式的虚拟机,将虚拟机导入云平台,加速业务上线时间。4、模板管理创建模板:支持根据主机或虚拟机创建模板。克隆模板:支持克隆一个与原模板配置相同的新模板。转换为虚拟机:支持将模板转换为虚拟机,虚拟机转换成功后,可执行虚拟机的管理操作。批量部署:支持选择指定的一个模板后,可以对所选择的模板部署虚拟机,部署虚拟机时可以指定部署虚拟机的数量和配置信息等。查询模板:支持根据指定的查询条件查询模板。查看模板:支持查看模板的详细信息,包括模板的基本信息、软硬件配置信息及特性信息。编辑模板:支持对模板的配置信息进行修改,如CPU、内存、网卡个数、磁盘个数、磁盘容量、磁盘格式等。(8)删除模板:支持单独或批量删除模板。5、虚拟机快照管理创建快照:支持对虚拟机创建相应的快照,保存虚拟机状态。快照恢复:支持选择同一虚拟机快照中的一个,恢复到创建快照时的状态。删除快照:支持对虚拟机快照的删除。查询快照信息:支持查看已有的快照信息及对应的关系,查看快照名、快照创建时间、快照存放位置、快照备注以及一个虚拟机对应的快照个数等信息。(5)快照策略:支持按时间、负载等策略自动化创建快照6、虚机备份管理创建虚机备份:支持对需要进行备份的虚拟机进行备份操作。删除虚机备份:支持对于不再需要的虚拟机备份内容进行删除。(3)查询虚机备份:支持通过管理界面,按时间点或者按备份位置等图形化操作界面查看备份信息。4)备份策略:支持按照策略对系统进行备份,备份方式包括虚拟机整机、磁盘备份,支持全量、差异增量、累积增量备份等,支持保留周期和优先级设定。(5)支持虚拟机整机和磁盘恢复;支持单个整机或者磁盘以及批量整机或者磁盘的恢复,支持恢复到原位置或者指定的新位置。(三)动态资源调度动态资源调度可依赖调度器完成,支持用户自定义调度策略,调度器的作用对象为资源池,需支持功能如下:(1)创建调度器:支持添加资源池时用户可以创建不同类型的调度器,并设置不同的调度策略和参数。(2)查询调度器:支持对系统已有的调度器的调度实例进行分类查询。(3)查看调度器:支持查看调度器的调度策略、配置参数以及调度集合中所包含的资源信息。(4)编辑调度器:支持对调度实例的详细信息进行编辑。(5)删除调度器:支持对已有的调度实例进行删除。三、网络资源管理(一)VPC管理(1)创建VPC:支持按照模板创建含有网络资源的VPC。VPC创建完成后仍可在此基础上按照业务需求创建相关网络资源,如果因资源准备不足或配置错误导致网络或VPN创建失败,不应影响VPC及其他网络资源的创建。(2)自定义VPC:支持创建空的VPC,在VPC创建完成后,自定义创建网络以及其他网络资源。(3)修改VPC:支持在基础网络之上配置弹性IP、NAT(包括DNAT和SNAT)、ACLs、VXLAN和VPN业务。(4)删除VPC:支持删除未被使用的VPC。(二)虚拟网络管理1、按照用户实际业务的使用需求,应支持以下3种网络配置模式:(1)直连网络:提供将云主机直接接入到外部网路的能力。连接到这个网络中的云主机可以分配到外部的IP地址。(2)内部网络:仅提供裸VLAN,可选支持IP地址管理,不提供网关。网络仅有二层,不提供三层访问的能力。这种网络一般用于内部使用的,只有处于同一内部网络的云主机之间可以通信,多个VPC间的内部网络IP地址可以重叠。路由网络:提供VLAN,IP地址管理,三层网关。对于一个VPC下的所有路由网络,能够自动打通这些路由网络之间的路由,不同路由网络下的虚拟机可以互相访问;可以在Internet通过弹性IP、VPN、DNAT服务访问连接在路由网络上的云主机。2、网络业务应支持VLAN和VXLAN,并同时支持IPv4和IPv6。3、管理员可以对已经创建的网络进行管理,包括修改网络名称和描述、查询网络信息,查询网络详情、查询网络列表、删除网络等。安全组管理1、创建安全组:支持为虚拟机创建安全组。2、删除安全组:支持删除已有的安全组。3、查询安全组:支持对安全组信息的查询,可以查询安全组详情、查询安全组列表、查询安全组应用的网卡等。4、创建安全组规则:(1)新创建的安全组只有一条默认规则,与安全组外部默认隔离,此规则用户不能删除。若需要当前安全组中的虚拟机和安全组外部的虚拟机通信,可以通过添加安全组规则来实现。安全组以外用来和安全组通信的网络称之为源,源可以是一个子网、一个IP地址段、一个安全组。可以为每个要和安全组互访的源添加一套安全组规则,在安全的前提下提高网络的灵活性。(3)进入安全组规则编辑界面,选择增加安全组规则,输入协议名称,源端类型源端信息,端口范围,执行添加操作。5、删除安全组规则:支持通过安全组规则编辑界面,删除指定的安全组规则。6、查询安全组规则:支持查询安全组规则详情、查询安全组规则列表。虚拟交换机管理(1)创建虚拟交换机:支持手动添加虚拟交换机和自动发现虚拟交换机,并为创建业务系统提供网络资源。修改虚拟交换机:支持对已有虚拟交换机属性的修改。删除虚拟交换机:支持删除被未被使用的虚拟交换机。管理员可以在服务器上划分出多个虚拟交换机,提供虚拟机的二层通信、隔离的能力。虚拟交换机能实现单个物理服务器内的虚拟机之间的交换,也能实现不同物理服务器的虚拟机之间的交换。管理员可以配置多个虚拟交换机,每个虚拟交换机可以覆盖集群中的多个计算节点。虚拟交换机具有多个虚拟端口VSP(VirtualSwitchPort),每个VSP具有各自的属性(速率、统计和ACL等),为了管理方便采用端口组管理相同属性的一组端口,相同端口组的VLAN相同。虚拟交换机支持端口镜像功能将镜像会话中源端口的流量复制转发到目的端口,通过端口镜像功能,可以快速定位网络故障。支持虚拟局域网(VLAN)和VxLAN两种隔离方式,便于对虚拟机进行安全隔离。虚拟路由器管理创建虚拟路由器:支持为业务网络创建虚拟路由器。(2)修改虚拟路由器:支持修改虚拟路由器参数,如接收和发送带宽。释放虚拟路由器:支持释放未被使用的虚拟路由器,虚拟路由器释放后可供其他业务网络使用。网络映射管理:支持通过虚拟路由器管理界面,创建虚拟路由网络映射、删除虚拟路由网络映射、查询虚拟路由网络映射,查询虚拟路由器网络映射、查询虚拟路由器网络映射列表。公网IP管理:支持通过创建的虚拟路由器,实现绑定公网IP、解除绑定公网IP、查询公网IP等功能。虚拟负载均衡管理1、创建负载均衡器:支持创建负载均衡器,其主要参数应包括:最大会话数:虚拟负载均衡器前端网络能够同时处理连接的最大数目。最大吞吐量:虚拟负载均衡器前端网络在单位时间内最大传送数据量。前端网络:对外提供负载均衡业务的网络。(4)后端网络:与虚拟负载均衡器关联的后端虚拟机所在网络。2、冻结负载均衡:虚拟负载均衡器冻结后将暂时停止提供负载均衡服务。3、解冻负载均衡:虚拟负载均衡器解冻结后将恢复其负载均衡服务。4、删除负载均衡器:删除不再使用的虚拟负载均衡器。5、监听器管理:支持为负载均衡器创建、配置、查看、删除监听器。(七)弹性IP地址管理(1)绑定弹性IP:支持弹性IP和虚拟机网卡或私有IP地址绑定。公网用户需要通过弹性IP访问虚拟机时,可将弹性IP和虚拟机网卡绑定;也可以将弹性IP与私有IP绑定(例如,某个应用的浮动IP地址),通过弹性IP对公网提供服务。(2)解绑弹性IP:支持解绑定后的弹性IP可与其他的虚拟机网卡或私有IP地址重新绑定。(3)释放弹性IP:弹性IP在释放后将成为公网IP池中的可用资源。(4)地址转换:支持网口地址转换,通过公网IP加端口映射的方法,使得一个公网IP可以映射到系统内部一个局域网;NAPTIP和虚拟机映射时,可以将RDP、SSH、TELNET等不同的网络访问协议映射到不同端口上,用户还可以自定义协议和端口的映射关系。四、存储资源管理主要包括统一存储模式和分布式存储模式,用户可根据各自业务需求和实际IT资源情况选择相应的存储方式。(一)统一存储模式在统一存储模式需要能够同时满足政府对SAN存储和NAS存储两种场景下的应用,能够支持数据中心大型数据库OLTP/OLAP(OnlineTransactionProcessing/OnlineAnalyticalProcessing)、高性能计算、数字媒体、集中存储、备份、容灾和数据迁移等不同业务应用的需求,支持政务云平台高可靠、高性能、高效率的业务需求。1、物理存储管理(1)存储介质:支持多种磁盘类型(如FC、SAS、NL-SAS、SATA、SSD等)创建资源池、RAID(如RADI0,RAID10,RAID5,RAID6等)以及磁盘热备。(2)部件模块热插拔:支持控制器、风扇、电源、I/O模块、备电模块、硬盘等模块的热插拔,不影响主机业务,支持在线I/O扩容。(3)存储实时监控:支持存储设备实时监控功能,包括运行状态监控,设备异常告警机制和告警信息传递方式。(4)存储系统自动部署:支持存储系统自动部署,包括软件安装、配置,实现即插即用,并磁盘、电源、10模块等支持热插拔。设备上电后管理软件通过远程管理自动对所有设备上的软件配置、安装,可快速完成系统的所有部署与配置,实现即插即用。(5)故障自愈功能:系统中任何一个组件(包括磁盘、控制器、节点)发生故障系统将自动检测、隔离该故障;如果出现多盘失效,系统自动通过其他节点在系统其余的可用空间中快速恢复受故障影响的数据。自愈过程无需中断业务,且对业务完全透明。(6)自动升级功能:存储系统可以对存储节点的系统升级,升级过程可无需人工干预和控制,系统自动判断各节点状态,并启动升级;如果升级遇到问题,系统将自动回退;整个升级过程无需中断业务,对业务完全透明。(7)异构存储管理功能:通过标准协议对数据中心中大量异构存储产品进行统一管理,避免异构存储系统之间的兼容性、互操作性等问题。(8)支持多种资源扩展性,如10接口卡、硬盘数量在线扩展等功能。(9)支持多种类型端口及其协议,如:iSCSI,FC,FC0E,IB,NFS,CIFS,Http,CiFS,FTP等。2、卷管理(1)数据卷管理:包括创建、卸载、删除数据卷、获取某个数据卷详情、获取已划分数据卷列表等功能。(2)数据卷备份管理:包括备份数据卷、删除数据卷备份、获取备份数据卷信息获取备份数据卷列表等功能。(3)数据卷快照管理:包括创建数据卷快照、从数据卷快照恢复卷、删除数据卷快照信息、获取数据卷快照信息、获取数据卷快照列表等功能。(4)卷扩容:支持通过存储系统侧的扩容和应用服务器侧的扩容。在存储系统侧完成卷扩容以后,通过应用服务器侧进行相应的配置,可使应用服务器识别和使用扩容后的存储空间。5)分配存储空间:可为应用服务新增加的业务分配存储空间,并支持应用服务器使用分配后的存储资源。(6)卷数据销毁:为避免已删除的存储数据被非法恢复,应对卷上的数据进行销毁,确保销毁的数据将无法进行恢复。3、文件系统管理创建文件系统:支持在已分配的存储上创建文件系统,文件系统名称不能重复,新创建文件系统的容量不能超出指定文件存储池或数据磁盘所提供的总容量。4、虚拟磁盘管理(1)创建虚拟磁盘:支持在数据存储上创建磁盘,为虚拟机提供存储资源。(2)绑定磁盘:支持将磁盘绑定到对应的虚拟机,增加目标虚拟机的磁盘数量。非共享磁盘只能绑定到一个虚拟机上,不能重复绑定。共享磁盘可以绑定到多个虚拟机上。(3)虚拟磁盘备份:支持通过配置虚拟机备份服务器,对虚拟机的磁盘数据进行备份。在虚拟机故障时,可通过备份服务器上的数据对虚拟机进行恢复。(4)虚拟磁盘扩展:当文件系统的容量无法满足业务需求时,可以通过扩容文件系统的方式增加容量。在存储系统完成文件系统扩容后,还需要在应用服务器侧进行相应的配置,才能使应用服务器识别和使用扩容后的存储空间。(二)分布式存储模式随着政府采用虚拟化与云计算技术来构建IT系统,提升IT系统的资源利用率的同时,也面临诸多问题,如存储资源弹性需求变化、存储扩展、大规模集群中的容错和可靠性等问题。分布式存储能够满足云平台日益增长的存储需求,为业务平台提供高安全性、高可靠性、高可用性和开放性的存储服务。分布式云存储服务可以提供多种形态的存储,如对象存储等,具有下面特性:(1)存储高扩展性:分布式存储容量可动态扩展到PB级(2)存储高伸缩性:分布式存储性能可以线性提升;支持千万级数量的对象,如文档,媒体文件等。(3)数据高可靠性:保证分布式存储中任意2台设备故障不会造成数据丢失,用户数据在同资源池内保留3个副本,用户的每次写请求只有当3个副本成功写入后才返回。支持跨组资源池的异地复制,支持实现异地容灾恢复。(4)数据高可用性:提供99.9%以上的可用性。三个副本都可以服务于读请求。(5)高数据安全性:提供多层次的安全防护;提供端到端的数据完整性校验;提供数据加密;提供多用户隔离、用户加密验证、权限控制以及防盗链等数据安全防护功能。(6)存储简单易用:支持标准接口调用和客户端操作。(7)应支持全分布式对称架构,系统无元数据节点;(8)应支持多节点并发访问,并支持多种负载均衡策略,例如节点轮询方式、节点连接数、节点吞吐量、节点能力(CPU/内存/带宽等)等。(三)存储综合管理(1)应支持在不中断业务系统的情况下存储系统组件自动检测、隔离故障,并且磁盘故障可自愈。(2)应支持自动精简配置功能。对存储资源的自动分配和利用,以避免磁盘空间被无限制索取。可以根据用户的容量需求现状,动态并且实时地改变存储容量资源的划分,充分利用磁盘阵列的有效存储空间。(3)应支持国家密码管理机构允许的密码算法的硬件系统,支持数据加密存储和签名。(4)应能够将数据均衡分布到存储硬盘上,按照用户定义的方式管理数据的分布根据硬盘访问压力,自动调整数据迁移速度。(5)应能够通过控制并发、计算、缓存、硬盘等关键系统资源的调度和分配,在整个10路径进行优先级控制。应能够根据用户设置的性能控制目标进行10流量控制,避免某些业务由于流量过大而影响其它业务。应能够设置业务的最低性能目标,保证关键业务满足性能需求。(6)根据业务对性能和容量的需求,数据能够基于迁移模式、迁移速度、迁移策略自动分级存储。(7)应支持Cache分区,为业务应用提供专属缓存分区,实现业务隔离,提高服务质量和可靠性。(8)应支持数据重删与压缩功能(9)支持LUN数据销毁,应能够按照标准方式和自定义方式进行数据销毁:(10)支持LUN迁移,迁移过程业务无感知,支持多对LUN迁移业务同时进行,支持在异构存储系统之间进行LUN迁移,支持动态改变迁移速度,支持故障排除后自动恢复。支持多租户管理功能,应能够隔离租户间的资源数据,将一部分资源的管理功能下放给各自的租户,由租户的管理员对租户内的资源进行自管理。支持LUN克隆功能,数据对象建立一份某时刻的完整的物理拷贝,为系统内的数据提供保护功能,用户可以灵活的创建多个时间点的一致性副本。支持LUN数据拷贝,支持在阵列间和阵列内进行LUN拷贝,支持源阵列和目标阵列互相LUN拷贝,支持一对多LUN拷贝,支持动态改变LUN拷贝速度来避免和生产业务的冲突,支持基于IP网络的LUN拷贝,支持不同品牌阵列间的LUN拷贝。五、流程管理该流程管理不同于统一流程平台,主要负责云资源的申请、回收、扩容及变更的流程管理。流程配置支持资源申请流程、资源回收流程、资源扩容流程、资源变更流程的配置。按照审核确定的方案,实施流程的增减、优化、IT实现和后评估等操作,并对实施结果进行统一管理,实现流程的持续改进。可视化工作流管理通过可视化的工作流图形式展示资源整个生命周期内的状态,包括申请、审批、分配、部署等。其中在资源分配和回收中对关联资源也进行图例展示,能够清楚地看到资源的分配状态和关联情况。能够使用网站上的元素在工作区域搭建工作流图,然后一键完成资源以及关联资源的分配操作。(2)支持图形化流程配置工具,包括可视化流程设计、任务管理、流程角色权限定义、流程流转、流程审批等。六、服务管理云管理平台在资源层的基础上,可以定义多种服务,每种服务项中对应多种服务参数,各服务参数的不同组合可以按需产生不同的模板,模板可以提供给用户使用。如云主机服务是云计算中最基础的服务,用户基于管理平台提供的云主机服务模板可以快速申请或常见创建一台云主机。(一)服务目录管理服务目录是所有资源能够向用户提供的服务的集合。服务目录管理支持服务目录的生成、发布、修改、删除、查询和导入导出,支持分级目录管理。1、服务目录创建(1)支持服务目录信息添加,包括目录编号、目录名称、目录级别等。(2)生成服务目录树形列表。系统根据预定义的目录级别,生成相应的服务目录树形列表,并以图形的方式展现给目录创建者。(3)将服务目录和资源服务进行关联。系统自动更新服务目录树形列表,将已关联的资源服务添加到服务目录中。(4)支持按用户的权限级别进行对应资源服务级别的服务目录展示;2、服务目录发布(1)服务目录生成人员提出发布申请后,由申核人员进行审核。审核通过后,系统将服务目录发布,并将服务目录状态修改为已发布。(2)服务目录发布后,自动向门户模块发送服务上线信息,门户更新服务目录。在发布过程中能够生成相应的系统日志信息。3、服务目录修改(1)服务目录设计者可对服务目录的信息进行修改,主要功能要求包括:(2)可通过图形界面进行服务目录的修改;(3)可对服务目录下的资源服务进行添加、修改和删除。(4)可对目录层级进行修改。(5)在修改服务目录的过程中,系统自动检查是否有用户正在申请被修改目录涉及到的资源模板。如有用户正在进行申请操作,系统给出告警提示,由服务目录设计者决定是否继续修改。(6)修改过程中生成相应的系统日志信息。4、服务目录删除运营管理人员可将已有服务目录删除。服务目录删除并不是真正将其删除,而是将其状态设置为已删除。服务目录删除,必须经过审批人员的审批。(1)支持通过图形界面进行服务目录的删除;(2)在删除服务目录时,系统自动检查是否有用户正在申请资源模板。如有用户正在进行申请操作,系统给出告警提示,由操作人员决定是否继续删除;服务目录删除后,自动向门户模块发送删除信息。(3)在删除过程中能够生成相应的系统日志信息。5、服务目录查询支持服务设计者、服务审批者和终端用户查询服务目录及其相关属性。(1)支持通过图形界面进行服务目录的查询;(2)支持通过在搜索框通过检索语法进行关键字查询;(3)支持对关键字的精确查询和模糊查询;(4)支持对查询结果进行二次查询和过滤;(5)支持按照服务目录的属性对查询结果进行排序;(6)在查询过程中能够生成相应的系统日志信息。7、服务目录导入和导出支持将所有或部分服务目录进行导入和导出。(1)支持通过图形界面进行服务目录的导入或导出。(2)导出的文件格式包括但不限于:XML、TXT、CSV、XLS、DOC、PDF。(3)支持将上述格式的文件进行导入操作。(4)在导入或导出过程中能够生成相应的系统日志信息。(二)产品包管理用户申请服务的过程中,云管理平台支持将而业务系统所需的IaaS服务、PaaS服务打包成一个产品包进行统一申请,产品包包含业务系统的各资源服务请求,也包含中间各服务的关系,管理员按照产品包的要求一次行部署,快速交付业务系统所需要的各种资源。(三)服务模板管理用户在申请服务时,需要选择所需的模板,并将带有业务系统的详细信息提交给管理员,由管理员对申请进行审批,实现从模板快速部署业务系统的功能。支持创建、修改、查询服务模板并设置模板状态。(1)创建服务模板:提供服务模板创建的功能,模板中包含资源配置、虚拟机规格、映像类别等信息。(2)配置服务模板:提供服务模板修改的功能,可以对于服务模板描述信息、虚拟机规格描述信息、配置信息进行修改。设置服务模板状态:设置待处理、可用、不可用、已删除等几种模板状态,.模板状态为等待处理时,通知管理员;查询服务模板:提供对于服务模板查询的功能。七、日志管理1、日志类型系统记录所包含的所有X86物理机资源、虚拟机资源、存储资源、网络资源、各类资源的订单和用户的数量历史信息及其当前的基本信息。系统记录每类资源的使用情况,如虚拟机系统每个分区的物理资源占用状况,块存储、分布式存储、网络资源的资源总量及占用状况。提供各类资源历史使用情况记录,统计系统中每个资源的历史使用情况,如:某个虚拟机什么时候被那个用户以什么原因启动或关闭,这些历史使用情况应存放在数据库中以便用户查询。系统提供每个订单使用资源的情况,统计系统中某个用户的所有订单使用资源的情况历史记录。提供服务实例使用情况历史记录,统计系统中每个服务实例使用资源的情况,统计系统中某个用户的所有服务实例使用资源的情况。系统提供各类订单、定单、变更、资源操作的历史日志记录。系统与资源管理系统交互产生的历史日志记录。系统日志保存需要支持可配置有效性记录时间。2、日志操作日志的设置:允许管理员对日志的容量(日志保留时间、日志占用空间)等参数进行设置。日志的查询:允许用户以多种方式查询日志的详细内容。日志的备份:提供日志的自动与手动备份功能。查看备份的日志时不能影响系统当前的日志记录。2.1.4统一运维管理平台建设方案统一运维管理平台概述传统的运维模式下运维人员多数情况下是被动维护,主要表现是不能主动预测、

发现问题,由此带来的问题就是运维工作量大、效率低、效果差。针对以上问题,本工程通过信息化运维体系的建设来提高运维工作的效率,实现医疗保障信息保障平台的统一归口管理;实现运维服务全过程的可视化管理;实现运行和安全集中监控管理最终,提高用户请求响应的服务质量,加快处理速度,提高服务水平;提高各服务公司的沟通协作,提高整体运维工作绩效。建立统一的运维管理平台,通过对IT资产、机房基础设施等硬件的定期监测,保障信息化系统的安全稳定运行,具体维护内容包括计算存储设备维护、网络设备维护安全设备维护以及应用系统维护。统一运维管理平台功能实现上划分四大平台统一运维门户、统一流程平台、运维及监控功能、统一采集平台,其中统一流程平台与统一采集平台为基础平台,支撑统一运维管理平台的各类运维和监控的功能。整体功能架构图如下所示:统一流程管理服务台事件管理问题管理变更管理配置管理业务管理业务运行数据智能化运维自动配置运维及监控IT资源管理3D数据机房机柜管理机房能耗管理统一流程管理服务台事件管理问题管理变更管理配置管理业务管理业务运行数据智能化运维自动配置运维及监控IT资源管理3D数据机房机柜管理机房能耗管理环境管理机房视频监控资源可视化机房监控网络管理主机管理网络拓扑流量管理业务访问情况故障自愈统一采集管理米集适配米集调度管理采集策略管理数据归一化管理存储管理日志管理业务故障定位健康检查厂统一运维门户自服务门户统一认证和授权可视化展示运维监控门户IT资源数据业务资源服务器资源网络资源存储资源数据库资源中间件资源图2.1-3统一运维管理平台功能架构图运维管理平台的建设还需遵循以下原则:1)实现管理的全面性运维管理系统实施后必须全面支持IT基础设施(包括但不限于:服务器、小型机、存储备份设备、网络设备、机房环境设备、计算机终端等硬件设备)、操作系统、数据库和中间件等系统,能够满足实际工作中的全方面的监控需求。运维管理系统的监控指标细致、深入,不仅能够实现对多种指标的监控,还要求能够实现查错、故障定位、性能分析和操作控制等功能。(2)实现统一平台监控要求能够对信息系统进行集中监控、集中维护、集中管理,在统一平台上实现性能、事件、报表的统一处理。要求管理系统对采集到的原始监控数据至少入库保存十二个月。(3)实现监控告警的时效性要求对监控平台能在最终用户可接受的最短时间内感知监控异常事件,及时在监控界面中展现,并将告警邮件或短信发送至监控人员或者相关管理人员。(4)开放性和可扩展性要求实现管理系统很好的开放性和对标准的支持能力,支持各种最终用户现有IT基础设施。要求实现管理系统良好的可扩展性和可伸缩性,以适应业务系统自身的不断调整、修改和优化,并要求提供监控系统自身管理模块,通过实施保证管理系统自身管理和维护的方便性。要求对应用系统提供灵活的管理支持和接口,可以方便和快速地扩展对非标准应用的支持,以监控应用的运行状态和关键参数。(5)管理系统尽可能少占用业务系统的资源若管理系统有部分监控进程需运行在业务服务器上,要求其所占系统资源要小于3%。不允许增加现有应用系统的复杂性,更不允许降低现有应用系统的稳定性。同时在系统业务繁忙时,业务服务器上的监控进程必须自动降低所占用的系统资源,避免系统资源的争用。同时要求最终用户能够自定义采集频率。(6)管理系统兼容性要求能够全面支持运行环境,兼容现有环境中监控对象的各个版本,并能够支持版本升级。(7)管理系统本身的稳定性管理系统运行必须非常稳定。系统应提供(7天x24小时)连续性服务,具备通过持续的数据维护、同步或异步错误处理服务能力,支持数据的高完整性和准确性。管理系统安全性实现运维管理系统数据、用户和系统的安全管理,包括:做到不同的功能需要有不同层次的安全接入,即不同级别的人只能进行各自权限范围内的操作;确保数据在处理的各个环节中的保密性、完整性和可用性。管理系统操作便利性要求实施后的用户操作步骤简洁,操作界面具有较好的用户体验。供应商必须提供完整详细的操作手册,对于经常发生和具有典型性的场景和事件要有详细的专题描述。要求实施后展现层在资源监控和事件管理的基础上,能够为不同的人员角色和管理需要提供灵活多样的展现方式。除了能够展现所管理资源的物理视图,还能够针对用户的应用架构、业务组成等信息来建立逻辑管理视图。统一运维门户为平台的访问入口,提供各个访问对象的自助服务系统的入口。统一运维门户为各部门包括部门领导、业务管理人员、运维人员、值班监控人员在内的各层用户提供个性化的工作门户。1、自服务门户是以个人工作为核心的工作平台,组织展现个人工作相关的各项数据和功能。个人门户可按照每个用户的个性化需求进行定制,并统一在页面进行生成和展现,构成不同角色融合的工作平台。个人门户包括个人工作台、消息中心、综合视图、个性化定制等功能。>个人工作台:包括个人工作台首页、个人工单管理、个人工作计划管理、个人文档管理等功能。>消息中心:门户可以接收各功能模块发送的即时消息,并通过门户集中展示。>综合视图:综合视图主要指面向不同用户的不同管理需求聚合各管理中心功能或数据形成各种监控视图、分析视图等。>个性化定制:个性化定制服务提供一个可由用户自己定义界面风格及展现栏目的功能,满足不同需要的用户使用。2、统一权限所有IT用户访问系统内的平台资源或业务系统的应用权限应统一进行申请、审批、分配、回收和稽核管理。统一权限是通过电子化流程实现账号权限申请、审批以及权限的分配、回收等管理过程,提供规范、易用的权限申请、审批、分配等功能。账号类型包括平台资源(含虚拟资源)账号以及业务系统应用账号>账号权限申请包括账号的增加、删除、修改,组织变更,账号锁定、解锁等。>业务主管部门对所管辖的业务系统应用账号和权限申请进行审批。账号管理员按照审批后的工单要求赋予权限,配置完成后在工单中记录操作情况。3、统一认证应具备通过综合门户整合各类专业管理平台的能力。用户登录统一运维门户时由门户认证管理模块进行统一的身份认证识别,认证通过后,系统获取该操作员使用各子平台以及各模块的所有权限,在访问权限范围内的不同业务功能时无需重复登录。>用户通过一次登录即可访问从监控管理中心、业务管理中心、运维管理中心、运营分析中心、资源管理、指标管理等各模块集成过来的功能,并根据权限展示各系统的相应功能。>门户中集成其他系统的功能模块也需要通过集中认证完成登录。>门户需要提供统一的系统用户权限管理和日志管理。>门户也可支持通过外部认证枢纽(如4A认证)配合来完成认证。4、可视化展示提供图形化的管理维护界面和各种灵活的展现方式,实现对被管资源的统一监控管理和统一展现,实现对被管资源的维护管理以及IT基础设施监控系统自身的管理,保障IT系统的正常运行。(1)展示内容实现对业务支撑系统告警、预警进行集中展现。>向不同的用户提供不同的监控界面,显示不同的监控内容。对管理人员显示对业务影响较为严重的告警和告警处理记录。对具体的维护人员,根据其分工,显示不同的监控内容,不同的告警信息,便于具体维护人员及时发现问题和处理问题。>提供完整、统一的告警监视界面,集中显示来自数据采集层和数据处理层经过相关处理后的告警事件,确保监控人员可以及时响应。(2)展示方式1)列表展现列表展现即以列表的方式展现告警信息,列表展现需具备以下功能>以电子表格的方式对活动告警信息进行滚动呈现。>在告警列表中,告警信息应以不同的颜色来代表不同的告警级别。>告警展示列表的字段需支持用户自定义,增减呈现字段后,打开告警列表时应立即生效。>在告警列表中应能够灵活过滤其需要查看的字段,并可根据字段内容进行相应告警的排序。>应能够在告警列表中方便的完成各项手工告警操作,如手工告警清除、告警级别改变以及告警的确认等,且上述操作均需通过日志的形式进行记录。>告警列表应支持手工批量的告警确认、告警清除、告警级别调整等功能。2)拓扑展现系统应该具备拓扑呈现的功能。拓扑呈现要求分层次地呈现业务支撑系统所涉及的所有被管理资源的拓扑结构。系统应具有灵活的浏览、监视和编辑的功能,同时在性能、告警、配置等方面动态反映资源环境的变化。在拓扑节点上可以查看相应资源详细配置信息,包括基本数据与汇总数据。>拓扑图呈现的被管资源范围•拓扑图应呈现的被管理资源不仅包括业务支撑系统内的所有主机设备、网络设备、数据库、中间件、存储、备份设备等,还应包括业务支撑系统应用软件的拓扑呈现。在拓扑图中要用不同的图标来区分不同的主机、网络设备、应用系统等,对应用软件的拓扑呈现,要求提供灵活的定制方式,以适合各省业务支撑系统应用软件模式的差异性和特殊状态。>拓扑图监视拓扑图在结合网络和应用环境的配置数据、性能数据和告警数据后,可以用于监视平台系统和应用系统的运行状态,反映被管理资源配置的变更情况,及时呈现与被管理资源相关的性能和告警信息,提供直观的对平台系统和应用系统的监视和处理手段。•拓扑图监视能够实时反映被管理资源告警类别与告警级别,告警要以可视、可闻的形式提醒维护人员。•能够在拓扑视图中用醒目的颜色反映网络的性能指标状态,提供性能的门限值告警的功能,具有各类性能告警门限值的重定义功能;对于应用拓扑视图,要求可表现当前业务支撑核心系统的运行状态,通过查看上层应用视图即可了解该应用是否运行异常,系统应具有灵活的告警升级方式,以便在应用视图上准确监控应用程序的运行状况。>拓扑图的分类拓扑图的分类依据维护人员的浏览、监视需要,并考虑到不同的视角、不同的侧重层次的需要。视图种类包括:应用拓扑视图、网络拓扑视图、存储拓扑视图、机房拓扑视图等。•应用拓扑视图:以业务支撑系统内的应用系统类型作为索引来组织被管资源的拓扑结构。应用拓扑视图体现被管理资源分布和关联情况。典型的业务支撑系统拓扑图是一个树型结构,实现对应用系统的管理。系统应提供方便的图形化配置修改工具,允许管理维护人员灵活修改组成业务支撑系统的相关联资源等基本配置信息。•网络拓扑视图:应支持以地理分布或网段划分作为索引来组织被管网络的逻辑拓扑。网络逻辑拓扑视图体现业务支撑系统内的被管资源分布和关联情况。应提供方便的图形化配置修改工具,允许管理维护人员灵活修改按地理或网段逻辑分布的相关联资源等基本配置信息。•存储拓扑:自动发现网络内的存储设备,呈现设备间关系,体现业务支撑系统内的被管设备分布和关联情况,拓扑图中展现设备配置、告警、性能等信息。•机房拓扑:是以机房内设备分布形成的拓扑展现,体现整个机房设备布局情况,支持机房内设备编辑,并以颜色变化体现设备的运行状态,支持机房、机柜、设备逐级下钻。2丄4.3统一流程管理统一流程管理主要对各运维流程进行管理,服务于包括运维人员、管理人员在内的各级人员,通过事件、问题等ITIL标准流程以及日常运维、安全管理等内部流程的梳理实施,规范了业务操作、投诉处理、故障响应、系统升级和需求开发等部门日常运维工作,实现了运维工作的流程化、透明化、知识化、标准化。1、流程设计统一流程平台应提供设计服务流程的图形化流程设计工具。(1)可视化设计系统应提供可视化的流程设计工具,方便灵活地定义流程和子流程,设定相关人员、角色、规则和流转条件,实现流程规范中定义的各种服务流程。系统应支持图形化设计功能,可以通过拖拽控件的方式定义服务流程。定义好的流程应该可以根据业务需求进行灵活设置和修改。系统支持流程的版本管理,设计好的流程,可以保存为不同的版本,用户可以选择使用哪个具体的版本。(2)任务管理系统保证流程中每一步骤都具有相应的责任人,而流程中的一个控制环节可能需要很多工作才能完成,例如,在变更管理中,评估是一个流程的环节,实际上评估可以分解成多个任务,例如从财务的角度去评估,从风险的角度去评估,从资源的角度去评估。流程应当支持任务管理功能。>应支持定义流程中的具体任务(工作单),并以流程图的方式显示,用户可以查询目前任务的进展情况。>每个单独的任务都可以被分配到不同的人员处理。>任务可以是串行、并行等方式进行。>任务可以定义类型,例如解决问题、与客户沟通等。(3)角色权限定义系统支持在流程中定义参与流程的角色、权限以及操作,保证在服务流程中各角色既分工明确,互不干扰,又可紧密配合。(4)流程流转控制流程的实例运转。支持但不限于以下流程的流转方式:>正常流转:表示流程正常向下一环节流转。>分配:将流程或者任务分配给相应的人员或者工作组。>接收:被分配人员可以选择接收该任务。>协办:可以转发给其他相关人员协助办理。>拒绝:工作人员认为该任务不应该由自己承担,或者自己没有能力承担,可以拒绝该流程工单,并注明理由。>撤回:当下一工作环节尚未被“执行“时,前面环节的用户可以撤回。>关闭:整个流程执行完毕。(5)流程审批对于流程中需要的审批过程,可以定义审批流程,审批流程可以组合下面所有的审批方式:>基本审批(单个):即审批人选择“批准”或者“拒绝”,或者要求用户补充详细材料。批准后方能向下流转。>多级审批:应提供多人串行审批的功能,即审批请求可以发给多个审批人,第一个审批人审批通过再把该请求发给下一个审批人进行审批;一旦中间环节中有审批不通过则整个流程被拒绝。>多人并行审批:应提供多人并行审批的功能,即把审批请求发给多个审批人,根据规则,如果有人批准或者多数人批准,即可通过审批。>批量审批:审批人可以选择多个需要审批的审批单点击“批量审批”即可在瞬间审批完大量甚至所有的审批请求。>代理审批:当审批人无法在线进行及时审批操作的时候,系统提供了一种变通的方法,可以通过具有超级审批权限的用户进行代理审批的操作,来完成应急的审批操作。>系统自动审批:当某些申请已经非常常见,无须人为特殊干预,系统提供自动审批功能,满足条件的流程自动进入下一阶段。2、服务台服务台人员对所有IT用户提交的服务请求,故障和问题等进行记录,这些记录提供了一种发现IT基础设施问题的机制。当面对同时发生的大量突发事件时,服务台提供了一种结构化的流程来安排工作优先级,影响度大且紧急的问题优先解决;同时,服务台选择最快的方式来恢复发生故障的IT服务。由于所有解决问题的方法都将被记录在问题管理数据库中,只要搜索一下该数据库,就可获得解决已发生过问题的解决方案,缩短了平均不可用时间。3、事件管理事件管理流程的主要功能是尽快解决出现的事件,保持业务支撑系统的稳定性。事件管理流程始于事件的接收和报告,结束于事件的解决。该流程包含下述主要内容:(1)事件检测和记录这个环节是事件管理流程的起点。所有用户或系统报告的IT事件必须由此步骤开始。此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。(2)分类和初步支持对于每个事件,需要确立优先级和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。(3)调查和诊断若支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时可调用多名支持人员以寻求解决措施。(4)解决和恢复支持人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。(5)优先级为紧急的事件(紧急事件)和事件升级对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理和相关的管理层,由事件经理决定紧急事件的处理方式,确保其得到最快速的解决。(6)当事件处理超过预期时限,将自动通知处理人员和相应管理层,以引起相关人员和管理人员的重视和参与。(7)结束事件当用户确认事件解决后,此时可结束该事件。4、问题管理事件管理主要是被动应付突发事件和故障,故障消除、业务恢复后事件管理应结束。如需进行进一步分析,找出故障深层原因和根本解决方案,通过变更请求(RFC)、变通方法或建议的预防性措施来防止同类故障的再次发生,应启动问题管理流程。问题管理流程的根本目的是消除或减少生产环境中事件发生的数量和严重程度,从而为企业建立一个稳定的IT环境,提高IT服务的可用性。问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。主要活动包括分析事件、找出问题、分派问题、确定根本原因以及找出解决方案、回顾及关闭,以消除事件或在其发生时降低对用户或业务的影响。5、变更管理变更管理流程将通过标准统一的方法和步骤来管理和控制所有对IT生产环境有影响的变更。变更管理流程始于变更的接收,结束于变更的实施和回顾。该流程包含下述主要内容:提出RFC、评估、分类变更申请人提出RFC,由变更主管负责检查和完善其内容,通过查询配置管理数据库,进行风险等级的初步评估;并尽量提出可能与业务发生的关联的影响,已供决策参考。变更主管并对变更进行分类;如为紧急变更,则按照紧急变更子流程执行;如为简单变更,直接制定变更计划,并安排实施。变更主管负责组织制定变更计划、测试变更主管安排并协调相应资源制定变更计划,包括实施计划、测试计划、回退计划、配置项更新计划等。应安排对实施计划和回退计划进行测试,随后将测试结果、实施计划、回退计划、配置项更新计划等提交给变更经理审核。(3)变更经理评估、审批变更经理接受RFC,如果确定是紧急变更,则快速完成评估、审批。对标准变更,确定变更风险等级,审阅变更实施计划、测试报告、回退计划和配置项更新计划,批准或驳回变更申请,如需要更高级别管理层的审批,则根据不同风险级别报批。(4)变更委员会(CAB)/紧急变更委员会(ECAB)评估、审批变更经理将根据特定的变更请求成立特定的CAB/ECAB,成员包括对该变更的评估和批准提供应有附加价值的技术人员和管理人员,审阅工作包括变更的风险、对现有服务的影响、实施计划、回退计划和配置项更新计划等,并做出批准与否的决定。如为紧急变更,则快速完成以上评估、审批。(5)管理层审批对于风险等级为“重大”的变更,在变更委员会审批通过后,必须再由变更经理报请至管理层审批。(6)协调变更实施变更主管负责协调资源,准备实施前相关工作,组织人员按计划实施变更,变更主管监控实施过程和结果,并在必要时进行协调或做出决定。在这阶段可能需要变更经理和变更委员会成员的帮助。(7)回顾和关闭实施变更后,变更主管确保配置项及时得到更新,并协同变更经理负责从技术、管理、业务角度去回顾变更,确保RFC得到了预期效果,并寻找改进机会或行动计划,在回顾过程中可能会需要得到变更委员会中相关领

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论