




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
警务云云数据中心运维管理解决方案警务云云数据中心运维管理解决方案1. 警务云运维需求分析 41.1. 警务云运维背景 41.2. 警务云技术架构 41.3. 运维管理需求分析 51.3.1. 资源管理 51.3.2. 资源监控 51.3.3. 自动化管理 51.3.4. 服务管理 62. 警务云运维方案概述 62.1. 云运维平台总体设计 62.2. 云运维平台技术架构 62.3. 与云平台集成方案 82.4. 云资源安全管控 93. 云运维平台详细技术方案 103.1. 资源配置管理(CMDB) 103.1.1. 配置数据建模 103.1.2. 配置数据采集 113.1.3. 配置数据维护 143.1.4. 配置数据应用 173.2. 集中监控管理 203.2.1. 网络监控管理 213.2.2. 系统应用监控 233.2.3. 用户体验监控 293.2.4. 集中告警管理 343.3. 运维自动化管理 373.3.1. 应用持续交付 383.3.2. 运维操作自动化 423.3.3. 自动化作业平台 453.3.4. 作业调度管理 493.4. 运维管理流程 503.4.1. ITIL流程 503.4.2. 云资源交付 513.4.3. 工单处理 523.4.4. 流程模型 533.4.5. 微信门户 543.4.6. 运维网站 553.5. 运维数据分析 553.6. 运维可视化展示 563.6.1. 大屏可视化展示 563.6.2. 可视化设计平台 573.7. 运维管理门户 584. 平台部署方案 594.1. 采控代理自动化部署 594.2. 运维平台部署 595. 平台建设收益 61警务云运维需求分析警务云运维背景近年来,全国各级公安机关大力推动信息资源汇聚共享,积极探索云计算大数据技术与公安业务的结合与应用,推动了警务工作创新发展,促进了公安信息化提质升级。信息技术快速发展,为公安信息化发展创造了新的条件。云计算、大数据技术的发展,为建立公安信息资源服务体系、加强公安内外部信息资源汇集整合、关联分析带来了可能。云计算以其超级计算能力、虚拟化能力、高扩展性、按需服务、高可用性、节能减排等特性,在公安行业得了快速的发展,当前各级公安科技部门已经基本了虚拟化平台或IaaS云计算平台,信息化水平走在前列在地区已经建设完成或正在建设PaaS、DaaS、SaaS等云计算平台,尤其是大数据、容器平台两个方面发展快速,在技术深化与实战方面取得了明显成效。但我们也在享受云计算、大数据等先进技术带来便利的同时,我们也需要注意的到云平台的分散性、安全性、脆弱性的特性。当前大多数云平台厂商提供的解决方案无法完全覆盖云计算的各个层次,同时各家产品均拥有自身的管理平台,在运维管理层面的能力也各不相同,这种分散性与能力的缺失使得运维管理复杂度加大。云平台在云资源创建、调整、销毁方面灵活快速,在带来便利的同时,存在着非常大的安全隐患,如果没有相应的管控手段,这种让云平台的这个脆弱性放大,甚至影响到的整理云平台的可用性。警务云技术架构警务云是一个系统性工程,包括基础设施层、云架构层、应用层、管控层等多个层次,各层次相互协助整合,构成完整的警务云技术架构体系。基础设施层,包括:机房环境、计算设备、存储设备及网络。云架构层,包括:IaaS、PaaS、DaaS等相关的云计算、大数据、容器平台。应用层,包括:数据库、中间件、标准应用等系统服务,及各类警务业务应用。管控层,包括:运维管理、安全管理等云管控平台(注:本方案主要讲述运维管理),运维管理主要包括:资源管理、监控管理、自动化管理、服务管理等。注:基础设施层、云架构层、应用层统均为运维管理的资源对象。警务云技术架构图运维管理需求分析资源管理警务云的资源管理需要同时将基础设施层、云架构层、应用层的各层次资源需要进行集中、统一纳管,才能真正到全面掌握云数据中心的资源全貌。为了能够及时掌握云资源,运维管理平台需要与云管理平台进行集成对接,定期获得云资源的变化情况。云的快速可变的特性,云资源很容易被创建和修改,缺乏对Openstack/VCenter/阿里云等云管理的操作管控机制,无法确认资源操作的合规性,存在明显安全隐患,需要有配套的监管手段。资源监控随着虚拟化的快速发展,云数据中心资源规模激剧增加,同时Docker、微服务架构的快速发展,使得云资源规模快速增加,资源数量级达到数十万级别甚至更高,对云资源监控的要求越来越高,开源软件和传统商业监控工具已经无法满足云数据中心监控管理的需要。自动化管理资源规模巨大的云数据中心仅仅依靠传统的人工运维操作已经无法满足当前的运维需求,需要更高层次的自动化管理能力。规范操作,知识的沉淀,降低对技术高手的依赖;提高效率、降低风险,提升运维应急应急保障能力。服务管理基于ITIL标准实现对日常维护、故障处置、变更上线等运维过程需要规范化、流程化管理,确保脆弱的云环境安全可靠,同时通过自动化工具降低运维过程中的安全风险。基于服务门户、服务目录与服务流程对提供便捷的运维服务,并通过自动化工具,在安全合规的前提下服务快速交付。警务云运维方案概述云运维平台总体设计考虑到警务云平台的技术多样性、平台分散性、脆弱性等特点,警务云运维管理平台的建设应当遵守以下原则:一、集中化管理避免多个入口、分散管理,将各类云资源管理权限回收,由运维管理平台作为云资源配置管理、资源监控的集中化管理平台,确保云资源管理安全合规;自动化管理通过自动化工具提供运维效率、降低风险、规范操作,实现知识精确沉淀,提升应急保障能力。规范化管理基于ITIL标准建立符合警务云运维实际需求的运维服务流程,通过流程化工具对运维过程进行规范化、合规化管理;可视化管理通过可视化云数据中心资源、监控、作业执行、工单流程、运行态势,提高运维决策的可视化水平。云运维平台技术架构优云运维管理平台采用微服务、大数据等互联网技术架构,统一平台PaaS层,产品采用平台+APP模式,平台提供统一采集操作层和资源库,应用APP基于平台服务和组件规范,可不断丰富扩展。平台提供服务门户作为统一的运维入口,实现各类运维管理场景。平台架构设计配置管理库(CMDB)CMDB实现对数据中心所有IT资源的配置信息管理,保证数据中心中配置项的完整性和精准性,构建运维管理元数据,并为监控、运维流程提供资源数据。集中监控管理系统提供云数据中心基础资源、业务应用、用户体验全方位监控,同时提供集中的监控告警管理及监控性能数据展示。运维自动化管理系统提供自动化操作与应用持续交付管理能力,实现运维自动化管理,提升运维操作效率、降低人工操作风险。运维管理流程系统提供基于ITIL的规范化运维管理流程,建立基于服务目录的对外服务交付过程,同时支持面向于云资源自动化交付管理。可视化展示与分析系统提供美观形象的可视化展示平台,帮忙运维管理人员准确掌握IT运行态势与运维服务水平。运维管理门户提供了运维管理门户网站、个人工作台等形式的面向外部最终用户自服务及内部人员人性化的运维界面。此外,平台还预留多种标准接口及开放的接口体系,实现和第三方系统的功能或数据集成对接,包括云管理平台、PKI认证、短信系统、邮件系统等。与云平台集成方案系统支持通过与云管理平台进行对接,包括:VMWare、Openstack(华为云、浪潮云、曙光云等)、阿里云等云平台,实现与IaaS、PaaS、DaaS等层次的集成对接,实现统一配置管理、全方位监控、操作自动化、服务流程及可视化展示。运维平台与云平台集成方案运维管理平台与云平台的集成对接方案如下:序号管理要求集成方案1监控管理支持调用云管理的API接口实现对云资源的统一监测;支持告警触发流程管理的事件工单;提供监控指标和告警事件接口。2配置管理支持调用云管理的API接口、自动化管理的发现接口,实现云资源的配置数据采集;提供配置数据的消费应用接口。3流程管理支持流程管理在审批过程结束后调用云管理的API接口实现云资源交付;支持运维流程调用自动化管理的作业。4自动化管理支持调用云管理的API实现对云资源的自动化操作管理;提供操作自动化的资源发现接口、作业的调用接口。云资源安全管控云的快速可变的特性,云资源很容易被创建和修改,缺乏对Openstack/VCenter/阿里云等云管理的操作管控机制,无法确认资源操作的合规性,存在明显安全隐患,需要有配套的监管手段。禁止在非必要的情况(如平台级的资源池、镜像、安全策略的配置管理操作等)使用云管理平台对云资源进行操作,如:云资源创建、调整与销毁,避免出现人为的非法操作与非授权的资源使用。日常周期性的维护操作需要使用自动化平台进行自动完成。日常资源申请与变更必须通过运维流程进行服务申请,在审批通过后调用自动化运维工具进行资源的操作,减少人工操作。通过配置管理库(CMDB)的全网扫描与自动化发现能力对云资源进行管理,及时发现非法的资源变更的情况,确保云环境的安全管控。云运维平台详细技术方案资源配置管理(CMDB)需实现对数据中心的物理资源、虚拟资源、软件资源及应用系统等对象的配置信息,包括配置模型的管理、配置信息的发现、配置关系的梳理、配置数据的管控,形成数据中心的配置管理库CMDB,提供统一、可信的配置数据应用支撑。配置数据建模配置管理库(CMDB)系统应当建立覆盖数据中心所有的IT资源的配置管理模型,易于理解和使用,并支持用户进行快速扩展,建立契合实际需求的配置模型。配置模型应当能够覆盖现有网络与安全设备、服务器、存储等硬件设备,及数据库、中间件、应用软件及业务系统等软件设施,至少包括以下配置项类型:1) 机房设施,包括:机柜、UPS、精密空调、配电柜、视频摄像头、传感器等。2) 网络与安全设备,包括:防火墙、路由器、交换机、IDS/IPS、负载均衡器、安全网关等;3) 服务器,包括:小型机、刀片服务器、PC服务器等;4) 存储设备,包括:存储整列、光纤交换机、磁带机、5) 操作系统,包括:Windows、AIX、HP-UNIX、各类Linux等;6) 数据库,包括:DB2、Sybase、Informix、Oracle、Mysql、MongoDB、Cassandra等;7) 中间件,包括:Weblogic、Websphere、TUXEDO、MQ、CICIS、Apache等;8) 虚拟化,包括:VMWARE、华为、H3C、阿里云等;9) 应用软件,包括:FTP、LDAP、AD、EmailServer等10) 业务系统,主要包括:警务综合系统、PGIS、打防控、视频监控等配置库应支持灵活的动态建模能力,可根据IT架构分层,自由、灵活的定义和调整配置模型,支持配置项类型、配置关系、配置表单的建模能力,所有设计与调整都基于可视化界面。CMDB数据建模配置建模能力包括资产配置项建模、关系建模以及字典目录管理和配置表单管理。配置数据采集系统支持多种资产配置信息的发现和收集手段,包括:全网扫描、配置发现、批量导入、第三方系统的集成接口等。全网资源扫描系统应当提供网络扫描工具,发现网络当中的所有IP资源,并将发现的资源标识为服务器或网络设备,发现结果进入IP地址库。应当同时扫描任务的定期执行,及时发现网络当中的IP黑户。配置采集发现系统应当提供配置深度发现工具,发现对象包括网络设备、服务器、操作系统、数据库、中间件、虚拟化等,并支持配置项关系的发现。配置数据收集维护利用了多种技术手段来保证各个来源的数据准确性和完整性,系统支持向导式发现配置功能,支持ICMP、TCP、SNMP、WMI、Telnet、SSH、CCLI、Http、DNS、JDBC、JMX、VMWare、libvirt、XenAPI等多种协议来实现配置信息的自动发现,用户可以通过发现配置向导来实现发现范围、发现参数的设置,构建合理的配置发现策略,同时支持将发现结果导入到配置管理库中。自动发现配置对于发现结果支持导出,能够通过EXECL导出并保存。配置项批量导入为了方便使用和维护,系统支持配置项信息的EXECL格式导入和导出功能,可以根据管理需要,选定所需的配置项进行导出;同时也可以将编辑好的EXECL文件直接导入到系统中,实现配置信息的批量导入。数据批量导入云平台资源采集系统支持通过与第三方系统集成实现配置数据的导入。如与华为云平台进行集成获取云资源的配置信息。与第三方系统集成获取配置数据配置数据调和从不同采集源获取到相同的资源数据时,系统能够识别并合并,并与配置库中标准数据进行比对,判断是否产生变化,如果产生变化则产生差异报告,并发出通知告知管理员进行变更审核,避免出现重复或不一致的配置信息。配置调和配置数据维护数据维护主要针对采集入库的数据进行综合管理,包括数据调和、分区管理、审核管理以及权限管理。配置分区管理系统支持数据分区管理,能够按照用户的地域、组织机构分布等因素对配置项进行分区,建立不同的管理域,各机构分别管理自己管辖范围内的配置。系统采用建立配置维护圈、社交协作化的思路,通过文化引导和规范约束结合的方法,促进配置维护圈的活跃、保证配置准确率,激发用户内在动力来做好配置维护。主要有圈子管理、人工配置维护、仓库数据的认领、配置评论、配置审核以及配置的动态展示等。支持按数据维护职责建立独立的数据维护工作区,各工作区对各自团队负责管理的资源进行认领并负责对该数据的维护管理。CMDB维护圈创建支持数据维护者根据自身维护需要创建过滤标签,快速查阅自身所关心的配置数据;支持对配置数据开放式的评论、点赞,提升数据维护的积极性与团队协作。数据开放式的评论、点赞配置审核管理配置数据的变更生效由工作区负责人审核决定,确保变更的快捷有效。变更审核时支持查看配置数据变化报告。配置数据变更审核支持对工作区内所有资源的数据变化时,可实时通知数据的订阅者或第三方系统,并告知变化内容。配置变更跟踪系统支持实时数据跟踪功能,能够跟踪配置和资产的当前状态信息,针对配置管理,系统能够支持配置项的版本跟踪和维护,当配置项产生新的版本时,系统能够自动跟踪、记录、更新并保存原始版本记录,对于存在多个版本的配置信息,系统还支持版本之间的比较。配置数据变更动态配置权限管理数据维护工作区拥有独立的团队成员管理权限,支持成员增加、删除;配置数据应用配置应用场景管理支持按应用场景建立配置数据应用区,支持从统一配置库当中选择所需的配置数据,并支持基于配置数据标签进行数据的批量导入。数据应用区中,不仅能查看配置项数据,还能根据管理创建所需要的配置关系,同时也查看到其他团队所创建的配置关系。配置关系展示数据应用区可以被监控系统、运维流程等模块进行调用,用于各类配置数据应用场景分析。配置数据查询系统提供了全文检索的能力,能够对所有配置信息通过全文检索的方式进行数据查询。全文检索支持对配置信息的附件信息进行检索,同时系统还提供了最近搜索记录功能,能将最近、常用的搜索的关键字进行记录,通过点击快速进行检索。数据全文检索能力配置与流程关系管理系统支持和流程进行关联,一方面可以直接从配置项发起相关流程工单,如事件、变更等;另一方面由变更流程引起的配置项变化,再变更流程工单完成时自动进行变更审核;对于和配置项相关的工单,在浏览配置项时均可查看其所关联的工单信息,如该配置项发生过哪些事件工单、有哪些变更等。用户还可以通过在配置管理界面直接发起运维工单,就该配置项开启流程运转。配置项与工单关联配置关系管理系统支持配置关系管理,提供直观的关系列表和可视化视图,通过配置关系管理,可以帮助管理人员快速了解该配置项与其他配置项之间的关联关系,从而帮助管理人员快速评判该配置项的重要程度和依赖关系。配置关系展示当该配置项出现故障能够快速评判其影响范围及影响程度。集中监控管理要求能够实现对现有的网络设备、主机/虚拟机、数据库、中间件、存储、业务应用等各类云资源的监控管理,提供面向业务应用用户体验监测能力,并提供故障告警、性能数据、监控展示的集中化管理。全方位监控工具体系、集中监控管理网络监控管理网络监控工具面向网络运维人员,为其提供相应的技术工具,实现网络拓扑结构、网络故障、网络性能、网络配置的实时监控,及时发现网络故障、流量异常,提高网络管理效率,确保网络的安全性和可靠性。系统支持大规模、分布式管理需求,能够适合大规模、分域、分级等管理特点。支持多层级联部署,满足网络隔离以及单向通信的需要,以及满足大规模部署的要求。网络拓扑发现系统支持自动网络发现能力,能够实现对华为、华三、锐捷、神码、中兴、CISCO等主流品牌设备自动发现,支持局部发现某个设备的邻居设备,并支持自动网络拓扑构建。系统支持全局网络拓扑与分层网络拓扑,全局拓扑显示所有的网络设备及关系。分层网络拓扑支持通过拓扑逐层建立组合的方式,支持构建骨干网拓扑展示,也可以根据业务管理场景进行拓扑构建。网络拓扑管理网络拓扑支持良好的拓扑交互,通过高亮显示指定设备及相关设备,能快速分析设备间的关系;也支持放大、缩小等地图式操作功能。支持在在拓扑上显示设备与链路的性能负荷。支持通过IP、设备名等关键字快速搜索与定位设备。网络设备监控系统支持发现与监测主流厂商的网络设备,设备性能监控指标包括:在线状态、Ping延时、CPU、RAM、端口状态、端口速率、端口包速、端口丢包率、端口错包率等。网络链路监测系统支持对网络链路的发现与监测,能够自动发现二层、三层网络链路,并支持对网络链路可用状态、丢包率、包延时的监测。网络事件管理系统支持网络设备发出的SNMPTrap与Syslog告警事件,并对进行告警事件进行事件关联压缩,能将对称的事件或重复的事件压缩,在界面上只显示事件的最新信息,并能点击查询事件的相关信息系统应支持事件的关联分析,并提供实时事件浏览界面,以对实时关注当前系统中发生的各类事件,以便对故障采取快速响应行动。系统应用监控系统支持数据中心计算、存储、网络等基础资源以及对运行于基础资源上的数据库、中间件等平台环境的监测。系统应具备大规模、分布式管理能力,能够适应大规模资源管理要求,系统的部署不会对现有环境产生影响。服务器硬件监控系统对IBM、DELL、HP、华为、浪潮、联想等国内外主流品牌的服务器硬件监控,支持通过IPMI协议实现监测,监控指标包括:服务器电流、传感器风扇、传感器状态、传感器温度、服务器电流、服务器电源功率等。服务器硬件监控存储监控监控系统支持对主流存储设备的监控,包括:HP、IBM、EMC、华为、HDS、Netapp等,技术手段包括:SMI-S、SNMP。监控指标包括:存储阵列、物理磁盘、存储池、控制器、存储卷、存储卷组等。存储设备监控若设备支持,支持监控设备环境参数,如温度、风扇、电源电压等。并能支持基于SNMPTrap、Syslog方式接收存储设备主动告警。虚拟化监控系统支持对VMWare虚拟化平台的监控管理,监控指标包括:虚拟机集群、物理机CPU、物理机内存、物理机磁盘、虚拟机CPU、虚拟机内存、虚拟机磁盘等。虚拟化监控IaaS云管理平台监控系统支持通过与IaaS云管理平台进行对接实现云资源监控,支持Openstack(华为云、浪潮云、曙光云等)、阿里云等云平台监控。云平台监控Docker虚拟化监控除虚拟化及IaaS云平台监控之外,同时支持对新兴的Docker监控。Docker监控操作系统监控可监测众多的服务器操作系统,包括:Windows、Debian、Ubuntu、CentOS、Redhat、MacOSX、Fedora、CoreOS、AIX、HP-UNIX。支持通过SNMP、CLI、WMI、代理Agent方式监控服务器,Linux/Unix系统的CLI监控方式应当同时支持SSH及Telnet两种方式。可自动监测服务器的各类性能指标,包括:CPU、RAM、磁盘、负载、文件系统、网络、监测、服务等指标;操作系统监测可自动监测服务器重要事件,包括:WindowsEvent、Syslog;可监测一些常见的系统服务,包括:HTTP、DNS、TCP、SSH、SNMP、WMI;中间件监控系统支持对各类中间件进行监控:Web服务中间件,包括:Apache、Tomcat、IIS、Nginx、JBoss、Lighttpd、Weblogic、Websphere;中间件监测缓存中间件,包括:Redis、Memcached
;消息中间件,包括:ActiveMQ、RabbitMQ、Kafka;大数据中间件,包括:etcd、HAProxy、Elasticsearch、Hadoop(HDFS、MapReduce
、Zookeeper);数据库监控系统支持传统关系型数据库与NoSQL数据库的监控:可监测各类传统关系数据库,包括:MySQL、PostgreSQL、SQLServer、DB2、Oracle、Sysbase、InformixMysql监测可监测各类NoSQL数据库,包括:Cassandra、MongoDBCassandra数据库监控MongoDB数据库监控大数据架构监控当前云数据中心在大数据方面发展势头明显,大数据云成为云数据中心的主要研究方向之一,同时也是云数据中心与实战结合的关键点。在大数据云的建设方面Hadoop技术占据的重要角色,运维系统支持面向Hadoop核心组件(HDFS、MapReduce
、Yarn、Zookeeper)及内部消息中间件(RibbitMQ)的监控。Hadoop2的监控支持情况以HDFS为例,监控指标包括:监控指标应当包括:总容量、损坏块、数据节点(DataNode)相关指标、HDFS空闲空间、HDFS使用磁盘空间、HDFS使用空间总数、丢失磁盘块数量、主节点(NameNode)相关指标、复制的磁盘块总数。大数据监控架构用户体验监控用户体验监测要求实现对业务系统的应用前端(WEB\APP)的运行性能、故障、用户操作体验、及用户行为的监控分析,为应用前端性能优化、故障处理、用户体验优化、应用评估提供数据支撑。监控数据方式应当采用对应用尽量小的方式,应采用轻量级的插件,不应对应用业务逻辑进行改造。系统应具有良好的水平扩展能力,能够支持未来增加被监控业务系统的性能要求。应用总体分析系统应当支持前端应用运行分析,展示应用总体访问情况,支持按访问用户数、操作数、错误数进行排序,方便领导和管理人员了解某项应用系统的访问分布情况,对应用的关心程度和使用情况等进行全面的分析,掌握热点应用、僵尸应用。应用访问总体分析支持分析应用的界面性能、运行错误、用户轨迹、访问热力图等,并提供性能、错误、用户访问等主题数据看板,展示数据变化趋势。应用访问概况用户访问热图支持展示用户访问业务系统的所关注页面区域,了解热点页面与热点操作。用户访问热图前端性能分析系统支持运营商、地域、浏览器、操作系统、访问页面/操作等多维度性能分析。应用前端性能分析系统支持监测页面各组件(包括Html文档、JS文件、CSS、Ajax资源、图片、字体等)加载性能:包括卸载、重定向、应用缓存、DNS、TCP、请求、响应、组件加载、渲染等全过程耗时情况。支持监测Ajax请求的请求、回应、回调耗时,并支持请求错误码采集。应用操作性能分析页面错误分析支持按照浏览器、操作系统、运营商、地域等角度分析JS错误的分布情况,并提供排名显示哪些浏览器版本、或操作系统版本错误发生最频繁。前端错误变化趋势应当支持识别发生前端错误的用户列表,了解其所在的区域、使用的浏览器类型及版本、运营商、分辨率、终端类型等信息,并支持记录用户应用访问的操作路径。同时支持定位页面发生的代码位置。前端错误定位用户访问分析可以按照着陆页、操作系统、运营商、地域等角度分析会话的分布情况,并提供排名显示哪些浏览器版本、或操作系统版本使用的用户最多。支持某个用户最近1个月的应用访问趋势,并提供对用户操作行为的分析,掌握用户应用操作过程路径,记录每一个操作会话时间、操作数、平均响应时间等。用户应用操作过程路径监测可视化配置支持通过可视化界面设置监测数据采集点,需提供浏览模式与标记模式,支持页面上的菜单、按钮、图片、超链接等可操作的元素设置采集点,应用不需要做任何开发。可视化监测埋点集中告警管理对告警事件进行统一的处理和分析,将IT环境中产生的异构、复杂且关联的事件信息通过集中的处理平台进行格式化、过滤、归并和关联分析,并将处理结果发送给管理人员,帮助管理人员对各种事件进行有效的分析和后续处理。告警接入管理系统支持对广通现有监控系统(网络监控、系统监控、应用性能监控等工具)告警统一接入,也支持对ZABBIX等开源监控系统的告警接收。告警接入管理支持通过可视化界面自定义规则实现接收和解析对来自第三方的SNMPTRAP的告警事件可将事件转换成标准格式。区块化告警展示系统支持对告警流水式查看,能够通过时间轴查看告警生成情况,并通过查看某个时间的告警事件。也支持通过区块化方式查看告警事件,支持通过告警关联对应的资源业务标签,通过业务标签对故障告警进行区块化分类汇总。通过区块化对告警的告警数量、紧急程度进行呈现,方便运维人员直观快速的掌握告警信息。区块化总览告警告警操作处理系统支持对告警流水式查看,能够通过时间轴查看告警生成情况,并通过查看某个时间的告警事件。支持自动从CMDB关联数据,并为每条告警打标签,提供基于标签分类的告警区块化展示告警详情查看 支持对告警事件进行归并、解除、关闭操作,支持对事件解决方法的记录,并支持基于告警事件触发运维流程工单。故障影响分析支持基于时间线进行告警分析,并提供故障影响可视化分析,掌握故障告警态势。故障影响分析事件处理规则支持可视化界面设置告警处理规则,包括:告警通知、告警抑制、告警关闭/删除等。告警抑制规则支持按告警时间、源地址、等级、类型等维度进行设置设定,避免不必要的告警。运维自动化管理广通软件基于多年的运维项目的建设,充分理念当前互联网的自动化运维实践,提出面向到数据中心的双态环境下的自动化运维管理方案。自动化平台架构全面的资源自动化纳管能力支持对X86架构从物理机、虚拟化、操作系统、数据库、中间件及应用软件的自动化管理能力。同时支持AIX、HP-UNIX等小型机的自动化操作,并具备一定能力的网络自动化管理能力。内置运维行业实践自动化脚本库系统内置丰富的运维操作脚本库,提供自动化运维行业实践,并支持Python、Shell、VBS和Windows的批处理脚本类型。丰富的运维自动化场景系统支持数据中心应用持续交付与运维操作自动化两大类运维场景,包括:环境准备、环境设置、应用部署、应用升级、自动化巡检、文件备份、合规检查、批量作业、故障处置、应急切换等。可视化场景编排系统支持基于工作流引擎的运维作业自动化场景的可视化编排,可以满足各类本地化的运维自动场景的业务需求。作业调度管理提供了全局作业总览,直观呈现了自动化作业的各方面情况,包括管理了多少资源、做了那些操作、操作的状态以及重点作业任务的当前执行情况等,方便管理层了解IT环境中运维自动化和任务执行情况。应用持续交付环境准备系统支持虚拟化环境与物理环境的准备,支持虚拟机创建与裸机安装。服务器裸机安装系统支持X86服务器的裸机安装。系统支持自动发现数据中心中已上电启动的服务器,并识别出服务器的硬件配置信息,系统会将这些信息收集起来展现在界面上,厂商、型号、CPU、内存配置等信息一目了然。
在安装系统之前,需要事先创建好需要安装的操作系统模板(也称系统镜像),Automation提供直观的系统模板管理能力,您只要动动鼠标,就能搭配出需要的系统模板。一个系统模板由系统的类型、系统架构(32/64位)、SN序列号、ISO镜像文件和驱动文件组成。
获取系统模板和所发现的裸机服务器信息后,我们可以选中一些服务器,对其进行系统的自动化安装。裸机安装虚拟化创建系统支持对VMware、Openstack、阿里云的自动化虚拟化的创建。以VMware为例,对接VMwarevSphere的集中管理系统vCenter6.0,实现虚拟机的自动克隆、配置修改和运行及在其上自动部署Automation的Agent。创建虚拟机作业执行过程容器(Docker)创建系统支持容器的创建,支持根据容器镜像进行容器的快速部署。Docker更新参数设置环境设置系统对服务器、应用系统各类参数的修改与调整,比如修改操作系统的句柄数、交换区大小等。环境参数修改应用部署系统支持数据库(Oracle/OracleRAC、Mysql、DB2、MongoDB等)、中间件(Weblogic、Apache、Tomcat、Ngix等)、应用(Web应用)的安装部署。系统同时支持补丁的安装与部署。Weblogic集群部署、参数调整、JDBC连接池修改和应用部署应用升级系统支持数据库(Oracle/OracleRAC、Mysql、DB2、MongoDB等)、中间件(Weblogic、Apache、Tomcat、Ngix等)、应用(Web应用)的补丁的安装与应用升级。运维操作自动化自动化巡检系统支持对各类资源进行自动化的巡检,及时发现资源的运行参数和状态,自动化巡检通过编写相应的脚本,获取相应的参数,并生成相应的巡检结果报告。系统巡检文件备份系统支持针对关键文件与数据库数据的定期或手工的备份操作。合规检查支持依据公安部安全管理规范及风险预警制定自动化作业,实现自动化合规检查。合规检查批量作业系统支持对系统参数调整、文件操作、数据备份等日常运维工作的批量化执行。故障处置系统支持通过对脚本的编排,单发生复合预设规定的故障信息是,支持手工或条件触发故障自动恢复作业,实现对故障的自动恢复。故障自愈应急切换系统支持针对不同应用系统的技术架构与部署情况进行切换操作脚本的编写与切换场景的编排。自动化作业平台资源管理系统支持代理和无代理方式进行资源管理,能够同时纳管服务器、数据库、中间件、虚拟化、网络与安全设备等,支持查看资源操作日志。提供被管资源的配置信息采集能力,能识别服务器上的资源类型,并自动设置资源标签。提供与CMDB库配置数据同步能力,能够从CMDB导入资源列表。支持对资源标签的标识能力,支持根据标签进行资源检索。被管资源管理文件仓库系统内置文件仓库,并内置常用的标准安装文件和镜像,支持文件上传与下载,可配置映射数据中心现有FTP服务,同步文件信息。文件仓库与FTP集成自动化操作应当提供内置运维操作脚本库,内置从虚拟资源、部署、配置变更、巡检等场景的丰富操作,可灵活定义输入、输出参数,支持多种数据类型。系统支持数据中心自动化运维操作场景如下:资源层技术方式自动化操作场景L6业务系统自动化代理应用部署L5系统应用(数据库、中间件等)自动化代理软件安装、参数调整、配置采集、服务启停、……L4操作系统自动化代理服务启停、参数调整、配置采集、文件管理、账号管理、系统关机与重启、……L3IaaS云平台API资源启停、模板管理、参数调整、配置采集L2虚拟化层API资源启停、参数调整、资源销毁、配置采集L1服务器硬件IPMI服务器启停、状态与性能巡检、配置采集 支持根据操作管理需求创建各种操作脚本,支持Python、Shell、VBS和Windows的批处理脚本,并支持在线脚本的调试能力。操作脚本库作业场景编排系统具备可视化流程编排的能力,通过资源、操作、文件仓库三者结合实现面向运维场景的作业编排能力,支持参数输入及多样化结果输出。系统支持表格、DSL、图形化的场景编排能力,适用于不同技术人群。作业场景编排编排支持设定手工或定时执行,重要的操作步骤支持人工确认互动,确保任务执行无误,当有任务执行出错时可继续或中断作业的执行。支持作业场景的克隆、导出及导入功能,提供作业场景的复用能力。作业执行作业任务支持多主机分布式并发执行,可高效执行编排作业,能详细记录作业执行过程,可动态查看作业执行过程,可按执行目标主机回放查阅执行日志。作业执行作业调度管理系统还提供了全局作业总览,直观呈现了自动化作业的各方面情况,包括管理了多少资源、做了那些操作,操作的状态以及重点作业任务的当前执行情况等,方便管理层了解IT环境中运维自动化和任务执行情况:作业总览运维管理流程优云运维流程基于“双态运维”理念,完美整合ITIL、DevOps理念,采用社交化元素提升流程处理的协作能力,提供更加敏捷的运维管理流程。运维流程基于服务目录实现运维服务明确,提供运维门户与微信公众号等服务接入方式,并通过流程与自动化平台的对接实现云资源自动化交付等快速交付场景。运维流程整体设计思路ITIL流程运维服务流程应支持ITIL、ITSS运维理念,通过规范服务流程和技术服务工作,基于随需定义的服务流程引擎,建立一套标准的运维服务流程,围绕服务目录、事件管理、问题管理、变更管理、服务请求管理等,实现IT运维服务的流程化、规范化管理。内置ITIL流程1、事件管理,支持故障的记录、分类、处理、解决的流程管理,确保故障尽快恢复。2、问题管理,支持问题的记录、识别、调查、诊断、解决的流程管理,预防同类情况重复发生。3、变更管理,支持变更的请求、评估、审核、实施、确认的流程管理,确保变更有序实施。4、服务请求管理:支持服务请求的记录、分类、处理,确保服务尽快交付。流程同时能与服务目录进行对接。5、服务目录与服务水平:支持服务目录的创建与维护,支持服务项上下线管理,当服务项处于上线状态表示可用,用户可以申请该服务项,当服务项处于下线状态表示可用,用户不可以申请该服务项。支持为各项服务项设置服务水平(SLA),并提供服务水平报表。云资源交付运维流程通过与自动化平台的对接实现云资源自动化交付等快速交付场景,包括:虚拟机创建、调整和销毁;容器的创建与销毁;工单处理系统支持社交化、敏捷化的工单处理。1、工单导航:支持分类导航显示工单,包括待办工单、关注的工单、参与的工单和所有工单查询。2、工单处理:支持社交化的工单处理,提供信息回复、工单关注功能,并能以流程环节分组方式展示工单处理动态。支持通过微信公众号进行工单新建与处理,同时可以查看待办、关注、参与的工单。3、工单通知:工单处理过程中支持邮件、短信、微信、站内信等方式将工单提醒通知给相关用户。4、阅知提醒:在流转过程中支持短信或邮件形式给相关人员发送阅知信息,发送阅知信息不影响流程流转。社交化流程处理流程模型系统支持灵活的流程设计能力,可根据实际管理环境和管理需要自由、灵活的定义和调整流程模型。敏捷流程设计引擎1、流程设计:支持WEB在线的流程自定义,实现流程环节可定义,流程处理人可定义,流程展现可定义,无需任何编码。2、流程表单:支持流程在不同环节展现不同的表单,表单支持自定义字段,字段类型包括时间、短文本、数字、长文本、附件、下拉列表、单选项、多选项、图片等,表单支持复制功能;3、流程动作:支持流程环节触发定时任务和自动任务,支持触发自动化作业等外部任务;4、流程模型:支持流程模型的复制、删除、启动和停用功能。支持流程模型的授权功能,不同的流程由不同的用户进行管理和使用。。微信门户系统支持通过微信方式来实现流程工单的发起、审批、处理和关闭,通过和企业微信公众号关联,实现运维流程在PC端和手机端的同步处理。系统实现了微信公众号的对接,可以基于微信公众号,实现工单的处理,微信ITSM提供了创建工单、处理工单、评论、工单消息通知等功能。运维网站系统提供运维门户,支持基于服务目录对外提供运维服务,业务人员可以通过服务目录进行服务提交、工单处理进展查看等操作。运维数据分析系统后台建立运维数据仓库,监控性能与告警、配置数据、运维工单等运维数据存储于数据仓库当中,通过环比、同比、分类等多种方式进行运维统计分析。系统具备可灵活设计的报表开发工具,实现个性化报表定制。报表包括:可用性分析:网络、服务器、数据库、中间件、虚拟机等软硬件的可用性统计报表;业务系统可用性分析报表性能分析:通过资源的运行性能进行分析,掌握运行性能趋势分析,诊断性能瓶颈;容量分析:从业务数据、运行性能数据等角度提供IT基础设施的容量分析报表;服务质量分析:对事件、服务请求、问题、变更等运维工单的执行质量进行统计分析。运维可视化展示可视化展现系统的提供了从网络系统、主机服务器、数据库、应用、安全等几方面的运行状况的集中展示管理平台,平台提供当前运行一览视图、业务一览视图、业务监测视图、网络监测视图、机房展现视图等多种监测视图来查看当前系统的整体运行情况,并
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 静电接地施工方案
- 中卫彩灯订做施工方案
- 高层外墙防水施工方案
- 超大楼梯施工方案
- 自动扶梯施工方案
- 吊顶喷淋头 施工方案
- 温州磨石地坪施工方案
- 路肩墙干砌片石施工方案
- 员工心得报告评语
- 常州绳锯桥梁切割施工方案
- 住院患者静脉血栓栓塞症预防护理与管理专家共识解读
- IATF16949-2016标准和内审员培训
- 2024年共青团入团积极分子考试题库及答案
- 2024年江苏农林职业技术学院单招职业适应性测试题库汇编
- 《中国痤疮治疗指南》课件
- 《休闲农业园区管理》课件-第三章 休闲农业的生产管理
- 2024年常州机电职业技术学院单招职业适应性测试题库及答案解析
- 2024年人教版小学语文六年级下册第二单元测试卷(含答案解析)【可编辑打印】
- 统编版八年级语文下册 24 唐诗三首练习题 (含答案)
- 教育技术学研究方法基础
- 幼儿园大班科学课件:《植物的生长》
评论
0/150
提交评论