版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、新技术背景下的运维管理平台议程1行业趋势分析2技术能力提升规划3成功案例分享-中行2未来信息化技术的发展趋势3大数据移动互联与社交工具云计算与物联网行业趋势近年来,云计算和物联网将深刻改变基础设施的建设方式,也是当前大型企业、互联网的IT建设正在考虑和投入的重要领域对运维带来的变化云计算将传统的运维模式逐步过渡到集中化、服务化、自动化和远程化的服务交付模式物联网实现了对设备的智能化管控,通过和配置集成,实现对设备资源管控的自动化、智能化和集约化未来58年,云计算、大数据、移动互联、物联网和社交工具等将引领信息化技术发展的趋势。随着这些技术的广泛、深入和成熟应用,将对IT基础架构带来巨大变革,同
2、时也改变了运维管理的工作内容、工作模式。技术趋势行业趋势互联网式的交互方式改变了传统人与人的交互方式,并进一步蔓延到企业及运维领域,也对运维工作产生了新的影响对运维带来的变化移动互联实质上扩展了运维的外延,实现任何地方、任何时间均可开展运维工作社交工具则改变了运维团队的指挥与互动体系,改变了技术人员之间、技术人员与用户之间的交互方式,使得技术支持对用户而言变得更为亲切,效率也更高行业趋势云计算、物联网、移动互联网等新兴计算形态,既是产生大数据的地方,也是需要大数据分析方法的领域;在未来一段时间内,大数据将成为企业、社会和国家层面重要的战略资源对运维带来的变化传统运维强调电子化、自动化,而大数据
3、的应用则赋予运维管理一个新的方向,即洞察力,通过大数据分析获取更多有价值的信息,引领有限的资源投入到更有价值的业务领域信息部门运维支撑的发展模式4移动互联与社交网络故障管理发布变更监控管理日常作业服务请求服务请求离散雏形阶段项目2项目3项目1机房环境与网络多活和混合云环境数据集中处理应用中心生产中心:客户服务与运行应用维护和监控系统与平台软件网络与安全管理机房环境与设备灾备中心:系统与平台软件网络与安全管理机房环境与设备故障管理发布变更监控管理日常作业服务请求服务请求统一运行监控大数据支撑下服务管理中心统一资源管理云外网核心节点开发应用维护系统维护开发应用维护系统维护开发应用维护系统维护内网核
4、心节点的建设往往就地取材,没有规划,专业性不强;IT组织以建设任务为导向,常常随IT项目建设边使用变改造;运维专业化程度处于较低的水平,缺乏专门的管理目标和管理手段缺乏规划,分割管理、摸索建设数据集中存储、处理,应用和业务集中化;外网核心节点建设依托有效规划,更加现代化,大规模外网核心节点引入“两地三中心”模式引入运维流程框架,通过流程实现跨部门的运维任务在各个专业部门之间的贯穿和协同整体规划,专业运维外网核心节点在逻辑上成为一个整体,要求运维组织不再按照专业领域进行部门划分,而是按照物理/逻辑进行部门设置划分外网核心节点“高可用性”有了基础级保障,运行维护工作核心开始围绕服务和资源的合理提供
5、、监管和调度。应用与基础设施松耦合,资源服务化 中国真正意义上集中式、大规模的外网核心节点,源于2000年开始的数据集中工程,已从银行业延伸到证券、保险、电力、电信、石油等行业。经过十多年的发展,已从建设离散雏形发展到数据集中处理应用中心,并逐步走向多活和混合云环境阶段 随着自动化、云计算、物联网和大数据、移动互联等新技术逐渐推进,另一条主线是从依赖于员工技能建设,逐渐向运维一体化、操作规范化、进而往自动化发展、最终向智能化演进物联网支撑下的无人值守机房机房-IV机房-III机房-II机房-I云计算带来的基础架构变化5混合云交付应用环境基础架构层具备软件定义能力与应用脱钩标准化、满配云资源调度
6、层异构资源服务封装软件定义资源调度和容量管理软件应用层统一应用基础平台软件定义应用交付逐步形成PaaS服务能力OLAPMobileOA01011010OLTP资源服务资源服务应用开发平台、应用运行基础平台资源API资源API资源API资源API云平台软件定义(资源与服务、应用脱钩;按需配置组装交付)基础架构服务企业应用系统基础架构VM企业混合云尽管不能照搬互联网的方案,但是IT部门在整合自身现有的传统异构、复杂的基础架构环境的基础上,需要进一步提升软件定义应用环境交付能力,通过统一基础平台,封装统一的IT组件,面向传统架构、大规模虚拟架构和互联网架构提供支持。传统架构大规模虚拟架构互联网架构物
7、联网带来运维范畴的延伸和方式的变化6运维方式的改变物联网物联网的应用将物理基础设施和IT基础设施整合为一,通过一系列的信息交换技术和传感设备,将任何物体和互联网、IT连接起来,以实现对机房和服务器设备的智能化识别、定位、跟踪、监控和管理,对运维范畴和运维工作方式带来了较大变化运维范畴延伸:物联网是在互联网基础上延伸和扩展的网络,通过信息交换和通信技术及设备,把机房和服务器设备与互联网相连接,反过来推动了运维范畴的延伸设备智能管理:通过与配置管理集成,通过信息传感技术获取物理设备的信息,实现远端物理设备的智能与快速处理自动反应处理:能够根据温湿度检测结果来自动调整精密空调的送风情况,实现部分运维
8、工作的自动化云计算与物联网支撑下的新型机房7无人值守机房以视频监控为主,辅以动力环境监测、综合报警处理和门禁控制信息等。采用先进的图像识别技术,能够对各机房的电路短/断、环境参量、现场状况进行监控和报警,能够实时、直接地了解和掌握各个机房的情况,及时对发生的事件做出反应。资源云化面向云计算和虚拟化,采用“分割”资源方式,将服务器、存储、网络设备等资源进行虚拟化,以便用户调用所需的计算资源、网络资源、存储资源、数据库资源等。自动化运维采用基于流程化框架的技术工具,将事件与IT流程相关联,检测事件后可自动启动故障响应和恢复机制。自动化运维还可帮助IT运维人员完成日常的重复性工作,提高IT运维效率。
9、同时,自动化运维还要能够预测故障、在故障发生前进行报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。远程监控与操作包括“监”和“控”两部分,“监” 主要是通过网络获得信息为主要手段来实现对环境和计算机系统的监视;而“控”是指通过网络对远程计算机系统进行操作的方法。新型机房特征 云计算与物联网的结合,使得未来计算资源的交付方式转向集中化、自动化和远程化,传统的IT资源将向虚拟化、动态化过渡,同时通过机房远程维护和无人值守等技术,让运维资源更加集约化,运维成本更加经济化案例解读8集中运维国内大型企业集中运维国际大型企业集中运维中国人保用户背景:2010年开始推动全国大集中,在广东佛山建
10、立南中心、背景成立了生控中心,全国40多个分公司原IT技术人员通过远程方式承担对本省应用系统的维护职责;目前整体运行模式还在调整优化过程中,但运维工作已经走上正轨。IBM(美国)集中运维模式在国外已有十多年的成功应用经验,国内大型企业也在数年前开始应用这一模式并取得一定成绩,随着云计算、大数据、物联网、移动运维等技术的深入应用,大集中运维模式已经成为未来运维发展的趋势运行模式:南中心目前承担机房设施、基础架构硬件设施的维护工作;北京生控中心负责虚拟化和操作系统以上到应用平台等各个逻辑层面的日常维护工作,以及运维管理平台的建设和维护,加上部分提供全局服务应用系统(统一门户)的维护;分公司负责本地
11、业务系统的应用逻辑和数据部分的维护。用户背景:1998年把全球对内服务的105个外网核心节点整合为北美、欧洲和中东、亚太、日本等4个区域中心。其中北美由原来60多个外网核心节点整合为5个外网核心节点,由分布在全美10多个城市的原有的IT队伍进行维护。运行模式:5个外网核心节点各有一个本地运维团队,负责机房设施和基础架构硬件的维护和日常工作,其他十几个城市中的技术人员组织为网络、服务器与存储、平台软件、应用系统和总工等5个团队,其中,总工团队负责重大故障的端到端诊断、变更审核和技术架构规范、架构审核等工作。移动互联对运维方式带来的变化9日常操作与物联网结合,将整个机房的巡检、设备入库、设备盘点等
12、通过移动终端、物联网与配置管理联动的方式来实现自动化,并简化信息采集与维护步骤信息推送移动互联是大数据的延伸终端,能够将大数据挖掘的有价值信息通过热点推送的方式,来及时、简洁的推动到有消费需求的用户手上移动运维实现运维流程环节下移到移动终端,如通过手机、平板电脑实现流程环节的审批和监控信息的浏览,将技术和管理人员从办公座位上解放出来,实现任何地方、任何时间办公移动互联是一种通过智能移动终端,采用移动无线通信方式获取业务和服务的新兴业务,用户可随时随地乃至在移动过程中都能方便地从互联网获取信息和服务移动互联社交工具对用户体验带来的变化10社交工具的快速发展对人际交互的方式和沟通成本产生了巨大的影
13、响,改变了以往或效率低下(邮件)、或单点沟通(电话)的交互模式,使得信息交互能够在更多人之间、更加通畅的进行;同时作为移动互联的外延手段,进一步促进运维工作模式的变化社交工具移动互联的外延社交工具作为移动互联外延的一个手段,增加了用户提交请求、技术人员相应请求的方式和选择,进一步促进了“在任何点点、任何时间均可办公”的运维模式面向人际沟通对外部用户而言,良好的社交工具有助于服务请求的快速响应和及时处理、跟踪,并且互联网式的沟通方式也拉进了用户和技术人员的距离,提升了用户体验对内部而言,良好的社交工具则能够促进技术人员之间的沟通交流,有助于问题的解决和知识的有效积累面向多用户支持面向多用户发生同
14、类问题时,良好的社交工具可以实现一对多、同时段的技术支持和服务交付,对技术人员来说解决了多个用户并发请求支持的情况,对用户而言则加快了技术响应时间大数据分析对运维决策带来的变化11面向决策分析的大数据技术大数据分析大数据分析是指所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到存取、管理、处理、并整理成为帮助企业机构管理、经营决策更积极有效的资讯,而产生的数据分析技术。 大数据对运维管理产生的影响大数据的特点:Volume: 大数据量Velocity: 数据产生速度Variety: 数据多样性Value: 数据价值大数据在运维管理中的应用 更完整的数据分析对全部数据而非样本的分
15、析,提升运维洞察力 更早的预防预测在有迹象时而不是发生故障时,提升业务可用性 更及时的运维处理随时反馈,及时准确,快速响应,提升运维保障能力 更有效的人际交流可以通过社交网络提升技术人员与用户、技术人员之间的交互体验,使得沟通更加灵活、便捷决策分析商业智能和预测分析风险分析决策管理内容分析大数据分析预测分析分析整合与治理内容分析决策管理社交媒体分析新技术趋势下的一体化运营理念12运维洞察力云计算、物联网下基础设施服务驱动在“混合云”环境下,不仅软硬件资源供应服务化,运维工作也开始服务化,成为云服务的一部分。同时,移动互联和社交网络将互联网方式带入到企业网中,推动和提升了服务体验。所以,新环境下
16、服务取代了流程,成为日常工作的驱动模式。以大数据为依托,在考虑管理的“程度、广度、粒度、深度”前提下,对系统、运维、人和成本进行合理、高效、全面的管理,从而达到真正的“一体化运营管理”,有效提升运维管理的“洞察力”。云计算、物联网技术下的基础设施是一种新型架构的技术基础,相比传统基础设施提供了更多虚拟化、自动化、动态化和远程化的管理能力,进一步拓展的基础架构和运维的外延,并逐步过渡到“智能化”运维核心理念云计算、大数据等新技术不仅从技术上带来了全新的变化,从管理上也带来很多新的要素。以云计算、物联网下新型基础设施为基础、以服务驱动为纽带、以运维洞察为管理核心, 从“一体化展现”向“一体化运维”
17、方向有效推动,直至走向“一体化运营” 议程1行业趋势分析2技术能力提升规划3成功案例分享-中行13技术能力提升规划概述14技术变革传统的运维技术支撑工具关注“监、管、控”三个维度,对IT资源进行监控、对运维过程进行管理、对日常操作进行管控,然而云计算、物联网、大数据、移动互联等新技术的应用,对传统的运维工具带来了新的要求和改变云计算资源虚拟化、动态化,配置管理需要面向更加灵活多变的IT资源基础架构云化,监控需要覆盖虚拟资源的运行态势虚拟资源交付自动化,需要构建自动化交付流程以实现虚拟资源交付物联网拓展了运维边界,设备接入更智能、快捷前段运维工作更加便捷,后端系统需要适应这一变化射频扫描等物联网
18、技术的应用,要求运维平台采取更开放的姿态灵活对接大数据更多的数据要求在数据的采集、传输、存储和统计分析上具备较强的能力运维平台需要向大数据平台提供完整的可供分析的数据运维平台应具备良好的展现和推送技术以展现大数据所挖掘的有价值信息移动互联运维工作从计算机延伸到移动终端,技术人员随时、随地可开展运维工作要求运维支撑平台与移动终端之间具备良好的交互能力社交工具互联网式的沟通方式要求平台的响应和支撑能力更加快捷、便利,通过快速的服务支持和交付能力来有效提升用户体验云计算:云平台与其他平台的集成关系151)与运行管理平台集成,实现监控、身份认证、配置管理、运维流程、集中操作和统一运维门户的对接;2)与
19、vCenter、PXE、存储管理平台和网络管理平台等基础架构控制器集成,实现对服务器、存储及网络资源的自动化管控;云平台统一运维门户流程管理子系统配置管理子系统集中操作子系统集中监控子系统运行管理平台vCenterPXE存储管理平台网络管理平台灾备管理平台基础架构控制器云平台与配置管理子系统、流程管理子系统的关系16流程管理子系统云平台配置管理子系统CMDB联邦调和数据更新数据汇聚云服务门户云流程引擎云调度引擎服务器自动化存储自动化网络自动化云资源库统一门户运维流程引擎工单库配置更新数据同步数据消费云资源更新返回结果创建工单工单保存创建工单云资源维护工单关联1)CMDB向云平台提供配置数据2)
20、CMDB从云资源库获取云配置信息1)云平台从CMDB获取配置信息进行消费2)云平台通过工单关联,接受流程子系统派发的云维护工单进行处理,返回处理结果;同时更新云资源库,并将信息同步到CMDB1)可以通过统一门户访问云服务门户2)涉及云资源维护一定从流程子系统发起工单云平台与专项监控、集中监控子系统的关系17流程管理子系统配置管理子系统云平台数据汇聚云服务门户云流程引擎云调度引擎服务器自动化存储自动化网络自动化云资源库工单库数据同步数据消费云资源更新工单保存CMDB联邦调和数据更新配置更新运维流程引擎集中监控子系统专项监控工具集中告警处理集中性能处理弹性计算侦测处置监控数据汇聚运行监控展现网络监
21、控系统监控业务监控视频监控机房监控集成第三方监控集成虚拟化监控云资源监控展现派单移动互联在运维领域的应用分析18移动互联移动互联作为运维工作的外延手段之一,将传统的在计算机上进行办公的方式逐步延伸到手持移动终端,使得运维人员随时、随地可参与运维工作,运维工作的开展也逐步与物理环境脱离配置管理APP面向配置管理:通过APP实现对配置信息的移动端管理面向物联网:作为配置管理与物联网的对接手段之一,例如通过二维码扫描即可将设备信息通过物联网传输到配置库中管控层APP面向管理和决策人员:将决策分析数据、热点分析数据以及管控层关心的信息推动到移动端操作层APP面向操作人员:通过APP实现流程的运转、监控
22、信息的查看以及日常操作等措施CMDB物联网移动APP大数据在运维领域的应用分析19大数据分析大数据分析赋予了运维管理一个新的方向,即洞察力,通过大数据分析获取更多有价值的信息,对系统运行态势、运维热点信息、运维行为模式及成熟度进行深入挖掘和分析,从而提高核心竞争力行为模式与成熟度分析通过流程记录、操作记录来对运维人员的行为模式、运维过程进行分析,发现问题所在,及时纠正、改进“人”的因素通过多维度数据对整体或某一维度的成熟度进行分析,了解当前成熟度以及与目标的差距,为提升改进提供数据支撑系统健康性分析通过对监控信息进行实时、历史、同比、环比等分析过程,展现系统运行态势和趋势,为系统的维护、资源的
23、调配提供数据依据对系统的健康度进行诊断和分析,不仅掌握系统“可不可用”,还要了解系统“好不好用”预警分析与知识匹配通过对系统运行监控信息的分析,能够提前预知系统性能运行阈值,提前采取必要措施规避可能的故障,达到预警分析的效果根据预警或告警标题、关键字等信息,自动匹配相应的知识信息,快速协助故障或隐患的消除运维热点分析面向决策层、管理层和操作层不同人员所关心热点信息,能够采集相关信息并通过整理分析生成有价值的运维热点分析结果,主动推送到相应人员手中,帮助不同层次人员宏观或微观掌握整体运行和运维态势信息社交网络在运维领域的应用分析20社交网络管理微信群面向管理层:为管理层提供实时、快速、灵活、方便
24、的管理通道,管理层可以随时、随地灵活且快速的获取所关注的信息:热点信息查询,对于管理层所关心的项目和工作信息,除传统的邮件、电话等方式外,现在可以通过微信群随时、随地了解工作督促,不受地理或时间限制,及时了解所关心项目或工作的当前推动情况,督促并推动项目或工作开展发布通知,除规范的发布通知手段外,通过微信群可快速、直接的通知到个人专业技术微信群面向专业技术人员:建立专业技术人员之间的交流和沟通平台,技术人员除传统沟通方式外,还可通过专业技术微信群来交流:协助解决,透过专业技术微信群,技术人员可以向其他专业技术人员了解或咨询故障或服务请求的处理方式,提供了除知识库外,新的协助解决方法知识积累,技
25、术人员可以在开放的沟通平台上就具体问题展开探讨,有助于知识的积累和优化快速通知,对于需要其他技术人员处理的工单,可通过微信群来实现快速通知用户微信群面向用户:建立更加快速、通畅的沟通平台,除规范化的服务请求和报障途径外,通过用户微信群可以:用户之间交流,就一些简单的服务请求,如业务咨询等可通过用户之间沟通即可解决多用户支持,针对多用户同类型服务请求或报障,除规范化流程外,技术人员还可通过微信群一对多提供解答和回复用户快速查询,通过微信可快速查询或了解当前请求的处理清理社交网络以快速、直接、灵活、方便的沟通方式改变了人们的交互乃至生活方式,同样,对于运维工作,针对性的引入社交网络工具,能够有助于
26、日常运维工作的开展,快速实现技术人员与用户、技术人员之间的有效和快捷沟通容量管理在运维领域的应用分析21资源容量资源容量管理确保管理人员始终掌握当前资源的使用情况。通过收集容量需求和数据,考虑可用和在用的资源容量,确保可用资源被有效使用。在预测未来需求的基础上,通过容量计划高效率的分配可用的资源。机房资源存储资源计算资源带宽资源网络设备资源结合配置管理,帮助运维人员掌握当前在线资源、闲置资源、可用资源、动态资源等信息,对资源的存量容量进行测算、统计和分析,为资源的合理调配、容量的预测提供基础数据通过收集资源容量存量信息,并对历史和当前容量使用情况进行统计分析,了解资源使用增长趋势;同时结合业务
27、发展需要,结合当前可用容量,对未来资源容量需求进行预测建立流程化的扩容过程管理,将各领域的扩容需求转化为采购需求,并驱动变更管理实现容量变更,最终通过监测等手段复核容量是否满足扩容目标和当前业务运行需要存量容量分析容量预测扩容管理总体技术功能框架22统一运维门户集中监控子系统运维服务网站可视化展现业务建模数据收集和维护数据利用流程管理子系统服务请求运维流程引擎运维大数据分析数据挖掘分析统计配置管理子系统CMDB统一事件管理统一性能管理云管理子系统云资源管理操作自动化集成操作审计工具网络监控系统监控业务监控视频监控机房监控集成第三方监控集成社交工具虚拟化监控云资源调度云资源池管理集中操作子系统非
28、结构化数据仓库故障管理发布管理变更管理问题管理知识管理容量管理服务目录/协议服务请求监控信息汇聚 系统外部集成接口统一工作台信息互联互通移动互联终端工具支撑云计算的“混合云架构”年代以及大数据、移动互联、物联网等新技术的应用,带来一体化运维管理的契机,而一体化的运维管理仅有运营管理框架是不够的,还需要有足够的技术能力和工具来支撑1)管理平台成为“软件定义”基础架构密不可分的一部分2)从运维逐步走向运营,从操作逐步走向服务3)以人为本,统一工作台提供各类管理平台的整合者4)自动化的逐步应用,最终走向智能化平台特点物联网接口 移动数据交换接口全网运行总览操作层APP管控层APP配置管理APP产品已
29、具备的功能说明23图例说明:其他项目建设统一运维门户运维流程管理集中监控管理 专项工具集中操作控制金二其他工具运维统计分析配置管理库CMDB机房监控集成产品不具备移动运维门户信息互联互通容量统计报表面向全国的综合统计报表应用项目绩效评估系统重启管理刷新中间层数据处理操作业务监控外部系统集成全网运行总览运维服务门户业务监控展现云资源申请运维流程引擎(支持跨单位运维协作)其他流程服务请求管理虚拟化监控运维知识管理基础架构图型化展现运维管理报表故障自动化处理系统补丁管理系统服务启停产品基本具备产品已具备统一工作台统一访问认证及授权网络监控系统监控视频监控运维服务接口机房监控展现配置建模自动发现联帮调
30、和配置管理配置可视化统一事件平台监控统计报表配置统计报表统一报表平台监控信息汇聚接口集中操作集成接口故障管理变更管理问题管理发布管理运维值班管理服务目录管理巡检作业管理配置服务接口服务级别管理议程1行业趋势分析2技术能力提升规划3成功案例分享-中行24中行项目概况25中国银行通过三个阶段完成了具备事件集中管理、业务影响分析和数据统一展现的IT总控中心管理平台的建设,显著提升了整体的管理水平和效率。概述项目需求适应 “两地三中心” 的运维管理要求增强整体系统性能分析能力逐步转向面向业务的监控管理机制项目建设历程一期项目的管理目标和业务价值明确,通过对专业监控的整合和集中告警,实现了中心层面集中监
31、控平台从无到有的发展二期项目以广度和推广为目标,集成了更为广泛的事件源,丰富了各平台功能及展现,以及与故障和监控流程的集成,基本实现了一体化监控平台从有到全的发展三期将在一期二期基础上实现一体化监控平台从全到精的发展建设成果总控中心大屏及领导视图3D机房MyDCIAD(事件分析决策系统)中行项目架构图26CMDB数据处理层动力环境监控供电温湿度数据展现引擎3D事件通知接口空调消防视频门禁BMC PatrolOSHWWebsphereOracleOS390Tivoli OmnibusNetcoolSMS事件性能数据库数据分析BI Report大数据平台HadoopPC大屏移动终端RemedyIAD业务影响分析BMC SIM数据汇聚层(接口)BMC BPPM(BEM)数据采集层关键数据分析层集中展现层SOP
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论