




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
城商行数据中心运维转型分析
一、银行数据中心运维的发展和演进
近年来,随着移动互联网、大数据、云计算、AI技术等金融科技业态逐步向传
统金融领域渗透,银行业务系统越来越庞大,系统之间的关联越来越复杂,金
融科技的不断发展一方面为传统银行业的跨越升级插上了腾飞的翅膀,另一方
面也给数据中心运维带来了极大挑战。业务的高速增长始终离不开运维的强有
力支撑,作为一名在银行数据中心系统运维体系从业十来年的IT工作者,历经
了银行数据中心从部件级运维到一体化发展的各个阶段,数据中心的内涵也从
单一数据存储场所向智慧运营不断演进。
(一)单一数据存储阶段
在单一数据存储阶段,数据中心的运维重点是服务器、存储和网络,主要承担
的功能是数据存储和管理,集中存储了银行的业务数据。处于此阶段的数据中
心功能比较单一,整体可用性低,业务连续性要求不高,仅仅便于数据的集中
存放和管理,面向单套业务系统的存储和应用,运维管理粗放,资源台帐不
清,运维人员时刻处于“火线”边缘。
(二)数据集成管理阶段
数据集成管理阶段是数据中心运维管理的转型阶段,此时数据中心组织专门的
人员进行集中维护,注重运维效率,为业务系统提供有效支撑。有些做得比较
好的数据中心已经开始集成CMDB,自动化集成ITSM流程,通过云服务实现自
动化的服务交付,对系统维护上升到了管理的高度,从事中干预、事后处理慢
慢过渡到事前预防。业务连续性要求较高,IT系统的可用性已经作为部门KPI
列入年度考核,数据中心要求有较高的稳定性和可靠性。
(三)智慧运营阶段
处于智慧运营阶段的数据中心,从注重运维效率转变为更加注重运维质量,业
务与科技深度融合,业务系统对数据中心的运维要求已不仅仅是支撑,而是提
供安全、持续、稳定、有效的科技服务,此阶段的数据中心已经演进成了金融
服务提供中心,服务流程趋于规范化、标准化、统一化,并通过信息技术实现
自动化管理。数据中心集成、管理和维护了各种资源,从技术运维转向了技术
运营,实现基础设施和服务实时交付,保证计算资源价值最大化。数据中心高
可用性和业务连续性要求高,重要信息系统应用级灾备覆盖率达到100%,且具
备有效的异地数据级灾备,灾备接管时间为分钟级。
二、城商行运维的痛点分析
中小型城商行受制于资产规模、科技投入、科技人才匮乏等因素,在科技人员
配置和资金投入时一般都是重开发轻运维,运维管理粗放,这就不可避免地暴
露了很多运维的问题和痛点。
(一)运维制度不规范
中小型城商行处于运维发展的初级阶段,运维制度、操作流程、应急预案、灾
难恢复计划书等制度性文件制定之后就束之高阁,没有及时根据实际情况进行
修订更新,使得运维工作无章可循,运维操作做不到规范化、标准化。运维制
度不规范的数据中心,人人都有一套运维标准,同样的事情不同人处理都存在
差异,各岗位职责边界界定不清,岗位之间协同性差,做事互相推诿,甚至怕
担责任少做少错,紧急问题得不到有效处置,从而运维事故频发,带来极大的
安全隐患。
(二)运维流程不合理
如果制度是“心脏”,那流程就是“血液”,它贯穿整个工作范畴,引导运维
工作,界定具体的管理职责,运维流程的有效性和可操作性直接影响了运维质
量和运维效率。数据中心需要制定切合自身的、实用的流程,缺乏有效流程管
理的数据中心,故障响应时间慢,故障定界定位难,故障处理缺乏统一有序步
调,问题跟踪方式自成一派。缺乏流程指引就摆脱不了“烟囱式”运维,或
“救火式”运维,每位运维人员都是无头苍蝇一般的“救火队员”,增加了人
为操作风险。
如今大多数中小型城商行的数据中心都部署了各类运维支撑工具或平台,比如
ITSNk自动监控平台、堡垒机、日志管理平台、灾备切换平台等,但大多数运
维场景下,这些工具平台各自为政,没有串联形成体系,相互之间缺乏有效的
流程进行编排和管理,流程和工具的衔接存在断层,协同调用依赖人工进行,
增加了运维投入但却没有简化运维。
(三)运维技术水平低
在实际操作层,技术是运维的骨骼,强硬的技术实力是运维体系的底座支撑。
近年来,中小型城商行业务迅猛发展,基础设施快速膨胀增加了运维管理的复
杂度,业务系统对"基础设施提出了更高的运维服务要求。多设备、多厂家、
多产品导致运维复杂度攀升,为达到高效运维,就必须利用技术手段为不同技
术路线的系统环境提供统一的服务接口,整合事件处理、变更管理、服务请
求、配置管理等多项流程,将流程和操作一体化,同时还需要熟悉多平台、多
业务、多工具的复合型运维人才。
但现实情况是,中小型城商行在运维投入上捉襟见肘,大多数运维手段还停留
在人工阶段,自动化运维平台没有充分发挥应有的效能,还需过多的人工干
预;在人才聘用方面,低于行业平均水平的薪资无法留住高技能人才,人员管
理不规范、晋引通道不清晰、行业地位低,造成运维人员变动大,维护人员技
能较低。
(四)应急管理不高效
银行业务具有较高的实时性和稳定性要求,一些面向客户、涉及账务处理且时
效性要求较高的业务处理类、渠道类和涉及客户风险等业务的管理类信息系统
已长期处于严格的监管之下,若这些重要系统发生非计划内中断,高效的应急
管理显得尤为重要。受限于自身原因,中小型城商行的应急管理体系建设还不
够全面,没有形成自上而下的合力,产生了许多突出的问题。
1、风险防范意识不高
中小型城商行主要关注主营业务发展,普遍缺乏信息系统风险防范意识,从上
到下对信息系统的应急管理都不够重视,容易滋生信息系统重大安全事件,严
重威胁银行的正常生产经营,造成声誉风险。
2、灾备体系不清晰
应急管理的一个重要组成部分就是灾备管理,中小型城商行灾备建设的主要目
的,是为了进行灾备演练从而应对监管检查,缺乏对灾备体系的统筹思考和总
体架构设计,这将导致灾备系统架构不清晰,延展性差,灾备资源只能在演练
时使用,正常生产时间段得不到合理利用。
3、系统应急预案不完善
应急预案可用性不强,是中小型城商行的通病。大多数应急预案流于形式,组
织架构不清晰,职责分工不明确,可执行性不强;甫些应急预案只专注与操作
细节,缺乏总体规划和统筹安排;经过了数次真实环境下的应急演练之后,没
有及时总结经验教训,同步更新应急预案。
三、城商行运维转型的思考和对策
鉴于以上痛点分析,中小型城商行要实现运维转型,必须要从根本上打破困
局。首先从思想上统一认识,从管理层开始自上而下认可运维工作的重要性;
然后制定并及时维护相关规章制度和操作流程,规范运维操作人员行为,降低
操作风险;最后才是最近提得比较多的,利用技术手段建设集中整合运维平
台,实现运行、监控、变更、应急等流程一体化、自动化、智能化,达到智慧
运营的目的。具体的思考和对策如下:
(一)战略层面一管理层关注
大部分中小型城商行均没有配备专职CIO,信息科技部在银行高级管理层眼里
仅仅是一个巨大的“成本中心”,不会产生实际效益,科技的重要性并没有渗
透至管理层。随着银行业务的快速发展,信息科技风险以及由此带来的衍生风
险并不亚于系统性金融风险,监管部门对银行信息科技的监管也日趋严格。若
高级管理层可以从战略层面重视信息科技,将业务与科技深度融合,关注科技
体制健康有序发展,科技赋能业务,组建训练有素的科技团队,就能有效规避
各类生产运行风险,助力业务系统持续稳定运行。数据中心是业务系统的总后
方,科技部领导也应重视数据中心运维管理,为数据中心运维提供动能和驱动
力。
除了要重视运维,管理层也应该为数据中心运维提供切实可行的指导思想,主
要表现在以下五个方面:一是标准化,要求完善制度制定和修订,一切工作按
制度执行,有章可循,在操作上严格要求规范化、标准化。二是自动化,进一
步提高监控、配置、作业调度等工具使用,提升运维自动化水平,降低人员操
作失误率和风险。三是集约化,深入推进“大运行”,并统筹考虑数据中心运
维一体化管理工作。四是自主化,加强人员培养和岗位技能考核,对关键系
统、关键岗位逐步实现自主运维。五是精细化,在运维工作的各个方面,不断
量化,力求用数字说话,加大量化考核力度。
(二)战术层面一做合规的事
以战略规划为指导思想,战术层面需做到数据中心即应用,在转型过程中逐步
将数据中心运维流程合理合规化,实行运维的“全生命周期”管理,实现运维
体系自身的价值。主要表现为:一是提质,数据中心制定服务化,标准化的运
维流程,主动性预测预防,最小化的应用中断,减少系统故障率,提升业务系
统的用户体验度。二是增收,构建应用差异化计费体系,体现运维体系管道能
力,加快商业变现增加收益。三是增效,通过自动化设计提升运维效率、集约
化设计提升数据中心整体资源利用率和复用率,增加CPU算力负载和网络负载
效率。四是降本,机器不是来取代人,而是将宝贵的人力成本投入到高价值领
域,通过自主化运维提升人员素质,加速人才转型,降低综合成本。
(三)实操层面一正确地做事
运维过程中出现的问题中,人为操作问题和流程设计问题各占40%,技术问题
占20%。因此,在实操层面,如何正确地做事,需要从运维人员、运维流程和
运维技术三方面进行讨论。
1、运维人员
运维人员包括行内运维人员和运维外包人员,人员组织架构是核心,并且不断
动态调整。从依赖厂商到自主可控,从标准化到脚本化,从半自动化到自动
化,不管如何调整,最终方向都是要培养自己的运维力量,做到自主运维。具
体需要做到分工明确、权责分明、及时响应。运维人员要有贡任,有担当,提
高自身技术能力,不过分依赖外包,不惹事,也不怕事。
2、运维流程
首先,运维工作中的每一个步骤都要有流程、有审批、可监控、可追溯,与工
作相关的流程和规定,一定要经常地,反复地修订、调整,牢记于心;其次,
充分利用流程,理清岗位职责的边界,完善标准化流程,对部门能提供的变更
能力做严格的梳理;最后,一定要严格遵守流程,流程正确+结果正确才是正
确,流程错误+结果正确仍然是错误,是态度问题;流程正确+结果错误是可以
原谅的,最多算能力问题。要建立流程来应对“没有流程”的场景,并且严格
遵守。
3、运维技术
运维技术就是运维工具,是各个厂家最热衷于讨论的主题,正如笔者前面所
提,运维技术稍逊于运维人员和运维流程,在运维管理中处于比较重要的地
位。良好的技术手段可以集成现有的分散流程,使得人员工作更加高效、更易
于培训和控制,还可以减少手工重复性操作的成本,提升对操作的控制性。
各厂家五花八门的运维技术归结到一点,就是通过统一管理实现数据中心工具
(技术)、流程和制度间创新性融合,构建统一的运维管理技术平台,完成设
备选型、规划、上架、故障处置、变更、调优、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025姐弟车辆财产赠与合同
- 2025租赁承包合同范本
- 2025短期劳动合同范本【标准】
- 2025年门面租赁合同书范本
- 2025解除合同的劳动合同法规定
- 2025电梯租赁合同
- 《银屑病样皮炎》课件
- 《直肠癌护理》课件
- 《中国心理咨询发展史》课件
- 婴儿及儿童期癫痫及癫痫综合征的临床护理
- 甲亢病人护理讲课
- 2025年中国铜铝复合母线行业市场运行现状及投资战略研究报告
- (高清版)DB1331∕T 072-2024 《雄安新区高品质饮用水工程技术规程》
- 2025年金丽衢十二校高三语文第二次模拟联考试卷附答案解析
- 广东省深圳市福田区2023-2024学年六年级下学期英语期中试卷(含答案)
- 2023-2024学年广东省广州七中七年级(下)期中数学试卷(含答案)
- 2025年北京城市排水集团有限责任公司招聘笔试参考题库含答案解析
- 课件-2025年春季学期 形势与政策 第一讲-加快建设社会主义文化强国
- 2025年山东惠民县农业投资发展限公司招聘10人历年高频重点提升(共500题)附带答案详解
- 大学美育知到智慧树章节测试课后答案2024年秋长春工业大学
- 《基于嵌入式Linux的农业信息采集系统设计与研究》
评论
0/150
提交评论