2023数据中心运维实践_第1页
2023数据中心运维实践_第2页
2023数据中心运维实践_第3页
2023数据中心运维实践_第4页
2023数据中心运维实践_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据中心运维实践数据中心的发展历程与挑战我们与数据中心我们与数据中心手环昨晚睡眠,今日建议

微信朋友圈+新闻

天气准备衣物

路况规划出行

邮件开始工作

查资料搜索+网盘沟通交流

娱乐网络定餐手机支付打车、代驾16个新增终端=1台新增数据中心服务器网络定餐手机支付打车、代驾

网上购物数据中心的定义数据中心的定义数据中心是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),以及各种安全装置——维基百科而并不仅仅是一些服务器的集合——谷歌各种形式的数据中心各种形式的数据中心立体数据中心集装箱级微模块机柜排级微模块

冷板式液冷服务器机柜级微模块/product/category/60.html数据中心发展历程第一代数据中心1960年代,科学计算、大型计算机机房

第二代数据中心1990式服务器机房

第三代数据中心2000年代,商务处理,机架式服务器机房第三代数据中心组成第三代数据中心组成第三代数据中心局限第三代数据中心局限 制冷不均匀造成系统MTBF降低传统机房建设方案:制冷不均匀造成系统MTBF降低采用架空地板+精密空调下送风的方式 最大制冷能力:3-5kW/rack数据中心热岛现象数据中心热岛现象机房过热后解决办法数据中心发展面临的挑战数据中心发展面临的挑战规划周期长涉及专业较多,并且各系统标准不统一,建设时间长。 建设成本高规划周期长涉及专业较多,并且各系统标准不统一,建设时间长。建设成本高初期建筑成本、机房工程、机房设备投入巨大资源利用效率低数据中心大多数为峰值建设,资源利用率低高能耗能耗与规模成正比增长,运维成本高,节能压力增大系统稳定性低高能耗能耗与规模成正比增长,运维成本高,节能压力增大系统稳定性低机房环境温度、湿度、粉尘较多等原因导致服务器宕机散热瓶颈功率密度快速增加,冷却问题成为制约性能提升的瓶颈运维复杂度高由于缺少智能化管理系统,数据中心运维水平较低新四代数据中心技术发展趋势新四代数据中心技术发展趋势分离与融合机房基础设施与建筑相分离,基设备的融合模块化整体模块化的数据中心,快速实施、快速交付分离与融合机房基础设施与建筑相分离,基设备的融合模块化整体模块化的数据中心,快速实施、快速交付绿色化节能降耗,最大效率降低能耗成本,节能减排高密度单位面积、单机柜密度飞跃增长智能化理和自动化的运维管理新四代数据中心趋势——绿色化新四代数据中心趋势——绿色化术 1、冷热通道封闭2、水平送风行间空调3、自然冷却技术45、液态冷却服务器技术1、动力设备自调节技术2、照明系统自动调节技术3、新风系统自动调节技术设备休眠与唤醒技术1、处理器休眠2、硬盘休眠3、电源休眠4、系统休眠

1、电源冷备份技术2、硬盘错峰上电3、自动负载调节技术更低能耗1、高效率供电系统2、高效UPS技术34、谐波治理技术动态关核调频调压3、内存动态调频

高效率的电源设计微模块数据中心市场现状与趋势微模块数据中心市场现状与趋势年份2013年份201320142015销售额(亿元)30.7933.3135.96增长率18.9%8.2%7.9%201603201603

根据研究调查显示,2015年,中国模块化数据中心市场规模达到35.96亿元,同比增长7.9%。2015年中国模块化数据中心产品构成情况细分产品销售额(亿元)占比机柜6.0416.8%UPS7.4820.8%电池2.988.3%空调7.0519.6%服务5.5015.3%监控2.376.6%KVM1.805.0%其他2.737.6%总计35.96100%2015年中国模块化数据中心市场行业应用情况行业销售额(亿元)市场份额金融5.6815.8%电信7.6221.2%政府6.9019.2%制造4.1711.6%能源4.7513.2%其它6.8319.0%总计35.96100.0%数据来源:ICTresearch2016032015年中国模块化数据中心市场排级产品厂商排名分析2015销售额市场份额中科曙光0.7815.7%艾默生0.469.3%施耐德0.326.4%华为0.316.2%其他3.0962.3% 合计 4.96 100% 2015销售额市场份额2015销售额市场份额华为5.7918.7%艾默生4.3514.0%施耐德2.377.6%台达0.752.4%科华恒盛0.692.2%其他17.0555.0% 合计 31.00 100% 数据来源:ICTresearch201603

2015场占有率。年份2016年年份2016年2017年2018年2019年2020年销售额(亿元)38.5641.6445.2248.7152.09增长率7.2%8.0%8.6%7.7%6.9%201603201603

预计2016202052数据中心的生命周期战略阶段设计阶段转换阶段运行阶段持续改进阶段战略阶段设计阶段转换阶段运行阶段持续改进阶段与发展蓝图、IT环与发展蓝图、IT环通过设备与技术高级设计,提供数据中心工程与体系结构的详细设计及预算、数据中心运行与治理模设备及解决方案采购通过数据中心建设项目的实施和实际的物理设备部署、应用迁移、试运转、验收等活动,逐步使新数据中心投入使用,转入生产运行阶段借助自动化管理软件与运维工程师,实现主动地管理复杂的异构数据中心环境,提供端到端的服务器、存储、网络、应用的运营管理,以及随后发生的审计管理及迁移管理。通过ITIL/ITSM最佳实践的实施、持续的改进评估,最新IT技术与产品培训、外包选择,使数据中心不断提高服务质量,完成从成本中心向仓Ⅱ新中心的转换。2:8在IT项目的生命周期中,大约80%的时间与IT目运营维护有关,而该阶段的投资仅占整个IT投资的20%,形成了典型的“技术高消费”、“轻服务、重技术”现象。GartnerGroup的调查发现,在经常出现的问题中,源自技术或产品(电力失常及天灾等)方面的其实只占了20%,而流程失误方面的占40%,人员疏失方面的占40%。流程失误包括变更管理没有做好、超载、没有测试等程序上的错误或不完整,人员疏失包括忘了做某些事情、训练不足、备份错误或安全疏忽等。ITSM、ITIL、IT运维ITSM(ITServiceManagement,IT服务管理)《中国IT服务管理指南》实施ITSM的根本目标实施ITSM的根本目标(1)以客户为中心提供IT服务;(2)ITSM的特性ITSM的特性ITIL(ITInfrastructureLibrary,IT基础架构标准库)由英国政府部门ComputingandAgency)在20世纪80年代末制订,现由英国商务部OGC(OfficeofGovernmentCommerce)负责管理,主要适用于IT服务管理(ITSM)。ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。ITIL主要包括六个模块,即业务管理、服务管理、ICT基础架构管理、IT服务管理规划与实施、应用管理和安全管理。其中服务管理是其最核心的模块,该模块包括“服务提供”和“服务支持”两个流程组ITIL获广泛认同ITIL获广泛认同IBMTivoli推出了“业务影响管理”解决方案HP公司倡导“IT服务管理”CA公司强调“管理按需计算环境”BMC公司则推出了“业务服务管理”理念异,但目标都是一致的:把IT与业务相结合,以业务为核心搭建和管理IT系统。通过在IT部门实施ITIL的最佳服务管理实践,可以将因重复呼叫、不当的变更等引起的延误时间减少79%,每年可以为每个终端用户平均节约800美元的成本,同时将每项新服务推出的时间缩短一半。(IDC、Gartner)通过在IT部门实施ITIL的最佳服务管理实践,可以将因重复呼叫、不当的变更等引起的延误时间减少79%,每年可以为每个终端用户平均节约800美元的成本,同时将每项新服务推出的时间缩短一半。(IDC、Gartner)ITIL的5个运营级流程ITIL的5个运营级流程止。(目标:减少影响)IT)()服务管理流程。(目标:减少影响、实现更新)(目标:减少影响、实现发布)ITIL与ITSM先有ITSM后有ITIL,因为ITIL,ITSM得到关注和发扬ITIL是ITSM的最佳实践,ITIL为ITSM提供创建了一组核心流程和专有名词ITIL并不是ITSM的全部,ITIL只是告诉我们什么该做,但没有说具体怎么做,而对ITSM而言,这些都是ITSM的范围。自动化运维IT运维自动化IT运维自动化基于流程化的框架,将事件与IT流程相关联,旦被监控系统发生I会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助IT运维人员完成日常的重复性工作(等),提高IT运维效率。IT运维的自动化还要求能够预测故障、在故障发生前能够报警,让IT障消除在发生前,将所产生损失减到最低。自动化运维的优势自动化运维的优势全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT人员的工作负担,且降低运维成本。通过自动化诊断能最大限度地减少维修时间,提高服务质量。IT入的分析和理解,进而改造和优化流程。自动化运维工具自动化运维工具IT运维监控和诊断优化工具+运维流程自动化工具。①监控自动化,是指对重要的IT设备实施主动式监控,如路由器、交换机、防火墙等。②配置变更检测自动化,是指IT设备配置参数一旦发生变化,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员发现和维护配置。③维护事件提醒自动化,是指通过对IT设备和应用活动的时时监控,当发生异常事件时系统自动启动报警和响应机制,第一时间通知相关责任人。④系统健康检测自动化,是指定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控。⑤维护报告生成自动化,是指定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维的可用性、性能、系统资源利用状况分析报告。EasyOP架构图EasyOP架构图 EasyOPEasyOP采用“互联网+”模式全生命周期覆盖支持移动端服务提供7x24小时跟进打造“HPC生态圈”整体覆盖的解决方案曙光的整体解决方案,从传统HPC软硬一体化方案HPCer到持续性在线服务HPCing转变,实现长久共赢。

7*24小时全生命周期SAAS级服务EasyOperation的简称,是曙光公司针对高性能计算集群推出的专业化运维服务平台,提供HPC在线7*24小时全生命周期SAAS级服务。全新的HPCOnline生态EasyOP目标是HPC的专业化监控运维平台,未来将承载曙光公司高性能计算所有在线服务,打造全新的HPCOnline生态。谁需要EasyOP谁需要EasyOP(决策领导(数据中心中心专业部署服务应用环境调优

(运维团队(终端用户EasyOP亮点EasyOP亮点1、差异化服务亮点提供日常运维服务;色通道,专人跟进;基础服务,永久免费。3、随时的专家级支持

2、随时随地管理集群用户可使用WEB有资产;还可以使用移动设备随时产看集群状况;普通用户可随时通过移动设备监察作业状态。4、软硬件全面覆盖监控盘阵列、交换机等设备和软件环境;支持多种采集协议;EasyOP基本架构EasyOP基本架构邮件服务 电话服务 微信服务 远程支持邮件服务电话服务微信服务远程支持分布式服务平台分布式服务平台 支持架构支持架构EasyOP服务形式EasyOP服务形式故障通知状态监控网页+微信服务在线咨询知识库专家平台故障通知状态监控网页+微信服务在线咨询知识库专家平台EasyOP服务价值EasyOP服务价值功能服务2017年Q1全面的集群监控在线运维支持服务个人作业监控

2017年Q2智能告警服务智能监控功能

2017年Q3健康检查功能用户工单系统

2017年Q4提供委托管理服务专家知识库服务专业机时服务体现价值解放运维压力第一时间发现故障解放运维压力第一时间发现故障创造更多数据中心价值被动服务为主动客户联系更紧密委托管理更省心EasyOP—生态圈EasyOP—生态圈免费运维平台

专业托

管服务专家深度支持管服务

应用市场

交易开放平台

“IDC生态圈”五个阶段HPC监控运维平台专职工程师托管服务行业专家深度支持针对数据中心的应用市场开放计算资源交易平台运维实例中央电视台IT运维系统–事件管理中央电视台IT运维系统–

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论