HC新华三康巴什智慧城市云计算基础平台建设方案_第1页
HC新华三康巴什智慧城市云计算基础平台建设方案_第2页
HC新华三康巴什智慧城市云计算基础平台建设方案_第3页
HC新华三康巴什智慧城市云计算基础平台建设方案_第4页
HC新华三康巴什智慧城市云计算基础平台建设方案_第5页
已阅读5页,还剩130页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

康巴什数智城市云计算基础整体平

解决方案建议书

HBC

新华三先进技术有限公司

2017年06月

目录

第1章概述........................................................6

1.1建设背景...................................................6

1.2建设任务及目标.............................................6

1.3建设原则...................................................7

第2章现状及项目需求分析..........................................9

2.1信息化现状.................................................9

2.1.1基础设施现状.........................................9

2.1.2应用信息系统现状.....................................9

2.1.3信息化管理现状.......................................9

2.2信息化建设项目需求........................................10

第3章云计算基础整体平台建设解决方案.............................10

3.1总体设计思路..............................................10

3.2总体架构设计..............................................12

3.3laaS架构蓝图.............................................13

第4章计算资源池解决方案.........................................14

4.1计算资源池分类............................................15

4.2服务器容量规划............................................17

4.3虚拟机资源分配............................................18

4.4虚拟机的物理分布..........................................18

4.5虚拟机模板设计............................................19

4.6高可用性设计..............................................19

4.7动态资源调整..............................................21

4.8动态资源扩展(DRX).......................................22

第5章存储资源池解决方案.........................................29

5.1存储聚合..................................................29

5.2网络RAID..................................................30

5.3多站点容灾................................................32

5.4自动精简配置..............................................33

5.5数据快照与复制............................................34

第6章网络服务资源池解决方案.....................................35

6.1网络资源池设计............................................35

6.1.1云计算网络挑战.....................................35

6.1.2Overlay介绍.........................................36

6.1.3SDNVPC架构........................................44

6.1.4SDNVPC拓扑........................................46

6.2安全资源池设计............................................47

6.2.1安全总体解决方案....................................47

6.2.2南北流量安全控制....................................48

6.2.3东西流量安全控制...................................49

6.3负载均衡资源池设计........................................50

第7章云服务整体平台解决方案.....................................52

7.1云整体平台整体架构........................................52

7.2云组织管理架构............................................54

7.3IAAS云服务...............................................54

7.4虚拟数据中心(vDC)服务...................................57

7.5云主机服务................................................57

7.5.1云主机概述..........................................58

7.5.2云主机租户网络......................................61

7.5.3自定义镜像..........................................64

7.5.4云主机特点..........................................65

7.6云存储云硬盘服务..........................................66

7.7云防火墙服务..............................................67

7.7.1先进技术特性........................................67

7.7.2安全策略............................................69

7.7.3先进技术优势........................................70

7.8云负载均衡服务............................................71

7.8.1先进技术特性........................................71

7.8.2负载均衡策略........................................73

7.8.3先进技术优势........................................74

7.9云存储服务................................................75

7.10云网络服务...............................................76

7.11云数据库服务.............................................79

7.12计费管理.................................................84

7.12.1基于资源用量的计费................................85

7.12.2基于资源模板进行计费...............................85

7.12.3账单报表..........................................86

第8章云安全管理解决方案.........................................88

8.1信息安全等级保护第三级....................................88

8.1.1等保三级要求........................................88

8.1.2三级等保云安全服务清单.............................93

8.2安全防护模式..............................................93

8.3安全即服务交付............................................94

第9章云运维管理解决方案.........................................95

9.1运维组织架构...............................................95

9.1.1运维组织架构........................................95

9.1.2岗位职责...........................................95

9.2运维管理流程..............................................96

9.2.1事件/故障管理.......................................96

9.2.2变更管理...........................................99

9.2.3资源配置管理......................................100

9.2.4监控与告警管理....................................102

9.2.5备份恢复管理......................................104

9.2.6运维服务报告管理..................................108

第10章应用信息系统迁移设计.....................................111

10.1新应用信息系统虚拟化建设...............................111

10.2老应用信息系统虚拟化迁移...............................114

10.3业务整合迁移...........................................115

10.3.1应用迁移.........................................115

10.3.2虚拟化迁移.......................................119

10.3.3虚拟资源计算......................................122

10.3.4迁移实施解决方案.................................125

第1章概述

1.1建设背景

在两会期间政府工作报告中提出“互联网+”行动计划后,互联网+俨然已成

为2015年以来行业最为热门的名词。业内认为,在“互联网+”的影响下,云计

算正在快速从“建设期”向“普及期”进行过渡。当前,各级政府开始纷纷拥抱

互联网、接入云计算。基于云先进技术,可以很好的整合资源,统一运筹,为各

委办局提供灵活、方便、可运营的IT支持信息系统,大大节约整体信息化投入

成本,有效提高整体信息化运营和运维管理处理效率。

随着个委办局业务的不断发展,信息化建设规模不断扩大。为了避免重复建

设、更有效的节省投资、业务信息系统更好更安全地发展,建议采用云计算理念、

模式和一系列先进先进技术整合现有IT资源,完善IT基础架构。

1.2建设任务及目标

康巴什数智城市云计算整体平台建设共包括三个方面:

一、构建完备的云计算先进技术支撑整体平台:数据中心:计算资源池、

存储资源池、网络资源池、安全资源池;基础设施:存储、服务器、

网络;信息安全:防火墙、虚拟防火墙。

二、建设业务全面覆盖的应用信息系统:主要是各单位的应用信息系统,

比如数智旅游、数智政务、数智社区、数智党建、平安城市、无线城

市、数智教育等应用信息系统。

三、建立健全一套完善的信息化管控体系:组织、制度、标准

康巴什数智城市云计算整体平台建设目标主要包括以下几个方面:

1)充分利用云计算先进技术和服务,升级、改造、完善政务云基础

信息设施,实现康巴什政府各委办局信息信息系统的资源池化,

构建共享基础架构,消除信息孤岛,使信息基础设施的资源使用

处理效率得到提高,信息系统运行成本更加合理;

2)逐步建立基于云计算和云服务的政务云运行管理模式,建成康巴

什数智城市云计算整体平台,实现康巴什各委办局应用信息系统

资源的统一管理和调度,增强应用信息系统的管理能力体系;

3)形成新的业务运行模式,信息部门和业务部门工作流程泾渭分明、

重点突出、业务协同发展

1.3建设原则

一、整体交付

康巴什数智城市云计算整体平台解决方案规划与后期本次项目实施建设中,

不仅要求所投产品满足标书先进技术标准,同时要求产品解决方案能够整体交付,

满足政务云整体平台整体实施交付、统一运维管理的要求。

一、统一规范

由于云计算是一个复杂的体系,应在统一的框架体系下,参考国际国内各方

面的标准与规范(如云架构OpenStack体系),严格遵从各项先进技术规定,做

好信息系统的标准化设计与施工。

二、成熟稳定

由于云计算的发展变化很快,而本本次项目建设时间紧,涉及面广,应用性

强,在设计过程中,应选成熟稳定的先进技术和产品,确保建成的政务云整体平

台整体平台适应各方的项目需求,同时节约本次项目施工时间。

三、实用先进

为避免投资浪费,政务云整体平台体系的设计不仅要求能够满足目前业务使

用的项目需求,还必须具备一定的先进性和发展潜力,使信息系统具有容量的扩

充与升级换代的可能,以便该本次项目在尽可能的时间内与业务发展和信息先进

技术进步相适应。

四、开放适用

由于云计算整体平台为各业务应用信息系统提供支撑,必须充分考虑信息系

统的开放性,提供开放标准接口,供开发者、用户使用。

五、安全可靠

本本次项目涉及用户范围广,数量大,实时性强,设计时应加强信息系统安

全防护能力体系,确保信息系统运行可靠,业务不中断,数据不丢失。

第2章现状及项目需求分析

2.1信息化现状

2.1.1基础设施现状

康巴什各委办局的IT基础设施种类繁多,涉及多家厂商的产品,服务器类

型有X86服务器,虚拟化程度较低,大多为物理机。

2.1.2应用信息系统现状

传统的信息化建设呈现烟囱式,每个应用信息系统拥有独立的服务器以及应

用运行环境,即每个应用对应一套独立的服务器、存储、中间件、数据库资源,

每个应用的资源都是独享的、孤立的,资源无法实现共享和复用,具体如下图所

示:

应用1应用2新应用

中间件中间件中间件

数据库数据库数据库

服务器服务器服务器

存储存储存储

2.1.3信息化管理现状

康巴什各委办局信息化目前处于分散管理状态,委办局各自负责管理各自的

IT资源,资源使用不均衡,且资源之间无法共享和统一调度,运维管理复杂,

运维成本较高。

2.2信息化建设项目需求

根据康巴什的信息化现状及未来业务发展项目需求,康巴什信息化建设项目

需求可以概况为以下几点:

1)整合各委办局的IT基础设施资源,提高整体资源利用率,降低采购成本;

2)构建统一运营管理整体平台,实现各委办局n■资源的统一管理和调度,实现

资源的均衡利用和灵活部署,提高政府IT管控能力体系;

3)完善运维管理体系,提高运维管理处理效率,降低运维管理难度及复杂度,

提高运维管理水平;

4)根据业务安全等级保护要求建设安全保障体系,满足相关部分监管要求;

第3章云计算基础整体平台建设解决方

3.1总体设计思路

1)基于SDN+Overlay网络虚拟化的云网融合设计

云计算数据中心引入服务器虚拟化先进技术后,要求网络基于大二层设计,

基于传统的VLAN先进技术设计云化数据中心网络存在种种限制:大二层网络基

于静态VLAN先进技术,必须Trunk到核心,带来巨大的广播风暴风险。任何一

个VLAN出现广播风暴,将会导致网络不可用;VLAN基于静态配置,无法实现动

态感知虚机位置和虚机vMotion,导致计算资源池和网络资源池的管理割裂,无

法实现动态、自动化实现数据中心硬件资源的动态调度。

随着以VXLAN先进技术为代表的新一代Overlay网络解决方案的提出,上述

典型项目问题有了一种新的解决思路,即通过在现有网络上叠加一个软件定义的

逻辑网络,原有网络尽量不做改造,通过定义其上的逻辑网络,实现业务逻辑,

从而解决原有数据中心的网络项目问题,极大的节省传统用户投资。

SDN+Overlay网络虚拟化利用标准的OpenFlow协议,通过SDN控制器与

OpenFlow交换机来捕获云计算环境中新上线虚拟机所发出的报文,再根据捕获

到的报文特征来感知虚拟机启动或迁移事件与虚拟机接入位置。基于这一先进技

术,可以将获取到的虚拟机位置信息通知SDN控制器,SDN控制器进而在网络设

备上自动下发虚拟机相关的网络策略,实现网络自动配置,让虚拟机上的业务能

够被正确地访问,由于这一过程全部是自动化处理的,从而保证了网络配置的正

确性与快速下发,从而实现网络动态感知虚机迁移,从而实现网络策略的动态跟

随,真正实现云网融合。

2)基于SDNVPC的安全隔离与基础资源动态调度设计

虚拟化和云的引入,形成计算、存储、网络及安全资源池,资源池化后网络

边界模糊,需要引入新的先进技术解决虚拟化环境的隔离能力体系,并且能够实

现资源池的基础资源能够在不同租户间的动态调度能力体系。

基于SDNVPC先进技术,通过将计算资源、存储资源、网络及安全资源分配

给不同租户,构成虚拟云整体平台,虚拟云整体平台之间可以实现有效的、安全

的隔离,使之符合电视台安全等保的要求;并且通过云管理整体平台能够实现基

础资源在不同的虚拟数据中心间灵活调度,真正实现云计算数据中心资源的动态、

按需的分配/调度和提供资源。

3)基于VPC先进技术的数智运维设计

组织架构定义是云整体平台的基础,几乎所有的云整体平台项目需求都涉及

用户和组织关系,这里牵涉到适应特定的定制项目需求。云整体平台支持定制多

级组织嵌套,每级组织都会划分自己的资源(CPU、内存、存储、网络等)和用

户。

云整体平台必须具备多租户管理能力体系,云管理员将IT管理权限下发至

租户管理员;租户管理员可以像独立的数据中心一样,维护自己的虚拟云整体平

台vPC,实现对计算、网络、存储、安全等基础资源的部署分发、服务编排、应

用监控,定制流程和计费模板。运维领导作为云整体平台(或云整体平台下某个

组织)的管理员,关注云容量的规划、服务的质量评价、计费营账报表以及绩效

考核等。对于业务部门,更关心vPC服务的申请、流程审批、工单问答以及实时

账单等。

3.2总体架构设计

根据政务信息化建设项目需求及未来业务发展战略,设计出能够支撑政务未

来3-5年业务发展需要的IT架构,具体如下图所示:

安虚拟计算虎拟网络去拟安全虚拟存储

全资源池资源池资源池资源池资源

护抽象

虚拟化(CPW内存](共享文件]{~至被―I(分布式由〕控制层

内核I“0虚拟化||索统J[疝J|拟;£»机J

业务应用区

安全控制区

整体架构分为如下四大部分:

1)物理资源层

物理层包括运行云整体平台所需的云数据中心机房运行环境,以及计算、存

储、网络、安全等设备。云中心机房的部署按照分区设计,主要分为数据库区、

业务应用区、存储区、信息系统管理区、网络出口区和安全防护区等区域。

2)虚拟化层

资源抽象与控制层通过虚拟化先进技术,负责对底层硬件资源进行抽象,对

底层硬件故障进行屏蔽,统一调度计算、存储、网络、安全资源池。

3)云服务层

云服务层提供IaaS>PaaS和SaaS三层云服务:

laaS服务:包括云主机、云存储(云数据盘、对象存储)、云数据库服务、

云防火墙、云负载均衡和云网络(租户子网/IP/域名等)。laaS层服务向PaaS

层提供开放API接口调用。

PaaS层服务:PaaS层基于laaS层之上,主要提供云应用、云数据库、缓存

及中间件及开发运行环境,同时管理应用的部署和扩展等生命周期。

SaaS层服务:SaaS层主要是一些电科院及分公司具体的应用或信息系统,

如检测信息系统、研发信息系统。

4)整体平台服务层

政务其下各接入单位提供IAAS基础设施资源服务,通过云整体平台自助

Portal界面,能够按照各自的要求申请相关的资源,包括:云主机、云存储、

云网络、云防火墙与云负载均衡等虚拟化设备吗,通过云整体平台自动编排方式

形成虚拟数据中心VDC,VDC间资源策略以及管理相互隔离,保证各个接入单位

或者部门的数据隔离。

由于云计算基础整体平台建设是一项复杂的工程,因此,总体架构的演进遵

循统一规划,分步实施的原则,分阶段进行建设。laaS云是企业云的基础,因

此,优先构建政务的laaS云。

3.3laaS架构蓝图

laaS云建设的基础是资源的虚拟化和池化,因此,首先通过虚拟化先进技术

(服务器、存储、网络/安全),将物理资源进行池化,构建资源池,然后通过统

一的云管理整体平台实现各单位数据中心资源的统一管理和调度,按需将资源分

配给各委办局,同时引入SDN(软件定义网络)、NFV等新先进技术,实现网络

的自动化编排和配置管理。具体架构如下图:

第4章计算资源池解决方案

在服务器资源池上需要再通过安装虚拟化软件整体平台,使得其计算资源能

以一种云主机的方式被不同的应用和不同用户使用。在x86系列的服务器上,其

主要是以H3Cloud云主机的形式存在,如下为H3C虚拟化软件整体平台的构成。

•CVK:CloudVirtualizationKernel,虚拟化内核整体平台

运行在基础设施层和上层操作信息系统之间的“元”操作信息系统,用于协

调上层操作信息系统对底层硬件资源的访问,减轻软件对硬件设备以及驱动的依

赖性,同时对虚拟化运行环境中的硬件兼容性、高可靠性、高可用性、可扩展性、

性能优化等项目问题进行加固处理。

•CVM:CloudVirtualizationManager,虚拟化管理信息系统

主要实现对数据中心内的计算、网络和存储等硬件资源的软件虚拟化,形成

虚拟资源池,对上层应用提供自动化服务。其业务范围包括:虚拟计算、虚拟网

络、虚拟存储、高可靠性(HA)、动态资源调度(DRS)、云主机容灾与备份、云

主机模板管理、集群文件信息系统、虚拟交换机策略等。

采用H3C的CAS虚拟化整体平台对多台服务器虚拟化后,连接到共享存储,

构建成计算资源池,通过网络按需为用户提供计算资源服务。同一个资源池内的

云主机可在资源池内的物理服务器上动态漂移,实现资源的动态调配。

CAS产品逻辑架构图如下所示:

图表CAS产品逻辑架构

建成后的虚拟化信息系统,虚拟机之间安全隔离;虚拟机可以实现物理机的

全部功能;兼容主要服务器厂商的主流X86服务器、主流存储阵列产品、运行

在X86服务器上的主流操作信息系统,并支持主流应用软件的运行。

4.1计算资源池分类

为了提高虚拟化信息系统的可靠性,在虚拟化整体平台的计算资源池建设时,

可以将多个物理主机合并为一个具有共享资源池的集群。虚拟化软件管理信息系

统的HA功能组件会监控该集群下所有的主机和物理主机内运行的虚拟机。当物

理主机发生故障,出现宕机时,HA功能组件会立即响应并在集群内另一台主机

上重启该物理主机内运行的虚拟机。当某一虚拟服务器发生故障时,HA功能也

会自动的将该虚拟机重新启动来恢复中断的业务。

在搭建服务器资源池之前,首先应该确定资源池的数量和种类,并对服务器

进行归类。归类的标准通常是根据服务器的CPU类型、型号、配置、物理位置

来决定。对云计算整体平台而言,属于同一个资源池的服务器,通常就会将其视

为一组可互相替代的资源。所以,一般都是将相同处理器、相近型号系列并且配

置与物理位置接近的服务器一一比如相近型号、物理距离不远的机架式服务器或

者刀片服务器。在做资源池规划的时候,也需要考虑其规模和功用。如果单个资

源池的规模越大,可以给云计算整体平台提供更大的灵活性和容错性:更多的应

用可以部署在上面,并且单个物理服务器的宕机对整个资源池的影响会更小些。

但是同时,太大的规模也会给出口网络吞吐带来更大的压力,各个不同应用之间

的干扰也会更大。如果有条件的话,通常推荐先审视一下自身的业务应用。可以

考虑将应用分级,将某些级别高的应用尽可能地放在某些独立而规模较小的资源

池内,辅以较高级别的存储设备,并配备高级别的运维值守。而那些级别比较低

的应用,则可以被放在那些规模较大的公用资源池(群)中。

初期的资源池规划应该涵盖所有可能被纳管到云计算整体平台的所有服务

器资源,包括那些为搭建云计算整体平台新购置的服务器、内部那些目前闲置着

的服务器以及那些现有的并正在运行着业务应用的服务器。在云计算整体平台搭

建的初期,那些目前正在为业务信息系统服务的服务器并不会直接被纳入云计算

整体平台的管辖。但是随着云计算整体平台的上线和业务信息系统的逐渐迁移,

这些服务器也将逐渐地被并入云计算整体平台的资源池中。

H3CCVM虚拟化管理整体平台体系将云计算资源池的物理服务器资源以树形

结构进行组织管理,云资源中的被管理对象之间的关系可以用下图描述:

图表云资源对象关系

4.2服务器容量规划

单台服务器所能支持虚机数量的决定因素主要取决与两方面:

1.服务器的硬件配置

♦CPU性能一多核高主频先进技术使得CPU成为性能瓶颈的可能性越来越

♦内存大小一做为硬指标的内存,配置越高,所能支持的虚机数量越多

♦网络端口一千兆网环境已很普遍,网络带宽大多有保证,更多从管理角

度来考虑

♦HBA卡一磁盘访问性能对虚机数量有一定影响,建议采用10G以太网或

者8GbpsFC以减少链路影响

♦本地磁盘…内置磁盘的可用性及I0吞吐能力体系均较弱,不建议在其上

存放虚拟机,推荐使用外置高性能磁盘阵列

2.应用负载大小

♦由于物理服务器资源自身的最大限制,应用负载越大,所能同时运行的

虚机数量越少

♦建议将不同应用访问特性的应用混合部署在同一物理服务器上

♦灵活运用DRS和VMotion先进技术可将物理机与虚机的比率关系调到最

♦考虑到HA及DRS所要求的资源冗余,所有运行虚机在正常负载下,总

体资源使用率不超过三分之二会比较合适

在部署虚拟化时,对物理服务器的硬件配置需要考虑以下因素:

♦可用的CPU目标数量尽可能多,单台服务器建议配置6个以上的CPU核。

♦超线程先进技术并不能提供等同于多核处理器的好处;建议关闭CPU的

超线程功能

♦使用具有EM64T能力体系的IntelVT或AMDV先进技术的CPU可以同

时支持运行32位和64位的虚拟机

♦采用同一厂商、同一产品家族和同一代处理器的服务器组成的集群,可

以获得最好的虚拟机迁移兼容能力体系

♦内存资源往往比CPU资源更会成为潜在的瓶颈,尽可能采用最大容量的

内存条(单条8GB效果优于两条4GB)。

下表给出了部署虚拟化时的服务器典型配置:

服务器CPU路数双路四路

CPU(建议主频2GHz以上)双路四核四路双核或四核

内存16GB+32GB+

无外接存储4+/6+4+/6+

千兆网口使用FC存储4+/6+4+/6+

使用IP存储6+/8+6+/8+

2*8GbpsFC2*8GbpsFC

SAN端口或或

2*10GbpsEth2*10GbpsEth

内置硬盘(使用外置磁盘阵列时)22

电源双冗余双冗余

4.3虚拟机资源分配

1.虚拟机CPU分配原则:

♦尽量使用最少的vCPUs,如果是单线程应用,无需多线程处理。

♦虚拟CPU数量不要等于或超过物理CPU核数,如双路双核的服务器配置,

虚机最多使用两个虚拟CPU

2.内存分配原则:

♦内存总量为在资源评估后,计算虚拟机评估结果所需实际内存尽量避免

大于物理内存的总和。因为应用程序而产生的更多内存需要用磁盘内存来解决,

会导致信息系统性能下降。

关键应用可考虑固定内存的方式方法以保证性能的稳定性

4.4虚拟机的物理分布

同一个资源池内的虚拟机在物理服务器上的分布,要尽可能考虑平衡负载的

原则,即保证资源池内的物理服务器CPU、内存资源占用率均衡,避免某单台

物理服务器上的负载特别高,而其它处于闲置状态。

个别业务应用可能会存在某个时段负载突发上升的情况,如公务员报考信息

系统,对于这类应用,需要部署DRS(动态资源调度)和DRX(动态资源扩展):

♦通过动态资源调度(DRS)集群的部署,可以解决单个虚拟机负载过高时,

位于同一台物理服务器上的其它业务应用虚拟机不会被“饿死”。

通过动态资源扩展集群的部署,可以解决当单个虚拟机负载超过物理服务器性能

后,快速克隆多个同样业务的虚拟机,配合负载均衡(LB)设备,完成对负载的

分担。

4.5虚拟机模板设计

业务应用模板是由虚拟机配置定义、操作信息系统、基础应用三部分组成。

1.虚拟机配置定义:包括虚拟机的vCPU、内存、网络策略、虚拟存储vDisk

等参数的定义。

2.操作信息系统:包括WindowsServer、Linux等支撑上层业务应用的操作

信息系统,以及操作信息系统配套的相应补丁及病毒。同时可以根据应用模板的

类型,开起相应的信息系统服务(如IIS、DHCP等)。

3.基础应用:包括中间件、WEB服务端等基本应用,根据应用模板的类型,

决定模板需要安装的基础应用。

业务应用模板的设计是云整体平台业务快速部署的基础,通过虚拟机模板快

速部署虚拟机,可以大幅节省安装操作信息系统、病毒与补丁、信息系统服务、

中间件的时间,由相应模板部署的虚拟机就相当于是一台安装好操作信息系统、

病毒库、基础应用的服务器,只需安装相应的业务应用软件即可让业务快速上线。

在采用云计算来向用户交付服务时,用户通过云门户自助申请的IT服务资

源就是业务应用模板,因此需要提前设计好相应的IT服务模板向云门户发布,

当用户申请该服务时,云整体平台根据模板进行资源编排,快速生成虚拟机相关

资源交付给用户使用。

4.6高可用性设计

高可用性包括两个方面:

1.虚拟机之间的隔离:每个虚拟机之间可以做到隔离保护,其中一个虚拟

机发生故障不会影响同一个物理机上的其他虚拟机;

2.物理机发生故障不会影响应用:故障物理机上运行的虚拟机可被自动迁

移接管,即虚拟机可以在同一集群内的多台服务器之间进行迁移,从而实现多台

物理服务器的之间的相互热备,实现当其中一个物理服务器发生故障时,自动将

其上面的虚拟机切换到其他的服务器,应用在物理机宕机情况下保证零停机。虚

拟机的迁移需要依赖共享存储,关于共享存储,后续章节将详细介绍。

H3CCAS虚拟化整体平台HA功能会监控该集群下所有的主机和物理主机

内运行的虚拟主机。当物理主机发生故障,出现宕机时,HA功能组件会立即响

应并在集群内另一台主机上重启该物理主机内运行的虚拟机。当某一虚拟服务器

发生故障时,HA功能也会自动的将该虚拟机重新启动来恢复中断的业务。

除了对集群中的物理服务器节点进行持续检测之外,H3CCASHA软件模

块还对运行于物理服务器节点之上的虚拟机进行持续检测。

在每台服务器节点上都运行了一个LRMd(LocalResourceManager

daemon,本地资源管理器守护进程),它是HA软件模块中直接操作所管理的各

种资源的一个子模块,负责对本地的虚拟化资源进行状态检测,并通过shell脚

本调用方式实现对资源的各种操作。

当LRMd守护进程检测到本机的某台虚拟机出现通信故障时,首先将事件

通知给DC,由DC统一将该虚拟机状态告知集群内所有的物理服务器节点,并

按照一定的策略算法,为该故障的虚拟机选择一个空闲的服务器节点,在该节点

上重启该虚拟机。

使用虚拟化软件HA特性进行虚拟机故障切换

4.7动态资源调整

动态资源调度功能可以持续不断地监控计算资源池的各物理主机的利用率,

并能够根据用户业务的实际需要,智能地在计算资源池各物理主机间给虚拟机分

配所需的计算资源。通过自动的动态分配和平衡计算资源,动态资源调整特性能

够:整合服务器,降低IT成本,增强灵活性;减少停机时间,保持业务的持续

性和稳定性;减少需要运行服务器的数量,提高能源的利用率。

动态资源调度功能组件可以自动并持续地平衡计算资源池中的容量,可以动

态的将云主机迁移到有更多可用计算资源的主机上,以满足虚拟机对计算资源的

项目需求。即便大量运行SQLServer的虚拟机,只要开启了动态资源调整功能,

就不必再对CPU和内存的瓶颈进行一一监测。全自动化的资源分配和负载平衡功

能,也可以显著地提高数据中心内计算资源的利用处理效率,降低数据中心的成

本与运营费用。

如上图所示,动态资源调整功能通过心跳机制,定时监测集群内主机的CPU

利用率,并根据用户自定义的规则来判断是否需要为该主机在集群内寻找有更多

可用资源的主机,以将该主机上的云主机迁移到另外一台具有更多合适资源的服

务器上。

4.8动态资源扩展(DRX)

业务访问量的突发性变化和对应的信息中心IT资源的供给是一对矛盾体。

对于信息中心IT管理人员来讲,一个很重要的任务就是在这两者之间达到一个

相对的平衡。云计算先进技术的出现和部署可以使信息中心IT资源以更小粒度

使用和交付,同时显著的增强了信息中心IT资源使用处理效率和调度的灵活性、

敏捷性。从而使得上述平衡可以更加容易获得。但由于各IT管理信息系统的割

裂,导致上述过程并无法有机的自动完成。因此迫切需要一个新的解决解决方案

通过整合和自动化部署来实现IT资源供给和业务项目需求的动态平衡。

■云计算带来的新变化与新项目需求

部分信息中心业务的访问量会周期性或随机的出现波动。有些业务的波动幅

度很大,其峰值访问量甚至会超出正常访问量的好几倍。随着访问量的弹性变化,

这类业务对IT资源的项目需求也存在较大的波动,这就要求信息中心IT基础架

构能够支撑这样的弹性扩展项目需求,IT部门面临很大的挑战。为了应对这样

的IT项目需求,通常有以下两种部署方式。

静态部署:n■部门按照业务峰值应用的IT项目需求来规划部署对应的IT资

源,这些IT资源(主要是服务器)专机专用,服务器部署好以后保持长期稳定

运行状态,无论当前业务负载量大小是否发生变化,均由这些服务器对外提供业

务。

动态扩展:IT部门动态调整服务器的数量来应对业务访问量弹性变化的项

目需求,即在业务访问量上涨前或初期,通过增加服务器来新增对业务容量。业

务访问量下降时,将新增的服务器回收用于支撑其他业务。

比较项动态扩展方式静态部署方式

响应敏捷度响应慢。物理服务器扩展流程复杂,周期长,难响应快。业务服务器部署完成并纳管后,无需人

以快速响应业务项目需求工干预即可响应业务访问变化项目需求

运维复杂度复杂度高。资源扩展和收缩时,均需要进行服务复杂度低。一次部署,长期使用

器和业务信息系统的部署

资源利用率资源利用率较高。业务对应的IT资源随着业务访资源利用率低。资源按最大项目需求部署、业务

问量的变化而弹性变化。业务项目需求和IT资源量低时,部署的资源无法得到充分利用

供给达到一定程度的平衡,资源能比较充分的利

成本相对低。资源充分利用,灵活调配高。较多的闲置资源

适用场景适用于业务访问量波动有规律而且不频繁的场适用于业务波动随机性强或波动比较频繁的场

景景

两种部署模式匕匕较

通过上表对两种部署方式的对比可以看出,两者各有优缺点,信息中心IT

部门可以根据本信息中心自身的业务特点来选择部署。通常来讲,大多信息中心

业务访问的随机性都比较强,所以传统IT环境下通常会选择静态部署方式。

对信息中心IT部门来讲,云计算带来了全新的IT基础架构建设、使用和交

付模式,其中,云计算的基础一一计算虚拟化先进技术尤为突出。总的来说,计

算虚拟化给信息中心IT基础架构带来如下两个变化。

更细粒度的IT资源使用和交付模式。计算虚拟化是“一虚多”的先进技术,

即将一台物理服务器虚拟化为多台虚拟服务器,各虚拟服务器均作为独立的实体

来承载信息中心业务。当信息中心业务信息系统承载的主体由传统的硬件服务器

转变为虚拟服务器后,IT部门是在将IT资源以更细粒度的虚拟服务器交付给

业务部门。信息中心物理服务器可以为多个业务部门所共享,极大的提高了物理

服务器的利用率。

快速敏捷的IT基础资源交付和部署模式。在传统IT部署中,物理服务器涉

及硬件产品的采购、组装、上架等流程,流程复杂且周期长;而虚拟服务器的部

署则不涉及这些项目问题。同时,由于虚拟化的特质,虚拟服务器可以通过快速

的克隆复制来实现快速的批量部署。因此,IT部门可以通过快速部署虚拟服务

器的方式迅速响应信息中心业务信息系统的业务承载项目需求和变化。另外,虚

拟服务器可以在多个硬件服务器之间灵活的迁移的特点,极大的提高了II■资源

调度的灵活性。

信息中心将其业务信息系统部署于虚拟服务器上对外提供服务,可以在保证

各业务信息系统的独立性、安全性和可靠性的同时极大的提高物理服务器的利用

率和资源调度灵活性。正由于上述计算虚拟化先进技术给信息中心IT建设带来

的诸多好处,越来越多的信息中心将业务部署于虚拟服务器上进行承载。

计算虚拟化简化了部署业务服务器的流程和具体工作,极大的缩短了新业务

服务器的部署周期,使得通过快速增减业务服务器来应对业务访问量的突发性变

化成为可能。因此,部署了云业务环境的信息中心开始考虑采用动态部署方式来

应对业务访问的突发性项目需求。但采用动态资源部署方式的一个不能忽略的前

提是:信息中心IT管理人员能够对业务访问量的突发性变化具备很强的敏感性,

并且能够迅速采取应对措施。但当前的IT基础架构中,信息中心业务负载监控

整体平台、虚拟服务器管理整体平台和业务分发的信息系统之间往往是割裂的,

没有整合形成统一解决方案。IT管理人员在感知到业务访问变化时,只能通过

手工进行虚拟服务器的增减和在业务分发信息系统的相应配置。这无疑缺乏灵活

性且处理效率低下。

因此,信息中心需要一个新的解决解决方案,整合上述的业务负载监控整体

平台、虚拟服务器管理整体平台和业务分发信息系统,自动化的实现上述三个业

务信息系统的关联部署,为信息中心IT基础架构注入智能,增强IT资源调配的

自动化能力体系。同时构建一个统一的管理整体平台来实现针对支撑信息中心特

定业务的一组虚拟服务器的运行状况进行统一的监控、管理和集中展示。针对这

些项目需求,H3c推出了“面向应用的云动态资源扩展解决解决方案”一一DRX

(DynamicResourceextension,动态资源扩展)解决解决方案。

■面向应用的云动态资源扩展解决解决方案

解决解决方案逻辑架构

该解决方案的关键在于其实现信息中心业务负载和IT支撑资源供给水平的

自动关联。通过感知业务信息系统的负载状况,并根据业务信息系统的实际负载

状况自动联动IT基础架构进行基础资源的弹性扩展,实现了信息中心业务项目

需求向IT项目需求的自动映射和资源调度。为了实现上述目标,解决解决方案

应该包括如下四大功能:服务器资源虚拟化和池化,这是整体解决解决方案的基

础;基于业务负载的资源动态调度;业务负载状况监控;多个虚拟资源之间的业

务负载分发功能。这些功能分别同资源层、业务资源调度和展示层、业务负载监

控模块和业务负载分发模块等功能模块对应(如下图所示)。

业务负载监控模块业务负载分发模块

业务资源调度&展示层

解决解决方案逻辑架构

♦资源层

负责将数据中心内的物理资源虚拟化和池化,并以虚拟服务器为单位对外提

供服务。总体来讲由以下三个子模块组成。

物理资源层:由数据中心内的多台物理服务器组成,为信息中心业务提供服

务器资源,服务器规模由信息中心业务总体项目需求确定。

虚拟化内核整体平台:安装于物理资源层内的物理服务器上,实现物理服务

器的硬件资源的逻辑封装和虚拟化,是信息中心云计算架构的基础。

虚拟资源层:物理资源层上运行的虚拟服务器的集合,共同构成统一的虚拟

服务器资源池。池内的虚拟服务器作为信息中心业务承载的最小单元,对外提供

业务服务。

♦业务资源调度&展示层

业务资源动态调度模块:该模块为管理一组虚拟服务器,为一个特定的用户

业务(后面我们统一称为“动态资源扩展业务”)提供服务。我们把这个虚拟服

务器组称为“业务动态资源扩展服务器组”。同时该模块通过与业务负载监控模

块的联动,及时感知业务负载状况,根据业务实际负载变化动态的增加或减少虚

拟服务器组内运行的服务器数量来实现针对同一业务的服务器资源的弹性扩展。

虚拟服务器的扩展(伸缩)可以通过虚拟机的克隆创建、删除和停止等方式来实

现。要注意的是,该模块需要提供北向接口,实现和业务负载监控模块以及业务

负载分发模块的联动。

业务资源调度展示模块:为了实现对数据中心内运行的“动态资源扩展业务”

的运行状况和资源支撑情况进行直观的展示,协助IT管理人员对“动态资源扩

展业务”进行有效的管理和预判。该模块提供丰富的动态资源扩展业务的统计信

息展示,如TOPN的虚拟服务器CPU占用率等。

♦业务负载监控模块

该模块对支撑某一特定业务的所有虚拟服务器的负载状况进行统一监控。管

理员可以根据业务情况事先设定阈值,当该组虚拟服务器的负载上升超出设定的

上限阈值后,联动业务资源调度模块自动扩展该业务对应的虚拟服务器资源;反

之,当该组虚拟服务器的负载下降超出设定的下限阈值后,联动业务资源调度模

块自动减少该业务对应的虚拟服务器资源。

♦业务负载分发模块

该模块实现将“业务动态资源扩展服务器组”内的多个虚拟服务器整合为一

个逻辑整体来共同支撑一个用户业务。这需要该模块其将对该业务的访问按照管

理员事先设定的策略分别发到对应的各虚拟服务器上;这个分发策略由IT管理

员依据业务的特点来自行选择。如,各虚拟服务器的监控状况、负载情况、随机

轮转分发等。

DRX解决解决方案组成及特点

DRX解决解决方案依托H3CCAS云计算管理整体平台实现(如下图所示)。

CAS云计算管理整体平台是为信息中心数据中心量身定做的虚拟化和云计算管

理软件,CAS整体平台中集成了一个基础业务负载监控模块。该模块能够监控

承载特定业务虚拟服务器组的负载状况,并根据业务负载的状况联动云管理整体

平台实现资源的动态注入和回收。

同一业

务承我

❷新增资源自动

提供服务,.,•・••••

业务资源组状态统计信息展示

业务

流量,施量

超源随业务I资源的业务

盘动态增成法动态加减

弹性费源组

❶基于业务负

载状态的资

源自动弹性

扩展

务负载监控平台

DRX解决解决方案架构

依托CAS云管理整体平台,通过整合基础业务负载监控模块、业务资源调

度&展示模块、业务分发整体平台,DRX解决解决方案主要提供以下关键功能:

用户业务的负载监控

通过基础业务负载监控模块监控运行于其虚拟化整体平台上的虚拟服务器

的实际资源负载状况;

用户通过CAS整体平台创建资源扩展业务时,可以设定好业务负载的上下

限阀值;

当业务负载超出用户事先设定的阀值后,业务负载监控模块给业务资源调度

模块上报资源扩展事件,以触发业务资源的弹性扩展(包括资源的动态伸缩);

基于用户业务负载的动态资源扩展

CAS整体平台上可以创建业务动态资源扩展业务,支撑该业务的所有虚拟

服务器进行统一的集中管理;

为了防止同一个业务无限占用云整体平台内的资源,DRX解决解决方案将

同一个业务的资源扩展范围限定在一个特定的物理资源池内(包括服务器和存储

资源),即后续虚拟服务器的增加和回收均在该物理资源池内进行;

接收到业务负载监控模块上报的资源扩展事件后,业务资源调度模块会在限

定的物理资源池内选择负载最轻的一台物理服务器上通过启动当前已经存在的

虚拟服务器或者克隆创建一台新的虚拟服务器的方式,以扩展该业务的支撑资源;

业务负载自动分发

通过集成的H3C负载均衡设备可以将业务请求分发到新创建的虚拟服务器

中,以实现对业务负载的分担;

动态资源扩展业务信息展示

CAS整体平台上可以提供丰富的动态资源扩展业务的各种信息展示,以便

于运维人员掌握当前某特定业务的资源部署状况和各虚拟服务器的运行状况(如

“业务资源CPU使用状况”、“TOP5虚拟服务器CPU利用率”等)。

H3CDRX解决解决方案整合了基础业务负载监控整体平台、资源调度整体

平台、业务分发信息系统和展示整体平台,可以针对用户业务负载的变化自动的

增减相

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论