下一代云计算平台-建设方案_第1页
下一代云计算平台-建设方案_第2页
下一代云计算平台-建设方案_第3页
下一代云计算平台-建设方案_第4页
下一代云计算平台-建设方案_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE PAGE 75下一代云计算平台建设方案目 录 TOC o 1-3 h z u HYPERLINK l _Toc487817771 第一章 背景介绍 PAGEREF _Toc487817771 h 4 HYPERLINK l _Toc487817772 1.1 云计算介绍 PAGEREF _Toc487817772 h 4 HYPERLINK l _Toc487817773 1.2云计算与我国教育领域 PAGEREF _Toc487817773 h 5 HYPERLINK l _Toc487817774 第二章 预期建设目标 PAGEREF _Toc487817774 h 8 HYPE

2、RLINK l _Toc487817775 2.1建设目标 PAGEREF _Toc487817775 h 8 HYPERLINK l _Toc487817776 2.2建设内容 PAGEREF _Toc487817776 h 8 HYPERLINK l _Toc487817777 第三章 平台整体架构及特色 PAGEREF _Toc487817777 h 10 HYPERLINK l _Toc487817778 3.1 云平台背景简介 PAGEREF _Toc487817778 h 10 HYPERLINK l _Toc487817779 3.2 云平台架构及特色 PAGEREF _Toc4

3、87817779 h 11 HYPERLINK l _Toc487817780 3.3 云平台特色功能 PAGEREF _Toc487817780 h 14 HYPERLINK l _Toc487817781 第四章 平台的管理与维护 PAGEREF _Toc487817781 h 19 HYPERLINK l _Toc487817782 4.1功能概述 PAGEREF _Toc487817782 h 19 HYPERLINK l _Toc487817783 4.2访问接口 PAGEREF _Toc487817783 h 20 HYPERLINK l _Toc487817784 4.3集群管理

4、软件客户端 PAGEREF _Toc487817784 h 20 HYPERLINK l _Toc487817785 4.4集群管理软件WEB客户端 PAGEREF _Toc487817785 h 20 HYPERLINK l _Toc487817786 4.5远程桌面及命令行界面 PAGEREF _Toc487817786 h 20 HYPERLINK l _Toc487817787 4.6主要功能介绍 PAGEREF _Toc487817787 h 20 HYPERLINK l _Toc487817788 第五章 应用的支撑 PAGEREF _Toc487817788 h 31 HYPER

5、LINK l _Toc487817789 5.2分布式缓存 PAGEREF _Toc487817789 h 42 HYPERLINK l _Toc487817790 5.3迁移的支持 PAGEREF _Toc487817790 h 45 HYPERLINK l _Toc487817791 第六章 集群管理软件虚拟化实现 PAGEREF _Toc487817791 h 47 HYPERLINK l _Toc487817792 6.1计算虚拟化 PAGEREF _Toc487817792 h 47 HYPERLINK l _Toc487817793 6.2存储虚拟化 PAGEREF _Toc487

6、817793 h 53 HYPERLINK l _Toc487817794 6.3网络虚拟化 PAGEREF _Toc487817794 h 64 HYPERLINK l _Toc487817795 第九章 平台发展与案例 PAGEREF _Toc487817795 h 73 HYPERLINK l _Toc487817796 9.1平台发展历程 PAGEREF _Toc487817796 h 73 HYPERLINK l _Toc487817797 9.2政府支持 PAGEREF _Toc487817797 h 74第一章 背景介绍云计算是计算机科学和互联网技术进一步融合发展的产物,也是引领

7、未来信息产业创新的关键战略性技术和手段。云计算在教育领域应用前景广阔,未来将在促进教育公平、降低教育成本、变革教学活动方式、提高管理效率和助推终身教育等五个方面对教育产生深远影响。1.1 云计算介绍云计算本质是将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务。微软把云计算定义在云+端、软件+服务上;谷歌(Googe)认为,云计算就是以公开的标准和服务为基础,以互联网为中心,提供安全、快速、便捷的数据存储和网络计算服务;IBM则认为云计算是一个虚拟化的计算机资源池,一种新的IT资源提供模式。虽然他们对云计算的定义不同,但认识较一致的地方是:云

8、计算即“按需服务”,将数据存储和计算能力作为可以通过互联网来获取的“服务”向客户提供。因此,云计算具有以下两点优势:1.1.1 降低信息化成本在信息化不断向广度、深度发展的今天,日常工作处理的数据急剧增长,这些数据中还有相当一部分保存在本地。大多数情况下,网络只是让人们能更方便地获得信息,数据处理主要还是依靠本地硬件设备及运行在本地的应用程序来进行。面对海量数据的存储与计算,人们对计算机系统升级的要求不断提高。对计算机系统的要求越高,给个人或单位带来的经济压力就越大。云计算的出现,为投入较低成本,换取高计算能力提供了技术支持。云计算只要求用户端设备能运行简单的操作系统和浏览器软件即可,也就是说

9、,云计算对用户端设备要求很低。应用云计算技术,可以避免本地建设和维护价格不菲的计算机系统,只需支付低廉的服务费用,即可完成原来需要高配置的本地计算才能完成的计算任务。1.1.2 使用方便快捷个人计算机是日常工作中的重要信息处理工具,人们需经常不断地进行系统软件的漏洞修补、应用软件的升级和存储数据的维护,并常常为病毒的攻击、黑客的窃取和数据的丢失而烦恼。但在云计算中,用户所处理的数据并非存储在本地,而是保存在云计算数据处理中心的存储设备中;用户所需的应用程序并非运行在用户的终端设备上,而是运行在云计算数据处理中心大规模的服务器集群中。云计算服务商的专业信息技术(IT)人员负责云计算上资源的分配、

10、负载的均衡、软件的部署、安全的控制等,并力保用户数据的安全性。只要接入互联网,就可以用电脑、手机、掌上电脑(PDA)等终端设备,在任何时间、任何地点方便快捷地享受强大的数据计算和数据存储服务。1.2云计算与我国教育领域国外也有服务于教育的云计算应用,但多是服务功能单一的系统,没有真正具备平台效能,且与我国的教育国情不完全相符。云教育网(HYPERLINK http:/wwwhttp:/www.)由云未科技公司开发建设,是全球第一个专用于教育领域的云计算应用平台,2010年12月正式上线。该平台覆盖了教学、管理、学习、娱乐、交流等众多服务领域,用户包括管理者、教师、学生、家长、教育工作者等不同类

11、型。目前有近550所中小学校已经注册使用该系统。该平台不需要在客户端安软件,仅通过浏览器,用户即可使用系统已授权的各种功能。云教育平台上提供近百万册电子图书供在线阅读,教学信息资源囊括小学一年级至高中三年级所有学科的教案、课件和习题,可在线观看特级教师授课视频,可谓是教学资源一应俱全:丰富的在线辅助学习工具,包括图片编辑、翻译、词典与计算器等,让学习变得轻松简单;让学生放松休闲的益智类游戏,可寓教于乐;博客、相册、社团、聊天和投票等信息交流子系统,供用户了解他人,展示自我,实现了教师、学生、家长的零距离交流。值得一提的是,该平台还提供应用程序调用(API)接口,使其真正成为一个名副其实的开放性

12、平台,让全球范围内的软件开发人员都能开发基于“云教育”的应用程序,融入该平台运行。该平台的核心理念是提供了一个“一站式”的教育信息化平台,让教育部门管理者、学校管理者、教师、学生、家长及其他教育工作者可以在同一个平台上,依据权限去完成不同的工作。平台冲破了传统的教育信息化边界,集教学、管理、学习、娱乐和交流于一体,推出了全新的教育信息化理念,使整个教育信息化领域感受到一股扑面而来的新风。 1.2.1 促进教育公平教育公平是关注民生在教育领域内的具体要求,是构建和谐社会的重要支撑和重要标志。我国教育中城乡、地区之间存在的不公平现象,影响到国民素质的整体提高,进而加剧了城乡、地区之间的经济和社会差

13、别。为保证社会稳定,促进经济和社会的协调发展,必须重视并力争消除教育不公平现象。教育不公平是指包括师资、信息、设备和基础设施等教育资源分布不均衡的社会现象。目前,我国教育发达地区的教育部门、学校和教育企业已经建设了大量的教育信息资源以及承载这些资源的设备设施,而教育欠发达地区很少拥有教育信息资源及相应的基础设施。云计算应用于教育时,教育信息资源存储在“云”上,只要有了连接网络的终端设备和信息资源访问权限,无论身处偏僻的山区,还是繁华的城市,人人都拥有公平使用这些优质信息资源的权利。由众多优秀教师提供的教育信息资源可以被教育欠发达地区的师生所共享,这也在一定程度上缓解了优秀教师资源分布不均的矛盾

14、。1.2.2 降低教育成本云计算大大降低了学校教育资源建设中的软硬件成本。目前,各级各类学校都配备数量不等的计算机和网络设备。但是随着设备的更新换代,学校常常要花大笔经费去购买新的计算机。这样就有很多早期的存储容量比较小的计算机被淘汰下来。有了云计算,学校就可以继续使用这些旧的计算机,从而可以大大降低学校教育资源建设中的硬件成本。没有计算机设备的学校在采购机器设备时,也大可不必采购高性能的计算机设备,只要性能够用即可,可以缓解贫困地区学校经费不足的矛盾。云计算的优势是把成本和效益紧密捆绑在一起。对于原来需要提供信息存储服务的教育部门或学校。当把信息资源转移到云上之后,可以不用或少用服务器,降低

15、了服务器及所需基础设施的更新维护费用、人工管理费用和能源消耗费用。对于一个大的区域或高层教育部门,可以集中租用云服务,以减少重复投资,提高信息资源利用率,倡导“绿色教育”。1.2.3 变革教学活动方式教育信息化系统迁入“云”之后,师生可以随时随地进行教学活动,促进移动学习。移动学习是在任何时间、任何地点,以任何方式学习任何内容的一种新的学习方式。它主要利用无线移动通信网络技术以及无线移动通信设备(如手机)、掌上电脑(PDA)等获取信息和反馈信息。有了云计算教育平台,学生在任何时间、任何墙点,想学习教师讲过的知识,就可以打开手机、掌上电脑(PDA)或者笔记本电脑,在线查看教师的电子教案或教学视频

16、,提交作业。学生可以隔空与同学、老师进行信息交流。在移动学习过程中,交互性、协作性与自主性通过云服务得以实现,凸显了学生在教学活动中的主体地位。在云教育平台上,只要打开可以上网的终端设备,教师也可以“随时随地”开展教学工作。利用云教育平台,教师可以方便地构建个人的生活情感圈,文化圈和业务交流圈。“云服务”的便捷性、交互性和海量信息的易检索性对教师的业务进修、成果共享、专业发展和科学研究都会产生重大影响,有助于教师教学水平的提高,进而提高学校教学质量。1.2.4 提高管理效率云计算在学校的应用将进一步推动教育信息化的深入实施。通过云教育平台,学校管理者可以向师生发布各种信息,及时获得师生的信息反

17、馈。信息的快速、便捷、廉价传递有助于提高管理效率,降低管理成本。管理者也可以借助平台了解学校教学和管理工作的状态,及时发现问题,提出改进办法和措施。在云教育平台上,教育管理的理念和途径也将随之发生变化,管理就是服务的理念可以进一步得到落实。1.2.5 助推终身教育所谓终身教育也称继续教育,是相对于全日制教育而言的,它是针对知识更新的要求提出来的。为此社会应该提供条件,使任何年龄阶段的人在生活中的任何阶段,都能接受各种非正规教育形式,即“终身教育”。终身教育主张在每一个人需要的时刻以最好的方式为其提供必要的知识和技能。这就对国民的终身教育提出更高的要求。政府的人力资源和社会保障部门、工会、妇联以

18、及各种行业协会可以组织各类专业技术人员开发高质量的培训、教育信息资源,在云平台上发布。属于不同行业、不同群体的个体可以根据需要自由选单,按需学习。覆盖“国民的公共云”教育平台可以在终身教育领域发挥重要的作用。第二章 预期建设目标2.1建设目标军械工程学院是全国重点高等院校,设有研究生院,军械技术研究所,基础部、火炮工程系、光学与电子工程系、弹药工程系、导弹工程系、计算机工程系、装备指挥与管理系、电气工程系、外训系、学员队、信息与管理学院、地方生部、教练团等多个部门,拥有兵器测试中心、电子测试中心等13个大型实验中心,图书馆文献总量62万册,学院校园网HYPERLINK /view/3487.h

19、tm t _blank网络终端覆盖了全部教学场所和学员宿舍,主干网带宽达到1000M。各系、各中心、各教研室都拥有自己的信息系统、试验室以及信息资源库,但各系统之间缺乏资源交互和信息共享,系统硬件资源各自为战,单独为本系统提供应用,信息资源内容单调形式单一,安全系统标准不统一且专业水平有较大差距。为此,我们计划采用先进的面向教学资源的云计算平台对学院现有教学资源进行统一升级,以实现以下目标:集中管理、降低成本:将各单位老旧和利用率不高的硬件资源统一组织起来,为用户提供“按需服务”,在同等投入的情况下,为用户提供更强的计算能力、更大的存储空间、更高的极限处理能力。丰富信息内容,提高资源利用率:通

20、过云计算平台,实现全校范围内的信息资源共享,为用户提供交互更加简便、内容更加丰富、形式更加多样的信息资源,提高信息的利用率。专业化的安全管理:通过云计算的实现,由云计算的专业信息技术人员负责云计算上资源的分配、负载的均衡、软件的部署、安全的控制等,统一安全标准、提高管理的专业化水平,并提供可靠的异地容灾备份。2.2建设内容面对学院教学资源整合、按需供给和存储高可用等需求,提供具有教学应用监测、需求分析、诊断和调整能力,支持教学资源本地和异地备份的智能化和高可用云平台。该平台通过“物理机(安装教学资源的遗留系统)到虚拟机自动转换和部署,教学应用运行时自监测与自分析,教学应用出错时自诊断和自恢复”

21、三大机制,切实做到了云环境下教学应用的“三易”:容易迁移,容易管理和容易恢复。通过云计算集中和专业化管理模式,在减少成本,提高资源利用率基础上,保障全院教学应用的安全,可靠和按需运行。云平台由具有自由自主知识产权的OncePVM流程执行虚拟机系统V1.0(软件著作编号:2012SR022928)和Once集群管理软件v1.0(软件著作编号:2011SR016499)组成,针对军械学院数字化校园项目建设需要,作为重点客户特殊优惠,本次投标云平台产品无物理服务器CPU使用数量限制。OncePVM流程执行虚拟机系统侧重强调高可用特性,除了支持物理机(安装教学资源的遗留系统)到虚拟化环境的自动转换,虚

22、拟化平台管理、监控、安全和优化等基础虚拟化管理能力以外,重点实现了教学资源备份(本地和异地)和快速恢复的能力。Once集群管理软件则侧重强调智能化特性,它利用OncePVM对外暴露的管理接口,通过对教学应用的历史或监测数据的分析,基于集群思想实现教学应用的智能部署和弹性伸缩(包括应用、数据库的横向扩展能力),支持可定制化的教学应用容错策略,支持全局虚拟化节点的分析和优化,能够实时监控虚拟机的负载情况,智能化地将工作负载整合到最少的物理服务器上,并将不需要的物理服务器休眠,从而降低数据中心能耗(电源智能管理)。第三章 平台整体架构及特色3.1 云平台背景简介云平台是由中国科学院软件研究所软件工程

23、技术研究开发中心自主研发,并取得自主知识产权的面向网络应用的云计算平台套件,交付版本由OncePVM流程执行虚拟机系统V1.0(软件著作编号:2012SR022928)和Once集群管理软件v1.0(软件著作编号:2011SR016499)组成。中国科学院软件研究所()成立于1985年,于1998年底率先进入中国科学院“北京信息科学技术研究发展基地”知识创新工程首批试点单位。是一个以计算机科学理论和应用研究为基础,以计算机软件高新技术的研究开发和产业建设为主导的综合性基地型研究所,拥有中国科学院院士4名,研究员54名,副研究员及高级工程师87名。建所近二十年来,特别是进入中国科学院知识创新试点

24、工程以来,软件所在计算机科学和软件领域取得了丰硕成果,获院、部级以上成果奖23项(全部为第一完成单位),其中包括国家自然科学奖一等奖1项、二等奖2项、三等奖1项;国家科技进步奖二等奖4项、三等奖2项。软件工程技术研究开发中心(简称为“中心”)作为软件所主要部门( HYPERLINK /yjsgk/zzjg/200908/t20090827_2449380.html)之一,成立于1997 /yjsgk/zzjg/200908/t20090827_2449380.html)之一,成立于1997年,目前拥有固定和流动的科研和开发人员超过100人,中心先后承担了国家自然科学基金、国家973计划、国家8

25、63计划、国家科技支撑计划及中科院知识创新工程等项目/课题100多项,在此基础上取得了以分布式软件基础架构平台网驰平台(ONCE,Open Network Computing Environment)为代表的一系列成果,近5年以第一完成单位获得国家科技进步二等奖一项(编号:2011-J-220-2-10-D01)、北京市科学进步一等奖一项(编号:2009计-1-001),军队科技进步二等奖一项(编号:2012921228)。中心从成立之初就专注分布式软件基础支撑技术的研究的,在以下主要课题的支持下形成云平台套件:(1)973项目奠定理论基础:网构软件中间件平台模型和框架研究 (2002CB31

26、2005);面向可信和服务质量的网构软件中间件模型及运行机制(2009CB320704)。(2)863项目“十五”、“十一五”,“十二五”重点课题建立技术优势:网络环境的系统软件核心技术及运行平台(2001AA113010, 2004AA112010);面向服务的动态软件体系结构及其支撑环境研究(2006AA01Z19B);可信的国家软件资源共享与协同生产环境(2007AA010301);网构化软件运行支撑和在线管理技术和机制(2011GX02D05007)。(3)“核高基”重大专项形成“产学研”生态链:国产中间件参考实现及平台(2009ZX01043-001);面向移动互联网的业务能力开放平

27、台关键技术(2011ZX03002-002-01)。(4)国家科技支撑重点支持推进产业示范:网构化软件运行支撑、在线管理及生产技术(SQ2011GX02D05007)。其中,本次交付的平台是得到课题网构化软件运行支撑和在线管理技术和机制(2011GX02D05007)和面向移动互联网的业务能力开放平台关键技术(2011ZX03002-002-01)的重要支持,并在和中国移动研究院合作的OMP云平台中(2011ZX03002-002-01)得到实际应用。综上所述,云平台是一个面向网络应用的,具有完全自主知识产权的云计算解决方案,并在实际应用中体现出良好的可定制化,专业的维护服务和持续的平台升级能

28、力。3.2 云平台架构及特色云平台架构如图3.1所示,相对于已有的云计算平台解决方案,云平台不但强调底层的虚拟化基础设施层,还强调对网络应用需求的监测和分析,利用底层提供的虚拟化管理API实现网络应用的自动化弹性伸缩,并重点解决了两个层次之间的融合问题。图3.1 云平台架构3.2.1 PVM虚拟机系统PVM虚拟机系统主要解决如何将但以物理资源划分给多个虚拟机使用的问题,如图3.2所示。在基础虚拟化能力方面,主要包括虚拟机管理、虚拟存储管理、虚拟网络管理和虚拟机池化管理四个部分:(1)虚拟机管理主要专注于虚拟机生命周期管理、模板和快照技术;(2)虚拟存储管理主要专注于构建统一软件层次的共享存储,

29、实现存储资源的自动化备份和快速恢复;(3)虚拟网络管理主要专注于虚拟局域网的构建,使得统同一物理局域网的中实现多个逻辑的子局域网;(4)虚拟机池化管理主要专注于构建多个物理服务器的逻辑集合,实现虚拟机在不同物理服务器上的迁移。在虚拟化工具方面:主要包括支持物理机(遗留系统)到虚拟机的自动化转换,服务器端完整的日志记录和安全控制,提供P2V界面,日志分析与展现界面和可定制化的用户权限界面。在自诊断和高可靠方面:平台首先支持基于规则的虚拟机异常规则配置,通过对虚拟机里面Web应用类型的区分和关键资源的分析,以规则是否违约作为判定虚拟机异常的依据,并提供异常类型为管理员提供修复依据。平台也支持备份机

30、制的配置,包括本地备份和异地备份,保障了系统的高可用。图3.2 OncePVM虚拟化系统架构3.2.2集群管理系统集群管理系统主要包括对应用集群,缓存集群和数据库集群的支持,如图2.1所示。应用集群专注于对网络应用的生命周期管理及运行支撑;缓存集群注于记录/恢复网络应用的状态,当单个网络应用实例出现异常无法访问时,可以通过新启一个网络应用实例快速恢复原来网络应用的状态;数据库集群用于教学资源数据的持久化Once集群管理系统通过区分应用、缓存和数据库等不同应用容器,提供了应用的智能部署和弹性伸缩能力。所谓智能部署,是指用户只需要提供网络应用和描述其资源需求的特点,平台会自动帮其构建集群环境,用户

31、不再需要关心需要什么样虚拟机(应用运行环境)配置等信息;所谓弹性伸缩,是指当应用出现资源瓶颈时,平台具有预警和自调整机制实现资源的按需提供,避免或减少人工的参与。3.3 云平台特色功能3.3.1虚拟机资源池高可用多台服务器构建的虚拟机资源池包含Master节点和自动选举的Backup节点,其中Master节点作为访问的唯一逻辑入口,具有检测和管理各个物理机状态的能力,以统一的视角方便用户进行全局虚拟机维护。Master模式在简化资源管理的同时,也引入了单点失效的问题,Master节点的宕机会导致整个资源池的不可用。网驰云平台有效的解决了这一问题,通过在Master节点宕机时将备份节点选举为新的

32、Master节点,并将Master节点的虚拟机重新启动在其他的服务器中,能够保证虚拟机资源池的可用性,以及服务的稳定性,如图3.3所示。图3.3 OncePVM虚拟化系统中虚拟机失效恢复机制3.3.2基于访问控制的权限管理网驰平台对用户的权限进行严格的划分,包含未授权、普通用户、高级用户、系统管理员等多个权限,不同等级的用户将看到不同的管理视图,并且能够拥有的虚拟机个数也有一定的限制。在虚拟机层面,支持安全组管理,通过将不同的虚拟机划分到不同的安全组并对安全组做基于IP和TCP/UDP端口的访问控制来保障虚拟机的安全,如图3.4所示。图3.4 Once集群管理软件中的权限管理3.3.3应用环境

33、的自由组合针对私有云环境下应用系统复杂多变的依赖问题,平台采用松耦合方式,为应用开发者提供了更多自由选择。开发者可以上传应用war包或者将整个应用服务器打包上传。支持tomcat 5.x 7.x、JBoss 4.x 7.x等多种版本的应用服务器类型,在底层的虚拟机选择时,也可以根据用户的需要提供Windows Server或Linux版本的虚拟机。而公有云系统如Sina App Engine或Google App Engine都会对应用进行非常大的限制,并且底层的支撑环境如应用服务器和操作系统对用户来说也是透明、不可选择的,如图3.5所示。图3.5 Once集群管理软件中的智能部署3.3.4基

34、于缓存的会话一致性保障用户的请求通过负载均衡器分发到后台的应用服务器节点,可以自定义负载均衡策略如会话粘滞、IP粘滞、URL粘滞等。后台的应用服务器节点将应用的会话集中存放在分布式缓存中。当用户会话粘滞的节点宕机时,负载均衡器会快速将请求转发到其他活着的节点,并从分布式缓存中取回会话的状态信息,保证整个会话的一致性,整个过程对用户是透明的,如图3.6所示。图3.6 Once集群管理软件中的弹性伸缩机制3.3.5基于QoS的资源弹性供给平台的管理服务器负责收集每一个应用服务器实例的响应时间、访问量、CPU、内存等信息进行分析,并根据分析结果进行资源的弹性供给,保证应用的服务质量。和目前的一些公有

35、云平台对比发现,其中部分平台如SAE仅仅是在服务器中设定了线程的阈值,超过阈值就进行弹性扩展,并未与服务质量进行关联,如图3.7所示。图3.7 Once集群管理软件中的弹性伸缩机制3.3.6数据库横向扩展网驰平台支持对数据库的横向扩展,例如在网驰Web管理界面中监测到当前数据库的IO吞吐率过大,IO资源成为瓶颈,此时1个数据库实例无法满足需求,如图3.8所示。图3.8 Once集群管理软件中的弹性伸缩机制此时网驰管理平台进行全局预警,该预警会告诉管理员应进行数据库的横向扩展操作,管理员根据网驰平台的推荐信息进行扩展实例的操作,比如添加数据库实例。数据库横向扩展的本质即首先对数据库实例进行快照操

36、作,新生成一个具有和快照时间点状态一样的数据库实例,然后启动并通过前端的数据库负载均衡器接管该数据库实例。3.3.7虚拟机跨数据中心备份网驰Web管理平台对每个虚拟机都有一个备份的选项,如下图所示。点击“备份按钮”,即可对虚拟机备份策略进行定制,包括备份的周期,默认为一天备份一次。同时也可以通过网驰管理控制台将虚拟机备份到异地数据中心,如图3.9所示。图3.9 Once集群管理软件中的虚拟机备份设置备份机制采用基于记录和重做的机制。即(1)云平台会周期性的采用快照技术备份虚拟机的状态,而该周期内的操作采用分布式缓存的方式记录下来;(2)当监测到虚拟机宕机无法恢复时,云平台会启动备份虚拟机,并采

37、用重做的策略实现数据的完全同步。图3.10 OncePVM虚拟机系统备份恢复机制第四章 平台的管理与维护集群管理软件提供了丰富的平台的管理与维护功能,以及方便的管理与维护接口。功能包括资源池搭建,虚拟机管理,应用的部署,资源监控与自调整,高可用,备份与恢复等等。在接口上,用户可以通过 集群管理软件 Client、集群管理软件 Web Client 的 Web 浏览器、命令行界面访问 集群管理软件 数据中心。4.1功能概述集群管理软件提供包括资源池搭建,虚拟机管理,应用的部署,性能监控与自调整,高可用,备份与恢复等等丰富的功能。这些功能通过集群管理软件 Client和集群管理软件 Web Cli

38、ent来向用户提供。主要功能描述如下:资源池搭建:用主机搭建资源池,为资源池挂载存储设备;虚拟机管理:主要包括虚拟机的生命周期管理,创建,开启,关闭,挂起,唤醒,迁移,删除等;应用的部署:将应用部署在虚拟机上;资源监控与自调整:包括主机,虚拟机的性能监控,当性能发生异常时,能够及时给出提醒,并尽最大所能自动调整底层资源分配来适应上层需求;高可用:当资源池中某台或某几台主机失效时,能尽力调整不影响虚拟机上应用的正常使用和管理平台的正常使用;备份与恢复:提供多种备份方式,主要包括本地备份及异地备份,如下:本地备份:用快照的方式快速记录虚拟机当前的状态,当发生异常时可以恢复到上一个正常状态;跨数据中

39、心备份:主要用于跨多个数据中心的情况,可以将虚拟机整体备份到另一个数据中心,当本地数据中心发生异常时可以远程恢复;4.2访问接口集群管理软件为用户提供 集群管理软件 Client、集群管理软件 Web Client 的 Web 浏览器、命令行界面三种方式来访问 集群管理软件 数据中心。集群管理软件 Client用于基础架构配置和日常操作,集群管理软件 Web Client用于日常操作和应用的部署及管理。4.3集群管理软件客户端 集群管理软件 Client用于基础架构配置和日常操作。它是一个本地的应用程序,可以运行在windows或linux操作系统之上,可以连接到多个资源池或主机,他提供几乎所

40、有底层相关的管理功能。主要提供给系统管理员使用。4.4集群管理软件WEB客户端集群管理软件 Web Client用于日常操作和应用的部署及管理。它是一个Web应用程序,在任何操作系统上都可以通过浏览器对它进行访问,只能连接到单个资源池,注重于虚拟机的部署和监控,应用的部署和监控等功能,不涉及主机,资源池,网络,数据存储方面的管理。可以提供给系统管理员及用户使用。4.5远程桌面及命令行界面远程桌面或命令行界面嵌入在集群管理软件 Client和集群管理软件 Web Client中,用户可以方便地通过该直观的方式对虚拟机进行操作。4.6主要功能介绍4.6.1 OncePVM系统支持虚拟机管理Once

41、PVM系统支持虚拟机的生命周期管理,主要包括虚拟机创建、启动、关闭、重启等。虚拟机的创建:集群管理软件提供了多种创建虚拟机的方法。如果环境中没有任何虚拟机或者符合要求的虚拟机(如特定的操作系统或硬件配置),请创建单个虚拟机。例如,创建单个虚拟机并在其上安装操作系统、应用程序等。集群管理软件 Client 给出了通过镜像文件创建虚拟机的接口,在创建完成之后,需要手动地通过远程桌面来完成给虚拟机安装操作系统的过程。虚拟机还可以通过模板快速生成。模板是虚拟机的主副本,可用于创建虚拟机,如果有一个要经常克隆的虚拟机,可以将该虚拟机设置成模板。集群管理软件 Client和集群管理软件 Web Clien

42、t都提供了根据模板快速生成虚拟机的接口。从模板快速生成的虚拟机和模板有着相同的特性和磁盘文件内容。也可以通过集群管理软件 Client的wizard选择模板,并给出个性化的设置来创建虚拟机。集群管理软件还集成了p2v(Physical to virtual)工具,可以利用此工具将将物理机转化为虚拟机。p2v是一种将操作系统、应用程序或者数据从计算机的物理硬盘中迁移到一个虚拟环境中或是磁盘分区中的技术。典型步骤包括制作镜像,选择驱动,定制配置三部分。集群管理软件在得到物理机制作成的镜像文件之后,可以方便地通过第一种方式创建和物理机相同的虚拟机。虚拟机的启动:通过集群管理软件 Client 和集群

43、管理软件 Web Client均可方便地启动虚拟机,值得注意的是,当启动的虚拟机是在一台资源池中,并且可共享的虚拟机时,集群管理软件将根据主机的性能评分(该评分由资源监控与自调整模块提供),选择合适的主机将虚拟机启动起来。虚拟机的关闭:虚拟机的关闭操作分为关闭和强制关闭两种。在虚拟机无法通过正常关闭操作关闭虚拟机时,强制关闭操作可使虚拟机强制断电,从而关闭虚拟机。虚拟机的重启:虚拟机的重启操作分为重启和强制重启两种。在虚拟机运行的前提下可执行此操作,用来保存对系统的设置和修改以及立即启动相关服务。虚拟机的挂起:运行中的虚拟机可执行挂起操作,虚拟机会记录下当前虚拟机系统的状态,将系统的现存状态封

44、存。虚拟机系统并未直接关闭,而是停留在当前使用状态,等需再次使用时可快速地恢复到当前工作状态。集群管理软件采用STD(SUSPEND TO DISK)模式,即挂起到硬盘,这种模式把当前的工作环境保存到硬盘,然后关闭所有硬件的电源,即系统休眠状态。虚拟机唤醒:处于挂起状态的虚拟机可以通过唤醒操作回到运行状态。唤醒操作根据虚拟机记录的系统状态,使虚拟机迅速恢复到挂起前工作状态,节省开机启动的麻烦。虚拟机的删除:只有关闭的虚拟机才可删除。把已关闭的虚拟机删除,会将虚拟机的所有信息从资源池或主机中彻底移除。虚拟机的迁移:虚拟机的迁移分为两种情况:虚拟机到虚拟机之间的迁移是指将虚拟机从源物理主机上移至目

45、标物理主机上,并且在目标主机上能够正常运行;物理机与虚拟机之间的迁移是指将遗留的物理机上的操作系统以及上面运行的所有软件都转换成虚拟机,或将虚拟机转换使之可以在物理机上运行。4.6.2 OncePVM系统支持物理机到虚拟机的自动转换OncePVM系统支持物理机到虚拟机的自动转换,该工具主要针对遗留系统。遗留系统通常是指那些运行关键业务,且依赖复杂的关键系统,往往因为人员流失、公司倒闭等因素使得该系统无法在新环境中重新安装。OncePVM支持将原有系统状态拷贝到共享存储,并将系统状态信息重新封装成操作系统(BIOS信息)的方式将其自动转换成虚拟机。4.6.3 OncePVM系统支持基本监控能力集

46、群管理软件可收集管理对象的资源使用情况的数据,分析这些数据以给出用户实时的资源调整建议。集群管理软件会频繁地收集基于一系列衡量指标的数据,并对这些数据进行处理并展示给用户。不仅如此,集群管理软件会不断分析虚拟机当前资源使用情况,当资源紧张时,集群管理软件通过客户端向管理员发出警报,并给出完整的资源调整建议。下面将分监控,分析和调整三部分来解释集群管理软件的资源管理功能。监控集群管理软件会频繁地收集基于一系列衡量指标的数据,并对这些数据进行处理并展示给用户。下面这张图会给出集群管理软件监控的各项指标,之后会给出监控功能的各项具体细节内容。衡量指标组描述CPU主机的物理cpu利用率。虚拟机的虚拟c

47、pu利用率。 磁盘虚拟机的磁盘总大小和已使用空间大小磁盘读写虚拟机的磁盘读取速率和写入速率。内存主机、虚拟机的已使用的内存空间的大小。网络读写每个主机或者虚拟机的网络接受速率和发送速率。应用名虚拟机上部署的应用组件,如Java EE服务器,mysql数据库,memory cache等等。计数器和衡量指标组集群管理软件使用数据计数器查询统计信息。数据计数器是与给定的清单对象或设备相关的信息单位。每个计数器为一个衡量指标组中的不同统计信息收集数据。例如,磁盘衡量指标组包括不同的数据计数器,用以收集磁盘读取速度、磁盘写入速度和磁盘使用情况的数据。会在指定的收集时间间隔后累计各计数器的统计信息,并在性

48、能图表中显示这些信息。数据可用性性能图表中只显示已打开电源的主机和虚拟机的实时数据。对于所有支持的主机和虚拟机显示历史数据,但在某些情形下数据可能不可用。性能图表类型集群管理软件使用线状图来显示性能衡量指标。每个性能计数器的数据绘制在图表中单独的一条线上。例如,一台主机的网络图表可以包含两条线:一条线显示接收的数据包数量,另一条显示传输的数据包数量。而主机的cpu使用情况图的线的数量则取决于主机的物理cpu数量。数据计数器集群管理软件使用数据计数器查询统计信息。数据计数器是与给定的清单对象或设备相关的信息单位。每个计数器为一个衡量指标组中的不同统计信息收集数据。属性描述测量单位测量统计信息数量

49、的标准。 千字节 (KB) 1024 字节 千字节/秒 (KBps) 1024 字节每秒 千位 (kb) 1000 位 千位/秒 (kbps) 1000 位每秒 兆字节 (MB) 兆字节/秒 (MBps) 兆位 (Mb),兆位每秒 (Mbps) 兆赫兹 (MHz) 微秒 (s) 毫秒 (ms) 数量 (#) 百分比 (%) 秒 (s)描述数据计数器的文本描述汇总类型在统计间隔内汇总数据所用的计算方法。用于确定为计数器返回的统计值类型。 平均 - 对时间间隔内收集的数据进行合计并取平均值。 最低 - 对最小值进行汇总。 最高 - 对最大值进行汇总。 最新 时间间隔内收集的数据为给定值。性能图表中

50、显示的值表示当前值。展示集群管理软件收集各项指标并反映在图表中,通常一张图表反映一项指标。在Client中可以看到完整的监控信息。 分析集群管理软件能够获得每台虚拟机的实时资源状态,当资源紧张时会通过客户端向管理员给出警告和调整建议。根据虚拟机上部署的应用组件,可以获知这台虚拟机实时的敏感资源类型。敏感资源类型根据应用组件的类型得到,表示主要影响这类型组件性能的资源,如会影响数据库性能的资源包括磁盘空间大小,内存大小,网络读写速度等等。具体对应关系如下表。应用组件类型敏感资源应用服务器CPU网络速度数据库磁盘空间大小内存网络速度缓存内存网络速度 获知敏感资源之后,集群管理软件分析这类资源实时的

51、使用状态,如果资源状态紧张,则通过客户端给管理员警报和建议。4.6.4 OncePVM系统支持物理服务器横向扩展能力OncePVM系统支持物理服务器升级,当物理服务器CPU个数或者内存大小需要增减时,只需要关闭和重启物理服务器即可。OncePVM具有动态识别和按需接管物理资源的能力。且单台物理服务器硬件横向扩展能力最大为128个逻辑内核和1TB内存,支持的单台虚拟机横向扩展能力最大为128路虚拟CPU和512G内存。注意:根据虚拟化技术原理,在物理服务器升级时尽量使用同种CPU和内存。4.6.5 OncePVM系统支持CPU硬件虚拟化技术OncePVM系统是基于Xen虚拟化解决方案,具有通过支

52、持Intel VT等硬件虚拟化技术提高虚拟化效率的能力。同时,OncePVM系统还具有降低x86虚拟化条件下CPU开销的优势(专利:一种x86虚拟化条件下降低网络I/O操作CPU开销的系统,中国科学院软件研究所,201210526670.8)。4.6.6 OncePVM系统支持虚拟机配置(CPU、内存等)的修改OncePVM系统通过可视化的界面允许用户定制化虚拟机的CPU个数、内存大小等信息,其主要操作包括:调整CPU:集群管理软件在客户端和WEB客户端均提供了在虚拟机运行时调整CPU大小的功能,例如将2核虚拟机扩展为4核,单个虚拟机最大支持128个虚拟CPU。这项修改需要在虚拟机重启后才能生

53、效。调整内存:集群管理软件在客户端和WEB客户端均提供了在虚拟机运行时调整CPU大小的功能,例如将2GB内存调整为4GB内存,单个虚拟机最大支持512GB内存。这项修改需要在虚拟机重启后才能生效。调整硬盘:集群管理软件可以在客户端查看虚拟机的硬盘空间,包括分配的硬盘空间和已使用的空间,当硬盘资源不足时,用户可以在面板中调整虚拟机的硬盘空间,包括1.5倍、2倍、2.5倍等多种扩容方案,用户可以根据需要自行选择。这项修改需要在虚拟机重启后才能生效。网卡修改:在桥接模式下,虚拟机可以通过所在物理机的网卡来连接局域网或互联网,默认使用主机的eth0网卡(推荐),用户可以根据需要切换虚拟机所使用的网卡。

54、这项修改需要在虚拟机重启后才能生效。4.6.7 OncePVM系统支持规模不小于100台物理机OncePVM系统能够支持不小于100台物理据和1000台虚拟机的集群环境,且集群实例数不小于20个。其原因是OncePVM实现了一种基于事件机制的集群监测和管理方法(专利:一种事件驱动的高并发流程虚拟机实现方法,中国科学院软件研究所 ,201210069336.4)4.6.8 OncePVM系统支持共享存储OncePVM系统支持虚拟机的共享存储,基于镜像文件共享内存迁移的技术可实现虚拟机的在线迁移。支持主流共享存储如SAN等,支持2PB的存储要求。4.6.9 OncePVM系统支持智能电源管理Onc

55、ePVM系统具有应用需求监测和分析能力,并能根据分析结果进行自调整,关闭多余的物理机以实现智能电源管理。主要流程包括:调整:当客户端出现全局警报时,同时还会根据资源类型给出不同的调整建议,管理员可以使用“一键调整”功能,后台使用合适的策略进行自调整;当然Client也给出了细粒度的调整接口供经验丰富的管理员使用。下面也会根据资源类型给出自调整策略。典型的例子包括:CPU问题:虚拟机 CPU 使用情况超过 90%,应用程序性能将受到影响。原因:1、虚拟机可能缺少满足要求所需的 CPU 资源;2、虚拟机的虚拟cpu绑定在一个非常忙碌的物理cpu上;解决方案:1、增加虚拟机的虚拟cpu数量;2、重新

56、将虚拟cpu和物理cpu进行绑定,这项操作可以在不停机的情况下完成,集群管理软件 Client给出了一键绑定功能。内存问题:1、内存使用情况一直很高(94% 或更高)或者一直很低(24% 或更低);2、可用内存一直为 6% 或更低,且交换频繁发生;原因:1、主机可能缺少满足要求所需的内存。如果活动内存与分配的内存大小相同,则会导致用于负载的内存资源不足。如果活动内存一直很低,则分配的内存会过多。2、主机计算机内存资源不足以满足要求,这会导致内存回收和性能降低。解决方案:1、如果内存太大,则在虚拟机上减少内存空间,并更正缓存大小。这将为其他虚拟机释放内存;2、如果虚拟机的内存预留值设置大大高于活

57、动内存设置,则减少预留设置,以便 集群管理软件可以在主机上回收空闲内存供其他虚拟机使用;3、将一个或多个虚拟机迁移到 资源池中的其他主机上;4、将物理内存添加到主机。磁盘问题:磁盘占用率达到阈值(一般设定为80%)以上。解决方案:1、对虚拟机进行磁盘扩容;2、如果物理磁盘大小不足以满足虚拟机磁盘扩容,则将虚拟机迁移到其他物理磁盘上3、网络读写速率过高;解决方案:1、如果该实例是应用服务器,则只需要根据同样的模板快速创建一台应用服务器加入集群中;2、如果该实例是数据库,则需要在创建虚拟机之后还要进行数据同步。集群管理软件推荐直接对虚拟机进行拷贝。 智能电源管理:通过实时监控功能可以获得虚拟机的实

58、时负载情况,集群管理软件能够智能的将工作负载分发到目前最空闲的物理机器上,用户也可以通过虚拟机管理中的挂起功能将暂时不使用的虚拟机进行休眠,从而降低整个数据中心的能耗,从而节省数据中心的管理成本。4.6.10 OncePVM系统支持虚拟交换机OncePVM系统支持虚拟交换机,应对云平台具有集中管理和服务主体多样化的矛盾,通过虚拟交换机实现逻辑层次上的隔离。所谓集中管理,是指所有应用部署在同一局域网或者具有相同安全权限的广域网环境中,所有应用应是逻辑上互相可见的。所谓服务主题多样化,是指这些应用的所有者具有利益冲突,他们希望彼此的应用不互相可见。因此,需要虚拟交换机进行逻辑上的隔离,OncePV

59、M支持以“组”为单位构建虚拟局域网。4.6.11 OncePVM系统支持安全组件OncePVM系统也支持安全组件,以防止集中管理模式下虚拟机被其它组织的人员使用(专利:一种基于信任度的访问控制方法及其系统,中国科学院软件研究所,201210116988.9)4.6.12 OncePVM系统支持虚拟机的HA主流虚拟机池化管理方案在解决单点失效问题上,采用的是master节点重构建或备份节点(本文特指master备份节点)静态指定策略,需要人工参与和配置,缺乏灵活性。相关数据显示这种人工配置方法容易导致误操作,从而引起虚拟机资源池在恢复时出现部分或全部状态信息丢失的不足,而虚拟机资源池状态信息的丢

60、失将最坏导致每小时上百万美元的损失,例如Amazon EC2。OncePVM系统并实现了一种具有master节点失效自动发现和自动替换能力的高可用虚拟机池化管理框架,通过减少人工干预来避免误操作,从而达到保障虚拟机池化管理系统高可用性的目的。4.6.13 OncePVM系统支持图形化配置vCPU和CPU映射关系OncePVM系统可以提供图形化界面来为虚拟机绑定、释放静态IP地址,并能够对虚拟机的带宽和网络流量进行限制。另外,可以将虚拟机划分到不同的安全组中,并为每一个安全组设置基于IP和TCP/UDP端口的访问控制规则,保障虚拟机的安全。4.6.14 OncePVM系统支持虚拟机的备份Once

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论