最有价值的云计算资料_第1页
最有价值的云计算资料_第2页
最有价值的云计算资料_第3页
最有价值的云计算资料_第4页
最有价值的云计算资料_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1初始云计算初始云计算2概要n背景n云体系结构云体系结构n云计算云计算n云存储云存储n云传输云传输n讨论讨论3阿喀琉斯之踵n古希腊神话中的阿喀琉斯是海神之子,荷马史诗中的英雄,传说他的母亲曾把他浸在冥河里使其能刀枪不入。但因冥河水流 湍急,母亲捏着他的脚后跟不敢松手,所以其脚踵是最脆弱的地方。n在特洛伊战争中,阿喀琉斯杀死了特洛伊王子赫克托耳,因而惹怒了赫克托耳的保护神阿波罗,于是太阳神用毒箭射中了阿喀琉斯的脚踵,送了这位勇士的命。 4数据量n数据爆炸性增涨(2006,161 EB;2011,1800 EB;年增长率达到60%. IDC报告)。n数据中的绝大部分将存储在世界各地的大型数据中心。

2、GB-TB-PB-EB1 kB = 1024 B (kB - kilobajt) 千 1 MB = 1024 kB (MB - megabajt) 兆 1 GB = 1024 MB (GB - gigabajt) 吉 1 TB = 1024 GB (TB - terabajt) 太 1 PB = 1024 TB (PB - petabajt) 拍 1 EB = 1024 PB (EB - eksabajt) 艾 1 ZB = 1024 EB (ZB - zettabajt) 皆 1 YB = 1024 ZB (YB - jottabajt) 佑5n2005年,美国新建立的数据中心需要消耗的能量

3、=加利福尼亚州所消耗能量的10%(大约5GW),约40亿美金。n英国的1500个数据中心每年消耗的能量和英国第十大城市莱卡斯特所需要的能量相当。n2010年,英国单个数据中心每年在能量上的花费达到大约740万英镑。n计算机集群系统由于采用商用化部件,其能耗问题更为突出。 IT基础设施能耗6热密度热密度7Google数据中心nGoogle数据中心以集装箱为单位,每个集装箱有1160台服务器,每个数据 中心有众多集装箱。nGoogle一次搜索查询的能耗能点亮100瓦的灯泡11秒钟。比利时的圣吉兰(Saint Ghislain)数据中心完全依靠数据中心外面的空气来冷却系统。Dalles数据中心位于俄

4、勒冈州的哥伦比亚河旁,河上的Dalles大坝为数据中心提供电力。数据中心有2座4层楼高的冷却塔。8Microsoft数据中心美国华盛顿州Grand Coulee水坝是世界第三大混合电力水坝,供电量是650万千瓦。Microsoft在水坝边上建一个有10个沃尔玛商店那么大的数据中心。微软在美国芝加哥的数据中心.总面积为70万平方英尺。即使只启用半数服务器,能耗也达到30兆瓦。9机遇n大部分企业IT基础设施的利用率只有35%. 还有许多企业的IT资源利用率不到15%(IDC报告).nGoogle的数据表明其绝大部分服务器的利用率在10%到50%之间。nWhy? ? 突发性的数据访问行为 。10推动

5、力n摩尔定律。商用化的组件组成的电脑其性能已足以支持多个操作系统的并行运行。n虚拟机技术的复苏(出现在上世纪70年代,并主要用在IBM 360的大型机中)n利用商用化的计算机组件来构造云环境n利用虚拟机技术来实现计算资源的按需分配。11杀手级的应用n任何一项新技术或者新的服务模式的成功,往往是因为其出现在恰当的时间,并且有合适的外因和内因来推动。n杀手级的应用(WWW互联网)。n云计算之历史渊源:元计算(Metacomputing)、普适计算(pervasive computing)、按需计算(On demand computing)、效用计算(Utility computing)、自主计算(

6、Autonomic computing)、网格计算(Grid computing)等等。 12什么是云计算一种新的服务模式。按服务类型大致可分:n将基础设施作为服务(Infrastructure as a Service, IaaS)、n将平台作为服务(Platform as a service, PaaS)n将软件作为服务(Software as a service, SaaS)。 13服务模式n根据实际需要通过定制或租用的方式使用基于Web的软件来完成所需的工作。n将应用和计算机资源包括硬件和系统软件包装成服务,通过按需付费(pay-as-you-go)的方式,穿越Internet来满足用

7、户各种不同的需求。n用户可以不再需要购买昂贵的计算机系统,不再因为需要短时间使用某个软件而不得不购买该软件的使用版权。n云计算通过虚拟化技术,通过资源整合,实现按需资源分配。提高资源利用率,同时降低用户的设备投入和使用成本。 14云体系结构云体系结构15n一条双向可无限延长的、被分成一个个方格的磁带, 格里写有符号n一个有限状态控制器n一个读写磁头图灵机图灵机这个装置就是根据程序的命令以及它的内部状态进行磁带的读写、移动。 图灵机的动作由五元组确定:图灵机的动作由五元组确定:其中,其中,q和和q为控制器的当前状态和下一状态;为控制器的当前状态和下一状态;b和和a为方格中的原有符号为方格中的原有

8、符号和修改后的符号,和修改后的符号,m指示磁头移动方向,或左或右或停。指示磁头移动方向,或左或右或停。由状态和符号确定的工作过程称图灵机程序。由状态和符号确定的工作过程称图灵机程序。图灵论题:图灵论题:凡是可计算的函数都可以用图灵机计算。凡是可计算的函数都可以用图灵机计算。16冯冯诺伊曼架构诺伊曼架构l计算机由控制器、运算器、存储器、输入设备和输出设备五大部分组成。l基本原理:存储程序(stored program)并按地址顺序执行。l控制器按照程序顺序,逐条把指令和数据从存储器中取出并加以执行,自动完成由程序所描述的处理工作。l以计算为中心17云环境架构服务器存储系统网络设备虚拟化技术虚拟化

9、技术应用/计算传输数据18云环境架构与用户视图19n云架构的特点:将地理上分布、大规模、异构的资源进行虚拟化,并能够对用户提供按需服务。n云的成功在很大程度上决定于云的规模效应。n同时,云环境下非常重要的问题之一就是如何合适地安排计算、存储和传输,使得其规模和性能能够同步扩展。 20云计算:虚拟机n虚拟机通过软件来模拟具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统。n优点:n提高资源的利用率。多个操作系统可以同时存在和运行于同一个物理平台上(在单个服务器上有可能同时运行数百个虚拟机器)。n有效隔离操作系统和资源。虚拟机中的操作系统崩溃后恢复比较容易,并不会对同一个物理平台上的

10、其它操作系统造成影响,而且比较容易实现操作系统的数据重放和回滚。 21虚拟机技术的问题n虚拟机技术最初使用在IBM 360的大型机中。大型机中往往采用专门的通道来来保证外部设备的访问和性能。n将该技术移植到基于商用组件的X86环境下,由于缺乏专用的通道和通道处理机来应对I/O访问,虚拟机环境下的I/O问题已经成为当前虚拟机系统中面临的最大问题。22n虚拟机环境下:第二个域的应用通过系统调用产生异步I/O,进入管理程序(Hypervisor),该管理程序将该I/O操作转给第零个域,然后返回到第二个域的操作系统(异步I/O)和上层应用程序。此时第零个域的操作系统将进行实际的I/O操作。待I/O完成

11、后,会产生一个虚拟中断给第零个域的操作系统,该操作系统给虚拟化软件发出相应的虚拟中断。待虚拟化软件完成I/O后,会给第零个域的操作系统返回一个系统调用来唤醒第二个域的操作系统,然后虚拟机管理程序将I/O完成的中断交给第二个域的操作系统,最后将I/O操作产生的数据交给第二个域中的应用程序。传统的计算机系统中:应用程序通过系统调用产生异步I/O操作后直接返回。待I/O操作完成后会产生中断给操作系统,并将I/O操作产生的数据交给应用程序。23云存储:磁盘驱动器磁盘是一种机电混合设备。在过去的十多年中,磁盘的区域密度、轨密度和线密度分别获得了100%, 50% 和 30% 的增长。24磁记录技术25存

12、储的角色演变n数据的增涨导致了以“计算”为中心到以“数据存储”为中心的的观念革新。n存储领域的两个重要转折点:n并行存储。比如磁盘阵列技术(RAID)。n网络存储。NAS,SAN 26新型存储体系结构n将网络引入存储系统,改变主机与外部存储节点间的连接模式,产生了若干新型存储体系结构:n直接联网存储( Direct attached storage , DAS )n附网存储(network attached storage , NAS)n存储区域网(storage area network , SAN)。n存储系统必须要从少数的存储引擎向连在网络上的成千上万的商用化存储设备进行转变。27三种典

13、型的存储系统附网存储附网存储存储区域网存储区域网直连存储直连存储28存储需求科学计算科学计算航空航空航天航天生物医学生物医学石油勘探石油勘探29n在过去的十多年中集群网络的重要进展之一是可以将成千上万的节点连起来,同时保证高可扩展性和相对较低的通讯开销。n采用商用化的技术来构造可扩展的集群是云存储的基本组件。n搭积木的形式来聚合存储组件。云存储理想架构30挑战1:名字空间n存储器空间的组织和分配,数据的存储、保护和检索都依赖于文件系统。n文件系统由文件和目录构成文件系统的树形层次化结构。包括集群文件系统。n当数据的访问从树根走向树叶的时候,访问的延迟会响应的增加。如果不知道文件保存位置,必须遍

14、历整个目录。n还有两个重要的因素导致树形架构不适合于云存储环境:n(1)树根本身就是一个单一失效点,而且很容易形成系统的瓶颈。n(2)树形架构很难在Internet上扩展到地理上分布的规模。n云存储只有采用非集中式的名字空间来避免潜在的性能瓶颈和单点失效。31挑战2:元数据n元数据是描述数据的数据,主要用来反映地址信息和控制信息,通常包括文件名、文件大小、时间戳、文件属性等等。n在文件系统的操作中,超过50%的操作是针对元数据的. 另有研究指出,使用NFS 3.0时,其客户端和服务器端交互的信息中65%的信息是和元数据相关的。n元数据是小的随机请求。32n和存储容量的增长不同,机械组件所带来的

15、延迟,磁盘的平均访问时间每年的降低不足8%。n小的随机请求,寻道时间是磁盘访问延迟中最组要的部分。这是由于磁头的稳定时间主导着磁盘的寻道时间,而且磁头的稳定时间数年来基本上没有太大的变化。n因此,对于大规模系统来讲,元数据的访问往往成为制约整个系统性能的瓶颈。33云传输:广域网性能云传输:广域网性能nNielsen 法则:终端用户的网络带宽以每年50%的速度增长。n广域网:n一条T1线路的带宽只相当于千兆网的千分之一,许多帧中继线路的带宽只有256Kbits/秒。nGarfinkel 通过测量发现从美国伯克利大学到西雅图的平均网络写带宽大约是5 to 18 Mbits/秒。n我们的测量数据:在

16、格林尼治标准时间下午7点到10点,从英国剑桥大学到中国北京的平均网络带宽大约是1.8 Mbits每秒。n由于广域网物理距离的原因,不可避免的时延也会对带宽造成影响。例如,一个T3链路(44.736 Mbits/秒),当时延超过40ms时,其带宽很快就下降到与T1链路(1.544 Mbits/秒)相当。34云传输可能的解决方案n云环境必须是地理上分布的,因为云的成功在很大程度上决定于其规模效应。n计算和存储相对便宜,然而,由于广域网环境下的低带宽、高延迟和较高的丢包率,使得广域网成为云环境下那块最短的木板。n图灵奖获得者Jim Gray 在2006年就指出在广域网上处理大数据集时,应该将程序传给

17、数据,而不是将数据传给程序。n另外,通过数据压缩、数据的去重等方法来减少网域网上的数据传输流量,降低对网络带宽的需求。采用动态缓存、IP流量管理以及QoS等方法来降低广域网的延迟。n但是,这些方法只能在一定程度上来缓解网络瓶颈问题,不能从根本上解决问题。因此,在设计云架构时,必须要考虑广域网的带宽、延迟和包丢失率所带来的影响。35云环境下的传输协议n目前广泛使用的TCP/IP协议是在实验室低速网络环境下诞生的,在设计初期只是为了保证数据在链路上的可靠传输。因此,它并不是为广域网而设计的网络传输协议。nTCP/IP协议的滑动窗口,重传和恢复等机制使得广域网的传输效率急剧下降。nTCP的窗口尺寸、慢启动等机制也无法充分利用已有的网络带宽。n我们需要重新审视在大规模数据传输的情况下广域网的性能优化相关的一系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论