下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
/基于Hadoop的云架构系统方案云计算是目前最热门的研究领域之一,也是众多企业及研究机构研究的课题。云计算是分布式处理、并行处理和网格计算的发展,或者说是这些计算机科学概念的商业实现。云计算的新颖之处在于它几乎可以提供无限的廉价存储和计算能力。未来存储模式将改变目前的存储模式。不再存放在个人计算机及服务器上,而是存放在云服务器中。同时所有的计算及处理工作也将在云服务器完成。这样给企业及各厂商带来很多便利。节省了投入成本、企业能够很好的应付突发的大访问量以及能够提供存储服务的同步升级和数据的有效管理。因此,云计算在近年来赢得了众多厂商和企业的关注并得到长足的发展。云计算及其存储结构1.1云计算概念云计算是网格计算、分布式计算、并行计算、效用计算、网络存储、虚拟化、负载均衡等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个成本相对较低的计算实体整合成一个具有强大计算能力的完美系统,并借助SaaS、PaaS、IaaS、MSP等先进的商业模式把这强大的计算能力分布到终端用户手中。云计算的一个核心理念就是通过不断提高“云”的处理能力,进而减少用户终端的处理负担。最终使用户终端简化成一个单纯的输入输出设备。并能按需享受“云”的强大计算处理能力。也就是说用户端只需要进行输入输出。其它所有计算、存储、处理等功能全部交给“云”去处理,用户可以根据自己的需求订购“云”中的服务。云计算的体系结构在云计算体系结构中,用户的操作及存储等服务都由云中的各个服务器完成。根据需求访问计算机和存储系统。用户的系统不需安装任何软件,数据也存储在云的计算机及服务器中。图1是云计算体系结构的模型。由用户端、服务目录、系统管理、配置工具、监控、服务器几个模块构成,各模块负责不同的功能。用户端:用户与云系统交互的界面,用户通过用户端向云发出请求。服务目录:显示该用户能够访问及操作的所有服务的目录列表,用户可以在这些目录里进行选择操作。系统管理:管理可分配给计算机的各种资源,从而保证负载平衡。配置工具:用户通过配置工具在分配的服务器节点上配置需要的各种运行环境。监控:监控和计算云系统资源的使用情况,确保资源能顺利分配给合适的用户。服务器集合:云系统中的各个服务器的集合。在云计算体系结构中,用户通过用户端访问服务目录,选择所需的服务;当服务请求发送并验证通过后,由系统管理负责找到所需要的资源;用户通过用户端在服务目录中选取调用一个服务,该命令传递到系统管理后,由系统管理选取合适的节点。调用配置工具为用户准备运行环境。云存储及其架构模型1.3.1云存储的定义云存储指通过集群应用、网格技术或分布式文件系统等功能将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。云存储可以简单的理解为云计算中的存储。云存储系统可以认为是配置了大容量存储空间的云计算系统。用户所有的数据都保存在“云”中,需要时从“云”中读取,本地不需要任何的存储设备。云存储更准精确地说是一种服务,用户使用的是由许多个存储设备和服务器所构成的集合体提供的数据访问服务。1.3.2云存储的架构模型云存储系统主要用来进行数据存储与管理而且处理的数据都是超大规模的。云存储系统是网络设备、存储设备、服务器、应用软件、公用访问接口、接入网和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件对外提供数据存储和业务访问服务。云存储模型与云计算模型相比,增加了一个存储层,且基础管理层增加了与数据管理和数据安全有关的功能。两者在访问层和应用接口层则是完全相同的。存储层主要包括存储设备及存储设备管理系统。存储设备分布在不同地域,彼此之间通过网络互联在一起。存储设备管理系统负责存储设备的虚拟化管理、多链路冗余管理、硬件设备的状态监控和故障维护、设备升级等。基础管理层通过集群系统、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之间的协同工作。应用接口层根据用户订购的服务为用户分配权限,为不同的用户提供不同的API接口及应用软件,同时提供网络接入、用户认证等功能。访问层包括各种能够访问云存储系统的用户,用户可以通过标准的公共应用接口登录云存储系统,享受云存储服务。Hadoop平台介绍Hadoop是一个能够对大量数据进行分布式处理的软件框架。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点:⒈高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。⒉高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。⒊高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。⒋高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。Hadoop带有用Java语言编写的框架,因此运行在Linux生产平台上是非常理想的。Hadoop上的应用程序也可以使用其他语言编写,比如
C++。Hadoop最核心的设计就是分布式文件系统HDFS和Map/Reduce算法模型。分布式文件系统HDFS是专门为Map/Reduce作业所设计的文件系统。但HDFS并不是用来处理随机存取数据的,HDFS的设计中更多的考虑到了数据批处理,而不是用户交互处理,比之数据访问的低延迟问题,更关键的在于数据访问的高吞吐量。因此,HDFS是一个给应用提供高吞吐量的分布式文件系统,可能由成百上千的机器所构成,每个机器上存储着文件系统的部分数据。计算模型Map/Reduce是Hado
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年教育培训项目投资与合作合同
- 设立分公司技术试验协议
- 多元化中学门卫招聘协议
- 留学生合同范本
- 草场租赁合同:户外健身中心
- 乡镇公务员聘用合同
- 旅游项目融资抵押借款协议书
- 电力施工设备租赁合同
- 驾校训练场驾驶培训租赁合同
- 医院工程板房施工协议
- 胰腺囊性肿瘤鉴别诊断
- JJG 693-2011可燃气体检测报警器
- 4.1 认识挫折直面困难(高效教案)-【中职专用】中职思想政治《心理健康与职业生涯》(高教版2023·基础模块)
- 电表分户申请书范本合集3篇
- 半导体行业的投资机会与风险分析
- 高中英语U4-The-Words-That-Changed-A-Nation教学课件
- 大学生创业法律服务智慧树知到期末考试答案2024年
- 中职学考《哲学与人生》考试复习题库(含答案)
- 货运驾驶员岗前培训
- 项痹中医护理课件
- 预防未成年人犯罪法主题班会
评论
0/150
提交评论