版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于Hadoop的云架构系统方案作者:日期:2基于Hadoop的云架构系统方案云计算是目前最热门的研究领域之一,也是众多企业及研究机构研究的课 题。云计算是分布式处理、并行处理和网格计算的发展,或者说是这些计算机科 学概念的商业实现。云计算的新颖之处在于它几乎可以提供无限的廉价存储和计 算能力。未来存储模式将改变目前的存储模式。 不再存放在个人计算机及服务器 上,而是存放在云服务器中。同时所有的计算及处理工作也将在云服务器完成。 这样给企业及各厂商带来很多便利。节省了投入成本、企业能够很好的应付突发 的大访问量以及能够提供存储服务的同步升级和数据的有效管理。因此,云计算在近年来赢得了众多厂商和
2、企业的关注并得到长足的发展。1.云计算及其存储结构1.1云计算概念云计算是网格计算、分布式计算、并行计算、效用计算、网络存储、虚拟化、 负载均衡等传统计算机技术和网络技术发展融合的产物。它旨在通过网络把多个 成本相对较低的计算实体整合成一个具有强大计算能力的完美系统,并借助SaaS PaaS laaS、MSP等先进的商业模式把这强大的计算能力分布到终端用户 手中。云计算的一个核心理念就是通过不断提高“云”的处理能力,进而减少用 户终端的处理负担。最终使用户终端简化成一个单纯的输入输出设备。并能按需享受“云”的强大计算处理能力。也就是说用户端只需要进行输入输出。其它所 有计算、存储、处理等功能全
3、部交给“云”去处理 ,用户可以根据自己的需求订 购“云”中的服务。1.2云计算的体系结构在云计算体系结构中,用户的操作及存储等服务都由云中的各个服务器完 成。根据需求访问计算机和存储系统。用户的系统不需安装任何软件,数据也存储在云的计算机及服务器中。图1是云计算体系结构的模型。由用户端、服务目 录、系统管理、配置工具、监控、服务器几个模块构成,各模块负责不同的功能。用户端:用户与云系统交互的界面,用户通过用户端向云发出请求。服务目录:显示该用户能够访问及操作的所有服务的目录列表, 用户可以在 这些目录里进行选择操作。系统管理:管理可分配给计算机的各种资源,从而保证负载平衡。配置工具:用户通过配
4、置工具在分配的服务器节点上配置需要的各种运行 环境。监控:监控和计算云系统资源的使用情况,确保资源能顺利分配给合适的用 户。服务器集合:云系统中的各个服务器的集合。在云计算体系结构中,用户通过用户端访问服务目录,选择所需的服务;当 服务请求发送并验证通过后,由系统管理负责找到所需要的资源;用户通过用户 端在服务目录中选取调用一个服务, 该命令传递到系统管理后,由系统管理选取 合适的节点。调用配置工具为用户准备运行环境。1.3云存储及其架构模型 1.3.1云存储的定义云存储指通过集群应用、网格技术或分布式文件系统等功能将网络中大量各 种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供
5、数据存储 和业务访问功能的一个系统。云存储可以简单的理解为云计算中的存储。 云存储 系统可以认为是配置了大容量存储空间的云计算系统。用户所有的数据都保存在“云”中,需要时从“云”中读取,本地不需要任何的存储设备。云存储更准精 确地说是一种服务,用户使用的是由许多个存储设备和服务器所构成的集合体提 供的数据访问服务。1.3.2云存储的架构模型云存储系统主要用来进行数据存储与管理而且处理的数据都是超大规模的。 云存储系统是网络设备、存储设备、服务器、应用软件、公用访问接口、接入网 和客户端程序等多个部分组成的复杂系统。 各部分以存储设备为核心,通过应用 软件对外提供数据存储和业务访问服务。 云存储
6、模型与云计算模型相比,增加了 一个存储层,且基础管理层增加了与数据管理和数据安全有关的功能。两者在访 问层和应用接口层则是完全相同的。存储层主要包括存储设备及存储设备管理系统。存储设备分布在不同地域, 彼此之间通过网络互联在一起。存储设备管理系统负责存储设备的虚拟化管理、 多链路冗余管理、硬件设备的状态监控和故障维护、设备升级等。基础管理层通 过集群系统、分布式文件系统和网格计算等技术,实现云存储中多个存储设备之 间的协同工作。应用接口层根据用户订购的服务为用户分配权限,为不同的用户提供不同的API接口及应用软件,同时提供网络接入、用户认证等功能。访问层 包括各种能够访问云存储系统的用户,用户
7、可以通过标准的公共应用接口登录云 存储系统,享受云存储服务。2. HadooP平台介绍Hadoop是 一个能够对大量数据进行分布式处理的软件框架。用户可以轻松地 在Hadoopt开发和运行处理海量数据的应用程序。它主要有以下几个优点:1高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。2高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的, 这些集簇可以方便地扩展到数以千计的节点中。3高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态 平衡,因此处理速度非常快。4高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的 任务重新分配。
8、Hadoop带有用Java语言编写的框架,因此运行在 Linux生产平台上是非常 理想的。Hadoop上的应用程序也可以使用其他语言编写,比如C+Hadoop最核心的设计就是分布式文件系统HDFS和Ma p/Reduce算法模型。 分布式文件系统HDF是专门为Map/Reduce乍业所设计的文件系统。但HDFS并不是用来处理随机存取数据的,HDFS的设计中更多的考虑到了数据批处理,而不 是用户交互处理,比之数据访问的低延迟问题,更关键的在于数据访问的高吞吐 量。因此,HDFS是一个给应用提供高吞吐量的分布式文件系统,可能由成百上 千的机器所构成,每个机器上存储着文件系统的部分数据。计算模型Map/Reduce 是Hadoop的核心计算模型,是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国木框挂钟行业投资前景及策略咨询研究报告
- 2024至2030年矿物基层用底漆项目投资价值分析报告
- 2024至2030年海竿包项目投资价值分析报告
- 2024至2030年拉花锯条项目投资价值分析报告
- 2024至2030年左旋甲状腺素项目投资价值分析报告
- 2024至2030年B-苯乙醇项目投资价值分析报告
- 2024年青花坛罐项目可行性研究报告
- 2024年中国钢丝货架市场调查研究报告
- 2024年荧光色层毛细管吸附柱项目可行性研究报告
- 2024年中国赛车胎市场调查研究报告
- 国家开放大学电大中国古代文学(B)(2)形考任务4答案
- 中共一大会址社会实践报告
- 人教版五年级数学上册第八单元表集体备课教案
- 信息系统项目管理师案例分析(项目范围管理)
- 【社区治理研究国内外文献综述5700字(论文)】
- 数独-九宫格学习资料课件
- 煤矿安全检查工试题与答案
- 住院患者非计划拔管危险因素评估量表
- 产品合格证标准模板
- 工业机器人技术与应用PPT完整全套教学课件
- 人教版PEP英语四年级上册全册双减同步分层作业设计含答案
评论
0/150
提交评论