版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1主要内容Hadoop项目简介HDFS体系结构HDFS关键运行机制HadoopVS.Google(分布式文件系统)HadoopAPIHadoop环境搭建2Hadoop项目简介吃水不忘挖井人DougCutting简介:Lucene(开源的全文检索包人)、Nutch(开源搜索引擎)、hadoop创始人。曾经在是雅虎搜索工程师,后面加入Cloudera,发展hadoop的企业级应用。一位盗火者,把高深的搜索引擎技术带给普通大众。3Hadoop项目简介Apache的解决方案Google云计算MapReduceBigTableGFSChubbyGFS-->HDFSMapReduce-->Hadoop
BigTable-->HBase
5
HDFS体系结构
NameNodeMasterDataNodeChunksever6一个名字节点和多个数据节点数据复制(冗余机制)
--存放的位置(机架感知策略)故障检测--数据节点心跳包(检测是否宕机)块报告(安全模式下检测)数据完整性检测(校验和比较)--名字节点(日志文件,镜像文件)空间回收机制
HDFS关键运行机制
--保障可靠性的措施7HDFS关键运行机制
--写文件流程客户端缓存流水线复制并发写控制流程:1.客户端把数据缓存到本地临时文件夹2.临时文件夹数据超过64M,客户端联系NameNode,NameNode分配DataNode,DataNode依照客户端的位置被排列成一个有着最近物理距离和最小的序列3.与序列的第一个数据服务器建立Socket连接,发送请求头,然后等待回应,依次下传,客户端得到回包,流水线建立成功,4.正式发送数据,以4K为大小传送9HDFSVS.GFS总体架构的比较数据结构化管理组件:Hbase→BigTable并行计算模型:MapReduce→MapReduce分布式文件系统:HDFS→GFSHadoop缺少分布式锁服务ChubbyHBaseMapReduceHDFSBigTableMapReduceGFSHadoop云计算应用Google云计算应用10HDFSVS.GFSHDFS与GFS比较中心服务器模式的差异GFS:多台物理服务器,选择一台对外服务,损坏时可选择另外一台提供服务HDFS:单一中心服务器模式,存在单点故障原因:Hadoop缺少分布式锁服务11HDFSVS.GFSHDFS与GFS比较子服务器管理模式差异GFS:ChunkServer在Chubby中获取独占锁表示其生存状态,Master通过轮询这些独占锁获知ChunkServer的生存状态HDFS:DataNode通过心跳的方式告知NameNode其生存状态GFS中,Master损坏时,替补服务器可以快速获知ChunkServer的状态HDFS中,NameNode损坏后,NameNode恢复时需要花费一段时间获知DataNode的状态在添加数据存储节点时,GFS的伸缩性较HDFS要好原因:Hadoop缺乏分布式锁服务13HDFSVS.GFSHDFS与GFS比较HDFS具备空间回收机制文件删除时,仅删除目录结构实际数据的删除在等待一段时间后实施优点:便于恢复文件14HDFS
API简单的HDFSAPI:
hdfs.copyFromLocalFile(pathsrcPath,pathdstPath)
上传本地文件到HDFS的指定位置上eg: 1.Configurationconfig=newConfiguration();
2.hdfs=(config);
3.PathsrcPath=newPath(srcFile);
4.PathdstPath=newPath(dstFile);
5.hdfs.copyFromLocal,dstPath);
hdfs.create(pathpath)
创建HDFS文件 1.Configurationconfig=newConfiguration();
2.hdfs=(config);
3.Pathpath=newPath();
4.FSDataOutputStreamoutputStream=hdfs.create(path);
5.outputStream.write(buff,0,buff.length);15HDFS
API常用的HDFSAPI:hdfs.rename(PathfromPath,PathtoPath) 重命名hdfs文件hdfs.delete(Pathf,Booleanrecursive) 删除指定HDFS文件hdfs.exists(Pathpath) 检查指定路径是否存在
17HDFS
--安防行业的应用前景HDFS存储相对传统存储的优势海量数据存储传统存储:海量视频存储对硬盘要求过高,不能动态增加硬盘容量,扩展容量方便HDFS存储:可以动态增加容量,容量抽象为没有上限,流式存储很适合视频数据。18HDFS
--安防行业的应用前景HDFS存储相对传统存储的优势海量数据分析传统存储:从海量视频数据存储中分析数据基本无法实现。HDFS存储:和hadoop另外的MapReduce分布式计算架构配合,可以进行海量视频数据的分析。19HDFS
--安
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 环保公司解除租赁协议
- 污水处理招投标委托书范例
- 农业物流服务合同管理指南
- 文化产业严禁参与盗版侵权承诺书
- 公共广场地砖铺设合同
- 建筑加固改造升级劳务协议
- 上海市工业园区基础设施施工合同
- 医疗机构用工规范承诺书
- 石油开采设备日常养护管理办法
- 渔业捕捞与加工合同
- 水灾期间的食品安全措施
- JTG F90-2015 公路工程施工安全技术规范
- 医院人才梯队建设与培养方案
- 上下班安全交通培训
- 股骨头置换术后护理查房
- 五谷知识课件
- 在线网课知慧《亚健康学(亚健康学)》单元测试考核答案
- 《招商招租方案》课件
- 第六单元中国特色社会主义生态文明建设及结语练习-2023-2024学年中职高教版(2023)中国特色社会主义
- 平面直角坐标系(单元教学设计)大单元教学人教版七年级数学下册
- 江苏省泰州市海陵区2023-2024学年七年级上学期期中语文试卷
评论
0/150
提交评论