版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
孟繁兴目录0102HadoopStreaming如何工作HadoopStreaming和Java类HadoopStreaming如何工作1HadoopStreaming如何工作无论使用MapReduce程序还是Hive或Pig脚本,本质上都是使用基于Java的MapReduce。但是,Java并不是在集群中创建map和reduce作业的唯一方法。还可以使用HadoopStreaming,它是一个工具,可以将任何可执行文件或脚本用作mapper或reducer。以下是一个简单的示例,演示如何使用常见的Linux实用程序,如cat(列出文件的内容)和wc(计算文件中的单词)来执行MapReduce任务。HadoopStreaming如何工作$HADOOPHOME/bin/hadoopjar$HADOOPHOME/hadoop-streaming.jar\-inputmyInputDirs\-outputmyOutputDir\-mapper/bin/cat\-reducer/bin/wcHadoopStreaming如何工作可以看到,mapper和reducer都以操作系统可执行文件表示,而不是任何自定义代码。两个可执行文件cat和wc读取输入文件并在终端上显示输出(stdout)。在这个简单的HadoopStreaming示例中,该作业与任何基于Java的MapReduce完全一样,具有类似的工作进度和输出。事实上,根本没有操作上的差异。下面是mapper和reducer任务的做法:HadoopStreaming如何工作mapper将输入转换为行,并从标准输出(stdout)收集输出,并将每个行转换为key/value对。这个key/value对是mapper进程的输出,就像在本章前面看到的WordCount程序的情况一样。reduce任务将key/value对转换为行,并将它们发送到reduce进程的标准输入(stdin)。然后,它们从进程的标准输出中收集输出并将其转换为key/value对,并将它们变为reducer的输出。HadoopStreaming和Java类2HadoopStreaming和Java类当mapper使用HadoopStreaming时,并不是必须要在mapper和reducer上同时使用非Java可执行文件或代码。可以混合和匹配!以下示例显示了如何为mapper程序提供Java类,并在reducer中使用操作系统可执行文件(wc)。HadoopStreaming和Java类$HADOOPHOME/bin/hadoopjar$HADOOP_HOME/hadoop-streaming.jar\-inputmyInputDirs\-outputmyOutputDir\-mapperorg.apache.hadoop.mapred.lib.IdentityMappe\-reducer/bin/wcHadoopStreaming和Java类可以使用用Python编写的mapper轻松替换Javamapper,方法是指定-mappermyPythonscript.py。还可以使用用其他编程语言(如Ruby和PHP)编写的mapper和reducer,这就像我们使用OS可执行文件一样简单。例如,以下两行使用基于PHP的mapper和reducer。-mapper/usr/l
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财务部年度预算执行总结与下年度计划
- 税收法规工作总结
- 建材行业质量管理培训反思
- 营销策划公司前台业务总结
- 【八年级下册历史】单元测试 第一、二单元综合测试卷
- 金融行业客服工作总结
- 2024年秋叶的舞会大班教案
- 《性心理的调节方法》课件
- 2024年观察绿豆日记300字
- 农民甲乙承包合同(2篇)
- 山东省济南市2022年中考英语情景运用拔高练习(Word版含答案)
- 中学校本课程教材《生活中的化学》
- 污水处理站运行维护管理方案
- 农村公路养护工程施工组织设计
- 个人如何开办婚介公司,婚介公司经营和管理
- 公司物流仓储规划方案及建议书
- 天津市历年社会保险缴费基数、比例
- 2024国家开放大学电大专科《学前儿童发展心理学》期末试题及答案
- 汽车座椅面套缝纫工时定额的研究
- 立体几何常考定理总结(八大定理)
- 喷嘴压力计算表及选型
评论
0/150
提交评论