




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3Hadoop的安装与伪分布模式安adoop的安装分为本地模式、伪分布模式、集群模式。本地模式是运行在本地,只负计本伪是在拟署学习调试。集群模式是在多个机器上配置haoop集群的安装。解压缩使用WinSCP把压缩包软件hadoop-1.10.24.tar.gz从宿主机移动到linux 下,如图3-13- hadoop-1.0.4 解压缩文件,并重命名为hadoop,方便使用。重命名后这时,hadoop hadoop-1.0.4 设置环境变 HADOOP_HOME,修改文件“/etc/profile”,如下图3-请读者与jdk设置时配置文件对照。这里我们设置了一个别名cdha,可以快速转到hadoop的 修改环境变量后,记得执行source命令哦。 3-我们关注 和 修改配置文hadoop配置文件默认是本地模式,我们修改四个配置文件,这些文件都位于 下第一个是hadoop环境变量文件hadoop-env.sh。保存并关闭。这里设置的是JAVA_HOME,注意去二二个是 第三个是hdfs配置文件第四个是MapReduce配置文件hadoop格式化文件系hdfs是文件系统以在第一次使用之前需要进行格式化。执行命$HADOOP_HOME/bin/hadoopnamenode–format3-3-注意:只在第一次启动的时候格式化,不要每次启动都格式化。理解为我们新买了块移动硬盘,使用之前总要格式化硬盘。 格式化操作很少有出现失败的情况。如果真出现了,请检查配置是否正确启格式化完成后,开始启动hadoop启动hadoop令都在$HADOOP_HOME/bin/下,下面的所有命令都不再带有完整路径3-执行start-all.sh启动hadoop,观察控制台的输出,见图3-5,可以看到正在启动进程,分别是namenode、datanode、secondarynamenode、jobtracker、tasktracker,一共5个,待执行完毕后,并不意味着这5个进程成功启动,上面仅仅表示系统正在启动进程而已。我们使用jdk令jps查看进程是否已经正确启动。执行以下jps,如果看到了这5个进程,见图3-6,说明hadoop真的启动成功了。如果缺少一个或者多个,那就进入到“Hadoop3-关闭hadoop令是stop-all.sh第二种,分别启动HDFS和3-执行命令start-dfs.sh,是单独启动hdfs,见图3-7。执行完该命令后,通过jps能够看到NameNode、DataNode、SecondaryNameNode三个进程启动了,该命令适合于只执行hdfs不使用MapReduce做计算的场景。关闭令就是stop-dfs.sh了。3-执行命令start-mapred.sh,可以单独启动MapReduce的两个进程。关闭令就是stop-mapred.sh了。当然,也可以先启MapReduce,再启HDFS。这HDFS和MapReduce第三种,分别启动各个进程14821[root@book0bin]#hadoop-daemon.shstartnamenode[root@book0bin]#hadoop-daemon.shstartdatanode[root@book0bin]#hadoop-daemon.shstartsecondarynamenode[root@book0bin]#hadoop-daemon.shstartjobtracker[root@book0bin]#hadoop-daemon.shstarttasktracker[root@book0bin]#jps执行令是“hadoop-daemon.shstart 运行简单的MapReduce计在$HADOOP_HOME下有个jarhadoop-example-1.1.2.jar3-9,这里面含有框架提供的很多例子.我们现在学下如何运行其中的例子吧.3-执行如下命可以看到图3-10的输出信息,可以看到18个输出信息,都是内置的例子程序.我们选择最后一个”wordcount”来运行,该程序的说明在最后,是统计文件中单词的出现次数的.3-3-如何执行这个程序哪?见图3-11,如3-wordcount个文件到hdfs中,见图3-12.那么输入文件的路径就是/README.txt了。3-这时候我们再运行wordcount例子,命令如w w 等到命令执行结束,运行的结果就会存在输出路径的文件夹中,文件名称叫做“part-r-00000”,我们使用命令查看输出内容,如 3-3-3-如果读者能够成功运行,那么恭喜你!你看到的就是hadoop的MapReduce做的事情。通过一个简单令,就可以把文件中的单词统计一遍出现次数,还是很有意思的。参加工作分布模式安装集群的架构和拓扑搭建集群之前,我们先规划一下集群各节点的功能,如下图主机用描64位rhel6,jdk6InC6002*(XeonE5-26202GHz)/64GB/12TB64位rhel6,jdk6InC6002*(XeonE5-26202GHz)/64GB/12TB3-读者在练习的时候,对于主机名和机器ip可以自己设定。不过,需要注意的是用途一定要保持一致,方便下面的学习。安装步1)是否永久关静态ip是否设主机名称是否设/etc/hosts是否添加了所有节点的ip与主机名映以上检查如果读者没有通过,请参面的配置说明进行集群间SSH免登 搭建hadoop集群,需要保证各个节点之间必须是ssh免登录的。那么,我们在节点hadoop0执行,以 在节点hadoop1中执行以下命 这样,就可以实现两个节点通过ssh互相登录时不需要了配置把节点41的hostname修改为在节点hadoop0的/etc/hosts文件中新增以下两行 在其他节点安装jdksshhadoop1在节点hadoop0执行命sshhadoop1 - 第一条命令的目的是把jdk文件夹到节点hadoop1的/usr/local/下第二条命令的目的是把hadoop文件夹到节点hadoop1的/usr/local/下;第三条命令的目的是把/etc/profile文件到节点hadoop1的/etc/下;第四条命令的目的是把/etc/hosts文件到节点hadoop1的/etc/下;配置集群文件hadoop的配置文件slaves,位于 下,里面着datanode和修改后,意味着在节点hadoop1运行datanode和tasktracker节点格式化文件系统hadoop以使用。hadoop文件系统也是如此。在节点hadoop0中执行命令:hadoopnamenode 格式化整个hadoop集群的文件系统。启动集群在节点hadoop0中执行命令:start-验在节点hadoop0中执行jps,可以观察到NameNode、SecondaryNameNode、三个java进程 的常见启动错hadoopjps命令查看启动的节点是否正确,然后再去设置主机名错误看日志,会发现下面的错 Invalidhostnameforserver:master这是由于主机名设置错误造成的,请检查配置文件中关于主机名的设置,是否正确。首先使用otname命令查看主机名是否正确;最后使用more/etc/hosts命令查看ip与主机名的映射是否设置。ip看日志,发现下面的ERRORERRORnode.NameNode:.BindException:Problembindingtobook0/00:9000:Cannotassignrequestedaddress使用more/etc/hosts命令查看ip与主机名的映射是否设置。 不能带有下划线,不能数字开头 含有下划线,也会造成启动失败动,请查看对应的log日志。日志的默认 以下是作者的日志截文件命名是有规律的,“hadoop-[当前用户名]-[节点名称]-[主机名].log”我们只查 结尾的文件。如果是namenode节点没有启动,查看hadoop-root-namenode-book0.log文件多次执行hadoop格式化现象:在Hadoop-root-datanode-master.log中有如下错误ERRORERRORorg.apache.hadoop.hdfs.server.datanode.DataNode:java.io.IOException:patiblenamespaceIDsin原因:每次namenodeformat会重新创建一个namenodeId,而dfs.data.dir参数配置的目录中包含的是上次.dir数配置的id一致。namenodeformat清空了namenode下的数据,但是没有清空datanode下的数据,导致启动时失败,所要做的就是fotmat,清dfs.data.dir数配置的。重新格hdfs的没有关闭从本地往hdfs文件系统上传文件,出现如下错误这个问题最有可能就是没有关闭,导致节点DataNode与节点NameNode通信失败。可以使用serviceiptablesstatus命令关闭。这样关闭后,重启操作系统时,有可能重启,可以关闭自动重能。使chkconfigiptablesofforg.apache
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025春季湖南融通资源循环产业(湖南)有限公司技能岗位社会招聘笔试历年参考题库附带答案详解
- 2025-2030中国化工仓储行业市场发展趋势与前景展望战略研究报告
- 中国软管固定支架行业市场发展前景及发展趋势与投资战略研究报告(2024-2030)
- 中国化纤布加工行业市场发展前景及发展趋势与投资战略研究报告(2024-2030)
- 中国氮化镓工业设备市场发展前景预测及投资战略咨询报告
- 中国滑雪鞋行业市场运营现状及投资规划研究建议报告
- 2025年中国养蚕及深加工市场规模预测及投资战略咨询报告
- 企业人员法律培训课件
- 中国胸苷酸合酶抗体行业市场前景预测及投资价值评估分析报告
- 2021-2026年中国生态农业和绿色食品行业市场深度分析及投资战略研究报告
- 南站商务城二期综合物探报告
- 浙江省引进人才居住证申请表2021版
- GB/T 20133-2006道路交通信息采集信息分类与编码
- GB 6245-2006消防泵
- GA/T 1217-2015光纤振动入侵探测器技术要求
- 2023年贵州水钢金属科技有限公司招聘笔试题库及答案解析
- 七年级生物下填图题(识图题)总复习
- 后穹窿穿刺课件
- 同志借调工作鉴定现实表现材料集合5篇
- MDITDI的安全使用与操作课件
- FMEA-潜在失效模式分析
评论
0/150
提交评论