




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
LET'SMAKESTUDYLET'SMAKESTUDYINTRESTINGRICHAND基于Hadoop的部署与实施基于Hadoop郭Hadoop的伪分布模式部Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事一二三四九 1234熟练部署各种场景的Hadoop 1234熟练部署各种场景的Hadoop平台熟悉如何在Windows和Linux上部署数据分析平台熟悉企业级大规模Hadoop集群的部署与管理熟悉Hadoop的启动和停止过程Hadoop的伪分布模式部Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事一二三四九 •– •––––在单节点上以伪分布模式运使用线程模拟分布 ……JobTrackerMaster ……JobTrackerMasterSecondaryNameNodeMasterNameNode一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九 •– •–––––以非分布式模式运行的一个独立Java进在这种默认模式下所有3个XML文件均为当配置文件为空时,Hadoop会完全运行在本 TaskTrackerJobTracker TaskTrackerJobTrackerMasterSecondaryNameNodeMasterNameNode一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九 •• ••–––––真正有意义的集由一个NameNode个SecondaryNameNode和多个DataNode组成 Slave-Slave-Slave- Slave-Slave-Slave-一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九 •– •–––••••••••在ESXi上创建Linux在OpenStack环境下创建Linux在Windows的VMwareWorkStation上创建Linux虚拟机 ••在OpenStack环境下创建1台CentOS ••在OpenStack环境下创建1台CentOS6.5Intel(R)Xeon(R)CPUE5-26200@cat/proc/cpuinfo|grep"modelcat/proc/meminfo|grepfree-df•• •Hadoop–––––Hadoop的可执行程 •Hadoop–––––Hadoop的可执行程MapReduce的日志文•Hadoop软件相关的文Hadoop数据相关的文文件系统大小用途/安装操作系操作系统的启动分内存交换分用于存放Hadoop的软用于存放Hadoop的数 •直接使用root用户部署Hadoop–––– •直接使用root用户部署Hadoop––––权限最大,可屏蔽关于文件系统权限的问风险较出现问题无法•使用特定的组和用户部署Hadoop––––需要额外规划,并创建新的组和用户,文件系统的权限也需要修有利于审计工•• • ••••••••••••配置Hadoop配置Linux的SSH •–JDK •–JDK•/technetwork/java/javase/downloads/jdk7-–JDK•/technetwork/java/javase/downloads/jdk8-其他版–•/technetwork/java/javase/archive- •使用RPM •使用RPM的方式安使用tar包解压的方式安JDK•––––使用root用户将JDK安装到/usr/local/java7目录并将JAVA_HOME下的bin目录添加到PATH环境变量•解压jdktar-zxf•解压jdktar-zxfjdk-7u79-linux-移动jdkmvjdk1.7.0_79/••echo"exportJAVA_HOME=/usr/local/java7"•echo"exportJAVA_HOME=/usr/local/java7">>echo"exportPATH=\$JAVA_HOME/bin:\$PATH">>重新加载source• •• ••––––lvcreate-L5120-nlvhadoopmkfs-text4/dev/vg00/lvhadoopmkdir-p/hadoopmount/dev/vg00/lvhadoop•––––lvcreate-L20480-nlvdatamkfs-text4/dev/vg00/lvdatamkdir-p/datamount/dev/vg00/lvdata•–修改/etc/fstab文•–修改/etc/fstab文 •groupadd-g •groupadd-g3000useradd-u3001-gcloudadminchown-Rhadoop:cloudadminchown-Rhadoop:cloudadminls-l/|grep••• • ••配置SSH–––ssh-keygen-tcdcatid_rsa.pub>••将key测试SSH–sshlocalhost •• ••–tar-zxfhadoop- •––––修改 •––––修改hadoop-env.sh文件:添加JAVA_HOME配修改mapred-•–––mkdir-pmkdir-pmkdir-p •conf/hadoop-env.sh •conf/hadoop-env.shHadoopCore配置选HadoopCore配置选 •conf/core-site.xml •conf/hdfs-site.xml •conf/hdfs-site.xmlMapReduce守护进程配MapReduce守护进程配置选 •conf/mapred-site.xml •修改完Hadoop的配置文件后,需要对HDFS •修改完Hadoop的配置文件后,需要对HDFS–bin/hadoopnamenode-•• •使用Hadoop– •使用Hadoop–bin/start-•检查Hadoop–•–bin/hadoopdfsadmin•–bin/hadoopdfsadmin- • • •一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九 •Hadoop系统不能直接在Windows •Hadoop系统不能直接在Windowscygwin软件来在Windows下模拟Linux支持的WindowsWindowsXP、7、2003、2008cygwin:用于在Windows下模拟Linux•••––––安装NetCategory下的openssl•––––安装NetCategory下的openssl的软件Basatg下的s的软件包tsatg•–此处省略……10000231231一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九 • •••••••••••如何选择JDK哪些节点做datanode ••在OpenStack环境下创建4台CentOS ••在OpenStack环境下创建4台CentOS6.5Intel(R)Xeon(R)CPUE5-26200@cat/proc/cpuinfo|grep"modelcat/proc/meminfo|grepfree-df-•• •••• •••••IP地址主机用Hadoop的namenode和Hadoop的datanode和 • ••••••••••••配置Hadoop配置Linux的SSH ••• ••••••上面的步骤和前面的配置一致,这里不再重复配置主机名和IP地址对应关配置主机名和IP地址对应关 •–使用root•––––echoechoechoechohm2">>hd001">>/etc/hostshd002">>hd003">>•–cat在集群中配置SSH在集群中配置SSH免密码登 •在集群的master节点上使用hadoop–ssh-keygen-t在集群的namenode•–––––cdcatid_rsa.pub>>scpauthorized_keys3:/home/hadoop/.ssh/scpauthorized_keysscpauthorized_keys•••SSH•SSH •––––– •––––––修改hadoop-env.sh文件:添加JAVA_HOME配修改slave文•–––mkdir-pmkdir-pmkdir-p •conf/hadoop-env.sh •conf/hadoop-env.shHadoopCore配置选HadoopCore配置选 •conf/core-site.xml •conf/hdfs-site.xml •conf/hdfs-site.xmlMapReduce守护进程配MapReduce守护进程配置选 •conf/mapred-site.xml •conf/masters•conf/slaves •conf/masters•conf/slaves •–––scp-rhadoop-1.2.1scp-rhadoop-1.2.1scp-rhadoop-1.2.1 •修改完Hadoop的配置文件后,需要对HDFS •修改完Hadoop的配置文件后,需要对HDFS–bin/hadoopnamenode- •使用Hadoop–bin/start- •使用Hadoop–bin/start-•检查Hadoop–主节点的进从节点的进程 •– •–bin/hadoopdfsadmin-DFSUsedNonDFSDFSUsed%DFS••••• •ddif=/dev/zeroof=/hadoop/test.datbs=1024000上传文件到HDFSbin/hadoopfs-copyFromLocal/hadoop/test.dat检查HDFSbin/hadoopfs-ls••一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九完全分布完全分布式Hadoop系统的实施步 ••••••••••••配置Hadoop配置Linux的SSH企业级大规企业级大规模集群部署的问 •–CPU、内存、磁盘、网络如何构建SSH免密码登陆Hadoop•••• ••Windows下的Active •••再利用NFS将hadoop用户的home目录放在NFS一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hadoop系Hadoop的启动停止及其注意事四九WordCount程序简 •••WordCount程序简 •••它可以称为MapReduce版“Hello•211MapReduce总体过MapReduce总体过 • • •Mapping过 •Mapping过 •Reducing过 •ReducingReducing过 •Reducing •–––echo •–––echo"thisisatestfile">>echo"hadoopissoeasy">>echo"testhadoopprogram">>•上传测试文件到HDFSbin/hadoopfs-mkdirbin/hadoopfs-copyFromLocal/hadoop/*.txt运行wordcountbin/hadoopjarhadoop-examples-1.2.1.jarwordcountin查看wordcountbin/hadoopfs-ls••Reduce的执行过程Reduce的执行过程过程数据统计信息 •• •••使用ls指令查看wordcount使用cat指令查看wordcount一二三Hadoop的伪分布模一二三Hadoop的伪分布模式部Hadoop的集群部在Linux上安装与配置Hado
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 用电监察员岗位模拟题含答案
- 2025年国家公务员考试公共基础知识法律基础知识试题库及答案(共500题)
- 隧道控制测量培训课件
- 金融电话礼仪培训
- 《大学生心理健康》课件 主题5 破解人际密码 非暴力沟通创造好关系
- 违规上网政治教育
- 采购流程作业
- 防电伤处理及预防措施
- 高中主题班会 高一上学期交通安全教育教育主题班会课件
- 零担运输操作流程
- YY/T 1870-2023液相色谱-质谱法测定试剂盒通用要求
- 博科ERP产品介绍
- 后张法预应力T梁预制施工方案
- 丙醇安全技术说明书MSDS
- GB/T 3836.9-2021爆炸性环境第9部分:由浇封型“m”保护的设备
- GB/T 20001.4-2015标准编写规则第4部分:试验方法标准
- GB/T 19666-2005阻燃和耐火电线电缆通则
- GB/T 19363.1-2008翻译服务规范第1部分:笔译
- GB/T 18316-2001数字测绘产品检查验收规定和质量评定
- GB/T 11864-2008船用轴流通风机
- 东印度公司的来龙去脉
评论
0/150
提交评论