Hadoop大数据平台构建与应用第14章HADOOP从完全分布式到HA安装与使用课件_第1页
Hadoop大数据平台构建与应用第14章HADOOP从完全分布式到HA安装与使用课件_第2页
Hadoop大数据平台构建与应用第14章HADOOP从完全分布式到HA安装与使用课件_第3页
Hadoop大数据平台构建与应用第14章HADOOP从完全分布式到HA安装与使用课件_第4页
Hadoop大数据平台构建与应用第14章HADOOP从完全分布式到HA安装与使用课件_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第14章HADOOP从完全分布式到 HA安装与使用HADOOP HA 介绍安装虚拟机系统安装JDK集群HADOOP-配置过程部署配置HADOOP HA模式第1页,共18页。目录页14.1HADOOP HA 是什么?14.1.1HDFS HA背景14.1.2HDFS HA架构14.2安装虚拟机系统14.2.1在VMware中创建虚拟机14.2.2安装CentOS 714.2.3网络静态IP地址设置14.2.4克隆3台虚拟机14.3使用XSHELL 6登录CENTOS虚拟机14.4修改各节点主机名称并配置SSH免密14.4.1修改各节点虚拟机主机14.4.2主机名与IP地址映射14.4.3SSH免

2、密设置14.5安装JDK第2页,共18页。目录页14.6安装并配置ZOOKEEPER14.6.1安装Zookeeper14.6.2启动和停止Zookeeper14.7安装并配置为完全分布式HADOOP集群14.7.1Hadoop软件上传、解压与配置环境变量14.7.2将hadoop配置配置为完全分布式14.8部署配置HADOOP HA模式14.8.1编辑Hadoop HA配置文件14.8.2将修改后的hdfs-site.xml和core-site.xml分发到其他节点14.8.3第一次启动HA14.8.4常规启动HA14.8.5Hadoop HA部署完成之后常规启停顺序14.8.6在HA集群上

3、测试wordcount程序第3页,共18页。14.1Hadoop HA 介绍Hadoop HA模式中文称谓高可用性Hadoop模式或容灾性Hadoop模式。HDFS集群中NameNode 存在单点故障(SPOF)。对于只有一个NameNode的集群,如果NameNode机器出现意外情况,将导致整个集群无法使用,直到NameNode 重新启动。影响HDFS集群不可用主要包括以下两种情况:一是NameNode机器宕机,将导致集群不可用,重启NameNode之后才可使用;二是计划内的NameNode节点软件或硬件升级,导致集群在短时间内不可用。为了解决上述问题,Hadoop给出了HDFS的高可用HA

4、(high availability)方案14.1.1 HDFS HA背景第4页,共18页。14.1Hadoop HA 介绍一个典型的HA高可用性集群,NameNode会被配置在两台独立的机器上,在任何时间上,一个NameNode处于活动状态,而另一个NameNode处于备份状态。为了让Standby Node与Active Node保持同步,这两个Node都与一组称为JNs(Journal Nodes)的互相独立的进程保持通信。Hadoop HA模式是一种QJM机制的模式。QJM全称是Quorum Journal Manager(仲裁日志管理器), 它由JournalNode(JN)组成,一

5、般是奇数点结点组成。为了支持快速failover(失效接管),Standby node持有集群中blocks(所有块)的最新位置是非常必要的。14.1.2 HDFS HA架构第5页,共18页。14.2安装虚拟机系统1、查看虚拟机NAT模式的网关和IP地址2、修改网卡设置,确定静态IP地址3、重启网卡4、查看新设IP地址5、设置域名解析服务器6、验证能否上网(当然主机要先能联网)14.2.1在VMware中创建虚拟机14.2.2安装CentOS 714.2.3网络静态IP地址设置14.2.4克隆3台虚拟机第6页,共18页。14.3使用XShell 6登录centOS虚拟机登录官方网站(/prod

6、ucts/main.html)申请Xshell 6学生版即可。1、创建连接会话(1)启动XShell 6(2)在菜单栏中,选择“文件”|“新建”。(3)第一次使用会话连接2、安装rz和sz第7页,共18页。14.4修改各节点主机名称并配置SSH免密1、在master1节点上修改/etc/hosts文件。2、分发hosts文件到各节点14.4.1修改各节点虚拟机主机名14.4.2主机名与IP地址映射14.4.3SSH免密设置1、生成秘钥2、将各自节点的公钥文件复制为不同的文件名。3、远程拷贝(scp命令)公钥文件4、将4个节点的公钥文件全部导入许可文件authorized_keys5、分发6、验

7、证第8页,共18页。14.5安装JDK1、建立一个存放安装软件的目录:2、上传JDK安装软件到安装软件目录3、建立工作路径/usr/java4、解压JDK安装软件到工作路径5、配置JAVA环境变量6、生效环境变量:7、查看java版本:8、分发到其他节点9、分别在master1、slave11、slave22节点上生效环境变量10、分别在master1、slave11、slave22节点上查看java版本第9页,共18页。14.6安装并配置Zookeeper先在master2节点上安装Zookeeper,然后分发到其他节点。1、上传Zookeeper安装压缩包2、解压缩文件到路径/opt下:3

8、、修改zookeeper-3.10.6安装目录名4、编辑配置zoo.cfg文件5、创建zkdata和zkdatalog文件夹6、设置Zookeeper节点对应的ID7、为master2设置Zookeeper环境变量并使之生效。8、使环境变量生效:# source /etc/profile9、分发zookeeper10、修改slave11和slave22节点的myid11、将环境配置文件/etc/profile分发到slave11和slaver2节点上,使Zookeeper环境变量在各自节点上生效。14.6.1 安装Zookeeper第10页,共18页。14.6安装并配置Zookeeper1、在

9、安装Zookeeper的各个节点上关闭防火墙# systemctl stop firewalld #分别在master2、slave11、slave22节点上执行2、启动ZooKeeper集群# zkServer.sh start #在3个节点上分别启动Zookeeper# zkServer.sh status #查看Zookeeper状态3、启动Zookeeper常见的问题4、关闭Zookeeper$ zkServer.sh stop14.6.2启动和停止Zookeeper第11页,共18页。14.7安装并配置为完全分布式hadoop集群1、上传hadoop-2.7.3.tar.gz2、解压

10、hadoop3、修改Hadoop安装目录名称4、配置Hadoop环境变量:5、使profile生效【# source /etc/profile】14.7.1Hadoop软件上传、解压与配置环境变量第12页,共18页。14.7安装并配置为完全分布式hadoop集群配置目标:master1为NomeNode,master2为Secondary NameNode(第二NameNode),master2、slave11、slave22均为DataNode节点。1、编辑hadoop环境配置文件hadoop-env.sh配置JDK路径2、core-site.xml配置(/opt/hadoop/etc/ha

11、doop/目录下配置,以下xml均同路径)3、修改hdfs-site.xml配置4、修改yarn-site.xml5、配置salves文件,设定数据节点6、分发hadoop配置到所有节点7、配置生效8、启动完全分布式集群14.7.2 将hadoop配置为完全分布式第13页,共18页。14.8部署配置Hadoop HA模式1、进入$HADOOP_HOME/etc/hadoop目录(/opt/hadoop/etc/hadoop)2、修改hdfs-site.xml文件(1)services自定义的HDFS服务名(2)service ID确定每个NameNode的唯一标识(3)no

12、service ID.name node ID(4)service ID.name node ID(5)node.shared.edits.dir(6)dfs.JournalNode.edits.dir(7)service ID(8)dfs.ha.fencing.methods-隔离配置3、修改core-site.xml文件14.8.1编辑Hadoop HA配置文件14.8.2将修改后的hdfs-site.xml和core-site.xml分发到其他节点第14页,共18页。14.8部署配置Ha

13、doop HA模式1、启动Zookeeper2、启动本机的JournalNode3、在master1上(只能在master1上)格式化namenode4、格式化完成后在master1上启动namenode5、双NN同步:master2与master1同步操作6、在master1上启动dfs和yarn7、启动zkfc8、通过命令来查看NameNode的状态(是Active还是Standby)9、查看各节点进程14.8.3 第一次启动HA第15页,共18页。14.8部署配置Hadoop HA模式1、在HA集群的所有节点上均关闭防火墙2、启动zookeeper3、 启动hdfs集群4、启动zkfc5

14、、在master1上启动yarn6、查看各节点进程14.8.4 常规启动HA第16页,共18页。14.8部署配置Hadoop HA模式1、启动过程:(1)在HA集群的所有节点上均关闭防火墙(2)在配置了Zookeeper的节点(master2、slave11、slave22)上均启动ZK(3)master1上启动Hadoop分布式系统start-dfs.sh(4)在master1和master2两个NN节点上分别启动zkfc(5) 在master1上启动yarn(如果需要)(6)查看各节点的进程情况,验证HA集群是否启动成功2、停止过程:(1)在master1上关闭yarn(2)在master1和master2两个NN节点上分别关闭zkfc(3)在master1上关闭Hadoop分布式系统start-dfs.sh(6)在master2、slave11、slave22节点分别关闭Zookeeper进程(7)验证关闭进程情况14.8.5Hadoop HA部署完成之后常规启停顺序第17页,共18页。14.8部署配置Hadoop HA模式hadoop-mapreduce-examples-2.7.3.jar是Hadoop2.7.3自带的一个进行词频统计的示

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论