Hadoop练习卷含答案_第1页
Hadoop练习卷含答案_第2页
Hadoop练习卷含答案_第3页
Hadoop练习卷含答案_第4页
Hadoop练习卷含答案_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页Hadoop练习卷含答案1.(,1分)Hadoop集群的yarn组件启动命令是()A、stop-yarn.shB、start-yan.shC、start-dfs.shD、start-yarn.sh【正确答案】:D2.(,1分)常见的文件系统有三类,下面不属于这三类的是()A、单机文件系统B、Windows文件系统C、网络文件系统D、分布式文件系统【正确答案】:B3.(,1分)下列选项中,不属于Hadoop自定义配置文件的是()A、core-site.xmlB、mapreduce-site.xmlC、hdfs-site.xmlD、yarn-site.xml【正确答案】:B4.(,1分)Hadoop集群的hdfs组件启动命令是()A、start-yarn.shB、start-dfs.shC、start-hdfs.shD、stop-dfs.sh【正确答案】:B5.假如现在cd到hadoop安装目录下,请问以下哪个命令不正确()。A、sbin/hdfsnamenode-formatB、bin/hdfsdfs-cat/mydemo/my.txtC、sbin/stop-dfs.shD、sbin/start-dfs.sh【正确答案】:A6.(,1分)MapReduce既分布式计算框架,底层思想采用()A、分而用之B、分而治之C、化简为繁D、集中处理【正确答案】:B7.Hadoop3.X中,()端口是集群Web控制台的默认端口A、80B、9000C、50070D、9870【正确答案】:D8.(,1分)查询表中数据时,去除重复列,使用关键词()A、stinctB、limitC、distinctD、unique【正确答案】:C9.MapReduce任务在运行时会经历那两个过程()A、map、reduceB、maq、redueC、map、redueD、maq、reduce【正确答案】:A10.(,1分)初次格式化HDFS文件系统使用的命令是hdfs___-format。()A、datanodeB、HadoopC、namenodeD、secondarynamenode【正确答案】:C11.hdfsdfs的那个子命令将HDFS下载至Linux文件中()A、-mvB、-cpC、-getD、-put【正确答案】:C12.(,1分)按下键能终止当前运行的命令()A、Ctrl-CB、Ctrl-BC、Ctrl-FD、Ctrl-D【正确答案】:A13.(,1分)hdfsdfs的那个子命令将Linux文件上传至HDFS中()A、-getB、-putC、-mvD、-cp【正确答案】:B14.(,1分)下列选项中,不属于MapTask工作原理中的阶段是()A、Spill阶段B、Read阶段Collect阶段D、Merge阶段【正确答案】:D15.(,1分)以下InputFormat组件中那个是文本文件输入类()A、KeyValueInputFormatB、SequenceFileAsBinaryInputFormatC、SequenceInputFormatD、TextInputFormat【正确答案】:D16.Hadoop2.xMapReduce主要的作用()A、负责分布式文件存储B、负责分布式集群管理C、负责资源管理和任务调度D、负责数据处理【正确答案】:D17.(,1分)HDFS采用_____架构,管理集群()A、分布式B、主从C、副本D、集群【正确答案】:B18.下列选项中,用于访问不同NameNode的子命令选项是()A、-hostB、-targeC、-pathD、-fs【正确答案】:D19.(,1分)与Hadoop1.x相比,Hadoop2.x采用全新的架构,最明显的变化就是增加了哪个组件()A、HbaseB、MapReduceC、PigD、YARN【正确答案】:D20.(,1分)下面那个选项()不是大数据的特点A、处理速度快B、数据类型繁多C、数据量大D、价值密度高【正确答案】:D21.(,1分)副本机制默认的副本数为3。A、对B、错【正确答案】:A22.(,1分)下列关于Hadoop生态体系项目的描述,错误的是()A、Hive是一个数据仓库工具B、Ambari是一个基于Web的工具C、Spark是一个基于内存的分布式计算引擎D、Pig是一个分布式数据库【正确答案】:D23.在ZooKeeper中,ZNode的类型不包括下面那个()A、顺序节点B、持久节点C、永久节点D、临时节点【正确答案】:C24.(,1分)Hadoop2.xMapReduce主要的作用()A、负责数据处理B、负责分布式文件存储C、负责分布式集群管理D、负责资源管理和任务调度【正确答案】:A25.(,1分)下列选项中,用于使用create命令创建顺序结点类型ZNode的参数是()A、-pB、-eC、-rD、-s【正确答案】:D26.(,1分)以下InputFormat组件中那个是文本文件输入类()A、SequenceFileAsBinaryInputFormatB、SequenceInputFormatC、TextInputFormatD、KeyValueInputFormat【正确答案】:C27.(,1分)Hadoop的配置目录在哪里()A、$HADOOP_HOME/confB、/etc/hadoopC、/etc/hostsD、$HADOOP_HOME/etc/hadoop【正确答案】:D28.(,1分)下列选项中,不能注册Watcher的方法是()A、setData()B、getData()C、getChildren()D、exists()【正确答案】:A29.(,1分)检查Linux能否连接上网,通常使用那个命令()A、ipconfigB、ifconfigC、ens33D、ping【正确答案】:A30.(,1分)下列选项中,用于启动Zookeeper服务的命令是()A、zkServer.shB、start-zk.shC、zkServer.shstartD、startzkServer.sh【正确答案】:C31.(,1分)在MapReduce中,对于map输出的中间结果,负责按key进行分区的是()A、ShuffleB、PartitionerC、CombinerD、RecordReader【正确答案】:B32.(,1分)在ZooKeeper中,ZNode的类型不包括下面那个()A、永久节点B、顺序节点C、持久节点D、临时节点【正确答案】:A33.(,1分)下列关于HDFS的说法正确的是()A、SecondaryNameNode通常与NameNode在一个节点启动B、元数据指的是文件实际的数据C、NameNode负责HDFS中的数据存储D、DataNode负责HDFS中的数据存储【正确答案】:D34.下列选项中,用于对Map阶段输出的数据进行分区的组件是()A、Partition组件B、Combiner组件C、Group组件D、Partitioner组件【正确答案】:D35.(,1分)MapReduce编程模型中以下那个组件式最后执行的()。A、PartitionerB、ReducerC、MapperD、RecorfReader【正确答案】:B36.(,1分)下列选项中,不属于HDFS服务的是()A、NodeManagerB、SecondaryNameNodeC、NameNodeD、ZNode【正确答案】:C37.(,1分)Hadoop3.x版本支持最低的JDK版本是()A、JDK7B、JDK9C、JDK8D、JDK6【正确答案】:C38.(,1分)下列关于Hadoop生态体系项目的描述,错误的是()A、Hive是一个数据仓库工具B、Ambari是一个基于Web的工具C、Spark是一个基于内存的分布式计算引擎D、Pig是一个分布式数据库【正确答案】:D39.(,1分)ZooKeeper集群中扮演着不同的角色,其中不包括()A、ObserverB、ClientC、LeaderD、Follower【正确答案】:B40.(,1分)下列选项中,不属于Hadoop自定义配置文件的是()A、hdfs-site.xmlB、mapreduce-site.xmlC、yarn-site.xmlD、core-site.xml【正确答案】:B1.24.(,1分)设置虚拟机主机名为hadoop3的命令是hostnamectlsethostnamehadop3。A、正确B、错误【正确答案】:B2.23.(,1分)Federation机制中每个NameNode管理的NameSpace可以相互访问。A、正确B、错误【正确答案】:B3.24.(,1分)Hadoop安装目录中的lib目录存放了Hadoop各个模块编译后的jar包。A、正确B、错误【正确答案】:B4.28.(,1分)只有初次启动Hadoop集群时需要进行格式化文件系统的操作。A、正确B、错误【正确答案】:A5.23.(,1分)Hive相对于MySQL来说执行延迟低。A、正确B、错误【正确答案】:B6.29.(,1分)创建分区表时,分区字段不能与已存在的字段重复。A、正确B、错误【正确答案】:A7.25.(,1分)用于合并小文件的组件是CombineTextInputFormat。A、正确B、错误【正确答案】:A8.27.(,1分)在MapReduce驱动类中配置ReduceTask数量的方法是setNumReduceTask()。A、正确B、错误【正确答案】:B9.26.(,1分)YARN中负责管理应用程序的是NodeManager。A、正确B、错误【正确答案】:B10.30.(,1分)Hadoop3.x支持最低的JDK版本为1.8。A、正确B、错误【正确答案】:A11.22.(,1分)ErasureCoding是一种加密技术。A、正确B、错误【正确答案】:B12.22.(,1分)Spark是一个基于磁盘的分布式计算引擎。A、正确B、错误【正确答案】:B13.21.(,1分)NodeManager是YARN的服务。A、正确B、错误【正确答案】:A14.28.(,1分)修改ZooKeeper默认配置时,要将模板文件zoo_sample.cfg重命名为zoo.cfg。A、正确B、错误【正确答案】:A15.30.(,1分)Shuffle仅发生在ReduceTask。A、正确B、错误【正确答案】:B16.25.(,1分)2004年,Nutch的开发人员借助GFS开发出了Nutch分布式文件系统。A、正确B、错误【正确答案】:A17.28.(,1分)

只有初次启动Hadoop集群时需要进行格式化文件系统的操作。A、正确B、错误【正确答案】:A18.29.(,1分)ZooKeeper集群中不同ZooKeeper服务的myid可以重复。A、正确B、错误【正确答案】:B19.26.(,1分)在Hadoop2.x中,YARN替代了Hadoop1.x中MapReduce的全部工作A、正确B、错误【正确答案】:B20.27.(,1分)只有初次启动Hadoop集群时需要进行格式化文件系统的操作。A、正确B、错误【正确答案】:A简答题1.33.(简答题,6分)简述ZooKeeper的Watcher机制的特性。【正确答案】:(1)一次性一次性指的是Watcher所监听的事件一旦被触发,那么该Watcher就会被移除,需要反复注册才能使用。(2)客户端串行执行所有Watcher的回调不会并发执行,而是按照回调顺序一个一个执行。

(3)轻量级WatchedEvent是Watcher机制的最小事件通知单元,它的数据结构中只包含三部分内容,分别是通知状态、事件类型和结点路径。2.简要叙述HDFS写文件流程。【正确答案】:(1)客户端NameNode发起写文件请求,与之建立通信。

(2)NameNode检查客户端是否有上传文件的权限,以及文件是否存在。

(3)客户端根据分块策略按128MB块切文件。

(4)客户端向NameNode请求上传第一个Block。

(5)NameNode根据副本机制和机架感知向客户端返回可上传DataNode列表。

(6)客户端从NameNode接收可上传DataNode列表,并与虚拟机建立管道。

(7)连接并建立管道,返回连通情况

(8)客户端开始传输,传输过程是以流式写入(流水)的方式实现。重复第4~8步的流程,依次上传,直到完成文件的上传。3.35.(简答题,6分)简述HDFS的局限性表现在那些方面。【正确答案】:1)HDFS不适合存储大量小文件,因为小文件会占用大量的元数据存储空间,降低存储效率;2)HDFS不支持多用户并发写相同文件,这限制了其在某些应用场景下的使用;3)HDFS不适合交互式应用和低延迟场景,因为其设计目标是批量处理大规模数据,而不是实时响应用户请求。4.简述不同类型ZNode的区别。【正确答案】:(1)持久结点持久结点被创建后,便会一直存在于ZooKeeper中,除非主动删除持久结点。

(2)临时结点与持久结点有所不同,临时结点的生命周期取决于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论