Hadoop传智播客复习试题附答案_第1页
Hadoop传智播客复习试题附答案_第2页
Hadoop传智播客复习试题附答案_第3页
Hadoop传智播客复习试题附答案_第4页
Hadoop传智播客复习试题附答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页Hadoop传智播客复习试题附答案1.下列哪项通常是集群的最主要的性能瓶颈?A、CPUB、网络C、磁盘D、内存【正确答案】:C2.按粒度大小的顺序,Hive数据被分为:数据库、数据表、()、桶?A、元祖B、栏C、分区D、行【正确答案】:C3.Hive查询语言和SQL的一个不同之处在于()操作A、GroupbyB、JoinC、PartitionD、Union【正确答案】:C4.下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()A、一个Map函数就是对一部分原始数据进行指定的操作。B、一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。C、Map与Map之间不是相互独立的。D、Reducee与Reduce之间不是相互独立的。【正确答案】:A5.Zookeeper启动时会最多监听几个端口()A、1B、2C、3D、4【正确答案】:B6.下列选项描述错误的是?()A、HadoopHA即集群中包含SecondaryNameNode作为备份节点存在。B、ResourceManager负责的是整个Yarn集群资源的监控、分配和管理工作C、NodeManager负责定时的向ResourceManager汇报所在节点的资源使用情况以及接收并处理来自ApplicationMaster的启动停止容器(Container)的各种请求。D、初次启动HadoopHA集群时,需要将格式化文件系统后的目录拷贝至另外一台NameNode节点上。【正确答案】:A7.下列关于zookeeper描述正确的是:()A、无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的B、从同一个客户端发起的事务请求,最终将会严格按照其发起顺序被应用到zookeeper中C、在一个5个节点组成的Zookeeper集群中,如果同时有3台机器宕机,服务不受影响D、如果客户端连接到Zookeeper集群中的那台机器突然宕机,客户端会自动切换连接到集群其他机器【正确答案】:A8.MapReduce自定义排序规则需要重写下列那项方法()A、readFields()B、compareTo()C、map()D、reduce()【正确答案】:B9.下列描述说法错误的是?()A、SecureCRT是一款支持SSH的终端仿真程序,它能够在Windows操作系统上远程连接Linux服务器执行操作。B、Hadoop是一个用于处理大数据的分布式集群架构,支持在GNU/Linux系统以及Windows系统上进行安装使用。C、VMwareWorkstation是一款虚拟计算机的软件,用户可以在单一的桌面上同时操作不同的操作系统。D、SSH是一个软件,专为远程登录会话和其他网络服务提供安全性功能的软件。【正确答案】:D10.MapReduce适用于()A、任意应用程序B、任意可以在WindowsServer2008上的应用程序C、可以串行处理的应用程序D、可以并行处理的应用程序【正确答案】:D11.以下选项中,哪种类型间的转换是被Hive查询语言所支持的()A、Double—NumberBigInt—DoubleC、Int—BigIntD、String--Double【正确答案】:D12.HDFS默认备份数量?()A、0B、1C、2D、3【正确答案】:D13.关于SecondaryNameNode哪项是正确?CA、它是NameNode的热备B、它对内存没有要求C、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间D、SecondaryNameNode应与NameNode部署到一个节点【正确答案】:C14.Hive是建立在()之上的一个数据仓库()A、HDFSB、MapReduceC、HadoopD、HBase【正确答案】:C15.下面哪项是Hadoop的作者?A、MartinFowlerB、DougcuttingC、MarkElliotZuckerbergD、KentBeck【正确答案】:B16.Hive最重视的性能是可测量性、延展性、()和对于输入格式的宽松匹配性A、较低恢复性B、容错性C、快速查询D、可处理大量数据【正确答案】:B17.以下选项中,哪个程序负责HDFS数据存储。A、NameNodeB、DataNodeC、SecondaryNameNodeD、ResourceManager【正确答案】:B18.下列语句描述错误的是()A、可以通过CLI方式、JavaAPI方式调用SqoopB、Sqoop底层会将Sqoop命令转换为MapReduce任务,并通过Sqoop连接器进行数据的导入导出操作。C、Sqoop是独立的数据迁移工具,可以在任何系统上执行。D、如果在Hadoop分布式集群环境下,连接MySQL服务器参数不能是localhost或。【正确答案】:C19.Hadoop2.x版本中的数据块大小默认是多少?A、64MB、128MC、256MD、512M【正确答案】:B20.下列哪些操作可以设置一个监听器Watcher()A、getDataB、getChildrenC、existsD、setData【正确答案】:D21.下列选项中那些是Hadoop2.x版本独有的进程()A、JobTrackerB、TaskTrackerC、NodeManagerD、NameNode【正确答案】:C1.下列选项参数是Sqoop指令的是?()A、importB、outputC、inputD、export【正确答案】:AD2.客户端上传文件的时候哪项是正确的?(多选)A、数据经过NameNode传递给DataNodeB、客户端端将文件切分为多个Block,依次上传C、客户端只上传数据到一台DataNode,然后由NameNode负责Block复制工作D、客户端发起文件上传请求,通过RPC与NameNode建立通讯【正确答案】:BD3.下面说法选项错误的是()A、在一个Agent中,同一个source可以有多个channelB、在一个Agent中,同一个sink可以有多个channelC、在一个Agent中,同一个source只能多1个channelD、在一个Agent中,同一个sink只能有1个channel【正确答案】:AD4.下列选项中是配置job的必要参数()A、typeB、dependenciesC、commandD、【正确答案】:AC5.配置Hadoop集群时,下列哪个Hadoop配置文件需要进行修改?(多选)()A、hadoop-env.shB、profileC、core-site.xmlD、ifcfg-eth0【正确答案】:AC1.在Hadoop集群中,NameNode负责管理所有DataNode。对A、正确B、错误【正确答案】:A2.在Hadoop1.x版本中,MapReduce程序是运行在Yarn集群之上。A、正确B、错误【正确答案】:B3.TaildirSource用于观察指定的文件,可以实时监测到添加到每个文件的新行,如果文件正在写入新行,则此采集器将重试采集它们以等待写入完成。A、正确B、错误【正确答案】:A4.Azkaban是对job进行调度管理的,而每一个job任务都是编写在一个文本文件中,且对文本文件没有限制。A、正确B、错误【正确答案】:B5.Map阶段处理数据时,是按照Key的哈希值与ReduceTask数量取模进行分区的规则。A、正确B、错误【正确答案】:A6.伪分布式模式下的Hadoop功能与完全分布式模式下的Hadoop功能相同。A、正确B、错误【正确答案】:A7.SecondaryNameNode是NameNode的备份,可以有效解决Hadoop集群单点故障问题。A、正确B、错误【正确答案】:B8.HadoopHA是集群中启动两台或两台以上机器充当NameNode,避免一台NameNode节点发生故障导致整个集群不可用的情况。A、正确B、错误【正确答案】:A9.Zookeeper集群宕机数超过集群数一半,则Zookeeper服务失效。A、正确B、错误【正确答案】:A10.Sqoop从Hive表导出MySQL表时,首先需要在MySQL中创建表结构。A、正确B、错误【正确答案】:A11.分区数量是ReduceTask的数量。A、正确B、错误【正确答案】:A12.在HadoopHA中,Zookeeper集群为每个NameNode都分配了一个故障恢复控制器,该控制器用于监控NameNode的健康状态。A、正确B、错误【正确答案】:A13.NameNode本地磁盘保存了数据块的位置信息。A、正确B、错误【正确答案】:B14.--target-dir参数是指定HDFS目标目录地址,因此需要提前创建目标文件。A、正确B、错误【正确答案】:B15.JobTracker是HDFS重要角色。A、正确B、错误【正确答案】:B16.Azkaban可以通过查看executorServerLog__*.out日志文件和logs目录下的日志文件查看AzkabanExecutor服务器的启动情况。A、正确B、错误【正确答案】:A17.Sqoop是关系型数据库与Hadoop之间的数据桥梁,这个桥梁的重要组件是Sqoop连接器。A、正确B、错误【正确答案】:A18.在整个数据传输的过程中,Flume将流动的数据封装到一个event(事件)中,它是Flume内部数据传输的基本单元。A、正确B、错误【正确答案】:A19.NodeManager是每个节点上的资源和任务管理器。A、正确B、错误【正确答案】:A20.HadoopHA是两台NameNode同时执行NameNode角色的工作。A、正确B、错误【正确答案】:B21.NameNode负责管理元数据,客户端每次读写请求时,都会从磁盘中读取或写入元数据信息并反馈给客户端。A、正确B、错误【正确答案】:A22.Azkaban要建立job之间的依赖关系需要使用command参数。A、正确B、错误【正确答案】:B23.Hadoop是由Java语言开发的。A、正确B、错误【正确答案】:A24.在MapReduce程序中,必须开发Map和Reduce相应的业务代码才能执行程序。A、正确B、错误【正确答案】:B25.ClouderaCDH是需要付费使用的。A、正确B、错误【正确答案】:B26.Zookeeper对节点的Watch监听通知是永久性的。A、正确B、错误【正确答案】:B27.FlumeAgent是一个JVM进程,它承载着数据从外部源流向下一个目标的三个核心组件是Source、Channel和Sink。A、正确B、错误【正确答案】:A28.Hadoop存在多个副本,且默认备份数量是3。A、正确B、错误【正确答案】:A29.ResourceManager负责监控ApplicationMaster,并在ApplicationMaster运行失败的时候重启它,因此ResouceManager负责ApplicationMaster内部任务的容错。A、正确B、错误【正确答案】:B30.Flume采集方案的名称、位置、以及sources、channels、sinks参数配

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论