Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院

上传人：题*** IP属地：浙江上传时间：2024-12-26 格式：DOCX 页数：14 大小：17.71KB 积分：6 举报 版权申诉

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院_第2页

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院_第3页

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院_第4页

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院_第5页

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院第一章单元测试

HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上。（）

A:错B:对

答案:对Hadoop既适合超大数据集存储,也适合小数据集的存储。（）

A:对B:错

答案:错HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。（）

A:错B:对

答案:对Hadoop起始于以下哪个阶段？（）

A:2004年，Nutch的开发者开发了NDFS。B:2004年，Google发表了关于MapReduce的论文。C:2003年，Google发布了GFS论文。D:2002年，Apach项目的Nutch。

答案:2002年，Apach项目的Nutch。Hadoop集群具有以下哪个优点?（）

A:高成本性B:高扩展性C:高可靠性D:高容错性

答案:高扩展性；高可靠性；高容错性

第二章单元测试

在本次课程里，Linux发行版本我们选择（）。

A:Centos8B:Centos7C:RedHatD:ubuntu

答案:Centos7从哪一个Hadoop历史版本引入了yarn（）。

A:2.x版本系列B:3.x版本系列C:4.x版本系列D:1.x版本系列

答案:3.x版本系列Hadoop部署方式分三种（）。

A:分布式模式B:单机模式C:伪集群模式D:伪分布式模式

答案:分布式模式；单机模式；伪分布式模式商业版Hadoop是指由第三方商业公司在社区版Hadoop基础上进行了一些修改、整合以及各个服务组件兼容性测试而发行的版本。（）

A:对B:错

答案:对Hadoop一般是安装在Windows服务器上的。（）

A:错B:对

答案:错

第三章单元测试

Hadoop的安装部署的模式属于伪分布模式（）。

A:默认的模式，无需运行任何守护进程（daemon），所有程序都在单个JVM上执行。B:伪分布不需要启动任何服务，一般用于调试MapReduce。C:全分布式模式的一个特例，Hadoop的守护进程运行在一个节点上。D:Hadoop守护进程运行在由多台主机搭建的集群上，是真正的生产环境。

答案:全分布式模式的一个特例，Hadoop的守护进程运行在一个节点上。Hadoop的核心组件不包括（）。

A:CommonB:YARNC:HDFSD:MapReduce

答案:Common下列操作不能实现关闭Linux系统的命令是（）。

A:rebootB:poweroffC:shutdown–hnowD:halt-p

答案:reboot下列关于克隆虚拟机描述正确的是（）。

A:克隆操作结束后，克隆的虚拟机就可以脱离原始虚拟机独立存在B:克隆可以在虚拟机运行状态进行C:克隆虚拟机和原始虚拟机的操作彼此影响D:克隆是复制原始虚拟机的部分状态

答案:克隆操作结束后，克隆的虚拟机就可以脱离原始虚拟机独立存在VMwareWorkstation的虚拟网络类型有（）。

A:NAT模式B:桥接模式C:Host-only模式D:IP模式

答案:NAT模式；桥接模式；Host-only模式Hadoop系统三种部署方式是（）。

A:单机模式B:全分布式C:伪分布式模式D:主从模式

答案:单机模式；全分布式；伪分布式模式下列关于HadoopHA模式的描述是正确的（）。

A:HA模式当工作中的机器宕机后，会自动处理这个异常，并将工作转移到其他备用机器B:HA是HighAvailability的简写,即高可用C:实现高可用最关键的策略是消除单点故障。D:HadoopHA模式分为NameNode高可用和YARN高可用

答案:HA模式当工作中的机器宕机后，会自动处理这个异常，并将工作转移到其他备用机器；HA是HighAvailability的简写,即高可用；实现高可用最关键的策略是消除单点故障。；HadoopHA模式分为NameNode高可用和YARN高可用下列属于用户与组操作的命令是（）。

A:useraddhadoopB:passwdhadoopC:fdisk-lD:df-h

答案:useraddhadoop；passwdhadoopLinux文件权限-rwxr-----解释正确的是（）。

A:文件所有者用o表示B:234位表示文件所有者对文件或目录的权限C:–表示普通文件D:r表示只读权限，w表示写入权限，x表示执行权限

答案:234位表示文件所有者对文件或目录的权限；–表示普通文件；r表示只读权限，w表示写入权限，x表示执行权限NAT模式可以在专用网络内连接虚拟机。（）

A:错B:对

答案:错NETMASK表示虚拟机子网掩码。（）

A:错B:对

答案:对通过克隆虚拟机可以快速搭建Hadoop集群。（）

A:错B:对

答案:对xshell是一款支持SSH的终端仿真程序。（）

A:对B:错

答案:对NAT模式中，虚拟机IP地址不一定VMware虚拟网络IP地址范围内。（）

A:错B:对

答案:错

第四章单元测试

下列关于SSH免密操作描述错误的是（）。

A:SSH的配置文件是/etc/ssh/sshd_config。B:实现SSH登录需要openssh和rsync两个服务。C:NameNode是通过SSH来启动和停止各个DataNode上的守护进程的。D:存储节点公钥的文件是id_rsa。

答案:存储节点公钥的文件是id_rsa。关闭防火墙的命令是（）。

A:systemctlrestartfirewalld。B:systemctldisablefirewalld。C:systemctlstopfirewalld。D:systemctlstatusfirewalld。

答案:systemctlstopfirewalld。下列关于NTP服务描述的错误的是（）。

A:NTP服务状态查询命令是ntpdate。B:启动NTP服务的命令是systemctlstartntpd。C:NTP服务是来使计算机时间同步的一种协议。D:NTP服务的配置文件是/etc/ntp.conf。

答案:NTP服务状态查询命令是ntpdate。下列不属于JAVA环境安装的步骤是（）。

A:在配置文件~/.bashrc中添加JAVA相关环境变量。B:执行配置文件的命令是source/etc/profile。C:解压JDK安装包到安装目录。D:检查JAVA版本的命令是javaversion。

答案:检查JAVA版本的命令是javaversion。下列哪个文件可以配置HDFS副本数量（）。

A:hdfs-site.xml。B:core-site.xml。C:hadoop-env.sh。D:yarn-site.xml。

答案:hdfs-site.xml。下列关于Hadoop完全分布式模式描述正确的是（）。

A:Hadoop2.X引入了HA机制B:Hadoop1.X之前存在单点故障问题，因为只有一个NameNodeC:Hadoop完全分布式模式应部署在“主从”结构的服务器集群D:Hadoop完全分布式是Hadoop默认安装模式

答案:Hadoop2.X引入了HA机制；Hadoop1.X之前存在单点故障问题，因为只有一个NameNode；Hadoop完全分布式模式应部署在“主从”结构的服务器集群需要配置的JDK环境变量是（）。

A:JAVA_HOMEB:ZOOKEEPER_HOMEC:HADOOP_HOMED:PATH

答案:JAVA_HOME；PATHHadoop默认配置文件包括（）。

A:mapred-site.xmlB:yarn-site.xmlC:hdfs-site.xmlD:core-site.xml

答案:hdfs-site.xml；core-site.xml存放Hadoop相关服务操作脚本的目录是（）。

A:libB:etcC:sbinD:bin

答案:sbin；binstart-dfs.sh命令启动的HDFS进程包括（）。

A:DataNodeB:NameNodeC:SecondaryNameNodeD:ResourceManager

答案:DataNode；NameNode；SecondaryNameNode伪分布式模式是Hadoop的默认模式。（）

A:对B:错

答案:错Hadoop是Apache软件基金会的开源产品。（）

A:错B:对

答案:对yarn-site.xml是Hadoop2.0新增的配置文件。（）

A:错B:对

答案:对查看hadoop版本的命令是hadoop-version。（）

A:对B:错

答案:错伪分布式是把集群主节点和从节点合二为一。（）

A:错B:对

答案:对

第五章单元测试

HDFS默认的数据块复制数量是（）。

A:1。B:2。C:3。D:4。

答案:3。下列操作不属于测试Hadoop的是（）。

A:在浏览器地址栏输入http://master:9000。B:在浏览器地址栏输入http://master:50070。C:执行jps命令查看节点信息D:执行hadoop系统自带测试jar包

答案:在浏览器地址栏输入http://master:9000。下列哪个命令能启动Hadoop相关进程（）。

A:start-yarn.shB:zkServer.shstartC:hadoop-daemon.shstartnamenodeD:start-dfs.sh

答案:start-yarn.sh；hadoop-daemon.shstartnamenode；start-dfs.sh下列哪些配置参数属于core-site.xml（）。

A:io.file.buffer.sizeB:hadoop.tmp.dirC:fs.defaultFSD:dfs.replication

答案:io.file.buffer.size；hadoop.tmp.dir；fs.defaultFS下列关于hadoop集群配置文件描述正确的是（）。

A:core-site.xml文件是hadoop集群的核心全局文件B:yarn-site.xml文件配置YARN运行所需要的环境变量C:hdfs-site.xml文件配置HDFSD:hadoop-env.sh配置hadoop运行所需要的环境变量

答案:core-site.xml文件是hadoop集群的核心全局文件；hdfs-site.xml文件配置HDFS；hadoop-env.sh配置hadoop运行所需要的环境变量下列关于hadoop集群安装步骤描述正确的是（）。

A:修改环境变量需要编辑文件/etc/profileB:slaves文件中需要配置slave1、slave2节点IP地址C:NameNode的格式化只需进行一次即可D:Jps命令是显示所有Java进程的pid命令

答案:修改环境变量需要编辑文件/etc/profile；slaves文件中需要配置slave1、slave2节点IP地址；NameNode的格式化只需进行一次即可下列关于hadoop集群描述正确的是（）。

A:生产环境中需要考虑整体容错性，Hadoop集群多采用多master架构B:实验环境下Hadoop集群网络只需考虑节点间的连通性C:Hadoop平台集群采用Master/Slave架构D:实验环境下一般采用4个节点设置Hadoop集群

答案:生产环境中需要考虑整体容错性，Hadoop集群多采用多master架构；Hadoop平台集群采用Master/Slave架构配置hadoop-env.sh文件，主要是设置Hadoop系统的JDK安装目录。（）

A:错B:对

答案:对hadoop.tmp.dir临时目录系统会自动创建。（）

A:错B:对

答案:错MapReduce存在JobTracker单点故障的问题。（）

A:对B:错

答案:对Hadoop的HA模式只有一种：YARN的HA模式。（）

A:错B:对

答案:错HDFS副本的放置策略称为机架感知策略。（）

A:对B:错

答案:对

第六章单元测试

下列关于HDFS描述错误的是（）。

A:HDFS是一种通过网络实现文件在多台主机上进行分布式存储的文件系统。B:Hadoop的脚本命令和UNIX系统一样都是命令体加命令参数。C:HDFS数据块默认大小为64M。D:在安全模式，各个DataNode将心跳报告和块列表信息发送到NameNode。

答案:HDFS是一种通过网络实现文件在多台主机上进行分布式存储的文件系统。下列关于HDFSshell描述正确的是（）。

A:HDFSshell和Linuxshell完全相同。B:在使用shell命令操作HDFS前应先启动Hadoop。C:把本地文件复制到HDFS根目录下的命令是cp。D:HDFSshell的命令格式是hdfs-cmd。

答案:在使用shell命令操作HDFS前应先启动Hadoop。下列关于HDFS读写操作描述错误的是（）。

A:NameNode向Client返回一个包含数据信息的地址。B:在写入数据时，如果DataNode发生错误，将没有被确认的数据放到数据队列末尾。C:Client完成数据的写入后，会调用数据流的close（）方法，关闭数据流。D:Clinet通过调用FileSystem对象的get()方法打开需要读取的数据。

答案:在写入数据时，如果DataNode发生错误，将没有被确认的数据放到数据队列末尾。下列关于HDFS数据存储和读取描述错误的是（）。

A:对于大文件的存储，HDFS采用分割的方式。B:对于大量数据的读取，HDFS采用集中式。C:对于普通文件的读取，HDFS采用普通的编码和压缩方式。D:对于少量数据的随机读取，HDFS采用按序读取。

答案:对于普通文件的读取，HDFS采用普通的编码和压缩方式。下列关于HDFS数据损坏的处理过程描述错误是（）。

A:如果校验和与Block创建时值不一样，则说明Block已损坏。B:数据损坏发生后，NameNode读取其他DataNode上的Block。C:DataNode读取block时，会计算校验和。D:NameNode负责标记损坏Block。

答案:数据损坏发生后，NameNode读取其他DataNode上的Block。下列关于HDFSJavaAPI描述正确的是（）。

A:Java程序通过Hadoop文件操作类可以进行读写、上传HDFS文件B:Hadoop文件操作类在org.apache.hadoop包中C:API是预先定义的函数D:Hadoop默认文件操作类是FileSystem

答案:Java程序通过Hadoop文件操作类可以进行读写、上传HDFS文件；API是预先定义的函数；Hadoop默认文件操作类是FileSystem下列关于Hadoop序列化描述正确的是（）。

A:序列化试讲对象转化为子节流以方便数据在网络间传输的过程B:Hadoop的序列化是通过Writable类实现的C:Java序列化的缺点是计算时开销大D:Hadoop实现进程间通信依靠RPC

答案:序列化试讲对象转化为子节流以方便数据在网络间传输的过程；Java序列化的缺点是计算时开销大；Hadoop实现进程间通信依靠RPC下列关于Hadoop小文件处理描述正确的是（）。

A:小文件是指小于HDFS中的一个块大小的文件B:创建序列文件主要是指创建SequenceFile文件C:Hadoop在小文件处理上效率低D:Hadoop处理小文件的方法是压缩小文件

答案:小文件是指小于HDFS中的一个块大小的文件；Hadoop在小文件处理上效率低下列关于通信机制RPC描述正确的是（）。

A:RPC是一种通过网络从远程计算机程序上请求服务的协议B:Hadoop中节点的进程间通信是通过RPC实现的C:RPC采用客户机/服务器模式D:RPC服务器指一种提供服务的服务器

答案:RPC是一种通过网络从远程计算机程序上请求服务的协议；Hadoop中节点的进程间通信是通过RPC实现的；RPC采用客户机/服务器模式下列关于Hadoop压缩描述正确的是（）。

A:Hadoop文件压缩的目的是减少存储空间占用，降低网络负载B:Hadoop常用压缩格式有Bzip2、Gzip、LZO、LZ4等C:Hadoop中的压缩编码器是通过一些接口来实现的D:Hadoop中压缩占比最高的Bzip2

答案:Hadoop文件压缩的目的是减少存储空间占用，降低网络负载；Hadoop常用压缩格式有Bzip2、Gzip、LZO、LZ4等Hadoop序列化是通过Writable接口实现的。（）

A:对B:错

答案:对Maven是一种Java开发项目。（）

A:错B:对

答案:错Java序列化的优点是计算时开销小，序列化结果占用存储空间小。（）

A:对B:错

答案:错Text类和String类的编码方式不同，String类采用UTF-8编码，而Text类采用UTF-16编码。（）

A:错B:对

答案:错API本质上是一些预定义的函数。（）

A:对B:错

答案:对

第七章单元测试

有关MapReduce，下面哪个说法是正确的（）。

A:它提供了资源管理能力（yarn）B:它是Hadoop数据处理层C:它是开源数据仓库系统，用于查询和分析存储在Hadoop中的大型数据集(Hive)

答案:它是Hadoop数据处理层MapReduce擅长处理哪种应用场景（）。

A:离线计算B:实时交互计算C:流式计算D:迭代计算

答案:离线计算MapReduce的Shuffle过程中哪个操作是最后做的？（）。

A:排序B:合并C:分区D:溢写

答案:合并MapReduce编程模型中Reducer组件哪个是最后执行的。（）

A:错B:对

答案:对在MapReduce中，下面哪个会将输入键值对处理成中间键值对（）。

A:Mapper和ReducerB:ReducerC:Mapper

答案:Mapper

第八章单元测试

下面哪个YARN的描述不正确（）。

A:YARN指的是YetAnotherResourceNegotiator，是另一种资源协调者B:YARN的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处C:YARN只支持MapReduce一种分布计算模式D:YARN最初是为了改善MapReduce的实现

答案:YARN只支持MapReduce一种分布计算模式下面不属于YARN架构的组成部分的是（）。

A:ResourceManagerB:NodeManagerC:JobTracerD:ApplicationMaster

答案:JobTracerYARN中任务进度监控是向哪个组件汇报的？（）。

A:ContainerB:ResourceManagerC:NodeManagerD:ApplicationMaster

答案:ApplicationMasterYARN架构的组成包括（）。

A:ResourceManagerB:NodeManagerC:ContainerD:ApplicationMaster

答案:ResourceManager；NodeManager；Container；ApplicationMaster在YARN上可以部署Spark（）。

A:错B:对

答案:对

第九章单元测试

HBbase中表格在物理存储上它们是按列族进行存储的，可以随时将新的列祖修饰符添加到现有的列族。（）

A:错B:对

答案:对HBase中的列由一个列族和一个列限定符组成，它们由:（冒号）字符分隔。（）

A:错B:对

答案:对HBase中所有的数据从底层来说一般是保存在MapReduce中，用户通过一系列HRegionServer获取这些数据。（）

A:错B:对

答案:错HBase安装时配置的文件有（）

A:hadoop-env.shB:hbase-site.xmlC:hbase-env.shD:hadoop-site.xml

答案:hbase-site.xml；hbase-env.shYARN主要包含的模块有以下哪些？(

）

A:QuorumJournalManagerB:ResourceManagerC:ApplicationMasterD:NodeManager

答案:ResourceManager；ApplicationMaster；NodeManager

第十章单元测试

哪个组件不属于fusioninsight架构的hadoop层（）。

A:HiveB:HDFSC:MinerD:HBase

答案:MinerHive表的索引创建在HBase表中

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院

文档简介

温馨提示

最新文档

评论

Hadoop大数据技术基础知到智慧树章节测试课后答案2024年秋河北软件职业技术学院

文档简介

温馨提示

最新文档

评论

相关文档