《大数据技术原理与操作应用》第3章习题答案

上传人：1*** IP属地：湖北上传时间：2023-11-04 格式：DOC 页数：12 大小：131KB 积分：6 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第三章单选题1、下列选项中，若是哪个节点关闭了，就无法访问Hadoop集群（）。A、namenodeB、datanodeC、secondarynamenodeD、yarn参考答案:A答案解析:暂无解析2、下列说法中，关于客户端从HDFS中读取数据的说法错误的是（）。A、客户端会选取排序靠前的DataNode来依次读取Block块B、客户端会把最终读取出来所有的Block块合并成一个完整的最终文件C、客户端会选取排序靠后的DataNode来依读取Block块D、如果客户端本身就是DataNode，那么将从本地直接获取数据参考答案:C答案解析:暂无解析3、下列选项中，用于检验数据完整性的信息的是（）。A、心跳机制B、ACK机制C、选举机制D、垃圾回收机制参考答案:B答案解析:暂无解析4、下列选项中，关于HDFS说法错误的是（）。A、HDFS是Hadoop的核心之一B、HDFS源于Google的GFS论文C、HDFS用于存储海量大数据D、HDFS是用于计算海量大数据参考答案:D答案解析:暂无解析5、下列选项中，用于存放部署Hadoop集群服务器的是（）。A、namenodeB、datanodeC、rackD、metadata参考答案:C答案解析:Rack是用来存放部署Hadoop集群服务器的机架。6、下列选项中，用于删除HDFS上文件夹的方法是（）。A、delete()B、rename()C、mkdirs()D、copyToLocalFile()参考答案:A答案解析:FileSystem对象调用delete()方法可以删除文件夹，delete()方法接收两个参数，第一个参数表示要删除的文件夹路径，第二个参数用于设置是否递归删除目录。7、下列选项中，关于HDFS的架构说法正确的是（）。A、HDFS采用的是主备架构B、HDFS采用的是主从架构C、HDFS采用的是从备架构D、以上说法均错误参考答案:B答案解析:HDFS采用主从架构（Master/Slave架构）。8、下列选项中，用于上传文件的Shell命令是（）。A、-lsB、-mvC、-cpD、-put参考答案:D答案解析:暂无解析多选题1、下列选项中，关于数据块说法正确的是（）。A、磁盘进行数据读/写的最大单位B、磁盘进行数据读/写的最小单位C、数据块是抽象的块D、DataNode是按block对数据进行存储。参考答案:B,C,D答案解析:暂无解析2、下列说法中，关于crontab表达式说法正确的是（）。A、通过执行crontab表达式可以执行定时任务B、crontab表达式是由6个参数决定C、Crontab表达式是由5个参数决定D、以上说法均正确参考答案:A,B答案解析:暂无解析3、下列说法中，关于使用JavaAPI操作HDFS说法正确的是（）。A、需要引入hadoop-common依赖B、需要引入hadoop-hdfs依赖C、需要引入hadoop-client依赖D、以上说法均错误参考答案:A,B,C答案解析:暂无解析4、下列选项中，关于Metadata元数据说法正确的是（）。A、元数据维护HDFS文件系统中文件和目录的信息B、元数据记录与文件内容存储相关的信息C、元数据用来记录HDFS中所有DataNode的信息D、元数据用于维护文件系统名称并管理客户端对文件的访问参考答案:A,B,C答案解析:NameNode用于维护文件系统名称并管理客户端对文件的访问。判断题1、HDFS目前不支持并发多用户的写操作，写操作只能在文件末尾追加数据。对错参考答案:对答案解析:HDFS目前不支持并发多用户的写操作，写操作只能在文件末尾追加数据。2、HDFS中提供SecondaryNameNode节点，是为了取代掉NameNode节点。对错参考答案:错答案解析:暂无解析3、在Windows平台开发HDFS项目时，若不设置Hadoop开发环境，也是没问题的。对错参考答案:错答案解析:在Windows平台开发HDFS项目时，若不设置Hadoop开发环境，则会报以下的错误：java.io.IOException:(null)entryincommandstring:nullchmod0644。4、传统文件系统存储数据时，若文件太大，会导致上传和下载非常耗时。对错参考答案:对答案解析:传统文件系统存储数据时，若文件太大，会导致上传和下载非常耗时。5、Hadoop在设计时考虑到数据的安全与高效，数据文件默认在HDFS上存放一份。对错参考答案:错答案解析:Hadoop在设计时考虑到数据的安全与高效，数据文件默认在HDFS上存放三份。6、在采集数据的过程中，通过在滚动完文件的名称后添加一个标识的策略，不能避免因日志文件过大而导致上传效率低的问题。对错参考答案:错答案解析:为了避免因日志文件过大而导致上传效率低，可以采取在滚动完文件的名称后添加一个标识的策略来解决这个问题。7、DataNode在客户端或者NameNode的调度下，存储并检索数据块，对数据块进行创建、删除等操作。对错参考答案:对答案解析:暂无解析8、Namenode存储的是元数据信息，元数据信息并不是真正的数据，真正的数据是存储在DataNode中。对错参考答案:对答案解析:暂无解析9、在安装配置windows平台hadoop，配置后直接运行是没有问题的。对错参考答案:错答案解析:暂无解析10、DataNode是HDFS集群的主节点，NameNode是HDFS集群的从节点。对错参考答案:错答案解析:NameNode是HDFS集群的主节点，DataNode是HDFS集群的从节点。11、在Linux中，mkdir命令主要用于在指定路径下创建子目录。对错参考答案:对答案解析:mkdir命令主要用于在指定路径下创建子目录。12、在Hadoop2.x版本下，Block数据块的默认大小是64M。对错参考答案:错答案解析:在Hadoop2.x版本下，Block数据块的默认大小是128M。13、由于Hadoop是使用Java语言编写的，因此可以使用JavaAPI操作Hadoop文件系统。对错参考答案:对答案解析:由于Hadoop是使用Java语言编写的，因此可以使用JavaAPI操作Hadoop文件系统。14、HDFS适用于低延迟数据访问的场景，例如毫秒级实时查询。对错参考答案:错答案解析:暂无解析15、由于Hadoop的设计对硬件要求低，因此无需构建在昂贵的高可用性机器上，导致无法保证数据的可靠性、安全性和高可用性。对错参考答案:错答案解析:暂无解析16、通过扩容的方式，解决不了传统文件系统遇到存储瓶颈的问题。对错参考答案:错答案解析:通过扩容的方式，可以解决传统文件系统遇到存储瓶颈的问题。17、SecondaryNameNode可以有效解决Hadoop集群单点故障问题。对错参考答案:对答案解析:暂无解析填空题1、HDFS是可以由【】组成，每个服务器机器存储文件系统数据的一部分。参考答案:【成百上千台服务器机器】答案解析:HDFS是可以由成百上千台服务器机器组成，每个服务器机器存储文件系统数据的一部分。2、DataNode中的数据块是以文件的类型存储在磁盘中，其中包含两个文件，一是【】，二是每个数据块对应的一个元数据文件。参考答案:【数据本身】答案解析:暂无解析3、DataNode之间需要建立【】通道，用于传输数据包。参考答案:【Pipeline】答案解析:DataNode之间需要建立Pipeline通道，用于传输数据包。4、在HDFS写数据的流程中，数据是以【】的形式进行发送。参考答案:【数据包】答案解析:在HDFS写数据的流程中，数据是以数据包的形式进行发送。5、传统的文件系统对海量数据的处理方式是将数据文件直接存储在【】台服务器上。参考答案:【一】答案解析:暂无解析6、在NameNode内部是以元数据的形式，维护着两个文件，分别是FsImage镜像文件和【】文件。参考答案:【EditLog日志】答案解析:暂无解析7、【】会自动加载HDFS的配置文件core-site.xml，从中获取Hadoop集群的配置信息。参考答案:【Configuration实例】答案解析:暂无解析8、【】节点，负责记录文件系统名称空间或其属性的任何更改操作，并存储配置文件中设置备份的数量。参考答案:【NameNode】答案解析:NameNode节点，负责记录文件系统名称空间或其属性的任何更改操作，并存储配置文件中设置备份的数量。9、NameNode和DataNode通过【】，可以检测DataNode是否工作。参考答案:【心跳检测机制】答案解析:暂无解析10、一般关于日志文件产生都是根据【】而决定。参考答案:【业务】答案解析:一般日志文件产生是由业务决定11、一个元数据文件包括数据长度、【】以及时间戳。参考答案:【块数据校验和】答案解析:暂无解析12、HDFS采用的是【】的数据一致性模型。参考答案:【一次写入，多次读取】答案解析:HDFS采用的是“一次写入，多次读取”的数据一致性模型。13、客户端从HDFS中查找数据，即为【】数据；Client从HDFS中存储数据，即为Write（写）数据。参考答案:【Read（读）】答案解析:暂无解析14、扩容的方式有两种，分别是【】和横向扩容。参考答案:【纵向扩容】答案解析:暂无解析15、HDFS与现有的分布式文件系统的主要区别是HDFS具有【】能力。参考答案:【高度容错】答案解析:暂无解析16、NameNode主要以【】的形式对数据进行管理和存储。参考答案:【元数据】答案解析:NameNode主要以元数据的形式对数据进行管理和存储。17、文件系统对象FileSystem提供的方法【】用于从HDFS复制文件到本地磁盘。参考答案:【copyToLocalFile()】答案解析:暂无解析18、客户端发起文件上传请求，通过【】协议与NameNode建立通讯。参考答案:【RPC】答案解析:暂无解析19、在HDFS中，通过执行【】命令查看HDFS根目录下的所有文件及文件夹。参考答案:【hadoopfs-ls】答案解析:在HDFS中，通过执行“hadoopfs-ls”命令查看HDFS根目录下的所有文件及文件夹。简答题1、简述单点故障的产生。参考答案:当存储数据块的服务器中突然有一台机器宕机，我们就无法正常的获取文件了，这个问题被称为单点故障答案解析:暂无解析2、简述HDFS的优点和缺点。参考答案:HDFS分布式文件系统具有优点和缺点。优点有高容错、流式数据访问、支持超大文件、高数据吞吐量以及可构建在廉价的机器上；缺点有高延迟、不适合小文件存取场景以及不适合并发写入。答案解析:暂无解析3、简述FsImage镜像文件和EditLog日志文件。参考答案:FsImage镜像文件用于存储整个文件系统命名空间的信息，EditLog日志文件用于持久化记录文件系统元数据发生的变化。答案解析:FsImage镜像文件用于存储整个文件系统命名空间的信息，EditLog日志文件用于持久化记录文件系统元数据发生的变化。4、简述NameNode管理分布式文件系统的命名空间。参考答案:在NameNode内部是以元数据的形式，维护着两个文件，分别是FsImage镜像文件和EditLog日志文件。其中，FsImage镜像文件用于存储整个文件系统命名空间的信息，EditLog日志文件用于持久化记录文件系统元数据发生的变化。当NameNode启动的时候，FsImage镜像文件就会被加载到内存中，然后对内存里的数据执行记录的操作，以确保内存所保留的数据处于最新的状态，这样就加快了元数据的读取和更新操作。答案解析:在NameNode内部是以元数据的形式，维护着两个文件，分别是FsImage镜像文件和EditLog日志文件。其中，FsImage镜像文件用于存储整个文件系统命名空间的信息，EditLog日志文件用于持久化记录文件系统元数据发生的变化。当NameNode启动的时候，FsImage镜像文件就会被加载到内存中，然后对内存里的数据执行记录的操作，以确保内存所保留的数据处于最新的状态，这样就加快了元数据的读取和更新操作。5、简述HDFS中提供了SecondaryNameNode节点的职责。参考答案:SecondaryNameNode节点主要是周期性的把NameNode中的EditLog日志文件合并到FsImage镜像文件中，从而减小EditLog日志文件的大小，缩短集群重启时间，并且也保证了HDFS系统的完整性。答案解析:SecondaryNameNode节点主要是周期性的把NameNode中的EditLog日志文件合并到FsImage镜像文件中，从而减小EditLog日志文件的大小，缩短集群重启时间，并且也保证了HDFS系统的完整性。6、简述HDFS读数据的原理。参考答案:（1）客户端向NameNode发起RPC请求，来获取请求文件Block数据块所在的位置。（2）NameNod

人人文库> 全部分类> 应用文书 > 作业报告

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《大数据技术原理与操作应用》第3章习题答案

文档简介

温馨提示

最新文档

评论

《大数据技术原理与操作应用》第3章习题答案

文档简介

温馨提示

最新文档

评论

相关文档