Hadoop大数据应用开发知到智慧树章节测试课后答案2024年秋深圳信息职业技术学院_第1页
Hadoop大数据应用开发知到智慧树章节测试课后答案2024年秋深圳信息职业技术学院_第2页
Hadoop大数据应用开发知到智慧树章节测试课后答案2024年秋深圳信息职业技术学院_第3页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop大数据应用开发知到智慧树章节测试课后答案2024年秋深圳信息职业技术学院第一章单元测试

大数据产业指什么()

A:提供分布式计算、数据挖掘、统计分析等服务的各类企业B:提供数据分享平台、数据分析平台、数据租售平台等服务的企业C:提供智能交通、智慧医疗、智能物流、智能电网等行业应用的企业D:一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合

答案:一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合以下哪个不是大数据时代新兴的技术()

A:HadoopB:MySQLC:HBaseD:Spark

答案:MySQL以下哪个不是Hadoop的特性()

A:支持多种编程语言B:高容错性C:高可靠性D:成本高

答案:成本高HDFS的命名空间不包含()

A:目录B:字节C:块D:文件

答案:字节以下对名称节点理解不正确的是()

A:名称节点通常用来保存元数据B:名称节点用来负责具体用户数据的存储C:名称节点的数据保存在内存中D:名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问

答案:名称节点用来负责具体用户数据的存储以下对数据节点理解不正确的是()

A:数据节点通常只有一个B:数据节点的数据保存在磁盘中C:数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作D:数据节点用来存储具体的文件内容

答案:数据节点通常只有一个Hadoop框架中最核心的设计是什么()

A:Hadoop被视为事实上的大数据处理标准B:提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务C:Hadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中D:为海量数据提供存储的HDFS和对数据进行计算的MapReduce

答案:为海量数据提供存储的HDFS和对数据进行计算的MapReduce

第二章单元测试

在Hadoop项目结构中,HDFS指的是什么()

A:资源管理和调度器B:分布式并行编程模型C:分布式文件系统D:Hadoop上的数据仓库

答案:分布式文件系统以下哪个命令无法用来操作HDFS文件()

A:hdfsfsB:hadoopfsC:hdfsdfsD:hadoopdfs

答案:hdfsfs假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是()

A:start-dfs.sh,stop-hdfs.shB:start-dfs.sh,stop-dfs.shC:start-hdfs.sh,stop-hdfs.shD:start-hdfs.sh,stop-dfs.sh

答案:start-dfs.sh,stop-dfs.sh传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是()

A:hdfsfs-putfile.txt/pathB:hdfsdfs-put/pathfile.txtC:hadoopdfs-put/pathfile.txtD:hdfsdfs-putfile.txt/path

答案:hdfsdfs-putfile.txt/path对HDFS通信协议的理解正确的是:()

A:客户端与数据节点的交互是通过RPC(RemoteProcedureCall)来实现的B:名称节点和数据节点之间则使用数据节点协议进行交互C:HDFS通信协议都是构建在IoT协议基础之上的D:客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互

答案:客户端与数据节点的交互是通过RPC(RemoteProcedureCall)来实现的;名称节点和数据节点之间则使用数据节点协议进行交互;客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互JobTracker主要包括哪三大功能?()

A:任务调度B:数据即服务C:资源管理D:任务监控

答案:任务调度;资源管理;任务监控

第三章单元测试

下列说法错误的是()

A:Map函数将输入的元素转换成<key,value>形式的键值对B:MapReduce框架采用了Master/Slave架构,包括一个Master和若干个SlaveC:Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写D:不同的Map任务之间不能互相通信

答案:Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写Hadoop框架是用Java实现的,因此MapReduce应用也必须要用Java编程语言完成。()

A:错B:对

答案:错MapReduce集群一般使用大量低端服务器,因此节点硬件失效和软件出错是常态。()

A:错B:对

答案:对Spark的计算模式也属于MapReduce,但编程模型比HadoopMapReduce更灵活。()

A:错B:对

答案:对在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的()

A:错B:对

答案:对MapReduce的作业主要包括什么?()

A:计算数据,即CPU密集工作B:负责协调集群中的数据存储C:从磁盘或从网络读取数据,即IO密集工作D:针对不同的工作节点选择合适硬件类型

答案:计算数据,即CPU密集工作;从磁盘或从网络读取数据,即IO密集工作

第四章单元测试

下列对HBase数据模型的描述错误的是()

A:HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本B:HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳C:每个HBase表都由若干行组成,每个行由行键(rowkey)来标识D:HBase列族支持动态扩展,可以很轻松地添加一个列族或列

答案:HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本关于HBaseShell命令解释错误的是()

A:put:向表、行、列指定的单元格添加数据B:list:显示表的所有数据C:create:创建表D:get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值

答案:list:显示表的所有数据HBase是一种什么数据库()

A:文档数据库B:关系数据库C:列式数据库D:行式数据库

答案:列式数据库下列对HBase的理解正确的是:()

A:HBase是一种关系型数据库,现成功应用于互联网服务领域B:HBase是针对谷歌BigTable的开源实现C:HBase多用于存储非结构化和半结构化的松散数据D:HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件

答案:HBase是针对谷歌BigTable的开源实现;HBase多用于存储非结构化和半结构化的松散数据HBase和传统关系型数据库的区别在于哪些方面:()

A:存储模式B:数据索引C:数据操作D:数据模型

答案:存储模式;数据索引;数据操作;数据模型HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件()

A:错B:对

答案:错

第五章单元测试

下列说法正确的是()

A:Hive本身存储和处理数据B:Impala和Hive、HDFS、HBase等工具不可以统一部署在一个Hadoop平台上C:HiveQL语法与传统的SQL语法很相似D:数据仓库Hive不需要借助于HDFS就可以完成数据的存储

答案:HiveQL语法与传统的SQL语法很相似以下不属于Hive的原始数据类型是()

A:STRINGB:LONGC:BINARYD:FLOAT

答案:LONG以下不属于Hive的复合数据类型是()

A:MAPB:SETC:UNIOND:ARRAY

答案:SET下列选项中,修改数据表属性的语法格式中用于修改数据表属性操作的子句是()

A:SETTBLPROPERTIEB:TBLPROPERTIESSETC:TBLPROPERTIESETD:SETTBLPROPERTIES

答案:SETTBLPROPERTIESHive是一个基于Hadoop的数据仓库工具,依赖HDFS存储数据,依赖MapReduce处理数据。()

A:对B:错

答案:对Hive不支持索引。()

A:对B:错

答案:错

第六章单元测试

Flume中,用于存储数据的组件是什么?()

A:AgentB:SourceC:SinkD:Channel

答案:ChannelFlume主要用于哪些场景?()

A:数据存储和管理B:数据可视化和展示C:数据处理和分析D:数据采集和传输

答案:数据采集和传输Flume中,可以使用哪个选项来指定配置文件的路径?()

A:--sinkB:--configC:--sourceD:--channel

答案:--config设计Flume架构时,Sink组件的数据可以流向一个新的Agent的Channel组件。()

A:错B:对

答案:错Flume内部数据传输的基本单元是Byte。()

A:错B:对

答案:错FlumeAgent的三个核心组件是Source、Channel和Sink。()

A:错B:对

答案:对

第七章单元测试

Kafka的消费者可以在消费时指定从哪个偏移量开始消费消息,这个偏移量可以是:()

A:指定的偏移量B:最新的偏移量C:最早的偏移量D:其余三个选项都是

答案:其余三个选项都是Kafka的副本有什么作用?()

A:其余三个选项都不是B:提高消息处理的容错性C:控制消息的存储周期D:提高消息处理的并发度

答案:提高消息处理的容错性Kafk

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论