大数据平台技术智慧树知到答案章节测试2023年山东交通学院_第1页
大数据平台技术智慧树知到答案章节测试2023年山东交通学院_第2页
大数据平台技术智慧树知到答案章节测试2023年山东交通学院_第3页
大数据平台技术智慧树知到答案章节测试2023年山东交通学院_第4页
免费预览已结束,剩余4页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章测试数据,就是所有能输入到计算机,并被计算机程序处理的符号的总称为()。

A:对

B:错

答案:A大数据的4V特征包括()。

A:种类繁多

B:规模庞大

C:变化频繁

D:价值巨大但价值密度低

答案:ABCD2TB数据等于多少GB()。

A:1024

B:2048

C:2000

D:1000

答案:B大数据包含下面类型()。

A:非结构化数据

B:结构化数据

C:纯文本数据

D:半结构化数据

答案:ABCD大数据的生命周期一般会经历这么几个阶段()。

A:可视化

B:采集与预处理

C:分析与挖掘

D:存储与管理

答案:ABCD大数据平台的基本架构,从技术架构的角度,可划分为这几个层次()。

A:服务封装层

B:数据处理层

C:数据存储层

D:数据采集层

答案:ABCDlinux系统中cd命令的作用是()。

A:移动文件或修改文件名

B:将源文件复制至目标文件

C:进入指定目录

D:删除一个目录中的一个或多个文件

答案:Cvi编辑器的操作模式共分为()。

A:输入模式

B:命令模式

C:底线命令模式

D:编辑模式

答案:BCD第二章测试Flume的Agent包含这些组成部分()。

A:Sink

B:Event

C:Source

D:Channel

答案:ACDEvent由这两部分组成()。

A:Body

B:Head

C:Array

D:K-V

答案:ABSource是Flume中事件的源头,负责接收数据到FlumeAgent,可以处理多种类型、多种格式的数据()

A:对

B:错

答案:AChannel是位于Source和Sink之间的缓冲区,对Source和Sink进行一对一处理()

A:错

B:对

答案:A在Flume的配置文件中,对某个目录下文件进行监控的命令是()。

A:flume-ng

B:/bin/bash-c

C:exec

D:tail-f

答案:D第三章测试以下说法有误的是()。

A:“元数据”中不包含真正的文件数据

B:分布式存储系统需要考虑数据的分块问题

C:分布式存储系统可以实现数据容灾

D:传统单机存储方式扩容成本较低

答案:DHadoop2.x中HDFS默认的block的大小为()。

A:32MB

B:64MB

C:128MB

D:256MB

答案:C关于SecondaryNameNode哪项是正确的()。

A:SecondaryNameNode应与NameNode部署到一个节点

B:它是NameNode的热备

C:它对内存没有要求

D:它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间

答案:D以下哪一项用于配置HDFS的block大小()。

A:dfs.blocksize

B:fs.defaultFS

C:.dir

D:dfs.replication

答案:AHDFS中的NameNode节点用于存放元数据,元数据内容包含()。

A:客户端硬件配置数据

B:数据块与数据节点的映射表

C:文件与数据块的映射表

D:每个数据块的内容

答案:BC如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。()

A:对

B:错

答案:BNameNode负责管理元数据,客户端每次读写请求,它都会从磁盘中读取或者写入元数据信息并反馈客户端。()

A:对

B:错

答案:B因为HDFS有多个数据副本,所以NameNode是不存在单点故障问题的。()

A:对

B:错

答案:B读取HDFS文件可以使用命令hdfsdfs-get。()

A:对

B:错

答案:A第四章测试以下说法有误的是()。

A:Hadoop的MapReduce框架不能容忍任务出错

B:MapReduce编程模型可以分为Map和Reduce两个阶段

C:MapReduce编程模型的核心思想是分而治之

D:分布式计算框架的实现需要考虑网络通信

答案:A下面说法错误的是()。

A:MapTask负责汇总整个任务的执行结果

B:一个集群中某个确定的任务可以存在多个MapTask进程

C:MapReduce任务可以不跑在Hadoop集群中

D:MapReduce可以逐行处理文本数据

答案:A下面哪项是错误的()。

A:MapReduce的输出目录如果已经存在了,任务的输出结果将会覆盖该路径下的原有内容

B:MapReduce作业的运行内存并非越大越好

C:Python提交MapReduce作业时,可以使用-rhadoop指定集群模式运行

D:Python提交MapReduce作业时,可以使用-o参数指定输出路径

答案:AMapReduce中Map阶段的输出将作为下面哪个阶段的输入()。

A:Join

B:Split

C:Reduce

D:Shuffle

答案:C下列关于MapReduce说法正确的是()。

A:MapReduce程序只能用java语言编写

B:MapReduce是一种计算框架

C:MapReduce隐藏了并行计算的细节,方便使用

D:MapReduce来源于google的学术论文

答案:BCD第五章测试以下说法有误的是()。

A:Kafka无法持久化数据

B:Kafka支持离线数据处理

C:实时数据传输问题在高并发场景下尤为明显

D:Kafka由Scala语言编写

答案:A以下对Kafka名词解释错误的是()。

A:Partition指Kafka的数据副本

B:Broker指Kafka服务器

C:Consumer指消息的消费者

D:Offset是数据在分区中的唯一位置

答案:A对市面上的消息队列产品描述正确的是()。

A:RabbitMQ支持动态扩展

B:ActiveMQ不支持集群模式

C:Kafka支持事务

D:Kafka支持动态扩展

答案:D以下描述正确的是()。

A:数据发送到Kafka需要经历序列化

B:Kafka的默认客户端端口号是50070

C:Python语言可以通过kafka-python模块使用Kafka客户端

D:utf-8编码方式不支持中文

答案:AC以下对消息模型的说法正确的是()。

A:发布订阅模型消息可以重复消费

B:点对点模型中同一消息只有一个消费者可以消费

C:发布订阅模型以主题区分消息类别

D:点对点模型中消息被消费后即删除

答案:ABCD第六章测试Spark框架的特色包括()。

A:容易使用

B:运行速度快

C:通用性

D:运行模式多样

答案:ABCDSpark支持的集群管理器包括()。

A:ApacheMesos

B:SparkCore

C:Standalone

D:HadoopYARN

答案:ACD下面关于Spark驱动程序driverprogram的说法,正确的是()。

A:驱动程序包含Spark应用程序中的主函数

B:驱动程序定义了分布式数据集以应用在集群中

C:每个Spark应用程序都包含一个驱动程序

D:驱动程序负责把并行操作发布到集群上

答案:ABCD弹性分布式数据集RDD的特性包括()。

A:弹性

B:分区

C:只读

D:依赖

答案:ABCD在Spark操作中,map(func)的作用是()。

A:返回一个新的数据集,这个数据集中的元素是通过func函数筛选后返回为true的元素

B:对RDD中的数据按照func进行计算得到新的RDD

C:返回排序后的数据集

D:对元素为键值对的RDD中Key相同的元素的value进行reduce

答案:B在Spark操作中,collect()的作用是()。

A:将数据集中的每个元素传递到函数func中运行

B:通过函数func聚合数据集中的元素

C:返回数据集中的元素个数

D:以数组的形式返回数据集中的所有元素

答案:D从概念上而言,流数据(或数据流)是指()。

A:数据采用集中式处理

B:在时间分布和数量上无限的一系列动态数据集合体

C:数据记录是流数据的最小组成单元

D:数据分时段批量到达

答案:BCSparkStreaming最主要的抽象是离散化数据流,表示连续不断的数据流。()

A:错

B:对

答案:B在SparkStreaming中,作为一个长期运行的task跑在一个Executor上,用于接收DStream的组件是()。

A:Receiver

B:Analyzer

C:Streaming

D:RDD

答案:A在SparkStreaming中,可以通过streamingContext.awaitTermination()方法来手动结束流计算进程。()

A:对

B:错

答案:B第七章测试以下说法有误的是()。

A:HBase不需要考虑读写性能

B:HBase是非关系型数据库

C:HBase是一种key-value数据库

D:HBase对事务的支持较差

答案:A下面说法错误的是()。

A:HBase表的一个列族可以包含多个列

B:一个HBase集群中只能有一个RegionServer

C:HBase一个RegionServer服务器中可以有多个Region

D:HBase的一个表中可以有多个列族

答案:B下面哪项关于HBase的常用命令的描述是错误的()。

A:HBase一张正在使用的表可以直接使用drop命令删除

B:HBase要查看表可以使用list_namespace

C:HBas

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论