在线网课知慧《大数据平台技术(山东交通学院)》单元测试考核答案_第1页
在线网课知慧《大数据平台技术(山东交通学院)》单元测试考核答案_第2页
在线网课知慧《大数据平台技术(山东交通学院)》单元测试考核答案_第3页
在线网课知慧《大数据平台技术(山东交通学院)》单元测试考核答案_第4页
在线网课知慧《大数据平台技术(山东交通学院)》单元测试考核答案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章单元测试1【判断题】数据,就是所有能输入到计算机,并被计算机程序处理的符号的总称为()。A.错B.对2.【多选题】正确答案:ABCD大数据的4V特征包括()。A.变化频繁B.种类繁多C.规模庞大D.价值巨大但价值密度低3【单选题】(2分)2TB数据等于多少GB()。A.2000B.2048C.1024D.10004.【多选题】正确答案:ABCD大数据包含下面类型()。A.纯文本数据B.半结构化数据C.结构化数据D.非结构化数据5.【多选题】正确答案:ABCD大数据的生命周期一般会经历这么几个阶段()。A.存储与管理B.可视化C.分析与挖掘D.采集与预处理6.【多选题】正确答案:ABCD大数据平台的基本架构,从技术架构的角度,可划分为这几个层次()。A.服务封装层B.数据存储层C.数据处理层D.数据采集层7【单选题】(2分)linux系统中cd命令的作用是()。A.移动文件或修改文件名B.进入指定目录C.将源文件复制至目标文件D.删除一个目录中的一个或多个文件8.【多选题】正确答案:ABCvi编辑器的操作模式共分为()。A.底线命令模式B.命令模式C.编辑模式D.输入模式第二章单元测试1.【多选题】正确答案:ABDFlume的Agent包含这些组成部分()。A.SinkB.ChannelC.EventD.Source2.【多选题】正确答案:CDEvent由这两部分组成()。A.K-VB.ArrayC.HeadD.Body3【判断题】Source是Flume中事件的源头,负责接收数据到FlumeAgent,可以处理多种类型、多种格式的数据()A.对B.错4【判断题】Channel是位于Source和Sink之间的缓冲区,对Source和Sink进行一对一处理()A.对B.错5【单选题】(2分)在Flume的配置文件中,对某个目录下文件进行监控的命令是()。A.execB./bin/bash-cC.flume-ngD.tail-f第三章单元测试1【单选题】(10分)以下说法有误的是()。A.传统单机存储方式扩容成本较低B.“元数据”中不包含真正的文件数据C.分布式存储系统可以实现数据容灾D.分布式存储系统需要考虑数据的分块问题2【单选题】(10分)Hadoop2.x中HDFS默认的block的大小为()。A.64MBB.128MBC.256MBD.32MB3【单选题】(10分)关于SecondaryNameNode哪项是正确的()。A.SecondaryNameNode应与NameNode部署到一个节点B.它对内存没有要求C.它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间D.它是NameNode的热备4【单选题】(10分)以下哪一项用于配置HDFS的block大小()。A.fs.defaultFSB.dfs.replicationC..dirD.dfs.blocksize5.【多选题】(20分)正确答案:BDHDFS中的NameNode节点用于存放元数据,元数据内容包含()。A.客户端硬件配置数据B.文件与数据块的映射表C.每个数据块的内容D.数据块与数据节点的映射表6【判断题】(10分如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。()A.错B.对7【判断题】(10分NameNode负责管理元数据,客户端每次读写请求,它都会从磁盘中读取或者写入元数据信息并反馈客户端。()A.对B.错8【判断题】(10分因为HDFS有多个数据副本,所以NameNode是不存在单点故障问题的。()A.对B.错9【判断题】(10分读取HDFS文件可以使用命令hdfsdfs-get。()A.错B.对第四章单元测试1【单选题】(10分)以下说法有误的是()。A.分布式计算框架的实现需要考虑网络通信B.Hadoop的MapReduce框架不能容忍任务出错C.MapReduce编程模型的核心思想是分而治之D.MapReduce编程模型可以分为Map和Reduce两个阶段2【单选题】(10分)下面说法错误的是()。A.MapTask负责汇总整个任务的执行结果B.一个集群中某个确定的任务可以存在多个MapTask进程C.MapReduce任务可以不跑在Hadoop集群中D.MapReduce可以逐行处理文本数据3【单选题】(10分)下面哪项是错误的()。A.Python提交MapReduce作业时,可以使用-rhadoop指定集群模式运行B.MapReduce的输出目录如果已经存在了,任务的输出结果将会覆盖该路径下的原有内容C.MapReduce作业的运行内存并非越大越好D.Python提交MapReduce作业时,可以使用-o参数指定输出路径4【单选题】(10分)MapReduce中Map阶段的输出将作为下面哪个阶段的输入()。A.ShuffleB.SplitC.ReduceD.Join5.【多选题】(10分)正确答案:ACD下列关于MapReduce说法正确的是()。A.MapReduce来源于google的学术论文B.MapReduce程序只能用java语言编写C.MapReduce隐藏了并行计算的细节,方便使用D.MapReduce是一种计算框架第五章单元测试1【单选题】(20分)以下说法有误的是()。A.Kafka无法持久化数据B.实时数据传输问题在高并发场景下尤为明显C.Kafka由Scala语言编写D.Kafka支持离线数据处理2【单选题】(20分)以下对Kafka名词解释错误的是()。A.Partition指Kafka的数据副本B.Offset是数据在分区中的唯一位置C.Consumer指消息的消费者D.Broker指Kafka服务器3【单选题】(20分)对市面上的消息队列产品描述正确的是()。A.ActiveMQ不支持集群模式B.RabbitMQ支持动态扩展C.Kafka支持动态扩展D.Kafka支持事务4.【多选题】(20分)正确答案:BC以下描述正确的是()。A.utf-8编码方式不支持中文B.Python语言可以通过kafka-python模块使用Kafka客户端C.数据发送到Kafka需要经历序列化D.Kafka的默认客户端端口号是500705.【多选题】(20分)正确答案:ABCD以下对消息模型的说法正确的是()。A.发布订阅模型以主题区分消息类别B.点对点模型中消息被消费后即删除C.点对点模型中同一消息只有一个消费者可以消费D.发布订阅模型消息可以重复消费第六章单元测试1.【多选题】正确答案:ABCDSpark框架的特色包括()。A.运行速度快B.容易使用C.通用性D.运行模式多样2.【多选题】正确答案:ABCSpark支持的集群管理器包括()。A.ApacheMesosB.HadoopYARNC.StandaloneD.SparkCore3.【多选题】正确答案:ABCD下面关于Spark驱动程序driverprogram的说法,正确的是()。A.驱动程序定义了分布式数据集以应用在集群中B.驱动程序负责把并行操作发布到集群上C.每个Spark应用程序都包含一个驱动程序D.驱动程序包含Spark应用程序中的主函数4.【多选题】正确答案:ABCD弹性分布式数据集RDD的特性包括()。A.弹性B.分区C.只读D.依赖5【单选题】(2分)在Spark操作中,map(func)的作用是()。A.返回一个新的数据集,这个数据集中的元素是通过func函数筛选后返回为true的元素B.返回排序后的数据集C.对元素为键值对的RDD中Key相同的元素的D.对RDD中的数据按照func进行计算得到新的RDD6【单选题】(2分)在Spark操作中,collect()的作用是()。A.将数据集中的每个元素传递到函数func中运行B.以数组的形式返回数据集中的所有元素C.返回数据集中的元素个数D.通过函数func聚合数据集中的元素7.【多选题】正确答案:AD从概念上而言,流数据(或数据流)是指()。A.在时间分布和数量上无限的一系列动态数据集合体B.数据分时段批量到达C.数据采用集中式处理D.数据记录是流数据的最小组成单元8【判断题】SparkStreaming最主要的抽象是离散化数据流,表示连续不断的数据流。()A.错B.对9【单选题】(2分)在SparkStreaming中,作为一个长期运行的task跑在一个Executor上,用于接收DStream的组件是()。A.AnalyzerB.ReceiverC.RDDD.Streaming10【判断题】在SparkStreaming中,可以通过streamingContext.awaitTermination()方法来手动结束流计算进程。()A.错B.对第七章单元测试1【单选题】(20分)以下说法有误的是()。A.HBase对事务的支持较差B.HBase不需要考虑读写性能C.HBase是一种key-D.HBase是非关系型数据库2【单选题】(20分)下面说法错误的是()。A.HBase的一个表中可以有多个列族B.HBase一个RegionServer服务器中可以有多个RegionC.一个HBase集群中只能有一个RegionServerD.HBase表的一个列族可以包含多个列3.【多选题】(20分)正确答案:ABD下面哪项关于HBase的常用命令的描述是错误的()。A.HBase全表扫描使用get命令B.HBase要查看表可以使用list_namespaceC.HBase使用scan

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论