Hadoop平台构建知到智慧树期末考试答案题库2024年秋上海思博职业技术学院_第1页
Hadoop平台构建知到智慧树期末考试答案题库2024年秋上海思博职业技术学院_第2页
Hadoop平台构建知到智慧树期末考试答案题库2024年秋上海思博职业技术学院_第3页
Hadoop平台构建知到智慧树期末考试答案题库2024年秋上海思博职业技术学院_第4页
Hadoop平台构建知到智慧树期末考试答案题库2024年秋上海思博职业技术学院_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop平台构建知到智慧树期末考试答案题库2024年秋上海思博职业技术学院HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置由DataNode确定。()

A:对B:错

答案:B:错数据集没有局部相关特性不适合用深度学习。()

A:对B:错

答案:B:错Yarn-client和Yarn-cluster主要区是ApplicationMaster进程的区别.()

A:对B:错

答案:对Slave节点要存储数据,所以它的磁盘越大越好。()

A:错B:对

答案:错HBase系统并不适合进行多表联合查询以及复杂性读写操作。()

A:对B:错

答案:A:对HDFS系统不支持数据的修改。()

A:错B:对

答案:对一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。()

A:对B:错

答案:对基于大数据的社会治理更加有效,比如可以运用各个行业的大数据监测品牌形象。()

A:错B:对

答案:B:对Hbase采用是Key-Value形式的数据库,模拟于Java中的Map形式。()

A:对B:错

答案:对在Hadoop集群中,YARN负责任务调度和资源管理。()

A:对B:错

答案:A:对Hadoop是一种关系型数据库。()

A:对B:错

答案:错导入数据到Hive表时不会检查数据合法性,只会在读取数据时候检查。()

A:对B:错

答案:错在Hadoop中,可以使用Flume进行流式数据处理。()

A:错B:对

答案:B:对如果NameNode意外终止,SecondaryNameNode不会接替它使集群继续工作。()

A:对B:错

答案:对HDFS存储数据时,关键数据根据实际业务需要保存在具有高度可靠性的节点中,通过修改Danodo的存储策略,系统可以将数据强制保存在指定的节点组中。()

A:错B:对

答案:B:对Hadoop是一种分布式计算平台。()

A:错B:对

答案:对今天的世界,一切都可以数据化。数据少了用处不大;数据大了就很有用处。()

A:对B:错

答案:A:对大数据仅仅是指数据的体量大。()

A:对B:错

答案:B:错使用Shell命令insert对HBase中的一张表进行数据添加操作。()

A:错B:对

答案:错HDFS支持大文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。()

A:对B:错

答案:B:错spark是由C编程语言实现的。()

A:错B:对

答案:错在Hadoop集群中,Hive用来处理实时数据。()

A:对B:错

答案:B:错每个map槽就是一个线程。()

A:错B:对

答案:错hive中的“groupby”指的是通过规则将一个数据集划分为几个小的数据集,然后根据小的数据集进行分组处理。()

A:对B:错

答案:对在HadoopHA模式下,主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数JournalNode即认为写入成功。通常配置奇数个JournalNode。()

A:错B:对

答案:对使用绑定变量是防止数据库SQL注入的有效手段。()

A:错B:对

答案:B:对Hbase的最小存储单元不是Region而是一个Cell单元。()

A:对B:错

答案:对对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求.()

A:错B:对

答案:错MapReduce是分布式并行计算框架,其计算模式属于流计算,实时性好。()

A:对B:错

答案:错Hive是用来处理实时数据的工具。()

A:对B:错

答案:B:错数据采集工具不包括()

A:SqoopB:KafkaC:HbaseD:Flume

答案:HbaseZookeeper角色分配不包括()

A:followerB:ObserverC:leaderD:protecter

答案:protecterHadoop的NameNode负责____A_____。

A:存储HDFS的文件B:运行Hadoop的集群管理C:管理HDFS的数据块D:处理MapReduce计算任务

答案:管理HDFS的数据块ETL三个部分中,花费时间最长的是()

A:全部B:TC:LD:E

答案:T关于hadoopMapReduce分片(split)的概念,下列说法不正确的是()

A:大多数情况下,理想的分片大小是一个HDFS块对应一个splitB:split是一个物理的存储概念C:hADoop为每个split创建一个mA.p任务D:split的多寡决定了mAp任务的数目

答案:split是一个物理的存储概念在spark生态组件中,哪个产品可用于复杂的批量数据处理()。

A:sparkstreamingB:sparkcoreC:sparkSQLD:Mlib

答案:sparkcore在思维方式方面,不是大数据显著影响的是()。

A:全样而非抽样B:效率而非精确C:相关而非因果D:存储而非计算

答案:存储而非计算Hadoop的核心组件之一是___A______。

A:HBaseB:SparkC:PigD:Hive

答案:Hivehive是以()技术为基础的数据仓库。

A:MapReduceB:HDFSC:hadoopD:HBASE

答案:HADOOP关于数据的规范化的错误观点是()

A:方便存储B:是为了消除量纲对数据结构的影响C:一般包括数据中心化和数据标准化D:一般是一个无量纲的纯数值

答案:A:方便存储zookeeper集群至少需要几个节点以上()。

A:3B:1C:4D:2

答案:A:3YARN是Hadoop中的___D______。

A:网络协议B:数据可视化工具C:数据库系统D:分布式计算框架

答案:D:分布式计算框架Hadoop和Hadoop生态圈的描述中,正确的是()。

A:Hadoop含义范围大于Hadoop生态圈B:与Hadoop相比,Hadoop生态圈是指Hadoop框架本身C:常见的Hadoop生态圈组件有ZooKeeper、Flume、Redis、Hive、Flink等D:Hadoop生态圈,不仅包含Hadoop,还包括保证Hadoop框架正常高效运行的其他框架

答案:Hadoop生态圈,不仅包含Hadoop,还包括保证Hadoop框架正常高效运行的其他框架以下哪个现象不属于大数据的典型特征():

A:产生速率高B:数据量大C:数据类型多D:数据包含噪声及缺失值

答案:D:数据包含噪声及缺失值。在Hadoop集群中,负责任务调度和资源管理的组件是__D_______。

A:HiveB:SparkC:HBaseD:YARN

答案:D:YARN在Hadoop集群中,负责数据的增删改查的组件是____A_____。

A:HiveB:HBaseC:SparkD:YARN

答案:A:Hive下面哪条命令可以把f1.txt复制为f2.txt?()

A:cpf1.txt|f2.txtB:catf1.txt|f2.txtC:catf1.txt>f2.txtD:copyf1.txt|f2.txt

答案:catf1.txt>f2.txt基于zookeeper实现主备NN自动切换,不正确的描述是()。

A:ZKFC的作用是监控NameNode健康状态,当主NN挂掉之后,备用NN的ZKFC会得到消息,然后会将备用NN状态改为Active,并是原来的主NN改为备用NN。B:备用NN也会帮助主NN合并editsLog文件和fsimage产生新的fsimage,并推送ActiveNN。C:两台NN启动后都会去zookeeper进行注册,zk会分配主节点Active和备节点Standby;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论