大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院

上传人：题*** IP属地：浙江上传时间：2023-10-23 格式：DOCX 页数：12 大小：14.43KB 积分：6 举报 版权申诉

已阅读5页，还剩7页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院咸阳职业技术学院

第一章测试

大数据（BigData），是指可以在一定时间范围内使用常规软件工具进行捕捉、管理和处理的数据集合。（）

A:错B:对

答案:错

Hadoop之父是（）。

A:DougCuttingB:KentBeckC:MartinFowler

答案:DougCutting

大数据的起始计量单位至少是P，即（）个T

A:10000B:10C:50D:1000

答案:1000

大数据的特征有（）。

A:数据量大B:价值密度低C:计算速度快D:数据种类繁多

答案:数据量大;价值密度低;计算速度快;数据种类繁多

Hadoop核心组件有（）

A:HDFS（分布式文件存储系统）：解决海量数据存储B:YARN（集群资源管理和任务调度框架）：解决资源任务调度C:MapReduce（分布式计算框架）：解决海量数据计算

答案:HDFS（分布式文件存储系统）：解决海量数据存储;YARN（集群资源管理和任务调度框架）：解决资源任务调度;MapReduce（分布式计算框架）：解决海量数据计算

第二章测试

Linux下启动HDFS的命令是（）。

A:start-dfscmdB:start-dfs.shC:startdfsD:hdfs

答案:start-dfs.sh

生成密钥对的命令是（）。

A:ssh-keygenB:sshC:ssh-addD:ssh-copy-id

答案:ssh-keygen

查看hadoop版本号的命令是（）。

A:hadoop-versionB:Hadoop-versionC:Version-hadoop-D:hadoopversion

答案:hadoopversion

Hadoop开发过程中一般采用普通用户登录。（）

A:错B:对

答案:对

生效环境变量的命令是（

）。

A:vi

/etc/profileB:vim/etc/profileC:source/etc/profileD:cat/etc/profile

答案:source/etc/profile

第三章测试

Client端上传文件的时候下列哪项正确?（）

A:Client端将文件切分为Block，依次上传B:Client只上传数据到一台DataNode，然后由NameNode负责Block复制工作C:NameNode负责Block复制工作D:数据经过NameNode传递给DataNode

答案:Client端将文件切分为Block，依次上传

下面哪个程序负责HDFS数据存储（）。

A:DatanodeB:secondaryNameNodeC:NameNodeD:Jobtracker

答案:Datanode

Cloudera提供哪几种安装CDH的方法?（）

A:TarballB:YumC:ClouderamanagerD:Rpm

答案:Tarball;Yum;Clouderamanager;Rpm

Nagios不可以监控Hadoop集群，因为它不提供Hadoop支持。（）

A:对B:错

答案:错

Ganglia不仅可以进行监控，也可以进行告警。（）

A:错B:对

答案:对

第四章测试

Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是（）。

A:1500MB:2000MC:200MD:1000M

答案:1000M

DataNode通过()与NameNode保持通信。（）

A:短连接B:长连接C:无连接D:超长连接

答案:长连接

下列哪项可以作为集群的管理?（）

A:ClouderaManagerB:PdshC:ZookeeperD:Puppet

答案:Pdsh;Zookeeper;Puppet

配置机架感知的下面哪项正确：（）

A:MapReduce会根据机架获取离自己比较近的网络数据B:写入数据的时候会写到不同机架的DataNode中C:如果一个机架出问题，不会影响数据读写

答案:MapReduce会根据机架获取离自己比较近的网络数据;写入数据的时候会写到不同机架的DataNode中;如果一个机架出问题，不会影响数据读写

如果NameNode意外终止，SecondaryNameNode会接替它使集群继续工作。（）

A:对B:错

答案:错

第五章测试

Yarn各模块组成有：（）

A:AngularB:Resourcemanager、nodemanager、applicationMasterC:VueD:Json

答案:Resourcemanager、nodemanager、applicationMaster

Yarn附则整个集群的资源管理功能，每个任务都单独有一个“应用服务器”：（）

A:对B:错

答案:对

以下关于yarn的描述正确的是：（）

A:对于资源的表示以硬盘为单位。B:目前可以支持多种计算框架运行在yarn上面，比如MapReduce、storm、spark、fookk等。C:支持多个框架，yarn不再是一个单纯的计算框架，而是一个框架管理器。D:框架升级更容易，在yarn中，各种计算框架不再是作为一个服务部署到集群的各个节点上。

答案:支持多个框架，yarn不再是一个单纯的计算框架，而是一个框架管理器。

以下关于yarn的说法正确的是：（）

A:Yarn是采用两级式资源分配方案B:存在于Hadoop1.0中C:Spark、stormstreaming、igraph等计算框架不能再yarn上运行，也不能访问hdfs上的数据资源D:Yarn只能运行Hadoop生态下的MapReduce运算框架

答案:Yarn是采用两级式资源分配方案

对新一代资源管理调度框架YARN的理解正确的是：（）

A:YARN的体系结构包含三个组件：ResourceManager，NodeManager，ApplicationMasterB:MapReduce2.0是运行在YARN之上的计算框架，由YARN来为MapReduce提供资源管理调度服务C:YARN既是资源管理调度框架，也是一个计算框架D:YARN可以实现“一个集群多个框架”，即在一个集群上部署一个统一的资源调度管理框架

答案:YARN可以实现“一个集群多个框架”，即在一个集群上部署一个统一的资源调度管理框架

第六章测试

HDFS为海量的数据提供了存储，而MapReduce为海量的数据提供了计算。（）

A:错B:对

答案:对

谷歌公司关于MapReduce模型的论文发布于（）年

A:2004B:2003C:2005D:2006

答案:2004

下列关于MapReduce模型的说法错误的是（）

A:MapReduce模型是一种理论模型，无法实现B:MapReduce模型具有简单易学，使用灵活的特点C:MapReduce模型可实现大规模数据的并行计算D:MapReduce模型的核心思想是“分而治之”

答案:MapReduce模型是一种理论模型，无法实现

大数据的开发和利用，关键在于大数据技术的支撑。其中，MapReduce是分布式数据库。（）

A:对B:错

答案:错

适合MapReduce框架处理的任何和数据集要求待处理的数据集可以分解为许多小的数据子集，而且每个数据子集的处理不依赖也不影响其他数据子集的处理。（）

A:对B:错

答案:对

第七章测试

（）是一个实时收集、分析、展示、监控数据的分布式数据库，它基于HBase存储和查询监控数据。

A:KijiExpressB:KijiMRC:KijiD:OpenTSDB

答案:OpenTSDB

HBase每个行有一个（）唯一标识了行的地址。

A:列族B:名C:行键D:时间戳

答案:行键

在水平方向，HBase的一张表由一个或多个（）组成。

A:时间戳B:列C:行D:列族

答案:列族

HBase的每个列族均对应了一个（）属性。

A:列名B:时间戳C:列键D:行键

答案:时间戳

在垂直方向，HBase的一张表有多个（）来组成。

A:列B:行族C:列族D:行

答案:行族

第八章测试

下列关于Hive特点总结正确的选项是（）。

A:Hive支持自由的扩展集群的规模，只需要重启服务即可B:Hive支持自定义函数，用户可以根据自己的需求去定义函数C:Hive适合处理小批量数据D:HiveSQL执行时，需要避免节点出现问题

答案:Hive支持自定义函数，用户可以根据自己的需求去定义函数

Hive的元数据存储在derby和MySQL中有什么区别（）。

A:数据库的区别B:没区别C:多会话(Moresession)D:支持网络环境

答案:多会话(Moresession)

Hive有四个驱动器，下面那个不是（）。

A:解释器B:编译器C:策略器(Strategyimplement)D:优化器

答案:策略器(Strategyimplement)

Hive有什么好处（）。

A:可以存储数据B:可以通过语句自动编译mapreduce（Mapreducecanbeautomaticallycompiledusingstatements）C:可以直接在表中插入数据D:可以使用sql，操作存储在hdfs中的数据

答案:可以通过语句自动编译mapreduce（Mapreducecanbeautomaticallycompiledusingstatements）

下列哪个组件不属于Hive架构（）

A:ClientB:MySQLC:TaskManagerD:HDFS

答案:TaskManager

第九章测试

Flume可以将应用产生的数据存储到任何集中存储器中，比如HDFS,HBase。（）

A:错B:对

答案:对

Flume的管道是基于事务，保证了数据在传送和接收时的一致性。（）

A:对B:错

答案:对

Flume是可靠的，容错性高的，可升级的，易管理的,并且不可以定制。（）

A:对B:错

答案:错

实时性，Flume有一个好处可以实时的将分析数据并将数据保存在数据库或者其他系统中。（）

A:错B:对

答案:对

Flume的配置很繁琐，source，channel，sink的关系在配置文件里面交织在一起，便于管理。（）

A:对B:错

答案:错

第十章测试

Sqoop是apache旗下一款“Hadoop和关系数据库服

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院

文档简介

温馨提示

最新文档

评论

大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院

文档简介

温馨提示

最新文档

评论

相关文档