大数据技术与应用智慧树知到期末考试答案2024年_第1页
大数据技术与应用智慧树知到期末考试答案2024年_第2页
大数据技术与应用智慧树知到期末考试答案2024年_第3页
大数据技术与应用智慧树知到期末考试答案2024年_第4页
大数据技术与应用智慧树知到期末考试答案2024年_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据技术与应用智慧树知到期末考试答案2024年大数据技术与应用Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令()

A:applicationB:application-attemptC:containerD:jar答案:applicationYARN中,slave节点负责以下哪些工作()

A:集群中所有资源的统一管理和分配B:监控每个Container的资源使用(内存、CPU等)情况C:管理日志和不同应用程序用到的附属服务(正确答案)D:监督Container的生命周期管理答案:监督Container的生命周期管理大数据时代,数据使用的关键是()。

A:数据分析B:数据存储C:数据收集D:数据再利用答案:数据再利用()是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。

A:HadoopB:MDapReduceC:IBMD:Nutch答案:HadoopHDfS中的block默认保存几份?()

A:2份B:3份C:不确定D:1份答案:份下面中不属于HIVE中的元数据信息(

)。

A:表的列和分区及其属性B:表的属性(只存储内部表信息)C:表的数据所在目录D:表的名字答案:表的属性(只存储内部表信息)下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?()

A:etcB:shareC:sbinD:bin答案:sbin本课程在虚拟机中安装的Linux操作系统是()

A:UbuntnB:RedHatC:CentOSD:Suse答案:CentOS在ZooKeeper和YARN的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪个目录中获取Application相关信息()

A:StorageB:MetastoreC:Statestore(正确答案)D:Warehouse答案:Statestore(正确答案)下列哪项通常是集群的最主要瓶颈()。

A:内存B:磁盘C:网盘D:CPU答案:磁盘停止Hadoop进程正确的命令是()。

A:Dfs-stop.shB:Stop-hdfs.shC:stop-all.shD:yarn-stop答案:stop-all.sh下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是:()

A:前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好B:前者相比后者学习起来更难C:前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好D:前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型答案:前者所需硬件价格贵,可扩展性差,后者硬件便宜,扩展性好###前者相比后者学习起来更难###前者适用于实时、细粒度计算、计算密集型,后者适用于批处理、非实时、数据密集型Hive是由哪家公司开源的(

)。

A:GoogleB:LinkedInC:NetflixD:Facebook答案:Facebook查看IP地址的命令错误的为:()

A:IfconfigB:ipaddrC:ipaddD:startnetwork答案:startnetworkYARN容量调度器的主要特点不正确的是()

A:灵活性B:复用性强C:多重租赁D:动态更新配置文件答案:复用性强()擅长处理和分析大量分布式的非结构化数据,以分批的方式进行历史分析。

A:HadoopB:WebC:NutchD:NoSQL数据库答案:Hadoop在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务()

A:分配ContainerB:申请和领取资源(正确答案)C:为任务设置好运行环境D:启动Map或Reduce任务答案:申请和领取资源下列哪个属性是hdfs—site。xml中的配置?()

A:yarn.resourcemanager.B:dfs.replicationC:fs.defaultFSD:答案:dfs.replication关于Hadoop单机模式和伪分布式模式的说法,正确的是()

A:后者比前者增加了HDFS输入输出以及可检查内存使用情况B:两者都起守护进程,且守护进程运行在一台机器上C:两者都不与守护进程交互,避免复杂性D:单机模式不使用HDFS,但加载守护进程答案:后者比前者增加了HDFS输入输出以及可检查内存使用情况hadoop大数据的两大核心技术是()

A:HDFSB:可视化C:YARND:MapReduce答案:HDFS###MapReduceHBase是一个构建在HDFS上的分布式列存储系统。()

A:错B:对答案:对HiveServer将用户提交的HL语句进行编译,解析成对应的Yarn任务、Spak任务或者HDFS操作,从而完成数据的提取、转换、分析。()

A:错B:对答案:对Channel不可以连接Source和Sink的组件。()

A:对B:错答案:错Flume采用了三层架构,分别为agent,collector和storage,每一层均可以水平扩展。()

A:对B:错答案:对Sqoop不可以高效的可控的利用资源,比如它可以通过调整任务数,来控制任务的并发度,另外还可以配置数据库的访问时间等等。()

A:对B:错答案:错Flume于2019年被捐赠给apache软件基金会,成为Hadoop相关组件之一。()

A:对B:错答案:错Sqoop启动MapReduce作业,MapReduce中主要是对输入类InputFormat和输出类OutputFormat进行定制。()

A:对B:错答案:对最早提出“大数据”时代到来的是全球知名公司谷歌()

A:错B:对答案:对测试Sqoop安装是否成功,输入sqoopversion命令之后,系统不会提示Sqoop版本相关信息。()

A:对B:错答案:错传统的数据仓库无法有效处理不同类型的数据。(

A:对B:错答案:对Flume支持多种接入资源数据的类型以及接出数据类型。()

A:对B:错答案:对Sqoop对于数据的导入、导出都是通过MapReduce作业实现的。()

A:错B:对答案:对Sqoop常用命令import是将数据导出。()

A:对B:错答案:错Sqoop软件是一个在关系型数据库(Mysql、Oracle)和Hadoop之间进行批量数据传输的工具。()

A:错B:对答案:对虚拟机是一个相对独立的环境,在这个环境里,可以安装各个版本的Windows系统。也可以根据环境自己调节环境的配置,像一般电脑一样开机。()

A:错误B:正确答案:正确Sqoop常用命令exportt是将数据导出。()

A:错B:对答案:对BlockSize是不可以修改的。()

A:正确B:错误答案:错误Sqoop常用命令help是打印Sqoop帮助信息。()

A:错B:对答案:对集群的目的是为了节省成本,用廉价的pc机,取代小型机及大型机。()

A:对B:错答案:对下面关于Hive和传统数据库的比较描述正确的是(

)。

A:Hive

和传统数据库除了拥有类似的查询语言,再无类似之处B:Hive使用了查询语言HQL(HiveQueryLanguage),HQL与SQL没有任何关系C:Hive

是建立在

Hadoop

之上的,所有

Hive

的数据都是存储在

HDFS

中的,而数据库则可以将数据保存在块设备或者本地文件系统中D:Hive的针对数据仓库设计,针对的是读多写少的场景答案:AI参考:正确选项是【C:Hive

是建立在

Hadoop

之上的,所有

Hive

的数据都是存储在

HDFS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论