版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据技术与应用智慧树知到课后章节答案2023年下咸阳职业技术学院咸阳职业技术学院
第一章测试
大数据(BigData),是指可以在一定时间范围内使用常规软件工具进行捕捉、管理和处理的数据集合。()
A:错B:对
答案:错
Hadoop之父是()。
A:DougCuttingB:KentBeckC:MartinFowler
答案:DougCutting
大数据的起始计量单位至少是P,即()个T
A:10000B:10C:50D:1000
答案:1000
大数据的特征有()。
A:数据量大B:价值密度低C:计算速度快D:数据种类繁多
答案:数据量大;价值密度低;计算速度快;数据种类繁多
Hadoop核心组件有()
A:HDFS(分布式文件存储系统):解决海量数据存储B:YARN(集群资源管理和任务调度框架):解决资源任务调度C:MapReduce(分布式计算框架):解决海量数据计算
答案:HDFS(分布式文件存储系统):解决海量数据存储;YARN(集群资源管理和任务调度框架):解决资源任务调度;MapReduce(分布式计算框架):解决海量数据计算
第二章测试
Linux下启动HDFS的命令是()。
A:start-dfscmdB:start-dfs.shC:startdfsD:hdfs
答案:start-dfs.sh
生成密钥对的命令是()。
A:ssh-keygenB:sshC:ssh-addD:ssh-copy-id
答案:ssh-keygen
查看hadoop版本号的命令是()。
A:hadoop-versionB:Hadoop-versionC:Version-hadoop-D:hadoopversion
答案:hadoopversion
Hadoop开发过程中一般采用普通用户登录。()
A:错B:对
答案:对
生效环境变量的命令是(
)。
A:vi
/etc/profileB:vim/etc/profileC:source/etc/profileD:cat/etc/profile
答案:source/etc/profile
第三章测试
Client端上传文件的时候下列哪项正确?()
A:Client端将文件切分为Block,依次上传B:Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作C:NameNode负责Block复制工作D:数据经过NameNode传递给DataNode
答案:Client端将文件切分为Block,依次上传
下面哪个程序负责HDFS数据存储()。
A:DatanodeB:secondaryNameNodeC:NameNodeD:Jobtracker
答案:Datanode
Cloudera提供哪几种安装CDH的方法?()
A:TarballB:YumC:ClouderamanagerD:Rpm
答案:Tarball;Yum;Clouderamanager;Rpm
Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。()
A:对B:错
答案:错
Ganglia不仅可以进行监控,也可以进行告警。()
A:错B:对
答案:对
第四章测试
Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是()。
A:1500MB:2000MC:200MD:1000M
答案:1000M
DataNode通过()与NameNode保持通信。()
A:短连接B:长连接C:无连接D:超长连接
答案:长连接
下列哪项可以作为集群的管理?()
A:ClouderaManagerB:PdshC:ZookeeperD:Puppet
答案:Pdsh;Zookeeper;Puppet
配置机架感知的下面哪项正确:()
A:MapReduce会根据机架获取离自己比较近的网络数据B:写入数据的时候会写到不同机架的DataNode中C:如果一个机架出问题,不会影响数据读写
答案:MapReduce会根据机架获取离自己比较近的网络数据;写入数据的时候会写到不同机架的DataNode中;如果一个机架出问题,不会影响数据读写
如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。()
A:对B:错
答案:错
第五章测试
Yarn各模块组成有:()
A:AngularB:Resourcemanager、nodemanager、applicationMasterC:VueD:Json
答案:Resourcemanager、nodemanager、applicationMaster
Yarn附则整个集群的资源管理功能,每个任务都单独有一个“应用服务器”:()
A:对B:错
答案:对
以下关于yarn的描述正确的是:()
A:对于资源的表示以硬盘为单位。B:目前可以支持多种计算框架运行在yarn上面,比如MapReduce、storm、spark、fookk等。C:支持多个框架,yarn不再是一个单纯的计算框架,而是一个框架管理器。D:框架升级更容易,在yarn中,各种计算框架不再是作为一个服务部署到集群的各个节点上。
答案:支持多个框架,yarn不再是一个单纯的计算框架,而是一个框架管理器。
以下关于yarn的说法正确的是:()
A:Yarn是采用两级式资源分配方案B:存在于Hadoop1.0中C:Spark、stormstreaming、igraph等计算框架不能再yarn上运行,也不能访问hdfs上的数据资源D:Yarn只能运行Hadoop生态下的MapReduce运算框架
答案:Yarn是采用两级式资源分配方案
对新一代资源管理调度框架YARN的理解正确的是:()
A:YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMasterB:MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务C:YARN既是资源管理调度框架,也是一个计算框架D:YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架
答案:YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架
第六章测试
HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。()
A:错B:对
答案:对
谷歌公司关于MapReduce模型的论文发布于()年
A:2004B:2003C:2005D:2006
答案:2004
下列关于MapReduce模型的说法错误的是()
A:MapReduce模型是一种理论模型,无法实现B:MapReduce模型具有简单易学,使用灵活的特点C:MapReduce模型可实现大规模数据的并行计算D:MapReduce模型的核心思想是“分而治之”
答案:MapReduce模型是一种理论模型,无法实现
大数据的开发和利用,关键在于大数据技术的支撑。其中,MapReduce是分布式数据库。()
A:对B:错
答案:错
适合MapReduce框架处理的任何和数据集要求待处理的数据集可以分解为许多小的数据子集,而且每个数据子集的处理不依赖也不影响其他数据子集的处理。()
A:对B:错
答案:对
第七章测试
()是一个实时收集、分析、展示、监控数据的分布式数据库,它基于HBase存储和查询监控数据。
A:KijiExpressB:KijiMRC:KijiD:OpenTSDB
答案:OpenTSDB
HBase每个行有一个()唯一标识了行的地址。
A:列族B:名C:行键D:时间戳
答案:行键
在水平方向,HBase的一张表由一个或多个()组成。
A:时间戳B:列C:行D:列族
答案:列族
HBase的每个列族均对应了一个()属性。
A:列名B:时间戳C:列键D:行键
答案:时间戳
在垂直方向,HBase的一张表有多个()来组成。
A:列B:行族C:列族D:行
答案:行族
第八章测试
下列关于Hive特点总结正确的选项是()。
A:Hive支持自由的扩展集群的规模,只需要重启服务即可B:Hive支持自定义函数,用户可以根据自己的需求去定义函数C:Hive适合处理小批量数据D:HiveSQL执行时,需要避免节点出现问题
答案:Hive支持自定义函数,用户可以根据自己的需求去定义函数
Hive的元数据存储在derby和MySQL中有什么区别()。
A:数据库的区别B:没区别C:多会话(Moresession)D:支持网络环境
答案:多会话(Moresession)
Hive有四个驱动器,下面那个不是()。
A:解释器B:编译器C:策略器(Strategyimplement)D:优化器
答案:策略器(Strategyimplement)
Hive有什么好处()。
A:可以存储数据B:可以通过语句自动编译mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)C:可以直接在表中插入数据D:可以使用sql,操作存储在hdfs中的数据
答案:可以通过语句自动编译mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)
下列哪个组件不属于Hive架构()
A:ClientB:MySQLC:TaskManagerD:HDFS
答案:TaskManager
第九章测试
Flume可以将应用产生的数据存储到任何集中存储器中,比如HDFS,HBase。()
A:错B:对
答案:对
Flume的管道是基于事务,保证了数据在传送和接收时的一致性。()
A:对B:错
答案:对
Flume是可靠的,容错性高的,可升级的,易管理的,并且不可以定制。()
A:对B:错
答案:错
实时性,Flume有一个好处可以实时的将分析数据并将数据保存在数据库或者其他系统中。()
A:错B:对
答案:对
Flume的配置很繁琐,source,channel,sink的关系在配置文件里面交织在一起,便于管理。()
A:对B:错
答案:错
第十章测试
Sqoop是apache旗下一款“Hadoop和关系数据库服
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度宿舍租赁安全责任免除合同
- 二零二五年度购物中心装饰工程劳务分包合同
- 安全经验分享:安全事故案例
- 高档橱柜购销合同范本
- 2025年度金融机构个人经营性借款合同样本3篇
- 南京科技职业学院《新媒体品牌传播》2023-2024学年第一学期期末试卷
- 南京工业大学《语言处理与语音识别》2023-2024学年第一学期期末试卷
- 南充职业技术学院《中学政治学科》2023-2024学年第一学期期末试卷
- 南充科技职业学院《外汇经营管理》2023-2024学年第一学期期末试卷
- 南昌应用技术师范学院《时政阅读》2023-2024学年第一学期期末试卷
- 新教材人教版高中物理选择性必修第二册全册各章节课时练习题及章末测验含答案解析(安培力洛伦兹力电磁感应交变电流等)
- 初级养老护理员培训全套
- 集中供热管网系统一次网的调节方法
- GB/T 41095-2021机械振动选择适当的机器振动标准的方法
- MRP、MPS计划文档教材
- 甲状腺疾病护理查房课件
- 安全安全带检查记录表
- GB∕T 26520-2021 工业氯化钙-行业标准
- 2022年浙江省绍兴市中考数学试题及参考答案
- Listen-to-this-3-英语高级听力-(整理版)
- 生活垃圾焚烧处理建设项目评价导则(2022)
评论
0/150
提交评论