



付费下载
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hadoop平台构建知到智慧树章节测试课后答案2024年秋上海思博职业技术学院绪论单元测试
Hadoop平台构建项目重点内容()。
A:数据仓库Hive部署与数据分析和MapReduce基础编程B:Hadoop部署与实现添加弹题C:Spark基础编程D:HDFS系操作
答案:数据仓库Hive部署与数据分析和MapReduce基础编程;Hadoop部署与实现添加弹题;Spark基础编程;HDFS系操作
第一章单元测试
大数据的战略意义是实现数据的增值。大数据的显著特征主要表现在:数据体量巨大、()。
A:数据类型庞杂、价值密度高和处理速度较慢B:数据类型繁多、价值密度低和处理速度快C:数据类型繁多、价值密度低和处理速度较慢D:数据类型精炼、价值密度高和处理速度快
答案:数据类型繁多、价值密度低和处理速度快大数据与云计算之间的关系是()。
A:大数据和云计算是相同概念的两个表述B:大数据的应用范围较云计算更为广泛C:大数据是在云计算基础上发展起来的D:大数据相当于储有海量信息的信息库;云计算相当于计算机和操作系统
答案:大数据是在云计算基础上发展起来的下列对大数据特点的说法中,错误的是()。
A:数据规模大B:数据处理速度快C:数据类型多样D:数据价值密度高
答案:数据价值密度高()在许多情况下,能够达到99.999%的可用性。
A:并行计算B:分布式C:集群D:虚拟化
答案:集群解压.tar.gz结尾的HBase压缩包使用的Linux命令是()。
A:tar-zxB:tar-nfC:tar-zxvfD:tar-s
答案:tar-zxvf
第二章单元测试
Hadoop生态系统中,被作为ETL使用的软件是()。
A:OracleB:AutoconfC:BigtopD:Sqoop
答案:Sqoop关于Hadoop单机模式和伪分布式模式的说法,正确的是()。
A:两者都不与守护进程交互,避免复杂性B:两者都起守护进程,且守护进程运行在一台机器上C:后者比前者增加了HDFS输入输出以及可检查内存使用情况D:单机模式不使用HDFS,但加载守护进程
答案:后者比前者增加了HDFS输入输出以及可检查内存使用情况以下命令组成错误的是()。
A:bin/hadoopfs-cat/hadoopdata/y/txtB:hadoopnamenode-formatC:vim/etc/profileD:source/etc/profile
答案:bin/hadoopfs-cat/hadoopdata/y/txt想要修改集群的备份数量,可以修改哪个()。
A:hadoop-env.shB:core-site.xmlC:hdfs-site.xmlD:mapred-site.xml
答案:hdfs-site.xmlHadoop作为分布式计算技术的杰出代表,其主要特征包括()。
A:高效性B:健壮性C:简单性D:可靠性
答案:高效性;健壮性;简单性;可靠性
第三章单元测试
HDfS中的block默认保存几份()。
A:2B:不确定C:1D:3
答案:3以下哪个不是HDFS的守护进程()。
A:NameNodeB:DataNodeC:MrappMaster/YarnChildD:SecondaryNameNode
答案:MrappMaster/YarnChild下列关于HDFS的描述正确的是()
A:DataNode通过长连接与NameNode保持通信B:NameNode磁盘元数据不保存Block的位置信息C:如果NameNode宕机,SecondaryNameNode会接替它使集群继续工作D:HDFS集群支持数据的随机读写
答案:NameNode磁盘元数据不保存Block的位置信息下列哪个属性是hdfs-site.xml中的配置()。
A:fs.defaultFSB:C:yarn.resourcemanager.addressD:dfs.replication
答案:yarn.resourcemanager.addressHDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()。
A:多次写入,多次读B:多次写入,少次读C:一次写入,多次读D:一次写入,少次读
答案:一次写入,多次读
第四章单元测试
HBase依赖()技术框架提供消息通信机制。
A:ChubbyB:ZookeeperC:RPCD:Socket
答案:Zookeeper下列()选项是安装HBase前所必须安装的。
A:操作系统B:ShellScriptC:JavaCodeD:JDK
答案:操作系统;JDKHBase系统用于记录Region相关信息的表,具体的表包含()。
A:-ADMIN-B:-ROOT-C:…META.D:…SYSTEM.
答案:-ROOT-;…META.Hadoop的HBase主要特点有哪些()
A:面向列B:高可靠性C:可伸缩D:高性能
答案:面向列;高可靠性;可伸缩;高性能HBase的数据文件HFile中一个Keyvalue格式包含哪些信息()。
A:KeytypeB:valueC:TimeStampD:Key
答案:Keytype;value;TimeStamp;Key
第五章单元测试
MapReduce程序对数据的处理主要分为下列哪些过程()。
A:reduceB:shuffleC:streamD:map
答案:reduce;shuffle;mapHadoop是当前大数据平台的事实标准,下列对Hadoop的描述中正确的是()。
A:Hadoop在当前衍生出一系列优秀的开源项目,包括Hbase、Hive、Pig等B:Hadoop的两个核心部分是HDFS和MapReduce计算框架C:Hadoop是一个由Apache基金会开发的分布式系统开源架构D:Hadoop的初始设计思路来源于Google发布的学术论文
答案:Hadoop在当前衍生出一系列优秀的开源项目,包括Hbase、Hive、Pig等;Hadoop的两个核心部分是HDFS和MapReduce计算框架;Hadoop是一个由Apache基金会开发的分布式系统开源架构;Hadoop的初始设计思路来源于Google发布的学术论文MapReduce与HBase的关系,()描述是正确的。
A:两者不是强关联关系,没有MapReduce,HBase可以正常运行B:MapReduce可以直接访问HBaseC:它们之间没有任何关系D:两者不可或缺,MapReduce是HBase可以正常运行的保证
答案:两者不是强关联关系,没有MapReduce,HBase可以正常运行;MapReduce可以直接访问HBaseMapreduce过程中,以下属于Shuffle机制的是()。
A:combineB:PartitionC:Sort/MergeD:Copy
答案:combine;Partition;Sort/Merge;CopyMapReduce的inputsplit一定是一个block。()
A:错B:对
答案:错
第六章单元测试
加载数据到Hive表,哪种方式不正确()。
A:将HDFS上的文件load到Hive表中B:直接将本地路径的文件load到Hive表中C:将其他表的结果集insertinto到Hive表D:Hive支持Insertinto单条记录的方法,所以可以直接在命令行插入单条记录
答案:Hive支持Insertinto单条记录的方法,所以可以直接在命令行插入单条记录Hive中的这条命令“droptableperson;”是什么含义(
)
A:添加列B:创建表C:删除表D:修改文件格式
答案:删除表关于hive建表基本描述正确的是()。
A:不可再修改表名B:不可再修改列名C:创建外部表需要制定external关键字D:可再增加新列
答案:创建外部表需要制定external关键字对hive中表数据操作描述正确的是()。
A:hive可以修改列值B:hive可以修改行值C:hive不可以修改特定行值、列值D:都不对
答案:hive不可以修改特定行值、列值对于Hive中关于普通表和外部表描述不正确的是()。
A:删除外部表时,只除外部表数据而不删除元数据B:外部实质是将已存在于HDFS上的文件路径跟表关联起来C:删除普通表时,元数据和数据同时被删除D:默认创建普通表
答案:外部实质是将已存在于HDFS上的文件路径跟表关联起来
第七章单元测试
下列不属于非关系型数据库的是()。
A:NoSqlB:CloudantC:HiveD:Redis
答案:HiveHive中的这条命令“LOADDATALOCAL
INPATH'/opt/college/person.csv'OVERWRITE
into
tableperson;”是个什么类型的操作(
)。
A:从HDFS的/opt/college/目录下导入B:从Linux本地文件person.csv导入C:导出数据到/opt/college/person.csvD:导入数据到表person
答案:从Linux本地文件person.csv导入;导入数据到表personHIVE的元数据可存储在哪里()。
A:derby数据库B:mysql数据库C:HDFS
答案:derby数据库;mysql数据库以下属于HiveSQL中DDL数据定义语言的是()。
A:修改表B:删除表C:数据导入D:建表
答案:修改表;删除表;建表Hive是一种数据仓库处理工具,使用类sql的HivesqlL语言实现数据查询功能,所有Hive的数据都存储在HDFS中。()
A:错B:对
答案:错
第八章单元测试
SparkStreaming计算基于DStream将流式计算分解成一系列短小的批处理作业。()
A:对B:错
答案:错Spark和Hadoop都不适用于迭代计算的场景。()
A:错B:对
答案:错Spark任务的每个stage可划分为job,划分的标记是shuffle。()
A:错B:对
答案:错Spark任务的Executor可以执行多个task。()
A:错B:对
答案:错spark的master和worker通过什么方式进行通信的()。
A:httpB:nioC:AkkaD:netty
答案:Akka
第九章单元测试
配置Hadoop时,JAVA_HOME包含在()
A:configuration.xslB:hadoop-site.xmlC:hadoop-env.shD:hadoop-default.xml
答案:hadoop-env.shHadoop及其生态系统,可以部署在()。
A:LinuxB:DOSC:O
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 麻醉吸入性肺炎的护理
- 电子竞技赛事商业赞助策略研究报告:2025年品牌合作案例深度解读
- 2025年罕见病药物研发激励政策与罕见病药物价格监管政策研究报告
- 2025年航空货运市场结构优化与发展策略深度研究报告
- 物联网技术概论 教学大纲和授课计划
- 2025年房地产中介行业规范发展与服务质量提升实证分析报告
- 当前社会热点难点分析
- 下周工作计划模板范文(10篇)
- 公司财务及报销管理制度
- 员工摩托车停放管理制度
- 2025年泸州市中考数学试卷真题(含答案解析)
- 2025年四川省自贡市中考数学真题含答案
- 2025年安徽省医师考核管理试题
- 胃管护理操作规范与管理要点
- 堆肥技术课件视频
- 工厂计件考勤管理制度
- 人文关怀在护理工作中的意义
- 2024北京初三一模英语汇编:材料作文
- T/CCMA 0137-2022防撞缓冲车
- GB/T 20854-2025金属和合金的腐蚀循环暴露在盐雾、“干”和“湿”条件下的加速试验
- 麻风病知识讲座课件
评论
0/150
提交评论