中国大学mooc《大数据技术原理与应用(厦门大学) 》章节测试答案_第1页
中国大学mooc《大数据技术原理与应用(厦门大学) 》章节测试答案_第2页
中国大学mooc《大数据技术原理与应用(厦门大学) 》章节测试答案_第3页
中国大学mooc《大数据技术原理与应用(厦门大学) 》章节测试答案_第4页
中国大学mooc《大数据技术原理与应用(厦门大学) 》章节测试答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

中国大学mooc《大数据技术原理与应用(厦门大学) 》章节测试答案.doc 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

title大数据技术原理与应用(厦门大学)中国大学mooc答案100分最新版content第1章大数据概述第1章大数据概述单元测验1、第三次信息化浪潮的标志是:A:个人电脑的普及

B:互联网的普及

C:云计算、大数据、物联网技术的普及

D:虚拟现实技术的普及

答案:云计算、大数据、物联网技术的普及2、就数据的量级而言,1PB数据是多少TB?A:512

B:1024

C:1000

D:2048

答案:10243、以下关于云计算、大数据和物联网之间的关系,论述错误的是:A:云计算侧重于数据分析

B:云计算、大数据和物联网三者紧密相关,相辅相成

C:物联网可以借助于云计算实现海量数据的存储

D:物联网可以借助于大数据实现海量数据的分析

答案:云计算侧重于数据分析4、以下哪个不是大数据时代新兴的技术:A:Hadoop

B:Spark

C:HBase

D:MySQL

答案:MySQL5、每种大数据产品都有特定的应用场景,以下哪个产品是用于批处理的:A:MapReduce

B:Pregel

C:Dremel

D:Storm

答案:MapReduce6、每种大数据产品都有特定的应用场景,以下哪个产品是用于流计算的:A:

GraphX

B:S4

C:Hive

D:Impala

答案:S47、每种大数据产品都有特定的应用场景,以下哪个产品是用于图计算的:A:Cassandra

B:Flume

C:Storm

D:Pregel

答案:Pregel8、每种大数据产品都有特定的应用场景,以下哪个产品是用于查询分析计算的:A:MapReduce

B:HDFS

C:Dremel

D:S4

答案:Dremel9、数据产生方式大致经历了三个阶段,包括:A:运营式系统阶段

B:用户原创内容阶段

C:感知式系统阶段

D:移动互联网数据阶段

答案:运营式系统阶段;

用户原创内容阶段;

感知式系统阶段10、大数据发展的三个阶段是:A:萌芽期

B:低谷期

C:成熟期

D:大规模应用期

答案:萌芽期;

成熟期;

大规模应用期11、大数据的特性包括:A:数据量大

B:数据类型繁多

C:处理速度快

D:价值密度低

答案:数据量大;

数据类型繁多;

处理速度快;

价值密度低12、图领奖获得者、著名数据库专家JimGray博士认为,人类自古以来在科学研究上先后经历了哪几种范式:A:实验科学

B:理论科学

C:计算科学

D:数据密集型科学

答案:实验科学;

理论科学;

计算科学;

数据密集型科学13、大数据带来思维方式的三个转变是:A:精确而非全面

B:全样而非抽样

C:效率而非精确

D:相关而非因果

答案:全样而非抽样;

效率而非精确;

相关而非因果14、大数据主要有哪几种计算模式:A:批处理计算

B:流计算

C:图计算

D:查询分析计算

答案:批处理计算;

流计算;

图计算;

查询分析计算15、云计算的典型服务模式包括三种:A:PaaS

B:

IaaS

C:SaaS

D:MaaS

答案:PaaS;

IaaS;

SaaS第2章大数据处理架构Hadoop第2章大数据处理架构Hadoop单元测验1、启动hadoop所有进程的命令是:A:start-dfs.sh

B:start-hadoop.sh

C:start-all.sh

D:start-hdfs.sh

答案:start-all.sh2、以下对Hadoop的说法错误的是:A:Hadoop的核心是HDFS和MapReduce

B:Hadoop是基于Java语言开发的,只支持Java语言编程

C:Hadoop2.0增加了NameNodeHA和Wire-compatibility两个重大特性

D:HadoopMapReduce是针对谷歌MapReduce的开源实现,通常用于大规模数据集的并行计算

答案:Hadoop是基于Java语言开发的,只支持Java语言编程3、以下哪个不是Hadoop的特性:A:高容错性

B:高可靠性

C:成本高

D:支持多种编程语言

答案:成本高4、以下名词解释不正确的是:A:HDFS:分布式文件系统,是Hadoop项目的两大核心之一,是谷歌GFS的开源实现

B:HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现

C:Hive:一个基于Hadoop的数据仓库工具,用于对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储

D:Zookeeper:针对谷歌Chubby的一个开源实现,是高效可靠的协同工作系统

答案:HBase:提供高可靠性、高性能、分布式的行式数据库,是谷歌BigTable的开源实现5、以下哪些组件是Hadoop的生态系统的组件:A:MapReduce

B:HDFS

C:

Oracle

D:HBase

答案:MapReduce;

HDFS;

HBase6、以下哪个命令可以用来操作HDFS文件:A:hadoopfs

B:hdfsdfs

C:hadoopdfs

D:hdfsfs

答案:hadoopfs;

hdfsdfs;

hadoopdfs第3章分布式文件系统HDFS第3章分布式文件系统HDFS单元测验1、HDFS的命名空间不包含:A:目录

B:文件

C:块

D:字节

答案:字节2、对HDFS通信协议的理解错误的是:A:HDFS通信协议都是构建在IoT协议基础之上的

B:名称节点和数据节点之间则使用数据节点协议进行交互

C:客户端与数据节点的交互是通过RPC(RemoteProcedureCall)来实现的

D:客户端通过一个可配置的端口向名称节点主动发起TCP连接,并使用客户端协议与名称节点进行交互

答案:HDFS通信协议都是构建在IoT协议基础之上的3、采用多副本冗余存储的优势不包含:A:加快数据传输速度

B:节约存储空间

C:容易检查数据错误

D:保证数据可靠性

答案:节约存储空间4、假设已经配置好环境变量,启动Hadoop和关闭Hadoop的命令分别是:A:start-hdfs.sh,stop-hdfs.sh

B:start-dfs.sh,stop-dfs.sh

C:start-dfs.sh,stop-hdfs.sh

D:start-hdfs.sh,stop-dfs.sh

答案:start-dfs.sh,stop-dfs.sh5、分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据叫

,另一类存储具体数据叫

:A:名称节点,数据节点

B:数据节点,名称节点

C:名称节点,主节点

D:从节点,主节点

答案:名称节点,数据节点6、下面关于分布式文件系统HDFS的描述正确的是:A:分布式文件系统HDFS是一种关系型数据库

B:分布式文件系统HDFS是GoogleBigtable的一种开源实现

C:分布式文件系统HDFS是谷歌分布式文件系统GFS(GoogleFileSystem)的一种开源实现

D:分布式文件系统HDFS比较适合存储大量零碎的小文件

答案:分布式文件系统HDFS是谷歌分布式文件系统GFS(GoogleFileSystem)的一种开源实现7、以下对名称节点理解正确的是:A:名称节点通常用来保存元数据

B:名称节点的数据保存在内存中

C:名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问

D:名称节点用来负责具体用户数据的存储

答案:名称节点通常用来保存元数据;

名称节点的数据保存在内存中;

名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问8、以下对数据节点理解正确的是:A:数据节点用来存储具体的文件内容

B:数据节点的数据保存在磁盘中

C:数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作

D:数据节点通常只有一个

答案:数据节点用来存储具体的文件内容;

数据节点的数据保存在磁盘中;

数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作9、HDFS只设置唯一一个名称节点带来的局限性包括:A:性能的瓶颈

B:命名空间的限制

C:隔离问题

D:集群的可用性

答案:性能的瓶颈;

命名空间的限制;

隔离问题;

集群的可用性10、以下HDFS相关的shell命令不正确的是:A:hadoopfs-ls<path>:显示<path>指定的文件的详细信息

B:hadoopdfsmkdir<path>:创建<path>指定的文件夹

C:hadoopfs-copyFromLocal<path1><path2>:将路径<path2>指定的文件或文件夹复制到路径<path1>指定的文件夹中

D:hdfsdfs-rm<path>:删除路径<path>指定的文件

答案:hadoopdfsmkdir<path>:创建<path>指定的文件夹;

hadoopfs-copyFromLocal<path1><path2>:将路径<path2>指定的文件或文件夹复制到路径<path1>指定的文件夹中第4章分布式数据库HBase第4章分布式数据库HBase单元测验1、HBase是一种

数据库A:行式数据库

B:列式数据库

C:文档数据库

D:关系数据库

答案:列式数据库2、下列对HBase数据模型的描述错误的是:A:HBase是一个稀疏、多维度、排序的映射表,这张表的索引是行键、列族、列限定符和时间戳

B:HBase列族支持动态扩展,可以很轻松地添加一个列族或列

C:HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本

D:每个HBase表都由若干行组成,每个行由行键(rowkey)来标识

答案:HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本3、下列说法正确的是:A:HBase的实现包括的主要功能组件是库函数,一个Master主服务器和一个Region服务器

B:Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等

C:如果不启动Hadoop,则HBase完全无法使用

D:如果通过HBaseShell插入表数据,可以插入一行数据或一个单元格数据

答案:Zookeeper是一个集群管理工具,常用于分布式计算,提供配置维护、域名服务、分布式同步等4、在HBase数据库中,每个Region的建议最佳大小是:A:100MB-200MB

B:500MB-1000MB

C:1GB-2GB

D:2GB-4GB

答案:1GB-2GB5、HBase三层结构的顺序是:A:Zookeeper文件,.MEATA.表,-ROOT-表

B:Zookeeper文件,-ROOT-表,.MEATA.表

C:-ROOT-表,Zookeeper文件,.MEATA.表

D:.MEATA.表,Zookeeper文件,-ROOT-表

答案:Zookeeper文件,-ROOT-表,.MEATA.表6、客户端是通过

级寻址来定位Region:A:一

B:二

C:三

D:四

答案:三7、关于HBaseShell命令解释错误的是:A:

create:创建表

B:list:显示表的所有数据

C:put:向表、行、列指定的单元格添加数据

D:get:通过表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值

答案:list:显示表的所有数据8、下列对HBase的理解正确的是:A:HBase是一个行式分布式数据库,是Hadoop生态系统中的一个组件

B:

HBase是针对谷歌BigTable的开源实现

C:HBase多用于存储非结构化和半结构化的松散数据

D:HBase是一种关系型数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论