大数据技术原理与应用_第1页
大数据技术原理与应用_第2页
大数据技术原理与应用_第3页
大数据技术原理与应用_第4页
大数据技术原理与应用_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据技术原理与应用1.数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:1.数据产生方式的变革主要经历了三个阶段,以下哪个不属于这三个阶段:()[单选题]*A.数据流阶段(正确答案)B.运营式系统阶段C.用户原创内容阶段D.感知式系统阶段2.2单选(2分)第三次信息化浪潮的发生标志是以下哪种技术的普及()[单选题]*A.物联网、云计算和大数据(正确答案)B.CPUC.个人计算机D.互联网3.3单选(2分)1TB=()MB()[单选题]*A.2^20(备注:2的20次方)(正确答案)B.1024C.1000D.2^10(备注:2的10次方)4.4单选(2分)Hadoop的两大核心是和()[单选题]*A.HDFS;HBaseB.MapReduce;HBaseC.GFS;MapReduceD.HDFS;MapReduce(正确答案)5.5单选(2分)HDFS默认的一个块大小是()[单选题]*A.32KBB.8KBC.64MB(正确答案)D.16KB6.6单选(2分)在分布式文件系统HDFS中,负责数据的存储和读取()[单选题]*A.数据节点(正确答案)B.名称节点C.主节点D.第二名称节点7.7单选(2分)上传当前目录下的本地文件file.txt到分布式文件系统HDFS的“/path”目录下的Shell命令是()[单选题]*A.hdfsfs-putfile.txt/pathB.hdfsdfs-putfile.txt/path(正确答案)C.hadoopdfs-put/pathfile.txtD.hdfsdfs-put/pathfile.txt8.8单选(2分)在HDFS根目录下创建一个文件夹/test,且/test文件夹内还包含一个文件夹dir,正确的shell命令是()[单选题]*A.hadoopdfs-mkdir/test/dirB.hadoopfs-mkdir-p/test/dir(正确答案)C.hdfsfs-mkdir-p/test/dirD.hdfsdfs*mkdir-p/test/dir9.9单选(2分)下列有关HBase的说法正确的是()[单选题]*A.HBase是针对谷歌BigTable的开源实现,是高可靠、高性能的图数据库B.在向数据库中插入记录时,HBase和关系数据库一样,每次都是以“行”为单位把整条记录插入数据库C.HBase数据库表可以设置该表任意列作为索引D.HBase是一种NoSQL数据库(正确答案)10.10单选(2分)已知一张表student存储在HBase中,向表中插入一条记录{id:2015001,name:Mary{score:math}:88},其id作为行键,其中,在插入数学成绩88分时,正确的命令是()[单选题]*A.put‘student’,‘score:math’,‘88’B.put‘student’,‘2015001’,‘score:math’,'88’(正确答案)C.put‘student’,‘2015001’,‘88’D.put‘student’,‘2015001’,‘math’,‘88’11.11单选(2分)NoSQL数据库的三大理论基石不包括()[单选题]*A.ACID(正确答案)B.CAPC.最终一致性D.BASE12.12单选(2分)在设计词频统计的MapReduce程序时,对于文本行“hellobigdatahellohadoop”,经过map函数处理后直接输出的结果应该是(没有发生combine和merge操作)()[单选题]*A.B.C.D.(正确答案)13.13单选(2分)假设已经配置好PATH环境变量,启动hadoop的命令是()[单选题]*A.start-hadoop.shB.start-hdfs.shC.start-fs.shD.start-dfs.sh(正确答案)14.14单选(2分)下列说法错误的是()[单选题]*A.HDFSHA可以解决单点故障问题B.HDFSFederation使得HDFS的命名服务能够水平扩展C.第二名称节点无法解决单点故障问题D.第二名称节点是热备份,而HDFSHA不是热备份(正确答案)15.15单选(2分)RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是()[单选题]*A.mapB.joinC.groupByD.collect(正确答案)16.16单选(2分)下列关于Hive的说法正确的是()[单选题]*A.Hive不支持索引B.Hive支持批量导入(正确答案)C.Hive的可扩展性差D.Hive支持频繁数据更新17.17多选(3分)大数据的特点包括()*A.数据种类繁多(正确答案)B.价值密度低(正确答案)C.处理速度快(正确答案)D.数据量大(正确答案)18.18多选(3分)下列适用于批处理计算的框架有哪些()*A.MapReduce(正确答案)B.PregelC.StormD.Spark(正确答案)19.19多选(3分)下列适用于流计算的框架有哪些()*A.SparkStreaming(正确答案)B.DremelC.PregelD.Storm(正确答案)20.20多选(3分)下列适用于图计算的框架有哪些()*A.Hama(正确答案)B.GraphX(正确答案)C.Pregel(正确答案)D.Impala21.21多选(3分)从技术架构上来看,物联网可以分为哪几层()*A.网络层(正确答案)B.应用层(正确答案)C.处理层(正确答案)D.感知层(正确答案)22.22多选(3分)HBase需要根据哪些属性来唯一地确定一个单元格(cell)中的某个版本数据()*A.列限定符(正确答案)B.行键(正确答案)C.时间戳(正确答案)D.列族(正确答案)23.23多选(3分)典型的NoSQL数据库的类型包括()*A.键值数据库(正确答案)B.列族数据库(正确答案)C.文档数据库(正确答案)D.图数据库(正确答案)24.24多选(3分)CAP是指()*A.持久性B.一致性(正确答案)C.可用性(正确答案)D.分区容忍性(正确答案)25.25多选(3分)云计算主要包括哪3种类型()*A.SaaS(正确答案)B.PaaS(正确答案)C.CaaSD.IaaS(正确答案)26.26多选(3分)以下属于流计算的应用有哪些()*A.购物网站的广告推荐(正确答案)B.根据过去一年购物记录判断用户的消费能力C.数据仓库数据批处理分析D.实时交通路线推荐(正确答案)27.27多选(3分)下列关于图计算说法正确的是()*A.传统的图计算框架通常表现出比较好的内存访问局部性B.当多个顶点的操作请求发生冲突时,Pregel采用局部有序和Handler来解决冲突(正确答案)C.Pregel是一种基于BSP模型实现的并行图处理系统(正确答案)D.在每个超步中,每个顶点会根据其接收消息的最大值和自身值比较,来确定自己状态作何种改变。(正确答案)28.28多选(3分)下列哪些是图计算框架Pregel的应用()*A.PageRank(正确答案)B.单源最短路径(正确答案)C.二分匹配(正确答案)D.流数据处理29.29多选(3分)关于Spark的特性说法正确的是()*A.Spark基于DAG的任务调度执行机制,要优于HadoopMapReduce的迭代执行机制(正确答案)B.Spark的计算模式也属于MapReduce,但编程模型比HadoopMapReduce更灵活(正确答案)C.Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言(正确答案)D.Spark提供了内存计算,可将中间结果放到内存中,对于迭代运算效率更高(正确答案)30.30多选(3分)BASE的基本含义是()*A.基本可用(正确答案)B.软状态(正确答案)C.持续性D.最终一致性(正确答案)31.31判断(2分)Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,是基于Java语言开发的,具有很好的跨平台特性。[判断题]*对(正确答案)错32.32判断(2分)HDFS分布式文件系统,是谷歌文件系统GFS的开源实现,而HadoopMapReduce也是针对谷歌MapReduce的开源实现。[判断题]*对(正确答案)错33.33判断(2分)在分布式文件系统HDFS中,名称节点负责管理HDFS的元数据,这些元数据被保存在磁盘中。[判断题]*对错(正确答案)34.34判断(2分)HDFS可以高效存储大量的小文件。[判断题]*对错(正确答案)35.35判断(2分)FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据。[判断题]*对(正确答案)错36.36判断(2分)第二名称节点(SecondaryNameNode)是HDFS架构中的一个组成部分,它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间。[判断题]*对(正确答案)错37.37判断(2分)HDFS采用了主从(Master/Slave)架构模型,一个HDFS集群包括一个名称节点和若干个数据节点。[判断题]*对(正确答案)错38.38判断(2分)NoSQL数据库的数据库模式灵活,可扩展性好,同时,所有NoSQL数据库都支持事务的ACID四性。[判断题]*对错(正确答案)39.39判断(2分)传统的关系数据库和NoSQL数据库各有所长,不存在一方完全取代另一方的问题,在很长的一段时期内,二者都会共同存在,满足不同应用的差异化需求。[判断题]*对(正确答案)错40.40判断(2分)MongoDB是一种图数据库,由C++语言编写的,其数据类型类似于JSON对象。[判断题]*对错(正确

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论