




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《大数据平台搭建与配置管理》期中试题
期中试题(闭卷B)
题成
—•四五六七八九十
号绩
满
30202030100
分
得
分
【本套试卷共有4大题,计66小题】
一、选择题(20题,每题1.5分,共30分)
1、欲把当前目录下的filel.txt复制为file2.txt,以下正确的命令是()。
A.copyfilel.txtfile2.txtB.cpfilel.txt|file2.txt
C.catfile2.txtfilel.txtD.catfilel.txt>file2.txt
2、下面哪个命令可以用来切换使用者的身份()。
A.passwdB.log
C.whoD.su
3、以下哪个不是HDFS的守护进程()。
A.datanodeB.namenode
C.secondarynamenodeD.mrappmaster/yarnchild
4、Hadoop-2.6.5集群中的HDFS的默认的数据块的大小是()。
A.32MBB.64MB
C.128MBD.256MB
5、HDFS集群中的namenode职责不包括()。
A.维护HDFS集群的目录树结构B.维护HDFS集群的所有数据块
的分布、副本数和负载均衡
C.负责保存客户端上传的数据D.响应客户端的所有读写数据请
求
6、下列关于HDFS的描述正确的是()。
A.如果NameNode宕机,B.HDFS集群支持数据的随机读
SecondaryNameNode会接替它使写
集群继续工作
C.NameNode磁盘元数据不保存D.DataNode通过长连接与
Block的位置信息NameNode保持通信
7>MapReduce是()上的并行计算。
A.运行于大规模集群B.运行于磁盘
C.运行于小规模集群D.运行在复杂的系统中
8、MapReduce框架会将M叩程序就近地在()数据所在的节点运行。
A.HDFSB.Spark
C.MapReduceD.Zookeeper
9、MapReduce为了保证任务的正常执行,采用()等多种容错机制。
A.重复执行B.重新开始整个任务
C,直接丢弃执行效率低的作业D.以上都是
10、ZooKeepcr是集群的(),监视着集群中各个节点的状态根据节点提交的反馈进行下
一步合理操作。
A.领导者B.执行者
C.管理者D,以上都不是
11、ZK提供了一定的()可以用来获取一个顺序增长的,可以在集群环境下使用的ID。
A.函数B.接口
C.方法D.类
12、名称空间由()组成。
A.磁盘寄存器B.表
C.内存寄存器D.数据寄存器
13、hive数据仓库中的数据,不可能的来源有哪些?()
A.Mysql或Oracle数据库B.行为数据
C.业务数据系统D.娱乐资料
14、解压.tar.gz结尾的HBase压缩包使用的Linux命令是什么?()
A.tar-vfB.tar
C.tar-zxD.tar-zxvf
15、下以下数据第三列,应该用哪种数据类型存储:1,zhangsan,[90,79.88]。()
A.mapB.int
C.arrayD.struct
16、查询速度的提升是以额外的()为代价的。
A.创建索引B.创建索引和存储索引
C.删除索引D.存储索引
17、当客户端发起一个Put请求时,首先它从()表中查出该Put数据。
A.hbase:metaB.hbase:value
C.-ROOT-D.hbase:key
18、HBase构建二级索引的实现方式有哪些?()
A.MapReduceB.Hive
C.BloomFilterD.Filter
19、Storm将()组成的网络抽象成Topology。
A.Spouts和BoltsB.字段
C.GFSD.Tuple
20、Slorm运行在分布式集群中,其运行任务的方式与()类似。
A.HDFSB.HBase
C.HadoopD.Zookeeper
二、填空题(20题,每题1分,共10分)
21、链接分为:o
22、JDK下解释执行Java的程序是。
23、是客户端需要执行的一个工作单元。
24、HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的o
25、HDFS不适合用在的应用场合。
26、HDFS集群中只有唯一一个名称节点,该节点负责所有的o
27、Map的输出结果首先被写入o
28、磁盘包含机械部件,它是通过和来寻址定位数据。
29、Shuffle优化的原则是给Shuffle过程尽可能多的。
30、ZooKeeper允许分布式进程通过共享的相互协调。
31、分布式应用正在运行的一组系统称为o
32^ZooKeeper类通过其构造函数提供功能。
33、Hive中创建的目的就是在查询一个表中某列值时提升速度。
34、使用命令可以创建一个指定名字的表。
35、WHERE子句是一个<>
36、HBase主要用来存储和的松散数据。
37、在HBase中执行操作时,并不会删除数据旧的版本。
38、服务器负责存储和维护分配给自己的。
39、Storm可以用来实时处理新数据和。
40、Topology中每一个计算组件都有一个执行度。
三、判断题,正确填“T",错误填"F”(20题,每题1分,共20分)
41、Hive本地模式和远程模式,最关键的差别是存储元数据的mysql数据库的安装位置
是在本地还是在远端。()
42、Hive数据类型中date类型是与时区无关的类型。()
43、Hive数据类型中,Timestamp类型是与时区无关的类型。()
44、Hive中的表,对应hdfs中文件的目录。()
45、外部表和内部表的差别,只是需要添加External关键词就可以了。()
46、删除外部表,只会删除外部表的元数据信息,并不会将外部表的数据删除。()
47、删除外部表,会同时删除外部表的数据和元数据。()
48、在Hive中,执行分桶操作,具体哪个值,分到哪个桶中,可以通过对数据进行Hash
运算取得。()
49、HBase是一套高性能的分布式数据集群,必须在大型机或者高性能的服务器上进行
搭建。()
50HBase是Apache的Hadoop项目的子项目,利用HadoopHDFS作为其文件存储系统,
适合于非结构化数据存储。()
51、MapReduce程序可以直接读取HBase内存储的数据内容。()
52、HBase系统适合进行多表联合查询以及复杂性读写操作。()
53^Hadoop是IBM公司开发的一款商用大数据软件。()
54、Hadoop是一个能够对大量数据进行分布式处理的软件框架,能够处理PB级数据。
()
55、Hadoop存储系统HDFS的文件是分块存储,每个文件块默认大小为32MB,()
56、HDFS系统为了容错保证数据块完整性,每一块数据都采用2份副本。()
57、HDFS系统采用NameNode定期向DataNode发送心跳消息,用于检测系统是否正常
运行。()
58、用户可以通过“hadoopfs-put"命令获取远端文件数据。()
59^Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持()。
6()、Ganglia不仅可以进行监控,也可以进行报警()。
四、简答题(6题,每题5分,共30分)
61、试论述实现矩阵向量乘法与矩阵乘法采用不同MapReduce策略的原因。
62、试论述HBase的三层结构中各层次的名称和作用。
答:
63、Storm集群中的Master节点和Work节点各自运行什么后台进程?这些进程又分别
负责什么工作?
答:
64、试论述Storm框架的工作流程。
答:
65试论述Hadoop和谷歌的mapreduce、gfs等技术之间的关系。
答:
66、试论述Hadoop在各个领域的应用情况。
答:
《大数据平台搭建与配置管理》期中标答
期中标答B(闭卷)
题成
----四五六七八九十
号绩
满
30202030100
分
得
分
一、选择题(20题,每题1.5分,共30分)
1-5:DDDCD
6-1():CAAAC
11-15:BDDDC
16-20:BAAAC
二、填空题(20题,每题I分,共20分)
21、软链接和硬链接
22、java.exe
23、job
24、完整性
25、低延迟
26、元数据的管理
27、缓存
28、磁头移动盘片的转助
29、内存
3()、分层命名空间
31、集群
32connect
33、索引
34、CREATETABLE
35、逻辑表达式
36、非结构化半结构化
37、更新
38、RegionRegion
39、更新数据库
40、并行
三、判断题(20题,每题1分,共20分)
41-45:FFTTF
46-50:TFTFT
51-55:TFFTF
56-60:FFFFT
四、简答题(6题,每题5分,共60分)
61、
答:矩阵向量乘法:
Map函数:每个Map任务将整个向量V和矩阵M的一个文件块作为输入。对每个元素
Mij,Map任务会产生键值对。
Reduce函数:Reduce任务将所有与给定键i关联的值相加即可得到<i,x>。
矩阵乘法:
1.自然连接:
Map函数:对每个矩阵元素My产生一个键值对,对每个矩阵元素Njk产生一个键值对。
Reduce函数:对每个相同键j,输出所有满足形式vj,〈i,k,mijnjk>>的元组。
62、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 储水桶合同范本
- 郑州防汛施工方案公司
- 路沿石的施工方案
- 关于个人聘用合同范例
- 会务外包合同范本
- 锅炉钢板施工方案
- 能谱CT定量参数在喉及下咽部病变良恶性鉴别诊断中的价值
- 高长径比银纳米线的制备及其在锂金属电池中的应用
- 鬼针草的铬富集机理研究
- 加工包回收合同范例
- 2025届浙江省湖州、衢州、丽水高三11月三地市一模考试化学试卷
- 2025年湖南艺术职业学院单招职业技能测试题库参考答案
- 2025年湖南铁道职业技术学院单招职业技能测试题库学生专用
- 《临床常见心理问题》课件
- 2025年广州开发区水质监测中心第四次招考聘用编外人员2人高频重点模拟试卷提升(共500题附带答案详解)
- 教学课件:《民事诉讼法》(本科)
- 2024年吉林省生活垃圾清运和处理市场前景预测及投资规划研究报告
- 2025年湖南省高职单招《语文》高频必练考试题库400题(含答案)
- 《SSD市场调查》课件
- 以教育家精神引领教师专业成长的价值及实践路径
- 《质量管理标准化手册》
评论
0/150
提交评论