Hadoop精彩试题题库_第1页
Hadoop精彩试题题库_第2页
Hadoop精彩试题题库_第3页
Hadoop精彩试题题库_第4页
Hadoop精彩试题题库_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用文档1.以下哪一项不属于 Hadoop可以运行的模式 CA.单机本地模式B.伪分布式模式C.互联模式D.分布式模式2 . Hadoop的作者是下面哪一位_B.A. Martin FowlerB. Doug cuttingC. Kent BeckD. Grace Hopper3 .以下哪个程序通常与 NameNode在同一个节点启动 _DA. TaskTrackerB. DataNodeC. SecondaryNameNodeD. Jobtracker4 . HDFS 默认 Block Size的大小是 B.A.32MBB.64MBC.128MBD.256M5 .以下哪项通常是集群的最主要瓶

2、颈 C_oA. CPUB.网络C.磁盘IOD.内存6.以下关于 MapReduce说法不正确的选项是 C_.A. MapReduce是一种计算框架B. MapReduce来源于google的学术论文C. MapReduce程序只能用java语言编写D. MapReduce隐藏了并行计算的细节,方便使用8. HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、 高可扩展性、高吞吐率等特征,适合的读写任务是_D.A. 一次写入,少次读B.屡次写入,少次读C.屡次写入,屡次读D. 一次写入,屡次读标准文案实用文档9. HBase依靠 A存储底层数据.A. HDFSB. H

3、adoopC. MemoryD. MapReduce10. HBase依赖 D_提供强大的计算水平.A. ZookeeperB. ChubbyC. RPCD. MapReduce11. HBase依赖 A 提供消息通信机制A. ZookeeperB. ChubbyC. RPCD. Socket12. 下面与HDF砥似的木g架是 C?A. NTFSB. FAT32C. GFSD. EXT313. 关于SecondaryNameNode下面哪项是正确的 C.A.它是NameNode的热备B.它对内存没有要求C.它的目的是帮助 NameNode合并编辑日志,减少 NameNode启动时间D. Sec

4、ondaryNameNode 应与 NameNode 部署到一个节点14.大数据的特点不包括下面哪一项D.A.巨大的数据量B.多结构化数据C.增长速度快D.价值密度高HBase测试题1. HBase来源于哪一项?C标准文案实用文档A The Google File SystemB MapReduceC BigTableD Chubby2 .下面对HBase的描述哪些是正确的?B、C DA不是开源的B是面向列的C是分布式的D是一种NoSQ改据库3 . HBase依靠存储底层数据AA HDFSB HadoopC MemoryD MapReduce4 . HBase依赖提供消息通信机制AA Zook

5、eeperB ChubbyC RPCD Socket5 . HBase依赖提供强大的计算水平DA ZookeeperB ChubbyC RPCD MapReduce6 . MapReduce与HBase的关系,哪些描述是正确的?B、CA两者不可或缺,MapReduceH HBase可以正常运行的保证B两者不是强关联关系,没有 MapReduce HBase可以正常运行C MapReduce可以直接访问 HBaseD它们之间没有任何关系7 .下面哪些选项正确描述了HBase的特性? A、B、C DA高可靠性B高性能C面向列D可伸缩8 .下面与Zookeeper类似的框架是? DA Protobu

6、f标准文案实用文档B JavaC KafkaD Chubby9 .下面与HDF睽似的框架是? CA NTFSB FAT32C GFSD EXT310 .下面哪些概念是 HBase框架中使用的? A、CA HDFSB GridFSC ZookeeperD EXT3第二局部:HBase核心知识点11 . LSM含义是? AA日志结构合并树B二叉树C平衡二叉树D基于日志结构的合并树12 .下面对LSM结构描述正确的选项是?A、CA顺序存储B直接写硬盘C需要将数据Flush到磁盘D是一种搜索平衡树13 . LSM更能保证哪种操作的性能?BA读B写C随机读D合并14 . LSM的读操作和写操作是独立的?

7、AA是.B否.C LSM并不区分读和写D LSM中读写是同一种操作15 . LSM结构的数据首先存储在.BA硬盘上标准文案实用文档B内存中C磁盘阵列中D闪存中16 HFile数据格式中的 Data字段用于.AA存储实际的 KeyValue数据B存储数据的起点C指定字段的长度D存储数据块的起点17 HFile 数据格式中的 Metalndex字段用于.DA Meta块的长度B Meta块的结束点C Meta块数据内容D Meta块的起始点18 HFile数据格式中的 Magic字段用于°AA存储随机数,预防数据损坏B存储数据的起点C存储数据块的起点D指定字段的长度19 HFile数据格

8、式中的 KeyValue数据格式,以下选项描述正确的选项是.A、DA是byte口数组B没有固定的结构C数据的大小是定长的D有固定的结构20 HFile 数据格式中的 KeyValue数据格式中 Value局部是.CA拥有复杂结构的字符串B字符串C二进制数据D压缩数据第三局部:HBase高级应用介绍31. HBase中的批量加载底层使用实现. AA MapReduceB HiveC CoprocessorD Bloom Filter32. HBase性能优化包含下面的哪些选项?A、B C、DA读优化B写优化C配置优化标准文案实用文档D JVM优化33. Rowkey设计的原那么,以下哪些选项的描

9、述是正确的?A、B、CA尽量保证越短越好B可以使用汉字C可以使用字符串D本身是无序的34. HBase构建二级索引的实现方式有哪些?A、BA MapReduceB CoprocessorC Bloom FilterD Filter35. 关于HBase二级索引的描述,哪些是正确的?A、BA核心是倒排表B二级索引概念是对应 Rowkey这个“一级索引C二级索引使用平衡二叉树D二级索引使用LSM吉构36. 以下关于Bloom Filter的描述正确的选项是? A、CA是一个很长的二进制向量和一系列随机映射函数B没有误算率C有一定的误算率D可以在 Bloom Filter中删除元素第四局部:HBas

10、e安装、部署、启动37. HBase官方版本可以安装在什么操作系统上?A、B、CA CentOSB UbuntuC RedHatD Windows38. HBase虚拟分布式模式需要个节点? AA 1B 2C 3D最少3个39. HBase分布式模式最好需要个节点? CA 1B 2C 3D最少标准文案实用文档关于hadoop的选择题1、Doug Cutting所创立的工程的名称都受到其家人的启发,以下工程不是由他 创立的工程是A. HadoopB. NutchC. LuceneD. Solr答案:D2、配置Hadoop时,JAVA_HOMfe含在哪一个配置文件中A. hadoop-defaul

11、t.xmlB. hadoop-env.shC. hadoop-site.xmlD. configuration.xsl答案:B知识点:hadoop配置3、Hadoop配置文件中,hadoop-site.xml 显示覆盖 hadoop-default.xml 里的内 容.在版本0.20中,hadoop-site.xml 被别离成三个 XMLt件,不包括A. conf-site.xmlB. mapred-site.xmlC. core-site.xmlD. hdfs-site.xml答案:A知识点:hadoop配置4、HDFSR认的当前工作目录是/user/$USER, fs.default.na

12、me的值需要在哪个配置文件内说明A. mapred-site.xmlB. core-site.xmlC. hdfs-site.xmlD.以上均不是答案:B知识点:hadoop配置5、关于Hadoop单机模式和伪分布式模式的说法,正确的选项是A. 两者都起守护进程,且守护进程运行在一台机器上B. 单机模式不使用HDFS但加载守护进程C. 两者都不与守护进程交互,预防复杂性D. 后者比前者增加了 HDFS俞入输出以及可检查内存使用情况答案:D知识点:hadoop配置6、以下关于Hadoop API的说法错误的选项是标准文案实用文档A. Hadoop的文件API不是通用的,只用于 HDFSfc件系统

13、B. Configuration类的默认实例化方法是以HDF繇统的资源配置为根底的C. FileStatus对象存储文件和目录的元数据D. FSDataInputStream 是 java.io.DataInputStream 的子类答案:A/HDFS 7、HDFS勺NameNod总责治理文件系统的命名空间,将所有的文件和文件夹的 元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件: A.日志B.命名空间镜像C.两者都是答案:C知识点:8、HDFS勺namenodef呆存了一个文件包括哪些数据块,分布在哪些数据节点上, 这些信息也存储在硬盘上.A.正确8 .错误答案:B知识点:在

14、系统启动的时候从数据节点收集而成的9 、 Secondary namenode就是namenod刘现问题时的备用节点A.正确B.错误答案:B知识点:它和元数据节点负责不同的事情.其主要功能就是周期性将元数据节点 的命名空间镜像文件和修改日志合并,以防日志文件过大.合并过后的命名空间镜像文件也在Secondary namenode呆存了一份,以防namenod吹败的时候,可 以恢复.10、出现在datanode的VERSIONt件格式中但不出现在 namenode的VERSION 文件格式中的是A. namespaceIDB. storageIDC. storageTypeD. layoutVe

15、rsion答案:B知识点:其他三项是公有的.layoutVersion 是一个负整数,保存了 HDFS的持 续化在硬盘上的数据结构的格式版本号;namespaceID是文件系统的唯一标识符, 是在文件系统初次格式化时生成的;storageType表示此文件夹中保存的是数据 节点的类型11、Client在HDFS±进行文件写入时,namenodet艮据文件大小和配置情况,返标准文案实用文档回局部datanode信息,谁负责将文件划分为多个 Block ,根据DataNode的地址 信息,按顺序写入到每一个DataNode块A. ClientB. NamenodeC. DatanodeD

16、. Secondary namenode答案:A知识点:HDFSC件写入12、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最 根本的存储单位是64M具有高容错、高可靠性、高可扩展性、高吞吐率等特征, 适合的读写任务是A. 一次写入,少次读写B.屡次写入,少次读写C. 一次写入,屡次读写D.屡次写入,屡次读写答案:C知识点:HDFS!性13、HDFS无法高效存储大量小文件,想让它能处理好小文件,比拟可行的改良 策略不包括A. 利用SequenceFile、MapFile、Har等方式归档小文件B. 多Master设计C. Block大小适当调小D. 调大namenode内存

17、或将文件系统元数据存到硬盘里答案:D知识点:HDFSI性14、关于HDFS勺文件写入,正确的选项是A. 支持多用户对同一文件的写操作B. 用户可以在文件任意位置进行修改C. 默认将文件块复制成三份存放D. 复制的文件块默认都存在同一机架上答案:C知识点:在HDFS勺一个文件中只有一个写入者,而且写操作只能在文件末尾完成,即只能执行追加操作.默认三份文件块两块在同一机架上, 另一份存放在其 他机架上.15、Hadoop fs中的-get和-put命令操作对象是A. 文件B. 目录C. 两者都是答案:C知识点:HDF阶令标准文案实用文档16、Namenod在启动时自动进入平安模式,在平安模式阶段,

18、说法错误的选项是A. 平安模式目的是在系统启动时检查各个 DataNode上数据块的有效性B. 根据策略对数据块进行必要的复制或删除C. 当数据块最小百分比数满足的最小副本数条件时,会自动退出平安模式D. 文件系统允许有修改答案:D知识点:HDFSe全模式/MapReduce17、MapReduce框架提供了一种序列化键/值对的方法,支持这种序列化的类能 够在Map和Reduce过程中充当键或值,以下说法错误的选项是A. 实现Writable接口的类是值B. 实现WritableComparable<T>接口的类可以是值或键C. Hadoop 的根本类型 Text 并不实现 Wri

19、tableComparable<T> 接口D. 键和值的数据类型可以超出 Hadoop自身支持的根本类型答案:C18、以下四个Hadoop预定义的Mapper实现类的描述错误的选项是A. IdentityMapper<K, V> 实现 Mapper<K, V, K, V> ,将输入直接映射到输出B. InverseMapper<K, V> 实现 Mapper<K, V, K, V> ,反转键/值对C. RegexMapper<K>实现 Mapper<K, Text, Text, LongWritable> ,为

20、每个常 规表达式的匹配项生成一个(match, 1)对D. TokenCountMapper<K>实现 Mapper<K, Text, Text, LongWritable> ,当输 入的值为分t时,生成(taken, 1)对答案:B知识点:InverseMapper<K, V> 实现 Mapper<K, V, V, K>19、以下关于HDF勃存储MapReduce并行切分和处理的数据做的设计,错误的A. FSDataInputStream 扩展了 DataInputStream 以支持随机读B. 为实现细粒度并行,输入分片(Input Spli

21、t) 应该越小越好C. 一台机器可能被指派从输入文件的任意位置开始处理一个分片D. 输入分片是一种记录的逻辑划分,而HDF激据块是对输入数据的物理分割答案:B知识点:每个分片不能太小,否那么启动与停止各个分片处理所需的开销将占很大 一局部执行时间20、针对每行数据内容为" Timestamp Url 的数据文件,在用JobConf对象conf 设置 conf.setlnputFormat(WhichlnputFormat.class) 来读取这个文件时, WhichlnputFormat应该为以下的A. TextlnputFormatB. KeyValueTextlnputForma

22、tC. SequenceFilelnputFormat标准文案实用文档D. NLineInputFormat答案:B知识点:四项主要的InputFormat类.KeyValueTextInputFormat以每行第一个分隔符为界,分隔符前为key,之后为value,默认制表符为t21、有关MapReduce!勺输入输出,说法错误的选项是A. 链接多个MapReducd乍业时,序列文件是首选格式B. FileInputFormat 中实现的getSplits() 可以把输入数据划分为分片,分片 数目和大小任意定义C. 想完全禁止输出,可以使用 NullOutputFormatD. 每个reduc

23、e需将它的输出写入自己的文件中,输出无需分片答案:B知识点:分片数目在 numSplits中限定,分片大小必须大于 mapred.min.size个字节,但小于文件系统的块22、Hadoop Streaming支持脚本语言编写简单 MapReduce®!序,以下是一个例bin/hadoop jar contrib/streaming/hadoop-0.20-streaming.jarinput input/filenameoutput outputmapper 'dosth.py 5 'file dosth.pyD mapred.reduce.tasks=123、以下

24、说法不正确的选项是A. Hadoop Streaming使用Unix中的流与程序交互B. Hadoop Streaming允许我们使用任何可执行脚本语言处理数据流C. 采用脚本语言时必须遵从 UNIX的标准输入STDIN并输出到STDOUTD. Reduce没有设定,上述命令运行会出现问题答案:D知识点:没有设定特殊的reducer ,默认使用IdentityReducer 24、在高阶数据处理中,往往无法把整个流程写在单个 MapReduc酢业中,以下 关于链接MapReducd乍业的说法,不正确的选项是A. Job和JobControl类可以治理非线性作业之间的依赖B. ChainMapp

25、er和ChainReducer类可以用来简化数据预处理和后处理的构成C.使用ChainReducer时,每个 mapper和reducer对象都有一个本地 JobConfD. ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能 好且平安性高答案:D知识点:ChainReducer.addMapper()方法中,值传递平安性高,引用传递性能高25、下面哪个程序负责HDFS数据存储.答案C datanode标准文案实用文档a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker

26、26. HDfS中的block默认保存几份?答案A默认3分a3份b2份c1份d不确定27. 以下哪个程序通常与NameNode在一个节点启动?答案 D a)SecondaryNameNodeb)DataNodec)TaskTrackerd)Jobtracker28. Hadoop 作者 答案 C Doug cutting a)Martin Fowler b)Kent Beck c)Doug cutting29. HDFS 默认 Block Size 答案:Ba)32MBb)64MBc)128MB 30、以下哪项通常是集群的最主要瓶颈:答案: C磁盘aCPUb网络c磁盘IOd内存31.关于Sec

27、ondaryNameNode哪项是正确的?答案 C a它是NameNode的热备b它对内存没有要求c它的目的是帮助NameNode合并编辑日志,减少 NameNode启动时间标准文案实用文档dSecondaryNameNode 应与 NameNode 部署到一个节点.多项选择题:1,以下哪项可以作为集群的治理?答案: ABD aPuppetbPdshcCloudera ManagerdZookeeper2,配置机架感知的下面哪项正确:答案 ABCa如果一个机架出问题,不会影响数据读写b写入数据的时候会写到不同机架的 DataNode中cMapReduce会根据机架获取离自己比拟近的网络数据3. Client端上传文件的时候以下哪项正确?答案 Ba数据经过NameNode传递给DataNodebClient 端将文件切分为Block ,依次上传cClient只上传数据到一台DataNode,然后由NameNode负责Block复制工4,以下哪个是Hadoop运

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论