2023年Hadoop试题试题库完整

上传人：调*** IP属地：江苏上传时间：2023-02-03 格式：DOC 页数：23 大小：49.50KB 积分：20 举报 版权申诉

已阅读5页，还剩18页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1．以下哪一项不属于Ｈaｄoop可以运营的模式＿__C__＿。A．单机（本地)模式B.伪分布式模式Ｃ.互联模式D.分布式模式2.Hadｏop的作者是下面哪一位__B_＿__。A.MａｒtinFowlerB.DｏuｇcuｔtingC.KentBｅckD.ＧｒａｃeHｏpper3.下列哪个程序通常与ＮameNode在同一个节点启动__D_＿＿。Ａ.TasｋTraｃkｅrＢ.DatａＮodeＣ.SｅconｄaryNａmｅNｏdeＤ．Jobtrackｅｒ４.HＤFS默认BlｏckSｉzｅ的大小是___B___。A．3２ＭBB.64ＭBC．１28ＭBD.256M5.下列哪项通常是集群的最重要瓶颈_＿__Ｃ__。A．ＣＰUＢ.网络C.磁盘IＯD.内存6．下列关于ＭapReduce说法不对的的是＿____Ｃ_。A．MａpRｅduce是一种计算框架B.MapRｅduｃe来源于ｇoｏgle的学术论文C.MａｐReduce程序只能用ｊａva语言编写D.ＭａｐReduce隐藏了并行计算的细节，方便使用８.HDFS是基于流数据模式访问和解决超大文献的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特性，适合的读写任务是＿_D____。A.一次写入,少次读B.多次写入，少次读C．多次写入,多次读D.一次写入,多次读９.HBａse依靠__A____存储底层数据。A.ＨDFSＢ.HａdoopＣ.MemoryD.ＭａpRedｕce１0.HBase依赖_＿_D___提供强大的计算能力。Ａ.ZookeeｐeｒB.CｈuｂｂyC.RPCD.ＭapReduce11.HBase依赖＿_＿A___提供消息通信机制Ａ.ZookeepｅrＢ.ChubbｙC.RPCD．Soｃket12.下面与HDＦS类似的框架是___Ｃ___＿?A.NTFSＢ.FAT32C.GFSD.EXT31３.关于SeｃondａryNameＮｏde下面哪项是对的的_＿＿C___。Ａ.它是NａmｅNoｄe的热备Ｂ．它对内存没有规定C．它的目的是帮助NameＮode合并编辑日记，减少ＮａmｅNodｅ启动时间D.SecondａryNａmeNoｄe应与NaｍeＮode部署到一个节点1４.大数据的特点不涉及下面哪一项___D___。Ａ．巨大的数据量B．多结构化数据C．增长速度快D．价值密度高HBasｅ测试题1.HBase来源于哪一项?CATheGoogｌeFｉleSyｓteｍBMaｐＲｅduceCBｉgTabｌeＤChｕｂby２．下面对HＢase的描述哪些是对的的?Ｂ、C、DA不是开源的B是面向列的C是分布式的D是一种ＮoＳQL数据库3．HＢasｅ依靠（)存储底层数据AＡHDＦSBHａｄooｐCＭemoryDMapRｅｄucｅ4．ＨBａｓe依赖()提供消息通信机制ＡAZｏoｋｅeperBＣhｕbbyCRＰCDSｏckｅt５.HＢａse依赖(）提供强大的计算能力DAZookｅeperBChｕbbｙＣRPCＤMapＲｅduce6.MaｐReduce与HBasｅ的关系，哪些描述是对的的?B、CA两者不可或缺,MapReduce是HBaｓe可以正常运营的保证B两者不是强关联关系，没有MapReducｅ,HBase可以正常运营ＣMapReduｃｅ可以直接访问HＢaseD它们之间没有任何关系7.下面哪些选项对的描述了HBase的特性？Ａ、B、C、ＤA高可靠性B高性能C面向列D可伸缩８．下面与Zｏoｋeepｅr类似的框架是？ＤAProtobufＢJavaCKafkaＤChubby9.下面与HＤFＳ类似的框架是?CＡNTFSＢFAT32CGＦSDEXＴ310.下面哪些概念是HBａsｅ框架中使用的?A、CAHDＦSBＧridFＳCZookｅepｅｒDEXT3第二部分：HBａｓe核心知识点11.LSM含义是?AA日记结构合并树B二叉树C平衡二叉树D基于日记结构的合并树1２.下面对LSM结构描述对的的是？A、CA顺序存储B直接写硬盘C需要将数据Flusｈ到磁盘D是一种搜索平衡树13.LSＭ更能保证哪种操作的性能？ＢA读B写C随机读Ｄ合并１4．LSM的读操作和写操作是独立的？AA是。B否。ＣＬSＭ并不区分读和写DLSM中读写是同一种操作1５.ＬＳM结构的数据一方面存储在（）。ＢＡ硬盘上B内存中C磁盘阵列中D闪存中16HFiｌe数据格式中的Datａ字段用于（)。AA存储实际的KeyVａlue数据Ｂ存储数据的起点C指定字段的长度D存储数据块的起点１７HＦｉle数据格式中的MetaIndeｘ字段用于（）。DAMeta块的长度BMeｔａ块的结束点CMeｔa块数据内容DMｅtａ块的起始点18HFile数据格式中的Maｇiｃ字段用于()。AA存储随机数，防止数据损坏B存储数据的起点C存储数据块的起点D指定字段的长度19HFilｅ数据格式中的KeyVaｌuｅ数据格式，下列选项描述对的的是（）。A、DA是byｔe[]数组B没有固定的结构C数据的大小是定长的D有固定的结构20ＨFile数据格式中的KeyValue数据格式中Vaｌue部分是(）。CA拥有复杂结构的字符串B字符串C二进制数据D压缩数据第三部分：HＢａse高级应用介绍31ＨBase中的批量加载底层使用()实现。ＡAMapRedｕcｅBHivｅＣＣoprocesｓｏrDBｌoomＦilter32.HBａsｅ性能优化包含下面的哪些选项?A、B、C、DA读优化B写优化C配置优化DＪVM优化３3．Roｗｋey设计的原则,下列哪些选项的描述是对的的？A、B、CA尽量保证越短越好B可以使用汉字C可以使用字符串D自身是无序的34.HBａse构建二级索引的实现方式有哪些？Ａ、BＡMapReduｃｅBCoprocessｏrＣＢloomＦilｔerＤFiｌtｅr３5.关于ＨBase二级索引的描述,哪些是对的的?Ａ、BA核心是倒排表B二级索引概念是相应Rowkｅy这个“一级”索引C二级索引使用平衡二叉树D二级索引使用LSM结构36．下列关于BlｏomFｉlter的描述对的的是？A、CＡ是一个很长的二进制向量和一系列随机映射函数B没有误算率C有一定的误算率D可以在BloｏｍＦiｌteｒ中删除元素第四部分:HBasｅ安装、部署、启动３7.HBase官方版本可以安装在什么操作系统上?A、Ｂ、ＣＡCeｎtOＳＢＵｂuntuCReｄＨaｔDWiｎdｏwｓ38.HBａse虚拟分布式模式需要（)个节点?AA１Ｂ2C３D最少3个39．HBasｅ分布式模式最佳需要（)个节点?CA１B2Ｃ3D最少关于hadoｏp的选择题1、DouｇCｕtting所创建的项目的名称都受到其家人的启发,以下项目不是由他创建的项目是A．HａｄoopB．NｕｔchC．LuceｎeD．Sｏｌr答案:Ｄ2、配置Hadooｐ时,JＡＶA_HOME包含在哪一个配置文献中Ａ.hadoop-defaｕlt．xmlB.hadｏop-eｎv．shC.hadｏoｐ-site．xｍlD．configuraｔioｎ．xsｌ答案：B知识点：hadoop配置３、Hadoop配置文献中,haｄｏｏp-sｉte.xml显示覆盖hａｄoop-deｆａuｌt.ｘｍl里的内容。在版本0．2０中，ｈaｄoop-site.xml被分离成三个ＸＭL文献,不涉及A．ｃonf-sｉte．xmlB．mａｐreｄ-ｓiｔｅ．xmlC.ｃore-sｉte.xmlD．hdfｓ-siｔe.xｍｌ答案:A知识点:hadooｐ配置4、ＨＤFS默认的当前工作目录是／usｅr/$ＵSER,fｓ．ｄeｆauｌｔ.ｎaｍe的值需要在哪个配置文献内说明A．ｍapreｄ-site．xｍｌB.ｃoｒｅ-sitｅ．xmlC.hdfs-ｓｉte.xmlD.以上均不是答案:Ｂ知识点：hadoop配置5、关于Ｈaｄoop单机模式和伪分布式模式的说法,对的的是A.两者都起守护进程,且守护进程运营在一台机器上B.单机模式不使用HＤFS，但加载守护进程C.两者都不与守护进程交互，避免复杂性Ｄ．后者比前者增长了ＨDFS输入输出以及可检查内存使用情况答案:D知识点：haｄoop配置6、下列关于HａdoopＡＰＩ的说法错误的是A．Ｈadoop的文献ＡPＩ不是通用的，只用于HＤFS文献系统B.Cｏnfiｇｕraｔion类的默认实例化方法是以HＤＦS系统的资源配置为基础的C.ＦilｅＳtａtus对象存储文献和目录的元数据D.ＦSDaｔaIｎｐuｔStream是jaｖａ．io.ＤatａInputSｔrｅaｍ的子类答案:A//HDFS7、HDFＳ的NameNoｄe负责管理文献系统的命名空间，将所有的文献和文献夹的元数据保存在一个文献系统树中，这些信息也会在硬盘上保存成以下文献：A．日记B.命名空间镜像C．两者都是答案:Ｃ知识点:8、HDFS的namｅｎodｅ保存了一个文献涉及哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。A.对的B.错误答案：B知识点:在系统启动的时候从数据节点收集而成的9、Sｅｃondａｒｙnaｍenoｄe就是ｎａmｅnｏdｅ出现问题时的备用节点A.对的B．错误答案：B知识点：它和元数据节点负责不同的事情。其重要功能就是周期性将元数据节点的命名空间镜像文献和修改日记合并，以防日记文献过大。合并过后的命名空间镜像文献也在Secoｎdａrynａmenode保存了一份，以防ｎamｅnode失败的时候，可以恢复。10、出现在dataｎode的ＶEＲＳION文献格式中但不出现在nａmｅｎode的ＶEＲSION文献格式中的是Ａ.ｎamespaceIDＢ.ｓtorａgｅIDC.storａgeTyｐeD．lａyoｕtVersioｎ答案:B知识点:其他三项是公有的。laｙoutVｅｒｓｉon是一个负整数,保存了HDＦS的连续化在硬盘上的数据结构的格式版本号;namesｐaceID是文献系统的唯一标记符，是在文献系统初次格式化时生成的；storageType表达此文献夹中保存的是数据节点的类型１1、Cliｅnt在HＤFＳ上进行文献写入时,nａmenode根据文献大小和配置情况，返回部分datａｎodｅ信息，谁负责将文献划分为多个Blｏck,根据ＤatａＮodｅ的地址信息，按顺序写入到每一个DataNoｄe块A．CｌiｅntＢ.NamｅnoｄeＣ．DatanｏdeD.Ｓｅcｏndarynａmenｏdｅ答案：A知识点：ＨDＦS文献写入１2、ＨDＦＳ的是基于流数据模式访问和解决超大文献的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高可扩展性、高吞吐率等特性，适合的读写任务是A．一次写入,少次读写Ｂ．多次写入,少次读写C.一次写入，多次读写Ｄ.多次写入，多次读写答案:Ｃ知识点：ＨDFS特性13、HDＦＳ无法高效存储大量小文献，想让它能解决好小文献，比较可行的改善策略不涉及A．运用SequenceＦｉle、ＭａｐFilｅ、Haｒ等方式归档小文献Ｂ．多Masｔer设计C．Block大小适当调小Ｄ.调大namenｏｄe内存或将文献系统元数据存到硬盘里答案：Ｄ知识点:ＨDFＳ特性14、关于HDFS的文献写入，对的的是Ａ．支持多用户对同一文献的写操作B.用户可以在文献任意位置进行修改C.默认将文献块复制成三份存放D．复制的文献块默认都存在同一机架上答案：C知识点：在HＤFS的一个文献中只有一个写入者，并且写操作只能在文献末尾完毕，即只能执行追加操作。默认三份文献块两块在同一机架上,另一份存放在其他机架上。1５、Ｈadｏoｐｆｓ中的-gｅt和-ｐut命令操作对象是A.文献B.目录Ｃ．两者都是答案：Ｃ知识点：ＨDFS命令１6、Namｅｎodｅ在启动时自动进入安全模式，在安全模式阶段,说法错误的是A．安全模式目的是在系统启动时检查各个DataNoｄe上数据块的有效性Ｂ.根据策略对数据块进行必要的复制或删除C．当数据块最小比例数满足的最小副本数条件时,会自动退出安全模式D.文献系统允许有修改答案:D知识点：HDFＳ安全模式//ＭapRedｕce17、MaｐReduｃe框架提供了一种序列化键/值对的方法，支持这种序列化的类可以在Map和Redｕce过程中充当键或值,以下说法错误的是A.实现Writａble接口的类是值B.实现WritableCｏmparable<T>接口的类可以是值或键C.Haｄoｏp的基本类型Ｔeｘt并不实现ＷritａbｌeComparablｅ<T>接口D.键和值的数据类型可以超过Haｄoop自身支持的基本类型答案:C１8、以下四个Haｄooｐ预定义的Mappeｒ实现类的描述错误的是A.IdenｔityMappeｒ<K,V>实现Mapper＜K,Ｖ,Ｋ,V>,将输入直接映射到输出Ｂ.ＩnｖersｅMａpper<K，Ｖ>实现Mappｅr＜Ｋ,Ｖ，K,V>，反转键／值对Ｃ.RegeｘMapper＜K>实现Ｍappｅr<K,Ｔexｔ，Text，ＬongＷrｉtable>,为每个常规表达式的匹配项生成一个(maｔch,1)对D.ＴoｋenCｏuntMappｅr<K＞实现Ｍapｐer<K，Teｘｔ,Teｘt,ＬｏnｇＷritable>，当输入的值为分词时，生成(ｔaken,1)对答案：B知识点：InveｒseMappｅr<Ｋ,V>实现Mapper＜K,V,V，K>１9、下列关于HDＦS为存储MapReduce并行切分和解决的数据做的设计,错误的是Ａ.ＦSＤataInpｕtStrｅaｍ扩展了DａtａInputStｒeam以支持随机读B．为实现细粒度并行，输入分片(InputSplｉt）应当越小越好Ｃ．一台机器也许被指派从输入文献的任意位置开始解决一个分片D．输入分片是一种记录的逻辑划分，而HDFS数据块是对输入数据的物理分割答案：Ｂ知识点：每个分片不能太小，否则启动与停止各个分片解决所需的开销将占很大一部分执行时间２0、针对每行数据内容为”TimestampUrl”的数据文献,在用JｏbConf对象ｃonｆ设立conｆ.sｅｔInpuｔFormａt(WhｉcｈＩnpuｔFormat.clａss）来读取这个文献时,WｈｉｃhInｐutＦormat应当为以下的A.TextInputFormａtB.KeｙValueTｅxtInpuｔFｏrmatＣ.SequenｃeFｉlｅInpｕtFｏrｍatD．NLｉneInｐｕtFoｒｍat答案：Ｂ知识点:四项重要的InｐutFｏrmat类。KeyValueＴextInpuｔFoｒmat以每行第一个分隔符为界，分隔符前为ｋey，之后为value,默认制表符为\ｔ21、有关MapReduｃｅ的输入输出,说法错误的是A.链接多个ＭapReduce作业时，序列文献是首选格式B.FiｌeＩnputFormａｔ中实现的getSｐlitｓ()可以把输入数据划分为分片,分片数目和大小任意定义Ｃ．想完全严禁输出,可以使用NullOutpuｔFormaｔD.每个reduce需将它的输出写入自己的文献中,输出无需分片答案：Ｂ知识点：分片数目在nｕmSplｉtｓ中限定,分片大小必须大于maprｅｄ.min.size个字节，但小于文献系统的块2２、ＨadｏｏpＳtrｅaｍing支持脚本语言编写简朴MapReｄuce程序，以下是一个例子:bin／ｈadooｐjａrｃontｒib/ｓtreａming/ｈadoop-0.20-streaming.ｊaｒ—ｉｎputiｎｐｕt/ｆiｌename—oｕtｐｕtoutｐuｔ—maｐper‘dostｈ.py5’—fｉlｅdosth.ｐy—Dmａprｅd.ｒedｕcｅ.ｔasks=１２３、以下说法不对的的是A.HadoopStreaming使用Ｕnix中的流与程序交互B.HadoopＳtrｅaｍiｎg允许我们使用任何可执行脚本语言解决数据流C．采用脚本语言时必须遵从UＮIＸ的标准输入STDＩN，并输出到STDOＵTD.Reduｃe没有设定，上述命令运营会出现问题答案:D知识点：没有设定特殊的ｒｅｄucer，默认使用IdentityＲeｄucer２４、在高阶数据解决中,往往无法把整个流程写在单个MapRｅｄuce作业中,下列关于链接ＭａpRedｕce作业的说法,不对的的是A．Joｂ和JobCｏnｔrol类可以管理非线性作业之间的依赖Ｂ．ChainMapｐer和ChainReducｅr类可以用来简化数据预解决和后解决的构成C.使用ChainRedｕｃer时，每个mａpper和rｅduceｒ对象都有一个本地JobＣｏnf对象D.CｈaiｎRｅduｃｅr.addMapｐer（)方法中,一般对键/值对发送设立成值传递,性能好且安全性高答案：D知识点:ChａinReducer.aｄｄMapｐｅr(）方法中，值传递安全性高,引用传递性能高25、下面哪个程序负责HＤFS数据存储。答案Cdatanodｅa）NameNodｅb)Jobtrａｃkｅrc）Dａtaｎoded）ｓｅcｏndaryNamｅNodee)taｓktrａcｋer2６.HDfS中的bｌoｃk默认保存几份？答案Ａ默认3分a)3份b)2份c）1份d）不拟定27．下列哪个程序通常与NameＮode在一个节点启动？答案Da)SecoｎdaｒｙNamｅＮｏdeb)DａtaＮodec)TａskＴrａckerｄ）Ｊｏｂｔrackeｒ28.Hadooｐ作者答案CDougcuttｉnga）MaｒtinＦｏwｌerb）KｅntBeckc）Dｏugcutting29.ＨDFS默认BlockＳize答案：Ba)32MBb）64MBc)128ＭＢ30、下列哪项通常是集群的最重要瓶颈:答案:Ｃ磁盘a）CPUb)网络c)磁盘IOd)内存31.关于ＳｅcondaryNameNｏde哪项是对的的？答案Ｃa)它是ＮamｅＮｏde的热备b）它对内存没有规定c)它的目的是帮助ＮaｍeNｏde合并编辑日记,减少NameＮｏｄｅ启动时间d)SｅcondaryＮａmｅNｏde应与NａｍeNode部署到一个节点。多选题:1.下列哪项可以作为集群的管理？答案：ＡBDａ)Puppｅｔb)Pdshc）ＣlouderａMaｎａgerd）Zｏokeeper２.配置机架感知的下面哪项对的:答案ＡBCa)假如一个机架出问题,不会影响数据读写b)写入数据的时候会写到不同机架的ＤataＮｏde中c)ＭapReｄucｅ会根据机架获取离自己比较近的网络数据3.Cliｅｎｔ端上传文献的时候下列哪项对的?答案Ba)数据通过ＮameNoｄe传递给ＤａｔaNodｅｂ)Clieｎｔ端将文献切分为Block,依次上传c）Clｉenｔ只上传数据到一台ＤatａNodｅ,然后由NａmｅNode负责Blｏｃk复制工作4.下列哪个是Ｈaｄoop运营的模式：答案ABＣa)单机版b)伪分布式ｃ）分布式5.Cloudeｒa提供哪几种安装CDH

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2023年Hadoop试题试题库完整

文档简介

温馨提示

最新文档

评论

2023年Hadoop试题试题库完整

文档简介

温馨提示

最新文档

评论

相关文档