版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA模拟考试题(含答案)一、单选题(共40题,每题1分,共40分)1、RDD有Transformation和Action算子,下列属于Action算子的是?A、saveAsTextFileB、reduceByKeyC、mapD、filter正确答案:A2、下面关于ZooKeeper描述错误的是()A、一条消息被一半以上的server接收,他将写入磁盘B、ZooKeeper的节点数必须是奇数个C、消息更新只有成功和失败,没有中间状态D、客户端发送的更新会按照他们发送的顺序被应用正确答案:B3、在规划FuskmlnsightHD集群时候,如果客户用于功能测试,对性能没有要求,节约成本的情况下,可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、4D、5正确答案:B4、FusionInsightHD部署时,同一集群内的Flumeserver节点建议至少部署几个?A、1B、2C、3D、4正确答案:B5、FusionlnsightHadoop集群中,在某节点上通过df-hT查询,看到的分区包含以下几个:/var/log/srv/BigData/srv/BigData/hadoop/data5/srv/BigData/solr/solrserver3/srv/BigData/dbdataom这些分区所对应磁盘最佳Raid级别的规划组合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1正确答案:B6、FusionlnsightHDManager界面Hive日志收集,那个选项不正确?A、可指定实例进行曰志收集,比如指定单独收集MetaStore的曰志B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志C、可指定节点IP进行曰志收集,例如仅下载某个IP的曰志D、可指定特定用户进行曰志收集,例如仅下载userA用户产生的曰志正确答案:D7、关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A、用于存储Kafka数据的磁盘配置(如磁盘数目、大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理,导致数据分配不均匀,使部分磁盘达到使用率上限D、Broker节点故障导致正确答案:D8、FusionInsightHD系统中,flume数据流在节点内不需要经过哪个组件?()A、sinkB、topicC、SourceD、Channel正确答案:B9、HDFS中的主备仲裁,是由哪个组件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient正确答案:A10、关于HBase中HFile的描述不正确的是?A、一个HFile属于一个RegionB、一个HFile包含多个列族的数据C、一个HFile包含多列数据D、一个HFile包含多行数据正确答案:B11、FusionInsightHD中loader从SFTP服务器导入文件时,不需要做编码转换和数据转换且速度最快的文件类型是以下哪项?()A、sequence_fileB、text_fileC、binary_fileD、graph_file正确答案:C12、关于FusionInsightHD中Loader作业描述正确的是?A、Loader将作业提交到Yarn执行后,如果此时Loader服务出现异常,则此作业执行失败。B、Loader将作业提交到Yarn执行后,如果某个Mapper任务执行失败,能够自动进行重试。C、Loader作业执行失败后将会产生垃圾数据,需要用户手动清除。D、Loader将一个作业提交至Yarn执行后,该作业执行完成前,不能再提交其他作业。正确答案:B13、Zookeeper在分布式应用中的主要作用不包括一下哪些选项?A、分配集群资源B、选举Master节点C、存储及群中服务器信息D、保证各节点上数据的一致性正确答案:A14、FusionInsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在HBaseshell中执行什么命令?A、use_permissionB、whoamiC、whoD、get_user正确答案:B15、Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A、客户端的文件数据经过NameNode传递给DataNodeB、客户端将文件划分为多个Block,根据datanode的地址信息,按顺序写入到每一个datanode中C、客户端根据datanode的地址信息,按顺序将整个文件写入每一个datanode中,然后由datanode将文件划分为多个blockD、客户端只上传数据到一个datanode,然后由namenode负责block复制正确答案:B16、YARN中默认的资源调度器是?()A、FIFO调度器B、容量调度器C、Fair调度器D、以上全不正确正确答案:B17、关于FusionlnsightHD中Loader作业描述正确的是?A、Loader将作业提交到Yam执行后,如果此时Loader服务异常,则此作业执行失败。B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后,该作业执行完成前,不能再提交其他作业正确答案:B18、Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DatanodeC、RegionServerD、Zookeeper正确答案:C19、HBase不适合哪些应用场景?()A、高吞吐率应用场景B、要求具有完全ACID特性的应用场景C、半结构化数据应用场景D、海量数据(TB、PB)应用场景正确答案:B20、HDFS的副本放置策略中,同一机架不同的服务器之间的距离是?()A、1B、3C、2D、4正确答案:C21、HBase中一个Region进行Split操作时,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、Compaction过程中D、HFile分开过程中正确答案:C22、关于HIVE的描述不正确的是?A、Hive最佳使用场景是大数据集的批处理作业B、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销C、Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转换为MapReduceHadoop集群上D、Hive可以实现在大规模数据集上实现低延迟快速的查询正确答案:D23、在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、启动Map或Reduce任务C、为任务设置好运行环境D、分配Container正确答案:A24、FusionInsightHD系统中HDFS的Block默认保存几份?A、3份B、2份C、1份D、不确定正确答案:A25、加载数据到Hive表,哪种方式不正确?A、直接将本地路径的文件load到Hive表中B、将HDFS上的文件load到Hive表中C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表正确答案:C26、kafka-clustermirroring工具可以实现以下那些功能?A、kafka集群数据同步方案B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对正确答案:A27、Spark组件中哪个选项不属于transformation操作?A、joinB、distinctC、reduceByKeyD、reduce正确答案:D28、当ZooKeeper集群的节点数为5节点时,请问集群的容灾能力和多少节点是等价的?()A、3B、4C、6D、以上说法都不对正确答案:C29、以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegionServer是Hbase的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移正确答案:B30、在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaster进程,()个RegionServer进程?A、2,2B、2,NC、3,ND、N,N正确答案:B31、FusionInsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?A、ZooKeeperB、HDFSC、HMasterD、RegionServer正确答案:C32、通过FusionInsightManager不能完成以下哪个操作?A、权限管理B、安装部署C、性能监控D、虚拟机分配正确答案:D33、以下哪类数据不属于半结构化数据?A、二维表B、HTMLC、JSOND、XML正确答案:A34、关于Hive建表基本操作,描述正确的是A、创建外部表时需要制定external关键字B、一旦表创建好,不可再修改列名C、一旦表建好,不可再增加新列D、一旦表建好,不可再修改表名正确答案:A35、Hive是基于hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是?()A、仅支持MapReduce计算引擎B、易用易编程C、可直接访问HDFS文件以及HBaseD、灵活方便的ETL(extract/transform/load)正确答案:A36、HBase的主Master是如何选举的?A、随机选取B、由RegionServer进行裁决C、通过Zookeeper进行裁决D、HMaster为双主模式,不需要进行裁决正确答案:C37、创建Loader作业时,可以在以下哪个步骤中设置Map数?A、转换B、基本信息C、输出D、输入设置正确答案:C38、HBase的最小存储单元是什么?A、RegionB、ColumnFamilyC、ColumnD、Cell正确答案:D39、关于DataSet,下列说法不正确的是?A、DataSet与RDD高度类似,性能比RDD好B、DataSet是一个由特定域的对象组成的强类型集合C、DataSet不需要反序列化就可以执行大部分操作D、DataSet执行sort,filter,shuffle等操作需要执行反序列化正确答案:D40、Loader中用于管理LoaderServer进程主备状态的模块是?A、JobManagerB、ResourceManagerC、JobSchedulerD、HAManager正确答案:D二、多选题(共30题,每题1分,共30分)1、FusionInsightManager可以对哪些项目进行健康检查?A、服务B、实例C、主机D、角色正确答案:ABCD2、以下关于Zookeeper的Leader选举说法正确的是?A、当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票B、Zookeeper选举leader时,需要半数以上的票数C、当实例数为8时,则成为leader节点需要5票,容灾能力为4D、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票正确答案:AB3、下面哪些关键词是Kafka的特点()。A、分布式B、支持消息随机读取C、消息持久化D、高吞吐正确答案:ACD4、以下关于HBase中HMaster的功能描述哪些是正确的?A、Region负载均衡,Region分裂以及分裂后的Region分配B、负责建表/修改表/删除表C、负责RegionServer的负载均衡D、RegionServer失效后的Region迁移正确答案:ABCD5、FusionInsightHD系统中Hive支持的存储格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile正确答案:BCD6、Zookeeper的关键特性包括以下哪些选项?()A、可靠性B、原子性C、最终一致性D、等待无关性正确答案:ABCD7、以下关于HBase的文件存储模块(HBaseFileStream,简称HFS)描述正确的有?A、应用在FusionInsightHD的上层应用B、HFS封装了HBase与HDFS的接口C、为上层应用提供文件的存储.读取.删除等功能D、HFS是HBase的独立模块正确答案:ABCD8、FusionInsightHD的HBase组件包含哪些进程A、HMasterB、DataNodeC、SlaveD、HRegionServer正确答案:AD9、YARN通过ResourceManager对集群资源进行管理,它的主要功能有?A、集群资源调度B、应用程序管理C、日志管理D、以上说法都不对正确答案:AB10、关于Flume,下列说话错误的是?()多选A、Source到Channel到Sink等进程内部有加密的必要B、Flume级联节点之间的数据传输支持加密C、Flume支持多级级联和多路复制D、Flume级联节点之间的数据传输不支持压缩正确答案:AD11、关于Flume,下列说法错误的是?A、Flume级联节点之间的数据传输支持加密B、Flume支持多级联和多路复用C、Source到Channel到Sink等进程内部有加密的必要D、Flume级联节点之间的数据传输不支持压缩正确答案:CD12、Zookeeper可以为FusionInsightHD中哪些组件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark正确答案:ABCD13、以下关于HBase存储模型的描述正确的是?()A、每一个KeyValue都拥有一个Qualifier标识B、同一个key值key关联多个valueC、KeyValue中拥有时间戳、类型等关键信息D、即使是key值相同,Qualifier也相同的多个KeyValue,也可能有多个,此时使用时间戳来区分正确答案:ABCD14、基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有?A、MRB、SparkC、HDFSD、HBase正确答案:CD15、kafka消息传输保障通常有以下哪几种?()A、最多三次(AtMostThreeTimes)B、仅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)正确答案:BCD16、以下关于Flink与其它组件交互说法正确的是?A、Flink任务的运行依赖Yarn来进行资源的调度管理B、Flink的checkpoint的实现依赖于ZookeeperC、Flink的可以将接收的组件发送给KafkaD、Flink在HDFS文件系统中读写数据正确答案:ABCD17、传统数据处理的性能瓶颈有?A、流式数据处理性能不足B、数据存储成本高C、批量数据处理缺失D、扩展能力有限正确答案:BD18、以下属于HiveSQL中DDL(数据定义语言)的是?A、删除表B、数据导入C、修改表D、建表正确答案:ACD19、FusionInsightHD系统中使用Streaming客户端Shell命令查看拓扑或者提交拓扑失败,以下哪些定位手段是正确的?A、查看客户端异常堆栈,判断是否客户端使用问题B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常C、查看Supervisor运行日志,判断是否Supervisor异常D、查看Worker运行日志正确答案:AB20、Spark有哪些特点?A、轻B、灵C、巧D、快正确答案:ABCD21、以下关于KafkaLogs中segmentfile的说法正确的有?A、使index元数据全部映射到menory,可以避免sementfile的index数据IO磁盘操作B、索引文件稀疏存储,可以大幅减低index文件元数据占用空间大小C、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储D、通过索引信息可以快速定位message正确答案:ABCD22、执行HBase数据读取业务时,需要读取哪几部分数据?A、HFileB、HLogC、MemStoreD、HMaster正确答案:AC23、MapReduce过程中,以下属于shuffle机制的是?()A、sort/mergeB、combineC、partitionD、copy正确答案:AD24、FusionInsightManager的主要功能有以下哪些?()A、安全管理B、数据集成C、服务治理D、系统管理正确答案:AD25、以下选项中,对华为FusionInsightHD系统中备用NameNode的作用描述准确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode启动时间D、备NameNode应与主NameNode部署到一个节点正确答案:AC26、FusionInsightHD平台中,哪些组件支持对表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS正确答案:BC27、HBase中包含的一些典型的Filter有哪些?A、KeyOnlyFilterB、FilterListC、RowFilterD、SingleColumnValueFilter正确答案:ABCD28、根据数据流如何在两个Transformation之间传输数据,数据流可以分为哪些类型?A、distributing流B、一对一流C、redistributing流D、一对多流正确答案:BD29、以下关于HBase中HregionServer的功能描述哪些是不正确的?A、管理所有的Region,Region可以在RegionServer之间迁移B、HBase的数据处理和计算单元C、RegionServer是HBase的数据服务进程,负责处理用户数据的读写请求D、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能正确答案:AD30、FusionInsightManager与外部平台对接时,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog正确答案:AD三、判断题(共30题,每题1分,共30分)1、Hadoop的NameNode用于存储文件系统的元数据。A、正确B、错误正确答案:A2、HBase的BloomFilter是用来过滤数据的A、正确B、错误正确答案:B3、Hive在load时是不检查数据是否符合schema的,hive遵循的是schemaonread(读时模式),只有在读的时候hive才检查,解析具体的数据字段schema。A、正确B、错误正确答案:A4、FLink采用checkpiont机制保障应用程序运行中的容错性A、正确B、错误正确答案:A5、如果FusionInsightHD集群节点数不足以使数据节点单独部署的情况下,可以采用管理节点&控制节点&数据节点合一部署方案,但性能会受限制。A、正确B、错误正确答案:A6、Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别()A、正确B、错误正确答案:A7、Flink与SparkStreaming类似,属于时间驱动型实时流系统。()A、正确B、错误正确答案:B8、SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。A、正确B、错误正确答案:B9、HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息,以此获取所读文件在DataNode中的位置。A、正确B、错误正确答案:A10、"Hive中"GroupBy"指的是通过一定的规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理。"A、正确B、错误正确答案:A11、Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供了javaAPI以便其他组件对接使用,在FusionInsight解决方案中,Kafka属于FusionInsightHD模块。A、正确B、错误正确答案:A12、华为FusionInsightHD系统中,对存储副本为3个的数据块,当有一个节点上该数据块丢失时,需要手动复制一个副本到该节点。(B)A、正确B、错误正确答案:B13、FusionInsightHD的Loader中,一个连接器只可以分配给一个作业使用A、正确B、错误正确答案:A14、Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中A、正确B、错误正确答案:A15、Zookeeper的增
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版土地使用权转让合同(商业用地)2篇
- 2025年度餐饮企业品牌形象设计与宣传推广合同6篇
- 2024租赁期间厂房转租管理的委托出租合同
- 2024年皮革原料购销合同范本
- 2025年度旅游度假精美合同协议范本(休闲度假版)3篇
- 2024年能源结构调整-充电桩施工建设及管理协议3篇
- 2024年苹果手机消费者维权服务合同范本3篇
- 2024年项目评估合作协议
- 2024年度倒插门女婿离婚后财产保全与执行协议3篇
- 2025年度网络安全防护解决方案调研委托合同集锦3篇
- (完整版)钢筋加工棚验算
- 安徽省合肥市庐阳区2023-2024学年三年级上学期期末数学试卷
- 概念方案模板
- 西南交大毕业设计-地铁车站主体结构设计
- 2024年山东传媒职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
- 江苏省南通市崇川区2023-2024学年三年级上学期期末语文试卷
- 华电行测题库及答案2024
- crtd植入术护理查房
- 扫雪铲冰安全教育培训
- 人教版三年级下册必读书目《中国古代寓言故事》
- 涉密内网分级保护设计方案
评论
0/150
提交评论