




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA模拟习题(含参考答案)一、单选题(共40题,每题1分,共40分)1、Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DataNodeC、RegionServerD、ZooKeeper正确答案:C2、下列关于Flinkbarrier描述错误的是()A、barrier是Flink快照的核心B、barrier周期性的插入到数据流中,并作为数据流的一部分随之流动C、一个barrier将本周期快照的数据与下一周期快照的数据分隔开来D、在插入barrier的时候,会暂时阻断数据流正确答案:D3、下列关于SparkStreaming和Streaming比较说法不正确的是?A、SparkStreaming事件处理时延比Streaming更高B、SparkStreaming的吞吐量大约是Streaming的2-5倍C、Streaming的执行逻辑是即时启动,运行完后在回收D、SparkStreaming是一个微批处理框架,事件需要积累到一定量时才进行处理正确答案:C4、FusionInsightHDHBase默认使用什么作为其底层文件存储系统?A、HDFSB、HadoopC、MemoryD、MapReduce正确答案:A5、在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、为任务设置好运行环境C、分配ContainerD、启动Map或Reduce任务正确答案:A6、HBase中Region的物理存储单元是什么A、RegionB、ColumnFamilyC、ColumnD、Row正确答案:B7、Hive不适用于一下哪个场景A、数据汇总,例如每天,每周用户点击数,点击排行B、数据挖掘,例如用户行为分析,兴趣分区,区域展示C、非实时分析,例如日志分析,统计分析D、实时的在线数据分析正确答案:D8、关于Hive中普通表和外部表的描述不正确的是?A、默认创建普通表B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来C、删除普通表时,元数据和数据同时被删除D、删除外部表时,只删除外部表数据而不删除元数据正确答案:D9、Zookeeper的Scheme认证方式不包括以下哪项?A、worldB、digestC、authD、sasl正确答案:D10、Flume支持监控并传输目录下新增的文件,可实现数据传输,以上描述的是哪一类source?A、syslogsourceB、execsourceC、spoolingdirectorysourceD、httpsource正确答案:C11、关于FusionInsightManager中的Controller和NodeAgent,说法正确的是?A、Controller每隔3秒向NodeAgent发送心跳B、NodeAgent接受Costroller下发的命令,执行具体的动作C、每个节点都必须部署ControllerD、NodeAgent是开源增强的正确答案:B12、Flume用于收集数据,其传输的数据基本单位是?A、SplitB、BlockC、EventD、Packet正确答案:C13、下列哪条HDFS命令可用于检测数据块的完整性?A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1正确答案:A14、关于FusionInsightHD安装流程正确的是?A、安装Manager->执行preinstall->LLD工具进行配置->安装集群->安装后检查->安装后配置B、LLD工具进行配置->执行preinstall->安装Manager->安装集群->安装后检查->安装后配置C、安装Manager->LLD工具进行配置->执行preinstall->安装集群->安装后检查->安装后配置D、LLD工具进行配置->执行preinstall->安装集群->安装Manager->安装后检查->安装后配置正确答案:B15、FusionInsightHD的HBase中保存一张用户信息表meg_table,Rowkey为用户id,其中一列为用户昵称,现在按先后顺序往这列写入三个KeyValue:001:Li,001:Mary,001:LiLy,请问scan'meg_table',{VERSIONS=>2}会返回哪几条数据?A、001:LiB、001:LilyC、001:Li,001:Mary,001:LiLyD、001:Mary,001:LiLy正确答案:D16、下列哪个不是HBase读取数据流程中涉及的角色或服务?A、HDFSB、HMasterC、HRegionServerD、Zookeeper正确答案:B17、FusionInsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪?A、ZooKeeperB、HDFSC、MasterD、meta表正确答案:D18、FusionInsightHD系统审计日志不可用记录下面哪些操作?A、手动清除警告B、启停服务实例C、删除服务实例D、查询历史监控正确答案:D19、Spark是用以下哪种编程语言实现的?A、CB、C++C、JAVAD、Scalad正确答案:D20、为了保障流应用的快照存储的可靠性,快照主要存储在哪里?A、hdfs中B、本地文件系统中C、jobManager的内存中D、可靠性高的单机数据库中正确答案:A21、FusionInsightHD系统审计日志不可以记录下面哪些操作()A、删除服务实例B、启停服务实例C、手动清除告警D、查询历史监控正确答案:D22、YARN调度器分配资源的顺序,下面哪一个描述是正确的?A、任意机器->同机架->本地资源B、任意机器->本地资源->同机架C、本地资源->同机架->任意机器D、同机架->任意机器->本地资源正确答案:C23、HDFS中Namenode的主备仲裁,是由哪个组件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController正确答案:D24、以下哪个不属于Hadoop中MapReduce组件的特点?A、良好的拓展性B、高容错性C、易于编程D、实时计算正确答案:D25、FusionInsightHD系统中HBase元数据Metaregion路由信息保存在哪?A、Root表B、ZooKeeperC、HMasterD、Meta表正确答案:B26、FusionInsightHD产品中,关于Kafka的说法不正确的是?A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费正确答案:B27、下列选项中适合MapReduce的场景有?()A、离线计算B、实时交互计算C、迭代计算D、流式计算正确答案:A28、Hive不适用于以下哪个场景A、数据汇总,例如每天,每用户点击数,点击排行B、数据挖掘,例如用户行为分析,兴趣分析,区域展示C、实时在线数据分析D、非实时分析,例如日志分析,统计分析正确答案:C29、关于FusionInsightManager说法错误的是?A、NTPServer/Client负责集群内各节点的时钟同步B、通过FusionInsightManager可以对HDFS进行启停控制、配置参数C、FusionInsightManager所有维护操作只能通过WebUI来完成,没有提供Shell维护命令D、通过FusionInsightManager可以向导式安装集群,缩短集群部署时间正确答案:C30、FusionInsightManager用户权限管理不支持哪个配置?A、给用户组配置角色B、给用户配置角色C、给角色配置权限D、给用户组配置权限正确答案:D31、Hadoop中MapReduce组件擅长处理哪种场景的计算任务?A、迭代计算B、实时交互计算C、离线计算D、流式计算正确答案:C32、下列选项中无法通过大数据技术实现的是?A、运营分析B、信用评估C、商品推荐D、商业模式发现正确答案:D33、HBase中数据存储的文件格式是什么?A、HFileB、SequenceFileC、LogD、TXTfile正确答案:A34、下面关于ZKFC的说法错误的是?A、ZKFC(ZKFailoverController)作为一个Zookeeper集群的客户端,用来监控NameNode的状态信息B、ZKFC进程需要在NameNode的节点和Zookeeper的Leader节点中部署C、StandbyNameNode通过Zookeeper感知ActiveNameNode的状态,一旦ActiveNameNode宕机,StandbyNameNode就会执行升主操作D、HDFSNameNode的ZKFC连接到Zookeeper,把主机名等信息保存到Zookeeper中正确答案:B35、关于HBase的RegionSplit分裂流程的描述不正确的是()A、Split过程中该表会暂停服务B、Split为了减少Region中数据大小,从而将一个Region分裂成两个RegionC、Split过程中被分裂的Region会暂停服务D、Split过程中并没有真正的将文件分裂,仅仅是创建了引用文件正确答案:A36、Hadoop中哪个模块负责HDFS的数据存储?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker正确答案:B37、查看Kafka的某Topic的partition详细信息时,使用如下哪个命令?A、bin/kafka-topic.sh–createB、bin/kafka-topic.sh--deleteC、bin/kafka-topish--describeD、bin/kafka-topic.sh--list正确答案:C38、以下哪一项不属于创建Loader作业时必选项?A、类型B、优先级C、名称D、连接正确答案:B39、以下哪些选项属于FusionInsightSparkSQL的优点?A、支持数据插入、更新和删除B、长稳测试C、以上全都正确D、稳定和高性能E、SQL兼容性正确答案:C40、以下关于ZKFC的说法错误的是?A、ZKFC进程需在NameNode的节点和ZooKeeper的Leader节点中部署。B、ZKFC(ZKFailoverController)作为一个ZooKeeper集群的客户端,用来监控NameNode的状态信息C、StandbyNameNode通过ZooKeeper感知ActiveNameNode的状态。一旦ActiveNameNode宕机,StandbyNameNode就会执行升主操作。D、HDFSNameNode的ZKFC连接到ZooKeeper,把主机名等信息保存到ZooKeeper中正确答案:A二、多选题(共30题,每题1分,共30分)1、FusionInsightManager会定时备份哪些数据?A、NameNodeB、LDAPC、OMsD、DBService正确答案:ABCD2、Kafka消息传输保障通常有以下哪几种?()A、仅有一次(ExactlyOnce)B、最多一次(AtMostOnce)C、最多三次(AtMostThreeTimes)D、最少一次(AtLeaseOnce)正确答案:ABD3、Hadoop系统中YARN支持哪些资源类型的管理?A、内存B、CPUC、网络D、磁盘空间正确答案:AB4、下面关于Flink窗口的描述错误的是()?A、滑动窗口之间时间点存在重叠。B、滑动窗口之间时间点不存在重叠。C、滚动窗口在时间上是不重叠的。D、滚动窗口在时间上是重叠的。正确答案:BD5、HBase的主要特点有哪些?A、高可靠性B、高性能C、面向列D、可伸缩正确答案:ABCD6、下面哪些场景不是Flink组件擅长的?()A、批处理B、数据存储C、流处理D、迭代计算正确答案:BD7、Flume适用于以下哪些场景的数据收集?A、大量数据的定时数据采集B、本地数据数据采集C、Thrift/Avro/Syslog/Kafka等数据源上收集数据D、应用系统产生的日志采集正确答案:ABCD8、在华为FusionInsightHD中,下面哪些组件是Flink强依赖的?A、ZooKeeperB、YARNC、KafkaD、HDFS正确答案:ABD9、以下选项中,属于HDFS架构关键特性的是?()A、健壮机制B、多方式访问机制C、HA高可靠性D、元数据持久化机制正确答案:ABCD10、Hadoop的HBase主要特点有哪些?A、高可靠性B、高性能C、面向列D、可伸缩正确答案:ABCD11、以下对与Supervisor的描述正确的是A、Nimbus主备部署,解决Nimbus单点问题,支持主从热切换。B、Supervisor失效后能够自动恢复,并且不影响正在运行的业务。C、Worker失效后能够自动恢复,继续运行。D、集群内节点失效后在该节点上的任务会被重分配到其他正常节点。正确答案:ABCD12、StructuredStreamming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、AppendModeB、UpdateModeC、GeneralModeD、CompleteMode正确答案:ABD13、FusionInsightHD系统中使用Streaming客户端Shell命令提交了拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有?A、拓扑结构过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间B、Supervisor的slots资源被耗尽,拓扑提交上去后分不到slot去启动Worker进程C、拓扑业务存在逻辑错误,提交之后无法正常运行D、当数据量较大时,拓扑处理速度较慢正确答案:ABC14、下列关于Flink中TransFormation的说法正确的是?A、filter操作是对每个元素执行boolean函数B、keyBy是将源头数据按照key进行分组,以保证同一个key的源数据分到同样的组中C、可以通过windows设定时间窗口D、flatMap可以对文本进行切分正确答案:ABCD15、FusionInsightHD的HBase服务包含哪些进程?A、HMasterB、SlaveC、HRegionServerD、DataNode正确答案:AC16、大数据分析相关技术主要特征包括?A、基于海量数据为基础B、数据背后事件关联性分析C、机器学习,全量特征D、基于精确样本为基础正确答案:ABC17、以下选项中,属于HDFS架构关键特性的是?A、元数据持久化机制B、HA高可靠性C、健壮机制D、多方式访问机制正确答案:ABCD18、以下关于HBase中HMaster的功能描述哪些是正确的?A、负责建表/修改表/删除表B、负责RegionServer的负载均衡C、RegionServer失效后的Region迁移D、Region负载均衡,Region分裂以及分裂后的Region分配正确答案:ABCD19、Loader可以实现以下哪些转换规则?()多选A、拼接转换B、增量转换C、空值转换D、长整形时间转换正确答案:ACD20、在大数据时代,企业所面临的挑战有以下哪些?A、企业各部门间数据分散,相同数据在各部门内部存储格式不一致。B、数据结构多样化。C、数据存在噪音、缺失、存储类型不规范等问题,需要进行大量的数据预处理工作。D、竞争对手的技术进步。正确答案:ABCD21、FusionInsightManager与外部管理平台对接时,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog正确答案:AD22、以下关于华为大数据解决方案说法正确的是()A、Farmer是数据服务框架B、GaussDB是一款开源数据库产品C、FusionInsightManager是一个分布式系统管理框架,管理员可以通过多接入点操控分布式集群D、FusionInsightHD是基于开源大数据软件Hadoop的增强版本正确答案:ABCD23、FusionInsightHD数据高可靠性体现在以下哪些方面?()A、第三方备份系统集成B、关键数据掉电保护C、跨数据中心容灾D、硬盘热插拔正确答案:ABCD24、在FusionInsightHD中,Flink主要与以下哪些组件进行交互A、zookeeperB、HDFSC、KafkaD、Yarn正确答案:ABCD25、下面哪些是MapReduce的特点?A、易于编程B、实时计算C、良好的扩展性D、高容错性正确答案:ACD26、FusionInsightHD产品中,关于Kafka组件部署规划说法正确的是?A、Kafka的Producer发送消息时可以指定该消息被哪个Consumer消费B、在创建Topic时,副本数不得大于当前存活的Broker实例个数,否则创建Topic将会失败C、Kafka安装完成后就不能再配置数据存放目录了D、Kafka会将元数据信息存放到ZooKeeper上正确答案:BD27、以下关于FusionInsight网络安全可靠性,说法正确的有()A、网络平面隔离,避免管理与业务宽带抢占、互相干扰B、FusionInsight支持将网络划分为三级:集群业务平面、集群管理平面和集群外维护网络,彼此之间实施物理隔离C、阻止外部攻击者通过管理通道入侵实际业务数据D、避免业务平面的高负载阻塞集群管理通道正确答案:ABCD28、下列选项中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager正确答案:BCD29、下列选项中,哪些是MapReduce一定会有的过程A、MapB、PartitionC、CombineD、Reduce正确答案:AD30、YARN中,“从”节点负责以下哪些工作?()A、集群中所有资源的统一管理和分配B、监督Container的生命周期管理C、管理日志和不同应用程序用到的附属服务D、监控每个Container的资源使用(内存,CPU等)情况正确答案:BD三、判断题(共30题,每题1分,共30分)1、Flink程序的两个关键要素是stream数据和transformation算子。()A、正确B、错误正确答案:A2、使用Loader进行数据导入和导出时,必须经过Reduce阶段进行数据处理A、正确B、错误正确答案:A3、FusionInsightHD产品中,一个典型的Kafka集群包含若干Producer,若干Broker,若Consumer和一个Zookeeper集群。A、正确B、错误正确答案:A4、FusionInsightHD中Loader作业提交到Yarn后,作业不能手工停止。A、正确B、错误正确答案:B5、FusionInsight中Hive包含2个角色,HiveServer和MetaStore.A、正确B、错误正确答案:A6、HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在Zookeeper中。()A、正确B、错误正确答案:A7、在Flink中,checkpoint机制能够保证应用在运行过程中出现失败时,从某一个检查点恢复,在此过程中,流快照是根据数据流入顺序依次创建的。A、正确B、错误正确答案:A8、Loader的作业执行失败,则此作业运行过程中导入的数据不会被自动删除,必须手动删除。A、正确B、错误正确答案:B9、Kafka所有消息都会被持久化到硬盘中,同时Kafka通过对TopicPartition设置Replicetion来保障数据可靠。A、正确B、错误正确答案:A10、zookeeper所有节点都可以处理读请求。()A、正确B、错误正确答案:A11、FusionInsightHD系统中,HBase支持动态扩展列。()A、正确B、错误正确答案:A12、kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消息系统。()A、正确B、错误正确答案:A13、FusionInsightHD系统中,集群中其中一个Loader节点异常,其他服务没有异常的情况下,不会影响Loader服务功能的正常使用。A、正确B、错误正确答案:A14、HBase的数据文件HFile中一个KeyValue格式包含Key、Value、TimeStamp、KeyType等内容。A、正确B、错误正确答案:A15、Colocation(同分布)文件级的同分布实现文件的快速访问,避免了因数据搬迁带来的大量网络开销A、正确B、错误正确答案:A16、图形化的健康巡检工具FusionInsightTool由FusionCare和SysChecker两部分组成。A、正确B、错误正确答案:A17、如果YARN集群中只有De
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB63T 2398-2025 公务用车管理 使用及监管
- 湖南普通话学习考试课件
- 游戏成语竞赛
- 高校诚信教育讲座
- 工程顶账房买卖合同
- 商品房精装修合同
- 财务成本管理财务分析阅读题
- 婚礼车辆租赁合同书
- 农机设备租借合同协议书
- 永吉县电梯安全管理人员实操考题目加答案
- 2024年中国职工保险互助会陕西办事处招聘笔试真题
- 商业地产项目整体经营方案
- 2025年4月自考13887经济学原理中级押题及答案
- 2025广东广州市花都区恒悦房地产开发有限公司招聘项目用工人员16人笔试参考题库附带答案详解
- 琴行规章制度
- 医疗大数据平台的运营管理策略
- 医院内部控制岗位职责与流程优化
- 2025年中国石油钻采专用设备行业竞争格局及市场发展潜力预测报告
- 国企人力笔试题库及答案
- 公司事故隐患内部报告奖励制度
- (完整版)行政文员笔试题库及答案-打印版
评论
0/150
提交评论