大数据HCIA考试题及参考答案_第1页
大数据HCIA考试题及参考答案_第2页
大数据HCIA考试题及参考答案_第3页
大数据HCIA考试题及参考答案_第4页
大数据HCIA考试题及参考答案_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据HCIA考试题及参考答案一、单选题(共41题,每题1分,共41分)1.下面关于ZKFC的说法错误的是?A、ZKFC(ZKFailoverController)作为一个Zookeeper集群的客户端,用来监控NameNode的状态信息B、ZKFC进程需要在NameNode的节点和Zookeeper的Leader节点中部署C、StandbyNameNode通过Zookeeper感知ActiveNameNode的状态,一旦ActiveNameNode宕机,StandbyNameNode就会执行升主操作D、HDFSNameNode的ZKFC连接到Zookeeper,把主机名等信息保存到Zookeeper中正确答案:B2.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表正确答案:A3.FusionlnsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager正确答案:D4.在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaster进程,()个RegionServer进程A、3,NB、N,NC、2,ND、2,2正确答案:C5.Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、applicationattemptC、jarD、application正确答案:D6.FusionInsightHD产品中,关于Kafka组件部署说法不正确的是?A、Kafka强依赖于ZooKeeper,安装Kafka必须安装ZooKeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色专门进行消息的消费正确答案:C7.以下哪些选项属于Hive的数据存储模型?A、以上全都正确B、表C、桶D、数据库E、分区正确答案:A8.FusionInsightManager对服务的管理操作,下面说法错误的是?A、可查看服务的当前状态B、可设置不常用的服务隐藏或显示C、可对服务进行启停重启操作D、可以添加和卸载服务正确答案:B9.关于Hive与传统数据仓库的对比,以下描述错误的是?A、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低B、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据仓库存储量会有上限C、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错,高可靠D、由于Hive基于大数据平台,所以查询效率比传统数据仓库快正确答案:D10.以下哪个不属于Hadoop中MapReduce组件的特点?A、实时计算B、易于编程C、良好的拓展性D、高容错性正确答案:A11.在Flink技术架构中,()是流处理和批处理的计算引擎A、StandaloneB、RuntimeC、DataStreamD、FlinkCore正确答案:B12.关于Hive中普通表和外部表的描述不正确的是?A、默认创建普通表B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来C、删除普通表时,元数据和数据同时被删除D、删除外部表时,只删除外部表数据而不删除元数据正确答案:D13.HBase中如果发生一个Region的Split,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、Compaction过程中D、HFile分开过程中正确答案:C14.在FusionInsightManager界面中,对loader的操作不包括下列哪个选项?()A、配置loader参数B、查看loader服务状态C、切换Loader主备节点D、启动loader实例正确答案:C15.下面关于ZooKeeper描述错误的是()A、一条消息被一半以上的server接收,他将写入磁盘B、ZooKeeper的节点数必须是奇数个C、消息更新只有成功和失败,没有中间状态D、客户端发送的更新会按照他们发送的顺序被应用正确答案:B16.FusionInsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?A、ZooKeeperB、HDFSC、HMasterD、RegionServer正确答案:C17.以下关于KafkaPartition偏移量的描述不正确的是?A、offset是一个String型字符串B、唯一标记一条消息C、每条消息在文件中的位置称为offset(偏移量)D、消费者通过(offset、partition、topic)跟踪记录正确答案:A18.FuskmlnsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案适合什么样的场景?A、30节点以下B、100节点以上C、100-200节点D、200节点以上正确答案:A19.fusioninsightmanager不能够管理哪个对象?A、sparkB、主机OSC、yarnD、HDFS正确答案:B20.在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaster进程,()个RegionServer进程?A、2,2B、2,NC、3,ND、N,N正确答案:B21.以下关于kafkapartition偏移量的描述不正确的是?()A、每条消息在文件中的位置称为offset(偏移量)B、唯一标记一条消息C、offset是一个String型字符串D、消费者通过(offset、partition、topic)跟踪记录正确答案:C22.Flink中的()接口用于流数据处理,()接口用于批处理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI正确答案:A23.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点()A、3B、2C、1D、4正确答案:B24.HDFS的NameNode节点主备状态管理及元数据文件合并分别由哪两个角色负责?A、ZKFC和备NameNodeB、主NameNode和备NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode正确答案:A25.以下关于Flink关键特性描述不正确的是?A、SparkStreaming与Flink相比,时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint实现了Flink的容错正确答案:A26.关于Hive与Hadoop其他组件的关系。以下描述错误的是?A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖正确答案:D27.在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作()A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveHQL任务D、以上全部正确正确答案:D28.HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?A、3B、4C、5D、6正确答案:C29.下列哪个HDFS命令可用于检测数据块的完整性?A、hdfsfsck/B、hdfsfsck/-deleteC、hdfsdfsadmin-reportD、hdfsbalancer-threshold1正确答案:A30.HBase不适合哪些应用场景?A、海量数据(TB、PB)应用场景B、高吞吐率应用场景C、要求具有完全ACID特性的应用场景D、半结构化数据应用场景正确答案:C31.以下关于Zookeeper关键特性中的原子性说法正确的是?A、集群中无论哪台服务器,对外展示的均是同一视图B、更新只能全部完成或失败,不会部分完成C、一条消息被一个server接收,将被所有server接收D、客户端发送的更新会按照他们被发送的顺序进行应用正确答案:B32.FusionInsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪?A、ZooKeeperB、HDFSC、MasterD、meta表正确答案:D33.硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制。默认情况下,一份文件,HDFS会存()份?A、2B、4C、3D、5正确答案:C34.FusionInsightHD系统中HDFS默认BlockSize是多少?A、32MB、64MC、128MD、256M正确答案:C35.在FusionInsightHD中,创建Loader作业的进行数据转换的正确步骤是()A、加载、转换、输出B、输入设置、转换、输出C、加载、转化、抽取D、抽取、转换、输出正确答案:B36.Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是?A、SinkB、ChannelSelectorC、InterceptorD、Channel正确答案:C37.Spark组件中哪个选项不属于transformation操作?A、joinB、distinctC、reduceByKeyD、reduce正确答案:D38.安装FusionInsightHD的Streaming组件Nimbus角色要求安装几个节点?A、4B、3C、2D、1正确答案:C39.关于FusionlnsightHD中Loader作业描述正确的是?A、Loader将作业提交到Yam执行后,如果此时Loader服务异常,则此作业执行失败。B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后,该作业执行完成前,不能再提交其他作业正确答案:B40.关于Hive建表基本操作,描述正确的是?A、创建外部表时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再增加新列D、一旦表创建好,不可再修改列名正确答案:A41.下列关于HBase的BloomFilter特性理解不正确的是?A、用来过滤数据B、用来优化随机读取的性能C、会增加存储的消耗D、可以准确判断某条数据不存在S正确答案:C二、多选题(共30题,每题1分,共30分)1.与开源Sqoop相比,Loader具有哪些增强特性?()多选A、高性能B、安全性C、高可靠D、图形化正确答案:ABCD2.Loader提供了哪些方式或接口实现作业管理?A、WebUIB、Linux命令行C、Rest接口D、JavaAPI正确答案:ABCD3.大数据时代的到来,依赖于以下哪些技术的提升?A、网络B、硬件设备制造C、云计算D、人工智能正确答案:ABCD4.Spark适用于以下哪些场景?A、实时流处理B、批处理C、图计算D、交互式查询正确答案:ABD5.以下哪些是Spark可以提供的功能?A、分布式文件系统B、流处理功能C、分布式内存计算引擎D、集群资源的统一调度正确答案:BC6.Hbase中的以下哪种场景会触发Flush操作?A、当Wals中的文件数量达到阈值时B、Region中MemStore的总大小,达到了预设的FlushSize阈值C、Hbase定期刷新Memstore,默认周期为1小时D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小正确答案:ABCD7.以下关于KafkaPartition说法正确的有?A、每个Partition都是有序且不可变的消息队列B、每个Partition在存储层面对应一个log文件C、Partition数量决定了每个Consumergroup中并发消费者的最大数量D、引入Partition机制,保证了Kafka的高吞吐能力正确答案:ABCD8.StructuredStreaming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、AppendModeD、GeneralMode正确答案:ABC9.Flink流式处理的数据源类型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files正确答案:ABCD10.以下关于KafkaPartition副本的特性描述正确的是?A、副本以分区为单位。每个分区都有各自的主副本的从副本B、Follower通过拉取的方式从Leader中同步数据C、主副本叫做Leader,从副本叫做FollowerD、消费者和生产者都是从Leader中读写数据,也可直接与Follower交互正确答案:ABC11.根据数据流如何在两个Transformation之间传输数据,数据流可以分为哪些类型?A、redistributing流B、distributing流C、一对多流D、一对一流正确答案:CD12.FusionInsightHDLoader可以将HDFS数据导出到以下哪些目标端?A、SFTP服务器B、FTP服务器C、Oracle数据库D、DB2数据库正确答案:ABCD13.以下哪些选项属于FusionInsightSparkSQL的优点。A、以上全都正确B、稳定和高性能C、SQL兼容性D、长稳测试E、支持数据插入,更新和删除正确答案:ABCDE14.在FusionInsightHD中,Flink主要与以下哪些组件进行交互?A、KafkaB、YARNC、ZookeeperD、HDFS正确答案:ABCD15.FusionInsightManager与外部管理平台对接时,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog正确答案:AD16.以下关于HBase中HregionServer的功能描述哪些是不正确的?A、管理所有的Region,Region可以在RegionServer之间迁移B、HBase的数据处理和计算单元C、RegionServer是HBase的数据服务进程,负责处理用户数据的读写请求D、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能正确答案:AD17.以下关于Zookeeper的leader选举说法正确的是A、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票B、当实例数为8时,则成为leader节点需要5票,容灾能力为4C、Zookeeper选举leader时,需要半数以上的票数D、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x+1票正确答案:CD18.ZKFC进程部署在hdfs中的以下那个节点上?A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不对正确答案:AB19.在Loader历史作业记录中,可以查看以下哪些内容?A、作业开始/运行时间B、作业状态C、错误行/文件数量D、脏数据连接正确答案:ABCD20.YARN通过ResourceManager对集群资源进行管理,它的主要功能有?A、集群资源调度B、应用程序管理C、日志管理D、以上说法都不对正确答案:AB21.kafka消息传输保障通常有以下哪几种?()A、最多三次(AtMostThreeTimes)B、仅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)正确答案:BCD22.HDFS联邦环境下,NameSpace(命名空间)包括以下哪些内容?A、目录B、文件C、块D、以上全不正确正确答案:ABC23.HBase中包含的一些典型的Filter有哪些?A、SingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter正确答案:ABCD24.以下关于FusionInsight多租户管理的描述正确的有()A、一站式管理租户资源,计算资源(CPU/内存/IO)、存储资源(HDFS)、服务资源(HBase…)B、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理C、基于容器机制的租户资源隔离,为租户SLA保驾护航D、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户、按需动态增删租户正确答案:ABCD25.下列关于HBase存储模型的描述正确的是A、同一个Key值可以关联多个ValueB、KeyValue中拥有时间戳,类型等关键信息C、即使是Key值相同,Qualifier也相同的多个KeyValue,也可能有多个,此时使用时间戳来区分D、每一个KeyValue都拥有一个Qualifier标识正确答案:ABCD26.在FusionInsightHD中,Flink主要与以下哪些组件进行交互A、zookeeperB、HDFSC、KafkaD、Yarn正确答案:ABCD27.在FusionInsight集群规划时,以下哪些集群命名是系统允许的?A、123FusionInsightB、FusionInsight-123C、FusionInsigh_123D、FusionInsight123正确答案:ACD28.FusionInsightHD集群中包含了多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase正确答案:BC29.FusionInsightHD支持哪些日志下载方式?(多选)A、下载已安装的所有组件的日志B、下载单个组件某个模块的日志C、下载指定主机的日志D、下载指定时间段的日志正确答案:ABCD30.在大数据时代,企业所面临的挑战有以下哪些?A、数据结构多样化。B、企业各部门间数据分散,相同数据在各部门内部存储格式不一致。C、竞争对手的技术进步。D、数据存在噪音、缺失、存储类型不规范等问题,需要进行大量的数据预处理工作。正确答案:ABCD三、判断题(共32题,每题1分,共32分)1.topology的处理逻辑都在bolt中。A、正确B、错误正确答案:A2.Zookeeper的增强特性包括在审计日志中添加ephemeralnode被删除的审计日志。()A、正确B、错误正确答案:A3.Flink适用于高并发处理数据、毫秒级时延的应用A、正确B、错误正确答案:A4.Kafka是一个高吞吐,分布式,基于发布订阅的消息系统,利用Kafka技术可在廉价PCServer上搭建起大规模消息系统。A、正确B、错误正确答案:A5.Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中A、正确B、错误正确答案:A6.kafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用于主动获取方式从kafka中获取消息。()A、正确B、错误正确答案:A7.FusionInsightHD的Loader中,一个连接器只可以分配给一个作业使用A、正确B、错误正确答案:A8.Flume的perties配置文件可以配置多个channel来传输数据。A、正确B、错误正确答案:A9.假设HDFS在写入数据时只存2份,那么在写入过程中,HDFSClient先将数据写入DataNodel,再将数据写入DataNode2.A、正确B、错误正确答案:B10.Spark是基于内存的计算引擎,所有Spark程序运行过程中的数据只能存储在内存中A、正确B、错误正确答案:B11.如果某些Containers的物理内存利用率超过了配置的内存阈值,但所有Containers的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的Containers仍可以继续运行。A、正确B、错误正确答案:A12.FusionInsightManager支持大规模集群的安装部署、监控、告警、用户管理、权限管理、审计、服务管理、健康检查、问题定位、升级和补丁。A、正确B、错误正确答案:A13.现在有3个机架,有一个文件需要存3份,其中副本1和副本2存放在与Client相同的机架且不同的服务器上,根据HDFS副本放置策略,副本3一定要存放在其他机架。A、正确B、错误正确答案:A14.Hadoop的NameNode用于存储文件系统的元数据。A、正确B、错误正确答案:A15.Solr创建Collection时,推荐选用路由算法为compositldRouter,那么该Collection可以拓展shard。A、正确B、错误正确答案:B16.FusionInsightHD集群安装成功后,不允许修改服务、角色和实例的配置。A、正确B、错误正确答案:B17.Flink只能部署在Local和Cluster,暂不支持其他部署()A、正确B、错误正确答案:B18.Flink与SparkStreaming类似,属于时间驱动型实时流系统。()A、正确B、错误正确答案:B19.FusionInsightManager界面上,当收到kafka擦盘容量不足警告,且该警告的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决此问题。(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论