![大数据HCIA模考试题与参考答案_第1页](http://file4.renrendoc.com/view6/M00/1D/02/wKhkGWesO_SAHKNxAADLr3xi1_Y759.jpg)
![大数据HCIA模考试题与参考答案_第2页](http://file4.renrendoc.com/view6/M00/1D/02/wKhkGWesO_SAHKNxAADLr3xi1_Y7592.jpg)
![大数据HCIA模考试题与参考答案_第3页](http://file4.renrendoc.com/view6/M00/1D/02/wKhkGWesO_SAHKNxAADLr3xi1_Y7593.jpg)
![大数据HCIA模考试题与参考答案_第4页](http://file4.renrendoc.com/view6/M00/1D/02/wKhkGWesO_SAHKNxAADLr3xi1_Y7594.jpg)
![大数据HCIA模考试题与参考答案_第5页](http://file4.renrendoc.com/view6/M00/1D/02/wKhkGWesO_SAHKNxAADLr3xi1_Y7595.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA模考试题与参考答案一、单选题(共41题,每题1分,共41分)1.FusionlnsightHD系统中HDFS的Block默认保存几份?A、3份B、2份C、1份D、不确定正确答案:A2.Hadoop的HBase不适合哪些数据类型的应用场景?A、大文件应用场景B、海量数据应用场景C、高吞吐率应用场景D、半结构化数据应用场景正确答案:A3.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点A、3B、2C、4D、1正确答案:B4.以下哪类数据不属于半结构化数据?A、JSONB、HTMLC、二维表D、XML正确答案:C5.创建loader作业中,可以在以下哪个步骤中设置过滤器类型?()A、转换B、输入设置C、输出D、基本信息正确答案:B6.FusionInsightHDHBase默认使用什么作为其底层文件存储系统?A、HDFSB、HadoopC、MemoryD、MapReduce正确答案:A7.下面关于Zookeeper特性的描述错误的是?()A、消息更新只能成功或者失败,没有中间状态。B、Zookeeper节点数必须为奇数个。C、一条消息要被超过半数的Server接收,它将可以成功写入磁盘D、客户端所发送的更新会按照它们被发送的顺序进行应用。正确答案:B8.查看Kafka某Topic的Partition详细信息时,使用如下哪个命令?A、bin/kafka-topics.sh--listB、bin/kafka-topics.sh--createC、bin/kafka-topics.sh–deleteD、bin/kafka-topics.sh--describe正确答案:D9.硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制。默认情况下,一份文件,HDFS会存()份?A、2B、4C、3D、5正确答案:C10.在规划FuskmlnsightHD集群时候,如果客户用于功能测试,对性能没有要求,节约成本的情况下,可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、4D、5正确答案:B11.KafkaClusterMirroring工具可以实现以下哪些功能?A、Kafka跨集群数据同步方案B、Kafka单集群内数据备份C、Kafka但集群内数据恢复D、以上全不正确正确答案:A12.Flink是流计算处理和批处理平台,()是数据批处理和流处理的核心引擎。()A、RuntimeB、DataStreamC、DataSetD、FlinkCore正确答案:A13.HDFS的副本存放策略中,同一机架不同服务器之间的距离是()A、2B、3C、1D、4正确答案:A14.传统数据处理的数据规模的单位是?A、TBB、EBC、PBD、GB正确答案:D15.在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?A、joinB、groupbyC、coalosceD、connect正确答案:A16.FusionInsightHD产品中,关于Kafka的说法不正确的是?A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费正确答案:B17.Spark应用在运行时,Stage划分的依据是哪个?A、taskSetB、actionC、shuffleD、task正确答案:C18.FusionInsightHD部署时,同一集群内的Flumeserver节点建议至少部署几个?A、1B、2C、3D、4正确答案:B19.HBase的底层数据以()的形式存在的?A、KeyValueB、行存储C、实时存储D、列存储正确答案:A20.关于Hive中普通表和外部表的描述不正确的是?A、默认创建普通表B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来C、删除普通表时,元数据和数据同时被删除D、删除外部表时,只删除外部表数据而不删除元数据正确答案:D21.Hadoop中MapReduce组件擅长处理哪种场景的计算任务?A、迭代计算B、流式计算C、实时交互计算D、离线计算正确答案:D22.当Zookeeper集群的节点数为5节点时,请问集群的容灾能力和多少节点是等价的?A、3B、4C、6D、以上都不是正确答案:C23.关于DataSet,下列说法不正确的是?()A、DataSet是一个由特定域的对象组成的强类型集合B、DataSet不需要反序列化就可执行大部分操作C、DataSet执行sort、filter、shuffle等操作需要进行反序列化D、DataSet与RDD高度类似,性能比RDD好正确答案:C24.FusionInsightHD使用HBase客户端批量写入10条数据,某个RegionServer节点上包含该表的2个Region,分别A和B,10条数据中有2条属于A,4条属于B,请问写入这10条数据需要向该RegionServer发送几次RPC请求?A、1B、2C、6D、10正确答案:A25.关于HBase的RegionSplit分裂流程的描述不正确的是()A、Split过程中该表会暂停服务B、Split为了减少Region中数据大小,从而将一个Region分裂成两个RegionC、Split过程中被分裂的Region会暂停服务D、Split过程中并没有真正的将文件分裂,仅仅是创建了引用文件正确答案:A26.Flume支持监控并传输目录下新增的文件,可实现准实时数据传输,以上描述的是哪一类source?A、spoolingdirectorysourceB、execsourceC、httpsourceD、syslogsource正确答案:A27.查看Kafka的某Topic的partition详细信息时,使用如下哪个命令?A、bin/kafka-topish--describeB、bin/kafka-topic.sh--deleteC、bin/kafka-topic.sh–createD、bin/kafka-topic.sh--list正确答案:A28.Spark自带的资源管理框架是?A、DockerB、MesosC、YARND、Standalone正确答案:D29.FusionInsightHDLoader作业运行前后,需要哪些节点与外部数据源通讯?A、Loader服务主节点B、运行Yarn服务作业的节点C、前面两个都需要D、前面两个都不需要正确答案:C30.关于FusionInsightHDStreaming的Supervisor描述正确的是?A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件正确答案:B31.YRAN的基于标签调度,是对下列选项中的哪个进行标签化?A、APPMasterB、ResourceManagerC、ContainerD、NodeManager正确答案:D32.以下关于Zookeeper关键特性中的原子性说法正确的是?A、集群中无论哪台服务器,对外展示的均是同一视图B、更新只能全部完成或失败,不会部分完成C、一条消息被一个server接收,将被所有server接收D、客户端发送的更新会按照他们被发送的顺序进行应用正确答案:B33.哪个模块是负责FusionInsightManager用户数据存储的?A、CASB、AOSC、KerberosD、LDAP正确答案:D34.FusionlnsightHadoop集群中,在某节点上通过df-hT查询,看到的分区包含以下几个:/var/log/srv/BigData/srv/BigData/hadoop/data5/srv/BigData/solr/solrserver3/srv/BigData/dbdataom这些分区所对应磁盘最佳Raid级别的规划组合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1正确答案:B35.FusionInsightHD集群组网设计中,有一种机架可以按照业务需求线性扩展,这种机架被称为()A、基本框B、扩展框C、管理框D、数据框正确答案:B36.创建Loader作业时,可以在以下哪个步骤中设置Map数?A、输入设置B、基本信息C、输出D、转换正确答案:C37.关于Hive建表基本操作,描述正确的是A、一旦表建好,不可再修改表名B、创建外部表时需要制定external关键字C、一旦表建好,不可再增加新列D、一旦表创建好,不可再修改列名正确答案:B38.FusionInsightHD系统审计日志不可以记录下面哪些操作?A、手动清除告警B、启停服务实例C、删除服务实例D、查询历史监控正确答案:D39.HBase中一个Region进行Split操作时,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、Compaction过程中D、HFile分开过程中正确答案:C40.Hadoop的HBase不适合哪些数据类型的应用场景?A、大文件应用场景B、海量数据应用场景C、高吞吐率应用场景D、半结构化数据应用场景正确答案:A41.以下关于KafkaPartition偏移量的描述不正确的是?A、唯一标记一条消息B、消费者通过(offset、partition、topic)跟踪记录C、offset是一个String型字符串D、每条消息在文件中的位置称为offset(偏移量)正确答案:C二、多选题(共30题,每题1分,共30分)1.Flink可以基于以下哪些窗口进行统计?A、时间窗口B、滑动窗口C、会话窗口D、countWindow正确答案:ABCD2.以下哪些属于FusionInsightHD的特点?A、开源B、易用C、安全D、可靠正确答案:ABCD3.执行HBase读数据业务,需要读取哪几部分数据?A、HFileB、HLogC、MemStoreD、HDFS正确答案:AC4.HBase中以下哪种场景会出发Flush操作?A、HBase定期刷新Memstore,默认周期为1小时B、当WALs中文件数量达到阈值时C、Region中MemStore的总大小,达到了预设的FlushSize阈值D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小正确答案:ABCD5.Hadoop通过ResourceManager对集群资源进行管理,它的主要功能有?A、应用程序管理B、集群资源调度C、集群资源管理D、日志管理正确答案:ABC6.对于容量调度器的任务选择,以下说法正确的是A、最大队列层级优先B、资源利用量最低的队列优先C、最小队列层级优先D、资源回收请求队列优先正确答案:BCD7.FusionInsightHD系统中使用Streaming客户端Shell命令提交了拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有?A、拓扑结构过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间B、Supervisor的slots资源被耗尽,拓扑提交上去后分不到slot去启动Worker进程C、拓扑业务存在逻辑错误,提交之后无法正常运行D、当数据量较大时,拓扑处理速度较慢正确答案:ABC8.Zookeeper可以为FusionInsightHD中哪些组件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark正确答案:ABCD9.大数据时代的到来,依赖于以下哪些技术的提升?A、云计算B、人工智能C、硬件设备制造D、网络正确答案:ABCD10.Spark适用于以下哪些场景?()A、图计算B、交互式查询C、实时流处理D、批处理正确答案:ABCD11.以下关于Zookeeper的Leader选举说法正确的是?A、当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票B、Zookeeper选举leader时,需要半数以上的票数C、当实例数为8时,则成为leader节点需要5票,容灾能力为4D、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票正确答案:AB12.以下选项中,属于HDFS架构关键特性的是?A、多方式访问机制B、健壮机制C、HA高可靠性D、元数据持久化机制正确答案:ABCD13.Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有()A、帮助用户迅速找到资源消耗最高的节点,采用适当的措施B、通过每个服务主页的资源分布查看界面,查看到关键的资源分布情况C、可以帮助用户快速聚集在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况。例如内存占有率在50-75%的主机列表,并提供链接跳转正确答案:ABCD14.传统数据处理的性能瓶颈有?A、数据存储成本高B、扩展能力有限C、流式数据处理性能不足D、批量数据处理缺失正确答案:ABCD15.Nimbus在Streaming架构中的功能包括?A、资源分配B、启动/关闭工作进程C、监控任务执行状态D、任务调度正确答案:AD16.StructuredStreaming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?A、CompleteModeB、UpdateModeC、AppendModeD、GeneralMode正确答案:ABC17.以下关于KafkaLogs中segmentfile的说法正确的有?A、通过索引信息可以快速定位messageB、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储C、使index元数据全部映射到memory,可以避免segmentfile的index数据IO磁盘操作D、索引文件稀疏存储,可以大幅度降低index文件元数据占用空间大小正确答案:ABCD18.FusionInsightHD的Loader在创建作业时,连接器有什么作用?A、确定有哪些转换步骤B、提供优化参数,提供数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接正确答案:ABCD19.若在消息处理过程中允许部分信息丢失,关闭消息可靠性处理机制的方式有以下哪些?A、将参数Config.Topology_ACKKRS设置为0B、将参数Config.Topology_ACKKRS设置为FalseC、Spout发送消息时,使用不指定消息messageID的接口进行发送D、Bolt发送消息时使用Unanchor方式发送正确答案:ACD20.HDFS不适用于以下哪些场景?A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入正确答案:BD21.HDFS系统中对备用NameNode的作用的描述正确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点正确答案:AC22.以下关于KafkaPartition说法正确的有?A、每个Partition都是有序且不可变的消息队列B、每个Partition在存储层面对应一个log文件C、Partition数量决定了每个Consumergroup中并发消费者的最大数量D、引入Partition机制,保证了Kafka的高吞吐能力正确答案:ABCD23.FusionInsightHD系统中使用Streaming客户端Shell命令查看拓扑或者提交拓扑失败,以下哪些定位手段是正确的?A、查看客户端异常堆栈,判断是否客户端使用问题B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常C、查看Supervisor运行日志,判断是否Supervisor异常D、查看Worker运行日志正确答案:AB24.在Loader历史作业记录中,可以查看以下哪些内容?A、错误行/文件数量B、脏数据连接C、作业开始/运行时间D、作业状态正确答案:ABCD25.以下哪些是Hive适用的场景?A、数据挖掘(用户行为分析,兴趣分区,区域展示)B、非实时分析(日志分析,统计分析)C、实时的在线数据分析D、数据汇总(每天/每周用户点击数,点击排行)正确答案:ABD26.FusionInsightManager的主要功能有以下哪些?A、安全管理B、数据集成C、服务治理D、系统管理正确答案:ACD27.FusionInsightHD产品中,关于Kafka组件部署规划说法正确的是?A、Kafka的Producer发送消息时可以指定该消息被哪个Consumer消费B、在创建Topic时,副本数不得大于当前存活的Broker实例个数,否则创建Topic将会失败C、Kafka安装完成后就不能再配置数据存放目录了D、Kafka会将元数据信息存放到ZooKeeper上正确答案:BD28.在Streaming的处理节点Bolt中,可以完成以下哪些操作()A、连接运算B、连接数据库C、过滤(filter)D、业务处理正确答案:ABCD29.以下关于FusionInsight多租户管理的描述正确的有?A、基于容器机制的租户资源隔离,为租户SLA保驾护航B、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户,按需动态增删租户C、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理D、一站式管理租户资源,计算资源(CPU/内存/IO),存储资源(HDFS),服务资源(HBase...)正确答案:ABCD30.以下关于HBase的文件存储模块(HBaseFileStream,简称HFS)描述正确的有?A、应用在FusionInsightHD的上层应用B、HFS封装了HBase与HDFS的接口C、为上层应用提供文件的存储.读取.删除等功能D、HFS是HBase的独立模块正确答案:ABCD三、判断题(共32题,每题1分,共32分)1.HBase中MOB数据直接HFile的格式存储在HDFS上,然后把这个文件的地址信息及大小信息作为value存储在管理HBase的store上,通过工具集中管理这些文件。这样就可以大大降低HBase的compation和split频率,提升性能。A、正确B、错误正确答案:A2.topology在任务完成后会自动结束运行。()A、正确B、错误正确答案:B3.Hive中“Groupby”指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理A、正确B、错误正确答案:A4.华为FusionInsight中,Hbase的表设计工具、连接池管理和增强的SDK,可以简化复杂表的业务开发。A、正确B、错误正确答案:A5.Flink采用checkpoint机制保障应用程序运行中的容错性。A、正确B、错误正确答案:A6.SparkOnYarn模式下的driver只能运行在客户端。A、正确B、错误正确答案:B7.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在Zookeeper中。()A、正确B、错误正确答案:A8.kafkalogssegment文件命名规则是partion全局的第一个segment从0开始,后续每个segment文件名为上一个全局partion的最大offset(偏移message数)。()A、正确B、错误正确答案:A9.如果某些Containers的物理内存利用率超过了配置的内存阈值,但所有Containers的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的Containers仍可以继续运行。A、正确B、错误正确答案:A10.Kafka中partitionreplication之间同步数据,从partition的leader复制数据到follower需要线程(replicationFetcherThread),Follower(一个follower相当于consumer)主动从leader批量拉取消息的,这极大提高了吞吐量。A、正确B、错误正确答案:A11.zookeeper的节点使用ACL控制访问策略,ACL可应用于集群中的任意中任一znode节点上。()A、正确B、错误正确答案:B12.Loader的作业执行失败,则此作业运行过程中导入的数据不会被删除,必须手动删除。A、正确B、错误正确答案:B13.Flume的tertises配置文件中可以配置多个channel来传输数据A、正确B、错误正确答案:A14.ResourecManager采用高可用方案,当ActiveResourceManager发现故障时,只能通过内置的Zookeeper来启动Standby的ResourceManager将其状态切换为Active。A、正确B、错误正确答案:B15.SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。A、正确B、错误正确答案:B16.华为在金融、公安、铁路、政务等多行业拥有丰富的大数据解决方案经验A、正确B、错误正确答案:A17.Flink采用checkpoint机制保障应用程序中的容错性。A、正确B、错误正确答案:A18.FusionInsightHD平台中,HBase暂不支持二级索引A、正确B、错误正确答案:B19."Hive中"GroupBy"指的是通过一定的规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理。"A、正确B、错误正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB37-T 4657-2023 智慧中药房建设基本要求
- 电商平台的产品生命周期管理
- 电商平台网络营销策略的制定与实施
- 我家社会科学基金项目申请书
- 电力设施的定期检查与维修记录管理
- 纪检委员申请书
- 2024-2025学年高中语文第四单元创造形象诗文有别第16课过小孤山大孤山课后课时作业含解析新人教版选修中国古代诗歌散文欣赏
- 2024-2025学年高中地理第二章环境污染与防治第一节水污染及其成因教案含解析新人教版选修6
- 2024-2025学年新教材高中地理课时素养评价十一探秘澜沧江-湄公河流域的河流地貌鲁教版必修1
- 士官党员转正申请书
- 康复科院感年度工作计划
- T-BJCC 1003-2024 首店、首发活动、首发中心界定标准
- 《海洋自然保护区》课件
- 2024年云南机场集团飞机维修服务分公司招聘笔试参考题库含答案解析
- 外科手术及护理常规
- 北师大版五年级数学下册教材分析解读课件完整版
- 苏少版小学一年级下册综合实践活动单元备课
- 学校开学教师安全培训
- 出口潜力分析报告
- 晋升的述职报告
- 微信视频号运营技巧攻略详解全套
评论
0/150
提交评论