




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
HCIA大数据3.0模拟试题及答案101.kafka集群在运行期间,直接依赖于下面那些组件A.Zookeeper(正确答案)B.HDFSC.SparkD.HBase102.在MRS服务中,关于创建Kafka的Topic中Kafka急群中Topic可以设置多个A.True(正确答案)B.False103.在fusionlnsight产品中,关于kafka的topic.以下描述不正确的是?A.topic的partition数量可以创建时配置B.每个topic只能被分成一个partition区(正确答案)C.每条发布到kafka的消息都有一个类别,这个类别被称为topic.也可以理解为一个存储消息的队列D.每个partition在存储层面对应一个log文件,log文件中记录了所有的消息数据104.查看kafka某Topic的Partition详细信息时,使用如下哪个命令?A.bin/kafka-topics.sh--createB.bin/kafka-topics.sh--listC.bin/kafka-topics.sh--describe(正确答案)D.bin/kafka-topics.sh–delete105.以下关于KafkaPartion偏移量的描述不正确的是?A.offset是一个String型字符串(正确答案)B.唯一标记一条消息C.每条消息在文件中的位置称为offset(偏移量)D.消费者通过(offset、partition、topic)跟踪记录106.为了提高kafka的容错性,kafka支持partition的复制策略,以下关于leaderpartition和Followerpartition的描述错误的是?A.一个kafka集群各个节点间不可能互为leader和flower(正确答案)B.如果leader失效,那么将会有其他Follower来接管(成为新的leader)C.由于leaderServer承载了全部的请求压力,因此从集群的整体考虑,kafka会将leader均横的分散在每个实例上,来确保整体的性能稳定D.Kafka针对partition的复制需要选出一个leader,由该leader负责partition的读写操作,其他的副本节点只是负责数据的同步107.以下关于KafkaPartition副本的特性描述正确的是?A.Follower通过拉取的方式从Leader中同步数据(正确答案)B.主副本叫做Leader,从副本叫做Follower(正确答案)C.消费者和生产者都是从Leader中读写数据,也可直接与Follower交互D.副本以分区为单位。每个分区都有各自的主副本的从副本(正确答案)108.Kafka是一个高吞吐,分布式,基于发布订阅的消息系统,利用Kafka技术可在廉价PCServer上搭建起大规模消息系统。A.TRUE(正确答案)B.FALSE109.FusionInsightHD产品中,一个典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一个Zookeeper集群A.True(正确答案)B.False110.Kafka中Partitionreplication之间同步数据,从Partition的Leader复制数据到Follower需要线程(ReplicaFetcherThread),实际上是复制Follower(一个Follower相当于consumer)主动从Leader批量拉取消息的,这极大提高了吞吐量。A.True(正确答案)B.False111.kafkalogssegment文件命名规则是partion全局的第一个segment从0开始,后续每个segment文件名为上一个全局partion的最大offset(偏移message数)。A.True(正确答案)B.False112.Kafka日志的清理方式有两种:delete和compact。默认值是deleteA.TRUE(正确答案)B.FALSE113.MRS服务中心,ZooKeeper服务不可用会导致Kafka服务不可用A.TRUE(正确答案)B.FALSE114.Kafka所有消息都会被持久化到硬盘中,同时Kafka通过对TopicPartition所在的LeaderBroker,用主动获取方式从Kafka中获取信息A.TRUE(正确答案)B.FALSE115.KafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用主动获取的方式从Kafka中获取消息?A.True(正确答案)B.false116.FusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个Consummer和一个zookeeper集群?A.True(正确答案)B.FALSE117.在Hive中,建表时可以指定桶的个数,数据可以根据桶的方式不同将不同数据放入不同桶中,分桶的好处是可以获得更好的查询处理效率,使得抽样更高效A.TRUE(正确答案)B.FALSE118.一下属于hiveSQL中DDL(数据定义语言)的是?A.建表(正确答案)B.修改表(正确答案)C.删除表(正确答案)D.数据导入119.加载数据到Hive表,哪种方式不正确?A.直接将本地路径的文件load到Hive表中B.将HDFS上的文件load到Hive表中C.Hive支持insertinto单条记录的方法,所以可以直接命令插入单条记录(正确答案)D.将其他表的结果集insertinto到Hive表120.Hive中哪些操作可以合并?A.UNIONALL(正确答案)B.JOIN(正确答案)C.SELECTD.GROUPBY(正确答案)121.Hive是基于hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是?A.仅支持MapReduce计算引擎(正确答案)B.易用易编程C.可直接访问HDFS文件以及HBaseD.灵活方便的ETL(extract/transform/load)122.Hive不适用于以下哪个场景?A.非实时分析,例如日志分析,统计分析B.数据挖掘,例如用户分析,兴趣分析,区域展示C.数据汇总,列如每天,每用户点击数,点击排行D.实时在线数据分析(正确答案)123.以下关于Hive的描述不正确的是?A.Hive可以实现在大规模数据集上实现低延迟快速的查询。(正确答案)B.Hive构建在基于静态批处理的Hadoop之上,Hadoop通常都有较高的延迟并且在作业提交和调度的时候需要大量的开销C.Hive的最佳使用场合是大数据集的批处理作业D.Hive查询操作过程严格遵守HadoopMapReduce的作业执行模型,Hive将用户的HiveQL语句通过解释器转为MapReduce作业提交到Hadoop集群上124.关于Hive与传统数据仓库的对比,以下描述错误的是?A.Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低B.Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据仓库存储量会有上限C.由于Hive的数据存储在HDFS中,所以可以保证数据的高容错,高可靠D.由于Hive基于大数据平台,所以查询效率比传统数据仓库快(正确答案)125.FusionInsight系统中Hive支持的存储格式包括?A.HFileB.TextFile(正确答案)C.SequenceFile(正确答案)D.RCFile(正确答案)126.关于Hive与Hadoop其他组件的关系,一下描述错误的是?A.Hive最终将数据存储在HDFS中(正确答案)B.Hive是Hadoop平台数据仓库工具C.HQL可以通过MapReduce执行任务D.Hive对HBase有强依赖127.关于Hive在FusionlnsightHD中的架构描述错误的是?A.只要有一个HiveServer不可用,整个Hive集群便不可用(正确答案)B.HiveServer负责接收客户端请求、解析、执行HQL命令并返回查询结果C.MetaStore用于提供原数据服务,依赖于DBServerD.在同一时间点HiveServeir只有一个处于Active状态,另一个则处于Standby状态128.在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作A.执行HiveDDL操作B.运行MapReduce任务C.运行HiveHQL任务D.以上全部正确(正确答案)129.以下哪些选项属于Hive的数据存储模型?A.以上全都正确(正确答案)B.表C.桶D.数据库E.分区130.关于Hive中普通表和外部表的描述不正确的是?A.默认创建普通表B.外部表实质是将已经存在HDFS上的文件路径跟表关联起来C.删除普通表时,元数据和数据同时被删除D.删除外部表时,只删除外部表数据而不删除元数据(正确答案)131.在Hive中,数据分区数量不是固定的A.TRUE(正确答案)B.FALSE132.以下关于HiveSQL基本操作描述正确的是A.加载数据到Hive时源数据必须是HDFS的一个路径B.创建外部表必须要指定location信息C.创建表时可以指定列分隔符(正确答案)D.创建外部表使用external关键字。创建普通表需要指定internal关键字133.Hive中的这条命令“ALTERTABLEemployee1ADDcolumns(column1string);”是什么含义?A.删除表B.增加列(正确答案)C.创建表D.修改文件格式134.Hive不支持超时重试机制A.TRUEB.FALSE(正确答案)135.Hive支持普通视图和物化视图A.TRUE(正确答案)B.FALSE136.Hive架构中Driver的作用是负责管理HiveQL执行的生命周期,并贯穿Hive任务整个执行期间A.TRUE(正确答案)B.FALSE137.FusionInsight中,HiveServer将用户提交的HQL语句进行编译,解析成对应的Yarn任务Spark任务或者HDFS操作,从而完成数据转换,分析A.TrueB.False(正确答案)138.Colocation(同分布)文件级的同分布实现文件的快速访问,避免了因数据搬迁带来的大量网络开销A.True(正确答案)B.False139.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsightHive中,可以指定表数据的输入和输出格式处理类。A.True(正确答案)B.False140.Hive在load时是不检查数据是否符合schema的,hive遵循的是schemaonread(读时模式),只有在读的时候hive才检查、解析具体的数据字段、schema。A.True(正确答案)B.False141.导入数据到Hive表时,不会检查数据合法性,只会要读取数据时候检查A.True(正确答案)B.False142.Hive中“Groupby”指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理A.True(正确答案)B.False143.Hive中“UNIONALL"操作符用于合并两个或多个SELECT语句的结果集,结果集中,不允许有重复的值()【判断】A.True(正确答案)B.False答案:A144.ElasticSearch的特点有哪些?A.ElasticSearch集群中的节点有主从之分(正确答案)B.ElasticSearch可以作为类似MySQL的关系型数据库进行使用(正确答案)C.ElasticSearch对ZooKeeper是有强依赖的(正确答案)D.ElasticSearch的索引数据并不是只能保顿在HDFS当中(正确答案)E.ElasticSearch的Discovery模块不存在单点故障的问(正确答案)F.EsNode是ElasticSearch中的节点145.ElasticSearch的shards索引分片可以把索引数据打散分布到不同的节点A.True(正确答案)B.False146.以下对ElasticSearch说法正
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 医用消毒设备电气安全与电磁兼容性考核试卷
- 城市配送与物流配送环节的全球物流网络考核试卷
- 密封用填料的耐臭氧性能探讨考核试卷
- 美甲店个体合作合同范本
- 水果新鲜采购合同范本
- 铁路雨季三防培训课件
- 土地流出合同范本
- 雪天交通安全课件
- 活动课安全课件
- 私密培训课件目录
- 学生因病休学申请书 因病休学一年后复学申请书(3篇)
- 2022年湖北省高中学业水平考试真题-音乐学科
- 提高屋面防水施工质量年QC成果
- 部编初中语文古诗词按作者分类梳理
- 博朗IRT6520中文说明书家用版
- 旅行社运营实务电子课件 1.1 初识旅行社
- 【读书如熬粥阅读答案】读书如熬粥阅读答案
- 少儿美术绘本教案课件-3-6岁 《西兰花先生的理发店》
- 保密管理工作课件
- 喷射井点降水方案
- 改革开放以来河南城市文化体制的改革
评论
0/150
提交评论