




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第页大数据HCIA复习测试附答案1.某银行规划的FusionlnsightHD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划()个。A、87B、85C、90D、86【正确答案】:B2.HDFS的Client写入文件时,数据的第一副本写入位置由NameNode确定,其他副本的写入位置由DataNode确定。A、对B、错【正确答案】:A3.下图展示了文件A、B、C、D的存放位置,其中文件A和B具有关联性,它们的存储位置符合Colocation同分布策略。A、TRUEB、FALSE【正确答案】:B4.在Flink的运行流程中,负责申请资源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正确答案】:B5.FusionlnsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在HBaseshell中执行什么命令?A、use_permissionB、whoamiC、whoD、get_user【正确答案】:B6.SparkOnYarn模式下的driver只能运行在客户端。A、对B、错【正确答案】:B7.hbase的底层数据以()的形式存在的?A、keyvalueB、列存储C、行存储D、实时存储【正确答案】:A8.FusionInsightManager对服务的配置功能说法不正确的是?A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效【正确答案】:C9.FusionInsightHD系统中,flume数据流在节点内不需要经过哪个组件?()A、sinkB、topicC、SourceD、Channel【正确答案】:B10.在Flink中,checkpoint机制能够保证应用在运行过程中出现失效时,从某一个检查点恢复,在此过程中,流快照是根据数据流入建立的A、TRUEB、FALSE【正确答案】:A11.Flink中的()接口用于流数据处理,()接口用于批处理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI【正确答案】:A12.FuskmlnsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案适合什么样的场景?A、30节点以下B、100节点以上C、100-200节点D、200节点以上【正确答案】:A13.YRAN的基于标签调度,是对下列选项中的哪个进行标签化?APPMasterB、ResourceManagerContainerD、NodeManager【正确答案】:D14.大数据需要传统行业思维的转变,要把数据收集,分析中作为业务流程的重要组成,数据端驱动业务流程优化,实现智能化和自动化,并依托数据资产实现跨界拓展A、正确B、错误【正确答案】:A15.关于Hive与Hadoop其他组件的关系。以下描述错误的是?A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖【正确答案】:D16.Flume的perties配置文件可以配置多个channel来传输数据。A、对B、错【正确答案】:A17.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A、用于存储Kafka数据的磁盘配置(如磁盘数目、大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理,导致数据分配不均匀,使部分磁盘达到使用率上限D、Broker节点故障导致【正确答案】:D18.Zookeeper的scheme认证方式不包含以下哪项?()A、saslB、authC、digestD、world【正确答案】:A19.在fusionlnsight产品中,关于kafka的topic.以下描述不正确的是?A、topic的partition数量可以创建时配置B、每个topic只能被分成一个partition区C、每条发布到kafka的消息都有一个类别,这个类别被称为topic.也可以理解为一个存储消息的队列D、每个partition在存储层面对应一个log文件,log文件中记录了所有的消息数据【正确答案】:B20.华为在金融、公安、铁路、政务等多行业拥有丰富的大数据解决方案经验A、对B、错【正确答案】:A21.HBase不适合哪些应用场景?()A、高吞吐率应用场景B、要求具有完全ACID特性的应用场景C、半结构化数据应用场景D、海量数据(TB、PB)应用场景【正确答案】:B22.二级索引为hbase提供了按照某些列的值进行索引的能力,二级索引先查索引表,再定位到数据表中的位置,不用全表扫描A、trueB、false【正确答案】:A23.下图为flume数据传输架构,图中“?”号处的组件是?()A、IntercepterB、ChannelprocessorChannelselectorD、以上全不正确【正确答案】:C24.在YARN的任务调度中,一旦ApplicationMaster申请到资源后,便与对应的ResourceManager通信,要求它启动任务A、TRUEB、FALSE【正确答案】:B25.FusionInsightSparkSQL同社区SparkJDBCServer一样,只支持单租户绑定到一个YARN资源队列多租户,并不支持多租户并行执行。A、TRUEB、FALSE【正确答案】:B26.下图为HDFS分级存储的配置,如果block的副本数为4,则以下说法错误的是?()A、4个block都将写入RAM_DISKB、如果是第1个副本之外的其它副本写入失败,则尝试写入“副本的备选存储策略”指定的存储类型C、第1个block副本将写入RAM_DISK,其余副本写入DISKD、如果第1个block副本写入RAM_DISK失败,则尝试写入“备选存储策略”指定的存储类型【正确答案】:A27.关于Hive建表的基本操作,描述正确的是?A、创建外部表的时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再增加新列【正确答案】:A28.在规划FuskmlnsightHD集群时候,如果客户用于功能测试,对性能没有要求,节约成本的情况下,可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、4D、5【正确答案】:B29.Flume的perties配置文件中可以配置多个Channel来传输数据?A、TRUEB、FALSE【正确答案】:A30.Spark是以下哪种编程语言实现的?A、CB、C++C、JAVAD、Scala【正确答案】:D31.Hadoop系统中YARN分配给Container的内存大小,可以通过参数yarn.app.mapreduce.am.resource.mb来设置A、对B、错【正确答案】:B32.在FusionInsight产品中,关于KafkaTopic,以下描述不正确的有?A、每个Topic只能被分成一个partition(区)B、Topic的partition数量可以在创建时配置C、每个Partition的存储层面对应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的消息都有一个类别,这个类别被称为Topic,也可以理解为一个存储消息的队列【正确答案】:A33.FusionInsightManger对外支持REST接口、SNMP接口、SYSLOG接口A、正确B、错误【正确答案】:A34.Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中()A、TRUEB、FALSE【正确答案】:A35.FusionInsightHD产品中,关于Kafka的说法不正确的是?A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费【正确答案】:B36.Flink的数据转换操作在以下哪个环节中完成?()A、soureB、TransformationC、SinkD、Channel【正确答案】:B37.Kafka集群中,Kafka服务端的角色是?A、ProducerB、ConsumerC、ZookeeperD、Broker【正确答案】:A38.关于HBase的RegionSplit分裂流程的描述不正确的是()A、Split过程中该表会暂停服务B、Split为了减少Region中数据大小,从而将一个Region分裂成两个RegionC、Split过程中被分裂的Region会暂停服务D、Split过程中并没有真正的将文件分裂,仅仅是创建了引用文件【正确答案】:A39.FusionInsightHD的Loader中,一个连接器只可以分配给一个作业使用A、对B、错【正确答案】:A40.下列哪个不是HBase读取数据流程中涉及的角色或服务?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer【正确答案】:C41.RDD有Transformation和Action算子,下列属于Action算子的是?()A、reduceByKeyB、filterC、mapD、saveAsTextFile【正确答案】:D42.FusionInsightHD系统审计日志不可以记录下面哪些操作()A、删除服务实例B、启停服务实例C、手动清除告警D、查询历史监控【正确答案】:D43.在FusionInsightManager界面中,对loader的操作不包括下列哪个选项?()A、切换Loader主备节点B、启动loader实例C、配置loader参数D、查看loader服务状态【正确答案】:A44.Hive在load时是不检查数据是否符合schema的,hive遵循的是schemaonread(读时模式),只有在读的时候hive才检查、解析具体的数据字段、schema。
()A、TRUEB、FALSE【正确答案】:A45.查看Kafka的某Topic的partition详细信息时,使用如下哪个命令?A、bin/kafka-topic.sh–createB、bin/kafka-topic.sh--listC、bin/kafka-topic.sh--describeD、bin/kafka-topic.sh--delete【正确答案】:C46.kafka集群在运行期间,直接依赖于下面那些组件?()A、ZookeeperB、HDFSC、SparkD、HBase【正确答案】:A47.HDFS的副本放置策略中,同一机架不同的服务器之间的距离是?()A、1B、3C、2D、4【正确答案】:C48.在Streaming中,消息可靠性级别中精确一次是通过ACK机制来实现的。A、TRUEB、FALSE【正确答案】:B49.FusionInsight中Hive包含2个角色,HiveServer和MetaStore.A、TRUEB、FALSE【正确答案】:A50.图形化的健康巡检工具FusionInsightTool由FusionCare和SysChecker两部分组成。A、trueB、false【正确答案】:A51.FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给角色配置权限C、给用户组配置角色D、给用户组配置权限【正确答案】:D52.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A、客户端的文件数据经过NameNode传递给DataNodeB、客户端将文件划分为多个Block,根据datanode的地址信息,按顺序写入到每一个datanode中C、客户端根据datanode的地址信息,按顺序将整个文件写入每一个datanode中,然后由datanode将文件划分为多个blockD、客户端只上传数据到一个datanode,然后由namenode负责block复制【正确答案】:B53.某用户需要搭建一个350节点的FusionlnsightHD集群,哪种规划方案最佳?A、管理节点、控制节点、数据节点合一部署,二层组网B、管理节点、控制节点合一部署、数据节点独立部署,二层组网C、管理节点、控制节点、数据节点都独立部署,三层组网D、管理节点、数据节点合一部署,控制节点独立部署,二层组网【正确答案】:C54.下列关于HBase的BloomFilter特性理解不正确的是?A、用来过滤数据B、用来优化随机读取的性能C、会增加存储的消耗D、可以准确判断某条数据不存在S【正确答案】:C55.FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给用户组配置权限C、给用户组配置角色D、给用户配置权限【正确答案】:B56.topology的处理逻辑都在bolt中。A、TRUEB、FALSE【正确答案】:A57.Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别()A、TRUEB、FALSE【正确答案】:A58.Hive不适用于以下哪个场景A、非实时分析,例如日志分析,统计分析B、数据挖掘,例如用户行为分析,兴趣分析,区域展示C、数据汇总,例如每天,每用户点击数,点击排行D、实时在线数据分析【正确答案】:D59.Hadoop的NameNode用于存储文件系统的元数据。A、正确B、错误【正确答案】:A60.驱动型Source是flume周期性主动去获取数据。()A、TRUEB、FALSE【正确答案】:B61.下列选项中适合MapReduce的场景有?()A、离线计算B、实时交互计算C、迭代计算D、流式计算【正确答案】:A62.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正确答案】:A63.以下关于Kafka的描述错误的有()A、用作活动流和运营数据处理管道的基础B、由ApacheHadoop开发,并于2011年开源C、具有信息持久化、高吞吐、实时等特性D、使用Scala、Java语言实现【正确答案】:B64.关于RDD,下列说法错误的是?A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘C、RDD是一个只读的,可分区的分布式数据集D、RDD是Spark对基础数据的抽象【正确答案】:B65.Channel支持事务,提供较弱的顺序保证,可以连接任何数量的Source和Sink
()A、TRUEB、FALSE【正确答案】:A66.FusionInsightHD部署Solr时,如果选择索引存放在本地磁盘,建议给每个
SolrServer实例(题目不全)A、正确B、错误【正确答案】:A67.Hadoop中哪个模块负责HDFS的数据存储?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker【正确答案】:B68.以下关于HiveSQL基本操作描述正确的是()A、加载数据到Hive时源数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建表时可以指定列分隔符D、创建外部表使用external关键字。创建普通表需要指定internal关键字【正确答案】:C69.FusionInsightHD管理节点提供双机HA机制,主节点故障后,主备节点需要手动实现Failover。A、正确B、错误【正确答案】:B70.Flink是一个批处理和流处理结合的计算框架,其核心是一个数据分类以及并行化计算的流数据处理引擎。()A、TRUEB、FALSE【正确答案】:A71.在FusionInsightHD系统,Loader作业运行过程中,如果产生脏数据,Loader作业执行结果的状态一定是失败。A、对B、错【正确答案】:B72.Flume的tertises配置文件中可以配置多个channel来传输数据A、TrueB、False【正确答案】:A73.FusionInsighttool是为技术支持工程师和维护工程师提供的一套健康检测工具,能够检查集群相关节点、服务的健康状态,提前发现集群中潜在的问题,并生成健康检查报告。方便技术支持工程师各维护工程师快速了解系统的健康状况。()A、TRUEB、FALSE【正确答案】:A74.Spark任务的每个stage可划分为job,划分的标记是shuffle。A、正确B、错误【正确答案】:B75.以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegionServer是Hbase的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移【正确答案】:B76.在Hive中,以下关于分区的描述不正确的是()A、分区下可再有分区或者桶B、数据表可以按照某个字段的值划分分区C、每个分区是一个目录D、分区数量是固定的【正确答案】:D77.Hadoop系统中,如果HDFS文件系统的备份因子是3,那么MapReduce每次运行Task都要从3个有副本的机器上传输需要处理的文件段。A、对B、错【正确答案】:B78.以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是?A、同时写入磁盘和内存B、先写磁盘再写内存C、仅写入内存D、先写内存再写磁盘【正确答案】:B79.Hbase中OpenScanner的过程,会创建两种不同的Scanner来读取HFile和MemStore的数据,HFile对应的Scanner为StoreFileScanner,MemStore对应的Scanner为MemStoreScanner。A、TRUEB、FALSE【正确答案】:A80.FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点小于200的集群场景。A、正确B、错误【正确答案】:A81.华为FusionInsightHD是国内首家符合国家金融等级保护的大数据平台,其安全性现在以下哪些方面?A、系统安全B、权限认证C、数据安全D、以上全都正确【正确答案】:D82.以下关于FusionInsightManager界面Hive日志收集的描述,哪个选项不正确?()A、可指定特定用户进行日志收集,例如仅下载UserA用户产生的日志。B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志。C、可指定实例进行日志收集,比如指定收集metstore的日志。D、可指定节点IP进行日志收集,例如仅下载某个IP的日志。【正确答案】:A83.关于Hive与传统数据仓库的对比,以下描述错误的是?A、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低B、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据仓库存储量会有上限C、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错,高可靠D、由于Hive基于大数据平台,所以查询效率比传统数据仓库快【正确答案】:D84.在MapReduce编程中,代码不仅要描述做什么,还要描述具体怎么做。()A、TRUEB、FALSE【正确答案】:B85.HDFS联邦机制下,各NameNode间元数据是不共享的。A、TRUEB、FALSE【正确答案】:A86.导入数据到Hive表时,不会检查数据合法性,只会要读取数据时候检查。A、TRUEB、FALSE【正确答案】:A87.kafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用于主动获取方式从kafka中获取消息。()A、TRUEB、FALSE【正确答案】:A88.Flink中的()接口用于流数据处理,()接口用于批处理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI【正确答案】:B89.Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供了javaAPI以便其他组件对接使用,在FusionInsight解决方案中,Kafka属于FusionInsightHD模块。A、TrueB、False【正确答案】:A90.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.stateD、yarn.scheduler.capacity.root.QueueA.maximum-capacity【正确答案】:D91.HDFS支持大文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。A、正确B、错误【正确答案】:B92.加载数据到Hive表,哪种方式不正确?A、直接将本地路径的文件load到Hive表中B、将HDFS上的额文件load到Hive表中C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表中【正确答案】:C93.FusionInsightHD系统中,HBase支持动态扩展列。()A、TRUEB、FALSE【正确答案】:A94.Flink中的checkpoint机制不断绘制流应用的快照,流应用的状态快照只能保存在HDFS文件系统中。A、对B、错【正确答案】:B95.Flume支持监控并传输目录下新增的文件,可实现数据传输,以上描述的是哪一类source?A、spoolingdirectorysourceB、httpsourceC、execsourceD、syslogsource【正确答案】:A96.关于HIVE的描述不正确的是?A、Hive最佳使用场景是大数据集的批处理作业B、Hive可以实现在大规模数据集上实现低延迟快速的查询C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销D、Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型,Hive将用户的HiveQL语句通过解释器转
换为MapReduceHadoop集群上【正确答案】:B97.HFS的出现解决了需要在HDFS中存储大量的小文件(10MB以下)。同时也要存储一些大文件(10MB以上)的混合的场景A、TRUEB、FALSE【正确答案】:B98.SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。A、TRUEB、FALSE【正确答案】:B99.
FusionInsightHD的Streaming对于Zookeeper弱依赖,即使Zookeeper故障,Streaming可以正常提供服务。A、对B、错【正确答案】:B100.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点A、3B、2C、4D、1【正确答案】:B101.下列选项中无法通过大数据技术实现的是?A、商业模式发现B、信用评估C、商品推荐D、运营分析【正确答案】:A102.FusionInsightHD系统审计日志不可用记录下面哪些操作?A、手动清除警告B、启停服务实例C、删除服务实例D、查询历史监控【正确答案】:D103.为了提高kafka的容错性,kafka支持partition的复制策略,以下关于leaderpartition和Followerpartition的描述错误的是?()A、一个kafka集群各个节点间不可能互为leader和flowerB、如果leader失效,那么将会有其他Follower来接管(成为新的leader)C、由于leaderServer承载了全部的请求压力,因此从集群的整体考虑,kafka会将
Leader均横的分散在每个实例上,来确保整体的性能稳定D、Kafka针对partition的复制需要选出一个leader,由该leader负责partition的读写操作,其他的副本节点只是负责数据的同步【正确答案】:A104.假设每个用户最低资源保障设置为yarn.scheduler.capacity.root.QueueA,minimum-user-limit-percent=24,则以上说法错误的是()A、第4个用户提交任务时,每个用户最多获得25%的资源B、第2个用户提交任务时,每个用户最多获得50%的资源C、第3个用户提交任务时,每个用户最多获得33.33%的资源D、第5个用户提交任务时,每个用户最多获得20%的资源【正确答案】:D105.Hive不支持超时重试机制。A、TRUEB、FALSE【正确答案】:B106.在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响性能。FusionInsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升性能?A、groupbyB、coalosceC、connectD、join【正确答案】:D107.FusionInsightManager界面上,当收到Kafka磁盘容量不足告警,且该告警的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决此问题A、对B、错【正确答案】:A108.下列选项中,关于Zookeeper可靠性含义说法正确的是?()A、可靠性通过主备部署莫属实现B、可靠性是指更新只能成功或者失败,没有中间状态C、可靠性是指无论哪个Server。对外展示的均是同一个视图D、可靠性是指一条消息被一个Server接收,它将被所有Server接受【正确答案】:D109.FusionInsightHD系统中,下面哪个方法不能查看到Loader作业执行的结果?A、通过Yarn任务管理查看B、通过LoaderUI界面查看C、通过Mangaer的告警查看D、通过NodeManager查看【正确答案】:D110.sparkStreaming容错机制是指RDD中任意的partition出错,都可以根据其父
RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。()A、TRUEB、FALSE【正确答案】:B111.FusionInsightHD中使用HBase进行数据读取服务时需要连接HMasterA、对B、错【正确答案】:B112.如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择以下哪种消息发布策略A、局部字段分组B、广播分组C、直接分组D、全局分组【正确答案】:C113.FusionlnsightHadoop集群中,在某节点上通过df-hT查询,看到的分区包含以下几个:
/var/log
/srv/BigData
/srv/BigData/hadoop/data5
/srv/BigData/solr/solrserver3
/srv/BigData/dbdataom
这些分区所对应磁盘最佳Raid级别的规划组合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1【正确答案】:B114.创建loader作业中,可以在以下哪个步骤中设置过滤器类型?()A、输入设置B、转换C、输出D、基本信息【正确答案】:A115.HDFS中的主备仲裁,是由哪个组件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正确答案】:A116.如图,以下关于kafka消息消费者Consumer读取消息的描述,错误的有?()A、图片中的蓝色为kafka的一个topic,即可以理解为队列,每个格子代表一条消息。B、生产者产生的消息逐条放到topic的末尾。C、消费者从右至左顺序读取消息。D、Consumer使用offset来记录读取的位置。【正确答案】:C117.HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息,以此获取所读文件在DataNode中的位置。A、对B、错【正确答案】:A118.HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?A、3B、4C、5D、6【正确答案】:C119.如果YARN集群中只有Default、QueueA和QueueB子队列,那么允许将他们的容量分别设置为60%、25%、22%。A、对B、错【正确答案】:B120.Mapreduce过程中,默认情况下,一个分片就是一个块,也是一个mapTask.A、trueB、false【正确答案】:A121.使用配置规划工具对FusionInsightHDV100R002C50集群进行规划时,可以用V100R2002C60版本的配置规划工具来规划。A、正确B、错误【正确答案】:B122.FusionInsightHD部署过程中,执行precheck检查每个节点时必须调用
CheckNode.Config配置文件。A、正确B、错误【正确答案】:A123.SparkStreaming相比Storm具备更高的实时性。A、对B、错【正确答案】:B124.在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaster进程,()个
RegionServer进程A、3,NB、N,NC、2,ND、2,2【正确答案】:C125.为了保障流应用的快照存储的可靠性,快照主要存储在哪里?A、jobManager的内存中B、可靠性高的单机数据库中C、本地文件系统中D、hdfs中【正确答案】:D126.Spark根据RDD的依赖关系来划分Stage,调度器从DAG图末端出发,逆向遍历整个依赖关系链,遇到窄依赖就断开,遇到宽依赖就将其加入当前Stage。A、TRUEB、FALSE【正确答案】:B127.Hive是基于hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是?()A、仅支持MapReduce计算引擎B、易用易编程C、可直接访问HDFS文件以及HBaseD、灵活方便的ETL(extract/transform/load)【正确答案】:A128.以下哪个不属于Hadoop中MapReduce组件的特点?A、易于编程B、良好的拓展性C、实时计算D、高容错性【正确答案】:C129.以下关于ZooKeeper关键特性中的原子性说法正确的是A、客户端发送的更新会按照他们被发送的顺序进行应用B、更新只能全部完成或失败,不会部分完成C、一条消息被一个server接收,将被所有server接收D、集群中无论哪台服务器,对外展示的均是同一视图【正确答案】:B130.HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置由DataNode确定。A、正确B、错误【正确答案】:A131.HBase中MOB数据直接HFile的格式存储在HDFS上,然后把这个文件的地址信息及大小信息作为value存储在管理HBase的store上,通过工具集中管理这些文件。这样就可以大大降低HBase的compation和split频率,提升性能。A、TRUEB、FALSE【正确答案】:A132.现有3个机架,有一个文件需要存3份,其中副本1和副本2存放在与client相同的机架且不同的服务器上。根据HDFS的副本放置策略一定要存放在其他机架。A、TRUEB、FALSE【正确答案】:B133.HBase中数据存储的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile【正确答案】:A134.SoIrCloud模式是集群模式,在此模式下Solr服务器强依赖于以下哪个服务?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正确答案】:C135.FusionInsightHD的Streaming是基于开源ApacheStorm开发的,Storm是一个分布式的离线计算框架。A、对B、错【正确答案】:B136.在FusionInsight产品中,关于创建Kafka的Topic,以下哪些描述是正确的?A、在创建Kafka的Topic时,必须设置Partition个数B、创建Kafka的Topic时,必须设置Partition副本个数C、设置多副本可以增强Kafka服务的容灾能力D、以上全都正确【正确答案】:C137.HDFS的NameNode节点主备状态管理及元数据文件合并分别由哪两个角色负责?A、ZKFC和备NameNodeB、主NameNode和备NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode【正确答案】:A138.容量调度器在尽行资源分配,现有同级的2个队列Q1和Q2,他们的容量均为30,其中Q1已使用8,Q2已使用14,则会优先将资源分配Q1。A、TrueB、False【正确答案】:A139.YARN调度器分配资源的顺序,下面哪一个描述是正确的?A、任意机器->同机架->本地资源B、任意机器->本地资源->同机架C、本地资源->同机架->任意机器D、同机架->任意机器->本地资源【正确答案】:C140.spark的核心模块是?A、sparkstreamingB、sparkcoreC、mapreduceD、sparksql【正确答案】:B141.FusionlnsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager【正确答案】:D142.FusionInsightHD平台中,HBase暂不支持二级索引A、对B、错【正确答案】:B143.Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正确答案】:D144.关于FusionlnsightManager中的Controller和NodeAgent,说法正确的是?A、Controller每陪3秒向NodeAgent发送心跳B、NodeAgent接受Contcolleir下发的命令,执行具体的动作C、每个节点都必须部署ControllerD、NodeAgent是幵源增强的【正确答案】:B145.在Flink中,checkpoint机制能够保证应用在运行过程中出现失败时,从某一个检查点恢复,在此过程中,流快照是根据数据流入顺序依次创建的。A、TrueB、False【正确答案】:A146.Flink是一个批处理和流处理结合的统一计算框架,其核心是一个数据分发以及并行化计算的流数据处理引擎。A、对B、错【正确答案】:A147.Kerberos只能对集群内的服务提供安全认证。A、正确B、错误【正确答案】:B148.Flink采用checkpoint机制保障应用程序运行中的容错性。A、TRUEB、FALSE【正确答案】:A149.关于Hive在FusionlnsightHD中的架构描述错误的是?A、只要有一个HiveServer不可用,整个Hive集群便不可用B、HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果C、MetaStore用于提供原数据服务,依赖于DBServerD、在同一时间点HiveServeir只有一个处于Active状态,另一个则处于Standby状态【正确答案】:A150.下图展示了StructuredStreaming的计算模型。通过观察可以得出最终T3的计算结果是
A、Dog1,owl1B、Cat2,dog4,owl2Cat2,dog3,owl1D、Cat1,cat1,dog2,dog2,owl2【正确答案】:B1.Nimbus在Streaming架构中的功能包括?A、监控任务执行状态B、任务调度C、启动/关闭工作进程D、资源分配【正确答案】:ABD2.Flink的兼容性体现在以下哪些方面?()A、能够与hadoop原有的mappers和reducers混合使用B、YARN能够作为Flink集群的资源调度管理器C、能够使用hadoop的格式化输入和输出D、能够从本地获取数据【正确答案】:ABCD3.FusionInsightManager与外部管理平台对接时,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正确答案】:AB4.HBase中包含的一些典型的Filter有哪些?A、ingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter【正确答案】:ABCD5.与开源sqoop相比,loader具有哪些增强特性?A、高可靠性B、高性能C、安全性D、图形化【正确答案】:ABCD6.在loader历史作业记录中,可以查看以下哪些内容?()A、作业状态B、作业开始/运行时间C、脏数据链接D、错误行/文件数量【正确答案】:ABCD7.YARN中,“从”节点负责以下哪些工作?()A、集群中所有资源的统一管理和分配B、监督Container的生命周期管理C、管理日志和不同应用程序用到的附属服务D、监控每个Container的资源使用(内存,CPU等)情况【正确答案】:BD8.Flume适用于以下哪些场景的数据收集?A、Thrift,Avro,Syslog,Kafka等数据源上收集数据B、本地文件数据采集C、应用系统产生的日志采集D、大量数据的实时数据采集【正确答案】:ABC9.HBase集群定时执行Compaction的目的是什么?A、减少同一Region,同一ColumnFamily下的文件数目B、提升数据读取性能C、减少同一ColumnFamily的文件数据D、减少同一Region的文件数目【正确答案】:ABD10.FusionInsightHD系统中Hive支持的存储格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正确答案】:BCD11.fusininsightHD平台中,那些组件支持对列表加密?A、HDFSB、FlinkC、hbaseD、hive【正确答案】:CD12.FusionlnsightHDLoader可以将HDFS数据导出到以下哪些目标端?A、SFTP服务器B、FTP服务器C、Oracle数据库DB2数据库【正确答案】:ABCD13.HDFS系统中对备用NameNode的作用的描述正确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点【正确答案】:AC14.kafka消息传输保障通常有以下哪几种?()A、最多三次(AtMostThreeTimes)B、仅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正确答案】:BCD15.以下关于华为大数据解决方案说法正确的是()A、Farmer是数据服务框架B、GaussDB是一款开源数据库产品C、FusionInsightManager是一个分布式系统管理框架,管理员可以通过多接入点操控分布式集群D、FusionInsightHD是基于开源大数据软件Hadoop的增强版本【正确答案】:ABCD16.下列关于Flink中Transformation的说法正确的是?A、可以通过window设定时间窗口B、Filtor操作是对每个元素执行boolean函数C、flatMap可以对文本进行切分D、eyBy是将源头数据按照key进行分组,以保证同一个key的元数据分到同样的组中【正确答案】:ABD17.HBase的数据文件HFile中一个KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType【正确答案】:ABCD18.Fusionlnsight系统中Hive支持的存储格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正确答案】:BCD19.FusionlnsightHadop集群中,就去哪规模有70个节点,如果采用推荐部署方案,在管理节点可能存在哪些分区?A、/srv/BigData/zookeeperB、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/BigData/jumalnodeE、/srv/BigData/hadoop/data5【正确答案】:ABCD20.下列选项中,哪些是MapReduce一定会有的过程?A、CombineB、MapC、ReduceD、Partition【正确答案】:BCD21.下列哪些组件必须依赖于Zookeeper才能运行?A、HDFSB、HBaseC、SparkD、YARN【正确答案】:ABD22.FusionInsightManager会定时备份哪些数据?A、NameNodeB、LDAPC、OMSDBService【正确答案】:BC23.Zookeeper中的数据节点znode分为哪几种类型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正确答案】:BD24.下列哪些措施是为了保障数据的完整性A、元数据可靠性保证B、重建失效数据盘的副本数据C、安全模式D、集群数据均衡【正确答案】:ABCD25.以下属于Streaming的特点的是?A、数据先存储在计算B、属于事件驱动C、延迟低D、可做连续查询【正确答案】:BCD26.以下关于Flink与其他组件交互说法正确的是?()A、Flink的checkpoint的实现依赖于ZookeeperB、Flink可以将接收的组件发生给kafkaC、Flink任务的运行依赖Yarn来进行资源的调度管理D、Flink在HDFS文件系统中读写数据【正确答案】:ABCD27.Loader可以实现以下哪些转换规则()A、空值转换B、拼接转换C、长整型时间转换D、增量转换【正确答案】:ABCD28.以下属于hiveSQL中DDL(数据定义语言)的是?()A、修改表B、删除表C、建表D、数据导入【正确答案】:ABC29.Flink支持的时间操作类型包括以下哪些选项?A、结束时间B、处理时间C、采集时间D、事件时间【正确答案】:BD30.安全模式下安装FusionlnsightHD集群时,哪些组件是必须安装的?、A、ZooKeeperB、LDAPServerC、KrbServerD、HDFS【正确答案】:BC31.以下关于KafkaLogs中segmentfile的说法正确的有?A、index元数据全部映射到menory,可以避免sementfile的index数据IO磁盘操作B、索引文件稀疏存储,可以大幅减低index文件元数据占用空间大小C、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储D、通过索引信息可以快速定位message【正确答案】:ABCD32.Spark适用于以下哪些场景?()A、图计算B、互式查询C、批处理D、实时流处理【正确答案】:ABCD33.关于Flume,下列说法错误的是?、A、Flume级联节点之间的数据传输支持加密B、Flume支持多级联和多路复用C、Source到Channel到Sink等进程内部有加密的必要D、Flume级联节点之间的数据传输不支持压缩【正确答案】:CD34.在FusionInsight产品中,关于Kafka组件说法正确的是?A、在创建Topic时,副本数不得大于当前存活的Broker实例个数,否则创建Topic将会失败B、Kafka的Producer发送消息时,可以指定该消息被哪个Consumer消费C、Kafka会将元数据信息存放到Zookeeper上D、Kafka安装完成后就不能再配置数据存放目录【正确答案】:ABCD35.在FusionInsight集群中,Spark主要与以下哪些组件进行交互?()A、HiveB、YARNC、HDFSD、Zookeeper【正确答案】:BCD36.执行Hbase数据业务(题干可能为读数据业务),需要读取哪几部分数据()A、HLogB、MenStoreC、HFileD、HMaster【正确答案】:BC37.下图展示了HDFS的标签存储策略,观察下图,HBase的数据会被存储到哪些数据节点上A、ataNodeAB、ataNodeBC、ataNodeED、ataNodeF【正确答案】:AB38.下列选项中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正确答案】:BCD39.FusionInsightHD数据高可靠性体现在以下哪些方面?()A、跨数据中心容灾B、关键数据掉电保护C、硬盘热插拔D、第三方备份系统集成【正确答案】:ABCD40.ZKFC进程部署在hdfs中的以下那个节点上?A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不对【正确答案】:AB41.大数据分析相关技术主要特征有哪些?A、机器学习,全量特征B、数据背后事件关联性分析C、以海量数据为基础D、以精确样本为基础【正确答案】:ABC42.Zookeeper的关键特性包括以下哪些选项?()A、原子性B、最终一致性C、等待无关性D、可靠性【正确答案】:ABCD43.FusionInsightHD的Loader在创建作业时,连接器有什么作用?A、确定有哪些转换步骤B、提供优化参数,提供数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接【正确答案】:ABCD44.FuskmlnsightHD集群中,集群规模现有300个节点,如果采用推荐部署方案,控制节点上一定不会存在哪些分区?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正确答案】:BE45.采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用以下哪种Channel类型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正确答案】:BC46.HDFS不适用于以下哪些场景?A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入【正确答案】:BD47.HBase集群定时执行Compaction的目的是什么?(ACD)[]A、减少同一个Region同一个ColumnFamily下的文件数目B、减少同一个Region的文件数目C、提升数据读取性能D、提升数据写入能力【正确答案】:ACD48.Zookeeper可以为FusionInsightHD中哪些组件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正确答案】:ABCD49.FusionlnsightHDLLD配置规划工具可以生成哪些配置文件?A、监控告警阈值配置文件B、集群的安装模板文件C、HDFS和YARN的配置文件D、执行Precheck所需要的配晋文件CheckNodes.Config【正确答案】:BD50.FusionInsight家族包含下列哪些子产品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正确答案】:ABCDE51.YARN通过ResourceManager对集群资源进行管理,它的主要功能有?A、集群资源调度B、应用程序管理C、日志管理D、以上说法都不对【正确答案】:AB52.以下哪些是Kafka实际的应用场景A、日志收集B、网站活性跟踪C、资源管理D、聚合统计系统运营数据【正确答案】:BD53.在Kafka中,如下关于Producer发送数据的说法错误的是()A、Proucer负责生产数据。Consumer负责消费数据。Producer和Consumer之间需要建立连接B、Proucer既可以发送数据到Broker上。又可以发送数据到ConsumerC、Proucer作为消息生产者。可以直接将数据写入ZookeeperD、Proucer连接任意一个正常的Broker实例就可以产生数据【正确答案】:ABC54.FusionlnsightHD产品在部署Kerberos和LDAP服务是,以下描述正确的是?(多选)A、部署Kerberos服务之前,必须先部署LDAP服务B、LDAP服务必须和Kerberos服务部署在同一个节点C、Kerberos服务和LDAP服务部署同一个节点利于数据访问,有助于性能提升D、LDAP服务可以多个集群共享【正确答案】:AC55.华为大数据产品FusionInsightHD中的Streaming具有哪些关键特性?()A、灵活性B、可伸缩性C、容灾能力D、消息可靠性【正确答案】:ABCD56.FusionInsightHD平台中,哪些组件支持对表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正确答案】:BC57.传统数据处理的性能瓶颈有?A、数据存储成本高B、流式数据处理性能不足C、扩展能力有限D、批量数据处理缺失【正确答案】:AC58.在华为大数据解决方案中,hadoop底层包含以下那些组件?A、finkB、hiveC、minerD、spark【正确答案】:ABD59.FusionInsight家族包含下列哪些子产品()?A、FusionInsightMinerB、FusionInsightFarmerC、FusionInsightHDD、GaussDB200【正确答案】:ABCD60.从生命周期来看,数据主要经历哪几个阶段?A、数据采集B、数据存储C、数据管理D、数据分析E、数据呈现【正确答案】:ABCD61.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、数据集成C、系统管理D、服务治理【正确答案】:AC62.Flume进程级联时,以下哪些sink类型用于接收上一跳Flume发送过来的消息?AvrosinkB、ThriftsinkC、HivesinkD、Nullsink【正确答案】:AB63.NodeManager的内存和CPU的数量,是通过下列哪些选项进行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正确答案】:BCD64.FusionInsightHD系统中使用Streaming客户端shell命令提交了拓扑之后,使用StromUI查看发现该拓扑长时间没有处理数据,可能原因有?()A、Supervisor是在topology中接收数据然后执行处理的组件B、拓扑业务存在逻辑错误,提交之后无法正常运行C、拓扑过于复杂或者并发太大,导致worker启动时间太长,超过Supervisor的等待时间D、Supervisor的slots资源被耗尽,拓扑提交上去之后分不到slot去启东worker进程【正确答案】:BCD65.以下哪些选项属于FusionInsight数据安全性?A、操作系统安全加固B、组件数据加密C、数据完整性校验D、用户权限认证管理【正确答案】:BC66.以下关于HBase的文件存储模块(HBaseFileStream,简称HFS)描述正确的有?A、应用在FusionInsightHD的上层应用B、HFS封装了HBase与HDFS的接口C、为上层应用提供文件的存储.读取.删除等功能D、HFS是HBase的独立模块【正确答案】:ABCD67.FusionInsightHD安装前准备,包括哪些步骤?(多选)A、完成硬件安装B、完成节点主机操作系统安装C、准备工具和软件。例如Putty、LLD、FusionInsightHD软件安装包等D、准备规划数据,例如网络参数和角色部署位置【正确答案】:ABCD68.MapReduce过程中,以下属于shuffle机制的是?()A、partitionB、sort/mergeC、copyD、combine【正确答案】:BC69.下面关于flink窗口的描述错误的是A、滚动窗口在时间上是重叠的B、滚动窗口在时间上是不重叠的C、滑动动窗口之间时间点不存在重叠D、滑动窗口之间时间点存在重叠【正确答案】:AC70.在大数据时代,企业所面临的挑战有以下哪些?A、企业各部门间数据分散,相同数据在各部门内部存储格式不一致。B、数据结构多样化。C、竞争对手的技术进步。D、数据存在噪音、缺失、存储类型不规范等问题,需要进行大量的数据预处理工作。【正确答案】:ABCD71.Loader提供了哪些方式或接口实现作业管理?A、WEBUIB、Linux命令行C、REST接口D、JavaAPI【正确答案】:ABCD72.FusionlnsightManager会定时备份哪些数据?A、NameNodeB、LDAPServerC、OMSDBService【正确答案】:BC73.FusionInsightHD集群中包含多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase【正确答案】:BC74.HBase的主要特点有哪些?A、高可靠性B、高性能C、面向列D、可伸缩【正确答案】:ABCD75.下列属于flume数据监控的指标是?()A、Source接收数据量B、Sink写入数据量C、DataNode数量D、Channel缓存数据量【正确答案】:ABD76.Flink流式处理的数据源类型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正确答案】:ABCD77.以下关于FusionInsight多租户管理的描述正确的有()A、一站式管理租户资源,计算资源(CPU/内存/IO)、存储资源(HDFS)、服务资源,(HBase…)B、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理C、基于容器机制的租户资源隔离,为租户SLA保驾护航D、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户、按需动态增删租户【正确答案】:ABCD78.以下关于HBase中HMaster的功能描述哪些是正确的?A、Region负载均衡,Region分裂以及分裂后的Region分配B、负责建表/修改表/删除表C、负责RegionServer的负载均衡D、RegionServer失效后的Region迁移【正确答案】:ABCD79.在华为FusionInsightHD中,下面哪些组件是Flink强依赖的?()A、kafkaB、HDFSC、YARND、Zookeeper【正确答案】:BC80.FusionlnsightManager与外部管理平台对接时,支持哪些接口?(多选)A、NMPB、VPNC、FTPD、Syslog【正确答案】:ACD81.StructuredStreamming在OutPut阶段可以定义不同的数据写入方式,包括下列哪些方式?AppendModeB、UpdateModeC、neralModeD、pleteMode【正确答案】:ABD82.以下哪些数据源可以通过loader实现与FusionInsightHD的数据交换?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正确答案】:ABCD83.Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有()A、帮助用户迅速找到资源消耗最高的节点,采用适当的措施B、通过每个服务主页的资源分布查看界面,查看到关键的资源分布情况C、可以帮助用户快速聚集在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况。例如内存占有率在50-75%的主机列表,并提供链接跳转【正确答案】:ABCD84.在FusionInsightHD中,以下哪一项不属于Hive的流控特性A、支持对已建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制【正确答案】:ABD85.某高校的FusionlnsightHD集群中有230个节点,在进行集群规划时,下列哪些进程应该部署在数据节点上?A、DataNodeB、NameNodeC、NodeManagerD、RegionServerE、DBServerF、SoIrServer【正确答案】:ACDF86.在FusionInsightHD中,Flink主要与以下哪些组件进行交互A、zookeeperB、HDFSC、KafkaD、Yarn【正确答案】:ABCD87.如图所示,下列哪些选项属于宽依赖A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正确答案】:AD88.FusionlnsightHD产品中,关于Kafka组件说法正确的有?A、删除Topic时,必须踊保Kafka的服务配置delete.topic.enable配置为trueB、Kafka安装及运行曰志保存路径为/srv/Bigdata/kafkaC、ZooKeeper服务不可用会导致Kafka服务不可用D、必须使用admin用户或者Kafkaadmin组用户进行创建Topic【正确答案】:ACD89.以下关于Zookeeper的Leader选举说法正确的是?A、当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票B、Zookeeper选举leader时,需要半数以上的票数C、当实例数为8时,则成为leader节点需要5票,容灾能力为4D、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票【正确答案】:AB90.若在消息处理过程中允许部分信息丢失,关闭消息可靠性处理机制的方式有以下哪些?A、将参数Config.Topology_ACKKRS设置为0B、将参数Config.Topology_ACKKRS设置为FalseC、Spout发送消息时,使用不指定消息messageID的接口进行发送D、Bolt发送消息时使用Unanchor方式发送【正确答案】:ACD91.FusionInsightHD集群中包含了很多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?()【正确答案】:AA、HDFSB、NameNodeC、DataNodeD、Hbase【正确答案】:BC92.Hadoop的HDFS是一种分布式文件系统,适合以下哪种应用场景的数据存储和管理?A、大量小文件存储B、高容错、高吞吐量C、低延迟读取D、流式数据访问【正确答案】:BD93.FusionInsightManager界面显示Hive服务状态为Bad时,可能原因有哪些?A、DBService不可用B、HDFS服务不可用C、MetaStore实例不可用D、HBase服务不可用【正确答案】:ABC94.华为FusionInsightHD行业成功案例都有哪些?A、数字政府B、智慧园区C、智慧交通D、金融【正确答案】:ABCD95.下列关于worker(工作进程)、Executor(线程)、task(任务)说法正确的是?()A、每个Executor(线程)可以运行多个task(任务)B、每个Executor(线程)可以运行不同组件(spout或bolt)的task(任务)C、每个worker可以运行多个Executor(线程)D、每个worker只能为一个拓扑运行Executor(线程)【正确答案】:ABCD96.FusionlnsightHD集群升级,以下描述正确的有?(多选)A、升级过程中不可以手工操作主备OMS倒换B、集群内所有主机的root账户密码保持一致C、保持网络畅通,避免因网络问题导致升级异常D、观察期不能做圹容【正确答案】:ABCD97.如图所示,Flink流式数据处理接口DataStreamAPI支持的语言包括?()A、pythonB、javaC、c语言D、scala【正确答案】:BD98.HDFS联邦环境下,NameSpace(命名空间)包含以下哪些内
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农村修房合同标准文本
- 共同合资购车合同标准文本
- 修缮工程劳务合同标准文本
- 前期咨询设计服务合同范例
- 公司合作框架合同标准文本
- 假山改梁合同范例
- 供应部采购合同标准文本
- 代理验货合同标准文本
- 住宅出租出售合同范例
- 大型场地清扫工程合同协议
- 早会模板完整版
- 中医医院科室建设与管理指南汇总版(含治未病科修订版)
- 计算机文字录入处理员中级理论知识试卷答案
- 年产.万吨环氧乙烷工艺设计-毕业设计1427
- 中医科物理治疗登记表
- 中国古代文学史-史记讲义
- 缺乏显著性商标驳回复审理由书
- 尿动力学检查操作指南2023版
- GB/T 12243-2021弹簧直接载荷式安全阀
- 行政事业单位无形资产管理办法模板
- 《幼儿卫生学》配套教学课件
评论
0/150
提交评论