H13-711 V3.0 HCIA-Big Data 华为大数据真题题库汇总(附答案)_第1页
H13-711 V3.0 HCIA-Big Data 华为大数据真题题库汇总(附答案)_第2页
H13-711 V3.0 HCIA-Big Data 华为大数据真题题库汇总(附答案)_第3页
H13-711 V3.0 HCIA-Big Data 华为大数据真题题库汇总(附答案)_第4页
H13-711 V3.0 HCIA-Big Data 华为大数据真题题库汇总(附答案)_第5页
已阅读5页,还剩148页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE153H13-711V3.0HCIA-BigData华为大数据真题题库汇总(附答案)一、单选题1.下图为HDFS分级存储的配置,如果block的副本数为4,则以下说法错误的是A、4个block都将写入RAM_DISKB、如果是第1个副本之外的其它副本写入失败,则尝试写入"副本的备选存储策略”指定的存储类型C、第1个block副本将写入RAMDISK,其余副本写入DISKD、如果第1个block副本写入RAMDISK失败,则尝试写入“备选存储策略”指定的存储类型答案:A2.ApplicationMaster米用轮询的方式通过RPC协议向Resourcemanager申请和领取资源。A、正确B、错误答案:A3.KrbServerl可为其他组件提供了kerberos功能用于防止窃听、防止replay攻击、保护数据完整性等场合。A、正确B、错误答案:A4.华为FusioninsightHD系统中关于HDFS的DataNode的说法正确的是?A、不会检查数据的有效性B、周期性地将本节点的Block相关信息发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的答案:B5.Zookeeper所有节点都可以处理读请求。A、正确B、错误答案:A6.以下关于FusioninsightManager界面Hive日志收集的描述,哪个选项不正确?A、可指定特定用户进行日志收集,例如仅下载UserA用户产生的日志B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志。C、可指定实例进行日志收集,比如指定收集metstore的日志D、可指定节点IP进行日志收集,例如仅下裁某个IP的日志。答案:A7.HBase中OpenScanner的过程会创建两种不同的Scanner来读取HFile和MemStorel的数据,HFile对应的Scanner为StoreFileScanner,MemStore对应的Scanner为MemStoreScanner。A、正确B、错误答案:A8.FusioninsightHD系统中,LDAP数据同步方式是哪个?A、单向同步B、双向同步C、隔离不同步D、数据交叉同步答案:A9.YARN服务中,如果要给队列QuqueA设置容量为30%,应该配置哪个参数A、YARN.scheduler.capacity.root.QueueA.user-limit-factorB、YARN.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、YARN.scheduler.capacity.root.QueueA.capacityD、YARN.scheduler.capacity.root.QueueA.state答案:C10.kafkalogssegment文件命名规则是partion全局的第一个segment从0开始,后续每个segment文件名为上一个全

局partion的最大offset(偏移message数)。A、正确B、错误答案:A11.下面哪一个是ElasticSearch的节点A、EsNodeB、IndexC、EsMasterD、Cluster答案:A12.ElasticSearch的shards索引分片可以把索引数据打散分布到不同的节点。A、正确B、错误答案:A13.在Flink技术架构中,__是流处理和批处理的计算引擎A、StandaloneB、RuntimeC、DataStreamD、FlinkCore答案:B14.FusioninsightHadoop集群中,在某节点上通过df-hT查询,看到的分区包含以下几个:

/var/log

/srv/BigData

/srv/BigData/hadoop/data5

/srv/BigData/solr/solrserver3

/srv/BigData/dbdataom这些分区所对应磁盘最佳Raid级别的规划组合是?A、RaidoRaid1Raid0Non-Raid1B、Raid1RaidlNon-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1答案:B15.Spark应用运行时,如果某个Task运行失败导致整个app运行失败。A、正确B、错误答案:B16.FusioninsightHDI中Loader作业提交到YARN后,作业不能手动停止。A、正确B、错误答案:B17.HBase的某张表的RowKey划分SplitKey为9,e,a,z请问该表有几个Region?A、3B、4C、5D、6答案:C18.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,不会保存消息。A、正确B、错误答案:B19.Loader的作业执行失败,导入的数据不会被自动删除,必须手动删除。A、正确B、错误答案:B20.在有N个节点FusioninsightHD集群中部署Hbasee时,推荐部署__个Master进程,__个RegionServeri进程.A、3,NB、N,NC、2,ND、2,2答案:C21.Hadoop中,如果将yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent设置为50,下面说法错误的

是?A、一个用户提交任务可以使用Queue的100%的资源B、QueueA中的每个用户最多只能获得50%的资源C、如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源D、QueueA中必须保障每个用户至少得到50%的资源答案:B22.RDD有Transformation和Action算子,下列属于Action算子的是?A、reducebykeyB、filterC、mapD、saveAsTextFile答案:D23.ElasticSearch对Zookeeper是强依赖的。A、正确B、错误答案:A24.下图展示的fume架构,主要应用于集群外的数据导入到集群内。A、正确B、错误答案:A25.华为在金融、公安、铁路、政务等多行业拥有丰富的大数据解决方案经验。A、正确B、错误答案:A26.Channel支持事务提供较弱的顺序保证,可以连接任何数量的Source和Sink。A、正确B、错误答案:A27.HBase的底层数据以的形式存在的?A、keyvalueB、列存储C、行存储D、实时存储答案:A28.SparkonYARN-client适合用于生产环境是因为可以更快的看到APP的输出。A、正确B、错误答案:B29.在FusioninsightManager界面中,对loader的操作不包括下列哪个选项?A、切换Loader?主备节点B、启动oader实例C、配置loader参数D、查看lolder服务状态答案:A30.如果YARNU群中只有Default、QueueA和QueueB子队列,那么允许将他们的容量分别设置为60%、25%、

22%。A、正确B、错误答案:B31.关于Hive建表的基本操作,描述正确的是?A、创建外部表的时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再増加新列答案:A32.FusionlnsightHD系统中HBase支持动态扩展列。A、正确B、错误答案:A33.Redis默认的快照方式是AOF。A、正确B、错误答案:B34.Spark和Hadoop一样不适用于送代计算。A、正确B、错误答案:B35.YARN-client和YARN-cluster主要区別是ApplicationMaster进程的区别。A、正确B、错误答案:A36.FusioninsightHD产品中。关于Kafka的说法不正确的是A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费答案:C37.某银行规划的FusioninsightHD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划()个。A、87B、85C、90D、86答案:A38.以下哪些选项属于Hive的数据存储模型?A、表B、桶C、数据库D、分区E、以上全都正确答案:E39.HDFS中NameNode的主备仲裁,是由哪个组件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZookeeperFailoverController答案:D40.在Fusioninsight集群规划部署时,建议管理节点最好部署__个控制节点,最少需要__部署个,数据节点最少需要__部署个。A、1,2,2B、1,3,2C、2,3,1D、2,3,3答案:D41.FusioninsightHD系统中flume数据流在节点内不需要经过哪个组件?A、sinkB、topicC、SourceD、Channel答案:B42.在KafkaHA中,当Partition对应的Leader宕机时需要从Follower中选举出新Leader,具体由以下哪个角色执行?A、FollowerB、ControllerC、BrokerD、Leader答案:C43.关于FusioninsightHD中Loader作业描述正确的是?A、Loader,将作业提交到Yam执行后如果此时Loader服务异常,则此作业执行失败B、Loader将作业提交到Yam执行后如果某个Appert任务执行失败能够自动进行重试C、Loadett作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后该作业执行完成前不能再提交其他作业答案:B44.HFS的出现解决了需要在HDFS中存储大量的小文件(10MB以下)。同时也要存储一些大文件(10MB以上)的混合

的场景。A、正确B、错误答案:A45.Sparks应用在运行时Stage划分的依据是什么?A、taskB、tasksetC、actionD、Shuffle答案:D46.ElasticSearch集群中的节点有主从之分。A、正确B、错误答案:A47.FusioninsightHDHBase默认使用什么作为其底层文件存储系统?A、HDFSB、HadoopC、MemoryD、MapReduce答案:A48.以下关于Kafkapartition偏移量的描述不正确的是?A、消费者通过(offset、partition、topic)跟踪记录B、唯一标记一条消息C、offset是-个String型字符串D、每条消息在文件中的位置称为offset(偏移量)答案:C49.Flume支持监控并传輸目录下新增的文件,可实现数据传输。以上描述的是哪一类source?A、spoolingdirectorysourceB、httpsourceC、execsourceD、syslogsource答案:A50.安装FusioninsightHD的Streaming组件时,Nimbus角色要求安装几个节点A、3B、2C、4D、1答案:B51.Hadoop中MapReduce组件擅长处理哪种场景的计算任务?A、迭代计算B、离线计算C、实时交互计算D、流式计算答案:B52.SparkOnYARN模式下的driver只能运行在客户端。A、正确B、错误答案:B53.HBase的分布式存储的最基本单元是RegionA、正确B、错误答案:A54.下列哪个不是HBase读取数据流程中涉及的角色或服务?A、HDFSB、ZookeeperC、HMasterD、HRegionServer答案:C55.FusioninsightManager对服务的配置功能说法不正确的是A、服务级别的配置可対所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效答案:C56.Spark是以下种编程语言实现的?A、CB、C++C、JAVAD、Scala答案:D57.MapReduce过程中,默认情况下、一个分片就是一个块也是一个mapTask。A、正确B、错误答案:A58.Spark根据RDD的依赖关系来划分Stage,调度器从DAG图末端出发,逆向遍历整个依赖关系链,遇到窄依赖就

断开,遇到宽依赖就将其加入当前Stage。A、正确B、错误答案:B59.Flume用于收集数据,器传輸的数据基本单位是A、SplitB、BlockC、EventD、Packet答案:C60.通过下面哪个命令可以清空Redis实例下所有数据库的数据?A、dropallB、flushallC、flushdbD、dropdb答案:B61.用户权限管理基于角色的访问控制(RBAC),提供可视化的多组统一的集群中用户权限管理。A、正确B、错误答案:A62.HDFS的副本放置策略中,同一机架不同的服务器之间的距离是?A、1B、2C、3D、4答案:B63.关于HIVE的描述不正确的是?A、Hive最佳使用场景是大数据集的批处理作业B、Hive可以实现在大规模数据集上实现低延时快速的查询C、Hive构建在基于静态批量处理的Hadoop之上,Hadoop通常有较高的延迟并且在作提交和调度的时候需要大量的开销D、Hive查询操作过程严格遵循HadoopMapreduce的作用执行模型,Hive将用户的HiveSQL语句通过解释器转换为MapreduceHadoop集群上答案:B64.下列关于Flinkbarrier描述错误的是()A、barrier周期性的插入到数据流中并作为数据流的一部分随之流动B、barrier是Flink快照的核心C、一个barrier将本周期快照的数据与下-周期快照的数据分隔开来D、在插入barrier的时候会暂时阻断数据流答案:D65.以下关于Zookeeper关键特性中的原子性说法正确的是A、客户端发送的更新会按照他们被发送的顺序进行应用B、更新只能全部完成或失败不会部分完成C、一条消息被一个server接收,将被所有server;=接收D、集群中无论哪台服务器,对外展示的均是同一视图答案:B66.下图展示了StructuredStreaming的计算模型。通过观察可以得出最终T3的计算结果是A、Dog1,owl1B、Cat2,dog4,owl2C、Cat2,dog3,owl1D、Cat1,cat1,dog2,dog2,owl2答案:B67.下列哪条HDFS命令可用于检测数据块的完整性?A、HDFSfsck/B、HDFSfsck-deleteC、HDFSdfsadmin-reportD、HDFSbalancer-threshold1答案:A68.使用Hbase客户端批量写入10条数据,某个HRegionServer节点上包含该表的2个Region,分别为A和

B,10条数

据中有6条属于

A,4条属于B请问写入这10条数据需要向HregionServer发送几次RPC请求?A、2B、1C、6D、10答案:B69.Fink支持Local模式和Cluster模式部署,其他模式部罟暂不支持。A、正确B、错误答案:B70.二级索引为HBase提供了按照某些列的值进行索引的能力,二级索引先查索引表,再定位到数据表中的位置,不

用全表扫描。A、正确B、错误答案:A71.FusioninsightHD平台中,HBase暂不支持二级索引。A、正确B、错误答案:A72.HDFS支持大文件存储同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。A、正确B、错误答案:B73.HDFS中的主备仲裁,是由哪个组件控制的?A、ZooleeperFailoverControllerB、NodemanagerC、ResourcemanagerD、HDFSClient答案:A74.KafkaClusterMirroring工具可以实现以下哪项功能?A、Kafka跨集群数据同步方式B、Kafka单集群内数据备份C、Kafka单集群内数据恢复D、以上全不正确答案:A75.安装FusioninsightHDI的Streaming组件时,Nimbus角色要求安装几个节点A、1B、2C、3D、4答案:B76.kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消

息系统。A、正确B、错误答案:A77.客户端往任意Zookeeper节点写数据,Zookeeper需要将数据完全同步到其他节点,才可以返回给客户端写成功。A、正确B、错误答案:B78.HDFS的NameNode节点主备状态管理及元数据文件合并分別由哪两个角色负责?A、ZKFC和备NameNodeB、主Namenode和备NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode答案:A79.Flink没有重启策略。A、正确B、错误答案:B80.HDFS从2.7.3版本开始,BlockSize默认是多大?A、32MBB、128MBC、64MBD、16MB答案:B81.FusioninsightHD使用HBase客户端批量写入10条数据,某个Regionserver节点上包含该表的2个Region,分别A

B,10条数据中有两条属于

A,4条属于

B,清向写入这10条数据需要向该Regionserver发送几次RPC请求?A、1B、2C、3D、4答案:A82.Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DataNodeC、RegionServerD、Zookeeper答案:C83.HBase元数据MetaRegion路由信保存在哪里?A、Root表B、ZookeeperC、HMasterD、Meta表答案:B84.Hbase中MOB数据直接HFile的格式存储在HDFS上,然后把这个文件的地址信息及大小信息作为value存储在

管理HBase的store上,通过工具集中管理这些文件。这样就可以大大降低HBase的pation和split频率提升性能。A、正确B、错误答案:A85.关于RDD,下列说法错误的是?A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘C、RDD是一个只读的,可分区的分布式数据集D、RDD是Spark対基础数据的抽象答案:B86.下列关于HBase的BloomFilterf特性理解不正确的是?A、用来过滤数据B、用来优化随机读取的性能C、会増加存储的消耗D、可以准确判断某条数据不存在答案:A87.ElasticSearch的一个索引库默认有几个分片?A、5B、6C、3D、4答案:A88.可以通过以下哪个命令创建节点数据?A、get/nodeB、create/nodeC、set/nodedataD、Is/node答案:B89.Hive支持普通视图和物化视图。A、正确B、错误答案:B90.Spark的中间数据放在内存中,对于迭代运算、批处理计算的效率更高,延迟更高。A、正确B、错误答案:B91.Hbasel的Region是由哪个服务进程来管理的?A、DatanodeB、ZookeeperC、MasterD、HregionServer答案:D92.Flink中的__接口用于流数据处理,__接口用于批处理?A、DatastreamApl,DataSetAPIB、DatabatchAPL,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI答案:A93.以下哪类数据不属于半结构化数据?A、HTMLB、XMLC、二维表D、JSON答案:C94.下列哪个命令是删除文件的?A、dfs-clearB、dfs-delC、dfs-rmD、dfs-Is答案:C95.Hive中的“Groupby"指的是通过一定规则将一个数据集划分成若干个小的数据集,然后针对若千个小的数据集进

行数据分组处理。A、正确B、错误答案:A96.FusioninsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给角色配置权限C、给用户组配置角色D、给用户组配置权限答案:D97.LdapServer的Group(组)是对用户进行统一的组管理,如果用户添加到该组中,该组的member属性中就会添加成

员的dn记录。A、正确B、错误答案:A98.Hive在load是不检索数据是否符合schema的,Hive遵循的是schemaonread(读时模式)只有在读时模式的时

候才检査Hive的数据字段schema。A、正确B、错误答案:A99.安装FusioninsightHD安装流程正确的是A、安装Manager->执行preinstall->LLD工具进行配置->安装集群->安装后检查->安装后配置B、LLD工具进行配置->执行preinstall-安装Managers->安装集群->安装后检査->安装后配置C、安装Manager->LLD工具进行配置->执行preinstall->安装集群->安装后检通->安装后配置D、LLD工具进行配置->执行preinstall->安装集群->安装Manager->安装后检查->安装后配置答案:B100.FusioninsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、ReaionServerC、ResourceManagerD、NodeManager答案:D101.FusioninsightHD中如果需要査看当前登录,HBase的用户和权限组,可以在HBaseshell中执行什么命令?A、use_permissionB、whoamiC、whoD、get_user答案:B102.鲲鹏计算产业是基于Kunpeng处理器构建的全栈IT基础设施、行业应用及服务,包括PC、服务器、存储、操作系

统、中间件、虚拟化、数据库、云服务、行业应用以及咨询管理服务等。A、正确B、错误答案:A103.假设数据量有200GB左右,分片最大容量限制为30GB,那么分片数量最多设计为多少比较合适?A、9或10B、7或8C、3或4D、5或6答案:B104.在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、为任务设置好运行环境C、分配ContainerD、启动Map或Reduce任务答案:A105.图形化的健康巡检工具FusioninsightTool由FusionCare和SysChecker两部分组成。A、正确B、错误答案:A106.MRS平台中,Flume数据流在节点内不需要经过哪个组件?A、SinkB、ChannelC、TopicD、Source答案:C107.FusioninsightHD系统中,集群中一个Loader节点异常,其他服务没有异常的情况下,不会影响Loader服务功能

的正常使用。A、正确B、错误答案:A108.关于HBase的RegionSplit分裂流程的描述不正确的是0A、Split过程中该表会暂停服务B、Split为了减少Region中数据大小,从而将一个Region分裂成两个RegionC、Split过程中被分裂的Region会暂停服务D、Split过程中并没有真正的将文件分裂,仅仅是创建了引用文件答案:A109.下图中ElasticSearch的索引名称是?A、ddcvcB、docC、logstash-2020.01.17D、3sDqsm8Bu-kTplz0jqhL答案:C110.容量调度器在进行资源分配,现有同级的2个队列Q1和Q2,他们的容量均为30,其中Q1已使用8,Q2已使用14,则会优先将资源分配Q1。A、正确B、错误答案:A111.Flume的tertises配置文件中可以配置多个channel来传输数据。A、正确B、错误答案:A112.关于Hive中普通表和外部表的描述不正确的是?A、默认创建普通表B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来C、删除普通表时,元数据和数据同时被删除D、删除外部表时,只删除外部表数据而不删除元数据答案:D113.安装FusioninsightHD的Streaming组件Nimbus角色要求安装几个节点?A、4B、3C、2D、1答案:C114.Flink中的TaskSlot主要用于资源隔离,其中包含内存资源和CPU资源。A、正确B、错误答案:B115.在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,严重影响

性能。Fusioninsighte中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减

少partition数,从而避免在shuffle的时候,生成过多的ash分桶,提升性能?A、groupbyB、coalesceC、connectD、Join答案:D116.MRS服务中,Zookeeper服务不可用会导致kafka服务不可用。A、正确B、错误答案:A117.现有3个机架,有一个文件需要存3份,其中副本1和副本2存放在与client相同的机架且不同的服务器上。根

据HDFS的副本放置策略一定要存放在其他机架。A、正确B、错误答案:B118.关于Kerberos部警,描述正确的是?A、Kerberos仅有一个角色B、Kerberos服务在同一个节点上有两个实例C、Kerberos服务采用主备模式部署D、Kerberos服务必须和LDAP服务部暑在同一个节点答案:B119.kafkaConsumer写数据总体流程是Consumer连接指定TopicPartition所在的LeaderBroker,用于主动获取方式从

Kafka中获取消息。A、正确B、错误答案:A120.Flink与SparkStreaming类似属于事件驱动型实时流系统。A、正确B、错误答案:B121.FusioninsightHD部署过程中,执行precheck检查每个节点时必须調用CheckNode.Config配置文件。A、正确B、错误答案:A122.以下哪些因素助力了大数据时代的達勃发展?A、硬件成本的降低和网络带宽的提升B、云计算的兴起C、智能终端的普及和社交需求的提升D、以上全都正确答案:D123.下面关于ZKFC的说法错误的是?A、ZKFC(ZKFailoverController)作为一个Zookeeper集群的客户端,用来监控NameNode的状态信息B、ZKFC进程需要在NameNode的节点和Zookeeper的Leader节点中部署C、StandbyNamenode通过Zookeeper感知ActiveNameNode的状态,一旦ActiveNamendes岩机,StandbyNamenode就会执行升主操作D、HDFSNamenode的ZKFC连接到Zookeeper,把主机名等信息保存到Zookeeper中答案:B124.Hive不话用于以下哪个场景A、实时的在线数据分析B、非实时分析,例如日志分析统计分析C、数据挖掘例如用户行为分析兴趣分区,区域展示D、数据汇总例如每天、每周用户点击数点击排行答案:A125.关于DataSet,下列说法不正确的是?A、DataSet是一个由特定域的对象组成的强类型集合B、DataSet不需要反串行化就可执行大部分操作C、DataSet执行sort、filter、shuffle等操作需要进行反串行化D、DataSet与RDD高度类似性能比RDD好答案:C126.关于FusioninsightHD中Loader作业描述正确的是?A、Loader将作业提交到YARN执行后,如果此时Loade相务异常,则此作业执行失败。B、Loader将作业提交到YARN执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loade作业执行失败后将会产生拉圾数据,需要用户手动清除D、Loader将一个作业提交至YARN执行后,该作业执行完成前,不能再提交其他作业答案:B127.华为FusioninsightHD是国内首家符合国家金融等级保护的大数据平台,其安全性现在以下哪些方面?A、系统安全B、权限认证C、数据安全D、以上全部正确答案:D128.FusioninsightHD系统中HDFS的Block默认保存几份?A、3B、2C、1D、不确定答案:A129.FusioninsightHDManager界面Hive日志收集,哪个选项不正确?A、可指定实例进行日志收集,比如指定单独收集Metastore的日志B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-140的日志C、可指定节点IP进行日志收集,例如仅下载某个IP的日志D、可指定特定用户进行日志收集,例如仅下载userA用户产生的日志答案:D130.以下关于Kafka的描述错误的有()A、用作活动流和运营数据处理管道的基础B、由ApacheHadoop开发并于2011年开源C、具有信息持久化、高吞吐、实时等特性D、使用Scala,Java语言实现答案:B131.为了考虑性能最优化,建议将所有集群中LdapServer都与KrbServer部署在相同节点上。A、正确B、错误答案:A132.Solr刨建Collection时,推荐选用路由算法为positedRouter,那么该Collection可以拓展shard。A、正确B、错误答案:B133.FusioninsightHD系统中,下面哪个方法不能查看到Loader作业执行的结果?A、通过YARN任务言理查B、通过LoaderUI界面查C、通过Manager的告警查看D、通过NodeManager查看答案:D134.关于FusioninsightHDStreaming的Supervisor描述正确的是?A、Supervisors负责资源的分配和任务的调度B、Superviso负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件答案:B135.对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求。A、正确B、错误答案:A136.SparkOnYARN模式下没有部署NodeManageri的节点不能启动executor执行Task。A、正确B、错误答案:A137.在规划FusioninsightHD集群时候,如果客户用于功能测试,对性能没有要求,节约

成本的情況下,可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、4D、5答案:B138.华为Fusioninsight中,HBase的表设计工具、连接池管理和增强的SDK,可以简化复杂数据表的业务开发。A、正确B、错误答案:A139.以下提供多种Redist优化的做法,错误的是哪个选项?A、精简键名和键值B、关闭TransparentHugePagesC、修改linux中tcp最小连接数D、修改linux内核内存分配策略或者执行sysctl答案:C140.为了保障流应用的快照存储的可靠性,快照主要存储在哪里?A、JobManager的内存中B、可靠性高的单机数据库中C、本地文件系统中D、HDFS中答案:D141.FusionlnsightManager对服务的管理操作,下面说法错误的是?A、可对服务进行启停重启操作B、可以添加和卸载服务C、可设置不常用的服务隐藏或显示D、可查看服务的当前状态答案:C142.SparkStreaming容错机制是指RDD中任意的partitioni出错,都可以根据其父RDD重新计算生成,如果父RDD

丢失则需要去磁盘中査找原始数据。A、正确B、错误答案:B143.Fusioninsightmanager不能够管理哪个对象?A、SparkB、主机OSC、YARND、HDFS答案:B144.下列选项中无法通过大数据技术实现的是?A、商业模式发现B、值用评估C、商品推荐D、运营分析答案:A145.Spark任务的每个stage可划分为job,划分的标记是shuffle。A、正确B、错误答案:B146.Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS

中。A、正确B、错误答案:A147.Flink是一个批处理和流处理结合的统一计算框架,其核心是一个数据分发以及并行化计算的流数据处理引擎。A、正确B、错误答案:A148.Kafka集群在运行期间,直接依赖于下面那些组件?A、ZookeeperB、HDFSC、SparkD、HBase答案:A149.flume传輸数据的可靠性是指fume在传输数据过程中,当下一跳的flume节点故障或者数据接收异常时,可以自

动切换到另外一路上继续传输。A、正确B、错误答案:A150.Hive中"UNIONALL"操作符用于合并两个过多个SELECT语句的结果集,结果集中不允许有重复的值。A、正确B、错误答案:B151.MapReduce某任务失败时可通过重试机制重新计算该任务。A、正确B、错误答案:A152.关于Hive在FusioninsightHD中的架构描述错误的是?A、只要有一个Hiveserver,不可用整个Hive集群便不可用B、Hiveserverf负责接受客户端请求、解析、执行HQL命令并返回查询结果C、MetaStore用于提供原数据服务,依赖于DBServerD、在同一时间点HiveServer只有一个处于Active状态,另一个则处于Standbys状态答案:A153.flume架构中一个Source可以连接多个channel。A、正确B、错误答案:A154.单选Zookeeper的scheme认证方式不包括以下哪项?A、authB、saslC、digestD、world答案:B155.FusioninsightHD的Streaming对于Zookeeper弱依赖,即使Zookeeper故障Streaming可以正常提供服务。A、正确B、错误答案:B156.Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供了javaAPI以便其他组件对接使用,在

Fusioninsight解決方案中,Kafka属于FusioninsightHD模块。A、正确B、错误答案:A157.topology在任务完成后会自动结束运行。A、正确B、错误答案:B158.YRAN的基于标签调度,是对下列选项中的哪个进行标签化?A、APPMasterB、ResourceManagerC、ContainerD、NodeManager答案:D159.Flume的数据流可以根据headers的信息发送到不同的Channel中。A、正确B、错误答案:A160.HBase中数据存储的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile答案:A161.关于Hive与Hadoop其他组件的关系以下描述错误的是?A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对Hbase有强依赖答案:D162.下列关于Flinkbarrier描述错误的是A、barrier周期性的插入到数据流中并作为数据流的一部分随之流みB、barriers是Flink快照的核心C、一个barrier/将本周期快照的数据与下一周期快照的数据分隔开来D、在插入barrier的时候,会暂时阻断数据流答案:D163.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A、客户端的文件数据经过NameNode传递给DataNodeB、容户端将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode中C、客户端根据Datanodel的地址信息按顺序将整个文件写入每一个DataNode中然后由DataNodel将文件划分为多个blockD、客户端只上传数据到一个DataNode,然后由NameNode负责block复制答案:C164.FusioninsightSparkSQL同社区SparkJDBCServer一样,只支持单租户绑定到一个YARN资源队列多租户并不支

持多租户并行执行。A、正确B、错误答案:B165.加载数据到Hive表,哪种方式不正确?A、直接将本地路径的文件load到Hive表中B、将HDFS上的额文件load到Hive表中C、Hie支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表中答案:C166.在Zookeeper的服务模型中,Leaderi节点以主备模式存在,其他节点都属于Follower节点。A、正确B、错误答案:B167.Hadoop平台中启用Yam组件的日志聚集功能需要配置哪个参数?A、yarn.nodemanager.local-dirsB、yarn.nodemanager.Iog-dirsC、varnamenableD、yarn.log-aggregation-enable答案:D168.ElasticSearch可以作为类似于MySQL的关系型数据库使用。A、正确B、错误答案:B169.FusioninsightHD中使用HBase进行数据读取服务时需要连接HMaster。A、正确B、错误答案:B170.Hbase命令中下列哪个选项性能最差A、putB、getC、listD、Scan答案:C171.传统数据处理的数据规模旳单位是?A、TBB、EBC、PBD、GB答案:D172.Flink适用于高并发处理数据、亳秒级时延的应用。A、正确B、错误答案:A173.SparkSQL表中,经常会存在很多小文件(大小远小于HDFS块大小),在这种情況下,Spark会启动更多的Task

来处理这些小文件,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数从而严重影响性能。A、正确B、错误答案:B174.FusioninsightHD的Loader中,一个连接器只可以分配给一个作业使用。A、正确B、错误答案:B175.驱动型Source是flume周期性主动去获取数据。A、正确B、错误答案:B176.HDFS的Client写入文件时,数据的第一副本写入位置由NameNode确定,其他副本的写入位置由DataNode确

定。A、正确B、错误答案:B177.Spark是基于内存的计算引擎,所有Spark程序运行过程中的数据只能存储在内存中。A、正确B、错误答案:B178.对于容量调度器的任务选择,以下说法正确的是A、最小队列层级优先B、资源回收请求队列优先C、最大队列层级优先D、资源利用量最低的队列优先答案:B179.Spark和Hadoop都不适用于迭代计算的场景。A、正确B、错误答案:B180.为减少写入磁盘的数据量,mapreduce支持对MOF(mapoutfile)进行压缩后再写入。A、正确B、错误答案:A181.FLINK采用checkpoint机制保障应用程序运行中的容错性。A、正确B、错误答案:A182.FusioninsightHD系统审计日志不可用记录下面哪些操作?A、手动清除警告B、启停服务实例C、删除服务实例D、查询历史监控答案:D183.kafka-clustermirroring工具可以实现以下那些功能?A、kafka集群数据同步方案B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对答案:A184.在FusioninsightHD中行数据转换的正确步骤是A、加载、转换、输出B、输入设置、转换、输出C、加载、转化、抽取D、抽取、转换、输出答案:B185.HBase的数据文件HFile中一个KeyValue格式包含Key,Value,TimeStamp,KeyType等内容。A、正确B、错误答案:A186.下列哪个命令是从HDFS下载目录/文件到本地的?A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put答案:C187.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是?A、用于存储Kafka数据的磁盘配置(如磁盘数目、大小等),无法满足当前业务数据流宣,导致磁盘使用率达到上限B、数据保存时间配置过长,数据累积达到磁盘使用率上限C、业务规划不合理导致数据分配不均匀使部分磁盘达到使用率上限D、Broker节点故障导致答案:D188.在Flink的运行流程中,负责申请资源的角色是A、ResourceManagerB、JobManagerC、ClientD、TaskManager答案:B189.大数据计算任务中,关于I0密集型任务的描述不正确的是哪项?A、I0密集型任务执行期间大部分时间都花在I0处里上B、通过提升网络传输效率和读写效率可大幅度提升性能C、CPU消耗高D、任务越多,CPU效率越高答案:C190.以下哪个不属于Hadoop中MapReduce组件的持点?A、易于编程B、良好的拓展性C、实时计算D、高容错性答案:C191.Kerberos作为认证服务器中心,能够向集群内所有服务以及客户的二次开发应用提供统一的认证服务。A、正确B、错误答案:A192.在MapReduce编程中,代码不仅要描述做什么还要描述具休怎么做。A、正确B、错误答案:B193.某用户需要搭建一个350节点的FusioninsightHD集群,哪种规划方案最佳?A、管理节点、控制节点、数据节点合一部暑,二层组网B、管理节点、控制节点合部署、数据节点独立部暑,二层组网C、管理节点、控制节点、数据节点都独立部暑,三层组网D、管理节点、数据节点合一部暑,控制节点独立部暑,二层组网答案:C194.大数据需要传统行业思维的转变,要把数据收集、分析中作为业务流程的重要组成,数据端驱动业务流程优化,

实现智能化和自动化,并依托数据资产实现跨界拓展。A、正确B、错误答案:A195.导入数据到Hive表时不会检查数据合法性只会在读取数据时候检查。A、正确B、错误答案:A196.以下关于Zookeeper的Leader节点在收到数据变更清求后的读写流程说法正确的是?A、同时写入磁盘和内存B、先写磁母再写内存C、仅写入内存D、先写内存再写磁盘答案:B197.Spark任务的Container可以运行多个task.A、正确B、错误答案:B198.colocation(同分布文件级的同分布实现文件的快速访问,避免了因数据搬迁帯来的大量网络开销。A、正确B、错误答案:A199.Hive是基丁hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据,以下关于Hive持性的描述不正确

的是A、仅支持Mapreducei计算引擎B、易用易编程C、可直接访问HDFS文件以及HbaseD、灵活方便的ETL(extract/transform/load)答案:A200.Flink中的checkpoint机制不断绘制流应用的快照流应用的状态快照只能保存在HDFS文件系统中。A、正确B、错误答案:B解析:主要保存在HDFS中201.Kafka所有消息都会被持久化到硬盘中,同时Kafka通过对TopicPartition设置Replicetion来保障数据可靠。A、正确B、错误答案:A202.Hadoop平台中,要查看YARN服务中一个application的信息通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application答案:D203.Kerberos服务角色中,KerberosServer主要是提供认证功能,KerberosAdmin主要提供用户管理功能。A、正确B、错误答案:A204.Channel的作用类似队列,用于临时缓存进来的数据,当Sink成功地将数据发送到下一跳的Channel或最终目的

数据会从Channel移除。A、正确B、错误答案:A205.FusioninsightManager界面上,当收到Kafka磁盘容量不足告警,且该告警的原因已经排除硬盘硬件故障时,系

统管理员需要老虑扩容解决此问题。A、正确B、错误答案:A206.FusioninsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案适合什么样的场景?A、30节点以下B、100节点以上C、100-200节点D、200节点以上答案:A207.SparkStreaming相比Storm具备更高的实时性。A、正确B、错误答案:B208.Flink中的()接口用于流数据处理,()接口用于批处理A、StreamAPI,BatchAPIB、DataStreamAPL,DatasetAPIC、DatabatchAPL,DatastreamapiD、Batchapl,StreamApi答案:B209.Hive不支持超时重试试机制。A、正确B、错误答案:B210.FusionlnsightHD管理节点提供双机HA机制,主节点故障后,主备节点需要手动实现Failover。A、正确B、错误答案:B211.HBase中一个Region进行Split操作时,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?A、Split过程中B、Flush过程中C、paction过程中D、HFile分开过程中答案:C212.关于Hive与传统数据仓库的对比,以下描述错误的是?A、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一灵活性低B、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据仓库存储量会有上限C、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错,高可靠D、由于Hive基于大数据平台,所以查询效率比传统数据仓库快答案:D213.关于FusioninsightManager中的Controller和NodeAgent,说法正确的是?A、Controller每隔3秒向NodeAgent发送心跳B、Nodeagent接受Controller下发的命令执行具体的动作C、每个节点都必须部署ControllerD、NodeAgent是开源増强的答案:B214.ElasticSearch的索引数据只能保存在HDFS系统中。A、正确B、错误答案:B215.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.stateD、yarn.scheduler.capacity.root.QueueA.maximum-capacity答案:D216.Spark自帯的资源管理框架是?A、StandaloneB、MesosC、YARND、Docker答案:A217.Kafka集群中,Kafka服务端的角色是A、ProducerB、ConsumerC、ZookeeperD、Broker答案:D218.Kafka中partitionreplication之间同步数据,从partition的leader复制数据到follower需要线程(replicationFetcherThread),Follower(一个follower相当于consumer)主动从leader批量拉取消息的,这极大提高了吞吐量。A、正确B、错误答案:A219.Fusioninsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点小于200的集群

场景。A、正确B、错误答案:A220.Kafka日志的清理方式有两种:delete和pact。默认值是delete。A、正确B、错误答案:A221.下图展示了文件A、B、C、D的存放位置其中A和B具有关联性它们的存储位置符合Colocation同分布策略。A、正确B、错误答案:B222.如果某些Container的物理内存利用超过了配置的内存阈值,但所有Container的总内存利用率并没有超过设置的

NodeManager内存阈值,那么内存使用过多的Container仍可以継续运行。A、正确B、错误答案:A223.以下关于HBase二级索引的描述哪一顼是正确的A、二级索引把要查找的列与rowkey关联成一个索引表B、此时列成新的rowkey,原rowkey成为valueC、二级索引查询了2次D、以上全都正确答案:D224.在Flink中,checkpoint机制能够保证应用在运行过程中出现失效时,从某一个检查点恢复在此过程中,流快照

是根据数据流入建立的。A、正确B、错误答案:A225.在MRS集群中,Spark主要与以下哪些组件进行交互?A、ZookeeperB、YarinC、HiveD、HDFS答案:A226.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionsightHive中,可以指定表数据的

输入和输出格式处理类。A、正确B、错误答案:A227.在FusioninsightHD系统,Loader作业运行过程中,如果产生脏数据,Loader作业执行结果的状态一定是失败。A、正确B、错误答案:B228.下图所示的Map阶段是描述哪个过程?A、PartitionB、SortC、Spill/MergeD、bine答案:D229.现有server.channels=ch1,设置Channel类型为FileChannel,下列配置正确的是?A、serverchannels.ch1type=fileB、serverchannels.ch1type=memoryC、serverchannels.type=memoryD、serverchannels.type=file答案:A230.FusioninsightHD系统中,HBase支持动态扩展列。A、正确B、错误答案:A231.数据中台技术架构的目标之一是为了能够解决传统数据仓库容易成为数据孤岛、大数据平台容易成为数据沼泽的

弊端。A、正确B、错误答案:A232.下图为Spark&MapReduce的性能对比数据,可以得出结论,与MapReduce计算相比,Spark用__的资源,获得__倍性能?A、1/8,3B、1/10,3C、1/10,4D、1/8,4答案:B233.在Fusioninsight产品中,关于kafka的topic以下描述不正确的是?A、Topic的partitions数量可以创建时配置B、每个topic只能被分成一个partition区C、每条发布到kafka的消息都有一个类别,这个类别被称为topic也可以理解为一个存储消息的队列D、每个partition在存储层面对应一个log文件,Iog文件中记录了所有的消息数据答案:B234.topology的处理逻辑都在bolt中。A、正确B、错误答案:A235.在Fusioninsighti产品中,关于KafkaTopic,以下描述不正确的有?A、毎个Topic只能被分成一个partition(区)B、Topice的partition数量可以在创建时配置C、每个Partition的存储层面対应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的消息都有一个类別,这个类别被称为Topic,也可以理解为一个存储消息的队列答案:A236.假设每个用户最低资源保障设置为YARN.scheduler.capacity.root.QueueA.minimum-User-limit-percent=25,则以上

说法错误的是A、第4个用户提交任务时每个用户最多获得25%的资源B、第2个用户提交任务时每个用户最多获得50%的资源C、第3个用户提交任务时每个用户最多获得33.33%的资源D、第5个用户提交任务时每个用户最多获得20%的资源答案:D237.KafkaClusterMirroring工具可以实现以下哪些功能?A、Kafka跨集群数据同步方案B、Kafkas单集群内数据备份C、Kafka但集群内数据恢复D、以上全不正确答案:A238.HBase组件中,数据读写服务需要连接Master执行。A、正确B、错误答案:B239.下列哪个不是Fink支持的状态存储0A、FsStateBackendB、RocksDBStateBackendC、MemoryStateBackendD、FileStateBackend答案:D240.以下哪一项不属于创建Loader作业时必选项?A、名称B、连接C、类型D、优先级答案:D241.Hadoop系统中YARN分配给Container的内存大小,可以通过参数yarn.app.mapreduceam.resource.mb来设置。A、正确B、错误答案:B242.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在Zookeeper中。A、正确B、错误答案:A243.SparkStreaming计算基于DStream,将流式计算分解成一系列短小的批处理作业。A、正确B、错误答案:A244.以下关于大数据和传统数据库故据的特点描述不正确的是?A、大数据是对“池塘中的鱼”进行数据处理,目标明确;传统数据库的数据处理,是通过某些“鱼”判断其他种类的”鱼”是否存在B、大数据处理的数据类型很多,包括结构化、非结构化和半结构化的数据;传统故据库的故据类型较为单一常以结构化数据为主C、在大数据中,并没有统一的数据工具,即"Nosizefitsall";在传统数据库中,在某种特定业务场景下,常常一个工具就能解决某个问题,即"One

Sizefitsall"D、大数据的数据规模很大,一般以TB、PB作为数据处理单位;传统数据库中数据规模一般较小常以MB作为数据处理单位答案:A245.HBbase默认使用什么组件作为其底层文件存储系统?A、FileB、KafkaC、MemoryD、HDFS答案:D246.HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据

信息,以此获取所读文件在DataNode中的位置。A、正确B、错误答案:A247.华为云MapReduce服务提供租户完全可控的一站式企业级大数据集群云服务,完全兼容开源接口,结合华为云计

算、存储优势及大数据行业经验,为客户提供高性能、低成本、灵活易用的全栈大数据平台,轻松运Hadoop,Spark,Hbase,Kafka、Storm等大数据组件,实现实时与离线的分析挖掘发现全新企业商机。A、正确B、错误答案:A248.以下不属于KrbServer核心要素的是?A、KDC(KeyDistributionCenter)B、KerberosClientC、KerberosKDCClientD、KerberosKDCServer答案:C249.Flume数据采集过程中,下列选项中能对数据进行过潓和修饰的是A、ChannelB、ChannelSelectorC、InterceptorD、Sink答案:C250.Hadoop系统中,如果HDFS文件系统的备份因子是3,那么Mapreduce每次运行Task都要从3个有副本的机器上

传输需要处理的文件段。A、正确B、错误答案:B251.Hadoop平台中启用YARN组件的日志聚集功能需要配置哪个参数?A、YARN.nodemanager.local-dirB、YARN.nodemanager.log-dirsC、YARN.acl.enableD、YARN.log-aggregation-enable答案:D252.使用Loader进行数据导入和导出时,必须经过Reducel阶段进行数据处理。A、正确B、错误答案:A253.FusioninsightHD中loader从SFTP服务器导入文件时,不需要做编码转换和数据转换目速度最快的文件类型是以

下项?A、sequence_fileB、text_fileC、binary_fileD、graph_file答案:C254.以下那些是华为鲲鹏处理器的特点A、高效能计算兼容ARM架构的高性能华为鲲鹏处理器和x86架构服务器和解决方案B、安全可靠,铸就稳如泰山的高品质C、开放生态支持业界主流软硬件,与开发者、伙伴和产业组织共同打造智能计算新底座D、以上全部正确答案:D255.KafkaProducer数据总体流程是Producer连接任意存活的Broker,请求指定topic、partition的leader元数据信息,

然后直接与对应的Broker直接连接发布数据。A、正确B、错误答案:A256.下列关于Sparkstreaming和Streaming比较说法不正确的是?A、Sparkstreaming是一个微批处理框架事件需要枳累到一定量时才进行处理B、Streaming的执行逻辑是即时启动运行完后再回收C、Sparkstreaming的吞吐量大约是Streaming的2-5倍D、Sparkstreaming事件处理时延比Streaming更高答案:B257.在Flink中,checkpoint机制能够保证应用在运行过程中出现失败时,从某一个检查点恢复,在此过程中,流快

照是根据数据流入顺序依次创建的。A、正确B、错误答案:A258.HBaseM主Master;是如何选举的?A、随机选取B、由RegionServer进行裁决C、通过Zookeeper进行裁决D、HMaster为双主模式,不需要进行裁决答案:C259.MapReduce在Map阶段的bine是一个预分组过程是可选的。A、正确B、错误答案:B260.Hadoop中,如果将yarn.scheduler.capacity.rootQueue.minimum-user-limipercent设置为50,下面说法错误的是?A、一个用户提交任务,可以使用Queuear的100%的资源B、Queuear中必须保瞳毎个用户至少得到50%的资源C、如果Queue.中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资D、Queuea中的每个用户最多只能获得50%的资源答案:D261.FusioninsightHD系统中HDFS默认BlockSize是多少?A、32MB、64MC、128MD、256M答案:C262.FusioninsightHD产品中,一个典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一个Zookeeper集群。A、正确B、错误答案:A263.哪个模块是负责FusioninsightManager用户数据存储的?A、CASB、AOSC、KerberosD、LDAP答案:D264.大数据体量的不断增加对数据存储的物理安全性要求越来越高,对数据的多副本与容灾机制也提出更高的要求。A、正确B、错误答案:A265.HiveServer将用户提交的HQL语句进行编译解析成对应的Yarn任务、Spark任务或者HDPS操作,从而完成数据

的提取、转换、分析。A、正确B、错误答案:A266.MapReduce的核心理念是将一个大的计算任务分解到集群每个节点上充分运用集群资源缩短运行时间。A、正确B、错误答案:A267.Hive中的这条命令"ALTERTableemployeeladdcolumns(columnlstring);"是什么含义?A、删除表B、增加列C、创建表D、修改文件格式答案:B268.创建Loader作业时,可以在以下哪个步骤中设置Map数?A、输出B、输入设置C、转换D、基本信息答案:A269.以下关于Hive特性的描述不正确的是?A、灵活方便的ETLB、仅支持MapReduce计算引擎C、可直接访问HDFS文件以及HBaseD、易用易编程答案:B270.YARN中默认的资源调度器是?0A、FIFO调度器B、容量调度器C、Fairi词度器D、以上全不正确答案:B271.以下哪些选项属于FusioninsightSPARKSQLA的优点?A、支持数据插入、更新和删除B、长稳测试C、稳定和高性能D、SQL兼容性E、以上全部正确答案:E272.HBase的分布式存储的最基本单元是Region。A、正确B、错误答案:A273.HDFS联邦机制下,各NameNode间元数据是不共享的。A、正确B、错误答案:A274.创建Loader作业中,可以在以下哪个步骤中设置过滤器类型?A、输入设置B、转换C、输出D、基本信息答案:A275.Hive中"Groupby'指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进

行数据分组处理。A、正确B、错误答案:A276.Zookeeper所有节点都可以处理请求。A、正确B、错误答案:A277.FusioninsightHD集群三层组网时管理节点、控制节点、数据节点建议安装在不同的网段内,可以提高可靠性。A、正确B、错误答案:A278.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表答案:A279.spark的核心模块是?A、sparkstreamingB、sparkcoreC、mapreduceD、sparksql答案:B280.HBase中当一个Region的size逐渐变大时,它可能会被修剪。A、正确B、错误答案:B281.FusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个Consumer和一个zookeeper集群。A、正确B、错误答案:B282.下面关于Zookeeper的持性描述错误的是?A、客户端所发送的更新会按照他们被发送的顺序进行应用B、一条消息要被超过半故的Server接收,他将可以成功写入磁盘C、消息更新只能成功或失败,没有中间状态D、Zookeeper节点数必须为奇数个答案:D283.Zookeeper的增强特性包括在审计日志中添加ephemeralnode被删除的审计日志。A、正确B、错误答案:A284.以下关于HiveSQL基本操作描述正确的是A、加载数据到Hive时源数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建表时可以指定列分隔符D、创建外部表使用external关键字,创建普通表需要指定internal关键字答案:C285.为了考虑性能最优化,建议将所有集群中LdapServer都与KrbServer部署在相同节点上。A、正确B、错误答案:A286.Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提眼转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。A、正确B、错误答案:A287.FusionlnsightHD集群中,根据磁盘规划建议,/srv/BigData分该部署在什么磁盘上?A、OS盘OB、元数据盘OC、数据盘OD、管理盘答案:A288.Redis判断一个键是否存在使用exist命令。A、正确B、错误答案:A289.FusioninsightHD的Loader在创建作业时连接器有什么作用?A、确定有哪些转换步骤B、提供优化参数提供数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接答案:C290.FusioninsightHD系统审计日志不可以记录下面哪些操作()A、刪除服务实例B、启停服务实例C、手动消除告营D、查询历史监控答案:D291.SolrCloud模式是集群模式,在此模式下Solr服务器强依赖于以下哪个服务?A、HBaseB、HDFSC、ZooKeeperD、YARN答案:C292.Redis支持多数据库。A、正确B、错误答案:A293.FusioninsightHD的HBase中保存一张用户信息表meg_table,Rowkey为用户id,其中一列为用户昵称,现在按先后

顺序往这列写入三个KeyValue:001:Li,001:Mary,001:Lily,请问scan'meg_table',(VERSION=>2)会返回哪几条数据?A、001:LilyB、001:LiC、001:Mary,001:LilyD、001:Li,001:Mary,00l:Lily答案:D294.Watermark是ApacheFlink

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论