版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第页大数据HCIA练习试题附答案1.FuskmlnsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案适合什么样的场景?A、30节点以下B、100节点以上C、100-200节点D、200节点以上【正确答案】:A2.在Zookeeper的服务模型中,Leader节点以主备模式存在,其他节点都属于Follower节点。A、对B、错【正确答案】:B3.Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正确答案】:D4.关于Hive在FusionlnsightHD中的架构描述错误的是?A、只要有一个HiveServer不可用,整个Hive集群便不可用B、HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果C、MetaStore用于提供原数据服务,依赖于DBServerD、在同一时间点HiveServeir只有一个处于Active状态,另一个则处于Standby状态【正确答案】:A5.大数据需要传统行业思维的转变,要把数据收集,分析中作为业务流程的重要组成,数据端驱动业务流程优化,实现智能化和自动化,并依托数据资产实现跨界拓展A、正确B、错误【正确答案】:A6.关于Hive与传统数据仓库的对比,以下描述错误的是?A、Hive元数据存储独立于数据存储之外,从而解耦合元数据和数据,灵活性高,而传统数据仓库数据应用单一,灵活性低B、Hive基于HDFS存储,理论上存储量可无限扩展,而传统数据仓库存储量会有上限C、由于Hive的数据存储在HDFS中,所以可以保证数据的高容错,高可靠D、由于Hive基于大数据平台,所以查询效率比传统数据仓库快【正确答案】:D7.kafkalogssegment文件命名规则是partion全局的第一个segment从0开始,后续每个segment文件名为上一个全局partion的最大offset(偏移message数)。
()A、TRUEB、FALSE【正确答案】:A8.ResourceManager采用高可用方案,当Activeresourcemanager发现故障时,只能通过内置的zookeeper来启动standby的resourcemanager,将其状态切换为active。A、TrueB、False【正确答案】:B9.在Flink技术架构中,()是流处理和批处理的计算引擎A、Standalone
B、RuntimeC、DataStreamD、FlinkCore
【正确答案】:B10.二级索引为hbase提供了按照某些列的值进行索引的能力,二级索引先查索引表,再定位到数据表中的位置,不用全表扫描A、trueB、false【正确答案】:A11.为了保障流应用的快照存储的可靠性,快照主要存储在哪里?A、jobManager的内存中B、可靠性高的单机数据库中C、本地文件系统中D、hdfs中【正确答案】:D12.Hive在load是不检索数据是否符合schema的,hive遵循的是schemaonread(读时模式)只有在读时模式的时候才检查hive的数据字段,schema。A、TRUEB、FALSE【正确答案】:A13.关于FusionInsightHDStreaming的Supervisor描述正确的是?A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件。【正确答案】:B14.安装FusionInsightHD的Streaming组件Nimbus角色要求安装几个节点?A、4B、3C、2D、1【正确答案】:C15.SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。A、TRUEB、FALSE【正确答案】:B16.为减少写入磁盘的数据量,mapreduce支持对MOF(mapoutfile)进行压缩后再写入。A、TrueB、False【正确答案】:B17.FusionInsightManager对服务的配置功能说法不正确的是?A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效【正确答案】:C18.以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegionServer是Hbase的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移【正确答案】:B19.Hive不支持超时重试机制。A、TRUEB、FALSE【正确答案】:B20.如图,以下关于kafka消息消费者Consumer读取消息的描述,错误的有?()A、图片中的蓝色为kafka的一个topic,即可以理解为队列,每个格子代表一条消息。B、生产者产生的消息逐条放到topic的末尾。C、消费者从右至左顺序读取消息。D、Consumer使用offset来记录读取的位置。【正确答案】:C21.在Flink中,checkpoint机制能够保证应用在运行过程中出现失效时,从某一个检查点恢复,在此过程中,流快照是根据数据流入建立的A、TRUEB、FALSE【正确答案】:A22.下图展示了文件A、B、C、D的存放位置,其中文件A和B具有关联性,它们的存储位置符合Colocation同分布策略。A、TRUEB、FALSE【正确答案】:B23.下图为HDFS分级存储的配置,如果block的副本数为4,则以下说法错误的是?()A、4个block都将写入RAM_DISKB、如果是第1个副本之外的其它副本写入失败,则尝试写入“副本的备选存储策略”指定的存储类型C、第1个block副本将写入RAM_DISK,其余副本写入DISKD、如果第1个block副本写入RAM_DISK失败,则尝试写入“备选存储策略”指定的存储类型【正确答案】:A24.FusionInsightHD系统中,HBase支持动态扩展列。()A、TRUEB、FALSE【正确答案】:A25.Flink是一个批处理和流处理结合的统一计算框架,其核心是一个数据分发以及并行化计算的流数据处理引擎。A、对B、错【正确答案】:A26.在FusionInsight产品中,关于创建Kafka的Topic,以下哪些描述是正确的?A、在创建Kafka的Topic时,必须设置Partition个数B、创建Kafka的Topic时,必须设置Partition副本个数C、设置多副本可以增强Kafka服务的容灾能力D、以上全都正确【正确答案】:C27.创建Loader作业时,可以在以下哪个步骤中设置Map数?A、输出B、输入设置C、转换D、基本信息【正确答案】:A28.Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是()A、ChannelB、ChannelSelectorC、InterceptorD、Sink【正确答案】:C29.下列哪条HDFS命令可用于检测数据块的完整性?A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1【正确答案】:A30.Hive不适用于以下哪个场景A、非实时分析,例如日志分析,统计分析B、数据挖掘,例如用户行为分析,兴趣分析,区域展示C、数据汇总,例如每天,每用户点击数,点击排行D、实时在线数据分析【正确答案】:D31.在FusionInsightHD中,创建Loader作业的进行数据转换的正确步骤是()A、加载、转换、输出B、输入设置、转换、输出C、加载、转化、抽取D、抽取、转换、输出【正确答案】:B32.在fusionlnsight产品中,关于kafka的topic.以下描述不正确的是?A、topic的partition数量可以创建时配置B、每个topic只能被分成一个partition区C、每条发布到kafka的消息都有一个类别,这个类别被称为topic.也可以理解为一个存储消息的队列D、每个partition在存储层面对应一个log文件,log文件中记录了所有的消息数据【正确答案】:B33.HDFS联邦机制下,各NameNode间元数据是不共享的。A、TRUEB、FALSE【正确答案】:A34.FusionInsight是华为企业级大数据存储、查询、分析的统一平台,能够帮助企业快速构建海量数据信息处理系统,通过对海量信息数据实时与非实时的分析挖掘,发现全新价值点和企业商机。()A、TRUEB、FALSE【正确答案】:A35.部署FusionInsightHD时,同一集群内的FlumeServer节点建议至少部署几个?A、1B、2C、3D、4【正确答案】:B36.Hadoop的NameNode用于存储文件系统的元数据。A、正确B、错误【正确答案】:A37.在Fusionlnsight集群规划部署时,建议管理节点最好部署()个,控制节点最少需要部署()数据节点最少需要部署()个。A、1,2,2B、1,3,2C、2,3,1D、2,3,3【正确答案】:D38.Hive中的“Groupby”指的是通过一定规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理。A、TrueB、False【正确答案】:A39.FusionInsightHD系统中,flume数据流在节点内不需要经过哪个组件?()A、sinkB、topicC、SourceD、Channel【正确答案】:B40.在Streaming中,消息可靠性级别中精确一次是通过ACK机制来实现的。A、TRUEB、FALSE【正确答案】:B41.FusionInsightHD系统中,集群中一个Loader节点异常,其他服务没有异常的情况下,不会影响Loader服务功能的正常使用A、对B、错【正确答案】:A42.对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求A、trueB、false【正确答案】:A43.FusionInisghtHD集群安装成功后,不允许修改服务、角色和实例的配置。A、正确B、错误【正确答案】:B44.HBase中MOB数据直接HFile的格式存储在HDFS上,然后把这个文件的地址信息及大小信息作为value存储在管理HBase的store上,通过工具集中管理这些文件。这样就可以大大降低HBase的compation和split频率,提升性能。A、TRUEB、FALSE【正确答案】:A45.FusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个Consummer和一个zookeeper
集群?A、trueB、false【正确答案】:B46.Solr创建Collection时,推荐选用路由算法为compositldRouter,那么该Collection可以拓展shard。A、正确B、错误【正确答案】:B47.HBase的BloomFilter是用来过滤数据的。()A、TRUEB、FALSE【正确答案】:B48.FusionlnsightHD系统中,LDAP数据同步方式是哪个?A、单向同步B、双向同步C、隔离不同步D、数据交叉同步【正确答案】:A49.YARN中默认的资源调度器是?()A、FIFO调度器B、容量调度器C、Fair调度器D、以上全不正确【正确答案】:B50.在Hive中,以下关于分区的描述不正确的是()A、分区下可再有分区或者桶B、数据表可以按照某个字段的值划分分区C、每个分区是一个目录D、分区数量是固定的【正确答案】:D51.关于Hive建表的基本操作,描述正确的是?A、创建外部表的时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再增加新列【正确答案】:A52.Zookeeper在分布式应用中的主要作用不包括一下哪些选项?A、选举Master节点B、保证各节点上数据的一致性C、分配集群资源D、存储及群中服务器信息【正确答案】:C53.Flink中的()接口用于流数据处理,()接口用于批处理?A、DataStreamAPI,DataSetAPIB、DatabatchAPI,DataStreamAPIC、StreamAPI,BatchAPID、BatchAPI,StreamAPI【正确答案】:A54.如果需要由数据生产者决定数据发送给目标Bolt的某一个确定的Task,应选择以下哪种消息发布策略A、局部字段分组B、广播分组C、直接分组D、全局分组【正确答案】:C55.FusionInsightHD的Streaming是基于开源ApacheStorm开发的,Storm是一个分布式的离线计算框架。A、对B、错【正确答案】:B56.topology在任务完成后会自动结束运行。()A、TRUEB、FALSE【正确答案】:B57.Hadoop的HBase不适合哪些数据类型的应用场景?A、大文件应用场景B、海量数据应用场景C、高吞吐率应用场景D、半结构化数据应用场景【正确答案】:A58.以下关于HiveSQL基本操作描述正确的是()A、加载数据到Hive时源数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建表时可以指定列分隔符D、创建外部表使用external关键字。创建普通表需要指定internal关键字【正确答案】:C59.Hadoop中,如果将yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent设置为50,下面说法错误的是?A、一个用户提交任务,可以使用QueueA的100%的资源B、QueueA中的每个用户最多只能获得50%的资源
C、如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源D、QueueA中必须保障每个用户至少得到50%的资源
【正确答案】:B60.哪个不是Flume的channel类型A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel【正确答案】:D61.FusionInsight中Hive包含2个角色,HiveServer和MetaStore.A、TRUEB、FALSE【正确答案】:A62.FusionInsightHD系统中HDFS默认BlockSize是多少?A、32MB、64MC、128MD、256M【正确答案】:C63.FusionInsightHD产品中,一个典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一个Zookeeper集群A、TrueB、False【正确答案】:A64.Flink适用于高并发处理数据、毫秒级时延的应用A、TrueB、False【正确答案】:A65.FusionlnsightHDLoader作业前后,需要哪些节点与外部数据源通讯?A、Loadeir服务主节点B、运行Yarn服务作业的节点C、前面两个都需要D、前面两个都不需要【正确答案】:C66.以下关于Flink关键特性描述不正确的是?A、SparkStreaming与Flink相比,时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint实现了Flink的容错【正确答案】:A67.flume架构中,一个Source可以连接多个channel。()A、TRUEB、FALSE【正确答案】:A68.华为FusionInsight中,hbase的表设计工具、连接池管理和增强的SDK,可以简化复杂数据表的业务开发。()A、TRUEB、FALSE【正确答案】:A69.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正确答案】:A70.FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点小于200的集群场景。A、正确B、错误【正确答案】:A71.Kafka中partitionreplication之间同步数据,从partition的leader复制数据到follower需要线程
(replicationFetcherThread),Follower(一个follower相当于consumer)主动从leader批量拉取消息的,这极大提高了吞吐量。A、TrueB、False【正确答案】:A72.Flink是一个批处理和流处理结合的计算框架,其核心是一个数据分类以及并行化计算的流数据处理引擎。()A、TRUEB、FALSE【正确答案】:A73.Flume用于收集数据,其传输的数据基本单位是?A、SplitBlockC、EventD、Packet【正确答案】:C74.SparkOnYARN模式下,没有部署NodeManager的节点不能启动executor执行TaskA、对B、错【正确答案】:A75.Flume的数据流可以根据headers的信息发送到不同的Channel中。A、TrueB、False【正确答案】:A76.Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别()A、TRUEB、FALSE【正确答案】:A77.HBase的数据文件HFile中一个KeyValue格式包含Key,Value,TimeStamp,KeyType等内容A、TRUEB、FALSE【正确答案】:A78.在Flink的运行流程中,负责申请资源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正确答案】:B79.Kafka日志的清理方式有两种:delete和compact。默认值是delete。A、TRUEB、FALSE【正确答案】:A80.Hive中“UNIONALL”操作符用于合并两个过多个SELECT语句的结果集,结果集中,不允许有重复的值。()A、TRUEB、FALSE【正确答案】:B81.可以通过以下哪个命令创建节点数据?A、get/nodeB、create/nodeC、set/nodedataD、ls/node【正确答案】:B82.以下哪个不属于Hadoop中MapReduce组件的特点?A、易于编程B、良好的拓展性C、实时计算D、高容错性【正确答案】:C83.HDFS支持大文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。A、正确B、错误【正确答案】:B84.HBase中Region的物理存储单元是什么A、RegionB、ColumnFamilyColumnD、Row【正确答案】:B85.华为FusionInsightHD系统中关于HDFS的DataNode的说法正确的是?A、不会检查数据的有效性B、周期性地将本节点的Block相关信息发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的【正确答案】:B86.Loader仅支持关系型数据库与HBase之间的数据导入导出。A、对B、错【正确答案】:B87.hbase的底层数据以()的形式存在的?A、keyvalueB、列存储C、行存储D、实时存储【正确答案】:A88.在FusionInsight产品中,关于KafkaTopic,以下描述不正确的有?A、每个Topic只能被分成一个partition(区)B、Topic的partition数量可以在创建时配置C、每个Partition的存储层面对应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的消息都有一个类别,这个类别被称为Topic,也可以理解为一个存储消息的队列【正确答案】:A89.FusionInsightManager界面上,当收到kafka磁盘容量不足告警,且读告警的原因已经排除磁盘硬件故障时,系统管理员需要考虑扩容解决此问题。()A、TRUEB、FALSE【正确答案】:A90.FusionInsightHD系统审计日志不可以记录下面哪些操作()A、删除服务实例B、启停服务实例C、手动清除告警D、查询历史监控【正确答案】:D91.HBase中数据存储的文件格式是什么?A、HFileB、HLogC、TextFileD、SequenceFile【正确答案】:A92.Spark应用运行时,如果某个Task运行失败则导致整个app运行失败。A、对B、错【正确答案】:B93.FusionInsightHD中Loader作业提交到YARN后,作业不能手动停止。A、对B、错【正确答案】:B94.FusionInsightManager界面上,当收到kafka擦盘容量不足警告,且该警告的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决此问题。()A、TRUEB、FALSE【正确答案】:A95.HBase元数据MetaRegion路由信息保存在哪里?A、Root表B、ZookeeperC、HMasterD、Meta表【正确答案】:B96.以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是?A、同时写入磁盘和内存B、先写磁盘再写内存C、仅写入内存D、先写内存再写磁盘【正确答案】:B97.以下关于ZooKeeper关键特性中的原子性说法正确的是A、客户端发送的更新会按照他们被发送的顺序进行应用B、更新只能全部完成或失败,不会部分完成C、一条消息被一个server接收,将被所有server接收D、集群中无论哪台服务器,对外展示的均是同一视图【正确答案】:B98.Hive在load时是不检查数据是否符合schema的,hive遵循的是schemaonread(读时模式),只有在读的时候hive才检查、解析具体的数据字段、schema。
()A、TRUEB、FALSE【正确答案】:A99.HDFS中Namenode的主备仲裁,是由哪个组件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController【正确答案】:D100.以下哪些选项属于Hive的数据存储模型?以上全都正确A、表B、桶C、数据库D、分区【正确答案】:A101.创建loader作业中,可以在以下哪个步骤中设置过滤器类型?()A、输入设置B、转换C、输出D、基本信息【正确答案】:A102.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,不会保存消息。A、对B、错【正确答案】:B103.下列哪个命令是从HDFS下载目录/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put【正确答案】:C104.Hadoop系统中,如果HDFS文件系统的备份因子是3,那么MapReduce每次运行Task都要从3个有副本的机器上传输需要处理的文件段。A、对B、错【正确答案】:B105.SparkStreaming计算基于DStream,将流式计算分解成一系列短小的批处理作业。()A、TRUEB、FALSE【正确答案】:A106.Kafka集群中,Kafka服务端的角色是?A、ProducerB、ConsumerC、ZookeeperD、Broker【正确答案】:A107.FusionInsightHDHBase默认使用什么作为其底层文件存储系统?A、HDFSB、HadoopC、MemoryD、MapReduce【正确答案】:A108.下图所示的Map阶段,是描述哪个过程?
A、PartitionB、SortC、Splill/MergeD、combine【正确答案】:D109.HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置由DataNode确定。A、正确B、错误【正确答案】:A110.HDFS的Client写入文件时,数据的第一副本写入位置由NameNode确定,其他副本的写入位置由DataNode确定。A、对B、错【正确答案】:A111.Flink采用checkpoint机制保障应用程序运行中的容错性。A、TRUEB、FALSE【正确答案】:A112.YARN上有两个同级队列Q1与Q2,容量都是50%,Q1上已经有10个任务共占用了40的容量,Q2上有两个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。A、对B、错【正确答案】:B113.FusionlnsightManager对服务的管理操作,下面说法错误的是?A、可对服务进行启停重启操作B、可以添加和卸载服务C、可设置不常用的服务隐藏或显示D、可查看服务的当前状态【正确答案】:C114.下图展示的flume架构,主要应用于集群外的数据导入到集群内。()A、TRUEB、FALSE【正确答案】:A115.SoIrCloud模式是集群模式,在此模式下Solr服务器强依赖于以下哪个服务?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正确答案】:C116.YARN服务中,如果要给队列QuqueA设置容量为30%,应该配置哪个参数?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.capacityD、yarn.scheduler.capacity.root.QueueA.state【正确答案】:C117.Kerberos只能对集群内的服务提供安全认证。A、正确B、错误【正确答案】:B118.关于FusionlnsightHD中Loader作业描述正确的是?A、Loader将作业提交到Yam执行后,如果此时Loader服务异常,则此作业执行失败。B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后,该作业执行完成前,不能再提交其他作业【正确答案】:B119.下列关于SparkStreaming和Streaming比较说法不正确的是?A、SparkStreaming是一个微批处理框架,事件需要积累到一定量时才进行处理B、Streaming的执行逻辑是即时启动,运行完后再回收C、SparkStreaming的吞吐量大约是Streaming的2-5倍D、SparkStreaming事件处理时延比Streaming更高【正确答案】:B120.Flume的perties配置文件可以配置多个channel来传输数据。A、对B、错【正确答案】:A121.FusionInsightHD平台中,HBase暂不支持二级索引A、对B、错【正确答案】:B122.现有3个机架,有一个文件需要存3份,其中副本1和副本2存放在与client相同的机架且不同的服务器上。根据HDFS的副本放置策略一定要存放在其他机架。A、TRUEB、FALSE【正确答案】:B123.华为FusionInsightHD是国内首家符合国家金融等级保护的大数据平台,其安全性现在以下哪些方面?A、系统安全B、权限认证C、数据安全D、以上全都正确【正确答案】:D124.对于容量调度器的任务选择,以下说法正确的是()A、最小队列层级优先B、资源回收请求队列优先C、最大队列层级优先D、资源利用量最低的队列优先【正确答案】:B125.HDFS中的主备仲裁,是由哪个组件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正确答案】:A126.HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息,以此获取所读文件在DataNode中的位置。A、对B、错【正确答案】:A127.下面关于Zookeeper特性的描述错误的是?()A、Zookeeper节点数必须为奇数个。B、客户端所发送的更新会按照它们被发送的顺序进行应用。C、消息更新只能成功或者失败,没有中间状态。D、一条消息要被超过半数的Server接收,它将可以成功写入磁盘【正确答案】:A128.FusionInsightHD部署过程中,执行precheck检查每个节点时必须调用
CheckNode.Config配置文件。A、正确B、错误【正确答案】:A129.关于RDD,下列说法错误的是?A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘C、RDD是一个只读的,可分区的分布式数据集D、RDD是Spark对基础数据的抽象【正确答案】:B130.通常情况下,Hive以文本文件存储的表会以回车作为其行分隔符,在华为FusionInsightHive中,可以指定表数据的输入和输出格式处理类。()A、TRUEB、FALSE【正确答案】:A131.某用户需要搭建一个350节点的FusionlnsightHD集群,哪种规划方案最佳?A、管理节点、控制节点、数据节点合一部署,二层组网B、管理节点、控制节点合一部署、数据节点独立部署,二层组网C、管理节点、控制节点、数据节点都独立部署,三层组网D、管理节点、数据节点合一部署,控制节点独立部署,二层组网【正确答案】:C132.假设HDFS在写入数据时只存2份,那么在写入过程中,HDFSClient先将数据写入DataNode1,再将数据写入DataNode2。()A、TRUEB、FALSE【正确答案】:B133.sparkStreaming容错机制是指RDD中任意的partition出错,都可以根据其父
RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。()A、TRUEB、FALSE【正确答案】:B134.如果某些Container的物理内存利用超过了配置的内存阈值,但所有Container的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的Container仍可以继续运行。()A、TRUEB、FALSE【正确答案】:A135.Spark和Hadoop都不适用于迭代计算的场景。A、对B、错【正确答案】:B136.kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消息系统。()A、TRUEB、FALSE【正确答案】:A137.以下关于FusionInsightCTBase的描述不正确的是?A、CTBase的读写数据接口,统一封装了行定义的接口,自动进行冷字段的合并和解析,不需要在应用程序中进行合并解释B、CTBase是基于HBase的聚簇表开发框架CTBase提供了一套WebUI进行元数据定义,提供了只管医用的表设计工具,降低表设计的难度D、CTBase的javaAPI提供一套HBase连接池管理的接口,内部进行连接共享,减少客户端应用开发难度。【正确答案】:B138.Flume支持监控并传输目录下新增的文件,可实现数据传输,以上描述的是哪一类source?A、spoolingdirectorysourceB、httpsourceC、execsourceD、syslogsource【正确答案】:A139.Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供了javaAPI以便其他组件对接使用,在FusionInsight解决方案中,Kafka属于FusionInsightHD模块。A、TrueB、False【正确答案】:A140.kafka-clustermirroring工具可以实现以下那些功能?A、kafka集群数据同步方案B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对【正确答案】:A141.Spark任务的每个stage可划分为job,划分的标记是shuffle。A、正确B、错误【正确答案】:B142.在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作()A、执行HiveDDL操作B、行MapReduce任务C、运行HiveHQL任务D、以上全部正确【正确答案】:D143.Flink中的checkpoint机制不断绘制流应用的快照,流应用的状态快照只能保存在HDFS文件系统中。A、对B、错【正确答案】:B144.Flink中的()接口用于流数据处理,()接口用于批处理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI【正确答案】:B145.导入数据到Hive表时,不会检查数据合法性,只会要读取数据时候检查。A、TRUEB、FALSE【正确答案】:A146.在YARN的任务调度流程中,下列哪个是ApplicationMaster负责的任务?A、申请和领取资源B、为任务设置好运行环境C、分配ContainerD、启动Map或Reduce任务【正确答案】:A147.在规划FuskmlnsightHD集群时候,如果客户用于功能测试,对性能没有要求,节约成本的情况下,可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3C、4D、5【正确答案】:B148.YARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.stateD、yarn.scheduler.capacity.root.QueueA.maximum-capacity【正确答案】:D149.Flink与SparkStreaming类似,属于事件驱动型实时流系统A、对B、错【正确答案】:B150.Spark应用在运行时,Stage划分的依据是什么?A、taskB、taskSetC、actionD、shuffle【正确答案】:D1.下图展示了HDFS的标签存储策略,观察下图,HBase的数据会被存储到哪些数据节点上A、ataNodeAB、ataNodeBC、ataNodeED、ataNodeF【正确答案】:AB2.FusionlnsightHD产品中,关于Kafka组件说法正确的有?A、删除Topic时,必须踊保Kafka的服务配置delete.topic.enable配置为trueB、Kafka安装及运行曰志保存路径为/srv/Bigdata/kafkaC、ZooKeeper服务不可用会导致Kafka服务不可用D、必须使用admin用户或者Kafkaadmin组用户进行创建Topic【正确答案】:ACD3.FusionlnsightHDV100R002C60版本集群中,以下哪些组件需要规划元数据分区?A、HDFSB、ZookeeperC、StreamingD、RedisE、HBaseF、Kafka【正确答案】:ABC4.HBase集群定时执行Compaction的目的是什么?(ACD)[]A、减少同一个Region同一个ColumnFamily下的文件数目B、减少同一个Region的文件数目C、提升数据读取性能D、提升数据写入能力【正确答案】:ACD5.FusionInsightManager会定时备份哪些数据?A、NameNodeB、LDAPC、OMSDBService【正确答案】:BC6.在华为大数据解决方案中,hadoop底层包含以下那些组件?A、finkB、hiveC、minerD、spark【正确答案】:ABD7.安全模式下安装FusionlnsightHD集群时,哪些组件是必须安装的?、A、ZooKeeperB、LDAPServerC、KrbServerD、HDFS【正确答案】:BC8.FusionInsightManager与外部平台对接时,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog【正确答案】:AD9.以下关于FusionInsight中CarbonData说法正确的有?()A、carbon也是一种将数据源与spark集成的高性能分析引擎。B、carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少
60%~80%数据存储空间,大大节省硬件存储成本。C、carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储、索引、压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更快的交互查询。D、使用carbon的目的是对大数据即席查询提供超快速响应。【正确答案】:ABCD10.FusionInsightHD系统中使用Streaming客户端shell命令提交了拓扑之后,使用StromUI查看发现该拓扑长时间没有处理数据,可能原因有?()A、Supervisor是在topology中接收数据然后执行处理的组件B、拓扑业务存在逻辑错误,提交之后无法正常运行C、拓扑过于复杂或者并发太大,导致worker启动时间太长,超过Supervisor的等待时间D、Supervisor的slots资源被耗尽,拓扑提交上去之后分不到slot去启东worker进程【正确答案】:BCD11.FusionlnsightHDLoader可以将HDFS数据导出到以下哪些目标端?A、SFTP服务器B、FTP服务器C、Oracle数据库DB2数据库【正确答案】:ABCD12.Loader提供了哪些方式或接口实现作业管理?A、WEBUIB、Linux命令行C、REST接口D、JavaAPI【正确答案】:ABCD13.采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用以下哪种Channel类型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正确答案】:BC14.Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有()A、帮助用户迅速找到资源消耗最高的节点,采用适当的措施B、通过每个服务主页的资源分布查看界面,查看到关键的资源分布情况C、可以帮助用户快速聚集在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况。例如内存占有率在50-75%的主机列表,并提供链接跳转【正确答案】:ABCD15.下列选项中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正确答案】:BCD16.Flink的兼容性体现在以下哪些方面?()A、能够与hadoop原有的mappers和reducers混合使用B、YARN能够作为Flink集群的资源调度管理器C、能够使用hadoop的格式化输入和输出D、能够从本地获取数据【正确答案】:ABCD17.FusionInsightHD集群中包含了很多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?()【正确答案】:AA、HDFSB、NameNodeC、DataNodeD、Hbase【正确答案】:BC18.ZKFC进程部署在hdfs中的以下那个节点上?A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不对【正确答案】:AB19.FusionInsightHD系统中使用Streaming客户端shell命令查看拓扑或者提交拓扑失败,以下哪些定位手段的正确的?()A、查看Supervisor运行日志,判断是否Supervisor异常B、查看worker运行日志C、查看客户端异常堆栈,判断是否客户端使用问题D、查看主nimbus的运行日志,判断是否nimbus服务器异常【正确答案】:ABCD20.FusionInsightHD的HBase服务包含哪些进程?A、HMasterB、SlaveC、HRegionServerDataNode【正确答案】:AC21.FusionInsightManager与外部管理平台对接时,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正确答案】:AB22.FusionInsightHD平台中,哪些组件支持对表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正确答案】:BC23.FusionInsightHD数据高可靠性体现在以下哪些方面?()A、跨数据中心容灾B、关键数据掉电保护C、硬盘热插拔D、第三方备份系统集成【正确答案】:ABCD24.华为大数据产品FusionInsightHD中的Streaming具有哪些关键特性?()A、灵活性B、可伸缩性C、容灾能力D、消息可靠性【正确答案】:ABCD25.与开源sqoop相比,loader具有哪些增强特性?A、高可靠性B、高性能C、安全性D、图形化【正确答案】:ABCD26.以下属于hiveSQL中DDL(数据定义语言)的是?()A、修改表B、删除表C、建表D、数据导入【正确答案】:ABC27.FusionlnsightHD产品在部署Kerberos和LDAP服务是,以下描述正确的是?(多选)A、部署Kerberos服务之前,必须先部署LDAP服务B、LDAP服务必须和Kerberos服务部署在同一个节点C、Kerberos服务和LDAP服务部署同一个节点利于数据访问,有助于性能提升D、LDAP服务可以多个集群共享【正确答案】:AC28.Zookeeper中的数据节点znode分为哪几种类型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正确答案】:BD29.以下关于KafkaLogs中segmentfile的说法正确的有?A、index元数据全部映射到menory,可以避免sementfile的index数据IO磁盘操作B、索引文件稀疏存储,可以大幅减低index文件元数据占用空间大小C、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储D、通过索引信息可以快速定位message【正确答案】:ABCD30.关于SparkSQL&Hive区别与联系,下列说法正确的是?()A、SparkSQL兼容绝大部分Hive的语法和函数B、SparkSQL不可以使用Hive的自定义函数C、SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduceD、SparkSQL依赖Hive的元数据【正确答案】:ACD31.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、数据集成C、系统管理D、服务治理【正确答案】:AC32.FusionInsight家族包含下列哪些子产品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正确答案】:ABCDE33.下面关于flink窗口的描述错误的是A、滚动窗口在时间上是重叠的B、滚动窗口在时间上是不重叠的C、滑动动窗口之间时间点不存在重叠D、滑动窗口之间时间点存在重叠【正确答案】:AC34.Flink支持的时间操作类型包括以下哪些选项?A、结束时间B、处理时间C、采集时间D、事件时间【正确答案】:BD35.在loader历史作业记录中,可以查看以下哪些内容?()A、作业状态B、作业开始/运行时间C、脏数据链接D、错误行/文件数量【正确答案】:ABCD36.华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?(多选)A、YARNB、HDFSC、HiveD、HBase【正确答案】:BCD37.以下关于FusionInsight网络安全可靠性,说法正确的有()A、避免业务平面的高负载阻塞集群管理通道B、网络平面隔离,避免管理与业务宽带抢占、互相干扰C、阻止外部攻击者通过管理通道入侵实际业务数据D、FusionInsight支持将网络划分为三级:集群业务平面、集群管理平面和集群外维护网络,彼此之间实施物理隔离【正确答案】:ABCD38.HDFS的基本系统构架中包含下列哪些节点?()A、ResourceManagerB、NameNodeC、NodeManagerDataNode【正确答案】:BD39.以下关于FusionInsight多租户管理的描述正确的有()A、一站式管理租户资源,计算资源(CPU/内存/IO)、存储资源(HDFS)、服务资源,(HBase…)B、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理C、基于容器机制的租户资源隔离,为租户SLA保驾护航D、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户、按需动态增删租户【正确答案】:ABCD40.Flink流式处理的数据源类型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正确答案】:ABCD41.FusionInsightHD安装前准备,包括哪些步骤?(多选)A、完成硬件安装B、完成节点主机操作系统安装C、准备工具和软件。例如Putty、LLD、FusionInsightHD软件安装包等D、准备规划数据,例如网络参数和角色部署位置【正确答案】:ABCD42.下列哪些组件必须依赖于Zookeeper才能运行?A、HDFSB、HBaseC、SparkD、YARN【正确答案】:ABD43.在Kafka中,如下关于Producer发送数据的说法错误的是()A、Proucer负责生产数据。Consumer负责消费数据。Producer和Consumer之间需要建立连接B、Proucer既可以发送数据到Broker上。又可以发送数据到ConsumerC、Proucer作为消息生产者。可以直接将数据写入ZookeeperD、Proucer连接任意一个正常的Broker实例就可以产生数据【正确答案】:ABC44.HBase集群定时执行Compaction的目的是什么?A、减少同一Region,同一ColumnFamily下的文件数目B、提升数据读取性能C、减少同一ColumnFamily的文件数据D、减少同一Region的文件数目【正确答案】:ABD45.YARN容量调度器的主要特点有哪些()A、灵活性B、多重租赁C、动态更新配置文件D、容量保证【正确答案】:ABCD46.FusionlnsightHadop集群中,就去哪规模有70个节点,如果采用推荐部署方案,在管理节点可能存在哪些分区?A、/srv/BigData/zookeeperB、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/BigData/jumalnodeE、/srv/BigData/hadoop/data5【正确答案】:ABCD47.FusionInsightHD集群中包含多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase【正确答案】:BC48.以下哪些是Kafka实际的应用场景A、日志收集B、网站活性跟踪C、资源管理D、聚合统计系统运营数据【正确答案】:BD49.HBase中以下哪种场景会出发Flush操作?A、HBase定期刷新Memstore,默认周期为1小时B、当WALs中文件数量达到阈值时C、Region中MemStore的总大小,达到了预设的FlushSize阈值D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小【正确答案】:ABCD50.以下关于Flink与其他组件交互说法正确的是?()A、Flink的checkpoint的实现依赖于ZookeeperB、Flink可以将接收的组件发生给kafkaC、Flink任务的运行依赖Yarn来进行资源的调度管理D、Flink在HDFS文件系统中读写数据【正确答案】:ABCD51.FusionInsightHD系统中使用Streaming客户端Shell命令查看拓扑或提交拓扑失败,以下哪些定位手段是正确的?A、查看客户端异常堆栈,判断是否客户端使用问题B、查看主Nimbus的运行日志,判断是否Nimbus服务端异常C、看Supervisor运行日志,判断是否Supervisor异常D、查看Worker运行日志【正确答案】:AB52.Flume适用于以下哪些场景的数据收集?A、Thrift,Avro,Syslog,Kafka等数据源上收集数据B、本地文件数据采集C、应用系统产生的日志采集D、大量数据的实时数据采集【正确答案】:ABC53.传统数据处理的性能瓶颈有?A、数据存储成本高B、流式数据处理性能不足C、扩展能力有限D、批量数据处理缺失【正确答案】:AC54.在大数据时代,企业所面临的挑战有以下哪些?A、企业各部门间数据分散,相同数据在各部门内部存储格式不一致。B、数据结构多样化。C、竞争对手的技术进步。D、数据存在噪音、缺失、存储类型不规范等问题,需要进行大量的数据预处理工作。【正确答案】:ABCD55.HDFS系统中对备用NameNode的作用的描述正确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点【正确答案】:AC56.FusionInsightHD系统中Hive支持的存储格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正确答案】:BCD57.HBase中包含的一些典型的Filter有哪些?A、ingleColumnValueFilterB、FilterListC、RowFilterD、KeyOnlyFilter【正确答案】:ABCD58.FusionInsightManager的主要功能有以下哪些?A、数据集成B、系统管理C、安全管理D、服务治理【正确答案】:BCD59.MapReduce过程中,以下属于shuffle机制的是?()A、partitionB、sort/mergeC、copyD、combine【正确答案】:BC60.华为FusionInsightHD行业成功案例都有哪些?A、数字政府B、智慧园区C、智慧交通D、金融【正确答案】:ABCD61.Zookeeper可以为FusionInsightHD中哪些组件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正确答案】:ABCD62.关于Flume,下列说法错误的是?、A、Flume级联节点之间的数据传输支持加密B、Flume支持多级联和多路复用C、Source到Channel到Sink等进程内部有加密的必要D、Flume级联节点之间的数据传输不支持压缩【正确答案】:CD63.HBase的主要特点有哪些?A、高可靠性B、高性能C、面向列D、可伸缩【正确答案】:ABCD64.下列选项中,哪些是MapReduce一定会有的过程?A、CombineB、MapC、ReduceD、Partition【正确答案】:BCD65.关于大数据的主要特征的理解和描述正确的有哪些?A、数据来源多,格式多B、数据增长速度快,处理速度快C、数据量大,计算量大D、数据价值密度低,价值高【正确答案】:ABCD66.如图所示,下列哪些选项属于宽依赖A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正确答案】:AD67.下列哪些OS版本被推荐可以用来搭建FusionlnsightV1R2C60集群?(多选)A、SUSE11SP1/SP2/SP3forAMD64&Inter64B、CentOS6.6C、Redhat-6.4-x86_64D、RedHat-6.5-x86_64E、RedHat-6.7-x86_64F、Ubuntu6.3【正确答案】:ABCDE68.YARN中,“从”节点负责以下哪些工作?()A、集群中所有资源的统一管理和分配B、监督Container的生命周期管理C、管理日志和不同应用程序用到的附属服务D、监控每个Container的资源使用(内存,CPU等)情况【正确答案】:BD69.在FusionInsightHD中,以下哪一项不属于Hive的流控特性A、支持对已建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制【正确答案】:ABD70.以下关于KafkaPartition副本的特性描述正确的是?A、Follower通过拉取的方式从Leader中同步数据B、主副本叫做Leader,从副本叫做FollowerC、消费者和生产者都是从Leader中读写数据,也可直接与Follower交互D、副本以分区为单位。每个分区都有各自的主副本的从副本【正确答案】:ABD71.HDFS联邦环境下,NameSpace(命名空间)包含以下哪些内容()A、目录B、文件C、块D、以上全不正确【正确答案】:ABC72.FusionlnsightHD集群升级,以下描述正确的有?(多选)A、升级过程中不可以手工操作主备OMS倒换B、集群内所有主机的root账户密码保持一致C、保持网络畅通,避免因网络问题导致升级异常D、观察期不能做圹容【正确答案】:ABCD73.NodeManager的内存和CPU的数量,是通过下列哪些选项进行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正确答案】:BCD74.以下选项中,属于HDFS架构关键特性的是?()A、健壮机制B、多方式访问机制C、HA高可靠性D、元数据持久化机制【正确答案】:ABCD75.在华为大数据解决方案中,hadoop层包含以下哪些组件?()A、MinerB、SparkC、HiveD、Flink【正确答案】:BCD76.YARN通过ResourceManager对集群资源进行管理,它的主要功能有?A、集群资源调度B、应用程序管理C、日志管理D、以上说法都不对【正确答案】:AB77.FuskmlnsightHD集群中,集群规模现有300个节点,如果采用推荐部署方案,控制节点上一定不会存在哪些分区?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正确答案】:BE78.kafka消息传输保障通常有以下哪几种?()A、最多三次(AtMostThreeTimes)B、仅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正确答案】:BCD79.在Streaming的处理节点Bolt中,可以完成以下哪些操作()A、接运算B、接数据库C、滤(filter)D、务处理【正确答案】:ABCD80.spark有哪些特点?()A、快B、巧C、灵D、轻【正确答案】:ABCD81.下列哪些措施是为了保障数据的完整性A、元数据可靠性保证B、重建失效数据盘的副本数据C、安全模式D、集群数据均衡【正确答案】:ABCD82.大数据分析相关技术主要特征有哪些?A、机器学习,全量特征B、数据背后事件关联性分析C、以海量数据为基础D、以精确样本为基础【正确答案】:ABC83.以下哪些选项属于FusionInsight数据安全性?A、操作系统安全加固B、组件数据加密C、数据完整性校验D、用户权限认证管理【正确答案】:BC84.以下关于HBase的文件存储模块(HBaseFileStream,简称HFS)描述正确的有?A、应用在FusionInsightHD的上层应用B、HFS封装了HBase与HDFS的接口C、为上层应用提供文件的存储.读取.删除等功能D、HFS是HBase的独立模块【正确答案】:ABCD85.调用Zookeeper客户端命令中包含哪些信息?A、端口号B、ip地址C、服务器名称D、用户名【正确答案】:AB86.FusionlnsightManager会定时备份哪些数据?A、NameNodeB、LDAPServerC、OMSDBService【正确答案】:BC87.Flink可以基于以下哪些窗口进行统计?A、时间窗口B、滑动窗口C、会话窗口D、countWindow【正确答案】:ABCD88.大数据商业咨询服务方案在规划环节主要考虑以下哪些设计?A、大数据商业模式设计B、商业场景全景规划C、典型场景需求设计D、场景分解和业务设计【正确答案】:ABCD89.若在消息处理过程中允许部分信息丢失,关闭消息可靠性处理机制的方式有以下哪些?A、将参数Config.Topology_ACKKRS设置为0B、将参数Config.Topology_ACKKRS设置为FalseC、Spout发送消息时,使用不指定消息messageID的接口进行发送D、Bolt发送消息时使用Unanchor方式发送【正确答案】:ACD90.FusionInsight家族包含下列哪些子产品()?A、FusionInsightMinerB、FusionInsightFarmerC、FusionInsightHDD、GaussDB200【正确答案】:ABCD91.FusionlnsightManager与外部管理平台对接时,支持哪些接口?(多选)A、NMPB、VPNC、FTPD、Syslog【正确答案】:ACD92.以下哪些数据源可以通过loader实现与FusionInsightHD的数据交换?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正确答案】:ABCD93.华为大数据解决方案中平台架构包括以下哪些组成部分?()A、Hadoop层B、GaussDB200C、Datafarm层D、FusioInghtManager【正确答案】:ACD94.以下关于Zookeeper的Leader选举说法正确的是?A、当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票B、Zookeeper选举leader时,需要半数以上的票数C、当实例数为8时,则成为leader节点需要5票,容灾能力为4D、当实例数n为奇数时,假定n=2x+1,则成为leader节点需要x票【正确答案】:AB95.FusionInsightHD的Loader在创建作业时,连接器有什么作用?A、确定有哪些转换步骤B、提供优化参数,提供数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接【正确答案】:ABCD96.HDFS不适用于以下哪些场景?A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入【正确答案】:BD97.Loader可以实现以下哪些转换规则()A、空值转换B、拼接转换C、长整型时间转换D、增量转换【正确答案】:ABCD98.下列关于worker(工作进程)、Executor(线程)、task(任务)说法正确的是?()A、每个Executor(线程)可以运行多个task(任务)B、每个Executor(线程)可以运行不同组件(spout或bolt)的task(任务)C、每个worker可以运行多个Executor(线程)D、每个worker只能为一个拓扑运行Executor(线程)【正确答案】:ABCD99.以下关于HBase存储模型的描述正确的是?()A、每一个KeyValue都拥有一个Qualifier标识B、同一个key值key关联多个valueC、KeyValue中拥有时间戳、类型等关键信息D、即使是key值相同,Qualifier也相同的多个KeyValue,也可能有多个,此时使用时间戳来区分【正确答案】:ABCD100.Zookeeper的关键特性包括以下哪些选项?()A、原子性B、最终一致性C、等待无关性D、可靠性【正确答案】:ABCD101.在华为FusionInsightHD中,下面哪些组件是Flink强依赖的?()A、kafkaB、HDFSC、YARND、Zookeeper【正确答案】:BC102.FusionInsightManager界面显示Hive服务状态为Bad时,可能原因有哪些?A、DBService不可用B、HDFS服务不可用C、MetaStore实例不可用D、HBase服务不可用【正确答案】:ABC103.执行HBase数据读取业务时,需要读取哪几部分数据?A、HFileB、HLogC、MemStoreD、HMa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广东省建筑安全员-C证考试(专职安全员)题库及答案
- 2025贵州省建筑安全员-C证考试(专职安全员)题库附答案
- 2025山东省安全员知识题库及答案
- 2025河南省安全员-C证(专职安全员)考试题库
- 食品加工的原料和材料-课件
- 中医内科学-感冒
- 《教师节综合实践》课件
- 有机药化实验课件
- 《急腹症宝力道》课件
- 《运筹学》整数规划
- 智能医疗在泌尿外科手术中的数字导航
- 部编人教版语文八年级下册文言文课下注释
- 部编版三年级下册每课巩固练习题
- 运动神经元病护理课件
- 财富流游戏灯片
- 新(完整)小学三年级语文教学案例
- 新媒体运营培训课件
- 国企集团集中采购管理制度(试行)
- ZZ007 现代加工技术赛项正式赛题及评分标准完整版包括所有附件-2023年全国职业院校技能大赛赛项正式赛卷
- 锅炉维保服务投标方案(技术标 )
- 麦肯锡:企业发展战略规划制定及实施流程教学课件
评论
0/150
提交评论