版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
华为数据中台运维复习试题附答案单选题(总共40题)1.MRSHD中Loader从SFTP服务器导入文件时,不需要做编码转换和数据转换且速度最快的文件类型是()。(1分)A、graph-fileB、binary-fileC、text-fileD、sequence-file答案:B解析:
暂无解析2.部署MRS时,同一集群内的FlumeServer节点建议至少部署()个。(1分)A、1B、3C、4D、2答案:D解析:
暂无解析3.MapReduce任务最终是在下列()中被执行的。(1分)A、NodeManagerB、containerC、ResourceManagerD、AppMaster答案:B解析:
暂无解析4.下列关于Flinkbarrieer描述错误的是()。(1分)A、一个barrier将本周期快快照的数据与下一个周期快照的数据分隔开来B、barrier是Flink快照的核心C、在插入barrier的时候,会暂时阻断数据流D、barrier周期性插入到数据流中,并作为数据流的一部分随之流动答案:C解析:
暂无解析5.以下关于Flink关键特性描述不正确的是()。(1分)A、SparkStreaming与Flink相比,时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、checkpoint实现了Flink的容错D、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量答案:A解析:
暂无解析6.HBase中一个Region进行Split操作时,将一个HFile文件真正分开到两个Region的过程发生在以下()阶段。(1分)A、Split过程中B、Flush过程中C、Compaction过程中D、HFile分开过程中答案:C解析:
暂无解析7.数据中台功能架构中数据资产管理包含()能力。(1分)A、安全管理B、数据开发C、数据资产目录D、计量管理答案:C解析:
暂无解析8.假设每个用户最低资源保障设置为yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。则以下说法错误的是()。(1分)A、第3个用户提交任务时,每个用户最多获得33.33%的资源B、第2个用户提交任务时每个用户最多获得50%的资源C、第4个用户提交任务时,每个用户最多获得25%的资源D、第5个用户提交任务时,每个用户最多获得20%的资源答案:D解析:
暂无解析9.如果需要由数据生产者决定数据发送给目标Blot的某一个确定的Task,应该选择以下()消息发布策略。(1分)A、局部字段分组B、广播分组C、直接分组D、全局分组答案:C解析:
暂无解析10.MULTIXACT日志存储的内容针对的是记录的()部分。(1分)A、xminB、xmaxC、dataD、cid答案:B解析:
暂无解析11.华为8.0数据中台架构贴源层数据存储产品是()。(1分)A、MRSB、GBase8AC、DWSD、DAYU答案:A解析:
暂无解析12.MRSManager用户权限管理不支持()配置。(1分)A、给用户配置角色B、给用户组配置角色C、给角色配置权限D、给用户组配置权限答案:D解析:
暂无解析13.下列()选项不属于创建Loader作业时必须项。(1分)A、优先级B、名称C、连接D、类型答案:A解析:
暂无解析14.对于Hive中关于普通标和外部表描述不正确的是()。(1分)A、默认创建普通表B、删除外部表时,只删除外部表数据而不删除元数据C、外部表实质上是将已存在的HDFS文件路径与表关联起来D、删除普通表时,元数据和数据同时被删除答案:B解析:
暂无解析15.以下不属于CN自动剔除约束的是()。(1分)A、设置CN心跳超时时间的值大于0B、集群中的CN总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后,逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行答案:D解析:
暂无解析16.MRS产品中,关于Kafka说法不正确的是()。(1分)A、Kafka强依赖于ZooKeeperB、Kafka的服务端可以产生消息C、Kafka部署的实例个数不得小于2D、Consumer作为kafka的客户端角色专门进行消息的消费答案:C解析:
暂无解析17.Hadoop系统中YARN资源的抽象是用()表示。(1分)A、内存B、CPUC、ContainerD、磁盘空间答案:C解析:
暂无解析18.下面()子句专用于GroupBy操作中的条件过滤功能。(1分)A、WHERE子句B、HAVING子句C、LIMIT子句D、ORDERBY子句答案:B解析:
暂无解析19.下列()选项属于Hive的数据存储模型。(1分)A、桶B、数据库C、分区D、以上全都正确答案:D解析:
暂无解析20.Hive中的这条命令“ALTERTABLEEMPLOYEELADDCOLUMNS(columnsstring)”,是()含义。(1分)A、创建表B、删除表C、添加列D、修改文件格式答案:C解析:
暂无解析21.下面()不是二进制类型。(1分)A、BLOBB、RAWC、BYTEAD、TEXT答案:D解析:
暂无解析22.Flume用于收集数据,其传输的数据基本单位是:()。(1分)A、SplitB、BlockC、EventD、Packet答案:C解析:
暂无解析23.Spark是用以下()编程语言实现的。(1分)A、CB、C++C、JAVAD、Scala答案:D解析:
暂无解析24.以下扫描算子中用于对列存表进行扫描的算子是()。(1分)A、SeqScanB、CstoreScanC、SubqueryScanD、ValuesScan答案:B解析:
暂无解析25.在有N个节点MRSHD集群中部署HBase时、推荐部署()个HMaster进程,()个RegionServer进程(1分)A、3、NB、N、NC、2、ND、2、2答案:C解析:
暂无解析26.以下两种描述分别对应()分类算法的评价标准。(1分)A、Precision,RecallB、Recall,PrecisionC、Precision,RocD、Recall,Roc答案:A解析:
暂无解析27.使用Hbase客户端批量写入10条数据,某个HRegionServer节点上包含两个Region,分别是A和B,10条数据中有6条属于A,4条属于B,请问写入这10条数据需要向HRegionServer发送()RPC请求。(1分)A、10B、6C、2D、1答案:D解析:
暂无解析28.Flink的数据转换操作在以下()环节中完成。(1分)A、channelB、TransformationC、sinkD、source答案:B解析:
暂无解析29.以下最常用的整型类型是()。(1分)A、TINYINTB、SMALLINTC、INTEGERD、BIGINT答案:C解析:
暂无解析30.关于MRSStreaming的Supervisor描述正确的是()。(1分)A、.Supervisor是在Topology中接受数据然后执行处理的组件B、Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的Worker进程C、Supervisor负责资源分配和任务调度D、Supervisor是运行具体处理逻辑的过程答案:B解析:
暂无解析31.MRSHD系统中HDFS默认BlockSize是()。(1分)A、32MBB、64MBC、128MBD、256MB答案:C解析:
暂无解析32.在Spark中,假设lines是一个DStream对象,filter语句可以过滤掉80%的数据,针对以下两个语句说法正确的是:X:lines.filter(...).groupByKey(...)Y:lines.groupByKey(...).filter(...)(1分)A、X比Y的性能更高B、X比Y的性能更低C、X和Y和性能一样D、无法确性X和Y的性能差异答案:A解析:
暂无解析33.当zookeeper集群节点数为5时,请问集群的容灾能力和()节点时等价的。(1分)A、3B、4C、5D、以上全不正确答案:B解析:
暂无解析34.关于Streaming的拓扑(Topology),下面描述错误的是()。(1分)A、一个Topology是由一组Spout组件和Bolt组件通过StreamGroupings进行连接的有向无环图(DAG)B、Topology会一直运行,直到它被显式killC、业务逻辑都被封装Topology中D、一个Topology只可以指定启动一个Worker进程答案:D解析:
暂无解析35.Hbase中数据存储的文件格式是()。(1分)A、HlogB、TextFileC、HfileD、SequenceFile答案:C解析:
暂无解析36.MRS中,()不属于集群节点的磁盘分区。(1分)A、OS分区B、数据分区C、元数据分区D、管理分区答案:D解析:
暂无解析37.在Zookeeper和Yarn的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下()目录中获取Application相关信息。(1分)A、metastoreB、StatestoreC、StoreageD、Warehouse答案:B解析:
暂无解析38.关于Hive与Hadoop其他组件的关系,以下描述错误的是()。(1分)A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖答案:D解析:
暂无解析39.安装MRS的Streaming组件是,Nimbus角色要求安装()节点。(1分)A、4B、3C、2D、1答案:C解析:
暂无解析40.YARN的基于标准调度,是对下列选项中的()进行标签化。(1分)A、AppMasterB、ResourceManagerC、NodeManagerD、Container答案:C解析:
暂无解析多选题(总共40题)1.创建数据库建议()。(1分)A、对象名称不超过64字节B、使用utf-8作为数据库默认编码集C、不要使用多字节符作为对象名答案:BC解析:
暂无解析2.国网数据中台能力架构中数据接入能力包含()方面。(1分)A、数据复制B、ETLC、数据交换D、消息队列答案:ABCD解析:
暂无解析3.DWS可以创建的表包含()表。(1分)A、临时表B、UNLOGGED表C、分区表D、哈希表答案:ABC解析:
暂无解析4.以下属于物化算子的有()。(1分)A、ResultB、SortC、AggD、Material答案:BCD解析:
暂无解析5.某大型生产企业,计划内部的物流数据和销售数据进行大数据转型,设计部给出了数据存储方案的分析,描述正确的是()。(1分)A、HBase存储海量数据,并支持动态扩展,能完成物流和销售数据的存储需求B、HBase支持高效随机读取,经过合理设计能完成对物流情况的实时分析于指挥C、物流数据非常稀疏,HBase能高效地处理稀疏数据D、HBase可以搭建在普通商用服务器上,构建成本相对较低答案:ABCD解析:
暂无解析6.下列选项中,()是MapReduce一定会有的过程。(1分)A、CombineB、MapC、ReduceD、Partition答案:BCD解析:
暂无解析7.以下关于Flink与其他组件交互说法正确的是()。(1分)A、Flink任务的运行依赖Yarn来进行资源调度B、Flink的checkpoint的实现依赖于ZookeeperC、Flink可以将接受的组件发给KafkaD、Flink在HDFS文件系统中读写数据答案:ABCD解析:
暂无解析8.传统数据处理的瓶颈有()。(1分)A、数据存储成本高B、流式数据处理形成不足C、扩展能力有限D、批量数据处理缺失答案:AC解析:
暂无解析9.下面()是组合分类方法。(1分)A、装袋B、提升C、决策树D、随机森林答案:ABD解析:
暂无解析10.DAYU作业的节点库中MRSKafka的失败策略()。(1分)A、终止当前作业执行计划B、继续执行下一节点C、挂起当前作业执行计划D、终止后续节点执行计划答案:ABCD解析:
暂无解析11.关于Kafka的Peoducer,如下说法正确的是()。(1分)A、Producer是消息生产者B、Producer生产数据需要指定TopicC、可以同时起多个Producer进程向同一个Topic进行数据发送D、Producer生产数据时需要先连接ZooKeeper,而后才连接Broker答案:ABC解析:
暂无解析12.在HBase表设计中,对于多项业务公用rowkey,导致数据访问矛盾的情况,可以有()应对策略。(1分)A、折中法(rowkey设计兼顾A和B的业务需求)B、冗余法(用空间换时间厂效率)C、创建二级索引D、预分region答案:ABC解析:
暂无解析13.以下能表示为布尔类型“真”值的是()。(1分)A、TRUEB、't'C、'true'D、'y'答案:ABCD解析:
暂无解析14.执行Hbase读取数据业务,需要从()读取。(1分)A、HmasterB、HfileC、HlogD、MetaStore答案:BD解析:
暂无解析15.MRS中,关于Oozie的作业操作命令,下列()描述是正确的。(1分)A、submit命令可以让作业的状态变为PREPB、start命令可以让PREP状态的作业变为RUNNINGC、run命令可以让作业状态变为RUNNINGD、kill命令可以作用在PREP/SUSPEND/RUNNING状态的作业上答案:ABCD解析:
暂无解析16.下列属于Flume数据监控的指标是()。(1分)A、sink写入数据量B、DataNode数量C、Channel缓存数据量D、source接收数据量答案:ACD解析:
暂无解析17.Spark适用于以下()场景。(1分)A、交互式查询B、实时流处理C、批处理D、图计算答案:ABCD解析:
暂无解析18.MRS中,Streaming适用于以下()场景。(1分)A、流数据监控B、网站的实时访问统计C、离线日志分析D、交通流量分析答案:ABD解析:
暂无解析19.基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有(1分)A、MRB、SparkC、HDFSD、HBase答案:CD解析:
暂无解析20.关于数据订阅订阅数据变更类型,以下()是正确的。(1分)A、updateB、deleteC、insertD、replace答案:ABCD解析:
暂无解析21.在数据同步管理中,创建同步任务的流程为场景选择、同步实例、()、()、预检查、任务确认六步。(1分)A、源库设置B、源库及目标库C、设置同步D、实例创建答案:BC解析:
暂无解析22.华为大数据产品MRS中的Streaming具有()关键特性。(1分)A、容灾能力B、灵活性C、消息可靠性D、可伸缩性答案:ABC解析:
暂无解析23.下列关于无共享Master架构的特点描述正确的有()。(1分)A、所有节点对等B、可通过任意节点查询或加载数据C、不存在单点性能瓶颈和单点风险D、无法保证数据一致性答案:ABC解析:
暂无解析24.下列()属于CLOG日志记录的状态。(1分)A、CommittedB、AbortedC、Sub-CommittedD、Inprogress答案:ABCD解析:
暂无解析25.MRS中使用Streaming客户端shell命令提交拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有()。(1分)A、拓扑业务逻辑错误,提交之后无法正常运行B、Supervisor是在Topology中接收数据然后执行处理的组件C、拓扑过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间D、Supervisor的slots资源被消耗尽,拓扑提交上去后分不到slot去启动worker进程答案:ABCD解析:
暂无解析26.DAYU作业调度的方式有()。(1分)A、单次调度B、周期调度C、事件驱动调度D、自定义调度答案:ABC解析:
暂无解析27.MRS大数据平台提供了()分布式计算框架。(1分)A、HBaseB、SparkC、StromD、Streaming答案:BCD解析:
暂无解析28.关于Hbase存储模型的描述正确的是()。(1分)A、即使是key值相同,qualifier也相同的多个KeyValue也可能有多个,此时使用时间戳来区分B、同一个key值可以关联多个valueC、keyvalue中期有时间戳,类型等关键信息D、每一个keyvalue都有一个qualifier标识答案:ABCD解析:
暂无解析29.Stream算子可以执行在以下()组件上。(1分)A、CNB、GTMC、DND、OM答案:AC解析:
暂无解析30.与开源的sqoop相比,Loader具有()增强特性。(1分)A、高可靠性B、高性能C、安全性D、图形化答案:ABCD解析:
暂无解析31.NodeManager的内存和CPU的数量,是通过下列()选项进行配置。(1分)A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、yarn.nodemanager.resource.cpu-vcoreC、yarn.nodemanager.vmem-pmom-ratioD、yarn.nodemanager.resource.memory-mb答案:BCD解析:
暂无解析32.在SolrCloud模式下,以下关于Solr相关概念描述正确的有()。(1分)A、Collection是在SolrCloud集群中逻辑意义上完整的索引,可以被划分为一个或者多个Shard,这些Shard使用相同的ConfigSet。B、ConfigSet是SolrCore提供服务必须的一组配置文件,包括solrconfig.xml和schemxml等。C、Shard是Collection的逻辑分片,每个Shard都包含一个或者多个replicas,通过选举确定哪个replica是Leader,只有Leaderreplica才能进行处理索引和查询请求。D、Replica只有处于active状态时才会接受索引和查询请求。答案:ABD解析:
暂无解析33.MRS中,关于Hive和Sparksql下列()描述是正确的。(1分)A、两者都能对外提供SQL或类SQL能力B、两者都能运行在MapReduce计算框架上C、两者都能通过表字段和HBase字段映射的方式访问HBase上的数据D、两者都能运行在Spark计算框架上答案:ACD解析:
暂无解析34.MRS中,Hive客户端以下()参数是用来控制reduce并发度的。(1分)A、hive.exec.reducers.bytes.per.reducerB、hive.exec-ducers.maxC、hive.exec.max.dynamic.partitionsD、hive.exec.max.dynamic.partitions.pemode答案:AB解析:
暂无解析35.MRS中,在使用Streaming的ACK机制时,下列()说法是正确的。(1分)A、启用了Acker之后,Streaming会识别发送失败的Tuple并自动重发,无需人为干预B、Acker会标识处理超时或者处理失败的消息为faiLC、从spout开始,形成的Tuple树中任何一个环节失败都会标记整棵树失败D、应用需要在spout的fail()接口方法中实现消息重发逻辑答案:BCD解析:
暂无解析36.在Loader历史作业记录中,可以查看以下()内容。(1分)A、作业状态B、脏数据链接C、错误行/文件数量D、作业开始时间/运行时间答案:ABCD解析:
暂无解析37.下面关于FusionInsightLibrA权限授予的描述正确的有()。(1分)A、权限授予最小化,只需要SELECT权限的不需要授予其他权限B、不要为了方便随便授予ALLPRIVILEGES权限C、谨慎授予可能改变表内容的操作(update、insert)权限D、管理好权限周期,超过时间及时使用REVOKE回收权限答案:ABCD解析:
暂无解析38.DWS支持()索引。(1分)A、唯一索引B、表达式索引C、多字段索引D、部分索引答案:ABCD解析:
暂无解析39.DLI用户可以通过以下()接入方式对云上CloudTable、RDS和DWS等异构数据源进行查询分析。(1分)A、可视化界面B、RestfulAPIC、JDBCD、ODBC答案:ABCD解析:
暂无解析40.FusionInsightLibrA中的DM工具可以提供()功能。(1分)A、数据库安装管理B、配置管理C、对象管理D、集群管理答案:ABCD解析:
暂无解析判断题(总共30题)1.Flink采用checkpoint机制保障应用程序运行中的容错性。(1分)A、正确B、错误答案:A解析:
暂无解析2.KafkaConsumer写数据的总体流程是,Consumer连接指定的TopicPartition所在的LeaderBroker,用主动的方式从Kafka中获取消息。(1分)A、正确B、错误答案:A解析:
暂无解析3.数据订阅成功后,如果不及时进行消费,新产生的数据最多保留3天。(1分)A、正确B、错误答案:A解析:
暂无解析4.Flume的数据流可以根据headers的信息发送到不同的Channel中。(1分)A、正确B、错误答案:A解析:
暂无解析5.分布式执行框架采用Producer-Consumer模型。(1分)A、正确B、错误答案:A解析:
暂无解析6.HDFS客户端以N副本向HDFS写文件时,若其中一个副本写入失败,则所有副本都会返回写入失败。(1分)A、正确B、错误答案:B解析:
暂无解析7.Zookeeper的增强性包括在审计日志中添加ephemeralnode被删除的审计日志。(1分)A、正确B、错误答案:A解析:
暂无解析8.Kafak所有消息都会被持久化到硬盘中,同时Kafka通过对TopicPartition设置Replication来保障数据的可靠性。(1分)A、正确B、错误答案:A解析:
暂无解析9.在Kafka中,Producer可以通过配置同步参数(producer.type),保证数据按顺序发送。(1分)A、正确B、错误答案:A解析:
暂无解析10.MRS中,用户想通过HBaseshell操作来查询某个HBase表中的内容,这种场景下推荐管理员给这个用户分配一个机机账号。(1分)A、正确B、错误答案:B解析:
暂无解析11.MRS中,Hbase支持动态扩展列。(1分)A、正确B、错误答案:A解析:
暂无解析12.MRS中Hive包含了两个角色HiveServer和MetaStore。(1分)A、正确B、错误答案:A解析:
暂无解析13.如果某些Containers的物理内存利用率超过了配置的内存阈值,但所有Containers的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的containers仍可以继续运行。(1分)A、正确B、错误答案:A解析:
暂无解析14.ResourceManager采用高可用方案,当Activeresourcemanager发现故障时,只能通过内置的Zookeeper来启动standby的resourcemanager,将其状态切换为active。(1分)A、正确B、错误答案:B解析:
暂无
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025教师个人工作计划总结
- 9月份营销工作计划范文
- 关于每日工作计划模板锦集
- 2025春季学期幼儿园食堂工作计划
- 食堂后勤管理个人工作计划
- 4科技综治和平安建设工作计划
- 4宁夏:某年教育民生计划发布
- 《大孔树脂分离技术》课件
- 《多元函数》课件
- 《型材料的研制》课件
- 机电产品设计奥秘探究知到章节答案智慧树2023年青岛滨海学院
- 新外研版高中英语必修第一册Unit 6教学设计
- 2023版中国近现代史纲要课件:05第五专题 中国人民在精神上由被动转为主动
- 快乐孕育孕妇学校高级教程孕产期心理保健
- AI时代大学生创新创业导航智慧树知到答案章节测试2023年西南大学
- 卧式罐剩余体积与液位关系计算方式-excel
- 公共政策案例分析例文范文(通用9篇)
- 三年级上册道德与法治知识点 解答题50道 部编版(含答案)
- 富士康公司组织架构及部门职责
- 库区倒罐作业操作规程
- 二年级下册乘除法口算题
评论
0/150
提交评论