华为数据中台运维专项试题(一)_第1页
华为数据中台运维专项试题(一)_第2页
华为数据中台运维专项试题(一)_第3页
华为数据中台运维专项试题(一)_第4页
华为数据中台运维专项试题(一)_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华为数据中台运维专项试题单选题(总共40题)1.国网数据中台,是在下面()数据中心阶段的基础上发展过来的。(1分)A、营销服务中心B、全业务统一数据中心C、海量历史/实时数据中心D、电网GIS数据中心答案:B解析:

暂无解析2.数据中台功能架构中运营管理包含包含()能力。(1分)A、内存计算B、标签管理C、任务调度D、服务目录答案:C解析:

暂无解析3.Hbase元数据MetaRegion路由器信息存放在()。(1分)A、ZookeeperB、Meta表C、HMasterD、Root表答案:B解析:

暂无解析4.关于Hive中普通表和外部表的描述不正确的是()。(1分)A、默认创建普通表B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来C、删除普通表时,元数据和数据同时被删除D、删除外部表时,只删除外部表数据而不删除元数据答案:D解析:

暂无解析5.关于DataSet,下列说法不正确的是()。(1分)A、DataSet不需要反序列化就可以执行大部分操作B、DataSet是一个由特定域的对象组成的强类型集合C、DataSet与RDD高度类似,性能比RDD好D、DataSet执行sort,filter,shuffle登录需要进行反序列化答案:D解析:

暂无解析6.Flume用于收集数据,其传输的数据基本单位是:()。(1分)A、SplitB、BlockC、EventD、Packet答案:C解析:

暂无解析7.以下()选项属于MRSSparkSQL的优点。(1分)A、稳定和高性能B、SQL兼容性C、支持数据插入,更新和删除D、以上全部正确答案:D解析:

暂无解析8.以下()不属于Hadoop中MapReduce组件的特点。(1分)A、高容错B、良好的扩展性C、实时计算D、易于编程答案:C解析:

暂无解析9.kafka-clustermirroring工具可以实现以下()功能。(1分)A、kafka集群数据同步方案B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对答案:A解析:

暂无解析10.下列()选项不属于创建Loader作业时必须项。(1分)A、优先级B、名称C、连接D、类型答案:A解析:

暂无解析11.Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是()。(1分)A、SinkB、ChannelC、ChannelSelectorD、Interceptor答案:D解析:

暂无解析12.以下关于MRSCTBase的描述不正确的是()。(1分)A、CTBase的读写接口,统一封装了行定义的接口,自动进行冷字段的合并和解析,不需要在应用程序中进行合并和解析B、CTBase是基于Hbase的聚簇表开发框架C、CTBase提供了一套WebUI进行元数据定义,提供了只管医用的表设计工具,降低表设计的难度D、CTBase的javaAPI提供了一套Hbase连接池管理的接口,内部连接共享,减少客户端应用开发的难度答案:B解析:

暂无解析13.在MRSLibrA中,下列()命令可以用于创建复制表。(1分)A、createtableregion1(ctid_valueint)distributebyreplicationB、createtableregion1(ctid_valueint);C、Createtableregion1(ctid_valueint)replication;D、以上都不正确;答案:A解析:

暂无解析14.以下()能力不属于数据中台能力架构中存储计算能力。(1分)A、分布式数据仓库B、分布式关系数据库C、流计算D、任务调度答案:D解析:

暂无解析15.MapReduce任务最终是在下列()中被执行的。(1分)A、NodeManagerB、containerC、ResourceManagerD、AppMaster答案:B解析:

暂无解析16.华为8.0数据中台架构贴源层数据存储产品是()。(1分)A、MRSB、GBase8AC、DWSD、DAYU答案:A解析:

暂无解析17.Hadoop平台中,要查看YARN服务中一个application的信息,通过的()命令行方式进行查询。(1分)A、containerB、jarC、application-attemptD、application答案:D解析:

暂无解析18.关于MRSStreaming的Supervisor描述正确的是()。(1分)A、.Supervisor是在Topology中接受数据然后执行处理的组件B、Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的Worker进程C、Supervisor负责资源分配和任务调度D、Supervisor是运行具体处理逻辑的过程答案:B解析:

暂无解析19.下列哪个命令是从HDFS下载目录/文件到本地的是()。(1分)A、dfs-putB、dfs-catC、dfs-getD、dfs-mkdir答案:C解析:

暂无解析20.部署MRS时,同一集群内的FlumeServer节点建议至少部署()个。(1分)A、1B、3C、4D、2答案:D解析:

暂无解析21.HBase默认使用()作为其底层文件存储系统。(1分)A、HDFSB、HadoopC、MemoryD、MapReduce答案:A解析:

暂无解析22.将数据块存储大小设置为128M,HDFS客户端在写文件时,当写入一个100M大小的文件,实际占用储存空间为()。(1分)A、128MB、100MC、64MD、50M答案:B解析:

暂无解析23.华为MRS中关于HDFS的DataNode的说法正确的是()。(1分)A、不会检查数据的有效性B、周期性地将本节点的Block相关信息发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的答案:C解析:

暂无解析24.以下()组件负责控制系统资源的分配,防止过量业务负载对系统的冲击而导致业务拥塞。(1分)A、GTMB、WLMC、CND、DN答案:B解析:

暂无解析25.关于MRSmanager界面Hive日志收集的描述中,不对的是()。(1分)A、可以指定实例进行日志收集B、可以指定节点IP进行收集C、可以指定用户进行日志收集D、可以指定时间段进行日志收集答案:C解析:

暂无解析26.安装MRS的Streaming组件是,Nimbus角色要求安装()节点。(1分)A、4B、3C、2D、1答案:C解析:

暂无解析27.关于Kerberos的TGT以下说法错误的是()。(1分)A、TGT全称为票据授权服务票据,主要由KDC服务器生成B、TGT一次生成之后,可以无限期使用。C、TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储。D、TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称。答案:B解析:

暂无解析28.以下()数据不属于半结构化数据。(1分)A、HTMLB、XMLC、二维表D、JSON答案:C解析:

暂无解析29.Hadoop中、如果yarn,scheduler.capacity.root.QueueA.minim.m-user-limit-percent设置为50,下面说法错误的是()。(1分)A、一个用户提交任务,可以使用QueueA的100%的资源B、如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源C、QueueA中必须保障每个用户至少得到50%的资源D、QueueA中的每个用户最多只能获得50%的资源答案:D解析:

暂无解析30.下列()命令是删除文件。(1分)A、dfs-clearB、dfs-lsC、dfs-rmD、dfs-del答案:C解析:

暂无解析31.数据中台功能架构中数据接入包含()能力。(1分)A、数据交换B、监控告警C、链路监测D、任务调度答案:A解析:

暂无解析32.MRS产品中,关于Kafka的说法不正确的是()。(1分)A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费答案:C解析:

暂无解析33.以下关于Flink关键特性描述不正确的是()。(1分)A、SparkStreaming与Flink相比,时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、checkpoint实现了Flink的容错D、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量答案:A解析:

暂无解析34.查看Kafka某Topic的partition详细信息时,使用如下()命令。(1分)A、bin/kafka-topic.sh--createB、bin/kafka-topic.sh--deleteC、bin/kafka-topic.sh--listD、bin/kafka-topic.sh--describe答案:D解析:

暂无解析35.以下关于HiveSQL基本操作描述正确的是()。(1分)A、加载数据到Hive时数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建外部表使用external关键字,创建普通表需要指定internal关键字D、创建表时可以指定列分隔符答案:D解析:

暂无解析36.假设每个用户最低资源保障设置为yarn,scheduler,capacity,root,QueueA.minimum-user-limit-percent=24。则以下说法错误的是()。(1分)A、第3个用户提交任务时,每个用户最多获得33.33%的资源B、第2个用户提交任务时每个用户最多获得50%的资源C、第4个用户提交任务时,每个用户最多获得25%的资源D、第5个用户提交任务时,每个用户最多获得20%的资源答案:D解析:

暂无解析37.以下不是EXPLAIN命令选项的是()。(1分)A、performanceB、prettyC、analyzeD、verbose答案:B解析:

暂无解析38.MRSManager对服务的配置功能说法不正确的是()。(1分)A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效答案:C解析:

暂无解析39.用来清理残留事务的工具叫()。(1分)A、gs_cleanB、gs_gucC、gs_dumpD、gs_ctrl答案:A解析:

暂无解析40.在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在shuffle操作时,会大大增加hash分桶数,严重影响性能,MRS中,针对小文件的场景通常采用()算子来对Table中的小文件生成的Partition进行合并,减少partition数,从而避免在shuffle的时候,生成过多的hash分桶,提升形成。(1分)A、groupbyB、coalosceC、connectD、join答案:D解析:

暂无解析多选题(总共40题)1.创建数据库可以指定兼容参数()。(1分)A、MySQLB、OraC、TDD、SQLServer答案:BC解析:

暂无解析2.StructuredStreaming在OutPut阶段可以定义不同的数据写入方式,包括以下()方式。(1分)A、GeneralModeB、AppendModeC、CompleteModeD、UpdateMode答案:BCD解析:

暂无解析3.以下属于控制算子的有()。(1分)A、HashJoinB、AppendC、AggD、RecursiveUnoin答案:BD解析:

暂无解析4.以下属于HiveSQL中DDL的是()。(1分)A、修改表B、删除表C、数据导入D、建表答案:ABD解析:

暂无解析5.对于HBaserowkey的设计原则,如下描述正确的是()。(1分)A、访问权重高的属性值放在RowKey前面B、访问权重高的属性值放在Rowkey后半部分C、离散度好的属性值放在Rowkey前半部分D、离散度好的属性值放在Rowkey后半部分答案:AC解析:

暂无解析6.MRS中,属于Streaming的数据分发方式有()。(1分)A、ShuffleGroupingB、FieldGroupingC、LocalGroupingD、DirectGrouping答案:ABCD解析:

暂无解析7.对HBase的列族,可以设置如下()属性。(1分)A、VersionsB、TTLC、CoprocessorD、Compression答案:ABD解析:

暂无解析8.在产品选型时,数据中台逻辑架构中共享层要重点关注产品的特点包含()方面。(1分)A、高效的访问能力B、支持数据发放能力C、支持高效的数据更新、删除能力D、智能的资源回收能力答案:ABC解析:

暂无解析9.MRS中,一个完整的StreamingCQL应用程序至少包含以下()部分。(1分)A、创建输入流B、创建输出流C、业务操作语句(例如SELECT、INSERT、JION等)D、应用提交语句答案:ABC解析:

暂无解析10.MRSManager界面显示Hive服务状态是Bad时,可能的原因有()。(1分)A、DBService服务不可用B、HDFS服务不可用C、Hbase服务不可用D、Metastoro实例不可用答案:ABD解析:

暂无解析11.MRS系统中,Hive支持的接口类型有()。(1分)A、JDBC接口B、ODBC接口C、Python接口D、Ruby接口答案:ABC解析:

暂无解析12.与开源的sqoop相比,Loader具有()增强特性。(1分)A、高可靠性B、高性能C、安全性D、图形化答案:ABCD解析:

暂无解析13.华为云机器学习服务MLS支持()分类方法。(1分)A、梯度提升术B、逻辑回归C、随机决策森林D、支持向量机答案:ABCD解析:

暂无解析14.以下()措施能提高HBase的查询性能。(1分)A、预分region,使region分布均匀,提高并发B、查询频繁属性放在rowkey前面部分C、使用二级索引,适应更多查询场景D、同时读取的数据存放在同一个cell中答案:ABCD解析:

暂无解析15.Spark有()特点。(1分)A、快B、灵C、轻D、巧答案:ABCD解析:

暂无解析16.MRS中,关于Hive和Sparksql下列()描述是正确的。(1分)A、两者都能对外提供SQL或类SQL能力B、两者都能运行在MapReduce计算框架上C、两者都能通过表字段和HBase字段映射的方式访问HBase上的数据D、两者都能运行在Spark计算框架上答案:ACD解析:

暂无解析17.数据质量定义模块包括()。(1分)A、质量维度定义B、检验类别管理C、度量规则管理D、检核方法管理答案:ABCD解析:

暂无解析18.Flink支持的时间操作类型包括以下()选项。(1分)A、结束时间B、处理时间C、采集时间D、事件时间答案:BD解析:

暂无解析19.以下关于Hbase文件存储模块描述正确的有()。(1分)A、应用在FusionInsightHD的上层应用B、HFS封装了Hbase与HDFS的接口C、为上层应用提供文件存储、读取、删除等功能D、HFS是Hbase的独立模块答案:ABCD解析:

暂无解析20.下列选项中,()是Spark的重要角色。(1分)A、NodeManagerB、ResourceManagerC、DataNOdeD、Driver答案:ABD解析:

暂无解析21.下列关于FusionInsightLibrA行存储和列存储的使用场景描述正确的有()。(1分)A、列存储适用于统计分析类查询(group,join多的场景)B、行存储适用于点查询(返回记录少,基于索引的简单查询)C、列存储适用于点查询(返回记录少,基于索引的简单查询)D、行存储适用于即席查询(查询条件列不确定,行存无法确定索引)答案:AB解析:

暂无解析22.Hbase中以下()场景会触发Flush操作。(1分)A、Hbase定期刷新MetaStore,默认周期为1小时B、当WALs中文件数量达到阈值C、Region中MetaStore的总大小达到了预设的FlushSize阈值D、MetaStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小答案:ABCD解析:

暂无解析23.下面关于FusionInsightLibrA权限授予的描述正确的有()。(1分)A、权限授予最小化,只需要SELECT权限的不需要授予其他权限B、不要为了方便随便授予ALLPRIVILEGES权限C、谨慎授予可能改变表内容的操作(update、insert)权限D、管理好权限周期,超过时间及时使用REVOKE回收权限答案:ABCD解析:

暂无解析24.以下属于Stream算子执行方式的有()。(1分)A、SortedB、BroadcastC、GatherD、Hashed答案:BC解析:

暂无解析25.下列关于Worker、Executor、Task说法正确的是()。(1分)A、每个Executor可以运行多个TaskB、每个Worker可以运行多个ExecutorC、每个Worker只能为一个拓扑运行ExecutorD、每个Executor可以运行不同组件的Task答案:ABD解析:

暂无解析26.以下关于FusionInsight网路安全可靠性,说法正确的是()。(1分)A、阻止外部攻击者通过管理通道入侵实际业务数据B、FusionInight支持网路划分为三级:集群业务平面、集群管理平面和集群外维护网路彼此之间实施物理隔离C、避免业务平面的高负载阻塞集群管理通道D、网路平面隔离,避免管理与业务贷款抢占,相互干扰答案:ABCD解析:

暂无解析27.关于Kafka的Peoducer,如下说法正确的是()。(1分)A、Producer是消息生产者B、Producer生产数据需要指定TopicC、可以同时起多个Producer进程向同一个Topic进行数据发送D、Producer生产数据时需要先连接ZooKeeper,而后才连接Broker答案:ABC解析:

暂无解析28.MRS中使用Streaming客户端shell命令提交拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有()。(1分)A、拓扑业务逻辑错误,提交之后无法正常运行B、Supervisor是在Topology中接收数据然后执行处理的组件C、拓扑过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间D、Supervisor的slots资源被消耗尽,拓扑提交上去后分不到slot去启动worker进程答案:ABCD解析:

暂无解析29.下列()模块通过主备复制保证高可用。(1分)A、CNB、DNC、GTMD、WLM答案:BC解析:

暂无解析30.创建数据库建议()。(1分)A、对象名称不超过64字节B、使用utf-8作为数据库默认编码集C、不要使用多字节符作为对象名答案:BC解析:

暂无解析31.华为云数据湖探索(DataLakeInsight,DLI)的数据源支持以下()数据格式。(1分)A、CSVB、ParquetC、JSOND、ORC答案:ABCD解析:

暂无解析32.Loader提供了()方式或接口实现作业管理。(1分)A、WebUIB、Linux命令行C、Rest接口D、JavaAPI答案:ABCD解析:

暂无解析33.MRS使用Streaming客户端shell命令查看拓扑或者提交拓扑失败,以下()定为手段是正确的。(1分)A、查看Supervisor运行日志,判断是否Supervisor异常B、查看worker运行日志C、查看Niimbus的运行日志,判断是否Nimbus服务异常D、查看客户端异常堆栈,判断是否是客户端使用问题答案:ABCD解析:

暂无解析34.MRS中,在使用Streaming的ACK机制时,下列()说法是正确的。(1分)A、启用了Acker之后,Streaming会识别发送失败的Tuple并自动重发,无需人为干预B、Acker会标识处理超时或者处理失败的消息为faiLC、从spout开始,形成的Tuple树中任何一个环节失败都会标记整棵树失败D、应用需要在spout的fail()接口方法中实现消息重发逻辑答案:BCD解析:

暂无解析35.Flume进程级联时,以下()sink类型用于接收上一跳Flume发送过来的数据。(1分)A、avrosinkB、thriftsinkC、HDFSsinkD、NullSink答案:BC解析:

暂无解析36.下列()属于CLOG日志记录的状态。(1分)A、CommittedB、AbortedC、Sub-CommittedD、Inprogress答案:ABCD解析:

暂无解析37.数据字典能修改的内容包括()。(1分)A、数据字典的类型B、数据字典类型的子项C、数据字典名称D、数据字典的层级答案:AB解析:

暂无解析38.CDM支持对已创建的连接进行以下操作:()。(1分)A、编辑B、测试连通性C、备份连接D、删除连接答案:ABD解析:

暂无解析39.关于Kafka的Producer,如下说法正确的是()。(1分)A、Producer是消息生产者B、Producer生产数据需要指定TopicC、可以同时起多个Producer进程向同一个Topic进行数据发送D、Producer生产数据时需要先连接ZooKeeper,而后才连接Broker答案:ABC解析:

暂无解析40.采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用以下()Channel。(1分)A、memoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel答案:BC解析:

暂无解析判断题(总共30题)1.SparkStreaming可以从Kafka接收数据并进行计算,计算结果只能存入HDFS,不能再写回Kafka。(1分)A、正确B、错误答案:B解析:

暂无解析2.MRS中,Streaming打包工具用于将业务代码jar包和其他所依赖的jar包等,打成一个完整的Streaming应用的jar包。(1分)A、正确B、错误答案:A解析:

暂无解析3.元数据按用途的不同分为三类:技术元数据、业务元数据和应用元数据。(1分)A、正确B、错误答案:B解析:

暂无解析4.对于SparkStreaming的应用,在一个JVM中,同一时间只能有一个StreamingContext处于活跃状态。(1分)A、正确B、错误答案:A解析:

暂无解析5.SparkStreaming作为微批处理的流处理引擎,是将每个时间分片的数据转换为一个RDD中的一个分区进行计算。(1分)A、正确B、错误答案:A解析:

暂无解析6.仅空间管理员可审计用户权限,包含查看用户列表、回收用户权限、对用户进行授权。(1分)A、正确B、错误答案:A解析:

暂无解析7.在MapReduce编程中,代码不仅要描述做什么,还要描述具体怎么做。(1分)A、正确B、错误答案:B解析:

暂无解析8.Hbase最小的存储单元是Region。(1分)A、正确B、错误答案:A解析:

暂无解析9.Hbase的BloomFiliter是用来过滤数据。(1分)A、正确B、错误答案:B解析:

暂无解析10.Hive中groupby指的是通过一定规则将一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行分组处理。(1分)A、正确B、错误答案:A解析:

暂无解析11.在Spark中,SparkSQL是独立的模块,可以不依赖于SparkCore独立完成SQL语句的解析、优化和执行等操作。(1分)A、正确B、错误答案:B解析:

暂无解析12.SparkStreaming容错机制实质RDD中的任意Partition出错,都可以根据其父RDD重新计算生成,如果父RDD丢失,则需要去硬盘中查找原始数据。(1分)A、正确B、错误答案:A解析:

暂无解析13.Yarn-client和Yarn-Cluster主要区别时ApplicationMaster进程的区别。(1分)A、正确B、错误答案:A解析:

暂无解析14.分布式执行框架采用Producer-Consumer模型。(1分)A、正确B、错误答案:A解析:

暂无解析15.HBase过滤器能将列名或列值设置为过滤条件,同时支持多个过滤器配

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论