华为数据中台运维专项试题

上传人：1*** IP属地：浙江上传时间：2024-12-24 格式：DOC 页数：20 大小：39.41KB 积分：30 举报 版权申诉

已阅读5页，还剩15页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

华为数据中台运维专项试题单选题（总共40题）1.Flink的数据转换操作在以下（）环节中完成。(1分)A、channelB、TransformationC、sinkD、source答案：B解析：

暂无解析2.Hbase中的Region是由（）服务进程来管理的。(1分)A、HRegionServerB、ZookeeperC、HmasterD、DataNode答案：A解析：

暂无解析3.下列关于SparkStreaming和Streaming比较说法不正确的是（）。(1分)A、SparkStreaming是一个微批处理框架，时间需要积累到一定量才能进行处理B、Streaming的执行逻辑是即时启动，运行完再回收C、SparkStreaming的吞吐量大约是Streaming的2-5倍D、SparkStreaming时间处理时延比Streaming更高答案：B解析：

暂无解析4.HBase表的rowkey设计是一个很重要的开发设计环节，下面roykey设计更为合理的是（）。(1分)A、姓名+手机号B、日期+手机号C、手机号+日期D、手机号+姓名答案：C解析：

暂无解析5.Spark的核心是模块是（）。(1分)A、sparkStreamingB、sparkcoreC、mapreduceD、sparksql答案：B解析：

暂无解析6.下列（）选项属于Hive的数据存储模型。(1分)A、桶B、数据库C、分区D、以上全都正确答案：D解析：

暂无解析7.以下（）工具可以实现大量数据的快速导入和导出。(1分)A、gsqlB、GDSC、DataStudioD、DSC答案：B解析：

暂无解析8.以下（）数据不属于半结构化数据。(1分)A、HTMLB、XMLC、二维表D、JSON答案：C解析：

暂无解析9.以下（）组件负责生成和维护全局事务ID、事务快照、时间戳等全局唯一信息。(1分)A、GTMB、WLMC、CND、DN答案：A解析：

暂无解析10.在MRS产品中，关于KafkaTpoic，一下描述不正确的有（）。(1分)A、每个Topic只能被分成一个partition(分区)B、Topic的partition数量可以在创建时配置C、每个partition的存储层对应一个log文件，log文件中记录了所有的信息数据D、每条发布到Kafka的信息都有一个类别，这个类别被称为Topic，也可以理解为一个存储消息的队列答案：A解析：

暂无解析11.在MRSHD中，创建Loader作业的进行数据转换正确步骤是（）。(1分)A、设置输入-转换-输出B、抽取-转换-输出C、加载-转换-输出D、加载-转换-抽取答案：A解析：

暂无解析12.以下（）选项不属于数据中台三层架构。(1分)A、贴源层B、轻度汇总层C、共享层D、分析层答案：B解析：

暂无解析13.下列关于HDFS客户端读文件过程正确的是（）。(1分)A、优先从最近的DataNode下载数据B、文件数据先从DataNode返回至NameNode,然后从NameNode下致到致客户端C、如果客户端和所连接的DataNode在读取时出现故障，那么客户端会放弃这个鼓掌节点，去连接其他副本所在的节点D、支持多个客户端同时从DataNode±读取同一个文件数据答案：D解析：

暂无解析14.在WebHCat架构中，用户能够通过安全的HTTPS协议执行以下（）操作。(1分)A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveSQL任务D、以上全部正确答案：D解析：

暂无解析15.以下最常用的整型类型是（）。(1分)A、TINYINTB、SMALLINTC、INTEGERD、BIGINT答案：C解析：

暂无解析16.执行引擎的类型包括（）。(1分)A、行执行引擎B、向量化执行引擎C、行列混合执行引擎D、以上都是答案：D解析：

暂无解析17.Kafka集群中，Kafka服务端的角色是（）。(1分)A、BrokerB、ConsumerC、ZookeeperD、Producer答案：A解析：

暂无解析18.将数据块存储大小设置为128M,HDFS客户端在写文件时，当写入一个100M大小的文件，实际占用储存空间为（）。(1分)A、128MB、100MC、64MD、50M答案：B解析：

暂无解析19.Hive常被用来处理（）场景。(1分)A、事务性处理B、批量计算C、实时性计算D、流计算答案：B解析：

暂无解析20.如果需要由数据生产者决定数据发送给目标Blot的某一个确定的Task，应该选择以下（）种消息发布策略。(1分)A、局部字段分组B、广播分组C、直接分组D、全局分组答案：C解析：

暂无解析21.为了保障流应用的快照存储的可靠性，快照主要存储在（）。(1分)A、JobManager内存中B、可靠性高的单击数据库中C、本地文件系统D、HDFS答案：D解析：

暂无解析22.决策树中不包含以下（）结点。(1分)A、根结点（rootnode）B、内部结点（internalnode）C、外部结点（externalnode）D、叶结点（leafnode）答案：C解析：

暂无解析23.HBase的主HMaster是（）选举的。(1分)A、由RegionServer进行裁决B、HMaster为双主模式，不需要进行裁决C、通过ZooKeeper进行裁决D、随机选举答案：C解析：

暂无解析24.在MRS中，可以在（）查看MapReduce应用程序的运行结果。(1分)A、MRSManager的web界面B、LoaderWeb界面C、Solrweb界面D、YarnWeb界面答案：D解析：

暂无解析25.Hadoop平台中HBase的Region是由哪个服务进程来管理?(1分)A、HMasterB、DataNodeC、RegionServerD、ZooKeeper答案：C解析：

暂无解析26.MRSManager对服务的配置功能说法不正确的是（）。(1分)A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效答案：C解析：

暂无解析27.YARN中设置队列QueueA的最大使用资源量，需要配置（）参数。(1分)A、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.root.QueueA.maximum-capacityC、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-factorD、yarn.scheduler.capacity.root.QueueA.state答案：B解析：

暂无解析28.以下不属于CN自动剔除约束的是（）。(1分)A、设置CN心跳超时时间的值大于0B、集群中的CN总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后，逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行答案：D解析：

暂无解析29.下列（）HDFS命令可用于检测数据块的完整性。(1分)A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1答案：A解析：

暂无解析30.安装MRS的Streaming组件是，Nimbus角色要求安装（）节点。(1分)A、4B、3C、2D、1答案：C解析：

暂无解析31.下列关于MRSLibrA数据均匀分布的存储描述错误的是（）。(1分)A、解析器从客户端应用获取输入的数据B、解析器对数据解析后，将数据分发诶各个处理单元进行处理C、各个处理单元把接受到的数据存储到各自的逻辑磁盘中D、每一个处理单元的逻辑磁盘只能是服务器自带的物理磁盘答案：D解析：

暂无解析32.在MRSLibrA中，下面对analyze使用的描述错误的是（）。(1分)A、analyze语句可收集与数据库中表内容相关的统计信息，统计结果存储在系统表PG_STATISTIC中B、建议对一个刚执行过大批量插入操作的表执行analyze语句，以便使LibrA内的优化器模块根据这些统计数据获得更优的输出，进而影响业务性能C、执行计划生成器会使用PG_STATISTIC表中的统计数据，以生成最有效的查询执行计划D、analyze语句中使用-pop选项，可避免当数据库中数据量过大时内存紧张答案：D解析：

暂无解析33.以下关于Zookeeper的Leader节点在接收到数据变更请求后的读写流程说法正确的是（）。(1分)A、仅写入内存B、同时写入硬盘和内存C、先写入内存再写入硬盘D、先写入硬盘再写入内存答案：D解析：

暂无解析34.YARN的基于标准调度，是对下列选项中的（）进行标签化。(1分)A、AppMasterB、ResourceManagerC、NodeManagerD、Container答案：C解析：

暂无解析35.关于RDD，下列说法错误的是（）。(1分)A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘C、RDD是一个只读的，可分区的分布式数据集D、RDD是Spark对基础数据的抽象答案：B解析：

暂无解析36.以下扫描算子中用于对列存表进行扫描的算子是（）。(1分)A、SeqScanB、CstoreScanC、SubqueryScanD、ValuesScan答案：B解析：

暂无解析37.在Spark中，假设lines是一个DStream对象，filter语句可以过滤掉80%的数据，针对以下两个语句说法正确的是：X:lines.filter(...).groupByKey(...)Y:lines.groupByKey(...).filter(...)(1分)A、X比Y的性能更高B、X比Y的性能更低C、X和Y和性能一样D、无法确性X和Y的性能差异答案：A解析：

暂无解析38.Streaming主要通过zookeeper提供以下的（）实现事件侦听。(1分)A、分布式锁机制B、WatcherC、CheckpointD、ACK答案：B解析：

暂无解析39.在MapReduce的应用程序开发中，下列（）JAVA类负责管理和运行一个计算任务。(1分)A、lobB、ContextC、FileSystemD、Configuration答案：A解析：

暂无解析40.关于Hive在MRS中的架构描述错误的是（）。(1分)A、只要有一个HiveServer不可用，整个Hive集群便不可用B、MotaStore用于提供元数据服务，依赖于DBServiceC、在同一时间点、HiveServer只要一个处于Active状态，另一个则处于Standby状态D、HiveServer负责接收客户端请求.解析.执行HQL命令并返回查询结果答案：A解析：

暂无解析多选题（总共40题）1.MRS中，（）组件支持对表进行加密。(1分)A、HDFSB、FlinkC、HbaseD、Hive答案：CD解析：

暂无解析2.关于Kafka的特点如下描述正确的是（）。(1分)A、Kafka是：一个高吞吐、分布式、基于发布订阅的消息系统B、Kafka可以做到消息的持久化C、适用于离线和在线的消息消费场景D、Kafka可以保证每个Partition内的消息有：序答案：ABCD解析：

暂无解析3.华为大数据产品MRS中的Streaming具有（）关键特性。(1分)A、容灾能力B、灵活性C、消息可靠性D、可伸缩性答案：ABC解析：

暂无解析4.向用户授权DRS权限流程包括以下（）方面。(1分)A、创建用户组并授权B、创建用户C、用户登录并验证权限D、用户自行添加权限答案：ABC解析：

暂无解析5.在产品选型时，数据中台逻辑架构中分析层要重点关注产品的特点包含（）方面。(1分)A、批量删除能力B、强资源隔离能力C、高并发的查询能力D、强大的OLTP能力答案：BC解析：

暂无解析6.在MRS中，关于Kafka组件说法正确的是（）。(1分)A、在创建Topic时，副本数不得大于当前存活的Broker实例个数，否侧创建Topic将会失败B、Kafka的Producer发送消息时,可以指定该消息被哪个Comsumer消费C、Kafka会将元数据信息存放在Zookeeper上D、Kafka安装完成后就不能再配置数据存放目录答案：ABCD解析：

暂无解析7.MRS中使用Streaming客户端shell命令提交拓扑之后，使用StormUI查看发现该拓扑长时间没有处理数据，可能原因有（）。(1分)A、拓扑业务逻辑错误，提交之后无法正常运行B、Supervisor是在Topology中接收数据然后执行处理的组件C、拓扑过于复杂或者并发太大，导致worker启动时间过长，超过supervisor的等待时间D、Supervisor的slots资源被消耗尽，拓扑提交上去后分不到slot去启动worker进程答案：ABCD解析：

暂无解析8.整库迁移支持的源端数据源类型有：（）。(1分)A、MySQLB、OracleC、HiveD、DWS答案：ABCD解析：

暂无解析9.创建API时，需要填写（）信息。(1分)A、API名称B、API目录C、请求PathD、请求方法答案：ABCD解析：

暂无解析10.以下属于物化算子的有（）。(1分)A、ResultB、SortC、AggD、Material答案：BCD解析：

暂无解析11.Spark适用于以下（）场景。(1分)A、交互式查询B、实时流处理C、批处理D、图计算答案：ABCD解析：

暂无解析12.Hbase中以下（）场景会触发Flush操作。(1分)A、Hbase定期刷新MetaStore，默认周期为1小时B、当WALs中文件数量达到阈值C、Region中MetaStore的总大小达到了预设的FlushSize阈值D、MetaStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小答案：ABCD解析：

暂无解析13.事务的ACID特性包括（）。(1分)A、原子性B、一致性C、隔离性D、持久性答案：ABCD解析：

暂无解析14.关于FusioninsightHD的Spark,以下（）编程语言可以用来开发Spark应用。(1分)A、CB、ScalaC、JavaD、Python答案：BCD解析：

暂无解析15.关于Kafka的Producer,如下说法正确的是（）。(1分)A、Producer是消息生产者B、Producer生产数据需要指定TopicC、可以同时起多个Producer进程向同一个Topic进行数据发送D、Producer生产数据时需要先连接ZooKeeper,而后才连接Broker答案：ABC解析：

暂无解析16.要实现资源检索应配置的前置条件是（）。(1分)A、在分类管理中先配置好分类类型和分类模板B、在页面在线配置中配置好表属性“是否为查询条件”，才能显示动态配置查询条件C、查看资源详情，预览数据需先同步元数据数据源D、创建sap索引答案：ABC解析：

暂无解析17.对资产搜索结果，可以基于条件进行筛选，下列筛选条件中支持类别有（）。(1分)A、数据连接B、类型C、密级D、大小答案：ABC解析：

暂无解析18.DLI用户可以通过以下（）接入方式对云上CloudTable、RDS和DWS等异构数据源进行查询分析。(1分)A、可视化界面B、RestfulAPIC、JDBCD、ODBC答案：ABCD解析：

暂无解析19.以下关于KafkaPrtition说法正确的是（）。(1分)A、引入Partition机制，保证了Kafka的高吞吐能力B、每个Partition都是有序且不可变的消息队列C、Partition数量绝对了每个consumergroup中并发消费者的最大数量D、每个Partition在存储层面对应一个log文件答案：ABCD解析：

暂无解析20.在HBase表设计中，对于多项业务公用rowkey,导致数据访问矛盾的情况，可以有（）应对策略。(1分)A、折中法（rowkey设计兼顾A和B的业务需求）B、冗余法（用空间换时间厂效率）C、创建二级索引D、预分region答案：ABC解析：

暂无解析21.华为云机器学习服务MLS支持（）分类方法。(1分)A、梯度提升术B、逻辑回归C、随机决策森林D、支持向量机答案：ABCD解析：

暂无解析22.在Kafka中，关于Comsumer说法正确的是（）。(1分)A、Consumer主要进行数据消费B、Consumer消费数据时需要指定TopicC、多个Consumer配置相同的group.id时，这些Consumer消费的数据不会重复D、新ConsumerAPI消费数据不用指定ZooKeeper地址答案：ABCD解析：

暂无解析23.某大型生产企业，计划内部的物流数据和销售数据进行大数据转型，设计部给出了数据存储方案的分析，描述正确的是()。(1分)A、HBase存储海量数据，并支持动态扩展，能完成物流和销售数据的存储需求B、HBase支持高效随机读取，经过合理设计能完成对物流情况的实时分析于指挥C、物流数据非常稀疏，HBase能高效地处理稀疏数据D、HBase可以搭建在普通商用服务器上，构建成本相对较低答案：ABCD解析：

暂无解析24.支持创建的数据标签类型（）。(1分)A、规则标签B、组合标签C、手工标签D、实时标签答案：ABCD解析：

暂无解析25.采用Flume传输数据过程中，为了防止因Flume进程重启而丢失数据，可以使用以下（）Channel。(1分)A、memoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel答案：BC解析：

暂无解析26.DWS的默认用户拥有（）权限。(1分)A、登录B、创建数据库C、创建用户答案：ABC解析：

暂无解析27.MRS中，Streaming适用于以下（）场景。(1分)A、流数据监控B、网站的实时访问统计C、离线日志分析D、交通流量分析答案：ABD解析：

暂无解析28.Flume进程级联时，以下（）sink类型用于接收上一跳Flume发送过来的数据。(1分)A、avrosinkB、thriftsinkC、HDFSsinkD、NullSink答案：BC解析：

暂无解析29.YARN容量调度器的主要特性有（）。(1分)A、容量保证B、动态更新配置文件C、灵活性D、多重租赁答案：ABCD解析：

暂无解析30.数据归约的策略包括：()。(1分)A、维归约B、数量归约C、螺旋式方法D、数据压缩答案：ABD解析：

暂无解析31.NodeManager的内存和CPU的数量，是通过下列（）选项进行配置。(1分)A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、yarn.nodemanager.resource.cpu-vcoreC、yarn.nodemanager.vmem-pmom-ratioD、yarn.nodemanager.resource.memory-mb答案：BCD解析：

暂无解析32.Stream算子可以执行在以下（）组件上。(1分)A、CNB、GTMC、DND、OM答案：AC解析：

暂无解析33.下列选项中，（）是MapReduce一定会有的过程。(1分)A、CombineB、MapC、ReduceD、Partition答案：BCD解析：

暂无解析34.DAYU作业调度的方式有（）。(1分)A、单次调度B、周期调度C、事件驱动调度D、自定义调度答案：ABC解析：

暂无解析35.若在消息处理过程中允许部分数据丢失，关闭消息可靠性处理机制的方式有（）。(1分)A、将参数Config.Topology_ACKKRS设置为0B、将参数Config.Topology_ACKKRS设置为falseC、Spout发送消息时，使用不指定消息messageID的接口进行发送D、Blot发送消息时使用Unanchor方式发送答案：ACD解析：

暂无解析36.以下属于HiveSQL中DDL的是（）。(1分)A、修改表B、删除表C、数据导入D、建表答案：ABD解析：

暂无解析37.在DRS的标签管理服务中，下列存在的功能有（）。(1分)A、添加标签B、编辑标签C、备份标签D、删除标签答案：ABD解析：

暂无解析38.MRS中，Hive客户端以下（）参数是用来控制reduce并发度的。(1分)A、hive.exec.reducers.bytes.per.reducerB、hive.exec-ducers.maxC、hive.exec.max.dynamic.partitionsD、hive.exec.max.dynamic.partitions.pemode答案：AB解析：

暂无解析39.Flink的兼容性体现在以下（）方面。(1分)A、YARN能够作为Flink集群的资源调度管理器B、能够与Hadoop原有的Mappers和Reduces混合使用C、能够使用Hadoop的格式化输入和输出D、能够从本地获取数据答案：ABCD解析：

暂无解析40.以下关于Hbase文件存储模块描述正确的有（）。(1分)A、应用在FusionInsightHD的上层应用B、HFS封装了Hbase与HDFS的接口C、为上层应用提供文件存储、读取、删除等功能D、HFS是Hbase的独立模块答案：ABCD解析：

暂无解析判断题（总共30题）1.在一个MapReduce应用程序中,map函数的输出经由MapReduce框架处理后,发送到reduce函数,这个处理过程是基于键值进行排序和分组。(1分)A、正确B、错误答案：A解析：

暂无解析2.“表/文件/整库迁移”支持批量迁移表或者文件，还支持同构/异构数据库之间整库迁移，一个作业即可迁移几百张表。(1分)A、正确B、错误答案：A解析：

暂无解析3.数据湖探索（DataLakeInsight，简称DLI）兼容标准SQL。(1分)A、正确B、错误答案：A解析：

暂无解析4.在Flink中，checkpoint机制能够保证应用在运行过程中出现失败时，从某一个点恢复，在此过程中，流快照是根据数据流入顺序依次创建的。(1分)A、正确B、错误答案：A解析：

暂无解析5.修改视图时可以修改视图的表空间。(1分)A、正确B、错误答案：B解析：

暂无解析6.Flink适用于高并发处理数据、毫秒级时延应用。(1分)A、正确B、错误答案：A解析：

暂无解析7.导入数据字典的excel中，字典类型代码在系统中不存在且在excel中不存在，否则导入失败。(1分)A、正确B、错误答案：A解析：

暂无解析8.SparkStreaming作为微批处理的流处理引擎，是将每个时间分片的数据转换为一个RDD中的一个分区进行计算。(1分)A、正确B、错误答案：A解析：

暂无解析9.HDFS客户端以N副本向HDFS写文件时，若其中一个副本写入失败，则所有副本都会返回写入失败。(1分)A、正确B、错误答案：B解析：

暂无解析10.Hadoop系统中，如果HDFS文件系统的备份因子是3，那么MapReduce每次允许task都是从3个有副本的机器上传输需要的处理文件。(1分)A、正确B、错误答案：B解析：

暂无解析11.SparkStreaming可以从Kafka接收数据并进行计算，计算结果只能存入HDFS,不能再写回Kafka。(1分)A、正确B、错误答案：B解析：

暂无解析12.Hbase中OpenScanner的过程，会创建两种不同的Scanner来读取Hfile和MetaStore的数据，Hfile对应的scanner为StoreFileScanner，MetaStore对应的Scanner为MetaStoreScanner。(1分)A、正确B、错误答案：A解析：

暂无解析13.HDFS采用的是“一次写入、多次读取''的文件访问模型。所以推荐一个文件经过创建、写入和关闭之后，就不要再去修改。(1分)A、正确B、错误答案：A解析：

暂无解析14.Channels支持事务，提供较弱的顺序保证，可以连接任何数量的Source和Sink。(1分)A、正确B、错误答案：A解析：

暂无解析15.HDFS运行时，NameNode会将文件系统的元数据从磁盘中全部加载到内存，因此文件系统所能存储的文件总数受限于NameNode的内存容量。(1分)A、正确B、错误答案：A解析：

暂无解析16.元数据按用途的不同分为三类：技术元数据、业务元数据和应用元数据。(1分)A、正确B、错误答案：B解析：

暂无解析17.Hive中unionall操作符用于合并两个或多个select语

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

华为数据中台运维专项试题

文档简介

温馨提示

最新文档

评论

华为数据中台运维专项试题

文档简介

温馨提示

最新文档

评论

相关文档