华为数据中台运维知识考试复习题库（含答案）

上传人：r*** IP属地：江苏上传时间：2023-11-15 格式：DOCX 页数：123 大小：109.59KB 积分：15 举报 版权申诉

已阅读5页，还剩118页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

PAGEPAGE1华为数据中台运维知识考试复习题库（含答案）一、单选题1.以下（）组件负责存储业务数据、执行数据查询任务以及向CN返回执行结果。A、GTMB、WLMC、CND、DN答案：D2.在MRSLibrA中，下列（）命令可以用于创建复制表。A、createtableregion1（ctid_valueint）distributebyreplicationB、createtableregion1（ctid_valueint）；C、Createtableregion1（ctid_valueint）replication；D、以上都不正确；答案：A3.以下（）组件负责生成和维护全局事务ID、事务快照、时间戳等全局唯一信息。A、GTMB、WLMC、CND、DN答案：A4.下列（）HDFS命令可用于检测数据块的完整性。A、hdfsfsck/B、hdfsfsck–deleteC、hdfsdfsadmin–reportD、hdfsbalancer–threshold1答案：A5.Zookeeper的Scheme认证方式不包括以下（）。A、digestB、saslC、authD、world答案：B6.在MRS的HBase中，如下（）场景不会触发Flush操作。A、客户端发起扫描请求时将scancaching设置过大B、通过客户端指定方式发起Flush作业C、RegionServer总内存超过阈值D、Region的MemStore设置超过阈值答案：A7.以下关于KafkaPartition偏移量的描述不正确的是（）。A、每条消息在文件中的位置称为offset(偏移量)B、消费者通过(offset.partition.topic)跟踪记录C、唯一标记一条消息D、Offset是一个String型字符串答案：D8.MVCC用于解决（）事务冲突。A、读读B、写写C、读写D、上述都包括答案：C9.以下（）组件负责控制系统资源的分配，防止过量业务负载对系统的冲击而导致业务拥塞。A、GTMB、WLMC、CND、DN答案：B10.数据中台功能架构中数据资产管理包含（）能力。A、安全管理B、数据开发C、数据资产目录D、计量管理答案：C11.MRSManager对服务的管理操作，下面说法错误的是（）。A、可以设置不常用的服务隐藏显示B、可以添加和卸载服务C、可以对服务进行启停操作D、可以查看服务的当前状态答案：A12.在MRS产品中，关于创建Kafka的Topic，以下描述正确的是（）。A、在创建Kafka的Topic时，必须设置PartitionB、在创建Kafka的Topic时，必须设置Partition副本数C、设置多副本可以增强Kafka服务的容灾能力D、以上全部正确答案：C13.表设计时选择分布列的原则包括（）。A、作为分布列的字段尽量聚集B、选择查询中关联条件作为分布列C、尽量选择在查询中存在形如col=10001过滤条件的字段答案：B14.FusionlnsihtHD中，Oozie客户端的JAVAAPI在运行任务时会调用OozieClient类的（）方法。A、suspendB、getJobInfoC、submitD、run答案：D15.Insert事务使用的锁模式是（）。A、AccessShareLockB、RowExclusiveLockC、ShareUpdateExclusiveLockD、ExclusiveLock答案：B16.关于DataSet，下列说法不正确的是（）。A、DataSet不需要反序列化就可以执行大部分操作B、DataSet是一个由特定域的对象组成的强类型集合C、DataSet与RDD高度类似，性能比RDD好D、DataSet执行sort，filter，shuffle登录需要进行反序列化答案：D17.Flume用于收集数据，其传输的数据基本单位是:（）。A、SplitB、BlockC、EventD、Packet答案：C18.如果要在某个模式下创建对象，该用户对此模式应具有（）权限。A、EXECUTEB、SELECTC、CREATED、USAGE答案：C19.在Zookeeper和Yarn的协同工作中，当ActiveResourceManager产生故障时,StandbyResourceManager会从以下（）目录中获取Application相关信息。A、metastoreB、StatestoreC、StoreageD、Warehouse答案：B20.当一个MapReduce应用程序被执行时，如下（）动作是map阶段之前发生的。A、splitB、bineC、partitionD、sort答案：A21.要级联删除用户创建的表等数据库对象，使用关键字（）。A、STRICTB、CASCADEC、USAGED、DELETE答案：B22.在有N个节点MRSHD集群中部署HBase时、推荐部署()个HMaster进程，()个RegionServer进程A、3、NB、N、NC、2、ND、2、2答案：C23.以下不是EXPLAIN命令选项的是（）。A、performanceB、prettyC、analyzeD、verbose答案：B24.HDFS集群跟目录下存在一个文件text.txt,下列（）命令可以查到此文件所存储的DatNode节点信息。A、hdfsfsck/test.txt-filesB、hdfsfsck/text.txt-locationsC、hdfsfsck/test.txt-blocksD、hdfsfsck/test.txt-list-corruptfileblocks答案：B25.关于Kerberos的TGT以下说法错误的是（）。A、TGT全称为票据授权服务票据，主要由KDC服务器生成B、TGT一次生成之后，可以无限期使用。C、TGT在客户端的存在方式可以是在内存中存储，也可以在本地以文件的形式存储。D、TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及分发给的客户端名称。答案：B26.Spark的核心是模块是（）。A、sparkStreamingB、sparkcoreC、mapreduceD、sparksql答案：B27.在MRS中，可以在（）查看MapReduce应用程序的运行结果。A、MRSManager的web界面B、LoaderWeb界面C、Solrweb界面D、YarnWeb界面答案：D28.下列关于HBase的BloomFilter特性理解正确的是（）。A、用来过滤数据B、用来优化随机读取的性能C、会增加存储的消耗D、可以准确判断某条数据不存在答案：C29.在决策树创建时，由于数据中的噪声和离群点，许多分枝反映的是训练数据中的异常.（）方法处理这种过分拟合数据问题。A、小波B、调和C、剪枝D、回归答案：C30.Flink中的（）接口属于流数据处理，（）接口用于批处理。A、DataBatchAPI，DataStreamAPIB、StreamAPI，BatchAPIC、DataStreamAPI，DataSetAPID、BatchAPI，StreamAPI答案：C31.kafka-clustermirroring工具可以实现以下（）功能。A、kafka集群数据同步方案B、kafka单集群内数据备份C、kafka单集群内数据恢复D、以全部不对答案：A32.以下不属于CN自动剔除约束的是（）。A、设置CN心跳超时时间的值大于0B、集群中的CN总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后，逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行答案：D33.Flume用于收集数据，其传输的数据基本单位是（）。A、SplitB、BlockC、EventD、Packet答案：C34.关于MRSmanager界面Hive日志收集的描述中，不对的是（）。A、可以指定实例进行日志收集B、可以指定节点IP进行收集C、可以指定用户进行日志收集D、可以指定时间段进行日志收集答案：C35.MRS中，用户登录到客户端，请求服务端的某个应用，客户端需要先向认证服务器请求消息获取如下（）。A、TGTB、STC、PTD、TOKEN答案：A36.以下（）组件采用Active-Active高可用模式。A、GTMB、WLMC、CND、DN答案：C37.在MRSManager界面中、对Loader的操作不包括下列（）选项。A、切换Leader主各节点B、启动Loader实例C、配置Leader参数D、查看Loader服务状态答案：A38.关于Hive建表基本操作，描述正确的是（）。A、一旦表建好，不可再修改表名B、一旦表建好，不可再增加新列C、创建外表时需要指定external关键字D、一旦表建好，不可再修改列名答案：C39.关于Redis集群拓扑信息，下面描述正确的是（）。A、客户端缓存有集群的拓扑信息B、服务端缓存有集群的拓扑信息C、两者都是D、两者多不是答案：C40.YARN中设置队列QueueA的最大使用资源量，需要配置（）参数。A、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.root.QueueA.maximum-capacityC、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-factorD、yarn.scheduler.capacity.root.QueueA.state答案：B41.华为MRS中关于HDFS的DataNode的说法正确的是（）。A、不会检查数据的有效性B、周期性地将本节点的Block相关信息发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的答案：C42.以下关于DWS数据库透明加密的特点，错误的是（）。A、支持行存表数据加密，不支持列存表加密B、支持集群级别配置C、使用KMS服务加密D、加密密钥层次结构有三层答案：A43.以下关于Flink关键特性描述不正确的是（）。A、SparkStreaming与Flink相比，时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、checkpoint实现了Flink的容错D、与FusionInghtHD中的Streaming相比，Flink具有更高的吞吐量答案：A44.Hive常被用来处理（）场景。A、事务性处理B、批量计算C、实时性计算D、流计算答案：B45.关于RDD，下列说法错误的是（）。A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘C、RDD是一个只读的，可分区的分布式数据集D、RDD是Spark对基础数据的抽象答案：B46.MRS系统中，Flume数据流在节点内不需要（）组件。A、SourceB、SinkC、TopicD、Channel答案：C47.Hbase中数据存储的文件格式是（）。A、HlogB、TextFileC、HfileD、SequenceFile答案：C48.对于Hive中关于普通标和外部表描述不正确的是（）。A、默认创建普通表B、删除外部表时，只删除外部表数据而不删除元数据C、外部表实质上是将已存在的HDFS文件路径与表关联起来D、删除普通表时，元数据和数据同时被删除答案：B49.HDFS中的主备仲裁，是由（）组件控制的。A、ZookeeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient答案：A50.关于MRSStreaming的Supervisor描述正确的是（）。A、Supervisor是在Topology中接受数据然后执行处理的组件B、Supervisor负责接受Nimbus分配的任务，启动和停止属于自己管理的Worker进程C、Supervisor负责资源分配和任务调度D、Supervisor是运行具体处理逻辑的过程答案：B51.Hadoop平台中，要查看YARN服务中一个application的信息，通过的（）命令行方式进行查询。A、containerB、jarC、application-attemptD、application答案：D52.HDFS的副本放置策略中，同一机架不同的服务器之间的距离是A、3B、2C、1D、4答案：B53.为保证流应用的快照存储的可靠性，快照主要存储在（）。A、本地文件系统中B、JobManager的内存中C、HDFS中D、可靠性高的单击数据库中答案：C54.MRS系统审计日志不可用记录下面（）操作。A、手动清除警告B、启停服务实例C、删除服务实例D、查询历史监控答案：D55.在很多小文件场景下，Spark会起很多Task，当SQL逻辑中存在shuffle操作时，会大大增加hash分桶数，严重影响性能，MRS中，针对小文件的场景通常采用（）算子来对Table中的小文件生成的Partition进行合并，减少partition数，从而避免在shuffle的时候，生成过多的hash分桶，提升形成。A、groupbyB、coalosceC、connectD、join答案：D56.关于Kafka磁盘容量不足的告警，对于可能的原因以下分析不正确的是（）。A、业务规划不合理，导致数据分配不均，使部分磁盘达到使用率上限B、Broker节点故障导致C、数据保存时间配置过长，数据累计达到磁盘使用率达到上限D、用于存储Kafka数据的磁盘配置，无法满足当前业务数据流量，导致磁盘使用率达到上限答案：B57.如果需要由数据生产者决定数据发送给目标Blot的某一个确定的Task，应该选择以下（）种消息发布策略。A、局部字段分组B、广播分组C、直接分组D、全局分组答案：C58.DWSDN的高可用架构是怎样的（）。A、主备从架构B、一主多备架构C、两者兼有D、其他答案：A59.YARN中默认的资源调度器是（）。A、FIFO调度器B、容量调度器C、Fair调度器D、以上全部是答案：B60.关于Streaming的拓扑(Topology),下面描述错误的是（）。A、一个Topology是由一组Spout组件和Bolt组件通过StreamGroupings进行连接的有向无环图（DAG）B、Topology会一直运行,直到它被显式killC、业务逻辑都被封装Topology中D、一个Topology只可以指定启动一个Worker进程答案：D61.关于Hive在MRS中的架构描述错误的是（）。A、只要有一个HiveServer不可用，整个Hive集群便不可用B、MotaStore用于提供元数据服务，依赖于DBServiceC、在同一时间点、HiveServer只要一个处于Active状态，另一个则处于Standby状态D、HiveServer负责接收客户端请求.解析.执行HQL命令并返回查询结果答案：A62.HBase的主HMaster是（）选举的。A、由RegionServer进行裁决B、HMaster为双主模式，不需要进行裁决C、通过ZooKeeper进行裁决D、随机选举答案：C63.下列（）Redis命令属于原子操作。A、INCR（将储存的数字值增一）B、HINCRBY（为哈希表key中的域field的值加上增量increment）C、LPUSH（对链表的push操作）D、以上都是答案：D64.MRS中HBase的最小处理单元是Region，UserRegion和RegionServer之间的路由信息是保存在（）。A、ZooKeeperB、HDFSC、MasterD、meta表答案：D65.MRS产品中，关于Kafka的说法不正确的是（）。A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费答案：C66.下列关于HDFS客户端读文件过程正确的是（）。A、优先从最近的DataNode下载数据B、文件数据先从DataNode返回至NameNode,然后从NameNode下致到致客户端C、如果客户端和所连接的DataNode在读取时出现故障，那么客户端会放弃这个鼓掌节点，去连接其他副本所在的节点D、支持多个客户端同时从DataNode±读取同一个文件数据答案：D67.下面（）子句专用于GroupBy操作中的条件过滤功能。A、WHERE子句B、HAVING子句C、LIMIT子句D、ORDERBY子句答案：B68.创建Loader作业时，可以在以下（）步骤中设置Map数。A、输出B、输入设置C、转换D、基本信息答案：A69.在Flink的运行过程中，负责申请资源的角色是（）。A、ResourceManagerB、JobManagerC、ClientD、TaskManager答案：B70.MRSHD系统中HDFS默认BlockSize是（）。A、32MBB、64MBC、128MBD、256MB答案：C71.YARN调度器分配资源的顺序是（）。A、任意机器--本地资源--同机架B、任意机器--同机架--本地资源C、本地资源--同机架--任意机器D、同机架--任意机器--本地资源答案：C72.用来清理残留事务的工具叫（）。A、gs_cleanB、gs_gucC、gs_dumpD、gs_ctrl答案：A73.下面哪一个不是属性选择度量A、ID3使用的信息增益B、C4.5使用的增益率C、CART使用的基尼指数D、NNM使用的梯度下降答案：D74.MRSManager用户权限管理不支持（）配置。A、给用户配置角色B、给用户组配置角色C、给角色配置权限D、给用户组配置权限答案：D75.数据中台功能架构中数据接入包含（）能力。A、数据交换B、监控告警C、链路监测D、任务调度答案：A76.RDD有Transformation和Action算子，下列属于Action算子的是（）。A、mapB、saveAsTextFileC、FilterD、reduceByKey答案：B77.关于Hive建表的基本操作，描述正确的是（）。A、创建外部表的时需要指定external关键字B、一旦表创建好，不可再修改表名C、一旦表创建好，不可再修改列名D、一旦表创建好，不可再增加新列答案：A78.在MRSLibrA中，下面对analyze使用的描述错误的是（）。A、analyze语句可收集与数据库中表内容相关的统计信息，统计结果存储在系统表PG_STATISTIC中B、建议对一个刚执行过大批量插入操作的表执行analyze语句，以便使LibrA内的优化器模块根据这些统计数据获得更优的输出，进而影响业务性能C、执行计划生成器会使用PG_STATISTIC表中的统计数据，以生成最有效的查询执行计划D、analyze语句中使用-pop选项，可避免当数据库中数据量过大时内存紧张答案：D79.CLOG日志缓冲区使用（）算法。A、FIFOB、LRUC、SLRUD、RANDOM答案：C80.关于Hive的Python接口类型，以下描述不正确的是（）。A、要求Python版本不低于2.6.6,不高于2.7.0B、客户端必须装有setuptools,且版本不低于5.0C、hive_python_client脚本提供了直接执行SQL的功能，如hive_python_client"showtables5D、Python二次开发不支持安全集群答案：D81.在Spark中，假设lines是一个DStream对象，filter语句可以过滤掉80%的数据，针对以下两个语句说法正确的是：X:lines.filter(...).groupByKey(...)Y:lines.groupByKey(...).filter(...)A、X比Y的性能更高B、X比Y的性能更低C、X和Y和性能一样D、无法确性X和Y的性能差异答案：A82.HDFS中Namenode的主备仲裁，是由（）组件控制的。A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController答案：D83.以下（）能力不属于数据中台能力架构中存储计算能力。A、分布式数据仓库B、分布式关系数据库C、流计算D、任务调度答案：D84.Hadoop框架是用下面（）语言写的。A、PytyonB、JavaC、C++D、Scala答案：B85.YARN的基于标准调度，是对下列选项中的（）进行标签化。A、AppMasterB、ResourceManagerC、NodeManagerD、Container答案：C86.硬件故障被认为是常态，为了解决这个问题，HDFS设计了副本机制，默认情况下，一份文件，HDFS会存放（）份。A、3B、5C、2D、1答案：A87.Hbase中的Region是由（）服务进程来管理的。A、HRegionServerB、ZookeeperC、HmasterD、DataNode答案：A88.Spark自带的资源管理框架是（）。A、StandaloneB、MesosC、YARND、Docker答案：B89.下列关于Flinkbarrier描述错误的是（）。A、barrier周期性的插入到数据流中，并作为数据流的一部分随之流动B、barrier是Flink快照的核心C、一个barrier将本周期快照的数据与下一周期快照的数据分隔开来D、在插入barrier的时候，会暂时阻断数据答案：D90.在MRS中，以下（）不属于Hive的流控特性。A、支持对已建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制答案：C91.MapReduce任务最终是在下列（）中被执行的。A、NodeManagerB、containerC、ResourceManagerD、AppMaster答案：B92.关于MRSHDStreaming的Supervisor描述正确的是（）。A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务，启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件答案：B93.Hadoop中、如果yarn，scheduler.capacity.root.QueueA.minim.m-user-limit-percent设置为50，下面说法错误的是（）。A、一个用户提交任务，可以使用QueueA的100%的资源B、如果QueueA中已经有2个用户的任务运行，这时第3个用户提交的任务需要等待释放资源C、QueueA中必须保障每个用户至少得到50%的资源D、QueueA中的每个用户最多只能获得50%的资源答案：D94.MRSManager对服务的配置功能说法不正确的是（）。A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效答案：C95.以下（）数据不属于半结构化数据。A、HTMLB、XMLC、二维表D、JSON答案：C96.Streaming主要通过zookeeper提供以下的（）实现事件侦听。A、分布式锁机制B、WatcherC、CheckpointD、ACK答案：B97.国网数据中台，是在下面（）数据中心阶段的基础上发展过来的。A、营销服务中心B、全业务统一数据中心C、海量历史/实时数据中心D、电网GIS数据中心答案：B98.以下（）组件不是华为产品的。A、CDMB、DRSC、RDSD、SG-ETL答案：D99.下面（）不是二进制类型。A、BLOBB、RAWC、BYTEAD、TEXT答案：D100.假设每个用户最低资源保障设置为yarn，scheduler，capacity，root，QueueA.minimum-user-limit-percent=24。则以下说法错误的是（）。A、第3个用户提交任务时，每个用户最多获得33.33%的资源B、第2个用户提交任务时每个用户最多获得50%的资源C、第4个用户提交任务时，每个用户最多获得25%的资源D、第5个用户提交任务时，每个用户最多获得20%的资源答案：D101.下面关于Zookeeper的特性描述错误的是（）。A、客户端所发送的更新会按照他们被发送的顺序进行应用B、一条消息要被超过半数的Server接收，他将可以成功写入磁盘C、消息更新只能成功或失败，没有中间状态D、Zookeeper节点数必须为奇数个答案：D102.执行引擎的类型包括（）。A、行执行引擎B、向量化执行引擎C、行列混合执行引擎D、以上都是答案：D103.对于运行在MapReduce平台上的应用程序，此应用程序所依赖的jar包会被放到（）。A、HIVEB、HBASEC、HDFSD、DB答案：C104.YARN调度器分配资源的顺序，下面（）描述是正确的。A、任意机器->同机架->本地资源B、任意机器->本地资源->同机架C、本地资源->同机架->任意机器D、同机架->任意机器->本地资源答案：C105.Flume的（）source类型，支持监控并传输目录下新增文件，可实现实时数据传输。A、httpsourceB、execsourceC、syslogsourceD、spoolingdirectorysource答案：D106.以下（）选项不属于数据中台三层架构。A、贴源层B、轻度汇总层C、共享层D、分析层答案：B107.数据中台在汇聚生产库的结构化数据时，最多的数据处理操作是（）。A、统计B、删除C、新增D、修改答案：C108.Yam中（）角色是管理单个节点资源（CPU/Memory）的。A、NodeManagerB、ResourceManagerC、DataNodeD、NameNode答案：A109.Flume数据采集过程中，下列选项中能对数据进行过滤和修饰的是（）。A、SinkB、ChannelC、ChannelSelectorD、Interceptor答案：D110.以下不属于事务上层系统状态的是（）。A、startedB、beginC、mitD、inprogress答案：C111.Zookeeper在分布式应用中的主要作用不包括一下（）选项。A、选举Master节点B、保证各节点上数据的一致性C、分配集群资源D、存储及群中服务器信息答案：C112.下列（）命令是删除文件。A、dfs-clearB、dfs-lsC、dfs-rmD、dfs-del答案：C113.在MapReduce的应用程序开发中，下列（）JAVA类负责管理和运行一个计算任务。A、lobB、ContextC、FileSystemD、Configuration答案：A114.HDFS客户端所在节点的系统时间与MRS集群的系统时间要保持一致，若有时间差,那么时间差应小于（）分钟。A、5B、10C、20D、30答案：A115.以下关于Zookeeper关键特性中的原子性说法正确的是（）。A、客户端发送的更新会按照他们发送的顺序进行应用B、鞥新只能全部完成或失败，不会部分完成C、一条消息被一个server接受，将会被所有的server接受D、集群中无论那台服务器，对外展示的均是统一视图答案：B116.Spark是用以下（）编程语言实现的。A、CB、C++C、JAVAD、Scala答案：D117.Kafka集群中，Kafka服务端的角色是（）。A、BrokerB、ConsumerC、ZookeeperD、Producer答案：A118.下列选项中，关于Zookeeper可靠性含义说法正确的是（）。A、可靠性通过主备部署模式实现B、可靠性是指更新只能成功或者失败，没有中间状态C、可靠性是指无论哪一个server，对外展示的均是同一个视图D、可靠性是指一个消息被一个server接受，它将被所有的server接受答案：D119.Hbase的底层以（）形式存在。A、keyvalueB、列存储C、行存储D、实时存储答案：A120.HBase中Region的物理存储单元是（）。A、RegionB、ColumnFamilyC、ColumnD、Row答案：B121.安装MRS的Streaming组件是，Nimbus角色要求安装（）节点。A、4B、3C、2D、1答案：C122.在MRS产品中，关于KafkaTpoic，一下描述不正确的有（）。A、每个Topic只能被分成一个partition(分区)B、Topic的partition数量可以在创建时配置C、每个partition的存储层对应一个log文件，log文件中记录了所有的信息数据D、每条发布到Kafka的信息都有一个类别，这个类别被称为Topic，也可以理解为一个存储消息的队列答案：A123.关于HIVE的描述不正确的是（）。A、Hive最佳使用场景是大数据集的批处理作业B、Hive可以实现在大规模集群上实现低延迟快速查询C、Hive构建在基于静态批量处理的Hadoop之上，Hadoop通常有较高的延迟并且在提交作业和调度的时候需要大量的开销D、Hive查询操作过程严格遵循HadoopMapReduce的作用执行模型，Hive将用户的HiveSQL语句通过解释器转换为MapReduceHadoop集群上答案：B124.存在如下场景：每天由线上系统产生新数据500G,需要对这些数据按天、周、月等维度做统计汇总，（）设计建表。A、分桶表，按照天分桶B、分区表，按天分区C、倾斜表，倾斜字段选择日期，倾斜值随机D、分区+分桶表，按照时间分区，每个分区2560个桶答案：B125.下列选项中适合MapReducer的场景有（）。A、实时交互计算B、迭代计算C、流式计算D、离线计算答案：D126.下面关于ACID解释错误的是（）。A、A—atomictty原子性：事务的所有操作要么全部完成，要么全部不完成B、C—consistency一致性：事务始终保证系统处于一致性的状态，不影响一致性C、I—Isolation隔离性：事务执行是隔离的，3个隔离级别D、D—Durability持久性：事务的结果是持久的答案：C127.以下最常用的整型类型是（）。A、TINYINTB、SMALLINTC、INTEGERD、BIGINT答案：C128.CREATETABLEAS创建表，后面需要添加查询语句类型（）。A、INSERTB、UPDATEC、SELECTD、DELETE答案：C129.华为8.0数据中台数据复制产品是（）。A、OGGB、InformaticaC、SDRD、DRS答案：D130.MRSHD中Loader从SFTP服务器导入文件时，不需要做编码转换和数据转换且速度最快的文件类型是（）。A、graph-fileB、binary-fileC、text-fileD、sequence-file答案：B131.HBase默认使用（）作为其底层文件存储系统。A、HDFSB、HadoopC、MemoryD、MapReduce答案：A132.为了保障流应用的快照存储的可靠性，快照主要存储在（）。A、JobManager内存中B、可靠性高的单击数据库中C、本地文件系统D、HDFS答案：D133.以下关于HiveSQL基本操作描述正确的是（）。A、创建外部表必须要指定location信息B、创建外部表使用external关键字，创建普通表需要指定internal关键字C、加载数据到Hive时源数据必须是HDFS的一个路径D、创建表时可以指定列分割符答案：D134.关于Hive与Hadoop其他组件的关系，以下描述错误的是（）。A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖答案：D135.查询集合操作中，表示交集的是（）。A、INTERSECTB、MINUSC、EXECPTD、UNION答案：A136.华为MRS是国内首家符合国家金融等级保护的大数据平台，其安全性体现在以下（）方面。A、系统安全B、权限认证C、数据安全D、以上全部正确答案：D137.下列（）选项属于Hive的数据存储模型。A、桶B、数据库C、分区D、以上全都正确答案：D138.传统处理数据的数据规模的单位是（）。A、TBB、EBC、PBD、GB答案：D139.以下不属于CN自动剔除约束的是（）。A、设置CN心跳超时时间的值大于0B、集群中的CN总数必须大于等于3C、多CN故障时只能剔除一个CND、CN剔除以后，逻辑集群的创建、删除、扩容、缩容、回滚、显示操作可以执行答案：C140.决策树中不包含以下（）结点。A、根结点（rootnode）B、内部结点（internalnode）C、外部结点（externalnode）D、叶结点（leafnode）答案：C141.HBase的Region是由（）服务进程来管理的。A、HRegionServerB、ZooKeeperC、HMasterD、DataNode答案：A142.在MRSHD的客户端，执行kinit｛账号｝命令是为了得到KDC的（）内容。A、Krb5.confB、TGTC、STD、jaas.conf答案：B143.MRSManager对服务的配置功能说法不正确的是（）。A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存后需要重启服务才能生效答案：C144.下列关于Flinkbarrieer描述错误的是（）。A、一个barrier将本周期快快照的数据与下一个周期快照的数据分隔开来B、barrier是Flink快照的核心C、在插入barrier的时候，会暂时阻断数据流D、barrier周期性插入到数据流中，并作为数据流的一部分随之流动答案：C145.Hbase的某张表的RowKey划分Splitkey为9.E.a.z.请问表里面有（）Region。A、6B、5C、4D、3答案：B146.Hadoop中MapReduce组件擅长处理（）场景的计算任务。A、迭代计算B、离线计算C、实时交互计算D、流式计算答案：B147.关于Hive与传统数据仓库的对比，下列描述错误的是（）。A、Hive元数据存储独立于数据存储之外，从而解耦合元数据和数据，灵活性高，二传统数据仓库数据应用单一，灵活性低B、Hive基于HDFS存储，理论上存储可以无限扩容，而传统数据仓库存储量有上限C、由于Hive的数据存储在HDFS上，所以可以保证数据的高容错，高可靠D、由于Hive基于大数据平台，所以查询效率比传统数据仓库快答案：D148.以下关于Kafka的描述错误的是（）。A、使用java、scala语言实现B、用作活动流和运营数据处理管道的基础C、由ApacheHadoop开发，并于2011年开源D、具有消息持久化、高吞吐、实时等特性答案：C149.当zookeeper集群节点数为5时，请问集群的容灾能力和（）节点时等价的。A、3B、4C、5D、以上全不正确答案：B150.关于Hive中普通表和外部表的描述不正确的是（）。A、默认创建普通表B、外部表实质是将已经存在HDFS上的文件路径跟表关联起来C、删除普通表时，元数据和数据同时被删除D、删除外部表时，只删除外部表数据而不删除元数据答案：D151.YARN的基于标准调度，是对下列选项中的（）进行标签化。A、AppMasterB、ResourceManagerC、NodeManagerD、Container答案：C152.HBase表的rowkey设计是一个很重要的开发设计环节，下面roykey设计更为合理的是（）。A、姓名+手机号B、日期+手机号C、手机号+日期D、手机号+姓名答案：C153.以下（）选项属于MRSSparkSQL的优点。A、稳定和高性能B、SQL兼容性C、支持数据插入，更新和删除D、以上全部正确答案：D154.数据中台功能架构中运营管理包含包含（）能力。A、内存计算B、标签管理C、任务调度D、服务目录答案：C155.查看Kafka某Topic的partition详细信息时，使用如下（）命令。A、bin/kafka-topic.sh--createB、bin/kafka-topic.sh--deleteC、bin/kafka-topic.sh--listD、bin/kafka-topic.sh--describe答案：D156.Kafka集群在运行期间，直接依赖于下列（）组件。A、sparkB、zookeeperC、hdfsD、hbase答案：B157.Hive不适用于以下（）场景。A、非实时分析，例如日志分析，统计分析B、数据挖掘，例如用户行为分析，兴趣分析，区域展示C、数据汇总，例如每天，每用户点击数，点击排行D、实时在线数据分析答案：D158.Hbase元数据MetaRegion路由器信息存放在（）。A、ZookeeperB、Meta表C、HMasterD、Root表答案：B159.下列哪个命令是从HDFS下载目录/文件到本地的是（）。A、dfs-putB、dfs-catC、dfs-getD、dfs-mkdir答案：C160.YARN服务中，如果要给队列QuqueA设置容量为30%，应该配置（）参数。A、yarn.scheduler.capacity.root.QueueA.user-limit-factorB、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentC、yarn.scheduler.capacity.root.QueueA.capacityD、yarn.scheduler.capacity.root.QueueA.state答案：C161.以下关于HiveSQL基本操作描述正确的是（）。A、加载数据到Hive时数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建外部表使用external关键字，创建普通表需要指定internal关键字D、创建表时可以指定列分隔符答案：D162.下列（）选项不属于创建Loader作业时必须项。A、优先级B、名称C、连接D、类型答案：A163.以下关于Kafka消息消费者Consumer读取消息描述错误的是（）。A、consumer使用offset来记录读取位置B、Kafka的一个Topic可以理解为一个队列，即一个消息C、生产者产生的消息逐条放到Topic尾部D、消费者从右至左读取消息答案：D164.MRS产品中，关于Kafka说法不正确的是（）。A、Kafka强依赖于ZooKeeperB、Kafka的服务端可以产生消息C、Kafka部署的实例个数不得小于2D、Consumer作为kafka的客户端角色专门进行消息的消费答案：C165.Hadoop系统中YARN资源的抽象是用（）表示。A、内存B、CPUC、ContainerD、磁盘空间答案：C166.在Flink框架中，下列（）是流处理和批处理的计算引擎。A、standaloneB、RuntimeC、FlinkCoreD、DataStream答案：B167.Hive中的这条命令“ALTERTABLEEMPLOYEELADDCOLUMNS(columnsstring)”,是（）含义。A、创建表B、删除表C、添加列D、修改文件格式答案：C168.在Flink技术架构中，（）是流处理和批处理的计算引擎。A、StandaloneB、RuntimeC、DataStreamD、FlinkCore答案：B169.以下关于Zookeeper的Leader节点在接收到数据变更请求后的读写流程说法正确的是（）。A、仅写入内存B、同时写入硬盘和内存C、先写入内存再写入硬盘D、先写入硬盘再写入内存答案：D170.以下（）工具可以实现大量数据的快速导入和导出。A、gsqlB、GDSC、DataStudioD、DSC答案：B171.以下关于MRSCTBase的描述不正确的是（）。A、CTBase的读写接口，统一封装了行定义的接口，自动进行冷字段的合并和解析，不需要在应用程序中进行合并和解析B、CTBase是基于Hbase的聚簇表开发框架C、CTBase提供了一套WebUI进行元数据定义，提供了只管医用的表设计工具，降低表设计的难度D、CTBase的javaAPI提供了一套Hbase连接池管理的接口，内部连接共享，减少客户端应用开发的难度答案：B172.MRS系统中，下面（）方法不能查看到Loader作业的执行结果。A、通过LoaderUI界面查看B、通过YARN任务管理查看C、通过NodeManager查看D、通过Manager的告警查看答案：C173.在MRSHD中，创建Loader作业的进行数据转换正确步骤是（）。A、设置输入-转换-输出B、抽取-转换-输出C、加载-转换-输出D、加载-转换-抽取答案：A174.MULTIXACT日志存储的内容针对的是记录的（）部分。A、xminB、xmaxC、dataD、cid答案：B175.华为8.0数据中台架构贴源层数据存储产品是（）。A、MRSB、GBase8AC、DWSD、DAYU答案：A176.CSN的推进和分配在（）管理。A、GTMB、CNC、DND、CM_SERVER答案：A177.为了提高Kafka的容错性，Kafka支持Partition的复制策略，以下关于LeaderPartition和FollowerPartition的描述错误的是（）。A、Kafka针对Partition的复制需要选出一个Leader。由该Leader负责Partition的读写操作。其他的副本节点只是负责数据同步B、由于LeaderServer承载了全部的请求压力。因此从集群的整体考虑，Kafka会将Leader均衡的分散在每个实例上，来确保数据均衡C、一个Kafka集群各个节点间不可能互为Leader和FlowerD、如果Leader失效。那么将会有其他follower来接管(成为新的Leader)答案：C178.如果需要由数据生产者决定数据发送给目标Blot的某一个确定的Task，应该选择以下（）消息发布策略。A、局部字段分组B、广播分组C、直接分组D、全局分组答案：C179.下列关于SparkStreaming和Streaming比较说法不正确的是（）。A、SparkStreaming是一个微批处理框架，时间需要积累到一定量才能进行处理B、Streaming的执行逻辑是即时启动，运行完再回收C、SparkStreaming的吞吐量大约是Streaming的2-5倍D、SparkStreaming时间处理时延比Streaming更高答案：B180.以下（）数据不属于半结构化数据。A、HTMLB、XMLC、二维表D、JSON答案：C181.使用Hbase客户端批量写入10条数据，某个HRegionServer节点上包含两个Region，分别是A和B，10条数据中有6条属于A，4条属于B，请问写入这10条数据需要向HRegionServer发送（）RPC请求。A、10B、6C、2D、1答案：D182.在HBase写数据的业务逻辑实现过程中，如下（）接口或类是不需要涉及的。A、PutB、HTableC、HBaseAdminD、PutList答案：C183.以下（）不属于Hadoop中MapReduce组件的特点。A、高容错B、良好的扩展性C、实时计算D、易于编程答案：C184.MRS中Hbase默认使用（）组件作为其底层文件存储系统。A、FileB、KafkaC、HDFSD、Memory答案：C185.MRS中，如果需要查看当前登录HBase的用户和权限组，可以在HBaseshell中执行（）命令。A、user_permissionB、whoamiC、whoD、get_user答案：B186.以下（）组件负责接收来自应用的访问请求，并向客户端返回执行结果。A、GTMB、WLMC、CND、DN答案：C187.部署MRS时，同一集群内的FlumeServer节点建议至少部署（）个。A、1B、3C、4D、2答案：D188.Flink的数据转换操作在以下（）环节中完成。A、channelB、TransformationC、sinkD、source答案：B189.大数据最显著的特征是（）。A、数据规模大B、数据类型多样C、数据处理速度快D、数据价值密度高答案：A190.分析应用计算后的分析主题数据存储在（）。A、贴源层B、共享层C、分析层D、整合明细层答案：C191.以下扫描算子中用于对列存表进行扫描的算子是（）。A、SeqScanB、CstoreScanC、SubqueryScanD、ValuesScan答案：B192.以下两种描述分别对应（）分类算法的评价标准。A、Precision，RecallB、Recall，PrecisionC、Precision，RocD、Recall，Roc答案：A193.HBase中一个Region进行Split操作时，将一个HFile文件真正分开到两个Region的过程发生在以下（）阶段。A、Split过程中B、Flush过程中C、paction过程中D、HFile分开过程中答案：C194.在WebHCat架构中，用户能够通过安全的HTTPS协议执行以下（）操作。A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveSQL任务D、以上全部正确答案：D195.将数据块存储大小设置为128M,HDFS客户端在写文件时，当写入一个100M大小的文件，实际占用储存空间为（）。A、128MB、100MC、64MD、50M答案：B196.创建Loader作业中、可以在以下（）步骤中设置过滤器类型。A、输入设置B、转换C、基本信息D、输出答案：A197.MRS中，（）不属于集群节点的磁盘分区。A、OS分区B、数据分区C、元数据分区D、管理分区答案：D198.数据库利用（）进行死锁检测。A、DAGB、RPCC、WFGD、DLC答案：C199.Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DataNodeC、RegionServerD、ZooKeeper答案：C200.Agg算子的实现策略有（）。A、4B、3C、2D、1答案：B201.下列关于MRSLibrA数据均匀分布的存储描述错误的是（）。A、解析器从客户端应用获取输入的数据B、解析器对数据解析后，将数据分发诶各个处理单元进行处理C、各个处理单元把接受到的数据存储到各自的逻辑磁盘中D、每一个处理单元的逻辑磁盘只能是服务器自带的物理磁盘答案：D202.下面关于Zookeeper特性的描述错误的是（）。A、消息更新只能成功或者失败，没有中间状态B、Zookeeper节点数必须为奇数个C、一条消息要被半数的Server接受，它将可以成功的写入硬盘D、客户端所发送的更新会按照他们被发送的顺序进行应用答案：B多选题1.下面关于FusionInsightLibrADM的支持平台描述正确的有（）。A、可以运行在SUSE11.3系统上B、需要运行在InternetExplorer9.0及以上版本C、JDK需要1.6及以上版本D、操作系统需要预留2G内存，10G磁盘空间答案：ABD2.华为云数据湖探索（DataLakeInsight,DLI）支持以下（）任务的作业管理。A、ImpalaB、SQLC、FlinkD、Spark答案：BCD3.HDFS的应用开发中，下列（）是HDFS服务支持的接口。A、BufferedOutputStreamwriteB、BufleredOutputStream.flushC、FileSystem.createD、FileSystem.append答案：ABCD4.以下关于多租户管理的描述正确的有（）。A、可视化的多租户管理，与企业组织结构相匹配，简化系统资源分配与管理B、一站式管理租户资源，计算资源、存储资源、服务资源C、与企业组织结构相匹配的多级的租户模型，不同部门对用不同的租户，按需动态增删租户D、基于容器机制的租户资源隔离，为租户SLA保驾护航答案：ABCD5.FusionInsight家族包含以下（）子产品。A、GaussDB200B、FusionInsightMinerC、FusionInsightHDD、FusionInsightFarmer答案：ABCD6.华为FusionInsightHD成功案例有（）。A、数字政府B、智慧园区C、智慧交通D、金融答案：ABCD7.下列关于Worker、Executor、Task说法正确的是（）。A、每个Executor可以运行多个TaskB、每个Worker可以运行多个ExecutorC、每个Worker只能为一个拓扑运行ExecutorD、每个Executor可以运行不同组件的Task答案：ABD8.DAYU作业调度的方式有（）。A、单次调度B、周期调度C、事件驱动调度D、自定义调度答案：ABC9.DWS可以创建的表包含（）表。A、临时表B、UNLOGGED表C、分区表D、哈希表答案：ABC10.MRS中，可以通过（）方式查看Oozie作业的调试结果。A、查看Oozie的JAVAAPI返回结果是否符合预期B、通过Hue的workflow仪表板查看程序运行结果C、通过Hue的workflow仪表板查看程序运行结果D、Oozie自带的Web界面也可以查看作业执行结果答案：ABCD11.Hive支持下列（）表类型。A、分区表B、分桶表C、倾斜表D、分区+分桶表答案：ABCD12.华为云机器学习服务MLS支持（）分类方法。A、梯度提升术B、逻辑回归C、随机决策森林D、支持向量机答案：ABCD13.在DAYU数据质量模块中，新建规则块时系统内置的模板规则共计19种，分为四种类型，具体为（）。A、库级规则B、表级规则C、字段级规则D、跨字段级规则答案：ABCD14.在线日志查询方案中，采用流处理来完成计算工作，整个计算过程中，需要将中间计算结果暂时存放，下列（）组件适合存放中间计算结果。A、HDfSB、HBaseC、KafkaD、Redis答案：CD15.关于FusioninsightHD的Spark,以下（）编程语言可以用来开发Spark应用。A、CB、ScalaC、JavaD、Python答案：BCD16.与开源的sqoop相比，Loader具有（）增强特性。A、高可靠性B、高性能C、安全性D、图形化答案：ABCD17.MRS系统中，Hive支持的接口类型有（）。A、JDBC接口B、ODBC接口C、Python接口D、Ruby接口答案：ABC18.创建数据库建议（）。A、对象名称不超过64字节B、使用utf-8作为数据库默认编码集C、不要使用多字节符作为对象名答案：BC19.调用Zookeeper客户端命令中包含（）信息。A、IP地址B、端口号C、服务器名称D、用户名答案：ABCD20.MRS使用Streaming客户端shell命令查看拓扑或者提交拓扑失败，以下（）定为手段是正确的。A、查看Supervisor运行日志，判断是否Supervisor异常B、查看worker运行日志C、查看Niimbus的运行日志，判断是否Nimbus服务异常D、查看客户端异常堆栈，判断是否是客户端使用问题答案：ABCD21.Loader提供了（）方式或接口实现作业管理。A、WebUIB、Linux命令行C、Rest接口D、JavaAPI答案：ABCD22.数据质量定义模块包括（）。A、质量维度定义B、检验类别管理C、度量规则管理D、检核方法管理答案：ABCD23.MRS中使用Streaming客户端shell命令提交拓扑之后，使用StormUI查看发现该拓扑长时间没有处理数据，可能原因有（）。A、拓扑业务逻辑错误，提交之后无法正常运行B、Supervisor是在Topology中接收数据然后执行处理的组件C、拓扑过于复杂或者并发太大，导致worker启动时间过长，超过supervisor的等待时间D、Supervisor的slots资源被消耗尽，拓扑提交上去后分不到slot去启动worker进程答案：ABCD24.创建API时，需要填写（）信息。A、API名称B、API目录C、请求PathD、请求方法答案：ABCD25.FusionInsightLibrA中的DM工具可以提供（）功能。A、数据库安装管理B、配置管理C、对象管理D、集群管理答案：ABCD26.以下（）是Kafka实际的应用场景。A、网络活性跟踪B、日志收集C、聚合统计系统运营数据D、资源管理答案：ABC27.MRS的Loader在创建作业时，连接器有以下（）作业。A、配置作业与内部数据连接方式B、配置作业与外部数据连接方式C、确定有转换D、提供优化参数，提高数据导入导出性能答案：ABCD28.下列关于Flink中Transformation的说法正确的是（）。A、可以通过window设定时间窗口B、Filtor操作是对每个元素执行Boolean函数C、flatMap可以对文本进行切分D、keyBy是将源头数据按照key进行分组，以保证同一个key的元素分到同样的组中答案：ABD29.在DRS的标签管理服务中，下列存在的功能有（）。A、添加标签B、编辑标签C、备份标签D、删除标签答案：ABD30.在大数据时代，企业所面临的挑战有以下（）。A、企业各个部门间数据分散，相同数据在各个部门内部存储格式不一致B、数据结构多样化C、竞争对手的技术进步D、数据在噪音、缺失、储存不规范等问题，需要进行大量的数据预处理工作答案：ABCD31.华为大数据产品MRS中的Streaming具有（）关键特性。A、容灾能力B、灵活性C、消息可靠性D、可伸缩性答案：ABC32.向用户授权DRS权限流程包括以下（）方面。A、创建用户组并授权B、创建用户C、用户登录并验证权限D、用户自行添加权限答案：ABC33.关于Kafka的特点如下描述正确的是（）。A、Kafka是：一个高吞吐、分布式、基于发布订阅的消息系统B、Kafka可以做到消息的持久化C、适用于离线和在线的消息消费场景D、Kafka可以保证每个Partition内的消息有：序答案：ABCD34.采用Flume传输数据过程中，为了防止因Flume进程重启而丢失数据，可以使用以下（）Channel。A、memoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel答案：BC35.YARN容量调度器的主要特性有（）。A、容量保证B、动态更新配置文件C、灵活性D、多重租赁答案：ABCD36.DWS的默认用户拥有（）权限。A、登录B、创建数据库C、创建用户答案：ABC37.在SolrCloud模式下，以下关于Solr相关概念描述正确的有（）。A、Collection是在SolrCloud集群中逻辑意义上完整的索引，可以被划分为一个或者多个Shard，这些Shard使用相同的ConfigSet。B、ConfigSet是SolrCore提供服务必须的一组配置文件，包括solrconfig.xml和schemxml等。C、Shard是Collection的逻辑分片，每个Shard都包含一个或者多个replicas，通过选举确定哪个replica是Leader，只有Leaderreplica才能进行处理索引和查询请求。D、Replica只有处于active状态时才会接受索引和查询请求。答案：ABD38.MRS中，关于Hive和Sparksql下列（）描述是正确的。A、两者都能对外提供SQL或类SQL能力B、两者都能运行在MapReduce计算框架上C、两者都能通过表字段和HBase字段映射的方式访问HBase上的数据D、两者都能运行在Spark计算框架上答案：ACD39.在MRS中，关于Kafka组件说法正确的是（）。A、在创建Topic时，副本数不得大于当前存活的Broker实例个数，否侧创建Topic将会失败B、Kafka的Producer发送消息时,可以指定该消息被哪个sumer消费C、Kafka会将元数据信息存放在Zookeeper上D、Kafka安装完成后就不能再配置数据存放目录答案：ABCD40.以下能表示为布尔类型“真”值的是（）。A、TRUEB、't'C、'true'D、'y'答案：ABCD41.MRS中，Hive客户端以下（）参数是用来控制reduce并发度的。A、hive.exec.reducers.bytes.per.reducerB、hive.exec-ducers.maxC、hive.exec.max.dynamic.partitionsD、hive.exec.max.dynamic.partitions.pemode答案：AB42.MRS支持通过（）方式提交Oozie作业。A、Sheell命令B、JavaAPIC、JavaAPID、RestAPI答案：ABCD43.下列（）选项属于数据安全性。A、操作系统安全加固B、组件数据加密C、数据完整性校验D、用户权限认证管理答案：BC44.MRS集群中，关于Hive和SparksqL描述正确的是：()。A、两者都能对外提供SQL或类SQL能力B、两者都能运行在MapReduce计算框架上C、两者都能通过表字段和HBase字段映射的方式访问HBase上的数据D、两者都能运行在Spark计算框架上答案：ACD45.以下关于Flink与其他组件交互说法正确的是（）。A、Flink任务的运行依赖Yarn来进行资源调度B、Flink的checkpoint的实现依赖于ZookeeperC、Flink可以将接受的组件发给KafkaD、Flink在HDFS文件系统中读写数据答案：ABCD46.下面关于FusionInsightLibrA权限授予的描述正确的有（）。A、权限授予最小化，只需要SELECT权限的不需要授予其他权限B、不要为了方便随便授予ALLPRIVILEGES权限C、谨慎授予可能改变表内容的操作（update、insert）权限D、管理好权限周期，超过时间及时使用REVOKE回收权限答案：ABCD47.要实现资源检索应配置的前置条件是（）。A、在分类管理中先配置好分类类型和分类模板B、在页面在线配置中配置好表属性“是否为查询条件”，才能显示动态配置查询条件C、查看资源详情，预览数据需先同步元数据数据源D、创建sap索引答案：ABC48.以下关于FusionInsight网路安全可靠性，说法正确的是（）。A、阻止外部攻击者通过管理通道入侵实际业务数据B、FusionInight支持网路划分为三级：集群业务平面、集群管理平面和集群外维护网路彼此之间实施物理隔离C、避免业务平面的高负载阻塞集群管理通道D、网路平面隔离，避免管理与业务贷款抢占，相互干扰答案：ABCD49.下列关于FusionInsightLibrA行存储和列存储的使用场景描述正确的有（）。A、列存储适用于统计分析类查询（group，join多的场景）B、行存储适用于点查询（返回记录少，基于索引的简单查询）C、列存储适用于点查询（返回记录少，基于索引的简单查询）D、行存储适用于即席查询（查询条件列不确定，行存无法确定索引）答案：AB50.Loader可以实现以下（）转换规则。A、长整型时间转换B、增量转换C、拼接转换D、空值转换答案：ABCD51.Flink的兼容性体现在以下（）方面。A、YARN能够作为Flink集群的资源调度管理器B、能够与Hadoop原有的Mappers和Reduces混合使用C、能够使用Hadoop的格式化输入和输出D、能够从本地获取数据答案：ABCD52.在HBase表设计中，对于多项业务公用rowkey,导致数据访问矛盾的情况，可以有（）应对策略。A、折中法（rowkey设计兼顾A和B的业务需求）B、冗余法（用空间换时间厂效率）C、创建二级索引D、预分region答案：ABC53.华为云数据湖探索（DataLakeInsight,DLI）的数据源支持以下（）数据格式。A、CSVB、ParquetC、JSOND、ORC答案：ABCD54.DRS在线迁移支持数据库中，包含（）方面。A、Mysql数据库B、Postgres数据库C、MongoDB数据库D、Oracle数据库答案：ABCD55.执行Hbase读取数据业务，需要从（）读取。A、HmasterB、HfileC、HlogD、MetaStore答案：BD56.StructuredStreaming在OutPut阶段可以定义不同的数据写入方式，包括以下（）方式。A、GeneralModeB、AppendModeC、pleteModeD、UpdateMode答案：BCD57.YARN容量调度器的主要特性有（）。A、容量保证B、动态更新配置文件C、灵活性D、多重租赁答案：ABCD58.Zookeeper可以为MRS中的那些组件提供分布式管理支持（）。A、HiveB、LoaderC、HbaseD、Spark答案：ACD59.在MRS中，使用SparkSQL时，可以通过以下（）方式（或工具）执行SQL语句。A、JDBCB、spark-beelineC、spark-sqlD、OBBC答案：ABC60.数据字典能修改的内容包括（）。A、数据字典的类型B、数据字典类型的子项C、数据字典名称D、数据字典的层级答案：AB61.以下属于Stream算子执行方式的有（）。A、SortedB、BroadcastC、GatherD、Hashed答案：BC62.MRS中，关于Ooze的作业管理，对于己暂停的作业可以进行以下（）操作。A、killB、runC、resumeD、submit答案：AC63.只有数据资源处于（）状态，才可以更新。A、注册B、更新C、发布D、已创建答案：ABC64.MRS中，在使用Streaming的ACK机制时，下列（）说法是正确的。A、启用了Acker之后，Streaming会识别发送失败的Tuple并自动重发，无需人为干预。B、Acker会标识处理超时或者处理失败的消息为faiLC、从spout开始，形成的Tuple树中任何一个环节失败都会标记整棵树失败。D、应用需要在spout的fail（）接口方法中实现消息重发逻辑。答案：BCD65.在产品选型时，数据中台逻辑架构中贴源层要重点关注产品的特点包含（）方面。A、具备审计能力，可提供给共享层做数据恢复B、低廉的存储能力，以供海量数据存储C、高并发数据写入能力，支撑数据高效写入D、数据访问以支持海量数据审计和高可靠答案：ABCD66.Loader可以将HDFS数据导出到以下（）目标端。A、oracle数据库B、SFTP服务器C、DB2数据库D、FTP服务器答案：ABCD67.数据归约的策略包括：()。A、维归约B、数量归约C、螺旋式方法D、数据压缩答案：ABD68.YARN中从节点主要负责以下（）工作。A、集群中所有资源的统一管理和分配B、监督container的生命周期C、监控每个Container的资源使用情况D、管理日志和不同应用程序用到的附属服务答案：BC69.MRS中，下列（）属于Oozie的MapReduceAction的配置项。A、name-nodeB、sourceC、mapred.mapper.classD、job-tracker答案：ACD70.在FusionInsightLibrA中，下列关于索引选择的描述正确的有（）。A、列存选择index时，尽量选择查询条件出现最多的列，例如filter条件或join列上建立partialclusterkey（约束）B、行存选择index，查询条件上创建B-treeindex，也可以创建组合索引，第三天承认值比较少的列不适合建立indexC、列存选择index，条件列上可以建立psortindex，也可以创建组合索引D、行存选择index，行存不适合建立太多B-treeindex，然后做数据导入，这样的数据导入性能非常差，一般这种情况需要按照分区导入且后建index答案：AB71.在Loader历史作业记录中，可以查看以下（）内容。A、作业状态B、脏数据链接C、错误行/文件数量D、作业开始时间/运行时间答案：ABCD72.下列选项中，（）是MapReduce一定会有的过程。A、bineB、MapC、ReduceD、Partition答案：BCD73.API网关是华为云提供的一个API托管的应用服务，以下（）是API网管包括的功能。A、API全生命周期的管理B、权限控制C、访问控制D、流量控制答案：ABCD74.Spark适用于以下（）场景。A、交互式查询B、实时流处理C、批处理D、图计算答案：ABCD75.Redis的LIST数据结构，适用于下列（）场景。A、

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

华为数据中台运维知识考试复习题库（含答案）

文档简介

温馨提示

最新文档

评论

华为数据中台运维知识考试复习题库（含答案）

文档简介

温馨提示

最新文档

评论

相关文档