华为大数据测试题及答案_第1页
华为大数据测试题及答案_第2页
华为大数据测试题及答案_第3页
华为大数据测试题及答案_第4页
华为大数据测试题及答案_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第第6页/共20页第第6页/共20页华为大数据测试题及答案下列关于GaussDB200的局部聚簇技术说法正确的是()?A、局部聚簇技术可以应用在GaussDB200的所有表中B、局部聚簇在某些场景下可以提交检索效率,所以在创建表时根据业务场景应创建多个PCKC、PCK对应的列尽量不要为空值D、PCK通过min/max稀疏索引实现事实表快速过滤扫描(正确答案)从数据库架构设计来看,主要有以下哪些设计思路?A、Shard-DiskB、Shard-EveryingC、Shard-NothingD、以上都是(正确答案)关于Schema和Database,下面说法正确的是()。A、二者都能实现资源隔离B、schema和用户强相关的,通过权限控制语法可以实现不同用户对各Schema的权限(正确答案)C、Database之间无法直接访问,但通过权限授予可以访问数据D、相比于Database,Schema的隔离更加的彻底下面哪个数据类型不是GaussDB200支持的数据类型()。A、XML类型(正确答案)B、数值类型C、JSON类型D、货币类型GaussDB200在创建表时,需要注意以下哪个事项()?A、创建列存表时压缩级别默认为LOW(正确答案)B、创建列存表时压缩级别默认为HIGHC、创建列存表时压缩级别默认为NOD、创建列存表之后,后续可以修改为行存表下列关于存储过程的特点说法正确的是()?A、编写的SQL存储在数据库中,因此执行速度快B、创建时编译,执行时调用,因此开发效率高C、用户创建的存储过程或自定义函数可以重复调用,因此数据传输量少D、通过指定存储过程的访问权限,因此安全系数高(正确答案)语句number=0的意思是()?A、修改变量number的值为0B、判断number的值是否为0C、比较number和0的大小D、声明一个变量number,并初始化值为0(正确答案)GaussDB200支持几种数据并行导入策略?A、4B、3(正确答案)C、2D、1ElasticSearch架构中包含哪些?A、A.以上说法全都正确(正确答案)B、ClientC、ESMasterD、ESNode.以下哪个不是RDD的创建方式?A、从子的RDD转换到新的RDD(正确答案)B、从数据集合转换而来C、从HDFS输入创建D、从父的RDD转换的到新的RDD以下哪个不是SparkSQL的使用场景?A、A.需要处理PB级的大容量数据B、对数据处理的实时性要求不高的场景C、实时数据查询(正确答案)D、结构化数据处理第第6页/共20页第第6页/共20页第第6页/共20页以下哪个不是离线批处理的核心诉求?A、处理数据量巨大B、处理数据格式多样C、处理时间要求不高(正确答案)D、支持SQL类作业和自定义作业HBase架构中包含哪些?A、ZookeeperB、以上说法全都正确(正确答案)C、HmasterD、HRegionServer某项目小组接到一个大数据实时分析项目,且对实时性要求很高。请问以下哪种大数据计算框架最合适?A、HbaseB、MapReduceC、SparkD、Flink(正确答案)以下关于Hive内置函数描述正确的是?A、descfunctionsupper:查看系统自带的函数B、trim():去除空字符串(正确答案)C、to_date():获取当前日期D、substr():求字符串长度Gremlin中查询单个点的信息该用什么命令?A、g.V(13464736).valueMap()(正确答案)B、g.V().hasLabel("test").values("age")C、g.V().hasLabel("test")D、g.V().hasLabel("test").valueMap("String_list","age")考虑以下场景,当公安人员需要根据某犯罪人员发现其犯罪同伙时,最适合使用下列哪个工具?A、ElasticSearchB、GraphBase(正确答案)C、HbaseD、HDFSHBase使用get方法读取数据时,下列哪个选项是需要的?A、Deletedelete=newDelete(rowKey)B、scan.setCaching(1000)C、byte[]rowKey=Bytes.toBytes("012005000201")(正确答案)D、List<Put>puts=newArrayList<Put>()Flink不包含以下哪些数据处理场景?A、高并发B、毫秒级低时延C、高可靠性D、图形分析(正确答案)关于GaussDB200的逻辑架构,下列说法正确的是()?A、DN是实际数据节点,所以只负责存储数据。B、CM是集群的管理模块,那么负责集群的日常管理和运维。C、CN是协调节点,协助CM管理整个集群。D、GTM是全局事务控制器,负责生成和维护全局事务ID等全局唯一信息。(正确答案)用户Region和RegionServer之间的路由信息,保存在哪个模块中?A、ZookeeperB、BHDFSC、MasterD、Meta表(正确答案)Hbase的物理存储单元是什么?A、RegionB、Columnfamily(正确答案)C、ColumnD、RowRedis中适合存储对象的数据类型是?A、Hash(正确答案)B、ListC、StringD、SetGAUSSDB200数据并行导入Shared策略支持的数据格式是?A、CSVB、Text(正确答案)C、FIXEDD、seqFlume支持第三方过滤器对数据进行过滤操作。[判断题]对(正确答案)错多个Flume可以连接起来从部署节点上采集数据。[判断题]对(正确答案)错Flume传输数据时,sink如果出现下一跳故障,可以将数据发给其他的下一跳。[判断题]对(正确答案)错Kafka集群中,Kafka服务端角色是Consumer。[判断题]对错(正确答案)Kafka集群中,Kafka部署的实例个数不得小于2。[判断题]对(正确答案)错Checkpoint机制是Flink运行过程中容错的重要手段。[判断题]对(正确答案)错Flink程序是由DataSet和DataStream组成。[判断题]对错(正确答案)StructuredStreaming的外部存储系统的AppendMode方式表示只有在ResultTable中被更新的数据才会被写入到外部存储系统。[判断题]对错(正确答案)Redis可以做排行榜的应用场景。[判断题]对(正确答案)错Redis的flushall命令表示清空Redis实例下所有数据库的数据。[判断题]对(正确答案)错数据库架构设计Shard-Everying是指服务器的所有资源(包括磁盘、CPU、显卡、网络)都共享。[判断题]对错(正确答案)CTID的值是增量增加的。[判断题]对(正确答案)错物理集群包含逻辑集群。[判断题]对(正确答案)错SQLonAnywhere的意思是SQL可以在任何地方使用。[判断题]对错(正确答案)GaussDB200的自适应调度和大数据的Yarn调度是类似的,都是根据作业的所耗资源,按照作业优先级,并优先满足损耗资源少的作业,保证资源的充分利用。[判断题]对错(正确答案)创建数据库时默认支持的字符集是UTF-8。[判断题]对错(正确答案)Flink程序是由DataSet和DataStream组成。[判断题]对错(正确答案)StructuredStreaming的外部存储系统的AppendMode方式表示只有在ResultTable中被更新的数据才会被写入到外部存储系统。[判断题]对错(正确答案).Hive从本地加载数据需要加关键字:“local”。[判断题]对(正确答案)错大数据技术,是指伴随大数据的采集、存储、处理和分析的相关技术[判断题]对(正确答案)错针对不同的数据来源,需要先分析其数据特征,例如一般网站产生的日志特点是数据量大,价值密度高,数据的业务种类多且涵盖之前的数据。[判断题]对错(正确答案)Kafka中的Broker在收到新消息后会立即存入磁盘。[判断题]对错(正确答案)GaussDB200的自适应调度和大数据的YARN调度是类似的,都是根据作业的所耗资源,按照作业优先级,并优先满足损耗资源少的作业,保证资源的充分利用。[判断题]对错(正确答案)Hbase是一种分布式数据库,不依赖HDFS也可以运行。[判断题]对(正确答案)错GAUSSDB200在内部使用行标识符(CTID)记录数据在表中的逻辑位置。[判断题]对错(正确答案)Redis默认支持14个数据库。[判断题]对错(正确答案)关于Kafka组件说法正确的是?A、删除topic时,必须确保kafka的服务配置delete.topic.enable配置为true(正确答案)B、Kafka安装及运行日志保存路径为/srv/Bigdata/kafka/C、ZooKeeper服务不可用会导致Kafka服务不可用(正确答案)D、必须使用admin用户或者kafkaadmin组用户进行创建topic(正确答案)下面哪些是Flume的sink支持的类型?A、KafkaSink(正确答案)B、StormSinkC、HbaseSink(正确答案)D、SparkSink(正确答案)Redis的写命令同步的时机有哪几种?A、appendfsyncyesB、appendfsyncalways(正确答案)C、appendfsynceverysec(正确答案)D、appendfsyncno(正确答案)关于Redis的描述,下列正确的是?A、Redis支持多数据库(正确答案)B、可以使用existskey判断键是否存在(正确答案)B、B、count(正确答案)第6页/共20页B、B、count(正确答案)第6页/共20页D、支持标准D、支持标准SQL和标准JDBC特性第6页/共20页C、Redis可以为任何键增减字段而不影响其他键D、Redis的命令区分大小写(正确答案)下面哪些是属于Flink的窗口类型?A、TumblingWindow(正确答案)B、countWindow(正确答案)C、SlidingWindow(正确答案)D、timeWindow(正确答案)以下哪些情况下采用Replication方式存储数据()?A、存储的表的数据量较小(正确答案)B、需要较高的并发分析能力(正确答案)C、对数据的完整性要求较高D、以上都是一般在什么时候会采用数据分区()?A、当表中数据量比较多(千万级别以上)的时候(正确答案)B、需要执行大量的数据删除操作的时候(正确答案)C、需要执行大量的热点数据查询操作的时候(正确答案)D、需要执行大量的数据更新操作的时候(正确答案)GaussDB200的高可靠主要体现在()?A、提供集群管理和数据节点HA(正确答案)B、事务支持ACID特性(正确答案)C、支持故障切换、单节点故障恢复(正确答案)下面关于GaussDB200的逻辑集群说法正确的是()?A、逻辑集群的意思就是通过物理服务器的隔离来达到数据的分离处理B、在逻辑集群上实现多租户管理,达到CPU、内存等计算资源的控制隔离(正确答案)C、逻辑集群的最终目的是实现资源隔离及资源弹性能力(正确答案)D、一个物理节点对应一个逻辑集群(正确答案)对于Gremlin描述正确的是?A、支持客户端操作和JavaAPI操作(正确答案)B、每一步操作都在数据流(datastream)上执行一个原子操作(正确答案)C、语句比较复杂D、函数式数据流语言(正确答案)HDFS的系统结构中包含哪些模块?A、DataNode(正确答案)B、Client(正确答案)C、RegionServerD、NameNode(正确答案)以下哪些是Hive自带的系统函数?A、sum(正确答案)第第6页/共20页B、用于优化随机写的场景(B、用于优化随机写的场景(正确答案)第6页/共20页C、批量文件数据(C、批量文件数据(正确答案)第6页/共20页C、like(正确答案)D、Dwg大数据场景化解决方案包含以下哪些选项?A、离线检索B、离线批处理(正确答案)C、实时检索(正确答案)D、实时流处理(正确答案)在金融领域的大数据批量离线处理平台中,以下描述准确的是?A、在数据集成模块,可以分为数据采集、数据操控和数据加载3个阶段。(正确答案)B、金融领域的外部数据来源可以是征信信息、社交网络和电商等。(正确答案)C、金融领域的内部数据来源均是结构化数据,包括信贷数据、信用卡数据和收单数据等。D、金融领域的数据应用层面均是面向金融机构内部的,如监管报表系统,精准营销、BI应用等,完全不对外或对其他下属机构开放。大数据离线批处理场景中常见的数据源包括?A、流式数据Socket流(正确答案)B、网页日志流(正确答案)D、数据库(正确答案)以下哪些选项是实时检索适用的场景?A、高并发的场景(正确答案)B、查询速度要求高的场景(正确答案)C、图片查询场景(正确答案)D、查询条件比较复杂的场景下列哪些措施,可以显著提升ElasticSearch的性能?A、减少EsMasterB、禁用swap(正确答案)C、修改副本数量(正确答案)D、增加EsMasterFlink中的计算时间包含以下哪几种?A、IngestionTime(正确答案)B、EventTime(正确答案)C、DelayTimeD、ProcessingTime(正确答案)StructuredStreaming中通过什么机制,解决数据的无序和滞后问题?A、持续查询B、事件时间(正确答案)C、watermark机制(正确答案)D、流连接下列关于GaussDB200的TOAST机制说法正确的是()?A、支持变长(varlena)表现形式的数据类型。(正确答案)B、存储超过2KB的字段时,会触发TOAST机制。(正确答案)C、存储超过1KB的字段时,会触发TOAST机制。D、存储超过1/2KB的字段时,会触发TOAST机制。数据仓库数据分层的优点包括?A、把复杂问题简单化(正确答案)B、减少数据仓库存储空间C、隔离原始数据(正确答案)D、减少重复开发(正确答案)GaussDB200的高可靠主要体现在()?A、提供集群管理和数据节点HA。(正确答案)B、GTM采用Active-Standby模式。(正确答案)C、CN支持多CNActive-Active模式HA。(正确答案)D、支持标准SQL和标准JDBC特性。对HbaseBloomfilter描述不正确的是?A、判断结果一定正确(正确答案)C、用于优化Scan场景(正确答案)D、误判率由哈希函数个数k、位数组大小m、数据量n共同确定实时场景的典型特点是?A、数据格式多(正确答案)B、交互式查询(正确答案)C、数据量大D、时延要求高(正确答案)实时检索解决方案支持的数据采集有哪些?A、Loader(正确答案)B、Spark(正确答案)C、Sparkstreaming(正确答案)D、Graphbase导入工具(正确答案)/r/

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论