华为大数据测试试题及答案_第1页
华为大数据测试试题及答案_第2页
华为大数据测试试题及答案_第3页
华为大数据测试试题及答案_第4页
华为大数据测试试题及答案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、华为大数据测试试题及答案HCIP_81您的姓名:填空题*1 .Flume支持采集静态目录下数据的source类型是?单项选择题A、sourceB、spoolingdirectorysource正萌答奏C、execsourceD、syslogsource2 .关于Kafka磁盘容量缺乏的告警,对于可能的原因以下不正确的选项是?【单项选择题1A、用于存储Kafka数据的磁盘配置如磁盘数目磁盘大小等,无法满足当前业务数据流量,导致磁盘使用率到达上限B、数据保存时间配置过长,数据累积到达磁盘使用率上限C、业务规划不合理,导致数据分配不均,使局部磁盘到达使用率上限D、Broker节点故障导致正确笑案3

2、.查看Kafka某Topic的Partition详细信息时,使用如下哪个命令?单项选择题A、bin/kafka-topics.shcreateB、bin/kafka-topics.sh-listC、bin/kafka-topics.sh-deleteD、bin/kafka-topics.sh-describe正确答案4 .关于Kaflca组件部署说法不正确的选项是?单项选择题A、Kafka强依赖于ZooKeeper,安装Kafka必须安装ZooKeeperB、Kafka部署的实例个数不得小于2C、Kafka效劳端可以产生消息王确答案)D、Consumer作为Kafka的客户端角色专门进行消息的

3、消费5 .在redis中,下面哪个是操作Hash数据类型的命令?单项选择题1A、strlenB、hexists王确答案)C、smembersD、Ltrim6 .关于Schema和Database,下面说法正确的选项是().单项选择题A、二者都能实现资源隔离B、schema和用户强相关的,通过权限限制语法可以实现不同用户对各Schema的权限:正确答案)C、Database之间无法直接访问,但通过权限授予可以访问数据D、相比于Database,Schema的隔离更加的彻底7 .下面哪个数据类型不是GaussDB200支持的数据类型().单项选择题A、XML类型;正确答案)B、数值类型C、JSON

4、类型D、货币类型8 .GaussDB200在创立表时,需要注意以下哪个事项()?单项选择题A、创立列存表时压缩级别默认为LOW:王确答案B、创立列存表时压缩级别默认为HIGHC、创立列存表时压缩级别默认为NOD、创立列存表之后,后续可以修改为行存表9 .以下关于存储过程的特点说法正确的选项是?单项选择题A、编写的SQL存储在数据库中,因此执行速度快B、创立时编译,执行时调用,因此开发效率高C、用户创立的存储过程或自定义函数可以重复调用,因此数据传输量少D、通过指定存储过程的访问权限,因此平安系数高正亮答案10 .以下关于GaussDB200的局部聚簇技术说法正确的选项是?单项选择题A、局部聚簇

5、技术可以应用在GaussDB200的所有表中B、局部聚簇在某些场景下可以提交检索效率,所以在创立表时根据业务场景应创建多个PCKC、PCK对应的列尽量不要为空值D、PCK通过min/max稀疏索引实现事实表快速过滤扫描E静等案H.从数据库架构设计来看,主要有以下哪些设计思路?单项选择题1A、Shard-DiskB、Shard-EveryingC、Shard-NothingD、以上都是正确答案12. 语句number=0的意思是?单项选择题A、修改变量number的值为.B、判断number的值是否为.C、比拟number和0的大小D、声明一个变量number,并初始化值为.正确答案13. Ga

6、ussDB200支持几种数据并行导入策略?单项选择题1A、4B、3正确答案c、2D、114. ElasticSearch架构中包含哪些?单项选择题A、A.以上说法全都正确:正确答案B、ClientC、ESMasterD、ESNode15.以下哪个不是RDD的创立方式?单项选择题A、从子的RDD转换到新的RDD正确答案IB、从数据集合转换而来C、从HDFS输入创立D、从父的RDD转换的到新的RDD16. 以下哪个不是SparkSQL的使用场景?单项选择题A、A.需要处理PB级的大容量数据B、对数据处理的实时性要求不高的场景C、实时数据查询正确答案D、结构化数据处理17. 以下哪个不是离线批处理的

7、核心诉求?单项选择题A、处理数据量巨大B、处理数据格式多样C、处理时间要求不高正篇答案,D、支持SQL类作业和自定义作业18. HBase架构中包含哪些?单项选择题1A、ZookeeperB、以上说法全都正确(正班答案)C、HmasterD、HRegionServer19. 某工程小组接到一个大数据实时分析工程,且对实时性要求很高.请问以下哪种大数据计算框架最适宜?单项选择题A、HbaseB、MapReduceC、SparkD、Dink(正确答案)20. 以下关于Hive内置函数描述正确的选项是?单项选择题1A、descfunctionsupper:查看系统自带的函数trim():去除空字符串

8、(正瑞答案)Csto_date():获取当前日期D、substr():求字符串长度21. Gremlin中查询单个点的信息该用什么命令?单项选择题A、g.V(13464736).valueMap()'正二鸟答案)B、g.V().hasLabel("test").values("age")C、g.V(),hasLabel("test")D、g.V().hasLabel("test").valueMap("String_list","agen)22. 考虑以下场景,当公安人员需要根

9、据某犯罪人员发现其犯罪同伙时,最适合使用以下哪个工具?单项选择题A、ElasticSearchB、GraphBase正确答案C、HbaseD、HDFS23. HBase使用get方法读取数据时,以下哪个选项是需要的?单项选择题A、Deletedelete=newDelete(rowKey)B、scan.setCaching(1000)C、byterowKey=Bytes.toBytes(012005000201")(E确丝案)D、List<Put>puts=newArrayList<Put>()24. Flink不包含以下哪些数据处理场景?单项选择题A、高并发

10、B、毫秒级低时延C、高可靠性D、图形分析(正确答案)25. 关于GaussDB200的逻辑架构,以下说法正确的选项是()?单项选择题A、DN是实际数据节点,所以只负责存储数据.B、CM是集群的治理模块,那么负责集群的日常治理和运维.C、CN是协调节点,协助CM治理整个集群.D、GTM是全局事务限制器,负责生成和维护全局事务ID等全局唯一信息.确答案)26. 用户Region和RegionServer之间的路由信息,保存在哪个模块中?单项选择题A、ZookeeperB、BHDFSC、MasterD、Meta表正确答案27. Hbase的物理存储单元是什么?单项选择题A、RegionB、Colum

11、nfamily正确答案C、ColumnD、Row28. Redis中适合存储对象的数据类型是?单项选择题1A、Hash正确答案B、ListC、StringD、Set29. GAUSSDB200数据并行导入Shared策略支持的数据格式是?单项选择题A、CSVB、Text正确答案C、FIXEDD、seq30. Flume支持第三方过滤器对数据进行过滤操作.判断题1对正确答案错31. 多个Flume可以连接起来从部署节点上采集数据.判断题对正确答案错32. Flume传输数据时,sink如果出现下一跳故障,可以将数据发给其他的下一跳.判断题对正确答案错33. Kafka集群中,Kafka效劳端角色

12、是Consumer.判断题对错正确答案34. Kafka集群中,Kafka部署的实例个数不得小于2.判断题对正确答案错35. Checkpoint机制是Flink运行过程中容错的重要手段.判断题对正确答案错36. Flink程序是由DataSet和DataStream组成.判断题对错正确答案37. StructuredStreaming的外部存储系统的AppendMode方式表示只有在ResultTable中被更新的数据才会被写入到外部存储系统.判断题对错正巧答案38. Redis可以做排行榜的应用场景.判断题对正确答案39. Redis的flushall命令表示清空Redis实例下所有数据库

13、的数据.判断题对正确答案错40. 数据库架构设计Shard-Everying是指效劳器的所有资源包括磁盘、CPU、显卡、网络都共享.判断题对错正确答案4LCTID的值是增量增加的.判断题对正确答案错42 .物理集群包含逻辑集群.判断题对正确答案错43 .SQLonAnywhere的意思是SQL可以在任何地方使用.判断题对错正确答案44 .GaussDB20.的自适应调度和大数据的Yarn调度是类似的,都是根据作业的所耗资源,根据作业优先级,并优先满足损耗资源少的作业,保证资源的充分利用.判断题对45 .创立数据库时默认支持的字符集是UTF-8.判断题对错正确答案46 .Flink程序是由Dat

14、aSet和DataStream组成.判断题对错正确答案47 .StructuredStreaming的外部存储系统的AppendMode方式表示只有在ResultTable中被更新的数据才会被写入到外部存储系统.判断题对错正确答案48 .Hive从本地加载数据需要加关键字:"local.判断题对正确答案错49 .大数据技术,是指伴随大数据的采集、存储、处理和分析的相关技术判断题对正确答案错50 .针对不同的数据来源,需要先分析其数据特征,例如一般网站产生的曰志特点是数据量大,价值密度高,数据的业务种类多且涵盖之前的数据.判断题1对错正确答案51 .Kafka中的Broker在收到新消

15、息后会立即存入磁盘.判断题错正萌答案52 .GaussDB200的自适应调度和大数据的YARN调度是类似的,都是根据作业的所耗资源,根据作业优先级,并优先满足损耗资源少的作业,保证资源的充分利用.判断题1对错正确答案53 .Hbase是一种分布式数据库,不依赖HDFS也可以运行.判断题对正确答案错54 .GAUSSDB200在内部使用行标识符CTID记录数据在表中的逻辑位置.判断题对错正确答案55 .Redis默认支持14个数据库.判断题对错正确答案56 .关于Kafka组件说法正确的选项是?A、删除topic时,必须保证kafka的效劳配置delete.topic.enable配置为true

16、程答案B、Kafka安装及运行日志保存路径为/srv/Bigdata/kafka/C、ZooKeeper效劳不可用会导致Kafka效劳不可用E确笔集D、必须使用admin用户或者kafkaadmin组用户进行创立topic除答案57 .下面哪些是Flume的sink支持的类型?A、KafkaSink正确答案B、StormSinkC、HbaseSink正确答案D、SparkSink正确答案i58 .Redis的写命令同步的时机有哪几种?A、appendfsyncyesB、appendfsyncalwaysIE礁芟案C、appendfsynceverysec王碇答案D、appendfsyncno确

17、答案i59 .关于Redis的描述,以下正确的选项是?A、Redis支持多数据库确答案B、可以使用existskey判断键是否存在确答案C、Redis可以为任何键增减字段而不影响其他键D、Redis的命令区分大小写正确笞案60 .下面哪些是属于Flink的窗口类型?A、TumblingWindow王礁答案B、countWindow正萌答案C、SlidingWindow:E确答案D、timeWindow正奉答案61 .以下哪些情况下采用Replication方式存储数据?A、存储的表的数据量较小正确答案B、需要较高的并发分析水平正确答案C、对数据的完整性要求较高D、以上都是62 .一般在什么时候

18、会采用数据分区?A、当表中数据量比拟多千万级别以上的时候,正确答案B、需要执行大量的数据删除操作的时候正萌答案C、需要执行大量的热点数据查询操作的时候正注答三,D、需要执行大量的数据更新操作的时候正国答案63 .GaussDB200的高可靠主要表达在?A、提供集群治理和数据节点HA正确答案B、事务支持ACID特性正确答案C、支持故障切换、单节点故障恢复正确答案D、支持标准SQL和标准JDBC特性64 .下面关于GaussDB200的逻辑集群说法正确的选项是?A、逻辑集群的意思就是通过物理效劳器的隔离来到达数据的别离处理B、在逻辑集群上实现多租户治理,到达CPU、内存等计算资源的限制隔离带答案C

19、、逻辑集群的最终目的是实现资源隔离及资源弹性水平正耍答奏D、一个物理节点对应一个逻辑集群正确答案65 .对于Gremlin描述正确的选项是?A、支持客户端操作和JavaAPI操作正碓答案B、每一步操作都在数据流datastream上执行一个原子操作1Z确答案C、语句比拟复杂D、函数式数据流语言,正碎答案66 .HDFS的系统结构中包含哪些模块?A、DataNode工防答案B、Client正确答案C、RegionServerD、NameNode正确答美67 .以下哪些是Hive自带的系统函数?A、sum正确答案B、count正确答案C、like正确答案D、Dwg68 .大数据场景化解决方案包含以

20、下哪些选项?A、离线检索B、离线批处理正确答案C、实时检索正确答案D、实时流处理正确答案69 .在金融领域的大数据批量离线处理平台中,以下描述准确的是?A、在数据集成模块,可以分为数据采集、数据操控和数据加载3个阶段.正学答案B、金融领域的外部数据来源可以是征信信息、社交网络和电商等.正餐答案C、金融领域的内部数据来源均是结构化数据,包括信贷数据、信用卡数据和收单数据等.D、金融领域的数据应用层面均是面向金融机构内部的,如监管报表系统,精准营销、BI应用等,完全不对外或对其他下属机构开放.70 .大数据离线批处理场景中常见的数据源包括?A、流式数据Socket流正确答案B、网页日志流正确答案C、批量文件数据正确答案D、数据库正确答案71 .以下哪些选项是实时检索适用的场景?A、局并发的场景正确答案B、查询速度要求高的场景正确答案C、图片查询场景正确答案D、查询条件比拟复杂的场景72 .以下哪些举措,可以显著提升ElasticSearch的性能?A、戒少EsMasterB、禁用swap工确答案C、修改副本数量正确答案D、增加EsMaster73 .Flink中的计算时间包含以下哪几种?A、IngestionTime三确答案iB、EventTime:确答案C、DelayTimeD、ProcessingTime正确笞案74 .Structur

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论