版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:大数据华为认证考试大数据华为认证考试(习题卷3)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages大数据华为认证考试第1部分:单项选择题,共51题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.集合运算算子指的是()?A)ArrayOPB)HashOpC)ListOpD)SetOp答案:D解析:[单选题]2.MapReduce任务最终是在下列()中被执行的。A)NodeManagerB)containerC)ResourceManagerD)AppMaster答案:B解析:[单选题]3.下列哪个不是Explain的关键字()?A)TablescanB)HashJoinC)FilterD)Seqscan答案:C解析:[单选题]4.YARN中默认的资源调度器是:()。A)FIFO调度器B)容量调度器C)Fair调度器D)以上全部是答案:B解析:[单选题]5.Action是RDD的算子的一个类型,不可以将结果写入()A)磁盘B)CPUC)HDFSD)数据库答案:D解析:[单选题]6.以下哪个不是大数据的数据计算引擎?()A)SparkB)MapReduceC)FlumeD)Flink答案:C解析:[单选题]7.当ElasticSearch集群有节点加入或退出时,集群数据会发生什么动作?()A)数据重载B)数据分布C)数据更新D)数据重建答案:B解析:[单选题]8.Spark2.0中引入了()的概念,它为用户提供了一个统一的切入点来使用Spark的各项功能。()A)SparkContextB)SparkConfC)SparkTextD)SparkSession答案:D解析:[单选题]9.关于GaussDB200的发展史,下列说法错误的是()?A)GaussDB200已经在华为云发布了云化产品。B)GaussDB200专注国内业务,不涉及海外。C)GaussDB200从-开始就支持ARM架构的部署。D)GaussDB200前身叫GaussDB,是GaussDB的子项目。答案:B解析:[单选题]10.Redis不适用于以下哪个应用场景?()A)获取PB级Value数据B)获取TOPN操作C)获取手机验证码D)获取最新N个数据的操作答案:A解析:[单选题]11.Hive中的解释器(complier)、优化器(optimizer)、执行器(executor)组件用于HQL语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在()中,并在随后由()调用执行。()A)内存、MapReduceB)HDFS、YarnC)HBase、YarnD)HDFS、MapReduce答案:D解析:[单选题]12.HDFS的副本放置策略中,同一机架不同的服务器之间的距离是:()。A)3B)2C)1D)4答案:B解析:[单选题]13.当Spark发生Shuffle时,MapTask的运算结果会通过()的形式把运算结果分发到对应的任务上去。()A)序列化B)键值化C)二进制D)RDD答案:B解析:[单选题]14.以下关于Kafka消息消费者Consumer读取消息描述错误的是:()。A)consumer使用offset来记录读取位置B)Kafka的一个Topic可以理解为一个队列,即一个消息C)生产者产生的消息逐条放到Topic尾部D)消费者从右至左读取消息答案:D解析:[单选题]15.Hadoop平台中HBase的Region是由:()服务进程来管理。A)HMasterB)DataNodeC)RegionServerD)ZooKeeper答案:C解析:[单选题]16.哪种不是Flink提供的部署方式?()A)ClusterB)CloudC)VMD)Local答案:C解析:[单选题]17.常用的数据收集工具不包括?()A)SparkB)LoaderC)SqoopD)Kettle答案:A解析:[单选题]18.一般情况下,若要提高ElasticSearch检索效率,可以采取什么操作?()A)使用Hive做底层存储B)调整索引分片数C)压缩索引D)增加EsMaster节点答案:B解析:[单选题]19.有一张表name,其中一个字段名为chinese_name,类型为char(4),另一个字段名为eng1ish_name,类型为varchar(5)。那么执行如下语句?insertintonamevalues('gaosi','GaussDB')?会发生什么?()A)存在记录(gaos,GaussDB)。B)存在记录(gaos,Gauss)。C)数据无法插入。D)存在记录(gaosi,GaussDB)答案:C解析:[单选题]20.下面哪个Flume功能可以给Event添加Header信息。()A)SelectorB)ChannelC)InterceptorD)Sink答案:C解析:[单选题]21.在MapReduce的应用程序开发中,下列()JAVA类负责管理和运行一个计算任务。A)lobB)ContextC)FileSystemD)Configuration答案:A解析:[单选题]22.ElasticSearch是怎么实现Master选举的?()A)借助ZooKeeper选举B)内部自行选举C)随机生成D)自行指定答案:A解析:[单选题]23.下列选项中适合MapReduce的场景有:()。A)实时交互计算B)迭代计算C)流式计算D)离线计算答案:D解析:[单选题]24.GaussDB200支持几种数据并行导入策略?()A)2B)1C)4D)3答案:D解析:为了使得数据能够正确、不重复地分配给各DN,保证入库数据的唯一性,GaussDB200对应提供了三种策略:1、Normal策略:利用高斯数据服务工具GDS(GaussDataService)来管理用户数据,将集群之外主机上的数据导入到集群中。2、Shared策略:利用网络文件系统NFS(NetworkFileSystem)服务,将存放用户数据的服务器统一挂载到各DN所在主机的相同路径下,将集群之外主机上的数据导入到集群中。3、Private策略:用户自行将数据文件上传到各DN所在主机。[单选题]25.大数据技术的4V特征不包含以下哪项?()A)VelocityB)VirtualC)VarietyD)Volume答案:B解析:[单选题]26.HBase为什么适用于海量数据存储?()A)HDFS做底层存储B)多列簇特C)支持列存表D)集群规模小答案:A解析:[单选题]27.以下()不是订阅数据包含的内容。A)服务IDB)数据库类型C)表名D)库名答案:B解析:[单选题]28.关于HDFS的文件块的描述不准确的是?()A)文件块越大寻址时间越短。B)文件块(片)被存在哪个集群;谁有权限查看、修改这个文件等信息放在元数据Metadata中C)文件块的大小设置原则:最大化寻址开销。D)HDFS文件块的大小在1.0版本时是64M,在2.0的时候是128M。答案:C解析:[单选题]29.下列代码的作用是?()StringgraphName=?graphbase?;Api.createGraph(graphName);A)创建图B)获得图C)删除图D)修改图答案:A解析:[单选题]30.Yam中()角色是管理单个节点资源(CPU/Memory)的。A)NodeManagerB)ResourceManagerC)DataNodeD)NameNode答案:A解析:[单选题]31.Kafka集群中,Kafka服务端的角色是:()。A)BrokerB)ConsumerC)ZookeeperD)Producer答案:A解析:[单选题]32.第三次信息化浪潮标志不包含以下哪项?()A)云计算B)物联网C)大数据D)互联网答案:D解析:[单选题]33.Zookeeper的Scheme认证方式不包括:()。A)digestB)saslC)authD)world答案:B解析:[单选题]34.修改资源的化导入excel的操作列应该填写()。A)插入B)更新C)删除D)追加答案:B解析:[单选题]35.下列关于FusionInsightLibrA数据均匀分布的存储描述错误的是:()。A)解析器从客户端应用获取输入的数据B)解析器对数据解析后,将数据分发诶各个处理单元进行处理C)各个处理单元把接受到的数据存储到各自的逻辑磁盘中D)每一个处理单元的逻辑磁盘只能是服务器自带的物理磁盘答案:D解析:[单选题]36.以下哪项属于Flume的基础数据单位?()A)ObjectB)TopicC)EventD)Subject答案:C解析:[单选题]37.以下关于数据服务API开放方使用流程,描述正确的是:()。A)创建api并发布apiB)获取APIC)调用APID)创建应用并获取授权答案:A解析:[单选题]38.以下两种描述分别对应:()两种分类算法的评价标准。A)Precision,RecallB)Recall,PrecisionC)Precision,RocD)Recall,Roc答案:A解析:[单选题]39.有如下存储过程,CREATEORREPLACEPROCEDUREprc_1(param1ININTEGERDEFAULT3,param2INOUTINTEGER)ASBEGINParam2:=paraml+param2;RETURN:END:调用如上存储过程callprc_1(2,1),结果是()?A)1B)2C)4D)3答案:D解析:[单选题]40.以下()组件负责控制系统资源的分配,防止过量业务负载对系统的冲击而导致业务拥塞。A)GTMB)WLMC)CND)DN答案:B解析:[单选题]41.Kafka消息默认保存时间为多少天?()A)14天B)30天C)1天D)7天答案:D解析:[单选题]42.以下哪个选项属于大数据消息系统?()A)SparkB)KafkaC)HBaseD)Zookeeper答案:B解析:[单选题]43.以下哪种Hive的方法可以用来对数据求和?()A)trimB)dataC)avgD)sum答案:D解析:[单选题]44.创建分支语句如下,CREATEORREPLACEPROCEDUREproc_case_branch(pi_resultininteger,pi_returnoutinteger)ASBEGINCASEpi_resultWHEN1THENPi_return:=1;WHEN2THENPi_return:=3:WHEN3THENPi_return:=5;WHEN6THENPi_return:=7;WHEN7THENPi_return:=9:ELSEPi_return:=0:ENDCASE:Raiseinfo'pi_return:%',pi_returnEND:执行如下语句CALLproc_case_branch(3,2)的返回结果是()A)4B)3C)5D)2答案:C解析:[单选题]45.在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下()操作。A)执行HiveDDL操作B)运行MapReduce任务C)运行HiveSQL任务D)以上全部正确答案:D解析:[单选题]46.在决策树创建时,由于数据中的噪声和离群点,许多分枝反映的是训练数据中的异常,()方法处理这种过分拟合数据问题。A)小波B)调和C)剪枝D)回归答案:C解析:[单选题]47.在FusioninsightHD的客户端,执行kinit{账号}命令是为了得到KDC的()内容。A)Krb5.confB)TGTC)STD)jaas.conf答案:B解析:[单选题]48.GraphBase能够处理海量数据的原因是什么?()A)基于Elasticsearch的索引机制B)基于HBase的分布式存储机制C)基于Spark的分布式内存计算技术D)图机制特性答案:B解析:[单选题]49.以下()组件负责接收来自应用的访问请求,并向客户端返回执行结果。A)GTMB)WLMC)CND)DN答案:C解析:[单选题]50.Redis中String数据类型不含以下哪种操作?()A)mgetB)sizeC)strlenD)append答案:B解析:[单选题]51.为了提高Kafka的容错性,Kafka支持Partition的复制策略,以下关于LeaderPartition和FollowerPartition的描述错误的是:()。A)Kafka针对Partition的复制需要选出一个Leader。由该Leader负责Partition的读写操作。其他的副本节点只是负责数据同步B)由于LeaderServer承载了全部的请求压力。因此从集群的整体考虑,Kafka会将Leader均衡的分散在每个实例上,来确保数据均衡C)一个Kafka集群各个节点间不可能互为Leader和FlowerD)如果Leader失效。那么将会有其他follower来接管(成为新的Leader)答案:C解析:第2部分:多项选择题,共34题,每题至少两个正确答案,多选或少选均不得分。[多选题]52.关于HDFS中NameNode的作用描述的正确的是?()A)管理HDFS的名称空间(NameSpace)B)配置副本策略通常为3份C)处理客户端读写请求D)执行数据块的读/写操作答案:ABC解析:[多选题]53.以下哪些属于大数据存储与管理技术?()A)HDFSB)HBaseC)TezD)Durid答案:AB解析:[多选题]54.以下关于Flink与其他组件交互说法正确的是:()。A)Flink任务的运行依赖Yarn来进行资源调度B)Flink的checkpoint的实现依赖于ZookeeperC)Flink可以将接受的组件发给KafkaD)Flink在HDFS文件系统中读写数据答案:ABCD解析:[多选题]55.数据标签支撑的典型场景包括:()。A)数据分析B)精准营销C)风险防控D)群体分析答案:ABCD解析:[多选题]56.下面关于FusionInsightLibrADM的支持平台描述正确的有:()。A)可以运行在SUSE11.3系统上B)需要运行在InternetExplorer9.0及以上版本C)JDK需要1.6及以上版本D)操作系统需要预留2G内存,10G磁盘空间答案:ABD解析:[多选题]57.HBase中HMaster主要负责什么?()A)用户数据读写B)表的增删改查C)Regionserver负载均衡D)Region分布调整答案:BCD解析:[多选题]58.华为大数据产品FusionInsightHD中的Streaming具有:()关键特性。A)容灾能力B)灵活性C)消息可靠性D)可伸缩性答案:ABC解析:[多选题]59.以下哪些是离线批处理的特点?()A)处理数据格式多样B)支持SQL类作业和自定义作业C)处理数据量巨大D)处理时间要求高答案:ABC解析:[多选题]60.传统数据处理的瓶颈有:()。A)数据存储成本高B)流式数据处理形成不足C)扩展能力有:限D)批量数据处理缺失答案:AC解析:[多选题]61.下面哪些是GaussDB200的特点()?A)支持集群在线扩容。B)支持就地升级。C)支持自动降级。D)支持标准SQL。答案:ABD解析:[多选题]62.以下关于Zookeeper的Loader选举说法正确的是:()。A)当实例n为奇数时,假定n=2x+1,则成为leader节点需要x+1票B)Zookeeper选举leader时,需要半数以上的票数C)当实例数为8,则成为leader需要5票,容灾能力为4D)当实例数n为奇数时,假定n=2x+1,则成为leader需要x票答案:AB解析:[多选题]63.常用的数据结构类型是?()A)结构化数据B)无结构化数据C)半结构化数据D)非结构化数据答案:ACD解析:[多选题]64.FusioninsightHD中,可以通过()方式查看Oozie作业的调试结果。A)查看Oozie的JAVAAPI返回结果是:否符合预期B)通过Hue的workflow仪表板查看程序运行结果C)通过Hue的文件浏览器查看是:否在HDFS指定目录生成了所期望的文件D)Oozie自带的Web界面也可以查看作业执行结果答案:ABCD解析:[多选题]65.FusionInsightHD平台中,()组件支持对表进行加密。A)HDFSB)FlinkC)HbaseD)Hive答案:CD解析:[多选题]66.以下哪些选项属于离线批处理的特点?()A)数据不落地、存储量不大B)处理数据量相对较大C)处理时间相对较长D)数据吞吐量较大答案:BCD解析:[多选题]67.在金融领域的大数据批量离线处理平台中,以下描述正确的是?()A)金融领域的外部数据来源可以是征信信息、社交网络和电商等B)在数据集成模块,可以分为数据采集、数据操控和数据加载3个阶段C)金融领域的内部数据来源均为结构化数据,包括信贷数据、信用卡数据和收单数据等D)金融领域的数据应用层面均是面向金融机构内部的,如监管报表系统,精确营销、BI应用等,完全不对外或对其他下属机构开放。答案:AB解析:[多选题]68.Kerberos安全认证必须有下列的哪些?()A)krb5.conf配置文件B)用户名C)用户的keytab文件D)Jaas.conf配置文件答案:ABC解析:(D)这个配置文件只有在访问Zookeeper组件时才需要,而且在FusionInsightC60版本以后,样例代码中已经提供了统一认证工具类,通过这个类的API生成jaas对象,不需再要求提供jaas.conf配置文件了。[多选题]69.下列关于Explain的关键字描述正确的是()A)在Explain的基础上,通过添加Analyze同时显示该语句执行时每个算子的实际开销(单位为毫秒)和行数信息,对于判断优化器的估算是否准确提供依据。B)在Explain的基础上,添加Verbose显示出计划的额外详细信息,包括每个算子的输出列,重分布算子的分布列等。C)Explain通过指定option选项参数FORMAT来指定输出格式,默认是text格式。D)在Explain的基础上,添加Performance显示出计划的额外详细信息,包括每个算子的输出列,重分布算子的分布列等。答案:ABC解析:[多选题]70.Hive特性包括哪些?()A)易用易编程。B)灵活方便的ETL(extract/transform/1oad)。C)可直接访问HDFS文件以及HBase。D)支持MapReduce,Tez,Spark等多种计算引擎。答案:ABCD解析:[多选题]71.HBase读写用户表数据时需要下列哪些角色参与?()A)RegionServerB)HMasterC)ZooKeeperD)Region答案:ACD解析:[多选题]72.FusionInsightHD系统中使用Streaming客户端shell命令提交拓扑之后,使用StormUI查看发现该拓扑长时间没有:处理数据,可能原因有:()。A)拓扑业务逻辑错误,提交之后无法正常运行B)Supervisor是:在Topology中接收数据然后执行处理的组件C)拓扑过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间D)Supervisor的slots资源被消耗尽,拓扑提交上去后分不到slot去启动worker进程答案:ABCD解析:[多选题]73.下列哪些选项不是HBase为null的列不占用存储空间的原因?()A)列存储B)Key-Value结构C)Region分裂D)行存储答案:CD解析:[多选题]74.Flume中的Source类型包含以下哪几种?()A)SyslogSourceB)HTTPSourceC)KafkaSourceD)ExecSource答案:ABCD解析:[多选题]75.以下哪些是hive支持的文件格式?A)RCFileB)ORCC)HFileD)TextFile答案:ABCD解析:[多选题]76.FusionInsightHD系统中Hive支持的存储格式包括:()。A)TextFileB)SequenceFileC)RCFileD)Hfile答案:ABC解析:[多选题]77.对GaussDB200CUDesc机制描述正确的是?()A)CUDesc为列存表B)采用Min/Max稀疏索引C)列存表的辅助表D)每条记录对应一个CU(60Krows)答案:BCD解析:[多选题]78.可以通过Java调用API对HDFS文件系统操作的内容包括?()A)查询HDFS指定目录下的文件B)读取HDFS中指定文件C)在HDFS上创建文件夹D)上传文件到HDFS上答案:ABCD解析:[多选题]79.在产品选型时,数据中台逻辑架构中分析层要重点关注产品的特点包含:()方面。A)批量删除能力B)强资源隔离能力C)高并发的查询能力D)强大的OLTP能力答案:BC解析:[多选题]80.FusioninsightHD中,Streaming适用于:()场景。A)流数据监控B)网站的实时访问统计C)离线日志分析D)交通流量分析答案:ABD解析:[多选题]81.在ApacheHadoop中,关于HDFS的回收站机制,描述正确的是?()A)回收站里的文件可以快速恢复。B)可以设置一个时间阀值,当回收站里文件的存放时间超过这个阀值或是回收站被清空时,文件才会被彻底删除,并且释放占用的数据块。C)删除文件时,不会真正的册除,其实是放入回收站。D)回收站默认是关闭的。答案:ABCD解析:[多选题]82.GraphBase数据底层可以存储在哪里?()A)HBaseB)MySQLC)HDFSD)ElasticSearch答案:AD解析:[多选题]83.大数据技术的?三驾马车?具体指以下哪些?()A)大数据分布式计算框架MapReduceB)分布式文件系统GFSC)数据库系统BigTableD)数据容器Docker答案:ABC解析:[多选题]84.Flume由哪三部分组成?()A)MasterB)SinkC)SourceD)Channel答案:BCD解析:[多选题]85.在产品选型时,数据中台逻辑架构中共享层要重点关注产品的特点包含:()方面。A)高效的访问能力B)支持数据发放能力C)支持高效的数据更新
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《龙湖葵花宝典培训》课件
- 经济效益的年度跟踪计划
- 《数据图示饼》课件
- 沿海工程防护设备采购合同三篇
- 内部激励措施的年度优化计划
- 《通信技术原理》课件
- 冷拔钢相关行业投资方案
- 合结钢行业相关投资计划提议
- 食品加工合同三篇
- 《液压与气动》课件 1气动系统概述
- 2024年大学计算机基础考试题库附参考答案(完整版)
- 《旅游财务管理》课件-3货币的时间价值
- “奔跑吧·少年”重庆市第三届幼儿体育大会幼儿体适能活动规程
- 2024版国开电大专科《中国古代文学(下)》在线形考(形考任务1至5)试题及答案 (二)
- Q GDW 11445-2015 国家电网公司管理信息系统安全基线要求
- 自我效能感研究综述
- 简洁合伙协议书模板(标准版)
- 人教版四年级上下册英语单词默写表(汉译英)
- 政府会计-课后习题参考答案 童光辉
- 音乐节演出合作协议书
- 《学写文学短评》统编版高一语文必修上册
评论
0/150
提交评论