版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:华为大数据练习华为大数据练习(习题卷3)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages华为大数据练习第1部分:单项选择题,共47题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.下列不属于CDM支持的文件增量迁移方式的是:()。A)增量导出全部新增的文件B)增量导出指定大小的文件C)增量导出指定时间以后的文件D)增量导出指定目录的文件答案:B解析:[单选题]2.F1ume的基础架构不包含以下哪部分?()A)ChannelB)BrokerC)SourceD)Sink答案:B解析:[单选题]3.DRS查看迁移任务中的迁移日志,不能看到的是:()。A)创建用户B)时间C)级别D)描述答案:A解析:[单选题]4.哪个选项不是实时检索解决方案的典型业务特点?()A)查询条件简单B)查询速度快C)统计类查询D)高并发答案:C解析:[单选题]5.Redis中String数据类型不含以下哪种操作?()A)mgetB)sizeC)strlenD)append答案:B解析:[单选题]6.FusionInsightManager对服务的管理操作,下面说法错误的是:()。A)可以设置不常用的服务隐藏显示B)可以添加和卸载服务C)可以对服务进行启停操作D)可以查看服务的当前状态答案:A解析:[单选题]7.下列对图数据库描述正确的是?()A)以?图?数据结构存储和查询数据的数据库B)存储图片的数据库C)与关系型数据库类似的数据库D)数据仓库的一种答案:A解析:[单选题]8.以下不是EXPLAIN命令选项的是:()。A)performanceB)prettyC)analyzeD)verbose答案:B解析:[单选题]9.MapReduce任务最终是在下列()中被执行的。A)NodeManagerB)containerC)ResourceManagerD)AppMaster答案:B解析:[单选题]10.在GraphBase上,创建一个新的图,必须使用的参数是?()A)edgeB)graphNameC)labelD)vertex答案:B解析:[单选题]11.YARN中默认的资源调度器是:()。A)FIFO调度器B)容量调度器C)Fair调度器D)以上全部是答案:B解析:[单选题]12.关于Kafka磁盘容量不足的告警,对于可能的原因以下分析不正确的是:()。A)业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限B)Broker节点故障导致C)数据保存时间配置过长,数据累计达到磁盘使用率达到上限D)用于存储Kafka数据的磁盘配置,无法满足当前业务数据流量,导致磁盘使用率达到上限答案:B解析:[单选题]13.用户Region和RegionServer之间的路由信息,保存在哪个模块中?()A)MasterB)HDFSC)Meta表D)Zookeeper答案:C解析:[单选题]14.为保证流应用的快照存储的可靠性,快照主要存储在:()。A)本地文件系统中B)JobManager的内存中C)HDFS中D)可靠性高的单击数据库中答案:C解析:[单选题]15.哪个是实时检索解决方案的数据源?()A)流数据B)以上都是C)文件数据D)图数据答案:B解析:[单选题]16.Redis中数据排序的性能优化不包含以下哪个选项?()A)减少待排序键中元素的数量B)增加集群中Master节点C)如果要排序的数据数量很大,尽可能使用store参数将结果缓存D)使用limi参数只获取需要的数据答案:D解析:[单选题]17.公安行业中实时检索不适用于以下哪个场景?()A)车辆信息查询B)快速信息汇集C)评估嫌疑人犯罪概率D)实时布控答案:C解析:[单选题]18.以下哪种机制使Flink能够实现窗口中无序数据的有序处理?()A)检查点B)窗口C)事件时间D)有状态处理答案:C解析:[单选题]19.某开发小组计划利用GraphBase实现一些功能,以下哪些功能可以实现?()A)物流最优路径规划B)社交分析C)金融反欺诈D)以上全都正确答案:D解析:[单选题]20.DAYU数据开发中,新建SQL脚本支持新建()SQL脚本A)OracleSQL脚本B)DWSSQL脚本C)MySqlSQL脚本D)MongoDBSQL脚本答案:B解析:[单选题]21.GaussDB200的SQL自诊断在Monitor模式下,可识别下列哪个IssuePattorn()?A)多列统计信息未收集B)大表等值关联NestLoopC)数据倾斜D)HashJoin中大表做內表答案:A解析:[单选题]22.下来()Redis命令属于原子操作。A)INCR(将储存的数字值增一)B)HINCRBY(为哈希表key中的域field的值加上增量increment)C)LPUSH(对链表的push操作)D)以上都是答案:D解析:[单选题]23.HBase为什么适用于海量数据存储?()A)HDFS做底层存储B)多列簇特C)支持列存表D)集群规模小答案:A解析:[单选题]24.数据中台在汇聚生产库的结构化数据时,最多的数据处理操作是:()。A)统计B)删除C)新增D)修改答案:C解析:[单选题]25.某工程师正在开发ElasticSearch应用,下面这些代码可以帮助他做什么?()Map<String,String>params=Collections.singletonMap(?pretty?,?true?);Responsersp=restClient.performRequest(?GET?,?/?+index+?/?+type+?/?+id,params);Assert.assertEquals(rsp.getStatusLine().getStatusCode(),HttpStatus.SC_OK);A)查询指定文档分片信息B)查询指定index、type、id下的文档信息C)查询指定index、type下的文档信息D)维护指定文档信息答案:B解析:[单选题]26.元数据采集任务的启动方式不包括:()。A)循环执行B)定时执行C)手动执行D)定时立即执行答案:A解析:[单选题]27.在网络日志数据分析场景中,日志服务器通过1og4j将数据传给(),()会对数据进行简单的处理过滤,然后将数据按照日期存储到()上。()A)Flume、Flume、HDFSB)Hive、Flume、LoaderC)HDFS、Flume、FlumeD)Spark、Sqoop、Flume答案:A解析:[单选题]28.在GaussDB200中,关于Schema和Database,下面说法正确的是()?A)二者都能实现资源隔离。B)Database之间无法直接访问,但通过权限授予可以访问数据。C)相比于Database,Schema的隔离更加的彻底。D)Schema和用户强相关的,通过权限控制语法可以实现不同用户对各Schema的权限。答案:D解析:[单选题]29.以下()组件负责接收来自应用的访问请求,并向客户端返回执行结果。A)GTMB)WLMC)CND)DN答案:C解析:[单选题]30.在FusionInsightManager界面中、对Loader的操作不包括:()选项。A)切换Leader主各节点B)启动Loader实例C)配置Leader参数D)查看Loader服务状态答案:A解析:[单选题]31.华为8.0数据中台架构贴源层数据存储产品是:()。A)MRSB)GBase8AC)DWSD)DAYU答案:A解析:[单选题]32.以下对GaussDB200双AZ集群描述不正确是?()A)灾备集群不同步数据时,可以提供读写服务B)主集群不可用时,灾备集群提供正常服务C)主集群提供正常服务,灾备集群只同步数据D)周期性数据同步答案:A解析:[单选题]33.现在有一亿条数据要插入HBase,使用下列哪个方式最好?()A)put方法B)insert方法C)bulk1oad方法D)she11端put命令答案:C解析:[单选题]34.以下哪项属于Flume的基础数据单位?()A)ObjectB)TopicC)EventD)Subject答案:C解析:[单选题]35.哪个不是StructuredStreaming中OutPut可以定义的存储方式?()A)UpdateModeB)JDBCModeC)CompleteModeD)AppendMode答案:B解析:[单选题]36.Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是:()。A)SinkB)ChannelC)ChannelSelectorD)Interceptor答案:D解析:[单选题]37.大数据应用开发流程不包含以下哪项?()A)需求分析B)可行性分析C)应用推广D)技术选型答案:C解析:[单选题]38.下列哪段代码是用于判断ElasticSearch索引是否存在?()A)publicbooleanisExistsIndex(StringindexName){IndicesExistsResponseresponse=getAdminClient().prepareExists(indexName).get();returnresponse.isExists()?true:false;}B)publicbooleanisExistsIndex(StringindexName){IndicesExistsResponseresponse=getAdminClient().prepareExists(indexName);returnresponse.isExists()?true:false:}C)publicbooleanisExistsIndex(StringindexName){IndicesExistsResponseresponse=getAdminClient().prepareExists(indexName).get();retumresponse:}D)publicbooleanisExistsIndex(StringindexName){IndicesExistsResponseresponse=getAdminClient().get():Returnresponse.isExists()?true:false.}答案:A解析:[单选题]39.进行场景迁移的前提条件说法错误的是:()。A)该用户必须拥有管理员权限B)已获取待连接数据源的用户名C)已获取待连接数据源的密码D)已获取待连接数据源的地址答案:A解析:[单选题]40.创建存储过程,CREATEORREPLACEPROCEDUREproc_whi1e_1oop(maxvalininteger)ASDECLAREIint:=maxval/2;BEGINWHILEi<maxvalLOOPRaiseinfo'%',i;I:=i+1;ENDLOOP:END:下面循环语句在Messages内的输出是()CALLproc_while_loop(9);A)5678B)456789C)56789D)45678答案:D解析:[单选题]41.关于Spark中RDD的描述不正确的是?()A)RDD可以从HDFS输入创建,或从与Hadoop兼容的其他存储系统中输入创建B)当前RDD默认是存储于内存,当内存不足时,RDD也不会溢出到磁盘中。C)Spark的所有Transform操作都是基于RDD来实现的。D)RDD是只读和可区分的。要想对RDD进行操作,只能重新生成一个新的RDD答案:B解析:RDD具有容错机制,并且只读不能修改,可以执行确定的转换操作创建新的RDD。具体来讲,RDD具有以下几个属性。只读:不能修改,只能通过转换操作生成新的RDD。分布式:可以分布在多台机器上进行并行处理。弹性:计算过程中内存不够时它会和磁盘进行数据交换。基于内存:可以全部或部分缓存在内存中,在多次计算间重用。[单选题]42.在DRS中,以下迁移任务命名错误的是:()。A)ABCedB)ab-cdC)abcd001D)abcd#001答案:D解析:[单选题]43.分析应用计算后的分析主题数据存储在:()。A)贴源层B)共享层C)分析层D)整合明细层答案:C解析:[单选题]44.FusionInsightManager用户权限管理不支持()配置。A)给用户配置角色B)给用户组配置角色C)给角色配置权限D)给用户组配置权限答案:D解析:[单选题]45.下列关于FusionInsightLibrA数据均匀分布的存储描述错误的是:()。A)解析器从客户端应用获取输入的数据B)解析器对数据解析后,将数据分发诶各个处理单元进行处理C)各个处理单元把接受到的数据存储到各自的逻辑磁盘中D)每一个处理单元的逻辑磁盘只能是服务器自带的物理磁盘答案:D解析:[单选题]46.关于DataSet,下列说法不正确的是:()。A)DataSet不需要反序列化就可以执行大部分操作B)DataSet是一个由特定域的对象组成的强类型集合C)DataSet与RDD高度类似,性能比RDD好D)DataSet执行sort,filter,shuffle登录需要进行反序列化答案:D解析:[单选题]47.Zookeeper在分布式应用中的主要作用不包括:()选项。A)选举Master节点B)保证各节点上数据的一致性C)分配集群资源D)存储及群中服务器信息答案:C解析:第2部分:多项选择题,共31题,每题至少两个正确答案,多选或少选均不得分。[多选题]48.以下哪些属于大数据存储与管理技术?()A)HDFSB)HBaseC)TezD)Durid答案:AB解析:[多选题]49.关于FusioninsightHD的Spark,()编程语言可以用来开发Spark应用。A)CB)ScalaC)JavaD)Python答案:BCD解析:[多选题]50.关于HDFS中NameNode的作用描述的正确的是?()A)管理HDFS的名称空间(NameSpace)B)配置副本策略通常为3份C)处理客户端读写请求D)执行数据块的读/写操作答案:ABC解析:[多选题]51.FusioninsightHD中,Hive客户端()参数是用来控制reduce并发度的。A)hive.exec.reducers.bytes.per.reducerB)hive.exec-ducers.maxC)hive.exec.max.dynamic.partitionsD)hive.exec.max.dynamic.partitions.pemode答案:AB解析:[多选题]52.下列选项中,()是MapReduce一定会有:的过程。A)CombineB)MapC)ReduceD)Partition答案:BCD解析:[多选题]53.HDFS里包含哪些实例?()A)NameNodeB)TaskManagerC)DataNodeD)JobManager答案:AC解析:[多选题]54.StructuredStreaming中通过什么机制,解决数据的无序和滞后问题?()A)watermark机制B)持续查询C)流连接D)事件时间答案:AD解析:[多选题]55.在哪些场景下不能使用HBase作为存储系统()?A)需要ACID特性B)海量数据存储C)主键查询D)大文件,视频等答案:AD解析:[多选题]56.数据仓库数据分层的优点包括?()A)减少重复开发B)把复杂问题简单化C)隔离原始数据D)减少数据仓库存储空间答案:ABC解析:[多选题]57.关于表扫描算子的说法正确的是()?A)对于点查或者范围扫描等过滤太量数据的查询,如果使用SeqScan全表扫描会比较快。B)表的数目比较少的时候,使用Seqscan效率更高。C)SQL的执行计划第一步就是从表扫描算子开始的。D)SeqScan是指顺序扫描表的所有信息。答案:ABC解析:对于SeqScan很好理解,就是按照表的记录的排列顺序从头到尾依次检索扫描,每次扫描要取到所有的记录。这也是最简单最基础的扫表方式,扫描的代价比较大;[多选题]58.YARN中从节点主要负责()工作。A)集群中所有:资源的统一管理和分配B)监督container的生命周期C)监控每个Container的资源使用情况D)管理日志和不同应用程序用到的附属服务答案:BC解析:[多选题]59.Hive数据存储模型包括哪些成分?()A)数据库B)桶C)分区D)表答案:ABCD解析:[多选题]60.在HA模式下,HDFS里包含哪些组件?()A)DataNodeB)TaskManagerC)NameNodeD)SecondaryNameNode答案:ACD解析:[多选题]61.大数据计算框架Spark中除了RDD,还有哪些数据类型?()A)DataSetB)DataFrameC)DataTypeD)DataSchema答案:AB解析:[多选题]62.HBase中包含哪些基本的概念?()A)RowKeyB)tableC)namespaceD)ColumnFamily答案:ABCD解析:[多选题]63.在ApacheHadoop中,关于HDFS的回收站机制,描述正确的是?()A)回收站里的文件可以快速恢复。B)可以设置一个时间阀值,当回收站里文件的存放时间超过这个阀值或是回收站被清空时,文件才会被彻底删除,并且释放占用的数据块。C)删除文件时,不会真正的册除,其实是放入回收站。D)回收站默认是关闭的。答案:ABCD解析:[多选题]64.以下哪些数据可以转化为Dataset或DataFrame?()A)JAVAStringB)MySqlTableC)JSOND)JPG答案:AB解析:[多选题]65.国网数据中台能力架构中数据管理包含:()。A)模型管理B)数据质量管理C)数据资产D)标签管理答案:ABCD解析:[多选题]66.Flume进程级联时,()sink类型用于接收上一跳Flume发送过来的数据。A)avrosinkB)thriftsinkC)HDFSsinkD)NullSink答案:BC解析:[多选题]67.FusioninsightHD中,可以通过()方式查看Oozie作业的调试结果。A)查看Oozie的JAVAAPI返回结果是:否符合预期B)通过Hue的workflow仪表板查看程序运行结果C)通过Hue的文件浏览器查看是:否在HDFS指定目录生成了所期望的文件D)Oozie自带的Web界面也可以查看作业执行结果答案:ABCD解析:[多选题]68.以下属于HiveSQL中DDL的是:()。A)修改表B)删除表C)数据导入D)建表答案:ABD解析:[多选题]69.ElasticSearch的核心概念包含哪些?()A)MappingB)DocumentC)TypeD)Index答案:ABCD解析:[多选题]70.Flume可以从以下哪些数据源上采集数据?()A)实时日志B)SyslogC)KafkaD)本地文件答案:ABCD解析:[多选题]71.在FusionInsightLibrA中,下列关于索引选择的描述正确的有:()。A)列存选择index时,尽量选择查询条件出现最多的列,例如filter条件或join列上建立partialclusterkey(约束)B)行存选择index,查询条件上创建B-treeindex,也可以创建组合索引,第三天承认值比较少的列不适合建立indexC)列存选择index,条件列上可以建立psortindex,也可以创建组合索引D)行存选择index,行存不适合建立太多B-treeindex,然后做数据导入,这样的数据导入性能非常差,一般这种情况需要按照分区导入且后建index答案:AB解析:[多选题]72.下面哪些关键词是Kafka的特点?()A)高吞吐B)分布式C)消息持久化D)支持消息随机读取答案:ABC解析:[多选题]73.对于GaussDB200的数据并行导入策略Norma1,下列说法错误的是()?A)导入的效率和GDS服务器有关,GDS服务器越多,导入效率越快。B)数据导入时,支持单行数据大小小于1GB。C)通过GDS服务的方式实现数据并行导入。D)能够将数据库的数据、表结构都导入。答案:AD解析:[多选题]74.以下关于Flink与其他组件交互说法正确的是:()。A)Flink任务的运行依赖Yarn来进行资源调度B)Flink的checkpoint的实现依赖于ZookeeperC)Flink可以将接受的组件发给KafkaD)Flink在HDFS文件系统中读写数据答案:ABCD解析:[多选题]75.Spark有:()特点。A)快B)灵C)轻D)巧答案:ABCD解析:[多选题]76.下列()选项属于FusionInsight数据安全性。A)操作系统安全加固B)组件数据加密C)数据完整性校验D)用户权限认证管理答案:BC解析:[多选题]77.下列关于GaussDB200的TOAST机制说法正确的是()?A)支持变长(varlena)表现形式的数据类型。B)存储超过1KB的字段时,会触发TOAST机制。C)存储超过2KB的字段时,会触发TOAST机制。D)存储超过1/2KB的字段时,会触发TOAST机制。答案:AC解析:[多选题]78.在Kafka中,关于Comsumer说法正确的是:()。A)Consumer主要进行数据消费B)Consumer消费数据时需要指定TopicC)多个Consumer配置相同的group.id时,这些Consumer消费的数据不会重复D)新ConsumerAPI消费数据不用指定ZooKeeper地址答案:ABCD解析:第3部分:判断题,共10题,请判断题目是否正确。[判断题]79.数据服务当前仅支持DWS、DLI、HBASE、HIVE、MySql、RDS六种数据源类型。A)正确B)错误答案:对解析:[判断题]80.KafkaProducer读数据流程是,Producer连接任意存活的Broker,请求指定的Topic、Partition的Lader元数据信息,然后直接与对应的Broker直接连接,发布数据。A)正确B)错误答案:错解析:[判断题]81.Flume传输数据的过程中,Sink取走数据并写入目的地后,会将events从channel中删除。A)正确B)错误答案:对解析:[判断题]82.在FusioninsightHD安全版本进行应用开发时,可采用keytab文件进行安全认证。A)正确B)错误答案:对解析:[判断题]83.对于N(N>1)副本储存的文件,HDFS客户端发起读取文件请求,如果所读副本节点故障,直接返回失败,不会转到其他副本节点进行读取。A)正确B)错误答案:对解析:[判断题]84.Hive是一种数据仓库处理工具,使用类似SQL的HiveSQL语言实现数据查询功能,所有Hice的数据存储都存储在HDFS中。A)正确B)错误答案:对解析:[判断题]85.向HBase集群中增加RegionServer主机时,必须先停止原集群,原因是HBase不支持动态扩容。A)正确B)错误答案:错解析:[判断题]86.DAYU实时作业启动过后不能暂停。A)正确B)错误答案:错解析:[判断题]87.Flink适用于高并发处理数据、毫秒级时延应用。A)正确B)错误答案:对解析:[判断题]88.?表/文件/整库迁移?支持批量迁移表或者文件,还支持同构/异构数据库之间整库迁移,一个作业即可迁移几百张表。A)正确B)错误答案:对解析:第4部分:问答题,共12题,请在空白处填写正确答案。[问答题]89.应用开
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 年度环保设备采购及运营维护合同2篇
- 二零二五年度出纳岗位培训聘用合同范本3篇
- 二零二五年度高端定制家具设计与制造合同协议范本3篇
- 二零二五年度出租车行业车辆维修承包合同3篇
- 个人与个人之间特许经营权转让合同(2024版)3篇
- 2025年度人工智能技术应用合作合同2篇
- 二零二五年度苗木育种技术合作开发合同3篇
- 二零二五年度建筑工程弃土清运及环保处理服务合同
- 2025年围墙安装与智慧城市基础设施连接合同3篇
- 室内设计公司2025年度合作框架合同3篇
- 习近平法治思想概论教学课件绪论
- 宠物会展策划设计方案
- 孤残儿童护理员(四级)试题
- 梁湘润《子平基础概要》简体版
- 医院急诊医学小讲课课件:急诊呼吸衰竭的处理
- 肠梗阻导管在临床中的使用及护理课件
- 调料厂工作管理制度
- 小学英语单词汇总大全打印
- 卫生健康系统安全生产隐患全面排查
- GB/T 15114-2023铝合金压铸件
- 货物验收单表格模板
评论
0/150
提交评论