华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第1页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第2页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第3页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第4页
华为HCIP认证大数据-H13-723培训考试复习题库(含答案)_第5页
已阅读5页,还剩165页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1华为HCIP认证大数据-H13-723培训考试复习题库(含答案)一、单选题1.对于GaussDB200的数据并行导入策略Normal,下列说法错误的是()?A、通过GDS服务的方式实现数据并行导入。B、导入的效率和GDS服务器有关,GDS服务器越多,导入效率越快。C、数据导入时,支持单行数据大小小于1GB.D、能够将数据库的数据?表结构都导入。答案:C2.考虑以下场景,当公安人员需要根据某犯罪人员发现其犯罪同伙时,最适合使用下列哪个工具?A、GraphBaseB、HBaseC、HDFSD、ElasticSearch答案:A3.智能数据湖运营平台指的是以下哪个选项?A、VAS(videoAnalysisService)B、ModeIArts C、cSSD、DAYU答案:D4.以下选项中关于HDFS的文件块的描述不准确的是()A、HDFS文件块的大小在1.0版本时是64M,在2.0的时候是128MB、文件块(片)被存在哪个集群;谁有权限查看、修改这个文件等信息放在元数据Metadata中。C、文件块越大寻址时间越短。D、文件块的大小设置原则:最大化寻址开销。答案:C5.以下关于公共安全行业专题分析与查询业务场最描述错误的选项是()。A、适用标准SQL语句进行查询,根据查询结果筛选目标人群,侦办案件。B、原始数据经过批处理后结果写入到指定的文件目录,供交互时查询。C、临时交互式查询任务对数据进行精确或者模糊查询。D、数据湖内多个数据源只能单独访问再呈现结果。答案:D6.以下选项不属于Flume的特点的是?A、支持定制各类方数据发送B、支持结构化、非结构化数据源C、支持多级联操作D、支持数据实时检索答案:D7.哪个不是Hbase的操作语法?A、create'my_tb'.infoB、listC、createtabIetb1(string)D、scanmy答案:C8.Kafka中数据从Producer到Broker和Broker到Consmer分别是哪种传递方式?A、push,pushB、pull,pullC、pull,pushD、push,pull答案:D9.aItertabletabIeNamesettblproperties('EXTERNAL'='FALSEl);执fT?Hive命令能实现以下哪一个目标?A、修改外部表tabIeName为内部表B、删除tabIeName表的元数据信息C、修改内部表tabIeName为外部表D、移动tabIeName数据到外部存储系统答案:A10.ElasticSearch数据写入阶段有很多调优方式,下列错误的是哪一项?A、写入前副本数设置为0B、禁用C、尽量使用自动生成的idD、写入过程中:采取bulk批量写入答案:A11.以下哪一选项不属于MRS日常运维不影响业务这一特性?A、滚动升级/补丁B、修改配置滚动重启C、单集群跨AZ高可用D、扩缩容业务无感知答案:C12.HiveSQL中DDL指定是哪一种语言?A、数据删除语言B、数据管理语言C、数据查询语言D、数据定义语言答案:D13.关于Spark中RDD的描述不准确的是A、ROD可以从HDFS输入创建,或从与Hadoop兼容的其他存储系统中输入创建。B、Spark的所有Transforn操作都是基于RDD来实现的。C、ROD是只读和可分区的。要想对RDD进行操作,只能重新生成一个新的RDD.D、当前RDO默认是存储于内存,当内存不足时,RDD也不会溢出到磁盘中。答案:D14.HBase的物理存储单元是什么?A、RegionB、CoIumnfamiIC、CoIumnD、Row答案:B15.Kafka集群在运行期间,直接依赖于下面那些组件?A、SparkB、ZookeeperC、HBaseD、HDFS答案:B16.在GaussDB200中常用的逻辑操作符有AND,OR和NOT,它们之间的运算优先级顺序为0)?A、AND,OR>N0TB、N0T>AND>ORC、OR>AND>NOTD、NOT>OR>AND答案:B17.()是一实现了文件系统的抽象类,继承自org.apache,hadoop.conf.Configured.并实现了Closeablo接口,可以适用于多种文件系统。A、FSDataInputStreamB、FileConfigurationC、FSDataOutputStreamD、FiIeSystem答案:C18.以下哪项不属于批量数据采集工具?()A、MapReduceB、FlumeC、ScoopD、其他ETL工具答案:A19.Hive中的解释器(pIier),优化器(optimizer),执行器(executor)组件用于HQL语句从词法分析,语法分析,编译,优化以及查询计划的生成,生成的查询计划存储在()中,并在随后由()调用执行。A、HDFS,TezB、HBase,YarmC、内存,MapReduceD、HDFS,Yarn答案:A20.当读取HBase表时,只要求返回C1的列值,使用下列哪个选项可以实现该功能?A、ValueFiIteB、ColumnFiIterC、RowFiIterD、QualifierFilter答案:D21.以下哪项不提供交互式查询服务?A、PrestoB、ImpaIaC、EchartD、Kylin答案:C22.若要修改HBase表,下列API哪个最先被调用?A、createConnection()B、getTable() C、getConnect() D、getAdmin() 答案:D23.下列一选项不是StructuredStreaming支持的source数据源?A、SocketB、KafkaC、HDFSD、Hive答案:D24.TOPN操作最适合采用哪种Redis数据结构?A、HashB、SetC、SortedSetD、List答案:C25.关于批量数据处理组件的描述不正确的是?A、HiveB、SparkSQLC、Spark:新型批处理引擎,可以用于处理非SQL类,尤其是数据挖掘和机器学习类批处理作业,适合海量数据,处理速度高效。D、MapReducer传统批处理引整用于处理非SoL类,尤其是数据挖掘和机器学习类批处理作业,使用广泛,海量数据下表现不稳定,但是处理速度较快。答案:D26.哪个不是ElasticSearch生态圈中的技术?A、beatsB、LoastashC、FIumeD、kiana答案:C27.Redis中String数据类型不含以下哪种操作?A、MgetB、sizeC、strIenD、append答案:B28.以下关于Hive内置函数描述正确的是()。A、descfunctionsupperB、to_date()获取当前日期C、substr()D、trim()答案:D29.某电商公司数据库高级工程师进行大数据分析,现在界面提示:"0;jdbe:hive2;//86:2181/>”信息,那么他最有可能在进行什么场录的数据分析工作?A、实时检素场景B、离线批处理场景C、图搜索场景D、实时流开发场景答案:B30.编写Seala代码时,通过以下哪个算子可以实现数据过滤?A、fIatmapB、collectC、FiIterD、map答案:C31.Action是RDD的算子的一个类型,不可以将结果写入()A、磁盘B、CPUC、HDFSD、数据库答案:B32.StructuredStreaming中以下哪项计划的执行顺序是正确的?A、物理计划一一逻辑计划一优化的逻辑计划B、逻撮计划一优化的逻辑计划一物理计划C、逻辑计划一物理计划一优化的逻辑计划D、优化的逻辑计划一逻辑计划一物理计划答案:B33.某大数据业务人员在查询某张表的业务数据时,希望查询出来的数值结果保留两位小数,他应该使用哪个函数来实现?A、TrimB、roundC、absD、rand答案:B34.大数据技术的4V特征不包括以下哪项?A、VirtualB、VelocityC、VarietyD、VoIume、答案:A35.在GraphBase上,创建一个新的图,必须使用的参数是?A、vertexB、graphNameC、labelD、edge答案:B36.Loader页面是基于开源(的图形化数据迁移管理工具。A、HadoopB、HueC、KettIeD、Sqoop答案:D37.对Base集群架构组成部分描述错误的是()A、正常HBase表只有一个Region,随着数据增多Region不断分裂变成多个,Region的拆分非常慢。B、Client包含访问HBase的接口,同时缓存维护已经访问过的Region的位置信息。C、HMaster主要负责表和Region的管理工作,Region的负戴均衡D、HRegionServer是Base的数据服务进程,负奏处理用户的数据读写请求。答案:A38.当前传统关系型数据库主要面临的挑战是()A、数据量爆炸式增长,要求数据处理平台具备弹性扩展能力。B、数据处理时效性需求提高,要求数据处理平台速度够快。C、多类型数据融合,要求数据处理平台功能更加强大。D、以上全都正确。答案:D39.哪个是实时检索解决方案的数据源?A、流数据B、以上都是C、文件数据D、图数据答案:B40.ElasticSearch进行全文检索需要哪几个步骤?A、清洗、分词、建立素引B、清洗、分词C、清洗、建立素引D、清洗、建立素引、分词答案:A41.从数据库架构设计来看,主要有以下哪些设计思路?A、Shared-DiskB、Shared-EveryingC、Shared-NothingD、以上全正确答案:D42.一般情况%若要提高界ElasticSearch检索效率,可以采取什么操作?A、调整索引分片数B、使用Hive做底层存储C、压缩素引D、正价EsMaster节点答案:A43.下列关于GaussDB200的局部聚簇技术说法正确的是()?A、局部聚簇技术可以应用在GaUssDB200的所有表中,B、局部聚簇在某些场景下可以提交检素效壑.所以在创建表时根据业务场旻应创建寥个PCKC、PCK通过min/max稀疏素引实现事实表快速过扫描D、PCK对应的列尽量不要为空值。答案:C44.以下关于EasticSearch缓存机制的理解不正确的是()A、QueryCacheB、RequestCacheC、FielddataCache专门针对分词的字段在查询期间的数据结构的缓存D、缓存主要分三种:QueryCache.FieIddataCache.RequestCacheo答案:A45.某公司计划上线新系统,数据库工程师使用Hive数据仓库进行数据分析,现在界面提示"o;jdbc:hive2;//86:2181/>"gM,现已完成数据库的创建工作,那么他将如何继续开始数据库的使用?A、usedatabaseB、startdatabaseC、restartdatabaseD、continuedatabase答案:A46.下面这条GaussDB200的SQL语句”selectname,count(1)fromstudentgroupbyname“可能涉及的算子有哪些?A、FiIterB、GroupAggregateC、StreamingD、HashAggregate答案:B47.对于GaussDB200的数据存储流程,下列说法正确的是()?A、通过GaussDB200的数据分布规则数据会自动分布.那么对表的设计可以比较随意B、导入的数据直接从客户端进入磁盘中C、数据的分布一般默认按照分布鍵的HASH值分布D、数据的分布一般默认按照数据大小均匀分布答案:C48.有如下存储过程,CREATEORREPLACEPROCEDUREprc_1(paranIININTEGERDEFAULT3,paran2INOUTINTEGER)ASBEGINParan2:=paraml+paran2;RETURN;END:调用如上存储过程callprc_1(2.1).结果是()?A、1B、2C、4D、3答案:D49.以下关于StreamExecution持续查询过程的描述哪项是正确的?A、获取最新数据offsetsoffsets写入offsetLog--构造LogicalPlan--优化LogicalPlan--计算完成mit--计算结果SinkB、offsets写入offsetLog--获取最新数据offsets--构造LogicalPlan--优化LogicalPlan--计算结果Sink--计算完成mitC、获取最新数据offsets--offsets写入offsetLog--构造LogicalPlan--优化LogicalPlan--计算结果Sink--计算完成itD、获取最新数据offsets--offsets写入offsetLog--优化Logica1Plan--构造LogicalPlan--计算结果Sink--计算完成mit答案:C50.下面哪个Flume功能可以给Event添加Header信息。A、数仓与大数据的并行架构B、低成本高扩震性的传统数仓架构C、以数仓为核心.大数据平台为延伸的融合架松D、大数据平台为核心的架构答案:C51.Spark的核心概念不包括?A、RDDB、HoqC、宽套依赖D、Shuffle答案:B52.Flink不包含以下哪些数据处理场最?A、高可靠性B、图形分析C、毫秒级低时延D、高并发答案:B53.在Finned中,以下哪一种类型的Sink支持将数据写入到Solr中?A、thiftsinkB、hdfssinkC、filerolIsinkD、MorphIineSolrsink答案:D54.以下关于ElasticSearch缓存机制的理解不正确的是()A、缓存主要分为三种,QueryCache,FielddatsCache,RequestCache。B、RequestCacheC、FielddateCaCheD、QueryCache答案:D55.以下哪个不是离线批处理的核心诉求?A、处理数据格式多样B、处理教据量巨大C、支持SQL美作业和自走义作业D、处理时间要求高答案:D56.在SparkSQL中,()使用了新的编码器,其编码器的作用是将VM的对象与表结构进行转换,允许操作序列化数据,可以提高内存利用率。A、DataFrameB、TabIeC、DataSetD、RDD答案:C57.列哪一个命令可以清空Reis实例下所有数据库的资料?A、FlushdbB、DropdbC、FlushallD、DropaII答案:C58.Redis中哪个命令是查看键的剰余生存时间?A、ttlB、expireatC、persistD、expire答案:A59.关于GaussDB200的逻辑架构,下列说法正确的是A、DN是实际数据节点,所以只负责存储数据。B、CN是协调节点,协助CM管理整个集群。C、CM是集群的管理模块,那么负责集群的日常管理和运维。D、GTM是全局事务控制器,负责生成和维护全局事务ID等全局唯一信息。答案:D60.哪个产品适应于OLAP场最?A、PostgressQLB、SQLServerC、MysQLD、GaussDB200答案:D61.以下关于HDFS适合做什么描述不正确的是?A、流式数据读取B、大文件存储与访问C、大数据量吞吐D、低延迟读取答案:D62.Flink的窗口,按窗口行为划分不包含以下哪种?A、容量窗口B、滑动窗C、滚动窗口D、会话窗口答案:A63.GaussDB200有两张相同字段结构和数据量的表table1和table2,table1是行存表,table2是列存表,执行SQL语句"selectnamefromtable_namewherenum=-1",table1查询了()数据量,table2查询了()数据量(一个单元格为一个数据量)<imgsrc="https://up.zaixiankaoshi./5443384/9381793/image/png/1676544270367.png"alt="1676544270367.png">A、9.6B、3.9C、3.6D、9.9答案:C64.某工程师正在开发EasticSearch应用,请问下列代码可以帮助他实现什么功能?<imgsrc="https://up.zaixiankaoshi./5443384/9381793/image/png/1676466973713.png"alt="1676466973713.png">A、删除素引B、创建素引C、维护索引D、更新素引答案:A65.以下哪个选项对Redis数据读写流程描述是正确的?A、ServerA节点返回集群拓扑一客户端选择集群任意一个serverA节点连接客户端计算Key归属的槽位以及对应ServerB节点并连接-Servere节点返回业务操作结果B、客户端选择集群任意一个ServerA节点连接-Servera节点返回集群拓扑客户端计算Key归属的槽位以及对应serverB节点并连接一ServerB节点返回业务操作结果C、ServerA节点返回集群拓扑一喜户端计算Key归属的槽位以及对应ServerB节点并连接户端选择集群任意一个ServerA节点连接-eerB节点返回业务操作结果D、客户端选择集群任意一个Servera节点连接客户端计算Key归属的槽位以及对应ServerB节点并连接-ServerA节点返回集群拓扑-ServerB节点返回业务操作结果答案:B66.EIasticfearch是怎么实现Master选举的?A、内部自行选举B、借助ZooKeeper选举C、随机生成D、自行指定答案:B67.Kafka的核心架构不包含?A、SplitB、ProducerC、ConsumerD、Broker答案:A68.关于GaussDB200的数据并行导出,下列说法正确的是()?A、Remote模式效率受网煥帯宽影响B、Local模式效率受网络带宽影响C、Remote模式是指将数据导出到集群本地服务器上。D、Loca模式是导出文件到本地电脑答案:A69.考虑以下场景,HBase有列簇CF1.列C1.C2.当读取HBase表时。只要求近回C1的列值,使用下列哪个选项可以实现该功能?A、ColumFiIterB、ValueFiIteC、QuaIifierFiIteD、RowFiIter答案:C70.Flume中基于WAL预写式日志Write-AheadLog)实现Channel持久化的是?A、MemoryCharneIB、KafkaChannelC、FileChanneID、JDBCChanneI答案:A71.Flink不包含以下哪些数据处理场最?A、毫秒级低时延B、高可靠性C、高并发D、图形分析答案:D72.用户Region和RegionServer之间的路由信息,保存在哪个模块中?A、MasterB、HDFSC、Meta表D、Zookeeper答案:C73.Flink哪种机制可以保证task运行失败时,其状态能够恢复?A、窗口B、事件时间C、检查点D、有状态处理答案:C74.GaussDB200支持几种数据并行导入策略?A、3B、1C、2D、4答案:A75.下列哪一项不是StructuredStreaming支持的Source数据源。A、KafkaB、SocektC、HiveD、Hdfs答案:C76.下面这段代码的作用是什么?<imgsrc="https://up.zaixiankaoshi./5443384/9381793/image/png/1676551009476.png"alt="1676551009476.png">A、创建索引B、删除索引C、维护亲引D、更新索引答案:A77.以下哪项是SparkQ2x程序统一入口?()A、StreamingContextB、Sa|ContextC、HiveContextD、SparkSession答案:D78.Hive中的解释器(pIier).优化器(optimizer).执行器(executor)组件用于HQL语句从词法分析,语法分析,编译:优化以及查询计划的生成。生成的查询计划存储在0中,并在随后由。调用执行。A、HDFS、MapReduceB、内存、MapReduceC、HDFS、YarnD、HBase、Yarn答案:A79.GaussDB200的高可用主要体现在哪些方面?A、数据融合B、分析融合C、计算融合D、以上全都正确答案:D80.HDFS数据写入流程描述错误的是?A、业务应用调用HDFSClient提供的API请求写入文件。B、业务调用close.flush后HDFSClient联系NameNode,确认数据写完成,DataNode持久化元数据。C、HDFSClient收到业务数据后,从NameNode获取到数据块编号.位置信息后,联系DataNode并将需要写入数据的DataNode建立起流水线。完成后,客户端再通过自有协议写入数据到DataNodeI.再由DataNode1复制到DataNode02DataNode3?D、HDFSClient联系NameNode.NameNode在元数据中创建文件节点。答案:B81.关于GaussDB200的两种跨集群方式EC(ExtensionConnector)和FT(ForeignTable).以下说法正确的是()?A、在连接之前都要先做好集群互信操作。B、EC配置简单,理论上可以连接任何支持ODBC的同构/异构数据库。C、二者都可以充分利用GaussDB200的分布式计算能力。D、FT配置复杂.只能支持GaussDB200同构数据库。答案:A82.Flink的Checkpoint机制绘制的流应用快照不能被保存在以下哪个位置?A、LocaIB、TaskManager的内存C、JobIManager的内存D、HDFS答案:B83.以下关于Saoop数据导入原理的描述中,错误的是哪一项?A、Sqoop会根据传入的num-mappers来确定划分几个区域。B、Saoop根据不同的split-by参数值来进行切分,然后将切分出来的区域分配到不同map中。C、num-mappers越大效率越高。D、Saoop在import时,需要指定split-by参数。答案:C84.关于HBase的RegionSplit,以下描述中错误的是哪一项?A、RegionSplit过程不需要HMasteri进行管理B、在建表时可以预先创建多个RegionC、将大表分裂出多个Region有助于提高数据的读写效率D、RegionSpliti速度很快,因为并没有真正拆分数据答案:A85.某项目小组接到,大数据实时分析项目,且对实时性要求很高。请问以下哪种大数据计算框架最合适A、MapReduceB、HBaseC、SparkD、Flink答案:D86.Irange是Redis中哪种数据类型的命令?A、SetB、StringC、ListD、Hash答案:C87.网站在运营过程中,会有用户访问井产生行为数据要想对这些数据进行处理挖掘如果是离线批处理下的方案配置,描述不正确的是A、数据导入导出,LoaderB、数据釆集传输:FlumeC、数据计算,StormD、数据存储.HDFS或MySql答案:C88.大数据的4V不包含哪一个?A、数据量大B、种类多C、价值密度低D、分布式E、处理速度快答案:D89.关于GES技术原理,下列错误的是哪一项?A、基于ElasticSearch的索引机制,能根据索引快速查阅数据B、基于Yarn的资源调度,可以并行执行多任务C、基于Spark的分布式内存计算技术,支持数据快速导入D、基于HBase的分布式存储机制,能够处理海量数据答案:C90.以下关于公共安全行业专题分析与查询业务场最描述错误的选项是0A、临时交互式查询任务对数据进行精确或者模湖查询。B、适用标准SQL语句进行查询,根据查询结果筛选目标人群,侦动案件。C、数据湖内多个数据源只能单独访问再呈现结果。D、原始数据经过批处理后结果写入到指定的文件目录,供交互时查询。答案:C91.Flume中的JDBCChannel内置数据库是哪个?A、DerbyB、OracleC、sqIServerD、MySql答案:A92.以下关于Sqoop数据导入原理的描述中,错误的是哪一项?A、rum-mappers越大效率越言。B、Sqoopi在import时,需要指定split-by参数。C、Sqoopi根据不同的split-by参数值来进行切分,然后将切分出来的区域分配到不同map中。D、Sqoop答案:A93.Kafka日志数据文件默认保留的最长时间是多少小时?A、96B、48C、24D、168答案:D94.HDFS创建目录过程中,通过调用FileSystem实例的()方法查看该目录是否存在。A、createB、MkdirsC、existsD、find答案:C95.如果想把Redis的Key中存储的数字值减1,该使用下列哪一个命令?A、decrB、incrC、inerbyD、derby答案:A96.以下哪些选项属于实时检索的特点?A、处理时间要求不高B、全文检素功能C、高并发D、查询响应要求较高答案:D97.一位大数据工程师使用EIasticSearch进行数据操作,如果他希望获取集群当前的健康状态,那么他可以如何操作?A、curl-XPOSThttpB、url-XGEThttpC、cur1-XGETD、cur1-XPUThttp答案:B98.Flink中的DataStream数据流转不包含以下哪项?A、DatasourceB、TransformationsC、DatasinkD、Actions答案:D99.Hive调优中,当连接一个较小和较大表的时候,把()的表直接放到内存中去,然后再对()的表进行map操作。A、小,小B、小,大C、大,小D、大,大答案:B100.以下哪个选项不能做为Kafka的Consser?A、HadoopB、Real-timeMonitoringC、FrontEndD、DataWarehouse答案:C101.对EIasticSearch检索流程描述正确的是?A、检索节点汇总结果发送给客户端B、分片节点不需要汇总结果直接把结果发送给客户端C、分片节点汇总结果发送给客户端D、检索节点不需要汇总结果直接把结果发送给客户端答案:A102.离线批处理工具不包含以下哪项?A、SparkB、MapReduceC、StormD、SQL答案:C103.以下哪项不属于Apache顶级项目?A、FlinkB、StormC、EcIipseD、Spark答案:C104.通过HDFS的Shell命令来操作HDFS,表示删除文件的命令是?A、hdfsdfs-rmB、hdfsdfs-putC、hdfsdfs-mkdirD、hdfsdfs-catCpath>答案:A105.以下关于选用Kafka等消息系统的原因描述错误的是()。A、解耦:消息系统在处理过程中插入一个隐含、基于数据的接口层。B、同步通信:消息队列允许消息加入队列,等需要时再处理。C、扩展性:消息队列解耦处理过程,容易扩展处理过程。D、冗余:消息队列持久化,防止数据丢失答案:B106.对EIasticSearch检索流程描述正确的是()。A、分片节点汇总结果发送给客户端B、检索节点汇总结果发送给客户端C、检索节点不需要汇总结果直接把结果发送给客户端D、分片节点不需要汇总结果直接把结果发送给客户端答案:B107.GaussDB200支持实例故障发生时,业务不中断。因此()。A、不用担心实例故障带来的影响,无需处理故障问题。B、在实例恢复或主备切换成功之后,能够继续提供服务。C、不用担心CN故障导致SQL执行失败,保证SQL100%执行成功。D、实例故障之后GaussDB200会自动重启,无需人为关注。答案:B108.以下哪项不属于数据存储组件?A、HBaseB、StormC、HDFSD、MySQL答案:B109.以下哪种机制使Flink能够实现窗口中无序数据的有序处理?A、窗口B、有状态处理C、检查点D、事件时间答案:A110.ETL工具工作过程不包含以下哪项?A、清洗B、传递C、加载D、转换答案:B111.HDFS默认的副本是几份?A、5B、3C、6D、4答案:B112.以下对于离线批处理的概念理解错误的是哪一项?A、离线批处理针对的数据量较大B、离线批处理占用的内存资源较多。C、斋线批收处理对数据处理的时延要求不高。D、离线批处理通常MR作业,Spark作业或者HGL作业实现。答案:B113.企业数据分析平台在根据不同的业务场景需求,搭建不同的大数据分析平台,如适应离线批处理的Hadoop平台;适应实时处理的流计算平台等,这种架构属于哪种类型的架构?A、分离架构B、单一架构C、融合架构D、多维架构答案:B114.EIasticSearch是怎么实现Master选举的?A、借助ZooKReper选举B、内部自行选举C、随机生成D、自行指定答案:A115.StructuredStreaming不能提供以下哪几种类型的保证?A、ExactIyonceB、AtIeastonceC、AtmostonceD、Morethanonce答案:D116.若要对图片进行检索,一般选择什么工具较好?A、MysQLB、HDFSC、ElasticSearchD、Hive答案:C117.以下关于HDFS适合做什么描述正确的是A、低延迟读取B、大文件存储C、大量小文件存储D、随机写入答案:B118.存储过程的调用有几种方式()A、3B、1C、4D、2答案:B119.以下哪种Hive的方法可以用来对数据求和?A、trimB、dataC、avgD、sum答案:D120.下面这条GaussDB200语句"calldbms_erval(1.'sysdate+1.0/24');"的意思是A、修改Job1的Interva为每隔24小时执行一次。B、修改Job1的Interval为每隔1小时执行一次。C、修改Job1的Interval为每隔1/24小时执行一次。D、修改Job1的Interval为每隔24分钟执行一次。答案:B121.EIasticsearch采用的捜索方式是()。A、正排素引B、倒排素引C、慢素引D、快速索引答案:B122.下列代码的作用是?StringvertexId=getVertexIdByProperty(api.graphName."person","name"."marko");api.queryVertex(vertexId.graphName);A、查询点B、查询属性C、查询边D、以上全不正确答案:B123.StructuredStreaming中持续地查询最新计算结果至写出。这个过程叫做什么?A、matchqueryB、querystringC、continousqueryD、matchphrase答案:C124.ElasticSearchk可通过分片副本来优化性能,下列策略错误的是哪一项?A、分片数不超过节点数的3倍,用较少的分片获得更佳的性能B、副本数至少设置为3,保障数据的可靠性C、副本数建议设置为1,过多的副本需要更多存储空间D、分片最大容量不要超过ElasticSearch推荐的最大JVM堆空间32G答案:B125.对ElasticSearch描述正确的是?A、客户端必须把索引请求发给EsMasterB、客户端必须把索引请求发给shardC、客户端必须把索引请求发给EsNodeD、客户端必须把索引请求发给指定的EsNode答案:A126.第三次信息化浪潮标志不包含以下哪项?A、互联网B、云计算C、物联网D、大数据答案:A127.关于实时检索技术的应用场最,以下描述中错误的是哪一个选项?A、公安系统数据量大、业务要求复杂,因此无法借助实时检索技术提高处警效率B、实时检索要求在小批量数据集上需达到毫秒级的时延C、在金融风控场景中,利用实时检索技术,客户可以在发生危险交易前及时上损D、运营商可以借助实时检索技术,查询某个时间段用户的流量记录,以应对不良APP偷跑流量引发的投诉答案:A128.以下属于Hive的架构组件的是?A、HLogB、DriverC、MasterD、NameNode答案:B129.下列哪个选项可以用来判断HBase表是否存在?A、admin.tabIeExists(tabIeNameB、admin.tabIeExists(TableNamevaIueOf(tabIeName)C、admin.getTabIe(tabIeNameD、tabIes.containsKey(tabIeName)答案:B130.GaussDB200的EXECUtEIMEDIATE语法和OPENFOR语法都可以实现动态语句的执行,那么二者的异同是()?A、EXECUTEIMMEDIATE没有返回值,OPENFOR有返回值。B、当需要将查询的结果保存在一个数据集时,可使用OPENFOR实现动态查询。C、EXECUTEIMMEDIATE通过动态执行SELECT语句,OPENFOR结合了游标的使用。D、EXECUTEINMEDIATE可以调用存储过程,OPENFOR则不行。答案:B131.Flink快照机制的核心是barriers不包含以下哪个特点?A、将前后周期快照数据分隔B、携带所属快照周期的IDC、严格的按照线性流动D、会阻断数据流,重量级元组答案:D132.Flink的Checkpoint机制绘制的流应用快照不能被保存在以下哪个位置?A、LocaIB、HDFSC、TaskManager的内存D、Joblanager的内存答案:C133.Flink的哪种机制可以保证task运行失败时,其状态能够恢复?A、窗口B、有状态处理C、事件时间D、检查点答案:D134.对于HBaseKeyVaIue存储模型描述不正确的是?A、同一个Key值只能美联个valueB、拥有时间戳类型等关键信息C、Keyvalue具有特定的格式D、时间戳来区分多个记录版本答案:A135.对ElasticSearch描述正确的是()。A、客户端必须把索引请求发给shardB、客户端必须把索引请求发给EsNodeC、客户端必须把素引请求发给EsMasteD、客户端必须把索引请求发给指定的EsNode答案:C136.某公司在进行大数据离线批处理平台的前期技术选型,以下哪个大数据组件不属于离线批处理业务所涉及到的组件?A、HDFSB、SparkC、StormD、Hive答案:C137.关于Kafka的Topic,以下哪一项描述是错误的?A、Kafka集群中Topic可以设置多个。B、设置多副本可以増强Kafka服务的容交能力。C、Topic的Partition数量可以在创建时配置。D、在创建Kafka的Topic时,必须设置Partition个数答案:D138.下列哪一个命令可以清空Redis实例下所有数据库的数据?A、dropdbB、flushdbC、dropaIID、flushalI答案:D139.以下描述中,哪一个选项属于HDFS的使用场最?A、海量气象数据存储B、社交媒体数据流式分析C、数据采集与开发D、集群资源调配管理答案:C140.消息系统Kafka如何保证高吞吐能力?A、多订阅者机制B、Partition机制C、持久性机制D、冗余备份机制答案:B141.Hive中的解释器(plier)、优化器(optimizer)、执行器(executor)组件用于HQL语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在0中,并在随后由。调用执行。A、内存、MapReduceB、HBase、YarnC、HDFS、TezD、HDFS、Yarn答案:D142.离线批处理方案的应用场最不包括?A、占用计算存储资源多B、快速高效,实时的数据处理C、数据处理格式多样D、处理大规模数据答案:B143.如果使用Redis统计切topN元素,可以使用哪些数据类型?A、SetB、ListC、StoredsetD、Hash答案:C144.对于HBase表设计描述错误的是?A、—张表可以创建多个CoIumnFamilyB、TTL默认为一天C、Region建议预先创建D、MaxVersion无法人为修改答案:D145.银行进行客户购买力分析首先获取客户历史账单,确定其中各项商品的计算权重,得出每位客户的购买力评分并存储记录。最后将结果以图表显示。请问该过程对应于以下哪个项目数据流程设计。A、数据可视化->数据源->数据落地-〉数据处理B、数据源->数据落地-〉数据处理-〉数据可视化C、数据源->数据处理->数据落地->数据可视化D、数据可视化->数据源->数据处理〉数据荷地答案:C146.以下关于HDFS的特点描述不正确的是()A、大数据量吞吐B、低延迟读取C、流式数据读取D、大文件存储与访问答案:B147.Flune的高级组件不包含以下哪个?A、SinkProcessorB、ChannellnterceptorC、ChannelSelectorD、Sourcelnterceptor答案:B148.Hive创建()时,会将数据移动到数据仓库指向的路径;创建(),仅记录数据所在的路径,不对数据的位置做任何改变A、内部表,外部表B、内部表,元数据C、原元数据,外部表D、外部表,托管表答案:A149.哪个不是StructuredStreaming中OutPut可以定义的存储方式?A、UpdateModeB、JDBCModeC、pIeteModeD、AppendMode答案:B150.关于RDD,下列说法错误的是哪一项?A、RDD具有血统机制(Lineage)。B、RDD默认存储在磁盘。C、RDD是一个只读的,可分区的分布式数据集。D、RDD是Spark对基础数据的抽象。答案:B151.以下哪个框架可以同时满足实时分析、高线分析、实时检素的功能?A、ApacheHadoopB、FusionInsightHDC、ApacheHBaseD、以上全都正确答案:B152.HBase使用get方法读取数据时,下列哪个选项是需要的?A、Deletedelete=newDelete(rowKey)B、scan.setCaching(1000)C、byte[]rowKey=Bytes.toBytes(\012005000201\)D、List<Put>]putS=newArrayList<Put>()答案:C153.一般来说,以下哪项不是大数据应用开发必备的能力?A、理解相关业务背景B、掌握机房硬件运维技巧C、具备JAVA/Scala编程能力,熟悉SQLD、熟悉LinuxShelI命令答案:B154.TOPN操作最适合采用哪种Redis数据结构?A、SetB、HashC、ListD、Sortedset答案:D155.对GaussDB200描述不正确的是?A、并行架构B、易运维,安全可靠C、行列不能混存D、节点多,易扩展答案:C156.下列哪个不是Explain的关键字()?A、TabIescanB、HashJoinC、FiIterD、Seqscan答案:C157.HBase不支持以下哪些SQL操作?A、SparkSQLB、HiveSQLC、MySQLD、PhoenixSQL答案:C158.下列关于GaussDB200的TOAST机制说法正确的是()?A、存储超过2KB的字段时,会触发TOAST机制.B、支持变长(varlena)表现形式的数据类型.C、存储超过1/2KB的字段时,会触发TOAST机制。D、存储超过1KB的字段时,会触发TOAST机制。答案:B159.GaussDB200在创建表时,需要注意以下哪些事项()?A、创建列存表之后,后续可以修改为行存表。B、创建列存表时压缩级别默认为HIGHC、如果指定表空间为普通表空间,创建表时默认是行式存储。D、创建行存表之后,后续可以修改为列存表。答案:C160.对融合数仓解决方案描述正确的是?A、数仓与大数据的并行架构B、低成本高扩震性的传统数仓架构C、以数仓为核心.大数据平台为延伸的融合架松D、大数据平台为核心的架构答案:C161.当Spark发生Shuffle时,MapTask的运算结果会通过()的形式把运算结果分发到对应的任务上去A、序列化B、键值对C、二进制D、RDD答案:B162.假设现在要做一个可以根据线索指导运维人员进行排障的功能,你建议选择下列哪个工具实现该功能?A、LuceneB、HBaseC、ElasticSearchD、GraphBase答案:D163.某电商网站想要实现热销商品的实时TopN排名,可以使用哪种技术实现?A、Elasticsearch的快速检索B、HBase的rowkey索引C、Hive的关联查询分析D、Redis的排序计算答案:D164.某大数据业务人员需针对某些数据创建Hive表结构,苴中某个数据为时间类型ywyMMdd,那么可以使用以下哪一项作为字段类型?A、IntB、doubleC、stringDD、varcahr答案:C165.Redis中相对于AOF持久化,对RDB持久化描述正确的是()A、会丢失最后一次持久化以后的数据B、内存占用过多,持久化文件尺寸较大C、占用较多的磁盘I0开支D、恢复数度相对较慢,写入数据相对较快答案:A166.Redis不适用于以下哪个应用场最?A、获取PB级Value数据B、获取T0PN操作C、获取手机验证码D、获取最新N个数据的操作答案:A167.公安行业中实时检索不适用于以下哪个场最?A、实时布控B、快速信息汇集C、评估嫌疑人犯罪概率D、车辆信息查询答案:C168.大数据应用开发流程不包含以下哪项?A、需求分析B、可行性分析C、应用推广D、技术选型答案:C169.下面这段代码的作用是什么?try{Rsp=restCIientlest,perfornilequest("HEAD"."1n+indexparams);Lf(HttpStatus.ScOK=rsp.getStatusLineO.getStatusCode0{LOG.info("Checkindexsuccessful,indexisexist;"+index);returntrue;}Lf(Httpstatus.SC_NOT_FOUND==Rsp.getStatusLine(.getStatusCode0{LOG.info(indexisnotexist:"+index):returnfalse;)A、判断素引分片是否存在B、判断索引类型C、判断索引是否可用D、判断索引是否存在答案:D170.下列关于GaussDB200的数据类型转换说法正确的是()A、如果需要保留空字符串时,需要新建兼容性为Postgres的数据库。B、在查询中,对常量不需要显式指定数据类型。C、在ORACLE兼容模式下,在导入数据时,空字符串会自动过滤。D、不同数据类型比较或转换时,使用强制类型转换,以防隐式类型转换结果与预期不符。答案:D171.GaussDB200的SQL自诊断在Monitor模式下,可识别下列哪个IssuePattern)?A、HashJoin中大表做内装B、多列统计信息未收集C、大表等值美联NestLoopD、数据倾斜答案:B172.Kafka消息默认保存时间为多少天?A、14天B、30天C、1天D、7天答案:D173.某学生正在学习ElasticSearch,请你帮他分析下,下列代码的作用是什么A、支持列存表,extendB、集群规模小,extendC、HDFS做底层存储,extendD、多列簇特性,extend答案:C174.HBase中数据存储的文件格式是下面哪一项?A、SequenceFileB、HfileC、TextFileD、HLog答案:B175.Redis中List列表是什么数据结构实现的?A、双向链表B、平衡二叉树C、红黑树D、循环链表答案:A176.当ElasticSearch集群有节点加入或退出时,集群数据会发生什么动作A、数据重载B、数据重分布C、数据更新D、数据重建答案:B177.在GaussDB200的存储过程中语句nimfcer=0的意思是()?A、判断number的值是否为0B、声明一个变量number.并初始化值为0。C、修改变量number的值为0D、比较number和的大小。答案:B178.以下哪些选项不属于大数据时代到来的必要条件?A、存储设备容量提升B、CPU计算性能提升C、超级计算机的出现D、网络带宽提升答案:C179.下列对图数据库描述正确的是?A、以图”数据结构存储和查询数据的教据库B、存储图片的数据库C、与关系型数据库美似的数据库D、数据仓库的一种答案:A180.ElasticSearch存放所有关键词的地方是A、字典B、关键词C、词典D、素引答案:C181.以下关于DataNode的描述不正确的是?A、DataNode管理数据块元数据B、DataNode执行数据块的读/写操作。C、DataNode的数量受数据规模影响。D、DataNode是用来存储数据库。答案:C182.关于HDFS的文件块的描述不准确的是?A、文件块越大寻址时间越知短。B、文件块(片)被存在哪个集群;谁有权限查看.修改这个文件等信息放在元数据Metadata中。C、文件块的大小设置原则:最大化寻址开销。D、HDFS文件块的大小在1.0版本时是64,在2.0的时候是128M。答案:A183.在Kafka集群中,Kafka服务端的角色是下列哪一项?A、ProducerB、ZooKeeperC、ConsumerD、Broker答案:D184.某大数据运维人员想通过shell命令上传某个文件至HDFS文件系统中。以下哪个命令能帮助他完成这个操作?A、-catB、-putC、-uploadD、-get答案:B185.网站个性化推荐的背后,可以使用哪些类型的数据实现?A、无结构化B、非结构化C、结构化D、半结构化答案:C186.下列关于存储过程的特点说法正确的是A、编写的SQL存储在数据库中,因此执行速度快,extendB、创建时编译,执行时调用,因此开发效率高,extendC、用户创建的存储过程或自定义函数可以重复调用,因此数据传输量少,extendD、通过指定存储过程的访问权限,因此安全系数高,extend答案:D187.以下关于HBase中HRegionServer的功能描述不正确的是哪一项?A、管理所有的Region.Regiont可以在RegionServer之间迁移。B、HBase的数据处理和计算单元.C、RegionServer是HBase的数据服务进程,负责处理用户数据的读写请求。D、RegionServer-一般与HDFS集群的NameNodei部署在一起,实现数据的存储功能。答案:B188.数据仓库仅仅是提供存储的,提供一种()的服务,不面向最终分析用户:而数据集市是()的,面向最终用户。A、面向分析应用、面向数据管理B、面向事务交互、面向数据管理C、面向数据管理、面向分析应用D、面向分析应用、面向事务交互答案:A189.某项目小组接到一个大数据实时分析项目,且对实时性要求很高,以下哪种大数据计算框架最合适?A、SparkB、FlinkC、HBaseD、MapReduce答案:B190.某大数据运维人员想通过shell命令上传某个文件至HDFS文件系统中。以下哪个命令能帮助他完成这个操作?A、-catB、-uploadC、-putD、-get答案:C191.关于GaussDB200的数据导入导出下列说法正确的是()?A、使用gsq1元命令和COPY命令在使用和用法上是一样的。B、GDS在数据导入时可以做预处理,比如非法字符替换、容错处理、数据聚合等。C、GOPY方式使用简单,一般用在大量数据的导入导出中。D、INSERT数据写入适合数据量不大,并发度不高的场景。答案:B192.创建一个存储过程proc_addCREATEORREPLACEPROCEDUREproc_add(paramlinINTEGERparam2outINTEGERparam3inlNTEGER)ASBEGINParam2;=paramltparam3;END;创建一个存储过程proctestCREATEORREPLACEPROCEDUREproc_test(resultoutlNTEGER)asDECLARELnput1INTEGER:=1;input2INTEGER:=2;statementVARCHAR2(200);param2lINTEGER;BEGIN一声明调用语句Statement:='callproc_A、3B、无返回值C、4D、2答案:A193.下列哪些选项不是HBase为null的列不占用存储空间的原因?A、Region分裂B、列存储C、行存储D、Key-Value结构答案:D194.Redis中数据排序的性能优化不包含以下哪个选项?A、减少待排序键中元素的数量B、增加集群中Master节点C、如果要排序的数据数量很大,尽可能使用store参数将结果缓存D、使用Iimit参数只获取需要的数据答案:D195.Redis中适合存储对象的数据类型是?A、StringB、ListC、HashD、Set答案:C196.Spark读取任务参数的优先级是()A、代码配置〉动态参数〉配置文件B、动态参数〉代码配置〉配置文C、配置文件〉代码配置〉动态参数D、动态参数配置文件〉代码配置答案:A197.Flume中一个ChanneISelector的作用是什么?A、设置多个channel发往多个sink的策略B、设置一个source发往多个channel的策略C、设置多个source发往多个channel的策略D、设置一个channel发往多个sink的策略角答案:B198.下列关于GaussDB200的说法正确的是()?A、RETURN用于返回存储过程调用结果B、RETURNNEXT表示返回下一个。C、RETURNQUERY用于近回集合。D、存储过程需要回值时使用RETURN关键字答案:D199.下列关于GaussDB200的Explain命令描述正确的是?()A、Explain命令主要显示SQL的执行计划,对SQL调优用处不大。B、Explain主要关注语句的预计执行开销。C、通过设置GUC参数explain_perfmode,可以显示不同格式的执行计划。D、Explain可以完成对SQL的优化,其余优化不关键。答案:B200.哪个选项不是实时检索解决方案的典型业务特点?A、查询条件简单B、查询速度快C、统计美查询D、高并发答案:C201.下列哪一个选项不是StructuredStreaming支持的sink输出源?A、HBaseB、ConsoleC、KafkaD、HDFS答案:A202.离线批处理常用的组件不包括哪个?A、FlumeB、SparkC、HiveD、Storm答案:D203.关于GaussDB200的数据导入导出下列说法正确的是()?A、GDs在数据导入时可以做预处理,比如非法字符誓换密错处理教据聚合等。B、COPY方式使用简单,一般用在大量数据的导入导出中。C、INSERT数据写入适合数据量不大.并发度不高的场景D、使用gsq元命令和COPY命令在使用和用法上是样的。答案:A204.现在有一亿条数据要插入HBase使用下列哪个方式最好?A、put,方法B、buIkload方法C、sheII端put命令D、insert方法答案:B205.某学生正在学习ElasticSearch,请你帮他分析下,下列代码的作用是什么?<imgsrc="https://up.zaixiankaoshi./5443384/9381793/image/png/1676465216299.png"alt="1676465216299.png">A、插入数据,更新素引B、插入数据,创建素引C、更新索引D、创建数据答案:B206.GaussDB200支持什么格式的数据存储?A、行存储B、列存储C、行列混存D、以上都对答案:D207.以下关于ElasticSearch介绍错误的是?A、Document文档.被素引的基本单位B、EsMaster主节点C、Index亲引.与关系型数据库中的索引概念一样D、EsNode答案:C208.Flune的应用中,如果要保证sink的负载均衡,需要使用以下哪一个组件?A、StaticlnterceptorB、DefaultSinkProcessorC、ReplicatingChannelSelectorD、Failover <spanstyle=\background-color答案:C209.Hive是基于Hadoop的数据仓库软件,最大可以查询和管理()级别的分布式数据。A、TBB、GBC、PBD、MB答案:C210.若要查询表,下列API哪个最先被调用?A、createCornectign()B、getAdmin()C、getTable()D、getConnect()答案:A211.下列关于存储过程中的变量说法正确的是()?A、声明变量时需要指定变量的初始值。B、变量的作用域是全局。C、变量必须先声明后使用D、声明变量时需要指定变量的数据类型。答案:C212.Loader特点不包含?A、图形化B、实时性C、高性能D、安全答案:B213.关于GaussDB200的发展史,下列说法错误的是()?A、GaussDB200已经在华为云发布了云化产品。 B、GaussDB200专注国内业务,不涉及海外。C、GaussD200从一开始就支持ARM架构的部署。D、GaussD200前身叫GaussDB,是GaussDB的子项目。答案:B214.Gremlin中查询单个点的信息该用什么命令A、g.V().hasLabel("test")B、g.V().hasLabel("test").values("age")C、g.V().hasLabel("test").valueMap("String._list","age")D、g.V(13464736).valueMap()答案:D215.Gateway在ElasticSearch中的含义是?A、网关B、素引的存储方式C、rpc请求接D、索引快照的存储方式答案:D216.对于ElasticSearch描述不正确的是?A、对Lucene进行了扩展B、不支持结构化数据存储C、能够水平扩展D、基于Lucene的全文检素服务答案:B217.某开发小组计划利用GraphBase实现一些功能,以下哪些功能可以实现?A、物流最优路径规划B、社交分析C、金融反欺诈D、以上全都正确答案:D218.Flume的基础架构不包含以下哪部分?A、ChanneIB、BrokerC、SourceD、Sink答案:B219.当大数据业务人员希望通过like关键字来查询Hive表中的某些数据时,需要添加以下哪个关键字符用于匹配数据?A、%B、AC、SD、&答案:A220.下列哪一项是HBase不适合的应用场景?A、海量数据(TB,PB)应用场景。B、半结构化数据应用场景。C、要求具有完全ACID特性的应用场景。D、高吞吐率应用场景。答案:C221.关于HBase建表语句,以下描述中错误的是哪一项?A、在华为云MRS提供的HBaseshell客户端中建表时,需指定至少一个列族名称B、利用HBasef的JavaAPI时,需要用put语句完成建表C、在HBaseshell客户端中可以通过create命令建表D、在建表时可以预先创建多个Region答案:B222.以下哪个不是大数据的数据计算引擎?A、SparkB、MapReduceC、FIumeD、Flink答案:C223.关于Hive自定义UDF描述错误的是()A、普通的UDF,用于操作单个数据行,且产生一个数据行作为输出。B、永久函数,可以在多个会话中使用,不需要每次创建。C、用户定义表生成函数UDTF,用于接受多个输入数据行,并产生一个输出数据行。D、临时函数,只能在当前会话使用,重启会话后需要重新创建答案:C224.集合运算算子指的是?A、SetOpB、ArrayOPC、HashOpD、ListOp答案:A225.HBase元数据MetaRegion路由信息保存的位置是下列一项?A、HasterB、ZooKeeperC、Root表D、Meta表答案:D226.下面这条GaussDB200语句"calldbms_job.broken(1.true)"的意思是()?A、停止任务TD为1的Job.B、启动任务ID为1的Job.C、延时任务ID为1的Job.D、删除任务ID为1的Job.答案:A227.GaussDB200数据并行导入Shared策略支持的数据格式是?A、CSyB、TextC、FIXEDD、Sea答案:B228.某大数据业务人员对某些数据创建Hive表结构,其中某个数据为时间类型yyyyMMdd,那么可以使用以下哪一项作为字段类型?A、varcahrB、stringC、doubIeD、int答案:B229.在网络日志数据分析场最中,日志服务器通过1性4将数据传给(),()会对数据进行简单的处理过滤,然后将数据按照日期存储到。上。A、Flume、Flume、HDFSB、HDFSx、Flume、FlumeC、Spark、Sgoop、FlumeD、Hive、Flume、Loader答案:A230.下列关于Hive自定义函数的描述中,正确的是哪一项?A、Hive中的min以及max属于UDAF的数。B、一般自行编写的函数都属于临时函数.每次使用都需要重新创建。C、一般自行编写的函数都属于永久函数.直接引用即可。D、如果创建的函数名与内置的函数名重复,在使用过程中以内置的函数名为主。答案:B231.下对GaussDB200双AZ集群描述不正确是?A、灾备集群不同步数据时,可以提供读写服务B、主集群不可用时,灾备集群提供正常服务C、主集群提供正常服务,文备集群只同步数据D、周期性数据同步答案:A232.有一张表name,其中一,字段名为chinese_name,类型为char(4),另一,字段名为english_name,类型为varchar⑸?那么执行如下语句"insertintonamevaIues(gaosi','GaussDB)'会发生什么?()A、存在记录(gaos.GaussDB)。B、存在记录gaos.Gauss)C、数据无法插入。D、存在记录(gaosi.GaussDB)答案:C233.HBase表设计为什么一般不超过两个列簇?A、过多的列簇不适合读写分离B、过多的列I0开销大C、过多的列簇StoreD、过多的列簇会导致memstore答案:B234.以下关于常见数据库描述正确的是?A、HBase基于ZooKeeper,Hadoop,适合非结构化数据存储,是高可靠性高性能,面向行,可伸缩的分布式存储系B、OracleC、RedisD、Mysql关系型数据库,列式存储,支持SQL轻量级数据分析存储,仅有商业版本。答案:C235.下列哪段代码是用于判断ElasticSearch索引是否存在?A、publicbooleanisExistsIndex(StringindexName)(IndicesExiStsResponserespoaDminClientO.prepareExists(indexName).get()B、publicbooleanisExistsIndex(StringindexName)IndicesExistsResponsefesponsegetAdminClientO.prepareExists(indexName)C、publicbooleanisExistslndex(StringindexName)(IndicesExistsResponseresponse=getAdminClient(getoD、publicbooleanisExistslndex(StringindexName)(IndicesExistsResponseresponse=getAdmincClientO.prepareExists(indexName),getO答案:B236.下列哪个选项对批量数据处理组件的描述是不正确的?A、HiveB、MapReduceC、SparkSQL:新型SQL批处理引擎,用于处理SQL类批处理作业,适合海量数据.处理速度高效。D、Spark:新型批处理引擎,可以用于处理非SQL类,尤其是数据挖掘和机器学习类批处理作业,适合海量数据,处理速度高效。答案:B237.企业数据分析平台在根据不同的业务场景需求,搭建不同的大数据分析平台,如适应离线批处理的Hadoop平台;适应实时处理的流计算平台等,这种架构属于哪种类型的架构?A、分离架构B、单一架构C、融合架构D、多维架构答案:A238.下列代码的作用是?StringgraphName="graphbase;Api.createGraph(graphName):A、删除图B、获得图C、修改图D、创建图答案:D239.哪种不是Flink提供的部署方式?A、ClusterB、CloudC、VMD、LocaI答案:C240.ElasticSearch可以通过什么命令发起HTTP请求来对数据进行查询操作?A、netstatB、CurlC、wgetD、get答案:B241.关于表连接算子的说法错误的是()?A、聚合操作如groupby会触发NergeJoinB、表连接算子主要有NestIoopMergeJoin.Minorjoin.HashJoinC、算子的选择是SQL根据逻辑三行选择的.与人为无关。D、默认情况下.执行效率来说Hashjoin最高。答案:D242.离线批处理常用的组件不包括()。A、SparkB、HiveC、FlumeD、Storm答案:D243.GES能够处理海量数据的原因是()A、基于HBase的分布式存储机制B、图机制特性C、基于Elasticsearch的素引机制D、基于Spark的分布式内存计算技术答案:A244.关于Spark中SparkSQL描述不准确的是?A、SQL语句通过SparkSQL模块解析为DAG,交给SparkCore执行。B、SparksSQL使用场景包括毫秒级实时查询。C、通过SparkSession提交SQL语句。任务像普通Spark应用一样提交到集群中分布式运行D、SparksQL是Spark用来处理结构化数据的一个模块,可以在Spark应用中直接使用SQL语句对数据进行操作。答案:B245.GaussDB200在创建表时,需要注意以下哪些事项()?A、创建列存表之后,后续可以修改为行存表。B、创建列存表时压缩级别默认为HIGHC、如果指定表空间为普通表空间,创建表时默认是行式存储D、创建一个行存表之后,后续可以修改为列存表。答案:C246.常用的数据收集工具不包括以下哪个选项?A、LoaderB、SqoopC、KettIeD、Spark答案:D247.Kafka集群必须依赖于下列哪一个组件?A、HDFSB、YarnC、FlumeD、Zookeeper答案:D248.Flune传输数据过程中,为了防止数据不丢失,使用的Channel类型是?A、MemoryChanneIB、FileChanneC、JDBCChanneD、HDESChannel答案:B249.创建分支语句如下,CREATEORREPLACEPROCEDUREproccase.branch(pi_resultininteger.pi_returnoutinteger)ASBEGINCASEpi_resultWHEN1THENpi_return;=1:WHEN2THENpi_return;=3:WHEN3THENpireturn:5:WHEN6THENPi_return:-7:WHEN7THENpi_return:P9:ELSEPi_return:=0.ENDCASE.Raiseinfopireturn:%.pireturn;END:执行如下语句CALLproc_case_branch(3.2)的返回结果是()。A、4B、3C、5D、2答案:C250.下列哪个选项可用于查询ElasticSearch的索引?A、curl-XGET"httpB、curl-XGET'httpC、curl-XPOSThttpD、curl-XGEThttp答案:B251.以下哪项属于Flume的基本数据单位?A、SubjectB、TopicC、ObjectD、Event答案:D252.以下选项对GES概念描述正确的是()。A、EdgeB、EdgeC、VertexD、vertex;节点/顶点,用于表示现实世界中的实体对象答案:D253.下面哪几项属于Redis中set类型的命令?A、suni

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论