HCIP BigData复习测试有答案_第1页
HCIP BigData复习测试有答案_第2页
HCIP BigData复习测试有答案_第3页
HCIP BigData复习测试有答案_第4页
HCIP BigData复习测试有答案_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HCIPBigData复习测试有答案单选题(总共40题)1.HiveSQL中DDL指定是哪一种语言?(1分)A、数据删除语言B、数据管理语言C、数据查询语言D、数据定义语言答案:D解析:

暂无解析2.关于StructuredStreaming时间语义以下哪一项是正确的?(1分)A、StructuredStreaming仅支持处理时B、事件时间是指每台机器的系统时间,当流程序采用处理时间时,将使用各个实例的机器时间C、StructuredStreaming仅支持事件时间D、StructuredStreaming支持watermark机制处理滞后数据答案:D解析:

暂无解析3.关于GaussDB200的逻辑架构,下列说法正确的是(1分)A、DN是实际数据节点,所以只负责存储数据。B、CN是协调节点,协助CM管理整个集群。C、CM是集群的管理模块,那么负责集群的日常管理和运维。D、GTM是全局事务控制器,负责生成和维护全局事务ID等全局唯一信息。答案:D解析:

暂无解析4.对于HBase表设计描述错误的是?(1分)A、一张表可以创建多个ColumnFamilyB、TTL默认为一天C、Region建议预先创建D、MaxVersion无法人为修改答案:D解析:

暂无解析5.哪个选项不是实时检索解决方案的典型业务特点?()(1分)A、查询条件简单B、查询速度快C、统计类查询D、高并发答案:C解析:

暂无解析6.以下哪个选项对Redis数据读写流程描述是正确的?((1分)A、ServerA节点返回集群拓扑—客户端选择集群任意一个serverA节点连接客户端计算Key归属的槽位以及对应ServerB节点并连接-Servere节点返回业务操作结果B、客户端选择集群任意一个ServerA节点连接-Servera节点返回集群拓扑客户端计算Key归属的槽位以及对应serverB节点并连接--ServerB节点返回业务操作结果C、ServerA节点返回集群拓扑—喜户端计算Key归属的槽位以及对应ServerB节点并连接户端选择集群任意一个ServerA节点连接-eerB节点返回业务操作结果D、客户端选择集群任意一个Servera节点连接客户端计算Key归属的槽位以及对应ServerB节点并连接-ServerA节点返回集群拓扑-ServerB节点返回业务操作结果答案:B解析:

暂无解析7.Flume中的JDBCChannel内置数据库是哪个?(1分)A、DerbyB、OracleC、sqlServerD、MySql答案:A解析:

暂无解析8.下列哪一个选项不是StructuredStreaming支持的sink输出源?(1分)A、HBaseB、ConsoleC、KafkaD、HDFS答案:A解析:

暂无解析9.下面这条GaussDB200语句"calldbms_job.broken(1,true):”的意思是()?(1分)A、停止任务ID为1的Job.B、启动任务ID为1的Job.C、延时任务ID为1的Job.D、删除任务ID为1的Job.答案:A解析:

暂无解析10.若要修改HBase表,下列API哪个最先被调用?(1分)A、createConnection()B、getTable()C、getConnect()D、getAdmin()答案:A解析:

暂无解析11.关于RDD,下列说法错误的是哪一项?(1分)A、RDD具有血统机制(Lineage)。B、RDD默认存储在磁盘。C、RDD是一个只读的,可分区的分布式数据集。D、RDD是Spark对基础数据的抽象。答案:B解析:

暂无解析12.在SparkSQL中,()使用了新的编码器,其编码器的作用是将VM的对象与表结构进行转换,允许操作序列化数据,可以提高内存利用率。(1分)A、DataFrameB、TableC、DataSetD、RDD答案:C解析:

暂无解析13.—般来说,以下哪项不是大数据应用开发必备的能力?(1分)A、理解相关业务背景B、掌握机房硬件运维技巧C、具备JAVA/Scala编程能力,熟悉SQLD、熟悉LinuxShell命令答案:B解析:

暂无解析14.在MRSHDFS中,将HDFS根目录下的a.txt重命名为b.txt,以下哪一个选项可以实现上述目的?(1分)A、Hdfsdfs-mv/a.txt/b.txtB、Hdfsdfs-ls/a.txt/b.txtC、Hdfsdfs-rm/a.txt/b.txtD、Hdfsdfs-put/a.txt/b.txt答案:A解析:

暂无解析15.下面这条GaussDB200的SQL语句”selectname,count(1)fromstudentgroupbyname“可能涉及的算子有哪些?(1分)A、FilterB、GroupAggregateC、StreamingD、HashAggregate答案:B解析:

暂无解析16.Gremlin中查询单个点的信息该用什么命令(1分)A、g.V0.hasLabel("test")B、g.VOhasLabel("test").values("age")C、9.V0.hasLabel("test).valueMap("String.list","age")D、gV(13464736).valueMap0答案:D解析:

暂无解析17.()是一个实现了文件系统的抽象类,继承自org.apache.hadoop.conf.Configured,并实现了Closeablo接口,可以适用于多种文件系统。(1分)A、FSDatalnputStreamB、FileConfigurationC、FSDataOutputStreamD、FileSystem答案:C解析:

暂无解析18.以下哪个不是大数据的数据计算引擎?(1分)A、SparkB、MapReduceC、FlumeD、Flink答案:C解析:

暂无解析19.HBase中数据存储的文件格式是下面哪—项?(1分)A、SequenceFileB、HfileC、TextFileD、HLog答案:B解析:

暂无解析20.HBase表设计为什么一般不超过两个列簇?(1分)A、过多的列簇不适合读写分离B、过多的列IO开销大C、过多的列簇StoreFile过多,Compaction压力大D、过多的列簇会导致memstoreflush时10压力过大答案:B解析:

暂无解析21.以下哪一选项不是企业级大数据平台的特点?(1分)A、数据共享B、资源共享C、可维护性差D、可平滑拓展答案:C解析:

暂无解析22.以下关于SinkProcessor的描述,错误的是哪一项?(1分)A、DefaultSinkProcessor是默认类型,需要配置SinkgroupsB、FailoverSinkProcessor是故障转移机制C、主要作用是针对Sinkgroups的处理策略设置D、LoadbalanceSinkProcessor是负载均衡机制答案:A解析:

暂无解析23.公安行业中实时检索不适用于以下哪个场景?(1分)A、实时布控B、快速信息汇集C、评估嫌疑人犯罪概率D、车辆信息查询答案:C解析:

暂无解析24.以下对于离线批处理的概念理解错误的是哪一项?(1分)A、离线批处理针对的数据量较大B、离线批处理占用的内存资源较多C、离线批收处理对数据处理的时延要求不高D、离线批处理通常MR作业,Spark作业或者HQL作业实现答案:B解析:

暂无解析25.ElasticSearch是怎么实现Master选举的?(1分)A、借助ZooKepper选举B、内部自行选举C、随机生成D、自行指定答案:A解析:

暂无解析26.以下对于离线批处理的概念理解错误的是哪—项?(1分)A、离线批处理对数据处理的时延要求不高。B、离线批处理占用的内存资源较多。C、离线批处理通常通过眠作业、Spark作业或者HQL作业实现。D、离线批处理针对的数据量较大。答案:B解析:

暂无解析27.对于HBaseKeyValue存储模型描述不正确的是?(1分)A、同一个Key值只能关联一个ValueB、拥有时间戳类型等关键信息C、KeyValue具有特定的格式D、时间戳来区分多个记录版本答案:A解析:

暂无解析28.一位大数据工程师使用ElasticSearch进行数据操作,如果他希望获取集群当前的健康状态,那么他可以如何操作?(1分)A、curl-XPOSThttp://ip:httpport/索引名/文档类型/索引1D?pretty-H"Content-Type:Application/json'-d'0B、curl-XGEThttp://ip:httpport/_cluster/health?prettyC、cur1-XGEThttp://ip:httpport/索引名/文档类型/索引ID?prettyD、cur1-XPUThttp://ip:httpport/素引名?pretty'-H"Content-Type:application/ison'-d'(“settings':("number_ofshards:分片数量,"number_ofreplicas":副本数量))答案:B解析:

暂无解析29.哪种不是Flink提供的部署方式?(1分)A、ClusterB、CloudC、VMD、Local答案:C解析:

暂无解析30.当前传统关系型数据库主要面临的挑战是((1分)A、数据量爆炸式增长,要求数据处理平台具备弹性扩展能力。B、数据处理时效性需求提高,要求数据处理平台速度够快。C、多类型数据融合,要求数据处理平台功能更加强大。D、以上全都正确。答案:D解析:

暂无解析31.Kafka中数据从Producer到Broker和Broker到Consumer分别是哪种传递方式?(1分)A、push,pushB、push,pullC、pullpullD、pull,push答案:B解析:

暂无解析32.关于HBase的RegionSplit,以下描述中错误的是哪一项?(1分)A、RegionSplit过程不需要HMaster进行管理B、在建表时可以预先创建多个RegionC、将大表分裂出多个Region有助于提高数据的读写效率D、RegionSpliti速度很快,因为并没有真正拆分数据答案:A解析:

暂无解析33.Action是RDD的算子的一个类型,不可以将结果写入().(1分)A、磁盘B、CPUC、HDFSD、数据库答案:B解析:

暂无解析34.关于实时检索技术的应用场景,以下描述中错误的是哪一个选项?(VX:HWRZKSTK)(1分)A、公安系统数据量大、业务要求复杂,因此无法借助实时检索技术提高处警效率B、实时检索要求在小批量数据集上需达到毫秒级的时延C、在金融风控场景中,利用实时检索技术,客户可以在发生危险交易前及时上损D、运营商可以借助实时检索技术,查询某个时间段用户的流量记录,以应对不良APP偷跑流量引发的投诉答案:A解析:

暂无解析35.lrange是Redis中哪种数据类型的命令?(1分)A、SetB、StringC、ListD、Hash答案:C解析:

暂无解析36.Kafka的核心架构不包含?()(1分)A、SplitB、ProducerC、ConsumerD、Broker答案:A解析:

暂无解析37.以下关于HDFS元数据持久化的描述中,哪一个选项是错误的?(1分)A、将数据传到SecondaryNameNode时,因数据读写不能同步进行,此时NameNode产生一个新的日志文件EditLog.new用来存放这段时间的操作日志B、ActiveNameNode中的FsImage和EditLog可以直接在本地完成合并操作,而不需要被拷贝到SecondaryNameNode中C、在SecondaryNameNode的内存中对FsImage文件和EditLog文件合并后产生新的FsImage,叫做FsImage.ckptD、SecondaryNameNodeO并FsImage后O传NameNode替换)原有FsImage,并将EditLog.new命名为EditLog答案:B解析:

暂无解析38.以下关于Redis中String类型的描述,错误的是哪一项??(1分)A、一个字符串类型的值存储的最大容量是1MBB、字符串类型是Redis中最基本的数据类型C、可以存储图片D、可以存储文本数据答案:A解析:

暂无解析39.Loader页面是基于开源()的图形化数据迁移管理工具。(1分)A、HadoopB、HueC、KettleD、Sqoop答案:D解析:

暂无解析40.关于Kafka的Topic,以下哪—项描述是错误的?(1分)A、Kafka集群中Topic可以设置多个。B、设置多副本可以增强Kafka服务的容交能力。C、Topic的Partition数量可以在创建时配置。D、在创建Kafka的Topic时,必须设置Partition个数答案:D解析:

暂无解析多选题(总共30题)1.在哪些场景下不能使用HBase作为存储系统()?(1分)A、需要ACID特性B、海量数据存储C、主键查询D、大文件,视频等答案:AD解析:

暂无解析2.关于GES的应用场景,以下哪些选项是正确的?(1分)A、金融:实时推荐、实时反欺诈,基于知识图谱的风控(信贷、保险)B、物流和网规:最优路径推荐C、T业:基于知识图谱的设备故障诊断和预警D、社交分析,寻找特定爱好的好友,或者通过好友的好友,找到用户可能认识的好友答案:ABCD解析:

暂无解析3.GraphBase数据底层可以存储在哪里?(1分)A、HBaseB、MySQLC、HDFSD、ElasticSearch答案:AD解析:

暂无解析4.Flume的高级组件有哪些?(1分)A、SinkProcessorB、ChannelSelectorC、AvrosourceD、SourceInterceptor答案:ABD解析:

暂无解析5.Redis应用开发在之制定业务目标时需要考虑以下哪些因素?(1分)A、数据量B、读写性能C、数据质量D、持久化答案:ABD解析:

暂无解析6.()加()的组合满足了大部分的用户实时查询诉求?(1分)A、MapReduceB、HBaseC、ElasticSearchD、Hive答案:BC解析:

暂无解析7.StructuredStreaming中OutPut定义的存储方式包含以下哪几种?(1分)A、ModifyModeB、AppendModeC、UpdateMode.D、CompleteMode答案:BCD解析:

暂无解析8.Kafka的应用场景有哪些?(1分)A、元信息监控B、行为监控C、流处理D、数据处理答案:ABC解析:

暂无解析9.Hive业务场景中,常常会出现某一张大表连接一张较小的维表,那么为了提高这个Join操作的效率,可以进行如下哪些操作?(1分)A、大表在前小表在后B、小表在前大表在后C、设置参数hive.auto.convert.join为trueD、设置参数hive.groupby.skewindata为true答案:BCD解析:

暂无解析10.以下哪些选项是GES图数据库用于存储海量数据的基础组件?(1分)A、SparkB、ElasticSearchC、HBaseD、Flink答案:BC解析:

暂无解析11.关于HBase组件的描述,下列哪几项是正确的?(1分)A、是一种NoSQL数据B、存储数据是以K-V的开形式C、是分布式的D、是面向列的答案:ABCD解析:

暂无解析12.以下哪些是HDFS的核心组件?(1分)A、ClientB、NameNodeC、DataNodeD、Product答案:ABC解析:

暂无解析13.SparkSQL使用场景丰富,可以处理的数据源包括?(1分)A、JsonB、HiveC、文本文件D、RDD答案:ABCD解析:

暂无解析14.Flume由哪三部分组成?(1分)A、MasterB、SinkC、SourceD、Channel答案:BCD解析:

暂无解析15.数据分析平台云化和融合发展具有以下哪些特点?(1分)A、多场景分析B、交叉融合分析C、资源弹性分配D、超敏捷应用答案:ABCD解析:

暂无解析16.OutPut可以定义的存储方式包含以下哪些项?(1分)A、AddModeB、UpdateModeC、AppendModeD、CompleteMode答案:BCD解析:

暂无解析17.关于HBase的数据模型,以下哪些选项是正确的?(1分)A、表是由行和列构成的,所有的列是从属于某一个列族的B、应用程序是以表的方式在HBase存储数据的C、所有的表都必须要有主键-keyD、HBase的表是按key排序的,排序方式是针对字节的答案:AD解析:

暂无解析18.Google发布的三篇论文是哪些?(1分)A、GFSB、HDFSC、MapReduceD、BigTable答案:ACD解析:

暂无解析19.关于ElasticSearch的基本理解,以下哪些选项是正确的?(1分)A、ElasticSearch自身就可以提供数据可视化操作B、ElasticSearch的全文检索条件可以包括词或短语C、ElasticSearch可以支持数据清洗和分词D、ElasticSearch可以支持非结构化数据检索答案:BCD解析:

暂无解析20.在金融领域的大数据批量离线处理平台中,以下描述准确的是?(1分)A、金融领域的外部数据来源可以是征信信息.杜交网络和电商等。B、在数据集成模块,可以分为数据采集.数据操控和数据加载3个阶段。C、金融领域的内部数据来源均是结构化数据,包括信贷数据,信用卡数据和收单数据等。D、金融领域的数据应用层面均是面向金融机构内部的,如监管报表系统,精准营销.BI应用等,完全不对外或对其他下属机构开放。答案:AB解析:

暂无解析21.以下对HDFS中提供文件读写的类描述正确的是?(1分)A、FSDataOutputStream是与DataNode交互的接口类。B、FSDataOutputStream是HOFSAPI中提供读取文件的类,通过FileSystem的close方法获取读取数据流。C、FSDataOutputStream通过FileSystem的create和append方法获取写入数据流。D、FSDataOutputStream是HDFSAPI中提供文件写入文件的类。答案:ACD解析:

暂无解析22.下面选项哪些是HBase数据查询过滤器Filter的比较器?(1分)A、BinaryComparatorB、BinaryProfixComparatorC、RegexStringComparatorD、SubStringComparator答案:ABCD解析:

暂无解析23.以下关于事件时间的描述,正确的是哪些项?(1分)A、基于事件时间进行处理的流程序可以保证事件在处理的时候的顺序性B、基于事件时间的处理往往有一定的滞后性C、事件时间在事件进入flink之前已经嵌入事件,flink可以提取该时间D、事件时间是指事件在其设备上发生的时间答案:ABCD解析:

暂无解析24.SparkSQL对SQL语句的处理和关系型数据库采用了类似的方法。关于SparkSQL的处理逻辑,以下哪些选项是正确的?(1分)A、绑定(Bind):将SQL语句和数据库的数据字典(列、表和视图等)进行绑定(Bind),如果相关的Projection和DataSource等都存在的话,则表示这个SQL语句是可以执行的B、优化(Optimize):SparkSQL.会提供几个执行计划,并针对数据进行优化,返回从数据库查询的数据集C、执行(Execute):执行优化步骤获取的最优执行计划,返回从数据库查询的数据集D、词法和语法解析(Parse):对读入的SQL语句进行词法和语法解析(Parse),分辨出SQL语句中那些词是关健词,哪些是表达式,哪些是DataSource等,判断SQL语句是否规范,并形成逻辑计划,答案:AD解析:

暂无解析25.以下哪些属于大数据的发展趋势?(1分)A、从统计分析到认知计算B、数据处理逐渐标准化、云化C、从技术驱动转变为商业驱动D、生态合作开放答案:ABCD解析:

暂无解析26.大数据技术的“三驾马车”具体指以下哪些?()(1分)A、大数据分布式计算框架MapReduceB、分布式文件系统GFSC、数据库系统BigTableD、数据容器Docker答案:ABC解析:

暂无解析27.2019年以后,华为云数据湖CloudDataLake中分析引擎包含以下哪些组件?(1分)A、TensorflowB、PrestoC、SparkD、Flink答案:BCD解析:

暂无解析28.以下选项对GraphBase概念描述正确的是?(1分)A、VertexLabe1:节点的标签,用于表示现实世界中的实体类型B、Edge:边,用于表示关系度C、Vertex:节点/顶点,用于表示现实世界中的实体对象D、EdgeLabel.边的标签,用于表示现实世界中的关系类型答案:ACD解析:

暂无解析29.ElasticSearch支持的gateway类型有(1分)A、HDFSB、本地文件系统C、AmazonS3D、AmazonS5答案:ABCD解析:

暂无解析30.以下哪些选项属于FlinkLibraries层的应用?(1分)A、图像处理的GellyB、处理逻辑表查询的TableC、复杂事件处理的CEPD、机器学习的FlinkML答案:ABCD解析:

暂无解析判断题(总共30题)1.Kettle中有两种脚本文件transformation(转换ktr结尾)和job(任务kjb结尾)(1分)A、正确B、错误答案:A解析:

暂无解析2.GaussDB200是基于MPP架构的面向海量数据分析的数据仓库。(1分)A、正确B、错误答案:A解析:

暂无解析3.Flink是Apache社区孵化的项目。(1分)A、正确B、错误答案:A解析:

暂无解析4.大数据场景中对于数据的大小而言指的是数据的总量需要大,对于数据的数量要求不高。(1分)A、正确B、错误答案:B解析:

暂无解析5.ElasticSearch缓存RequestCache属于Node级别的缓存。(1分)A、正确B、错误答案:B解析:

暂无解析6.SQLonAnywhere的意思是GaussDB200的SQL可以运行在任何地方的数据库。(1分)A、正确B、错误答案:B解析:

暂无解析7.StructuredStreaming中逻辑计划的优化是通过Catalyst优化器完成。(1分)A、正确B、错误答案:A解析:

暂无解析8.MRS的SFlink不支持Kerberos等进行认证,但支持SSL加密传输。(1分)A、正确B、错误答案:B解析:

暂无解析9.ElasticSearch不支持SQL语句查询数据。(1分)A、正确B、错误答案:B解析:

暂无解析10.Filter主要在Scan和Get过程中进行数据过滤,通过设置一些过滤条件来实现(1分)A、正确B、错误答案:A解析:

暂无解析11.CTID的值是增量增加的。(1分)A、正确B、错误答案:A解析:

暂无解析12.GESAPI向上层应用提供统一的访问入口,通过高度灵活的RESTAPI按口,封装GES平台的统一操作。(1分)A、正确B、错误答案:A解析:

暂无解析13.某电商公司的一位数据分析师在使用Hive进行数据分析时,不慎删除了一个外部表,那么元数据和业务数据将一起都被删除,并且数据不可恢复。(1分)A、正确B、错误答案:B解析:

暂无解析14.数据处理方式,可分为实时处理和离线处理。(1分)A、正确B、错误答案:A解析:

暂无解析15.SparkSQL可以进行实时查询。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论