HCIP大数据练习试卷附答案_第1页
HCIP大数据练习试卷附答案_第2页
HCIP大数据练习试卷附答案_第3页
HCIP大数据练习试卷附答案_第4页
HCIP大数据练习试卷附答案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HCIP大数据练习试卷附答案单选题(总共40题)1.对于数据仓库而言,一般分为四层,ODS层、DWD层、DWS层和ADS层。以下关于数据仓库分层的描述中,错误的是哪一项?(1分)A、ODS层为原始数据层,数据无需做变动直接导入B、DWS层基于DWD层进行了数据清洗C、DWD层为数据明细层,也与ODS层数据一致。D、ADS层一般面向用户,会将数据同步到关系型数据库中答案:B解析:

暂无解析2.关于ElasticSearch内部架构,以下描述中错误的是哪一项?()(1分)A、Plugins:插件可以通过自定义的方式扩展加强Elasticsearch的基本功能,比如可以自定义类型映射,分词器,本地脚本等B、transport:代表Elasticsearch内部节点或集群与客户端的交互方式,默认内部是使用tcp协议进行交互C、Discovery:该模块主要负责集群中节点的自动发现和Master节点的选举D、Gateway:代表ElasticSearch.与客户端交流的方式答案:D解析:

暂无解析3.大数据技术一站式融合中计算融合指的是以下哪一选项?(1分)A、大数据基础设施上云B、融合多样性的算力,提升整体效率C、批、交互式、流等计算框架共用资源,分时复用D、大数据平台的数据分析智能化以及数据治理的智能化答案:C解析:

暂无解析4.某大数据开发人员在创建Hive表结构时,发现原先创建的表存储格式出现了问题。对于这一现象,以下描述中,错误的是哪一项?(1分)A、不同的存储格式会影响表的处理效率B、必须修正回来,不然会导致数据无法查询C、可以通过alter命令进行修改D、错误的表存储格式会影响10A,D命令加载,导致数据无法正常导入答案:B解析:

暂无解析5.在复杂的大数据集群中,资源的合理分配一直是需要解决的问题。资源分配一般分为两种模式,一种是独占模式,一种是共享模式。以下对该两种模式描述中,正确的是哪一项?(1分)A、共享模式简单,按照配额隔离即可。B、共享模式仅用于需要特殊资源保障的业务。C、独占模式资源利用率高,可以充分利用资源,减少闲置。D、独占模式配额是独占的,不用时无法共享只能闲置。答案:D解析:

暂无解析6.在大数据分析场景中,以下说法哪一项是不正确的?(1分)A、SparkSQL:新型SQL处理引擎,速度比Hive快,处理SQL类的批处理任务B、HDFS:基于大数据的数据仓库平台C、FLink:流批一体式计算引擎D、Hive:类SQL查询,传统批处理引擎,速度较慢答案:B解析:

暂无解析7.某大数据业务人员需针对某些数据创建Hive表结构,其中某个数据为时间类型yyyyMMdd.那么可以使用以下哪一项作为字段类型?(1分)A、varcahrB、stringC、intD、double答案:B解析:

暂无解析8.Kafka的特点包括不包括以下哪一选项?(1分)A、消息持久化B、分布式C、高吞吐D、随机读取答案:D解析:

暂无解析9.关于HBase中的BloomFilter,以下描述中错误的是哪一项?(1分)A、BloomFilter用来优化一些随机读取的场景,即Get场景B、BloomFilter可以被用来快速的判断一条数据在一个大的数据集合中是否存在C、如果BloomFilter判断结果为“该条数据不存在”,这一结果拥有一定的误判率D、HBase的BloomFilter的相关数据,被保存在HFile中答案:C解析:

暂无解析10.HBase中数据存储的文件格式是下面哪一项?(1分)A、HFileB、HLogC、SequenceFileD、TextFile答案:A解析:

暂无解析11.关于ElasticSearch的说法,下列错误的是哪一项?(1分)A、ElasticSearch可以把一个完整的索引分成多个分片B、ElasticSearch可以不需要Zookeeper的支特、C、EsMaster可以临时管理集群级别刷的一些变更D、ElasticSearch可以设置多个索引的副本答案:B解析:

暂无解析12.Hive中的解释器(complier)、优化器(optimizer)、执行器(executor)组件用于HQL语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在()中,并在随后由()调用执行。(1分)A、内存、MapReduceB、HBase、YarnC、HDFS、YarnD、HDFS、Tez答案:A解析:

暂无解析13.以下关于Flink的描述,错误的是哪一项?(1分)A、Flink在维护一次完整的的应用状态时,不能无缝修复错误B、Flink是一个批处理和流处理结合的统一计算框架C、Flink支持大规模运行,在上千个节点运行时有很好的吞吐量和低延迟D、Flink没有单点故障,提供高吞吐量和低延迟的能力答案:A解析:

暂无解析14.Spark中A,Ction算子返回的是以下哪一选项?(1分)A、依赖关系B、DAG图C、RDDD、计算结果或者是写入存储操作答案:D解析:

暂无解析15.以下哪个场景是HDFS适合做的?(1分)A、大量小文件存储B、流式数据访问C、随机写入D、低延迟读取答案:B解析:

暂无解析16.()是一个实现了文件系统的抽象类,继承自org.apache.hadoop.conf.Configured,并实现了Closeable接口,可以适用于多种文件系统。(1分)A、FileSystemB、FSDataOutputStroamC、FSDatalnputStreamD、FileConfiguration答案:A解析:

暂无解析17.下列哪一个选项不是StructuredStreaming支持的sink输出源。(1分)A、HBaseB、ConsoleC、HDFSD、Kafka答案:A解析:

暂无解析18.ElasticSearch数据写入阶段有很多调优方式,下列错误的是哪一项?(1分)A、尽量使用自动生成的idB、禁用wildcardC、写入前副本数设置为0D、写入过程中:采取bulk批量写入答案:B解析:

暂无解析19.以下大数据精准广告发展方向不包括哪一项?(1分)A、平台化B、自动化C、精准化D、价值化答案:A解析:

暂无解析20.Redis中Hash数字类型不含以下哪种操作?(1分)A、hgetallB、hsetC、hmgetD、size答案:D解析:

暂无解析21.数据仓库主要提供以下哪项服务?(1分)A、面向分析B、面向业务应用C、数据管理和分析D、面向事务答案:C解析:

暂无解析22.以下哪一项不属于Hive的数学函数?(1分)A、rand()B、Abs()C、trim()D、round(答案:C解析:

暂无解析23.HBase元数据MetaRegion路由信息保存的位置是下列哪一项?(1分)A、Root表B、HMasteC、ZooKeeperD、Meta表答案:C解析:

暂无解析24.以下关于KeyBy算子的描述,错误的是哪一项?(1分)A、数据类型转换是KeyedStream->DataStreamB、每个分区包含具有相同key的元素C、逻辑地将一个流拆分成不相交的分区D、在内部以hash的形式实现的答案:A解析:

暂无解析25.Loader页面是基于开源()的图形化数据迁移管理工具。单选(1分)A、KettleB、HadoopC、HueD、Sqoop答案:D解析:

暂无解析26.大数据环境下的隐私担忧,主要表现为以下哪个选项?(1分)A、用户画像的生成B、病毒入侵C、个人信息的被识别与暴露D、内存溢出答案:C解析:

暂无解析27.关于HBase,以下描述正确的是哪一项?(1分)A、对于绝大部分企业级大数据平台而言,HBase底层需依赖HDFS存储海量数据B、HBase可轻易实现海量数据的全局A,CID特性C、HBase和Zookeeper不是强绑定的D、HBase无法存储结构稀疏的表格答案:A解析:

暂无解析28.以下哪一项不属于图搜索引擎技术的典型应用场景?(1分)A、通过关系网络,查询关联关系,可用于反洗钱、风控等场景B、根据某人的常用联系人网络,查询其社交关系最密切的有关人员C、基于"人、事、地、物、组织、身份"等点状实体,查询在社会关系网络中的关联关系D、根据历史数据,拟合函数,预测未来手机流量使用趋势答案:D解析:

暂无解析29.关于HBase中HRegionServer的故障处理机制,以下说法中哪一项是错误的?(1分)A、共用日志优点:恢复时需要分拆日志;缺点:提高对表的写操作性能B、根据日志记录所属的Region对象对HLog数据进行拆分,分别放到相应Region对象的目录下C、Zookeeper会实时监测每个HRegionServer的状态,当某个HRegionServer发生故障时,Zookeeper会通知HMasterD、HMaster首先会处理发生故障的HRegionServer上面遗留的HLog文件,这个遗留的HLog文件中包含了来自多个Region对象的日志记录答案:A解析:

暂无解析30.Redis不适用于以下哪个应用场景?(1分)A、获取TOPN操作B、获取PB级Value数据C、获取最新N个数据的操作D、获取手机验证码答案:B解析:

暂无解析31.以下关于Flume的描述,错误的是哪一项?(1分)A、Flume不支持级联(多个Flume对接起来),合并数据的能力B、Flume支持按照用户定制采集数据的能力C、提供实时采集日志信息(taildir)到目的地的能力D、提供从固定目录下采集日志信息到目的地(HDFS,HBase,Kafka)能力答案:A解析:

暂无解析32.以下选项对GES概念描述正确的是()(1分)A、Vertex:节点/顶点,用于表示现实世界中的实体对象B、Edge:边,用于表示关系度C、EdgeLabel:边的标签,用于表示现实世界中的关系类型D、VertexLabel::节点的标签,用于表示现实世界中的实体类型答案:A解析:

暂无解析33.关于HDFS单名称节点体系结构的局限性,以下哪一个选项是错误的?(1分)A、HDFS只设置唯一一个名称节点,一旦这个唯一的名称节点发生故障,会导致整个集群变得不可用B、HDFS只设置唯---一个名称节点,资源和数据可以方便的完成隔离C、HDFS只设置唯-一个名称节点,会带来命名空间的限制D、HDFS只设置唯---一个名称节点,会带来性能的瓶颈和吞吐量的瓶颈答案:B解析:

暂无解析34.大数据与传统数据的区别不包括哪一方面?(1分)A、数据规模B、数据类型C、处理对象D、编程语言答案:D解析:

暂无解析35.StructuredStreaming中持续地查询最新计算结果至写出。这个过程叫做什么?()(1分)A、ContinuousstringB、continousqueryC、mapqueryD、continousphrase答案:B解析:

暂无解析36.Redis中相对于RDB持久化,以下对AOF持久化描述错误的是哪一选项?(1分)A、AOF持久化是用快照的方式实现的B、发生故障时恢复速度慢C、内存占用过多,文件体积大D、占用较多磁盘的10开销答案:A解析:

暂无解析37.实时检索应用场景不包含以下哪一顺?(1分)A、通过用户姓名查找购房记录B、通过用户银行卡号查找转账记录C、通过用户兴趣爱好推荐影视作品D、通过用户身份证号查找住宿记录答案:C解析:

暂无解析38.StructuredStreaming程序执行过程中,定义流计算过程之后是哪一个步骤?(1分)A、创建输入数据源B、导入相关依赖模块C、启动流计算并计算输出结果D、创建SparkSession对象答案:C解析:

暂无解析39.以下哪一选项不是企业级大数据平台的特点?(1分)A、可维护性差B、可平滑拓展C、数据共享D、资源共享答案:A解析:

暂无解析40.Hive架构中有一个Driver模块用于对SQL语句进行转化,那么对于Driver的描述中,正确的是哪一项?(1分)A、Driver中的Compiler负责对HiveQL生成的执行计划和MapReduce任务进行优化B、Driver中的Optimizer负责编译HiveQL并将其转化为一系列相互依赖的Map/Reduce任务。C、Driver中的Executor负责按照任务的依赖关系分别执行Map/Reduce任务D、Driver指Java的JDBC连接所用的Driver类。答案:C解析:

暂无解析多选题(总共30题)1.以下关于Kafka的特点描述,正确的是哪些项?(1分)A、高吞吐B、分布式C、多订阅者D、冗余备份答案:ABCD解析:

暂无解析2.以下关于事件时间的描述,正确的是哪些项?(1分)A、事件时间在事件进入flink之前已经嵌入事件,flink可以提取该时间B、事件时间是指事件在其设备上发生的时间C、基于事件时间进行处理的流程序可以保证事件在处理的时候的顺序性D、基于事件时间的处理往往有一定的滞后性答案:ABCD解析:

暂无解析3.关于HBaseRegion分裂的描述中,以下哪些选项是正确的?(1分)A、Region拆分操作需要消耗大量时间B、拆分过程中的Region是不可读的C、直到分裂过程结束,把存储文件异步地写到独立的文件之后,才会读取新文件D、在RegionSplit时,拆分之后的Regioni读取的仍然是原存储文件答案:BC解析:

暂无解析4.关于GES服务的常见基本概念,以下哪些选项是正确的?(1分)A、GES不存在无向边B、在GES中,点的属性(Property)表示了该顶点的附加信息,采用Keyvalue:结构进行保存C、个人的姓名、年龄、身份证、爱好等信息可以用VertexLA,Bel来表示D、"认识/朋友关系"在图中可以用边来表示答案:ABCD解析:

暂无解析5.以下哪些选项是离线批处理的特点?(1分)A、多个作业调度复杂B、容易产生资源抢占C、处理数据量巨大,PB级D、处理时间要求高答案:ABC解析:

暂无解析6.关于ElasticSearch的基本架构,以下描述中正确的有哪些项?(1分)A、ElasticSearch通过Discovery模块来实现节点自动发现,以及Master节点选取B、ElasticSearch底层基于Lucence,将索引存储在本地文件系统、共享文件系统或HDFS等文件系统中C、ElasticSearch支多种插件来扩展加强功能D、ElasticSearch通过Java以及Restfulapi提供答案:ABCD解析:

暂无解析7.大数据分离架构有以下哪些优势?(1分)A、异构流数据实时处理B、交互式实时查间C、结构化数据快速查询D、复杂计算模型灵活编程接口答案:ABCD解析:

暂无解析8.以下哪些选项是Hive数据仓库分层的优点?(1分)A、隔离原始数据B、复杂问题简单化C、减少重复开发D、清晰数据结构答案:ABCD解析:

暂无解析9.以下哪些选项是Loader组件的特点?()(1分)A、图形化B、高性能C、高可靠D、安全答案:ABCD解析:

暂无解析10.HBaseFilter有以下哪几项?(1分)A、RowFilterB、KeyOnlyFilterC、MFilterListD、SingleColumnValueFilter答案:ABCD解析:

暂无解析11.以下哪些选项是网站日志的特点?(1分)A、价值密度低B、数据的业务种类多C、数据结构复杂D、数据量大答案:ABCD解析:

暂无解析12.Hive支持以下哪些计算引擎?(1分)A、MapReduceB、LoaderC、TezD、Spark答案:ACD解析:

三.判断13.Kafka创建Topic时如何将分区放置到不同的Broker中,请选择正确的顺序()(1分)A、第一个分区的第一个副本放置位置是随机从brokerList选择的B、其他分区的第一个副本放置位置相对于第0个分区依次往后移C、剩余的副本相对干第一个副本放置立置其实是由nextReplicaShift决定的,而这个数也是随机产生的D、副本因子不能大于Broker的个数答案:ABCD解析:

暂无解析14.以下关于Filnk的窗口描述正确的是()。(1分)A、Flink窗口按窗口行为划分:TumblingWindow-SlidingWindow.SessionWindow.B、窗口可以是时间驱动的也可以是数据驱动的。C、我们可以每30秒计算一次最近一分钟用户购买的商品总数,这个就是时间滑动窗口的应用方式。D、会话窗口是将数据聚合到会话窗口中,由非活跃的间隙分隔开。答案:ABCD解析:

暂无解析15.Redis包含以下哪些数据类型?(1分)A、HashB、ListC、StringD、Set答案:ABCD解析:

暂无解析16.以下哪些项属于实时数据处理系统的诉求?(1分)A、吞吐量高B、多数据源支持C、处理速度快D、可靠性高答案:ABCD解析:

暂无解析17.以下关于KafkaPartition说法正确的有哪几项?(1分)A、每个Partition在存储层面对应一个log文件。B、每个Partition都是有序且不可变的消息队列。C、Partition数量决定了每个Consumergroup中并发消费者的最大数量。D、引入Partition机制,保证了Kafka的高吞吐能力。答案:ABCD解析:

暂无解析18.华为企业云数据湖的数据源可以是以下哪些选项?(1分)A、传感器(loT)B、外部数据库C、日志数据库D、关系型数据库答案:ABCD解析:

暂无解析19.StructuredStreaming可以提供以下哪几种类型的保证?(1分)A、OnlyOnceB、AtmostonceC、ExactlyonceD、Atleastonce答案:BCD解析:

暂无解析20.某大数据业务人员因误操作,导致某条Hive的Insert语句执行了多次,使得数据出现了重复的现象,为了避免下次再次出现这种问题,以下哪些操作是可取的?(1分)A、改造SQL语句,添加关键字Overwrite使得数据以覆盖的方式写入B、改造SQL语句,在插入前添加清空操作如truncateC、添加Hive表的唯一索引,保证数据不重复-D、添加权限,使得业务人员只能执行单次插入。答案:CD解析:

暂无解析21.Flink有哪些状态存储方式?(1分)A、MemoryStateBA,CkendB、FsStateBA,CkendC、MySqlStateBA,CkendD、RocksDBStateBA,Ckend答案:ABD解析:

暂无解析22.以下哪些属于大数据的发展趋势?(1分)A、从技术驱动转变为商业驱动B、从统计分析到认知计算C、生态合作开放D、数据处理逐渐标准化、云化答案:ABCD解析:

暂无解析23.StructuredStreaming触发器可以定义的流数据处理的计时,包含以下哪些项?(1分)A、Trigger.Once()一次微批处理所有数据B、Trigger.ProcessingTime("nseconds"),固定间隔时间开启微批处理C、Trigger.Continuous("1second"),连续处理模式D、没有指定触发器设置,默认为查询以微批处理模式执行答案:ABCD解析:

暂无解析24.关于HBase的基本架构,以下描述中正确的有哪些项?(1分)A、在HBase中,每一个Store对应一个ColumnQualifierB、每一次触发Flush都会生成新的HFileC、在HBase中,由HMaster直接管理RegionD、HBase允许多台HRegionServer同时工作答案:ABD解析:

暂无解析25.计算十分钟内的单词,每5分钟更新一次,若程序在11:00开始运行,在12:07收到一个数字,这个数字应该对应于以下哪些窗口的计算()(1分)A、12:05-12:15B、12:10-12:20C、12:00-12:10D、11:55-12:05答案:AC解析:

暂无解析26.以下关于FileChannel的描述中,正确的是哪些项?(1分)A、不同的FileChannel均需要配置多个checkpoint目录B、不同的FileChannel均需要配置一个checkpoint目录C、支持对数据进行持久化D、需要配置数据目录和checkpoint目录答案:ACD解析:

暂无解析27.FIink可以部署在各种资源提供者上,也可以作为裸机硬件上的独立群集,这里的资源提供者可以是()(1分)A、GESB、KubernetesC、YARND、ApacheMesos答案:BCD解析:

暂无解析28.离线批处理的数据来源可以是以下哪些选项?(1分)A、0GG日志流B、日志文件C、批量文件数据D、数据库答案:ABCD解析:

暂无解析29.关于HDFS数据写入流程的描述,以下哪些选项是正确的?(1分)A、在写入流程的最后一步,HDFSClient联系NameNode,确认数据写入完成后,由NameNode持久化元数据B、客户端通过自有协议写入数据到DataNode1,再由DataNode1复制到DataNode2,DataNode3C、HDFSClient需要联系NameNode,由NameNode在元数据中创建文件节点D、业务应用调用writeAPI写入文件答案:ABCD解析:

暂无解析30.关于GES的应用场景,以下哪些选项是正确的?(1分)A、工业:基于知识图谱的设备故障诊断和预警B、物流和网规:最优路径推荐C、金融:实时推荐、实时反欺诈,基于知识图谱的风控(信贷、保险)D、社交分析:寻找特定爱好的好友,或者通过好友的好友,找到用户可能认识的好友答案:ABCD解析:

暂无解析判断题(总共30题)1.华为FusionInsight上的一站式融合分析能力,支持图数据库与图分析算法融合,在金融反欺诈识别,安平的团伙分析等场景非常普遍。(1分)A、正确B、错误答案:A解析:

暂无解析2.向HBase插入数据,只可使用put一种方法。(1分)A、正确B、错误答案:B解析:

暂无解析3.Redis各节点维护Key->Server的映射关系。(1分)A、正确B、错误答案:A解析:

暂无解析4.Event是Flume数据传输的基本单元(1分)A、正确B、错误答案:A解析:

暂无解析5.Flume的Source可以不用和channel关联,直接连接到sink。(1分)A、正确B、错误答案:B解析:

暂无解析6.Hive中MetaStore是用于存储表、列和Partition等元数据。(1分)A、正确B、错误答案:A解析:

暂无解析7.在编写自定义函数时,UDF、UDTF和UDAF继承的类都是一样的。判断(1分)A、正确B、错误答案:B解析:

暂无解析8.Flink核心是一个提供了数据分发以及并行化计算的流数据处理引擎,对无界和有界数据流进行状态计算。(1分)A、正确B、错误答案:A解析:

暂无解析9.FIume不支持对数据进行简单处理,并写到各种数据接受方(可定制)的能力。(1分)A、正确B、错误答案:B解析:

暂无解析10.在HBase中,KeyValue作为承载用户数据的基本单元,需要保存一些对自身的描述信息,例如时间截、版本号等等。那么势必会有一定的结构化空间开销。(1分)A、正确B、错误答案:A解析:

暂无解析11.高频交易,市场舆情分析,信贷风险分析等这些金融领域的研究内容均可以利用大数据技术进行分析。(1分)A、正确B、错误答案:A解析:

暂无解析12.Flume可以在系统中定制各类数据发送方,用于数据收集,同时提供简单的数据处理,并将简单处理的数据写入各种数据接收方,如文本、HDFS、Kafka和HBase.(1分)A、正确B、错误答案:A解析:

暂无解析13.Spark和MapReduce一样不适用于迭代计算。(1分)A、正确B、错误答案:B解析:

暂无解析14.在HBase中存储海量数据,不支持多版本。(1分)A、正确B、错误答案:B解析:

暂无解析15.MapReduce

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论