大数据HCIA试题及参考答案

上传人：r*** IP属地：河南上传时间：2023-07-05 格式：DOCX 页数：18 大小：27.40KB 积分：9.6 举报 版权申诉

已阅读5页，还剩13页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

大数据HCIA试题及参考答案1、以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是？A、仅写入内存B、同时写入磁盘和内存C、先写磁盘再写内存D、先写内存再写磁盘答案：C2、在FusionInsight产品中，关于KafkaTopic，以下描述不正确的有？A、每个Topic只能被分成一个partition（区）B、Topic的partition数量可以在创建时配置C、每个Partition的存储层面对应一个log文件，log文件中记录了所有的信息数据D、每条发布到Kafka的消息都有一个类别，这个类别被称为Topic，也可以理解为一个存储消息的队列答案：A3、HBase的物理存储单元是什么?A、RegionB、ColumnFamilyC、ColumnD、ROW答案：B4、以下哪些选项属于Hive的数据存储模型？A、以上全都正确B、表C、桶D、数据库E、分区答案：A5、Zookeeper的scheme认证方式不包含以下哪项？（）A、digestB、authC、saslD、world答案：C6、Hive中的这条命令“ALTERTABLEemployee1ADDcolumns(column1string);”是什么含义？A、删除表B、增加列C、创建表D、修改文件格式答案：B7、FusionInsightHD的HBase中的一张表包含以下几个Region[10，20），[20，30），[30，+∞]，分别编号为①，②，③，那么，11，20，222分别属于哪个Region?A、①①③B、①②③C、①②②D、①①②答案：C8、FusionInsightHD的HBase中保存一张用户信息表meg_table，Rowkey为用户id，其中一列为用户昵称，现在按先后顺序往这列写入三个KeyValue:001:Li，001:Mary，001:LiLy，请问scan'meg_table'，{VERSIONS=>2}会返回哪几条数据?A、001:LiB、001:LilyC、001:Li，001:Mary，001:LiLyD、001:Mary，001:LiLy答案：D9、Flink中的（）接口用于流数据处理，（）接口用于批处理？A、DataStreamAPI，DataSetAPIB、DatabatchAPI，DataStreamAPIC、StreamAPI，BatchAPID、BatchAPI，StreamAPI答案：A10、关于RDD，下列说法错误的是？A、RDD具有血统机制（Lineage）B、RDD默认存储在磁盘C、RDD是一个只读的，可分区的分布式数据集D、RDD是Spark对基础数据的抽象答案：B11、加载数据到Hive表，哪种方式不正确?A、直接将本地路径的文件load到Hive表中B、将HDFS上的文件load到Hive表中C、Hive支持insertinto单条记录的方法，所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表答案：C12、在fusionlnsight产品中，关于kafka的topic.以下描述不正确的是？A、topic的partition数量可以创建时配置B、每个topic只能被分成一个partition区C、每条发布到kafka的消息都有一个类别，这个类别被称为topi也可以理解为一个存储消息的队列D、每个partition在存储层面对应一个log文件，log文件中记录了所有的消息数据答案：B13、FusionInsightHD产品中，关于Kafka组件部署说法不正确的是?A、Kafka强依赖于ZooKeeper，安装Kafka必须安装ZooKeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色专门进行消息的消费答案：C14、KafkaClusterMirroring工具可以实现以下哪项功能？A、Kafka跨集群数据同步方式B、Kafka单集群内数据备份C、Kafka单集群内数据恢复D、以上全不正确答案：A15、FusionlnsightHD中，如果需要查看当前登录HBase的用户和权限组，可以在HBaseshell中执行什么命令？A、use_permissionB、whoamiC、whoD、get_user答案：B16、以下关于KafkaPartition偏移量的描述不正确的是？A、唯一标记一条消息B、消费者通过offset、partition、topic跟踪记录C、每条消息在文件中的位置称为offset偏移量D、offset是一个String型字符串答案：D17、Spark自带的资源管理框架是?A、YARNB、MesosC、StandaloneD、Docker答案：C18、下列关于SparkStreaming和Streaming比较说法不正确的是？A、SparkStreaming是一个微批处理框架，事件需要积累到一定量时才进行处理B、Streaming的执行逻辑是即时启动，运行完后再回收C、SparkStreaming的吞吐量大约是Streaming的2-5倍D、SparkStreaming事件处理时延比Streaming更高答案：B19、某银行规划的FusionlnsightHD集群有90个节点，如果控制节点规划了3个，那集群中数据节点推荐规划（）个。A、87B、85C、90D、86答案：B20、FusionInsightHD系统中，下面哪个方法不能查看到Loader作业执行的结果？A、通过Yarn任务管理查看B、通过LoaderUI界面查看C、通过Mangaer的告警查看D、通过NodeManager查看答案：D21、HBase不适合哪些应用场景？A、海量数据（TB、PB）应用场景B、高吞吐率应用场景C、要求具有完全ACID特性的应用场景D、半结构化数据应用场景答案：C22、关于FusionInsightHDStreaming的Supervisor描述正确的是？A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务，启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件答案：B23、安装FusionInsightHD的Streaming组件时，Nimbus角色要求安装几个节点（）A、3B、2C、1D、4答案：B24、FusionlnsightManager对服务的管理操作，下面说法错误的是？A、可对服务进行启停重启操作B、可以添加和卸载服务C、可设置不常用的服务隐藏或显示D、可查看服务的当前状态答案：C25、HBase不适合哪些应用场景？（）A、高吞吐率应用场景B、要求具有完全ACID特性的应用场景C、半结构化数据应用场景D、海量数据（TB、PB）应用场景答案：B26、关于Kafka磁盘容量不足的告警，对于可能的原因以下分析不正确的是？A、用于存储Kafka数据的磁盘配置（如磁盘数目、大小等），无法满足当前业务数据流量，导致磁盘使用率达到上限B、数据保存时间配置过长，数据累积达到磁盘使用率上限C、业务规划不合理，导致数据分配不均匀，使部分磁盘达到使用率上限D、Broker节点故障导致答案：D27、关于Hive建表基本操作，描述正确的是?A、创建外部表时需要指定external关键字B、一旦表创建好，不可再修改表名C、一旦表创建好，不可再修改列名D、一旦表创建好，不可再增加新列答案：A28、Flume数据采集过程中，下列选项中能对数据进行过滤和修饰的是？A、SinkB、ChannelSelectorC、InterceptorD、Channel答案：C29、下列选项中，关于Zookeeper可靠性含义说法正确的是？A、可靠性通过主备部署模式实现B、可靠性是指一条消息被一个server接收，它将被所有server接受C、可靠性是指无论哪个server，对外展示的均是同一个视图D、可靠性是指更新只能成功或者失败，没有中间状态答案：B30、创建Loader作业中，可以在以下哪个步骤中设置过滤器类型？A、输入设置B、基本信息C、输出D、转换答案：A31、RDD有Transformation和Action算子，下列属于Action算子的是？A、saveAsTextFileB、reduceByKeyC、mapD、filter答案：A32、在Fusionlnsight集群规划部署时，建议管理节点最好部署（）个，控制节点最少需要部署（）数据节点最少需要部署（）个。A、1,2,2B、1,3,2C、2,3,1D、2,3,3答案：D33、对于容量调度器的任务选择，以下说法正确的是（）A、资源利用量最低的队列优先B、资源回收请求队列优先C、最大队列层级优先D、最小队列层级优先答案：B34、以下关于kafkapartition偏移量的描述不正确的是？（）A、offset是一个String型字符串B、每条消息在文件中的位置称为offset（偏移量）C、唯一标记一条消息D、消费者通过（offset、partition、topic）跟踪记录答案：A35、FusionInsightManager不能够管理哪个对象?A、SparkB、主机OSC、YARND、HDFS答案：B36、spark的核心模块是？A、sparksqlB、sparkcoreC、mapreduceD、sparkstreaming答案：B37、下列选项中，关于Zookeeper可靠性含义说法正确的是？（）A、可靠性通过主备部署莫属实现B、可靠性是指更新只能成功或者失败，没有中间状态C、可靠性是指无论哪个Server。对外展示的均是同一个视图D、可靠性是指一条消息被一个Server接收，它将被所有Server接受答案：D38、Flink的数据转换操作在以下哪个环节中完成？A、channelB、sinkC、sourceD、transformation答案：D39、关于FusionInsightManager关键特性或操作说法正确的是?A、能够针对整个集群或者某个服务进行健康检查，不能够针对某个节点进行健康检查B、Manager引入角色的概念，采用RBAC的方式对系统进行权限管理C、整个系统使用Kerberos管理用户，使用LDAP进行用户认证，通过CAS实现单点登录D、对于健康检查结果，不能够导出检查报告，只能够在线查看答案：B40、FusionInsightHD系统审计日志不可以记录下面哪些操作?A、手动清除告警B、启停服务实例C、删除服务实例D、查询历史监控答案：D41、HDFS不适用以下哪些场景（）A、大文件存储与访问B、大量小文件存储C、随机写入D、流式数据访问答案：BC42、以下选项中，属于HDFS架构关键特性的是？A、多方式访问机制B、健壮机制C、HA高可靠性D、元数据持久化机制答案：ABCD43、华为FusionInsightHD行业成功案例都有哪些？()A、智慧园区B、数字政府C、智慧交通D、金融答案：ABCD44、大数据分析相关技术主要特征包括?A、基于海量数据为基础B、数据背后事件关联性分析C、基于精确样本为基础D、机器学习，全量特征答案：ABD45、ZKFC进程部署在hdfs中的以下那个节点上？A、activenamenodeB、standbynamenodeC、datanodeD、以上全部不对答案：AB46、Hbase中的以下哪种场景会触发Flush操作？A、Region中MemStore的总大小，达到了预设的FlushSize阈值B、Hbase定期刷新Memstore，默认周期为1小时C、当Wals中的文件数量达到阈值时D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小答案：ABCD47、Flink支持的时间操作类型包括以下哪些选项？A、事件时间B、处理时间C、采集时间D、结束时间答案：ABC48、以下哪些是Kafka实际的应用场景A、资源管理B、日志收集C、网站活性跟踪D、聚合统计系统运营数据答案：CD49、下列选项中，哪些是MapReduce一定会有的过程？A、CombineB、MapC、ReduceD、Partition答案：BCD50、以下哪些数据源可以通过loader实现与FusionInsightHD的数据交换？（）A、MySQLB、NoSQLC、FTPServerD、SFTPServer答案：ABCD51、以下关于华为大数据解决方案说法正确的是（）A、GaussDB是一款开源数据库产品B、FusionInsightHD是基于开源大数据软件Hadoop的增强版本C、Farmer是数据服务框架D、FusionInsightManager是一个分布式系统管理框架，管理员可以通过多接入点操控分布式集群答案：ABCD52、以下属于Streaming特点的是？A、可做连续查询B、属于事件驱动C、延迟低D、数据先存储再计算答案：ABC53、关于大数据的主要特征理解和描述正确的有?A、数据的价值密度较低B、增长速度快，处理速度快C、来源多，格式多D、存储量大，计算量大答案：ABCD54、FusionInsightHDLoader可以将HDFS数据导出到以下哪些目标端?A、SFTP服务器B、FTP服务器C、Oracle数据库D、DB2数据库答案：ABCD55、Flume适用于以下哪些场景的数据收集？A、大量数据的定时数据采集B、本地数据数据采集C、Thrift/Avro/Syslog/Kafka等数据源上收集数据D、应用系统产生的日志采集答案：ABCD56、HDFS系统中对备用NameNode的作用的描述正确的有？A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志，减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点答案：AC57、下列属于Flume数据监控的指标是？A、Sink写入数据量B、DataNode数量C、Source接受数据量D、Channel缓存的数据量答案：ACD58、华为FusionInsightHD行业成功案例都有哪些？A、数字政府B、智慧园区C、智慧交通D、金融答案：ABCD59、Loader可以实现以下哪些转换规则（）A、长整型时间转换B、增量转换C、空值转换D、拼接转换答案：ABCD60、Flume进程级联时，以下哪些sink类型用于接收上一跳Flume发送过来的消息？A、AvrosinkB、ThriftsinkC、HivesinkD、Nullsink答案：AB61、Streaming消息可靠性级别包括以下哪些选项？A、完全处理B、最多一次C、精确一次D、至少一次答案：BCD62、Hadoop集群规模很大时，数据的分布情况会非常关键，用户需要根据数据分布情况，决定集群是否扩容，数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有（）A、帮助用户迅速找到资源消耗最高的节点，采用适当的措施B、通过每个服务主页的资源分布查看界面，查看到关键的资源分布情况C、可以帮助用户快速聚集在最关键的资源消耗上D、通过DashBoard界面，可以查看到主机资源分布情况。例如内存占有率在50-75%的主机列表，并提供链接跳转答案：ABCD63、FusionInsightManager的主要功能有以下哪些？A、数据集成B、系统管理C、安全管理D、服务治理答案：BCD64、以下哪些选项属于FusionInsightSparkSQL的优点。A、以上全都正确B、稳定和高性能C、SQL兼容性D、长稳测试E、支持数据插入，更新和删除答案：ABCDE65、Flink流式处理的数据源类型包括？A、CollectionsB、JDBCC、SocketstreamsD、Files答案：ABCD66、以下哪些选项属于FusionInsight数据安全性。A、用户权限认证管理B、组件数据加密C、操作系统安全加固D、数据完整性校验答案：BD67、以下关于HBase存储模型的描述正确的是？（）A、每一个KeyValue都拥有一个Qualifier标识B、同一个key值key关联多个valueC、KeyValue中拥有时间戳、类型等关键信息D、即使是key值相同，Qualifier也相同的多个KeyValue，也可能有多个，此时使用时间戳来区分答案：ABCD68、以下属于hiveSQL中DDL（数据定义语言）的是？（）A、修改表B、删除表C、建表D、数据导入答案：ABC69、传统数据处理的性能瓶颈有？A、批量数据处理缺失B、流式数据处理性能不足C、数据存储成本高D、扩展能力有限答案：CD70、大数据商业咨询服务方案在规划环节主要考虑以下哪些设计？A、场景分解和业务设计B、大数据商业模式设计C、商业场景全景规划D、典型场景需求设计答案：ABCD71、FusionInsightManager支持多租户统一管理。()A、正确B、错误答案：A72、FusionInsightHD系统中，HBase支持动态扩展列。（）A、正确B、错误答案：A73、SparkStreaming计算基于DStream，将流式计算分解成一系列短小的批处理作业。A、正确B、错误答案：A74、FusionInsightHD系统中一个集群可以管理多个服务，每个服务可以管理多个角色，每个角色只能管理一个实例。A、正确B、错误答案：B75、HDFS存储数据时，关键数据根据实际业务需要保存在具有高度可靠性的节点中，通过参数修改DataNode的存储策略，系统可以将数据强制保存在指定的节点组中。A、正确B、错误答案：A76、Spark的中间数据放在内存中，对于迭代运算/批处理计算的效率更高，延迟更高。A、正确B、错误答案：B77、在ZooKeeper的服务模型中，Leader节点以主备模式存在，其他节点都属于Follower节点。()A、正确B、错误答案：B78、RDD可以从Hadoop兼容的文件系统生成，生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A、正确B、错误答案：A79、YARN上有两个同级队列Q1与Q2，容量都是50，Q1上已经有10个任务共占用了40的容量，Q2上有2个任务共占用了30的容量，那么由于Q1的任务数多，调度器会优先将资源分配给QA、正确B、错误答案：B80、在Streaming中，消息可靠性级别中精确一次是通过ACK机制来实现的。A、正确B、错误答案：B81、通常情况下，Hive以文本文件存储的表会以回车作为其行分隔符，在华为FusionInsightHive中，可以指定表数据的输入和输出格式处理类。（）A、正确B、错误答案：A82、FusionInsightHD的Streaming对于Zookeeper弱依赖，即使Zookeeper故障Streaming也可以正常提供服务。A、正确B、错误答案：B83、FusionInsightHD管理节点提供双机HA机制，主节点故障之后，主备节点需要手动实现Failover。A、正确B、错误答案：B84、FusionInsight集群组网设计中，二层组网指集群内二层交换，集群节点在一个子网里，适用节点小于200的集群场景。A、正确B、错误答案：A85、SparkSQL表中，经常会存在很多小文件（大小远小于HDFS块大小），在这种情况下，Spark会启动更多的Task来处理这些小文件，当SQL逻辑中存在Shuffle操作时，会大大增加hash分桶数，从而严重影响性能。A、正确B、错误答案：B86、使用配置规划工具对FusionInsightHDV100R002C50集群进行规划时，可以用V100R2002C60版本的配置规划工具来规划。A、正确B、错误答案：B87、Hbase的最小处理单元是Reg

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据HCIA试题及参考答案

文档简介

温馨提示

最新文档

评论

大数据HCIA试题及参考答案

文档简介

温馨提示

最新文档

评论

相关文档