大数据HCIA复习试题及答案

上传人：喝*** IP属地：广西上传时间：2024-12-27 格式：DOCX 页数：50 大小：1.03MB 积分：30 举报 版权申诉

已阅读5页，还剩45页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第页大数据HCIA复习试题及答案1.Flume数据采集过程中,下列选项中能对数据进行过滤和修饰的是()A、ChannelB、ChannelSelectorC、InterceptorD、Sink【正确答案】：C2.在FusionInsight产品中,关于创建Kafka的Topic,以下哪些描述是正确的?A、在创建Kafka的Topic时,必须设置Partition个数B、创建Kafka的Topic时,必须设置Partition副本个数C、设置多副本可以增强Kafka服务的容灾能力D、以上全都正确【正确答案】：C3.下面关于Zookeeper的特性描述错误的是?A、户端所发送的更新会按照他们被发送的顺序进行应用B、条消息要被超过半数的Server接收,他将可以成功写入磁盘C、消息更新只能成功或失败,没有中间状态D、Zookeeper节点数必须为奇数个【正确答案】：D4.SparkStreaming计算基于DStream,将流式计算分解成一系列短小的批处理作业。()A、TRUEB、FALSE【正确答案】：A5.部署FusionInsightHD时,同一集群内的FlumeServer节点建议至少部署几个?A、1B、2C、3D、4【正确答案】：B6.kafkalogssegment文件命名规则是partion全局的第一个segment从0开始,后续每个segment文件名为上一个全局partion的最大offset(偏移message数)。

()A、TRUEB、FALSE【正确答案】：A7.FusionlnsightHadoop集群中,在某节点上通过df-hT查询,看到的分区包含以下几个:

/var/log

/srv/BigData

/srv/BigData/hadoop/data5

/srv/BigData/solr/solrserver3

/srv/BigData/dbdataom

这些分区所对应磁盘最佳Raid级别的规划组合是?A、Raid0Raid1Raid0Non-Raid1B、Raid1Raid1Non-RaidNon-RaidRaid1C、Raid0Raid0Raid0Raid0Raid0D、Non-RaidNon-RaidNon-RaidNon-RaidRaid1【正确答案】：B8.FusionInsightHD中使用HBase进行数据读取服务时需要连接HMasterA、对B、错【正确答案】：B9.对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求A、trueB、false【正确答案】：A10.下图所示的Map阶段,是描述哪个过程?

A、PartitionB、SortC、Splill/MergeD、combine【正确答案】：D11.FusionInsightHD集群三层组网时,管理节点、控制节点、数据节点建议安装在不同的网段内,可以提高可靠性。A、正确B、错误【正确答案】：A12.以下关于ZooKeeper关键特性中的原子性说法正确的是A、客户端发送的更新会按照他们被发送的顺序进行应用B、更新只能全部完成或失败,不会部分完成C、一条消息被一个server接收,将被所有server接收D、集群中无论哪台服务器,对外展示的均是同一视图【正确答案】：B13.Yarn-client和Yarn-cluster主要区别是ApplicationMaster进程的区别()A、TRUEB、FALSE【正确答案】：A14.kafka是一个高吞吐、分布式、基于发布订阅的消息系统,利用kafka技术可在廉价PCServer上搭建起大规模消息系统。()A、TRUEB、FALSE【正确答案】：A15.在FusionInsight产品中,关于KafkaTopic,以下描述不正确的有?A、每个Topic只能被分成一个partition(区)B、Topic的partition数量可以在创建时配置C、每个Partition的存储层面对应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的消息都有一个类别,这个类别被称为Topic,也可以理解为一个存储消息的队列【正确答案】：A16.FusionlnsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、Nodemanager【正确答案】：D17.SparkSQL表中,经常会存在很多小文件(大小远小于HDFS块大小),在这种情况下,Spark会启动更多的Task来处理这些小文件,当SQL逻辑中存在Shuffle操作时,会大大增加hash分桶数,从而严重影响性能。A、对B、错【正确答案】：B18.FusionlnsightHD使用HBase客户端批量写入10条数据,某个RegionServer节点上包含该表的2个Region,分别A和

B,10条数据中有两条属于

A,4条属于

B,请问写入这10条数据需要向该RegionServer发送几次RPC请求?A、1B、2C、3D、4【正确答案】：A19.在FusionInsightHD中,创建Loader作业的进行数据转换的正确步骤是()A、加载、转换、输出B、输入设置、转换、输出C、加载、转化、抽取D、抽取、转换、输出【正确答案】：B20.Kafka所有消息都会被持久化到硬盘中,同时Kafka通过对TopicPartition设置Replicetion来保障数据可靠。A、TRUEB、FALSE【正确答案】：A21.哪个模块是负责FusionInsightManager用户数据存储的?A、CASB、AOS

C、KerberosD、LDAP

【正确答案】：D22.Solr创建Collection时,推荐选用路由算法为compositldRouter,那么该Collection可以拓展shard。A、正确B、错误【正确答案】：B23.Hadoop系统中,如果HDFS文件系统的备份因子是3,那么MapReduce每次运行Task都要从3个有副本的机器上传输需要处理的文件段。A、对B、错【正确答案】：B24.FuskmlnsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案适合什么样的场景?A、30节点以下B、100节点以上C、100-200节点D、200节点以上【正确答案】：A25.HDFS支持大文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。A、正确B、错误【正确答案】：B26.FusionInsightHD中Loader作业提交到YARN后,作业不能手动停止。A、对B、错【正确答案】：B27.传统数据处理的数据规模的单位是?A、TBB、EBC、PBD、GB【正确答案】：D28.以下关于HiveSQL基本操作描述正确的是()A、加载数据到Hive时源数据必须是HDFS的一个路径B、创建外部表必须要指定location信息C、创建表时可以指定列分隔符D、创建外部表使用external关键字。创建普通表需要指定internal关键字【正确答案】：C29.如果YARN集群中只有Default、QueueA和QueueB子队列,那么允许将他们的容量分别设置为60%、25%、22%。A、对B、错【正确答案】：B30.FusionInsightHD平台中,HBase暂不支持二级索引A、对B、错【正确答案】：B31.下列哪个不是HBase读取数据流程中涉及的角色或服务?()A、HDFSB、ZookeeperC、HMasterD、HRegionServer【正确答案】：C32.HBase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪里的?A、ZookeeperB、HDFSC、MasterD、meta表【正确答案】：A33.查看Kafka的某Topic的partition详细信息时,使用如下哪个命令?A、bin/kafka-topic.sh–createB、bin/kafka-topic.sh--listC、bin/kafka-topic.sh--describeD、bin/kafka-topic.sh--delete【正确答案】：C34.Zookeeper在分布式应用中的主要作用不包括一下哪些选项?A、选举Master节点B、保证各节点上数据的一致性C、分配集群资源D、存储及群中服务器信息【正确答案】：C35.FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点小于200的集群场景。A、正确B、错误【正确答案】：A36.Flume传输数据的过程中,Sink取走数据并写入目的地后,会将events从channel中删除。A、对B、错【正确答案】：A37.FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给角色配置权限C、给用户组配置角色D、给用户组配置权限【正确答案】：D38.关于FusionlnsightHD中Loader作业描述正确的是?A、Loader将作业提交到Yam执行后,如果此时Loader服务异常,则此作业执行失败。B、Loader将作业提交到Yam执行后,如果某个Mapper任务执行失败,能够自动进行重试C、Loadet作业执行失败后将会产生垃坝数据,需要用户手动清除D、Loader将一个作业提交至Yam执行后,该作业执行完成前,不能再提交其他作业【正确答案】：B39.FusionlnsightHD系统中HDFS的Block默认保存几份?A、3份B、2份C、1份D、不确定【正确答案】：A40.驱动型Source是flume周期性主动去获取数据。()A、TRUEB、FALSE【正确答案】：B41.以下哪类数据不属于半结构化数据?A、HTMLB、XMLC、二维表D、JSON【正确答案】：C42.Kafka作为一个分布式消息系统,支持在线和离线消息处理,并提供了javaAPI以便其他组件对接使用,在FusionInsight解决方案中,Kafka属于FusionInsightHD模块。A、TrueB、False【正确答案】：A43.FusionInsightHD中loader从SFTP服务器导入文件时,不需要做编码转换和数据转换且速度最快的文件类型是以下哪项?()A、sequence_fileB、text_fileC、binary_fileD、graph_file【正确答案】：C44.FusionInsightHD系统审计日志不可以记录下面哪些操作()A、删除服务实例B、启停服务实例C、手动清除告警D、查询历史监控【正确答案】：D45.Flink与SparkStreaming类似,属于事件驱动型实时流系统A、对B、错【正确答案】：B46.Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application【正确答案】：D47.HBase的主Master是如何选举的?A、随机选取B、由RegionServer进行裁决C、通过Zookeeper进行裁决D、HMaster为双主模式,不需要进行裁决【正确答案】：C48.FusionInsightHD系统中,HBase支持动态扩展列。()A、TRUEB、FALSE【正确答案】：A49.关于FusionInsightHD安装流程正确的是?A、安装Manager->执行preinstall->LLD工具进行配置->安装集群->安装后检查->安装后配置B、LLD工具进行配置->执行preinstall->安装Manager->安装集群->安装后检查->安装后配置C、安装Manager->LLD工具进行配置->执行preinstall->安装集群->安装后检查->安装后配置D、LLD工具进行配置->执行preinstall->安装集群->安装Manager->安装后检查->安装后配置【正确答案】：B50.Hive是基于hadoop的数据仓库软件,可以查询和管理PB级别的分布式数据。以下关于Hive特性的描述不正确的是?()A、仅支持MapReduce计算引擎B、易用易编程C、可直接访问HDFS文件以及HBaseD、灵活方便的ETL(extract/transform/load)【正确答案】：A51.Spark任务的每个stage可划分为job,划分的标记是shuffle。A、正确B、错误【正确答案】：B52.kafkaProducer读数据总体流程是,Producer连接任意存活的Broker,请求指定topic、partition的leader元数据信息,然后直接与对应的Broker直接连接,发布数据。()A、TRUEB、FALSE【正确答案】：A53.sparkStreaming容错机制是指RDD中任意的partition出错,都可以根据其父

RDD重新计算生成,如果父RDD丢失,则需要去磁盘中查找原始数据。()A、TRUEB、FALSE【正确答案】：B54.下列哪个命令是删除文件的?()A、dfs-clearB、dfs-delC、dfs-rmD、dfs-ls【正确答案】：C55.关于Hive建表的基本操作,描述正确的是?A、创建外部表的时需要指定external关键字B、一旦表创建好,不可再修改表名C、一旦表创建好,不可再修改列名D、一旦表创建好,不可再增加新列【正确答案】：A56.以下关于HBase二级索引的描述哪一项是正确的()A、二级索引把要查找的列与rowkey关联成一个索引表B、此时列成新的rowkey,原rowkey成为valueC、二级索引查询了2次D、以上全都正确【正确答案】：D57.下图为Spark&MapReduce的性能对比数据,可以得出结论,与MapReduce计算相比,Spark用___的资源,获得___倍性能?A、1/8,3B、1/10,3C、1/10,4D、1/8,4【正确答案】：B58.FusionInsightHD产品中,一个典型的Kafka集群包含若干Producer,若干Borker,若干Consumer和一个Zookeeper集群A、TrueB、False【正确答案】：A59.下面哪些场景不是Flink组件擅长的?()A、批处理B、迭代计算C、数据存储D、流处理【正确答案】：C60.华为FusionInsightHD系统中关于HDFS的DataNode的说法正确的是?A、不会检查数据的有效性B、周期性地将本节点的Block相关信息发送给NameNodeC、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的【正确答案】：B61.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,不会保存消息。A、对B、错【正确答案】：B62.fusioninsightmanager不能够管理哪个对象?A、sparkB、主机OSC、yarnD、HDFS【正确答案】：B63.topology在任务完成后会自动结束运行。()A、TRUEB、FALSE【正确答案】：B64.在有N个节点FusionInsightHD集群中部署HBase时,推荐部署()个HMaster进程,()个

RegionServer进程A、3,NB、N,NC、2,ND、2,2【正确答案】：C65.HDFS的Client写入文件时,数据的第一副本写入位置由NameNode确定,其他副本的写入位置由DataNode确定。A、对B、错【正确答案】：A66.FusionlnsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在HBaseshell中执行什么命令?A、use_permissionB、whoamiC、whoD、get_user【正确答案】：B67.FusionInsightSparkSQL同社区SparkJDBCServer一样,只支持单租户绑定到一个YARN资源队列多租户,并不支持多租户并行执行。A、TRUEB、FALSE【正确答案】：B68.Zookeeper的scheme认证方式不包含以下哪项?()A、saslB、authC、digestD、world【正确答案】：A69.如果某些Container的物理内存利用超过了配置的内存阈值,但所有Container的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的Container仍可以继续运行。()A、TRUEB、FALSE【正确答案】：A70.kafka集群在运行期间,直接依赖于下面那些组件?()A、ZookeeperB、HDFSC、SparkD、HBase【正确答案】：A71.Flink采用checkpoint机制保障应用程序运行中的容错性。A、TRUEB、FALSE【正确答案】：A72.HDFS中Namenode的主备仲裁,是由哪个组件控制的A、HDFSClientB、NodeManagerC、ResourceManagerD、ZooKeeperFailoverController【正确答案】：D73.在Streaming中,消息可靠性级别中精确一次是通过ACK机制来实现的。A、TRUEB、FALSE【正确答案】：B74.FusionInsightHD系统中,下面哪个方法不能查看到Loader作业执行的结果?A、通过Yarn任务管理查看B、通过LoaderUI界面查看C、通过Mangaer的告警查看D、通过NodeManager查看【正确答案】：D75.KafkaClusterMirroring工具可以实现以下哪项功能?A、Kafka跨集群数据同步方式B、Kafka单集群内数据备份C、Kafka单集群内数据恢复D、以上全不正确【正确答案】：A76.HDFS的NameNode节点主备状态管理及元数据文件合并分别由哪两个角色负责?A、ZKFC和备NameNodeB、主NameNode和备NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode【正确答案】：A77.Hadoop的HBase不适合哪些数据类型的应用场景?A、大文件应用场景B、海量数据应用场景C、高吞吐率应用场景D、半结构化数据应用场景【正确答案】：A78.以下哪个不属于Hadoop中MapReduce组件的特点?A、易于编程B、良好的拓展性C、实时计算D、高容错性【正确答案】：C79.FusionlnsightManager对服务的管理操作,下面说法错误的是?A、可对服务进行启停重启操作B、可以添加和卸载服务C、可设置不常用的服务隐藏或显示D、可查看服务的当前状态【正确答案】：C80.硬件故障被认为是常态,为了解决这个问题,HDFS设计了副本机制。默认情况下,一份文件,HDFS会存()份?A、2B、4C、3D、5【正确答案】：C81.在Flink中,checkpoint机制能够保证应用在运行过程中出现失败时,从某一个检查点恢复,在此过程中,流快照是根据数据流入顺序依次创建的。A、TrueB、False【正确答案】：A82.HBase中MOB数据直接HFile的格式存储在HDFS上,然后把这个文件的地址信息及大小信息作为value存储在管理HBase的store上,通过工具集中管理这些文件。这样就可以大大降低HBase的compation和split频率,提升性能。A、TRUEB、FALSE【正确答案】：A83.HBase中Region的物理存储单元是什么A、RegionB、ColumnFamilyColumnD、Row【正确答案】：B84.Spark和Hadoop都不适用于迭代计算的场景。A、对B、错【正确答案】：B85.Hadoop系统中YARN分配给Container的内存大小,可以通过参数yarn.app.mapreduce.am.resource.mb来设置A、对B、错【正确答案】：B86.YRAN的基于标签调度,是对下列选项中的哪个进行标签化?APPMasterB、ResourceManagerContainerD、NodeManager【正确答案】：D87.SoIrCloud模式是集群模式,在此模式下Solr服务器强依赖于以下哪个服务?A、HBaseB、HDFSC、ZooKeeperD、Yarn【正确答案】：C88.Hive中“Groupby”指的是通过一定的规则将每一个数据集划分成若干个小的数据集,然后针对若干个小的数据集进行数据分组处理A、TrueB、False【正确答案】：A89.用户权限管理基于角色的访问控制(RBAC),提供可视化的多组统一的集群中用户权限管理。A、trueB、false【正确答案】：A90.Hive在load时是不检查数据是否符合schema的,hive遵循的是schemaonread(读时模式),只有在读的时候hive才检查、解析具体的数据字段、schema。

()A、TRUEB、FALSE【正确答案】：A91.Flink适用于高并发处理数据、毫秒级时延的应用A、TrueB、False【正确答案】：A92.KafkaClusterMirroring工具可以实现以下哪些功能?A、Kafka跨集群数据同步方案B、Kafka单集群内数据备份C、Kafka但集群内数据恢复D、以上全不正确【正确答案】：A93.以下哪一项不属于创建Loader作业时必选项?A、名称B、连接C、类型D、优先级【正确答案】：D94.FusionInsightManager对服务的配置功能说法不正确的是?A、服务级别的配置可对所有实例生效B、实例级别的配置只针对本实例生效C、实例级别的配置对其他实例也生效D、配置保存好需要重启服务才能生效【正确答案】：C95.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点A、3B、2C、4D、1【正确答案】：B96.Spark是以下哪种编程语言实现的?A、CB、C++C、JAVAD、Scala【正确答案】：D97.

FusionInsightHD的Streaming对于Zookeeper弱依赖,即使Zookeeper故障,Streaming可以正常提供服务。A、对B、错【正确答案】：B98.关于RDD,下列说法错误的是?A、RDD具有血统机制(Lineage)B、RDD默认存储在磁盘C、RDD是一个只读的,可分区的分布式数据集D、RDD是Spark对基础数据的抽象【正确答案】：B99.Hadoop的NameNode用于存储文件系统的元数据。A、正确B、错误【正确答案】：A100.下列哪个命令是从HDFS下载目录/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put【正确答案】：C101.使用Hbase客户端批量写入10条数据,某个HRegionServer节点上包含该表的2个Region,分别为A和B,10条数据中有6条属于

A,4条属于

B,请问写入这10条数据需要向该HRegionServer发送几次RPC请求?A、2B、1C、6D、10【正确答案】：B102.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点()A、3B、2C、1D、4【正确答案】：B103.Flink是一个批处理和流处理结合的统一计算框架,其核心是一个数据分发以及并行化计算的流数据处理引擎。A、对B、错【正确答案】：A104.Zookeeper的scheme认证方式不包括以下哪项?()A、authB、saslC、digestD、world【正确答案】：B105.flume架构中,一个Source可以连接多个channel。()A、TRUEB、FALSE【正确答案】：A106.spark的核心模块是?A、sparkstreamingB、sparkcoreC、mapreduceD、sparksql【正确答案】：B107.SparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。A、TRUEB、FALSE【正确答案】：B108.Hadoop中哪个模块负责HDFS的数据存储?A、NameNodeB、DataNodeC、ZooKeeperD、JobTraoker【正确答案】：B109.在Flink技术架构中,()是流处理和批处理的计算引擎A、Standalone

B、RuntimeC、DataStreamD、FlinkCore

【正确答案】：B110.在Flink的运行流程中,负责申请资源的角色是?A、ResourceManagerB、JobManagerClientD、TaskManager【正确答案】：B111.关于FusionInsightHDStreaming的Supervisor描述正确的是?A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件。【正确答案】：B112.下列选项中,关于Zookeeper可靠性含义说法正确的是?()A、可靠性通过主备部署莫属实现B、可靠性是指更新只能成功或者失败,没有中间状态C、可靠性是指无论哪个Server。对外展示的均是同一个视图D、可靠性是指一条消息被一个Server接收,它将被所有Server接受【正确答案】：D113.SparkOnYarn模式下的driver只能运行在客户端。A、对B、错【正确答案】：B114.以下关于Flink关键特性描述不正确的是?A、SparkStreaming与Flink相比,时延更低B、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能C、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量D、checkpoint实现了Flink的容错【正确答案】：A115.YARN上有两个同级队列Q1与Q2,容量都是50%,Q1上已经有10个任务共占用了40的容量,Q2上有两个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。A、对B、错【正确答案】：B116.以下哪些选项属于FusionInsightSparkSQL的优点?A、支持数据插入、更新和删除B、长稳测试C、以上全都正确D、稳定和高性能SQL兼容性【正确答案】：C117.当Zookeeper集群的节点数为5节点时,请问集群的容灾能力和多少节点是等价的?A、3B、4C、6D、以上都不是【正确答案】：C118.二级索引为hbase提供了按照某些列的值进行索引的能力,二级索引先查索引表,再定位到数据表中的位置,不用全表扫描A、trueB、false【正确答案】：A119.Streaming主要通过Zookeeper提供的以下哪项服务实现事件侦听?()A、分布式锁机制B、ACKC、WatcherD、Checkpoint【正确答案】：C120.假设HDFS在写入数据时只存2份,那么在写入过程中,HDFSClient先将数据写入DataNode1,再将数据写入DataNode2。()A、TRUEB、FALSE【正确答案】：B121.ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源。A、TRUEB、FALSE【正确答案】：A122.flume传输数据的可靠性是指flume在传输数据过程中,当下一跳的flume节点故障或者数据接收异常时,可以自动切换到另外一路上继续传输。()A、TRUEB、FALSE【正确答案】：A123.Spark应用在运行时,Stage划分的依据是什么?A、taskB、taskSetC、actionD、shuffle【正确答案】：D124.下图为HDFS分级存储的配置,如果block的副本数为4,则以下说法错误的是?()A、4个block都将写入RAM_DISKB、如果是第1个副本之外的其它副本写入失败,则尝试写入“副本的备选存储策略”指定的存储类型C、第1个block副本将写入RAM_DISK,其余副本写入DISKD、如果第1个block副本写入RAM_DISK失败,则尝试写入“备选存储策略”指定的存储类型【正确答案】：A125.以下关于Hbase中HregionServer的功能描述哪些是不正确的A、RegionServer一般与HDFS集群的NameNode部署在一起,实现数据的存储功能B、Hbase的数据处理和计算单元C、RegionServer是Hbase的数据服务进程,负责处理用户数据的读写请求D、管理所有的Region,Region可以在RegionServer之间迁移【正确答案】：B126.FusionlnsightHD系统中,LDAP数据同步方式是哪个?A、单向同步B、双向同步C、隔离不同步D、数据交叉同步【正确答案】：A127.SparkStreaming相比Storm具备更高的实时性。A、对B、错【正确答案】：B128.kafkaConsumer写数据总体流程是,Consumer连接指定TopicPartition所在的LeaderBroker,用于主动获取方式从kafka中获取消息。()A、TRUEB、FALSE【正确答案】：A129.hive支持普通视图和物化视图。()A、TRUEB、FALSE【正确答案】：B130.colocation(同分布)文件级的同分布实现文件的快速访问,避免了因数据搬迁带来的大量网络开销。()A、TRUEB、FALSE【正确答案】：A131.HBase的BloomFilter是用来过滤数据的。()A、TRUEB、FALSE【正确答案】：B132.FusionInsightHD产品中,关于Kafka的说法不正确的是?A、Kafka强依赖于ZookeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色进行消息的消费【正确答案】：B133.FusionInsightHD管理节点提供双机HA机制,主节点故障后,主备节点需要手动实现Failover。A、正确B、错误【正确答案】：B134.HDFS中的主备仲裁,是由哪个组件控制的?A、ZooleeperFailoverControllerB、NodeManagerC、ResourceManagerD、HDFSClient【正确答案】：A135.下图展示的flume架构,主要应用于集群外的数据导入到集群内。()A、TRUEB、FALSE【正确答案】：A136.关于Hive与Hadoop其他组件的关系。以下描述错误的是?A、Hive最终将数据存储在HDFS中B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务D、Hive对HBase有强依赖【正确答案】：D137.Spark自带的资源管理框架是?A、StandaloneB、MesosC、YARNDocker【正确答案】：B138.Hadoop中MapReduce组件擅长处理哪种场景的计算任务?A、迭代计算B、离线计算C、实时交互计算D、流式计算【正确答案】：B139.下面关于Zookeeper特性的描述错误的是?()A、Zookeeper节点数必须为奇数个。B、客户端所发送的更新会按照它们被发送的顺序进行应用。C、消息更新只能成功或者失败,没有中间状态。D、一条消息要被超过半数的Server接收,它将可以成功写入磁盘【正确答案】：A140.Spark是基于内存的计算引擎,所有Spark程序运行过程中的数据只能存储在内存中A、对B、错【正确答案】：B141.在MapReduce编程中,代码不仅要描述做什么,还要描述具体怎么做。()A、TRUEB、FALSE【正确答案】：B142.FusionInsight中Hive包含2个角色,HiveServer和MetaStore.A、TRUEB、FALSE【正确答案】：A143.关于Hive在FusionlnsightHD中的架构描述错误的是?A、只要有一个HiveServer不可用,整个Hive集群便不可用B、HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果C、MetaStore用于提供原数据服务,依赖于DBServerD、在同一时间点HiveServeir只有一个处于Active状态,另一个则处于Standby状态【正确答案】：A144.YARN中默认的资源调度器是?()A、FIFO调度器B、容量调度器C、Fair调度器D、以上全不正确【正确答案】：B145.以下关于Zookeeper的Leader节点在收到数据变更请求后的读写流程说法正确的是?A、同时写入磁盘和内存B、先写磁盘再写内存C、仅写入内存D、先写内存再写磁盘【正确答案】：B146.Flume的perties配置文件中可以配置多个Channel来传输数据?A、TRUEB、FALSE【正确答案】：A147.Kafka中partitionreplication之间同步数据,从partition的leader复制数据到follower需要线程

(replicationFetcherThread),Follower(一个follower相当于consumer)主动从leader批量拉取消息的,这极大提高了吞吐量。A、TrueB、False【正确答案】：A148.Flume用于收集数据,其传输的数据基本单位是?A、SplitBlockC、EventD、Packet【正确答案】：C149.FusionInsightHD的HBase中保存一张用户信息表meg_table,Rowkey为用户id,其中一列为用户昵称,现在按先后顺序往这列写入三个KeyValue:001:Li,001:Mary,001:Lily,请问scan’meg_table’,(VERSION=>2)会返回哪几条数据?()A、001:LilyB、1:LiC、1:Mary,001:LilyD、001:Li,001:Mary,001:Lily【正确答案】：A150.某银行规划的FusionlnsightHD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划()个。A、87B、85C、90D、86【正确答案】：B1.HBase集群定时执行Compaction的目的是什么?A、减少同一Region,同一ColumnFamily下的文件数目B、提升数据读取性能C、减少同一ColumnFamily的文件数据D、减少同一Region的文件数目【正确答案】：ABD2.FusionInsightHD安装前准备,包括哪些步骤?(多选)A、完成硬件安装B、完成节点主机操作系统安装C、准备工具和软件。例如Putty、LLD、FusionInsightHD软件安装包等D、准备规划数据,例如网络参数和角色部署位置【正确答案】：ABCD3.Hadoop集群规模很大时,数据的分布情况会非常关键,用户需要根据数据分布情况,决定集群是否扩容,数据是否需要做均衡等。以下关于FusionInsight资源分布监控说法正确的有()A、帮助用户迅速找到资源消耗最高的节点,采用适当的措施B、通过每个服务主页的资源分布查看界面,查看到关键的资源分布情况C、可以帮助用户快速聚集在最关键的资源消耗上D、通过DashBoard界面,可以查看到主机资源分布情况。例如内存占有率在50-75%的主机列表,并提供链接跳转【正确答案】：ABCD4.下列关于worker(工作进程)、Executor(线程)、task(任务)说法正确的是?()A、每个Executor(线程)可以运行多个task(任务)B、每个Executor(线程)可以运行不同组件(spout或bolt)的task(任务)C、每个worker可以运行多个Executor(线程)D、每个worker只能为一个拓扑运行Executor(线程)【正确答案】：ABCD5.以下属于hiveSQL中DDL(数据定义语言)的是?()A、修改表B、删除表C、建表D、数据导入【正确答案】：ABC6.Hadoop的HDFS是一种分布式文件系统,适合以下哪种应用场景的数据存储和管理?A、大量小文件存储B、高容错、高吞吐量C、低延迟读取D、流式数据访问【正确答案】：BD7.FusionInsightHD的HBase服务包含哪些进程?A、HMasterB、SlaveC、HRegionServerDataNode【正确答案】：AC8.FusionlnsightHD支持哪些日志下载方式?A、下载已安装组件的所有组件的曰志B、下载单个组件某个模块的曰志C、下载指定主机的曰志D、下载指定时间段的曰志【正确答案】：ABCD9.以下哪些数据源可以通过loader实现与FusionInsightHD的数据交换?()A、MySQLB、NoSQLC、FTPServerD、SFTPServer【正确答案】：ABCD10.以下关于FusionInsight多租户管理的描述正确的有()A、一站式管理租户资源,计算资源(CPU/内存/IO)、存储资源(HDFS)、服务资源,(HBase…)B、可视化的多级租户管理,与企业组织结构相匹配,简化系统资源分配与管理C、基于容器机制的租户资源隔离,为租户SLA保驾护航D、与企业组织结构相匹配的多级的租户模型,不同部门对应不同的租户、按需动态增删租户【正确答案】：ABCD11.FusionInsightHD系统中使用Streaming客户端shell命令查看拓扑或者提交拓扑失败,以下哪些定位手段的正确的?()A、查看Supervisor运行日志,判断是否Supervisor异常B、查看worker运行日志C、查看客户端异常堆栈,判断是否客户端使用问题D、查看主nimbus的运行日志,判断是否nimbus服务器异常【正确答案】：ABCD12.FusionlnsightManager与外部管理平台对接时,支持哪些接口?(多选)A、NMPB、VPNC、FTPD、Syslog【正确答案】：ACD13.FusionInsightManager会定时备份哪些数据?A、NameNodeB、LDAPC、OMSDBService【正确答案】：BC14.Flink流式处理的数据源类型包括?A、CollectionsB、JDBCC、SocketstreamsD、Files【正确答案】：ABCD15.以下关于HBase中HMaster的功能描述哪些是正确的?A、Region负载均衡,Region分裂以及分裂后的Region分配B、负责建表/修改表/删除表C、负责RegionServer的负载均衡D、RegionServer失效后的Region迁移【正确答案】：ABCD16.FusionInsight家族包含下列哪些子产品?A、HDB、LibraC、ManagerD、MinerE、FarmerF、DWS【正确答案】：ABCDE17.Flume进程级联时,以下哪些sink类型用于接收上一跳Flume发送过来的消息?AvrosinkB、ThriftsinkC、HivesinkD、Nullsink【正确答案】：AB18.如图所示,Flink流式数据处理接口DataStreamAPI支持的语言包括?()A、pythonB、javaC、c语言D、scala【正确答案】：BD19.在Kafka中,如下关于Producer发送数据的说法错误的是()A、Proucer负责生产数据。Consumer负责消费数据。Producer和Consumer之间需要建立连接B、Proucer既可以发送数据到Broker上。又可以发送数据到ConsumerC、Proucer作为消息生产者。可以直接将数据写入ZookeeperD、Proucer连接任意一个正常的Broker实例就可以产生数据【正确答案】：ABC20.FusionInsightManager与外部平台对接时,支持哪些接口?A、SNMPB、VPNC、BGPD、Syslog【正确答案】：AD21.FusionInsightManager的主要功能有以下哪些?A、数据集成B、系统管理C、安全管理D、服务治理【正确答案】：BCD22.下列哪些OS版本被推荐可以用来搭建FusionlnsightV1R2C60集群?(多选)A、SUSE11SP1/SP2/SP3forAMD64&Inter64B、CentOS6.6C、Redhat-6.4-x86_64D、RedHat-6.5-x86_64E、RedHat-6.7-x86_64F、Ubuntu6.3【正确答案】：ABCDE23.在Streaming的处理节点Bolt中,可以完成以下哪些操作()A、接运算B、接数据库C、滤(filter)D、务处理【正确答案】：ABCD24.Flink的兼容性体现在以下哪些方面?()A、能够与hadoop原有的mappers和reducers混合使用B、YARN能够作为Flink集群的资源调度管理器C、能够使用hadoop的格式化输入和输出D、能够从本地获取数据【正确答案】：ABCD25.大数据商业咨询服务方案在规划环节主要考虑以下哪些设计?A、大数据商业模式设计B、商业场景全景规划C、典型场景需求设计D、场景分解和业务设计【正确答案】：ABCD26.以下哪些是Spark可以提供的功能?A、分布式内存计算引擎B、分布式文件系统C、集群资源的统一调度D、流处理功能【正确答案】：AD27.Zookeeper的关键特性包括以下哪些选项?()A、原子性B、最终一致性C、等待无关性D、可靠性【正确答案】：ABCD28.在FusionInsightHD中,以下哪一项不属于Hive的流控特性A、支持对已建立的总连接数做阈值控制B、支持对每个用户已经建立的连接数做阈值控制C、支持对某个特定用户已建立的连接数做阈值控制D、支持对单位时间内所建立的连接数做阈值控制【正确答案】：ABD29.华为大数据解决方案中平台架构包括以下哪些组成部分?()A、Hadoop层B、GaussDB200C、Datafarm层D、FusioInghtManager【正确答案】：ACD30.以下关于FusionInsight中CarbonData说法正确的有?()A、carbon也是一种将数据源与spark集成的高性能分析引擎。B、carbon使用轻量级压缩和重量级压缩的组合压缩算法压缩数据,可以减少

60%~80%数据存储空间,大大节省硬件存储成本。C、carbon是一种新型的ApacheHadoop本地文件格式,使用先进的列式存储、索引、压缩和编码技术,以提高计算效率,有助于加速超过PB数量级的数据查询,可用于更快的交互查询。D、使用carbon的目的是对大数据即席查询提供超快速响应。【正确答案】：ABCD31.Flume适用于以下哪些场景的数据收集?A、Thrift,Avro,Syslog,Kafka等数据源上收集数据B、本地文件数据采集C、应用系统产生的日志采集D、大量数据的实时数据采集【正确答案】：ABC32.HDFS不适用于以下哪些场景?A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入【正确答案】：BD33.在loader历史作业记录中,可以查看以下哪些内容?()A、作业状态B、作业开始/运行时间C、脏数据链接D、错误行/文件数量【正确答案】：ABCD34.HBase的数据文件HFile中一个KeyValue格式包含哪些信息?A、KeyB、ValueC、TimestampD、KeyType【正确答案】：ABCD35.HBase的主要特点有哪些?A、高可靠性B、高性能C、面向列D、可伸缩【正确答案】：ABCD36.下列哪些组件必须依赖于Zookeeper才能运行?A、HDFSB、HBaseC、SparkD、YARN【正确答案】：ABD37.下面关于flink窗口的描述错误的是A、滚动窗口在时间上是重叠的B、滚动窗口在时间上是不重叠的C、滑动动窗口之间时间点不存在重叠D、滑动窗口之间时间点存在重叠【正确答案】：AC38.Spark适用于以下哪些场景?()A、图计算B、互式查询C、批处理D、实时流处理【正确答案】：ABCD39.Flink可以基于以下哪些窗口进行统计?A、时间窗口B、滑动窗口C、会话窗口D、countWindow【正确答案】：ABCD40.FusionlnsightHDV100R002C60版本集群中,以下哪些组件需要规划元数据分区?A、HDFSB、ZookeeperC、StreamingD、RedisE、HBaseF、Kafka【正确答案】：ABC41.与开源sqoop相比,loader具有哪些增强特性?A、高可靠性B、高性能C、安全性D、图形化【正确答案】：ABCD42.Zookeeper中的数据节点znode分为哪几种类型?A、semi-persistentB、ephemeralC、temporaryD、persistent【正确答案】：BD43.HDFS系统中对备用NameNode的作用的描述正确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点【正确答案】：AC44.在FusionInsightHD中,Flink主要与以下哪些组件进行交互A、zookeeperB、HDFSC、KafkaD、Yarn【正确答案】：ABCD45.FusionInsightHD数据高可靠性体现在以下哪些方面?()A、跨数据中心容灾B、关键数据掉电保护C、硬盘热插拔D、第三方备份系统集成【正确答案】：ABCD46.基于Hadop幵源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有?A、MRB、SparkC、HDFSD、HBase【正确答案】：CD47.执行Hbase数据业务(题干可能为读数据业务),需要读取哪几部分数据()A、HLogB、MenStoreC、HFileD、HMaster【正确答案】：BC48.执行HBase数据读取业务时,需要读取哪几部分数据?A、HFileB、HLogC、MemStoreD、HMaster【正确答案】：AC49.FusionInsightHD的Loader在创建作业时,连接器有什么作用?A、确定有哪些转换步骤B、提供优化参数,提供数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接【正确答案】：ABCD50.下列关于Flink中Transformation的说法正确的是?A、可以通过window设定时间窗口B、Filtor操作是对每个元素执行boolean函数C、flatMap可以对文本进行切分D、eyBy是将源头数据按照key进行分组,以保证同一个key的元数据分到同样的组中【正确答案】：ABD51.以下关于FusionInsightHBase可视化建模说法正确的有?()A、可视化建模帮助DBA进行建模设计,降低HBase的使用门槛B、QualifierHBase列:每一列代表业务数据某一属性C、实现人员分工:DBA关注数据表建模,开发人员关注用户表明和用到的列D、Column用户表列:每一列代表一个KeyValue【正确答案】：ABC52.FusionlnsightHDLLD配置规划工具可以生成哪些配置文件?A、监控告警阈值配置文件B、集群的安装模板文件C、HDFS和YARN的配置文件D、执行Precheck所需要的配晋文件CheckNodes.Config【正确答案】：BD53.FusionlnsightHDLoader可以将HDFS数据导出到以下哪些目标端?A、SFTP服务器B、FTP服务器C、Oracle数据库DB2数据库【正确答案】：ABCD54.大数据分析相关技术主要特征有哪些?A、机器学习,全量特征B、数据背后事件关联性分析C、以海量数据为基础D、以精确样本为基础【正确答案】：ABC55.以下关于FusionInsight网络安全可靠性,说法正确的有()A、避免业务平面的高负载阻塞集群管理通道B、网络平面隔离,避免管理与业务宽带抢占、互相干扰C、阻止外部攻击者通过管理通道入侵实际业务数据D、FusionInsight支持将网络划分为三级:集群业务平面、集群管理平面和集群外维护网络,彼此之间实施物理隔离【正确答案】：ABCD56.如图所示,下列哪些选项属于宽依赖A、groupby:A->BB、map:C->DC、union:D&E->FD、join:B&F->G【正确答案】：AD57.以下哪些选项属于FusionInsight数据安全性?A、操作系统安全加固B、组件数据加密C、数据完整性校验D、用户权限认证管理【正确答案】：BC58.FuskmlnsightHD集群中,集群规模现有300个节点,如果采用推荐部署方案,控制节点上一定不会存在哪些分区?A、/B、/srv/BigData/dbdata_omC、/srv/BigDataD、/srv/Bigdata/umatnodeE、/srv/Bigdata/hadoop/data5【正确答案】：BE59.华为大数据产品FusionInsightHD中的Streaming具有哪些关键特性?()A、灵活性B、可伸缩性C、容灾能力D、消息可靠性【正确答案】：ABCD60.华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?(多选)A、YARNB、HDFSC、HiveD、HBase【正确答案】：BCD61.FusionlnsightHD产品中,关于Kafka组件说法正确的有?A、删除Topic时,必须踊保Kafka的服务配置delete.topic.enable配置为trueB、Kafka安装及运行曰志保存路径为/srv/Bigdata/kafkaC、ZooKeeper服务不可用会导致Kafka服务不可用D、必须使用admin用户或者Kafkaadmin组用户进行创建Topic【正确答案】：ACD62.以下关于HBase存储模型的描述正确的是?()A、每一个KeyValue都拥有一个Qualifier标识B、同一个key值key关联多个valueC、KeyValue中拥有时间戳、类型等关键信息D、即使是key值相同,Qualifier也相同的多个KeyValue,也可能有多个,此时使用时间戳来区分【正确答案】：ABCD63.传统数据处理的性能瓶颈有?A、数据存储成本高B、流式数据处理性能不足C、扩展能力有限D、批量数据处理缺失【正确答案】：AC64.下列选项中,哪些是Spark的重要角色()A、DateNodeB、NodemanagerC、DriverD、ResourceManager【正确答案】：BCD65.FusionInsightHD平台中,哪些组件支持对表、列加密?()A、FlinkB、HBaseC、HiveD、HDFS【正确答案】：BC66.HDFS联邦环境下,NameSpace(命名空间)包含以下哪些内容()A、目录B、文件C、块D、以上全不正确【正确答案】：ABC67.在FusionInsight集群中,Spark主要与以下哪些组件进行交互?()A、HiveB、YARNC、HDFSD、Zookeeper【正确答案】：BCD68.FusionlnsightManager会定时备份哪些数据?A、NameNodeB、LDAPServerC、OMSDBService【正确答案】：BC69.若在消息处理过程中允许部分信息丢失,关闭消息可靠性处理机制的方式有以下哪些?A、将参数Config.Topology_ACKKRS设置为0B、将参数Config.Topology_ACKKRS设置为FalseC、Spout发送消息时,使用不指定消息messageID的接口进行发送D、Bolt发送消息时使用Unanchor方式发送【正确答案】：ACD70.下列属于flume数据监控的指标是?()A、Source接收数据量B、Sink写入数据量C、DataNode数量D、Channel缓存数据量【正确答案】：ABD71.FusionlnsightHD产品在部署Kerberos和LDAP服务是,以下描述正确的是?(多选)A、部署Kerberos服务之前,必须先部署LDAP服务B、LDAP服务必须和Kerberos服务部署在同一个节点C、Kerberos服务和LDAP服务部署同一个节点利于数据访问,有助于性能提升D、LDAP服务可以多个集群共享【正确答案】：AC72.FusionlnsightHD集群升级,以下描述正确的有?(多选)A、升级过程中不可以手工操作主备OMS倒换B、集群内所有主机的root账户密码保持一致C、保持网络畅通,避免因网络问题导致升级异常D、观察期不能做圹容【正确答案】：ABCD73.下列选项中,哪些是MapReduce一定会有的过程?A、CombineB、MapC、ReduceD、Partition【正确答案】：BCD74.FusionInsightHD系统中使用Streaming客户端shell命令提交了拓扑之后,使用StromUI查看发现该拓扑长时间没有处理数据,可能原因有?()A、Supervisor是在topology中接收数据然后执行处理的组件B、拓扑业务存在逻辑错误,提交之后无法正常运行C、拓扑过于复杂或者并发太大,导致worker启动时间太长,超过Supervisor的等待时间D、Supervisor的slots资源被耗尽,拓扑提交上去之后分不到slot去启东worker进程【正确答案】：BCD75.采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,可以使用以下哪种Channel类型?A、MemoryChannelB、JDBCChannelC、FileChannelD、HDFSChannel【正确答案】：BC76.FusionInsightManager界面显示Hive服务状态为Bad时,可能原因有哪些?A、DBService不可用B、HDFS服务不可用C、MetaStore实例不可用D、HBase服务不可用【正确答案】：ABC77.Fusionlnsight系统中Hive支持的存储格式包括?A、HFileB、TextFileC、SequenceFileD、RCFile【正确答案】：BCD78.以下关于华为大数据解决方案说法正确的是()A、Farmer是数据服务框架B、GaussDB是一款开源数据库产品C、FusionInsightManager是一个分布式系统管理框架,管理员可以通过多接入点操控分布式集群D、FusionInsightHD是基于开源大数据软件Hadoop的增强版本【正确答案】：ABCD79.YARN通过ResourceManager对集群资源进行管理,它的主要功能有?A、集群资源调度B、应用程序管理C、日志管理D、以上说法都不对【正确答案】：AB80.FusionInsightManager与外部管理平台对接时,支持哪些接口()A、SNMPB、SyslogC、VPND、FTP【正确答案】：AB81.spark有哪些特点?()A、快B、巧C、灵D、轻【正确答案】：ABCD82.关于Flume,下列说法错误的是?、A、Flume级联节点之间的数据传输支持加密B、Flume支持多级联和多路复用C、Source到Channel到Sink等进程内部有加密的必要D、Flume级联节点之间的数据传输不支持压缩【正确答案】：CD83.以下关于Flink与其他组件交互说法正确的是?()A、Flink的checkpoint的实现依赖于ZookeeperB、Flink可以将接收的组件发生给kafkaC、Flink任务的运行依赖Yarn来进行资源的调度管理D、Flink在HDFS文件系统中读写数据【正确答案】：ABCD84.HBase集群定时执行Compaction的目的是什么?(ACD)[]A、减少同一个Region同一个ColumnFamily下的文件数目B、减少同一个Region的文件数目C、提升数据读取性能D、提升数据写入能力【正确答案】：ACD85.以下哪些是Kafka实际的应用场景A、日志收集B、网站活性跟踪C、资源管理D、聚合统计系统运营数据【正确答案】：BD86.某高校的FusionlnsightHD集群中有230个节点,在进行集群规划时,下列哪些进程应该部署在数据节点上?A、DataNodeB、NameNodeC、NodeManagerD、RegionServerE、DBServerF、SoIrServer【正确答案】：ACDF87.以下关于KafkaPartition说法正确的有A、引入Partition机制,保证了Kafka的高吞吐能力B、每个Partition都是有序且不可变的消息队列C、Partition数量决定了每个consumergroup中并发消费者的最大数量D、每个Partition在存储层面对应一个log文件【正确答案】：ABCD88.以下关于HBase的文件存储模块(HBaseFileStream,简称HFS)描述正确的有?A、应用在FusionInsightHD的上层应用B、HFS封装了HBase与HDFS的接口C、为上层应用提供文件的存储.读取.删除等功能D、HFS是HBase的独立模块【正确答案】：ABCD89.华为FusionInsightHD行业成功案例都有哪些?A、数字政府B、智慧园区C、智慧交通D、金融【正确答案】：ABCD90.YARN中,“从”节点负责以下哪些工作?()A、集群中所有资源的统一管理和分配B、监督Container的生命周期管理C、管理日志和不同应用程序用到的附属服务D、监控每个Container的资源使用(内存,CPU等)情况【正确答案】：BD91.在FusionInsight产品中,关于Kafka组件说法正确的是?A、在创建Topic时,副本数不得大于当前存活的Broker实例个数,否则创建Topic将会失败B、Kafka的Producer发送消息时,可以指定该消息被哪个Consumer消费C、Kafka会将元数据信息存放到Zookeeper上D、Kafka安装完成后就不能再配置数据存放目录【正确答案】：ABCD92.根据数据流如何在两个Transformation之间传输数据,数据流可以分为哪些类型?

A、redistributing流B、一对一流C、一对多流D、distributing流【正确答案】：BC93.调用Zookeeper客户端命令中包含哪些信息?A、端口号B、ip地址C、服务器名称D、用户名【正确答案】：AB94.NodeManager的内存和CPU的数量,是通过下列哪些选项进行配置?A、Yarn.scheduler.capacity.root.QueueA.maximum-capacityB、Yarn.nodemanager.resource.cpu-vcoreC、Yarn.nodemanager.vmem-pmom-ratioD、Yarn.modemanager.resource.memory-mb【正确答案】：BCD95.Loader可以实现以下哪些转换规则()A、空值转换B、拼接转换C、长整型时间转换D、增量转换【正确答案】：ABCD96.FusionInsightHD集群中包含了很多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?()【正确答案】：AA、HDFSB、NameNodeC、DataNodeD、Hbase【正确答案】：BC97.Zookeeper可以为FusionInsightHD中哪些组件提供分布式管理支持()A、HBaseB、LoaderC、HiveD、Spark【正确答案】：ABCD98.fusininsightHD平台中,那些组件支持对列表加密?A、HDFSB、FlinkC、hbaseD、hive【正确答案】：CD99.HBase中以下哪种场景会出发Flush操作?A、HBase定期刷新Memstore,默认周期为1小时B、当WALs中文件数量达到阈值时C、Region中MemStore的总大小,达到了预设的FlushSize阈值D、MemStore占用内存的总量和RegionServer总内存比值超出了预设的阈值大小【正确答案】：ABCD100.kafka消息传输保障通常有以下哪几种?()A、最多三次(AtMostThreeTimes)B、仅有一次(ExactlyOnce)C、最少一次(AtLeaseonce)D、最多一次(AtMostonce)【正确答案】：BCD101.以下关于KafkaLogs中segmentfile的说法正确的有?A、index元数据全部映射到menory,可以避免sementfile的index数据IO磁盘操作B、索引文件稀疏存储,可以大幅减低index文件元数据占用空间大小C、稀疏存储,即将原来的完整数据,只间隔的选择多条进行存储D、通过索引信息可以快速定位message【正确答案】：ABCD102.FusionInsightManager的主要功能有以下哪些?()A、安全管理B、数据集成C、系统管理D、服务治理【正确答案】：AC103.关于大数据的

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据HCIA复习试题及答案

文档简介

温馨提示

最新文档

评论

大数据HCIA复习试题及答案

文档简介

温馨提示

最新文档

评论

相关文档