版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据HCIA练习题库(含答案)一、单选题(共40题,每题1分,共40分)1、下列哪个HDFS命令可用于检测数据块的完整性?A、hdfsfsck/B、hdfsfsck/-deleteC、hdfsdfsadmin-reportD、hdfsbalancer-threshold1正确答案:A2、下列哪个命令是删除文件的?()A、dfs-clearB、dfs-rmC、dfs-delD、dfs-ls正确答案:B3、有关普通表和外部表的描述,下面哪句是错误的?A、缺省创建时为普通表;B、外部表实际上是将HDFS中已有路径的文件与表联系起来;C、删除普通表时会删除数据和元数据;D、删除外部表时只删除数据,不删除元数据;正确答案:D4、FusionInsight系统中,Flume数据流在节点内不需要经过哪个component?A、channelB、sinkC、topicD、source正确答案:C5、FusionInsightHD产品中,关于Kafka组件部署说法不正确的是?A、Kafka强依赖于ZooKeeper,安装Kafka必须安装ZooKeeperB、Kafka部署的实例个数不得小于2C、Kafka的服务端可以产生消息D、Consumer作为Kafka的客户端角色专门进行消息的消费正确答案:C6、某银行规划的FusionlnsightHD集群有90个节点,如果控制节点规划了3个,那集群中数据节点推荐规划()个。A、87B、85C、90D、86正确答案:B7、加载数据到Hive表,哪种方式不正确?A、直接将本地路径的文件load到Hive表中B、将HDFS上的额文件load到Hive表中C、Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录D、将其他表的结果集insertinto到Hive表中正确答案:C8、在FusionInsightManager界面中,对loader的操作不包括下列哪个选项?()A、切换Loader主备节点B、配置loader参数C、查看loader服务状态D、启动loader实例正确答案:A9、传统数据处理的数据规模的单位是?A、TBB、EBC、PBD、GB正确答案:D10、下列哪个命令是删除文件的A、dfs-lsB、dfs-delC、dfs-clearD、dfs-rm正确答案:D11、HBase不适合哪些应用场景?A、海量数据(TB、PB)应用场景B、高吞吐率应用场景C、要求具有完全ACID特性的应用场景D、半结构化数据应用场景正确答案:C12、在WebHCat架构中,用户能够通过安全的HTTPS协议执行以下哪些操作()A、执行HiveDDL操作B、运行MapReduce任务C、运行HiveHQL任务D、以上全部正确正确答案:D13、哪个不是Flume的channel类型?A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel正确答案:D14、FusionInsightManager用户权限管理不支持哪个配置?A、给用户配置角色B、给用户组配置角色C、给用户组配置权限D、给用户配置权限正确答案:C15、YARN是主从架构,其中”从“是指下列选项中的那个?A、NodeManagerB、NameNodeC、AppMasterD、ResourceManager正确答案:A16、FusionInsightHD的Loader在创建作业时,连接器(Connector)有什么作用?A、确定有哪些转换步骤B、提供优化参数,提高数据导入导出性能C、配置作业如何与外部数据源进行连接D、配置作业如何与内部数据源进行连接正确答案:C17、kafka集群在运行期间,直接依赖于下面那些组件?()A、ZookeeperB、HDFSC、SparkD、HBase正确答案:A18、HDFS的副本存放策略中,同一机架不同服务器之间的距离是()A、2B、3C、1D、4正确答案:A19、以下关于Zookeeper关键特性中的原子性说法正确的是?A、集群中无论哪台服务器,对外展示的均是同一视图B、更新只能全部完成或失败,不会部分完成C、一条消息被一个server接收,将被所有server接收D、客户端发送的更新会按照他们被发送的顺序进行应用正确答案:B20、Flink中的()接口用于流数据处理,()接口用于批处理A、StreamAPI,BatchAPIB、DataStreamAPI,DataSetAPIC、DataBatchAPI,DataStreamAPID、BatchAPI,StreamAPI正确答案:B21、关于FusionInsightHDStreaming的Supervisor描述正确的是?A、Supervisor负责资源的分配和任务的调度B、Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D、Supervisor是在Topology中接收数据然后执行处理的组件正确答案:B22、创建Loader作业时,可以在一下那个步骤中设置Map数?A、转换B、基本信息C、输出D、输入设置正确答案:C23、FusionInsightHD的HBase中的一张表包含以下几个Region[10,20),[20,30),[30,+∞],分别编号为①,②,③,那么,11,20,222分别属于哪个Region?A、①①③B、①②③C、①②②D、①①②正确答案:C24、Spark自带的资源管理框架是?A、StandaloneB、MesosC、YARND、Docker正确答案:B25、Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A、客户端的文件数据经过NameNode传递给DataNodeB、客户端将文件划分为多个Block,根据DataNode的地址信息,按顺序写入每一个DataNode中C、客户端根据DataNode的地址信息,按顺序将整个文件写入每一个DataNode中,然后由DataNode将文件划分为多个BlockD、客户端只上传数据到一个DataNode,然后由NameNode负责Block复制正确答案:B26、FusionlnsightHDLoader作业前后,需要哪些节点与外部数据源通讯?A、Loadeir服务主节点B、运行Yarn服务作业的节点C、前面两个都需要D、前面两个都不需要正确答案:C27、FusionInsightHD中Loader实例必须与哪个实例部署在一起?A、DataNodeB、RegionServerC、ResourceManagerD、NodeManager正确答案:D28、在Fusionlnsight集群规划部署时,建议管理节点最好部署()个,控制节点最少需要部署()数据节点最少需要部署()个。A、1,2,2B、1,3,2C、2,3,3D、2,3,1正确答案:C29、Hadoop的HBase不适合哪些数据类型的应用场景?A、大文件应用场景B、海量数据应用场景C、高吞吐率应用场景D、半结构化数据应用场景正确答案:A30、HDFS的NameNode节点主备状态管理及元数据文件合并分别由哪两个角色负责?A、ZKFC和备NameNodeB、主NameNode和备NameNodeC、ZKFC和主NameNodeD、主NameNode和JournalNode正确答案:A31、Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、jarC、application-attemptD、Application正确答案:D32、FusionInsightHDManager界面Hive日志收集,哪个选项不正确?A、可指定实例进行日志收集,比如指定单独收集MetaStore的日志B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志C、可指定节点IP进行日志收集,例如仅下载某个ip的日志D、可指定特定用户进行日志收集,例如仅下载userA用户产生的日志正确答案:D33、以下关于KafkaPartition副本的特性描述不正确的是A、主副本叫做Leader,从副本叫做FollowerB、Follower通过拉取的方式从Leader中同步数据C、副本以区分为单位。每个区分都有各自的主副本和从副本D、消费者和生产者是从Leader中读写数据,也可直接与Follower交互正确答案:D34、以下关于FusionInsightCTBase的描述不正确的是?A、CTBase的读写数据接口,统一封装了行定义的接口,自动进行冷字段的合并和解析,不需要在应用程序中进行合并和解释B、CTBase是基于HBase的聚簇表开发框架C、CTBase提供了一套WebUI进行元数据定义,提供了只管医用的表设计工具,降低表设计的难度D、CTBase的javaAPI提供一套HBase连接池管理的接口,内部进行连接共享,减少客户端应用开发难度。正确答案:B35、FusionInsightHD中HBase默认使用什么组件作为其底层文件存储系统?()A、kafkaB、HDFSC、MemoryD、File正确答案:B36、在FusionInsight集群规划部署时,建议管理节点最好部署()个,控制节点最少需要部署()数据节点最少需要部署()个。A、1,2,2B、2,3,1C、1,3,2D、2,3,3正确答案:D37、传统数据处理的数据规模单位是()A、TBB、GBC、PBD、EB正确答案:B38、下列哪个命令是从HDFS下载目录/文件到本地的?()A、dfs-catB、dfs-mkdirC、dfs-getD、dfs-put正确答案:C39、关于FusionInsightManager关键特性或操作说法正确的是?A、能够针对整个集群或者某个服务进行健康检查,不能够针对某个节点进行健康检查B、Manager引入角色的概念,采用RBAC的方式对系统进行权限管理C、整个系统使用Kerberos管理用户,使用LDAP进行用户认证,通过CAS实现单点登录D、对于健康检查结果,不能够导出检查报告,只能够在线查看正确答案:B40、在FusionInsight产品中,关于KafkaTopic,以下描述不正确的有?A、每个Topic只能被分成一个partition(区)B、Topic的partition数量可以在创建时配置C、每个Partition的存储层面对应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的消息都有一个类别,这个类别被称为Topic,也可以理解为一个存储消息的队列正确答案:A二、多选题(共30题,每题1分,共30分)1、FusionInsight家族包含下列哪些子产品?A、FusionInsightHDB、GaussDB200C、FusionInsightMinerD、FunsionInsightFarmer正确答案:ABCD2、关于大数据的主要特征理解和描述正确的有?A、来源多,格式多B、数据的价值密度较低C、存储量大,计算量大D、增长速度快,处理速度快正确答案:ABCD3、华为大数据产品FusionInsightHD中的Streaming具有哪些关键特性?A、可伸缩性B、容错能力C、消息可靠性D、灵活性正确答案:ABCD4、HDFS不适用以下哪些场景()A、大文件存储与访问B、大量小文件存储C、随机写入D、流式数据访问正确答案:BC5、以下关于Hadoop的HDFS描述正确的有?A、HDFS由NameNode,DataNode,Client组成B、HDFS备NameNode上的元数据是主NameNode同步过去的C、HDFS采用就近的机架节点进行数据的第一副本存储D、HDFS适合一次写入,多次读取的读写任务正确答案:ACD6、以下说法正确的有A、作业运行了一段时间后失败了,不会残留原始文件。B、脏数据是指不符合转换规则的数据。C、Loader客户端脚本只能提交作业。D、创建了一个人机账号,就可以操作所有Loader作业。正确答案:AB7、Loader提供了哪些方式或接口实现作业管理?A、WebUIB、Linux命令行C、Rest接口D、JavaAPI正确答案:ABCD8、FusionInsightHDLoader可以将HDFS数据导出到以下哪些目标端?A、SFTP服务器B、FTP服务器C、Oracle数据库D、DB2数据库正确答案:ABCD9、下列哪些组件必须依赖于Zookeeper才能运行?A、HDFSB、HBaseC、SparkD、YARN正确答案:ABD10、在loader历史作业记录中,可以查看以下哪些内容?()A、脏数据链接B、作业状态C、作业开始/运行时间D、错误行/文件数量正确答案:ABCD11、FusionInsightHD集群中包含多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase正确答案:BC12、Hadoop通过ResourceManager对集群资源进行管理,它的主要功能有?A、日志管理B、集群资源调度C、应用程序管理D、集群资源管理正确答案:BCD13、以下关于Flink关键特性描述不正确的是?A、Flink流式处理引擎能够同时提供支持流处理和批处理应用的功能B、checkpoint实现了Flink的容错C、SparkStreaming与Flink相比,时延更低D、与FusionInghtHD中的Streaming相比,Flink具有更高的吞吐量正确答案:CD14、Loader可以实现以下哪些转换规则()A、拼接转换B、空值转换C、增量转换D、长整型时间转换正确答案:ABCD15、以下哪些选项属于FusionInsight数据安全性?A、用户权限认证管理B、组件数据加密C、操作系统安全加固D、数据完整性校验正确答案:BD16、fusininsightHD平台中,那些组件支持对列表加密?A、HDFSB、FlinkC、hbaseD、hive正确答案:CD17、以下哪些选项属于Hive的数据存储模型?A、以上全都正确B、桶C、数据库D、表E、分区正确答案:ABCDE18、华为大数据解决方案中平台架构包括以下哪些组成部分?()A、Hadoop层B、GaussDB200C、Datafarm层D、FusioInghtManager正确答案:ACD19、以下选项中,属于HDFS架构关键特性的是?A、多方式访问机制B、健壮机制C、HA高可靠性D、元数据持久化机制正确答案:ABCD20、HBase集群定时执行Compaction的目的是什么?A、减少同一Region,同一ColumnFamily下的文件数目B、提升数据读取性能C、减少同一ColumnFamily的文件数据D、减少同一Region的文件数目正确答案:ABD21、关于大数据的主要特征的理解和描述正确的有哪些?A、数据来源多,格式多B、数据价值密度低,价值高C、数据量大,计算量大D、数据增长速度快,处理速度快正确答案:ABCD22、以下属于Streaming特点的是?A、可做连续查询B、数据先存储再计算C、延迟低D、属于事件驱动正确答案:ACD23、FusionInsightHD集群中包含了多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?A、HDFSB、NameNodeC、DataNodeD、HBase正确答案:BC24、下列关于HBase存储模型的描述正确的是A、同一个Key值可以关联多个ValueB、KeyValue中拥有时间戳,类型等关键信息C、即使是Key值相同,Qualifier也相同的多个KeyValue,也可能有多个,此时使用时间戳来区分D、每一个KeyValue都拥有一个Qualifier标识正确答案:ABCD25、关于SparkSQL&Hive区别与联系,下列说法正确的是?()A、SparkSQL不可以使用Hive的自定义函数B、SparkSQL依赖Hive的元数据C、SparkSQL的执行引擎为Sparkcore,Hive默认执行引擎为MapReduceD、SparkSQL兼容绝大部分Hive的语法和函数正确答案:BCD26、HDFS系统中对备用NameNode的作用的描述正确的有?A、主NameNode的热备B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode的启动时间D、备NameNode应与主NameNode部署到一个节点正确答案:AC27、Flink支持的时间操作类型包括以下哪些选项?A、事件时间B、采集时间C、处理时间D、结束时间正确答案:ABC28、Spark适用于以下哪些场景?A、图计算B、批处理C、交互式查询D、实时流处理正确答案:BCD29、下列哪些措施为了保障数据的完整性?A、集群数据均衡B、元数据可靠性保证C、安全模式D、重建失效数据盘的副本数据正确答案:ABCD30、Spark可以接收哪些来源的数据?A、YARNB、HDFSC、HIVED、HBase正确答案:BCD三、判断题(共30题,每题1分,共30分)1、Zookeeper所有节点都可以处理请求A、正确B、错误正确答案:A2、Flume的tertises配置文件中可以配置多个channel来传输数据A、正确B、错误正确答案:A3、FusionInsightManager界面上,当收到kafka擦盘容量不足警告,且该警告的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决此问题。()A、正确B、错误正确答案:A4、FusionInsightHD系统中一个集群可以管理多个服务,每个服务可以管理多个角色,每个角色只能管理一个实例。A、正确B、错误正确答案:B5、RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A、正确B、错误正确答案:A6、华为FusionInsight中,Hbase的表设计工具、连接池管理和增强的SDK,可以简化复杂表的业务开发。A、正确B、错误正确答案:A7、二级索引为HBase提供了按照某些列的值进行索引的能力。二级索引先查索引表,再定位到数据表中的位置,不用全表扫描,时延小。A、正确B、错误正确答案:A8、容量调度器在尽行资源分配,现有同级的2个队列Q1和Q2,他们的容量均为30,其中Q1已使用8,Q2已使用14,则会优先将资源分配Q1。A、正确B、错误正确答案:A9、Topology在任务完成后会自动结束运行。A、正确B、错误正确答案:B10、FusioninsightHD产品中,一个典型的kafka集群包含若干个producer若干个Consummer和一个zookeeper集群?A、正确B、错误正确答案:B11、Hive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中()A、正确B、错误正确答案:A12、导入数据到Hive表时,不会检查数据合法性,只会在读取数据时候检查。A、正确B、错误正确答案:A13、SparkStreaming计算基于DStream,将流式计算分解成一系列短小的批处理作业。A、正确B、错误正确答案:A14、SparkStreaming相比Storm具备更高的实时性。A、正确B、错误正确答案:B15、在Zookeeper的服务模型中,Leader节点以主备模式存在,其他节点都属于Follower节点。A、正确B、错误正确答案:B16、FusionInisghtHD系统中,在创建Kafka的Topic时必须设置Partition个数和副本个数,设置多副本可以增强Kafka服务的容灾能力。A、正确B、错误正确答案:A17、Flink中的checkpoint机制
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 过程控制系统点检员操作规程考核试卷含答案
- 电冰箱零部件制作工安全规程知识考核试卷含答案
- 给水工程招投标管理办法
- 商铺租赁补充合同协议2026年修订草案
- 鲜花颜色搭配培训课件
- 燃气基础设施安全设备更新改造项目环境影响报告书
- 2025~2026学年江苏省扬州市江都区邵樊片九年级上学期第一次月考道德与法治试卷(答案不完整)
- 市政管网分区管理与调度方案
- AI技术驱动的高校音乐教育活态教学研究
- 细胞疗法优化X临床试验数据论文
- 运输管理组组长安全生产岗位责任制模版(2篇)
- 2025届山西省阳泉市阳泉中学高二生物第一学期期末质量检测试题含解析
- 毒理学中的替代测试方法
- DB3502-Z 5026-2017代建工作规程
- 广东省大湾区2023-2024学年高一上学期期末生物试题【含答案解析】
- 第四单元地理信息技术的应用课件 【高效课堂+精研精讲】高中地理鲁教版(2019)必修第一册
- 提高隧道初支平整度合格率
- 2023年版测量结果的计量溯源性要求
- GB 29415-2013耐火电缆槽盒
- 中国古代经济试题
- 软件定义汽车:产业生态创新白皮书
评论
0/150
提交评论