大数据工程师培训题库一_第1页
大数据工程师培训题库一_第2页
大数据工程师培训题库一_第3页
大数据工程师培训题库一_第4页
大数据工程师培训题库一_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、TDH数据平台认证工程师试题【说明】心za)客观题30题,每题2分,总计60分b)主观题4题,每题10分,总计40分c)满分100分。【不泄项选择题(每题2分共60分)】1、在HDFS服务中,为了保证Name Node髙可用性的角色不包括()Data NodeB . Journal NodeZKFCZookeeper2、Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是()安全模式目的是在系统启动时对数据有效性进行检査根据策略对数据块进行必要的复制或删除当数据块的上报数达到阈值时,会自动退出安全模式允许用户对文件系统进行读写操作3、在集群中配置HDFS的副本数为3,设置数据

2、块大小为128M,此时我们上传一份64M的数据文件,该数据文件占用HDFS空间大小为()64MB 128MC 384MD 192M6、下列计算框架中不属于分布式计算框架的是()A MapReduceB MATLABC SPARKD.Tez7、以下关于外表和托管表描述正确的是()A、外表的数据存储在本地,托管表的数据存储在hdfs上B、删除托管表只会删除Inceptor 的元数据不会删除数据文件,删除外表两者都会 被删除C、删除外表只会删除Inceptor上的元数据不会删除数据文件,删除托管表两者都会 被删除D、删除托管表或外表,incepotr上的元数据和数据文件都会被删除8、以下对分桶表的描

3、述正确的是()A、分桶表通过改变数据的存储分布,对查询起到一左的优化作用B、分桶键不能是表中的列C、分桶数应为素数D、事物表必须制泄分桶,分桶字段可以被更新9、以下关于inceptor excutor资源配置的说法正确的有()A、Excutor资源配置fixed和ratio两种模式B、Excutor内核数配垃的是每个excutor所使用的逻辑core数量C、Excutor内核数和内存配置比例一般为1 core:2G memoryn. Fwc什cr介祐/無个Vr占I云彳Ml Yrntnr灼畐戒as广“ter Zl:俵群卜i云行药15、某交通部门通过使用流监控全市过往24小时各个卡口数据,要求每分

4、钟更新一次, 原始流为。rg_stream,以下实现正确的是()A. CREATE STREAMWINDOW traffic_stream AS SELECT * FROM originaLstream STREAM wl AS (length 1 minute slide 24 hour);BCREATESTREAMt raff ic_st reamASSELECT*FROMoriginaLstreamSTREAMWINDOW wl AS (length T minute slide *24 hour);CCREATESTREAMt raff ic_st reamASSELECTFROMor

5、iginaLstreamSTREAMWINDOW wl AS (length 241 hour slide T minute);D CREATE STREAM trafficstream AS SELECT * FROM original_stream AS (length 241 second slide l1 minute);16以卜不是Zookeeper的功能是()配置管理集群管理分布式锁存储大量数据17.以下服务需要与zookeeper进行通信的是()A. HMasterB Active NameNodeC InceptorSQLD Active ResourceManager18.下

6、列是关于flume和sqoop对比的描述,不正确的是()A . flume主要用来采集日志而sqoop主要用来做数据迁移Bflume主要采集流式数据而sqoop主要用来迁移规范化数据C Iiieq XT! cnccrt/fri(T-21.下列有关flume的描述不正确的是(Aflume是Apache的一个子项目B . flume主要是一个日志采集,传输系统C . flume和sqoop功能相似,因此可以相互替代D . flume可以同时采集集群内部和集群外部的日志数拯22、卜列sink中哪些是flume不支持的sink ()A HDFS sinkB kafka sinkC memory sin

7、kD . file roll sink23、以卜对ElasticSearch描述不iE确的是()A. ElasticSearch是分布式全文搜索引擎B ElasticSearch 群中分 master 和 data iY点CElasticSearch数据存储在HDFS上D. ElasticSearch数据可以按Shard分布在不同的if点上24、下列不属于kafka应用场景的是()常规的消息收集网站活动性跟踪日志收集D关系型数据库和大数据平台之间的数据迁移25、TDH提供哪几种认证模式?(28、以下对Hadoop组件的应用场景描述正确的是()Hive主要用于构建大数据数仓,主要做批处理、统计分

8、析型业务Hbase主要用于检索查询的OLTP业务ElasticSearch主要用于全文检索的关键字查询业务Spark Streaming主要用于实时数据的业务场景29、以下不属于管理角色的是()A. Name NodeB . HMasterResource ManagerD . Node Manager30、下面哪些工作不属于集群预安装工作()为集群中每个节点的安装操作系统选一个节点作为管理节点,修改其/etc/hosts文件C .安装Transwa中Manager管理界而配置集群安全模式【客观简答题(每题20分,共40分)】1、集群有8个丹点,每个节点有8块硬盘(默认3副本)。如果某个iT点有3块盘损坏, 是否可能存在数据块丢失情况;如果有3个节点发生故障,是否可能存在数据块去 失情况:并简述原因。2、请描述TDH平台中在Yarn可以使用哪几种调度策略,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论