数据工程师培训题库一_第1页
数据工程师培训题库一_第2页
数据工程师培训题库一_第3页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据平台认证工程师试题(一 b)题4题,每题10分,总计40满分100【选择题(每题2分共60分DataJournal1、在HDFS服务中,为了保证NameDataJournal2、 根据策略对数据块进行必要的或删3HDFS3128M的数据文件,该数据文件占用HDFS空间大小为 A.B.C.D.4、下列对YARN角色在集群中的作用描述正确的是 HDFS5、在Yarn服务中,不包含以下哪种角色 A.B.C.D. A.BC.D. A、外表的数据在本地,托管表的数据在hdfsB、删除托管表只会删Inceptor上的元数据不会删除数据文件,删除外表两者都会C、删除外表只会删Inceptor上的元数据不会删除数据文件,删除托管表两者都会 9、以下关于inceptorexcutor资源配置的说法正确的有 A、ExcutorfixedratioB、ExcutorexcutorcoreC、Excutor1core:2GDExcutorexcutorexecutor在集群上运行的SELECTSexRegion,COUNT(IDAVGSalary)FROMEmployeeWHEREDepartment=,RegionORDERBYSex,通过holodesk的cube和index对这种过滤率和聚合率高的业务进行优化,以下建表 CREATETABLEEmployeeTBLPROPERTIES('cache'='RAM','holodesk.index'='Department','holodesk.dimension'='Sex,)CREATETABLEEmployeeTBLPROPERTIES('cache'='RAM','holodesk.index'='Sex,Region''holodesk.dimension'=)CREATETABLEEmployeeTBLPROPERTIES('cache'=''Department'','holodesk.index'='Department','holodesk.dimension'='Sex,Region')CREATETABLEEmployeeTBLPROPERTIES('cache'='RAM','holodesk.index'='Department','holodesk.dimension'='Sex')11、关于Hyperbase全局索引的描述,哪些是正确的 全局索引概念是对应Rowkey这个“一级”12、以下为Hyperbase分布式的最小单元的是 A、Regionserver13、以下有关Hyperbase说法正确的是 A、数据类型丰富,支持String、Int、CharB、Key/value系统,keyRow,ColumnFamily,ColumnQualifierC、Hyperbase表中rowkey14、以下关于StreamSQL的概念描述正确的是 StreamStreamjob是对一个或多个streamApplicationstreamjob15、某交通部门通过使用流市过往24小各个卡数据,要求每分钟更新一次,原始流为ogtra,以下实现正确的是( )CREATESTREAMWINDOWtraffic_streamASSELECT*FROMoriginal_streamSTREAMw1AS(length'1'minuteslide'24'hour); STREAMWINDOWw1AS(length'1'minuteslide'24'hour); STREAMWINDOWw1AS(length'24'hourslide'1'minute);CREATESTREAMtraffic_streamASSELECT*FROMoriginal_streamAS(length'24'secondslide'1'minute);16、以下不是Zookeeper的功能是 17、以下服务需要与zookeeper进行通信的是 ActiveActive18、下列是关于flume和sqoop对比的描述,不正确的是 A.flume主要用来日志而sqoop主要用来做数据迁B.flume主要流式数据而sqoop主要用来迁移规范化数D.flume主要用于多数据源小数据而sqoop用来迁移单数据源数19、有关使用sqoop抽取数据的原理的描述不正确的是 sqoopmap的个数,maphdfs生成的B. sqoopmap的个数设置的越多性能sqoopsplit字段的(最大值-最小值)/map 20、 A.--fields-terminated-by‘\\01’hdfsB.--hive-drop-import- 用来设置在hdfs生成的文件的形式为Cnull-stringN'用来把所有的String转换hiveNULL 用来 String类型的空值转换成hive的NULL21、下列有关flume的描述不正确的是 AflumeApacheB.flume主要是一个日志,传输系C.flumesqoopD.flume可以同时集群和集群外部的日志数22、下列sink中哪些是flume不支持的 A.HDFSB.kafkaC.memoryD.fileroll23、以下对ElasticSearch描述不正确的是 ElasticSearchElasticSearchmasterdataElasticSearch数据在HDFSElasticSearchShard24、下列不属于kafka应用场景的是 25、TDH提供哪几种认证模式 所有服务都启用Kerberos认证,用户要提供Kerberosprincipal和(或keytab)来各个服KerberosInceptorLDAPLDAP NameNode50070HDFS进行ResourceManager8180YARN上运行的任务进行HMaster60010HBase进行HueServer888827、Inceptorserver服务无法启动时,该如何查看日志是 查看TDHmanager所在节点 下的hive-server2.log日查看Inceptorserver所在节点 下的hive-server2.log日查 所在节点 下yarn-yarn-resourcemanager-poc-node1.log 下的hive-server2.log日28、以下对Hadoop组件的应用场景描述正确的是 HbaseOLTP SparkStreaming A.NameB.C.ResourceD.Node 选一个节点作为管理节点,修改其/etc/hostsTranswarpManager【客观简答题(104

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论