版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.允许开发人员为容器分配MAC地址的是()。2.Flink的日志管理通常包括()这几个方面。3.DataFrame和RDD最大的区别是()。4.关于Hive描述正确的是()。A、count函数必须开窗口才能使用B、max函数是窗口函数5.Flink的作业提交通常需要()来管理作业的执行。A、JobManager7.Dockerfile中指定环境变量的指令是()。8.HMaster的主要作用是()。B、负责响应用户I/0请求,向HDFS文件系统读写数据9.Hive是由哪家公司开源的()。10.Flume的源类型有哪些?()11.Flume的事件Body可以包含什么类型的数据?()12.Flink的TableAPI和SQL用于()。13.关于HiveSQL编译描述正确的是()。B、Master与Worker进行TCP通信,使得Worker启动ExecutorC、Executor启动会主动连接Driver,通过Driver->Master->WorkExecutor,从而得到Driver在哪D、river会产生Task,提交给Executor中启动Task去做真正的计算15.ZooKeeper中的一致性协议ZAB是基于()算法实现。C、Paxos算法17.Flume的事件可以包含哪些属性?()18.Flume的Channel组件负责什么?()19.强制删除容器tmp01的操作命令是()。20.在hive中下列哪个命令不可以实现去重()。21.Flume的哪个版本开始支持Spoolingdirectorysource?()22.Flink的作业调度(JobScheduling)通常由()负责。23.Hive是为了解决哪类问题()?A、海量结构化日志的数据统计24.典型的NoSQL数据库是()。25.在Centos中启动Docker服务的命令是()。26.以下()文件中主要用来配置ResourceManager,NodeManager的通信端口,27.Dataset最终在()版本中被定义成Spark新特性。28.在Flink中,水位线是()生成的。29.Hive中以下操作不正确的是()。30.Task运行在下面()选项中Executor上的工作单元。33.消费者出现活锁问题时应该()。34.Flume的哪个拦截器可以按类型区分事件?()C、以上都不是35.Hadoop组件在企业应用中,能用于大数据集实时查询的产品有()。36.Flink任务管理器(TaskManager)的作用是()。A、管理Flink集群的任务37.Stage的Task的数量由()决定。38.Flink支持的数据处理方式为()。A、批处理39.Flume的事件是什么?()40.ZooKeeper中的一次写操作是原子的吗?()43.()参数不影响kafka重平衡?44.在Hive中,以下哪个配置参数用于指定Hive表的默认存储格式()?45.将一个RDD转换为DataFrame的方法是()。46.Flink的状态管理用于(),以支持容错性和状态化的计算。A、存储和检索中间结果C、定时触发窗口操作D、执行数据清洗47.在Hive中,以下哪个配置参数用于指定Hive执行计划的缓存目录()?A、hive.query.plan.cacheC、hive.cache.plan.directoryA、hive.history.file.n49.关于DStream窗口操作函数,以下说法错误的是()。A、window()返回基于源DStream的窗口进行批计算后的一个新的DstreamB、countByWindow()返回基于滑动窗口的DStream中的元素数D、以上说法都不对50.在Hive中,以下哪个配置参数用于指定HDFS的名称节点地址()。C、hive.metastore.warehouse.dirhive.ser51.关于ZooKeeper临时节点的说法正确的是()。53.Flink的容错机制是()工作的,它定期A、1M55.HadoopMapReduce支持多种语言编程,下列说法不正确的是()。C、可以用Python语言编写MapReduce应用程序56.Flink的CEP(ComplexEventProcessing)库用于(),帮助检测和处理特定57.在Hadoop生态组件中,哪个产品可用于复杂的批量数据处理。()58.sqoop安装完成后,查看sqoop版本的命令是()。59.下面()操作是窄依赖。60.关于MapReduce的说法正确的是()。61.将nginx容器接入自定义的myops网络的操作命令是()。62.Kafka的高可用性是通过什么机制实现的?()A、1M65.Flink的主要特点是()。67.在HDFS文件操作中,上传文件的命令是()。68.Flink的Web界面通常用于()。69.Kafka的核心是由哪个组件组成?()70.以下关于Hive操作描述不正确的是()。C、Hive的加载数据时候,可以用local进行修饰,表示从某个本地目录下加载D、Hive一般可以用于实时的查询分析71.以下选项哪个是MapReduce正确的运行模型()。72.SparkJob默认的调度模式是()。76.Flume的哪个组件可以保证数据不会丢失?()77.下列()不可以作为SparkStreaming的输入数据流。78.Kafka的消息以什么形式进行存储?()C、文档79.Docker的()命令用于构建镜像。A、create81.Flume的Source组件负责什么82.关于Hivemetastore的三种模式的描述错误的是()。84.使用Dockerrun命令运行一个容器时,通过参数()可启动一个bash允许用85.Kafka的消息消费可以使用哪种模式?()87.Flink中的Checkpoints(检查点)主要用于()。88.ZooKeeper的特点不包括()。90.Flume的默认通道类型是什么?()91.ZooKeeper使用的是()文件系统。93.在ZooKeeper中,ACL(访问控制列表)可94.HBase依赖()技术框架提供消息通信机制。97.水位线的单位通常是()。98.Flume的拦截器实现了哪个接口?()99.下列语句中,描述错误的是()。100.Flume如何处理故障恢复?()102.Hive中分组的关键字是什么()?104.Docker的()命令只支持将本地文件复制到容器中。A、DD105.以下哪个选项不是Sqoop的导入模式?()106.Hive的默认元数据存储是什么()?107.Kafka的消息是如何进行顺序写入的?()108.在Flink中,窗口(Window)的作用是()。114.下列()不是Docker项目中用于文件存储的数据库。A、MYSQLD、随机位置A、事件发生的时间B、事件进入Flink的时间C、事件处理完成的时间D、事件被记录的时间答案:AA、计算作业的结果B、控制作业的执行顺序C、定义数据源D、过滤和转换数据流答案:D118.关于SparkSQL,以下描述错误的是()。A、SparkSQL使用的数据抽象并非是DataFrame,而是RDDC、DataFrame是一种以RDD为基础的分布式数据集D、ataFrame可以完成RDD的绝大多数功能答案:A119.Flink的时间语义(TimeSemantics)中的事件时间(EventTime)和处理时120.下列关于leader和follower的说法正确的是()。121.在ZooKeeper中,()角色负责协调其他节点的工作。C、观察者(0bserver)122.Kafka的消息传递语义是()。123.Dockerfile中声明镜像内服务监听的端口的指令是()。124.将大数据平台数据导出到mysql可以使用()工具。125.Flink的数据源可以是()。A、文件B、消息队列C、数据库D、以上都是126.Kafka的消息压缩算法可以选择的方式是()。A、hive.security.authent129.Hive中的哪个配置参数用于指定Hive的临时文件目录()?130.关于Hive数据模型描述正确的是()。134.当使用sqoop将数据从MySQL导入到HDFS时,以下哪个参数用于指定使用多个mapper?()答案:A135.Hive中的配置文件通常位于哪个目录中()?A、/etc/hive/conf答案:A136.获取远程仓库中Docker镜像的操作命令是()。A、dockerget答案:C137.在ZooKeeper中,关于节点的ACL(访问控制列表)说法错误的是()。A、CL可以用于控制节点的读写权限B、ACL可以定义多个权限组合138.下列说法错误的是()。A、--delete-target-dA、hive.history.file.direct142.Kafka使用的是什么类型的消息传递模式?()143.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送()。B、格式紧耦合C、安全机制不够完善145.在Sqoop中,哪个参数用于指定要导入的目标表?()146.在Hive中,以下哪个配置参数用于指定Hive执行计划的输出目录()?QL类型被映射什么类型()。150.DStream的转换操作方法中,()方法可以直接调用RDD上的操作方法。151.Kafka的消息传递保证是()。A、至少一次152.Kafka的主题分区数量可以根据什么进行配置?()157.Flume的哪个版本开始支持Avro作为数据传输格式?()A、1.X版本B、2.X版本C、3.X版本158.关于Hive查询通常延迟较高的原因描述错误的是()。159.在Flink的配置文件中,()通常用来指定Flink任务并行度。160.在Hive中,哪个配置参数用于指定Hive的执行模式,如本地模式或MapReA、hive.execution.eng161.使用create命令新建容器时,指定容器在网络中的别名的命令选项是()。162.DStream的输出操作,不包括()。165.Flink最常用的编程语言是()。166.Flume的默认Avro序列化方式是什么?()168.关于Hive用户自定义函数UDF的描述错误的是()。169.Kafka最初是由哪家公司开发的?()C、在节点数据变更期间172.MySQL数据库驱动文件放置于hive哪个目录下()。173.在Flink中,()通常用于指定Flink作业的任务流图(JobGraph)。174.下面哪个命令是导入到集群()。175.Flume的Kafka源类型是什么?()176.Sqoop将导入或导出命令翻译成什么程序来实现导入导出()。177.SparkStreaming中对DStream的转换操作会转变成对()的操作。A、sql具,它属于哪个Apache项目的一部分()179.在Hive中,以下哪个配置参数用于指定Hive服务器的端口号()?180.Flume的哪个版本加入了Kafka作为源和汇点?()B、2.X版本181.制作镜像时,复制文件到镜像中使用的命令是()。A、DD182.查看Docker版本号的操作命令是()。183.Flume的哪个版本加入了对Thrift事件的的支持?()184.Hive是以()技术为基础的数据仓库。185.Linux下启动HDFS的命令是()。186.Docker容器是在()层面上实现虚拟化。A、硬件层面187.在ZooKeeper中,节点的数据版本是如何维护的?()A、hive.execution.engine=sp195.关于Hive各个格式使用场景描述错误的是()。B、目前Parquet默认使用gzipC、ORC可以支持复杂的数据结构(比如Map等)D、RCFile是一种行列存储相结合的存储方式B、节点数据具有顺序性C、节点的触发器具有顺序性197.Spark默认的存储级别是()。198.当之前下线的分区重新上线时,要执行Leader选举,选举策略为()。204.启动一个容器的操作命令是()。205.使用消息队列的好处不包括()。206.Flink的分布式部署需要的组件是()。208.在Docker的运行过程中,对镜像的操作不包括()。209.在ZooKeeper中,节点可以设置监听器吗?()210.下面()端口不是Spark自带服务的端口。211.Docker运行的核心模块是()。213.Kafka的消息保留策略可以根据什么进行配置?()217.以下关于Spark中的RDD的说法,错误的是()。A、RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合D、RDD的不同分区可以被保存到集群中不同的节点上,从而可以在集群中的不218.以下哪种不是Hive支持的数据类型()。219.ZooKeeper中的一次读操作是原子的吗?()220.搜索nginx引擎的操作命令是()。221.在Sqoop中,使用哪个命令可以列出可用的数据库连接?()222.关于SecondaryNameNode哪项是正确的?()B、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间223.在ZooKeeper中,每个节点都有一个唯一的标识符,这个标识符是()。224.Hive中的自动分区是通过哪个配置参数启用的()?225.下面()不是RDD的特点。226.Flume的哪个组件用于将事件数据写入目标存储?()D、窄依赖的RDD之间无Shuffle操作229.sqoop的组件功能是()。230.以下选项中说法正确的是()。236.Dockerfile配置文件使用()命令指定基础镜像。多台主机的集群是()模式。A、bin/sqoopimport--connectjdbc:mysql://0:3306/userernameroot--delete-target-dir--target-dir/MysqlToHDFS1--B、in/sqoopimport--connectjdbc:mysql://localhoeroot--delete-target-dir--target-dir/MysqlToHDFS1--C、bin/sqoopimport--connectjdbc:mysql://localhost:3meroot--delete-target-dir--target-dir/MysqlToHDFS1-D、bin/sqoopimport--connectjdbc:mysql://localhmeroot--delete-target-dir--target-dir/MysqlToHDFS1--tablestudent--m11.3241.Sqoop中哪个参数用于指定要A、-field-separator242.Docker的三大核心不包括()。A、DataFrame可以看作是分布式的Row对象的集合,在二维表数据集的每一列244.下面()操作是宽依赖。245.Flink的安全性设置通常包括(),以确保只有授权用户能够访问Flink集246.查看HDFS的报告命令是()。答案:B多选题A、ClientB、基于本地模板导入4.Flink流式处理的数据源类型包括()。A、CollectionsA、已经安装了Hadoop集群和Hive数据库9.Kafka的特性()。10.Flink支持的部署模式有()。B、Local模式D、顺序节点的序号能无限增加D、持久性16.Hive中的哪个配置属性用于指定Hive表的默认存储格式()。18.Hive中的分区是如何定义的()。A、Sqoop可以使用多个mapper同时进行数据导出20.启动HDFS至少需要启动()进程。21.在Hive中,以下哪个配置属性用于指定Hive表的默认文件格式()。A、SQLA、hive.data.root.dir27.zookeeper在kafka中的作用()。D、发送到topic的数据需要经过zookeeper28.Flume可以应用于哪些数据传输场景?()30.Docker的常用镜像命令有()。32.Flume可以与其他哪些大数据技术进行集成?()33.Kafka相对传统技术有什么优势说法正确的是否()。34.关于Flink的架构表述正确的是()。A、Fink存储层支持专有的文件系统esos管理的集群上运行。也能部署在云端C、Flink提供两个核心API:DatasetAPI和DataStreamAPID、ataSetAPI做批处理,而DataStreamAPI做流处理35.Flink有哪些状态存储方式()。D、在将数据从MySQL导入到Hive时,38.Kafka负载均衡原理说法正确的是()。B、存在多个partiiton,每个partition有自己的replica,每个replica分布40.Linux的特点是以下()方面。44.RDD有()缺陷。45.要配置Hive的元数据存储用户名,应该设置哪个属性()。46.Sparkdriver的功能是()。47.Hive的分区和桶的主要区别是什么()。48.Flink支持的Source包括()。50.Sqoop中哪些参数可以用于指定要导入/导出的表?()53.以下哪些组件属于Hadoop生态圈()。54.关于Docker容器的run命令,下列参数匹配正确的有()。A、d:在后台运行容器B、i:已交互模式运行容器C、p:随机端口映射55.关于spark中数据倾斜引发原因正确的选项有()。56.下列有关ZooKeeper中的节点路径说法正确的是()。57.Hadoop的运行模式分为以下()种。59.以下是Spark中executor的作用是()。C、接受Driver端发送来的任务Task,作用在RDD上进60.Task运行不在以下选项中Executor上的工作单元有()。A、hive.query.parallelA、QueryOptimizer65.关于partition中的数据是如何保持到硬盘上的,说法正确的是()。A、一个topic分为好几个partition,每一个partition是以文件夹的形式保持在broker节点上面的B、每一个分区的命名是从序号0开始递增C、每一个partition目录下多个segment文件(包含xx.index,xx.log),默认是1GD、每个分区里面的消息是有序的,数据是一样的66.从RDD转换得到DataFrame包含两种典型的方法,分别是()。A、利用反射机制推断RDD模式B、使用编程方式定义RDD模式C、利用投影机制推断RDD模式67.Sqoop目前支持两种增量导入模式,分别是()和()模式。71.Flume的核心组件有哪些?()72.在Hive中,以下哪个配置属性用于设置Hive表的默认压缩格式()。A、press.fo73.使用dockerps命令可以查看到的信息有()。B、镜像名称C、容器的端口D、生存时间74.关于dockerbuild命令支持的选项,下列匹配正确的有()。A、network:指定run命令时网络模式C、add-host:添加自定义的主机名到IP的映射75.Hive支持哪种数据存储格式()。A、CSV76.Stage的Task的数量不是由()决定。77.Flink的主要特性包括()。79.下面关于SparkMLIib库的描述正确的是()。80.Flink的时间窗口有()。81.Flume的拦截器可以完成哪些操作?()82.Flink的核心组件包括()。83.Hadoop集群的三大核心组件是()。84.要在Hive中启用LLAP(LowLatencyAnalyticalProcessing),哪个配置属85.关于HadoopHDFS的文件操作,正88.Hive中的数据类型包括哪些()。89.Flume的HTTPSource和Sink组件支持哪些协议?()A、HTTP90.Flink的兼容性体现在()。91.Flink支持的时间操作类型包括()。92.Flink的缓存机制包含以下哪些内容()。94.HadoopHDFS自身的局限性包括()。95.要启用Hive的Tez执行引擎,应该配置哪个属性()。A、hive.execution.engA、hive.transaction.enab98.Flume的拦截器支持哪些操作?()99.()是流计算的处理流程。100.要启用Hive的压缩功能,应该配置哪个属性()。101.Hadoop的优点有哪些()?102.Flume可以用于哪些方面的数据处理?()103.Dockerfile配置文件中的指令包括()。105.下面关于Flink的说法正确的是()。C、Flink不是Apache软件基金会的项目106.Kafka的核心组件包括()。108.spark的特点包括()。109.SparkContext可以从()读取数据。110.下列属于RDD的转换算子的是()。111.ZooKeeper中的节点类型包括()。118.Flink常见的应用场景包括()。120.SparkStreaming的基本121.查看Docker容器的子命令有()。122.Flume的Spoolingdirectorysource有何特点?()124.RDD的操作主要是()操作。125.Sqoop是一个用于在Hadoop和结构化数据存储(如关系型数据库)之间传输数据的工具。以下哪些()是Sqoop的主要参数?126.Docker的核心概念包括()。127.ZooKeeper的集群中的Leader节点的选举是通过以下()方式实现。129.下面关于Flink窗口描述错误的是()。130.Flink核心组成部分提供了面向()的接口。131.Flume的可靠性机制包括哪些内容?()132.Spark要想很好的支持SQL,需要完成三大过程。这三大过程包括(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024人力资源管理全程服务委托协议
- 2024家具购买合同范文集锦
- 江南大学《高等数学Ⅱ(2)》2022-2023学年第一学期期末试卷
- 2024年企业授信贷款协议模板版B版
- 《制造企业人才盘点方案》
- 二零二四年度酒店管理服务合同标的及管理内容2篇
- 佳木斯大学《护理管理学》2021-2022学年第一学期期末试卷
- 暨南大学《麻醉拔牙及齿槽外科学》2021-2022学年第一学期期末试卷
- 暨南大学《国际事务专题讲座》2021-2022学年第一学期期末试卷
- 济宁学院《体操Ⅰ》2021-2022学年第一学期期末试卷
- 物业维修工的服务规范考核标准
- 医疗预防保健机构的拟聘用证明
- (完整word版)儿童感觉统合能力发展评定量表
- 儿歌《别说我小》PPT课件.ppt
- 语文课堂上小组合作学习的几点尝试
- 烟草专卖行政执法的现状与对策
- 图像在初中物理教学的应用
- 已有多层住宅加装电梯的可行性研究——毕业论文
- (完整版)like练习题
- 第二章 火炮工作原理
- 个人所得税自行纳税申报表(A表)(2019版)
评论
0/150
提交评论