2024年知识竞赛-大数据智能办公系统知识考试近5年真题附答案_第1页
2024年知识竞赛-大数据智能办公系统知识考试近5年真题附答案_第2页
2024年知识竞赛-大数据智能办公系统知识考试近5年真题附答案_第3页
2024年知识竞赛-大数据智能办公系统知识考试近5年真题附答案_第4页
2024年知识竞赛-大数据智能办公系统知识考试近5年真题附答案_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(图片大小可自由调整)2024年知识竞赛-大数据智能办公系统知识考试近5年真题荟萃附答案第I卷一.参考题库(共100题)1.在scala中的模式匹配可以匹配哪些类型()A、通配符匹配B、常量匹配C、变量匹配D、构造函数匹配等2.flume在读取文本文件的时候,一个文本数据是一个?()A、agentB、eventC、sourceD、float3.下面哪个端口不是spark自带服务的端口()A、8080B、8090C、18080D、40404.spark中的action算子的特性是()A、懒执行B、立即执行C、一致性D、冗余性5.Flume中配置一个Agent,需要配置的有哪些?()A、配置sourceB、配置sinkC、配置channelD、将source、channel、sink连接起来6.有关flume是什么说法正确的是()A、消息中间件B、日志收集系统C、缓冲组件D、以上都不对7.scala中的Object中通常在里面放一些静态的()A、FieldB、MethodC、管理块服务器D、Source8.maven项目是通过pom.xml文件来进行依赖jar包的加载的9.Set集合是无序不重复的集合10.reduceRight通过如下程序块其输出结果为varlist=List(1,2,99,4,100)varjs=list.reduceRight(_max_println(js)()A、$1B、100C、206D、以上答案都不对11.SparkStreaming有高吞吐量和容错能力强等特点12.Scala关于变量定义、赋值,错误的是?()A、vala=3B、vala:String=3C、varb:Int=3;b=6D、varb="HelloWorld!";b="123"13.以下组件中和mesos相类似的组件是哪个()A、yarnB、hdfsC、mapreduceD、以上都不对14.spark切分完的partition的大小必须和block一致15.对于以下2个列表的操作,下面那些说法说法正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(4,5,1,2,3,)16.flatMap类似于map,但是每一个输入元素可以被映射为0或多个输出元素(所以func应该返回一个序列,而不是单一元素),所有元素会被压瘪17.Linux中重启系统的指令有哪些()A、rebootB、haltC、shutdown-rD、shutdown-h18.spark架构中哪些架构可以相互转化()A、sparkcoreB、sparksqlC、sparkstreamingD、sparkR19.函数在scala中的地位说法正确的有哪些选项()A、一等公民B、可以独立定义C、不能独立定义D、函数不能赋值给变量20.表达式for(iA、11;12;13;21;22;23;31;32;33B、11;13;21;23;31;33C、12;13;21;23;31;32D、11;12;21;22;31;3221.DataFrame也是一个分布式数据容器22.scala中的object描述下列那些正确()A、object是scala的关键字B、scala中的object和java中的object是一样的C、object本身就是一个单例对象D、scala中的object是一个伴生对象23.不能够遍历Array的算子是哪个()A、foreachB、countC、collectD、flatmap24.standalone组件在spark中的角色是其自带的()A、任务调度框架B、任务模式C、资源调度框架D、任务整合25.sparkSql可以访问hive数据,并将其结果取回作为RDD使用26.spark的运行模式有哪些?()A、javaB、pythonC、scalaD、go27.spark框架中,机器学习库的框架是哪个()A、hadoopB、spark?streamingC、mlbaseD、RDD28.SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD29.spark中map算子具有以下哪个特性()A、懒执行B、立即执行C、一致性D、冗余性30.Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性31.以下对map函数说法错误的是()A、对传入的每个元素都进行映射,返回一个处理后的元素B、对每个元素都处理,没有返回值C、对传入元素进行条件判断,必须返回布尔值D、对传入元素进行条件判断,没有返回值32.在scala中定义变量时,变量的类型可以不写33.spark中persist算子是()的算子A、延迟执行B、立即执行C、等待执行D、陈列执行34.能够在sparkSql中写sql语句35.flume中用来缓存数据的组件是channe36.spark进行数据切分的时候,划分完成的partition个数和hdfs中block个数一致37.Linux中查看一个文本文件的指令有哪些()A、结构化数据文件B、hive的表C、外部数据库D、RDDs38.下面哪些系统可以和Kafka集成()A、FlumeB、StromC、SparkD、ElasticSearch39.伴生类和伴生对象说法正确?()A、单例对象与类同名时,这个单例对象被称为这个类的伴生对象,而这个类被称为这个单例对象的伴生类B、伴生类和伴生对象要在同一个源文件中定义C、伴生对象和伴生类可以互相访问其私有成员D、不与伴生类同名的单例对象称为孤立对象40.下面对于spark的特点描述正确的是()A、良好的容错性:在分布式数据集计算时通过checkpoint来实现容错,当某个运算环节失败时,不需要从头开始重新计算B、开发便捷性:spark通过scala,java,pythonapi及交互式shell提供丰富的使用方式C、不适合细粒度更新操作:Spark的运算是面向集合的,不适用于需要异步细粒度更新状态的应用,例如web服务的DAO层或web爬虫等D、以上答案都不符合其特性41.跟在类名后面的是主构造器42.关于Scala中的trait和Java中的Interface描述错误的是?()A、Scala特质和Java接口都可以包含抽象方法和具体实现。B、Scala和Java都不允许多重继承,但可以叠加多个特质或接口。C、Java只能在类层面上添加接口的实现,而Scala可以在类和对象层面上“混入”特质。D、Trait可以写方法的实现43.flume的配置文件不能给多个agent使用44.以下关于Scala中函数的描述错误的是?()A、函数是“头等公民”,就和数字一样。B、可以将函数赋值给变量,如valfun=scala.math.ceil。C、支持非具名函数,也即匿名函数。D、可以将函数作为参数,传递给其它函数。45.scala语言中var定义的变量,赋值后不能改变46.在flume中,以下属于agent组件的成员是()A、sourceB、ChannelC、GridFSD、Sink47.sparkAPI支持哪种语言()A、masterB、workerC、applicationD、driver48.reduce求和输出结果为varlist1=list1(1,2,3,4)varsum=list1.reduce(_+_)println(sum)()A、10B、1C、4D、以上答案都不对49.reverse会将所给的对象的顺序反转,请说出下列程序输出结果为valarr=Array(1,2,3,4,5)//带下标的for循环for(iA、54321B、43215C、32154D、1234550.关于高阶函数描述错误的是:()A、在程序中应该首先被定义的函数B、将函数作为参数其他函数的参数使用C、执行时间长的函数D、函数的方法体比较长51.spark是基于()运行的计算框架A、内存B、磁盘C、内存加磁盘D、网络52.以下组件哪个不是Flume的组成部分()A、sourceB、sinkC、channelD、topic53.kafka是一个关于什么的中间件()A、消息B、传输C、操作D、事物54.在scala中使用那个关键字定义方法()A、defB、mainC、objectD、class55.下面有关scala语言描述正确的是?()A、varval第一个是对scala中对变量的定义标志,其中var表示可变,val表示不可以变量B、content为变量的名字C、String表示是变量的类型,如果没有写,将来会自动推断D、"helloworld"为变量的初始化56.flume在大数据生态圈中的作用是()A、监测收集数据B、处理数据C、计算数据D、存储数据57.spark中cache算子和persist算子的关系()A、_useDiskB、_useMemoryC、_useOffHeapD、_useDes58.在scala中如果使用for循环,其格式必须如下for(vari=0;i<10;i++){}59.闭包是一个函数,返回值依赖于声明在函数外部的一个或多个变量60.以下对于reduce操作说法严格一样正确的是vart=List(1,2,3,4,5)println(t.reduce((a,b)=>a+b))()A、println(t.reduce(_+_))是用通配符代表前后2个元素相加,与题干一致B、println(t.reduceLeft(_+_))reduceLeft与reduce一致,通配符表示前后2个元素相加,与题干一致C、println(t.reduceRight((a,b)=>a+b))是用通配符代表前后2个元素相加,但是累加顺序从右边开始,与题干不一致D、println(t.reduceRight(_+_))是用通配符代表前后2个元素相加,但是累加顺序从右边开始,与题干不一致61.在scala中对于列表的操作,那些说法说法正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t2.:::(t)得到List(1,2,3,4,5)62.Rdd不能够转换成DataFrame63.sparkSql不能使用jdbc读取数据库的数据64.对于以下代码描述有误的是?valdata=Map(1->"One",2->"Two")valres=for((k,v)1))yieldv()A、运行后res的结果为List("Two")。B、运行后res的结果为List("One","Two")。C、对映射data中的每一个(键,值)对,k被绑定对键,而v则被绑定到值。D、其中的if(k>1)是一个守卫表达式。65.DiscretizedStream是SparkStreaming的基础抽象,代表持续性的数据流和经过各种Spark原语操作后的结果数据流66.以下关于Namenode的说法正确的是()A、协调客户端对文件的访问。B、记录命名空间内的改动或者空间本*省属性的改动。C、记录?每个文件数据快在各个Datanode上的位置和副本信息。D、管理文件系统的命名空间。67.在scala中,AnyRef是String类的父类68.spark架构中的persist算子在源码中最多有()备份A、2B、3C、4D、169.在scala中所有类型都继承自Object70.该方法只能用于连接两个List类型的集合71.spark中的程序必须有以下哪几种算子构成()A、转换算子,action算子B、转换算子,控制算子C、转换算子,tracform算子D、转换算子72.以下哪个组件不是agent中包含的()A、sourceB、sinkC、channelD、broker73.在HBase框架中,下面哪些选项被使用()A、HDFSB、GridFSC、ZookeeperD、EXT374.SparkStreaming中的Dstream可以看作是在RDD上面又封了一层的数据结构75.sparkcore组件中的核心概念是()A、rddB、datasetC、dataframeD、data76.sparkSql不能够访问hive中的数据77.java中,关于数组的说法,哪几个是正确的()A、数组的长度是固定的B、数组的长度是可变的C、数组可以存放不同的数据类型的数据D、数组只能存放单一的数据类型的数据78.下面算子中哪个是宽依赖的()A、mapB、flatmapC、reducebykeyD、sample79.以下关于特质的说法错误的是?()A、类可以实现任意数量的特质。B、特质可以要求实现它们的类具备特定的字段、方法或超类。C、与Java接口(Interface)相同,Scala特质也可以提供方法和字段的实现。D、当将多个特质叠加在一起时,顺序很重要——其方法先被执行的特质排在更后面。80.基于maven的项目,有且必须有一个pom.xml文件81.与spark基于内存相比,mapreduce是基于()运行的计算框架A、内存B、磁盘C、内存加磁盘D、网络82.DataFrame更像传统数据库的二维表格,除了数据以外,还记录数据的结构信息,即()A、schemaB、表结构C、RowD、DataSet83.spark架构计算速度比mapreduce计算速度快单纯因为内存84.spark架构在运行过程中是通过driver完成资源申请85.以下的计算结果选项中那个正确varlist=List(1,2,3,4,5)varjs=list.fold(100)(_+_)println(js)()A、115B、15C、5D、8586.内存计算下,Spark?比?Hadoop?快10倍87.zookeeper数据模型是带有默认权限的88.下面输出与其他不一致的是?()A、valw="World";println(s"Hello$w")B、valw="World";println("Hello$w")C、println("HelloWorld")D、valw="World";println("Hello"+w)89.Kafka是由哪个组织研的组件()A、googleB、apacheC、sunD、oracle90.sortByKey算子在一个(K,V)的RDD上调用,K必须实现Ordered接口,返回一个按照key进行排序的(K,V)的RDD91.日志收集系统Flume现在使用的是哪个版本?()A、NG版本B、OG版本C、DG版本D、MG版本92.sparkSql仅仅支持查询原生的RDD,其他方式的查询都不支持93.SparkStreaming中的Dstream和SparkSql中的DataFrame其实是一回事,没有区别94.flume中的三大组件为source、channel、sinks95.在scala中,以下哪些属于动作算子()A、foreachB、reduceC、countD、map96.创建rdd可以有如下几种?()A、由外部存储系统的数据集创建,包括本地的文件系统B、由一个已经存在的Scala集合创建C、比如所有Hadoop支持的数据集,比如HDFS、Cassandra、HbaseD、以上说法都不对97.spark架构中会出现控制算子的原因是以下哪个选项()A、spark备份的安全原因B、spark用户的要求C、兼容hiveD、兼容hbase98.下列哪些语句关于Java内存回收的说明是正确的()A、程序员必须创建一个线程来释放内存?B、内存回收程序可以在指定的时间释放内存对象C、内存回收程序允许程序员直接释放内存D、内存回收程序负责释放无用内存99.变量声明时不指定类型,编译器会报错误,编译不过去100.action算子在spark程序运行的过程中有什么作用()A、懒执行B、立即执行C、一致性D、冗余性第I卷参考答案一.参考题库1.参考答案:A,B,C,D2.参考答案:B3.参考答案:B4.参考答案:B

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论