Hadoop大数据技术与项目实战知到智慧树期末考试答案题库2024年秋山西职业技术学院_第1页
Hadoop大数据技术与项目实战知到智慧树期末考试答案题库2024年秋山西职业技术学院_第2页
Hadoop大数据技术与项目实战知到智慧树期末考试答案题库2024年秋山西职业技术学院_第3页
Hadoop大数据技术与项目实战知到智慧树期末考试答案题库2024年秋山西职业技术学院_第4页
Hadoop大数据技术与项目实战知到智慧树期末考试答案题库2024年秋山西职业技术学院_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Hadoop大数据技术与项目实战知到智慧树期末考试答案题库2024年秋山西职业技术学院Flume基于事务传输event(批量传输),使用两个独立的事务分别处理source到channel和channel到sink,失败时会将所有数据回滚进行重试。该事务遵循“最少一次”语义,因此数据不会丢失,但有可能重复。()

A:错B:对

答案:对Sqoop作为大数据平台的数据搬运工,比较轻松地打开了关系数据库与分布式存储体系之间方便之门。为传统数据仓库平稳过渡到大数据平台作出了重要贡献。()

A:对B:错

答案:对Event的最大定义为1024字节,超过会被切割放到下一个Event中。()

A:对B:错

答案:错实现全外连接的关键字是join。()

A:错B:对

答案:错数据仓库主要是为决策分析提供数据。()

A:错B:对

答案:对饼图主要用于展现数据的变化趋势。()

A:错B:对

答案:错本项目中,/opt目录下存放着项目所安装的全部软件及所有数据文件。()

A:对B:错

答案:对Kafka最大的特性就是可以实时的处理大量数据以满足各种需求场景,比如基于hadoop的批处理系统、低延迟的实时系统、storm/Spark流式处理引擎,web/nginx日志、访问日志,消息服务等。()

A:错B:对

答案:对在分流标记拦截器中,初始化和关闭方法进行空实现即可。()

A:错B:对

答案:对在编写Flume拦截器代码时,build方法是拦截器类的核心方法,功能是将当前自定义的LogETLInterceptor类进行实例化,从而提供给Flume进程在运行过程中对其调用。()

A:对B:错

答案:对删除Kafka主题时,在配置文件中设置delete.topic.enable=true,才是完全删除,否则为标记删除。

A:对B:错

答案:对insertoverwrite命令将数据写入表中()

A:错B:对

答案:对Kafka内部有两个topic分别用来接收Flume传输过来的数据,topic_start接收启动日志数据,topic_event接收事件日志数据。()

A:错B:对

答案:对数据仓库就是数据库。()

A:错B:对

答案:A:错启动hive之前只需要启动hive--servermetastore服务。()

A:错B:对

答案:错折线图主要以百分比形式显示每一类数值相对于总数值的大小。()

A:对B:错

答案:错Sqoop数据迁移时,命令参数fields-terminated-by代表导入数据的切分格式。

A:对B:错

答案:对通过Sqoop可以将关系型数据库的数据迁移到Hadoop平台,但是不可以将Hadoop平台的数据迁移到关系型数据库。()

A:对B:错

答案:错Hadoop是Apache基金会开发的一款分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题,从广义上来说,Hadoop通常指的是Hadoop生态圈。()

A:错B:对

答案:对mapred-site.xml配置文件主要是针对MapReduce程序在YARN集群上运行的一些相关参数的配置,需要找到对应的文件。()

A:对B:错

答案:对在编写flume拦截器代码中event.getHeaders()方法的功能是()。

A:从各个body中获取body的头部信息B:从各个body中获取header的头部信息C:从各个body中获取map的信息D:从各个body中获取key的信息

答案:从各个body中获取header的头部信息创建bigdata用户的命令是()。

A:subigdataB:bigdataALLC:useraddbigdataD:sudoers

答案:useraddbigdata在Flume数据传输过程中,Source的主要功能是和外部数据源对接,负责数据的采集,将采集回来的数据传递给()。

A:SinkB:AppC:ChannelD:Source

答案:Channel在Flume数据传输系统中,memorychannel的特点是()。

A:数据存储于磁盘,优势:传输速度快;劣势:可靠性差B:数据存储于磁盘,优势:可靠性高;劣势:传输速度慢C:数据存储于内存,优势:可靠性高;劣势:传输速度慢D:数据存储于内存,优势:传输速度快;劣势:可靠性差

答案:数据存储于内存,优势:传输速度快;劣势:可靠性差当Kafka启动之后,会把元数据保存到哪里()?

A:MySQLB:HDFSC:ZookeeperD:Hive

答案:Zookeeper在编写Flume拦截器代码时,initialize()方法的作用是:当程序中需要开辟某种资源时申请资源,该方法的特点是程序至始至终,只执行();

A:两次B:一次C:四次D:三次

答案:一次在Flume数据传输系统中,ChannelProcessor是()。

A:Channel选择器B:Channel调节器C:Channel变压器D:Channel处理器

答案:Channel处理器项目实施流程中没有哪一步()

A:下载数据B:数据访问C:数据导出D:数据仓库设计开发

答案:下载数据在编写Flume拦截器代码时,intercept(Listevents)方法的功能是用来接收source传递的批次数据,对其进行()。

A:获取进程B:管理控制C:开辟资源D:扩容

答案:管理控制Sqoop的工作本质是()。

A:存储数据B:接收数据C:处理数据D:迁移数据

答案:迁移数据在Linux系统中,()目录默认为空,在本课程项目开发过程中是使用最多的目录。

A:RootB:HomeC:EtcD:opt

答案:optPyEcharts中,折线图类是()。

A:BarB:PieC:LiquidD:Line

答案:Line使用hdfsdfs-count/查看根目录下面数据文件的个数,显示结果为“147248745”,其中14代表的是()

A:子目录的个数B:文件的嵌套层数C:所有文件的字节数D:文件个数

答案:文件的嵌套层数用于文件在网络间安全传输的软件是()。

A:VMwareB:XftpC:IDEAD:Xshell

答案:Xftp在ETL拦截器中,我们重写的初始化方法initialize()可以理解为是()。

A:进行流程控制B:资源的申请C:业务逻辑处理D:资源的关闭

答案:资源的申请在Zookeeper的配置文件中,要设置的dataDir参数的功能是()。

A:配置启动ZookeeperB:指定Zookeeper存储数据的位置C:接收客户端的访问请求D:添加Zookeeper集群的映射信息

答案:指定Zookeeper存储数据的位置谷歌开源的三篇大数据论文有()。

A:HDFSB:GFSC:BigTableD:MapReduce

答案:B:GFSC:BigTableD:MapReduce下列属于事件日志数据的是()。

A:用户发表评论数据B:商品点击数据C:用户点赞数据D:用户收藏数据

答案:用户发表评论数据###商品点击数据###用户点赞数据###用户收藏数据yarn集群核心配置的文件是()。

A:yarn-site.xmlB:hdfs-site.xmlC:mapred-site.xmlD:core-site.xml

答案:mapred-site.xml###yarn-site.xml以下关于Kafka的存储机制描述正确的是()。

A:顺序写入B:分区存储C:非顺序写入D:可靠性

答案:可靠性###顺序写入###分区存储创建每日新增设备数据表包含有()哪些字段

A:统计日期字段B:新增设备数量字段C:设备唯一标识D:用户ID,

答案:新增设备数量字段###统计日期字段Hadoop具有四大优势,是()。

A:高可靠性B:高效性C:高容错性D:高扩展性

答案:高容错性###高扩展性###高效性###高可靠性创建活跃设备数据表中包含有哪些字段()

A:日期是否为周末和月末B:统计日期C:当周用户数量D:当月用户数量

答案:当月用户数量###当周用户数量###统计日期###日期是否为周末和月末在JSON字符串中,Object结构是()。

A:valueB:{key:value,key:value...}C:KeyD:key,value

答案:{key:value,key:value...}###key,value在本教材的实战操作中,打开hosts文件,设置三台虚拟机的IP地址及映射名称,需要输入()内容。

A:node4B:node3C:node1D:node2

答案:node1###node3###node2下列属于事件日志数据合法校验步骤的是()。

A:对数据进行校验B:对日志进行切割C:校验服务器时间D:校验是否为json格式

答案:校验服务器时间###对数据进行校验###对日志进行切割###校验是否为json格式flume中自定义的分流标记拦截器可以实现()两种分流。

A:错误日志流B:启动日志流C:事件日志流D:时间日志流

答案:启动日志流###事件日志流本项目编写Flume自定义拦截器步骤()

A:实现ExceptionB:重写四个方法C:静态内部类,实现Interceptor.BuilderD:实现Interceptor

答案:重写四个方法###静态内部类,实现Interceptor.Builder###实现Interceptor在HQL实现过程中,一个语句里要执行()两部分操作。

A:将查询结果直接保存到对应的统计结果表中B:查询业务数据表中的数据C:数据可视化的展示D:分析数据

答案:B:查询业务数据表中的数据以下描述正确的是()

A:整个MapReduce的执行过程可以分为五个阶段B:shuffle阶段是整个MapReduce执行过程中最复杂的一步C:Reduce阶段是将一个大的计算任务分解成多个小任务D:Map阶段产生的数据会通过shuffle阶段,在内存缓冲区中进行数据的分区、排序、分组的处理

答案:A/B/Dpyecharts的Page中内置了以下哪些布局方式?()

A:DraggablePageLayoutB:DisplayPageLayoutC:SimplePageLayoutD:ComplexPageLayout

答案:SimplePageLayout###DraggablePageLayout在编写Flume拦截器代码中,实现Interceptor需要重写()方法

A:initialize初始化B:publicEventintercept(Eventevent)处理单个EventC:publicList<Event>intercept(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论