大数据技术与应用(咸阳职业技术学院)知到智慧树答案_第1页
大数据技术与应用(咸阳职业技术学院)知到智慧树答案_第2页
大数据技术与应用(咸阳职业技术学院)知到智慧树答案_第3页
大数据技术与应用(咸阳职业技术学院)知到智慧树答案_第4页
大数据技术与应用(咸阳职业技术学院)知到智慧树答案_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章单元测试第二章单元测试第三章单元测试第四章单元测试第五章单元测试第六章单元测试第七章单元测试第八章单元测试第九章单元测试第十章单元测试1【判断题】(2分)大数据(BigData),是指可以在一定时间范围内使用常规软件工具进行捕捉、管理和处理的数据集合。()正确答案:AA.错B.对2【单选题】(3分)Hadoop之父是()。正确答案:AA.DougCuttingB.KentBeckC.MartinFowler3【单选题】(3分)大数据的起始计量单位至少是P,即()个T正确答案:DA.10000B.50C.10D.10004【多选题】(4分)大数据的特征有()。正确答案:ABCDA.数据种类繁多B.数据量大C.计算速度快D.价值密度低5【多选题】(4分)Hadoop核心组件有()正确答案:ABCA.YARN(集群资源管理和任务调度框架):解决资源任务调度B.MapReduce(分布式计算框架):解决海量数据计算C.HDFS(分布式文件存储系统):解决海量数据存储1【单选题】(3分)Linux下启动HDFS的命令是()。正确答案:AA.start-dfs.shB.startdfsC.start-dfscmdD.hdfs2【单选题】(3分)生成密钥对的命令是()。正确答案:CA.sshB.ssh-copy-idC.ssh-keygenD.ssh-add3【单选题】(3分)查看hadoop版本号的命令是()。正确答案:BA.Hadoop-versionB.hadoopversionC.hadoop-versionD.Version-hadoop-4【判断题】(2分)Hadoop开发过程中一般采用普通用户登录。()正确答案:AA.对B.错5【单选题】(2分)生效环境变量的命令是(

)。正确答案:CA.vim/etc/profileB.vi

/etc/profileC.source/etc/profileD.cat/etc/profile1【单选题】(2分)Client端上传文件的时候下列哪项正确?()正确答案:CA.Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作B.NameNode负责Block复制工作C.Client端将文件切分为Block,依次上传D.数据经过NameNode传递给DataNode2【单选题】(2分)下面哪个程序负责HDFS数据存储()。正确答案:CA.secondaryNameNodeB.NameNodeC.DatanodeD.Jobtracker3【多选题】(2分)Cloudera提供哪几种安装CDH的方法?()正确答案:ABCDA.ClouderamanagerB.RpmC.YumD.Tarball4【判断题】(2分)Nagios不可以监控Hadoop集群,因为它不提供Hadoop支持。()正确答案:BA.对B.错5【判断题】(2分)Ganglia不仅可以进行监控,也可以进行告警。()正确答案:AA.对B.错1【单选题】(2分)Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是()。正确答案:CA.200MB.2000MC.1000MD.1500M2【单选题】(2分)DataNode通过()与NameNode保持通信。()正确答案:BA.短连接B.长连接C.超长连接D.无连接3【多选题】(2分)下列哪项可以作为集群的管理?()正确答案:ABCA.ZookeeperB.PdshC.PuppetD.ClouderaManager4【多选题】(2分)配置机架感知的下面哪项正确:()正确答案:ABCA.MapReduce会根据机架获取离自己比较近的网络数据B.如果一个机架出问题,不会影响数据读写C.写入数据的时候会写到不同机架的DataNode中5【判断题】(2分)如果NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。()正确答案:BA.对B.错1【单选题】(2分)Yarn各模块组成有:()正确答案:CA.JsonB.VueC.Resourcemanager、nodemanager、applicationMasterD.Angular2【判断题】(2分)Yarn附则整个集群的资源管理功能,每个任务都单独有一个“应用服务器”:()正确答案:AA.对B.错3【单选题】(2分)以下关于yarn的描述正确的是:()正确答案:DA.框架升级更容易,在yarn中,各种计算框架不再是作为一个服务部署到集群的各个节点上。B.目前可以支持多种计算框架运行在yarn上面,比如MapReduce、storm、spark、fookk等。C.对于资源的表示以硬盘为单位。D.支持多个框架,yarn不再是一个单纯的计算框架,而是一个框架管理器。4【单选题】(2分)以下关于yarn的说法正确的是:()正确答案:AA.Yarn是采用两级式资源分配方案B.Yarn只能运行Hadoop生态下的MapReduce运算框架C.存在于Hadoop1.0中D.Spark、stormstreaming、igraph等计算框架不能再yarn上运行,也不能访问hdfs上的数据资源5【单选题】(2分)对新一代资源管理调度框架YARN的理解正确的是:()正确答案:DA.YARN的体系结构包含三个组件:ResourceManager,NodeManager,ApplicationMasterB.YARN既是资源管理调度框架,也是一个计算框架C.MapReduce2.0是运行在YARN之上的计算框架,由YARN来为MapReduce提供资源管理调度服务D.YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架1【判断题】(2分)HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。()正确答案:BA.错B.对2【单选题】(2分)谷歌公司关于MapReduce模型的论文发布于()年正确答案:DA.2006B.2003C.2005D.20043【单选题】(2分)下列关于MapReduce模型的说法错误的是()正确答案:AA.MapReduce模型是一种理论模型,无法实现B.MapReduce模型具有简单易学,使用灵活的特点C.MapReduce模型的核心思想是“分而治之”D.MapReduce模型可实现大规模数据的并行计算4【判断题】(2分)大数据的开发和利用,关键在于大数据技术的支撑。其中,MapReduce是分布式数据库。()正确答案:BA.对B.错5【判断题】(2分)适合MapReduce框架处理的任何和数据集要求待处理的数据集可以分解为许多小的数据子集,而且每个数据子集的处理不依赖也不影响其他数据子集的处理。()正确答案:BA.错B.对1【单选题】(2分)()是一个实时收集、分析、展示、监控数据的分布式数据库,它基于HBase存储和查询监控数据。正确答案:CA.KijiB.KijiExpressC.OpenTSDBD.KijiMR2【单选题】(2分)HBase每个行有一个()唯一标识了行的地址。正确答案:DA.名B.时间戳C.列族D.行键3【单选题】(2分)在水平方向,HBase的一张表由一个或多个()组成。正确答案:CA.列B.时间戳C.列族D.行4【单选题】(2分)HBase的每个列族均对应了一个()属性。正确答案:AA.时间戳B.行键C.列名D.列键5【单选题】(2分)在垂直方向,HBase的一张表有多个()来组成。正确答案:BA.行B.行族C.列族D.列1【单选题】(2分)下列关于Hive特点总结正确的选项是()。正确答案:AA.Hive支持自定义函数,用户可以根据自己的需求去定义函数B.HiveSQL执行时,需要避免节点出现问题C.Hive适合处理小批量数据D.Hive支持自由的扩展集群的规模,只需要重启服务即可2【单选题】(2分)Hive的元数据存储在derby和MySQL中有什么区别()。正确答案:CA.支持网络环境B.没区别C.多会话(Moresession)D.数据库的区别3【单选题】(2分)Hive有四个驱动器,下面那个不是()。正确答案:AA.策略器(Strategyimplement)B.优化器C.解释器D.编译器4【单选题】(2分)Hive有什么好处()。正确答案:BA.可以存储数据B.可以通过语句自动编译mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)C.可以直接在表中插入数据D.可以使用sql,操作存储在hdfs中的数据5【单选题】(2分)下列哪个组件不属于Hive架构()正确答案:DA.MySQLB.HDFSC.ClientD.TaskManager1【判断题】(2分)Flume可以将应用产生的数据存储到任何集中存储器中,比如HDFS,HBase。()正确答案:BA.错B.对2【判断题】(2分)Flume的管道是基于事务,保证了数据在传送和接收时的一致性。()正确答案:BA.错B.对3【判断题】(2分)Flume是可靠的,容错性高的,可升级的,易管理的,并且不可以定制。()正确答案:AA.错B.对4【判断题】(2分)实时性,Flume有一个好处可以实时的将分析数据并将数据保存在数据库或者其他系统中。()正确答案:BA.错B.对5【判断题】(2分)Flume的配置很繁琐,source,channel,sink的关系在配置文件里面交织在一起,便于管理。()正确答案:BA.对B.错1【判断题】(2分)Sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。()正确答案:BA.错B.对2【判断题】(2分)Sqoop核心的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论