1+x大数据试题库与参考答案_第1页
1+x大数据试题库与参考答案_第2页
1+x大数据试题库与参考答案_第3页
1+x大数据试题库与参考答案_第4页
1+x大数据试题库与参考答案_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1+x大数据试题库与参考答案一、单选题(共93题,每题1分,共93分)1.HBase依赖_()存储底层数据A、HDFSB、HadoopC、MemoryD、MapReduce正确答案:A2.flume中那种source类型支持Unix的命令标准在生产数据()A、Avr0SourceB、ThriftSourceC、ExecSourceD、JMSSource正确答案:C3.下列不属于NameNode的功能()。A、提供名称查询服务B、保存Block信息,汇报Block信息C、保存metadata信息D、metadata信息在启动后会加载到内存正确答案:B4.Hadoop作者A、MartinFowlerB、KentBeckC、Dougcutting正确答案:C5.tar命令用于对文件进行打包压缩或解压,-t参数含义()A、创建压缩文件B、查看压缩包内有哪些文件C、解开压缩文件D、向压缩归档末尾追加文件正确答案:B6.下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?()A、shareB、sbinC、etcD、bin正确答案:B7.HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、64MBB、75MBC、一个map读取64MB,另外一个map读取11MB正确答案:C8.关于Hadoop的运行机制过程顺序说法正确的是()A、作业初始化--作业提交--任务分配--任务的执行--任务进度和状态的更新--任务结束B、任务分配--作业提交--作业初始化--任务的执行--任务进度和状态的更新--任务结束C、任务执行-作业提交--作业初始化--任务的分配--任务进度和状态的更新--任务结束D、作业提交--作业初始化--任务分配--任务的执行--任务进度和状态的更新--任务结束正确答案:D9.Sqoop的底层实现是()?A、HDFSB、MapReduceC、HbaseD、Hadoop正确答案:B10.Hadoop官方真正支持的操作系统是()A、UNIXB、WindowsC、DOSD、Linux正确答案:D11.Hive默认的元存储是保存在内嵌的()数据库中A、MySQLB、DerbyC、OracleD、SqlServer正确答案:B12.在HDFS分布式文件系统中,一般采用冗余存储,冗余因子通常设置为()A、1B、2C、3D、4正确答案:C13.Flume用于收集数据,其传输的数据基本单位是?A、SplitB、BlockC、EventD、Packet正确答案:C14.有关使用sqoop抽取数据的原理的描述不正确的是()A、sqoop抽取数据是个多节点并行抽取的过程,因此map的个数设置的越多性越好B、sqoop在抽取数据的时候可以指定map的个数,map的个数决定在hdfs生成的C、sqoop抽取数据的时候需要保证执行当前用户有权限执行相应的操作D、sqoop任务的切分是根据split字段的(最大值-最小值)/map数正确答案:A15.以下选项哪个是HDFS的名称节点()A、DataNodeB、SecondaryNodeC、NodeD、NameNode正确答案:D16.Sqoop是Hadoop和关系数据库服务器之间传送数据的工具,下列哪种数据库是不支持使用Sqoop直接进行数据传送()A、PostgresB、MySQLC、RedisD、Oracle正确答案:C17.HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是:()A、一次写入,少次读写B、多次写入,少次读写C、一次写入,多次读写D、多次写入,多次读写正确答案:C18.以下关于日志采集工具Flume的说法不正确的是?A、Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统B、Flume适用于大量数据的实时数据采集C、Flume支持多级级联和多路复制D、Flume的数据源和目标都是可定制、可扩展的正确答案:C19.配置Hadoop环境变量修改()文件A、vi/etc/profilesB、vi~/input/dataC、vi/etc/profileD、vi/etc/hosts正确答案:C20.下列选项中,正确描述flume对数据源的支持是?A、只能使用HDFS数据源B、可以配置数据源C、不能使用文件系统D、不能使用目录方式正确答案:B21.MapReduce编程模型,键值对<key,value>的key必须实现哪个接口?()A、WritableComparableB、ComparableC、WritableD、LongWritable正确答案:A22.狭义的Hadoop是一个适合大数据分布式存储和分布式计算的平台,不包括下面哪个组件?()A、HDFSB、MapReduceC、YarnD、HBase正确答案:D23.大数据平台Hadoop的组件中,提供分布式协作服务的组件是()A、HBaseB、ZooKeeperC、SqoopD、Hive正确答案:B24.关于SecondaryNameNode下面哪项是正确的()。A、它对内存没有要求B、SecondaryNameNode应与NameNode部署到一个节点C、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间D、它是NameNode的热备正确答案:C25.在Centos7系统中,查看和修改IP信息需要用到()文件A、/etc/sysconfig/network/ifcfg-ens0B、/etc/sysconfig/network-script/ifcfg-ens0C、/etc/sysconfig/ifcfg-ens0D、/etc/resolv.conf正确答案:B26.HDFS首先把大数据文件切分成若干个小的数据块,再把这些数据块分别写入不同的节点,这些负责保存文件数据的节点被称为?()A、NameNodeB、DataNodeC、SecondaryNameNodeD、Block正确答案:B27.以下选项哪个命令是用hadoop用户登录,通过scp命令实现密钥拷贝到slave1节点上()A、scp~/.ssh/id_rsa.pubroot@slave1:~/B、scp~/.ssh/id_rsa.pubhadoop@slave2:~/C、scp~/.ssh/id_rsa.pubslave1@root:~/D、scp~/.ssh/id_rsa.pubhadoop@slave1:~/正确答案:D28.采用多副本冗余存储的优势不包含(.A、节约存储空间B、加快数据传输速度C、容易检查数据错误D、保证数据可靠性正确答案:A29.在导入开始之前,Sqoop检索出表中所有的列以及列的SQL数据类型,这些SQL类型被映射什么类型(C)A、CB、C++C、JavaD、Python正确答案:C30.大数据的特点不包括下面哪一项()。A、多结构化数据B、巨大的数据量C、价值密度高D、增长速度快正确答案:C31.显示当前所在目录的命令是()A、mkdirB、pwdC、cdD、ls正确答案:B32.下列哪项通常是集群的最主要的性能瓶颈A、CPUB、网络C、磁盘D、内存正确答案:C33.哪种调度器是YARN中默认的资源调度器?()A、FIFOSchedulerB、CapacitySchedulerC、FairSchedulerD、以上都不是正确答案:B34.下列命令中(在zookeeper安装文件夹的bin目录下执行),哪项是停止ZooKeeper的正确命令()A、start-all.shB、start-stop.shC、zkServer.shstartD、zkServer.shstop正确答案:D35.在确认客户需求,进行确认需求调研的时候,以下说法正确的是()。A、先了解细节需求,再了解宏观需求。B、将客户的想法记录下来,就能解决客户的实际问题。C、确定客户需求调研的过程中,不可避免的会出现客户提出一些现有条件下根本无法实现或者即使实现也非常困难的要求,我们要无条件去满足客户的需求。D、按计划有步骤的确定客户需求调研。正确答案:D36.Hadoop的配置目录在哪里?()A、/etc/hostsB、/etc/hadoopC、$HADOOP_HOME/confD、$HADOOP_HOME/etc/hadoop正确答案:D37.安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?()A、psB、netstatC、pingD、ifconfig正确答案:B38.大数据处理中数据处理层不包括()A、数据规约B、数据提取C、数据清洗D、数据分析正确答案:D39.Hbase的主要作用是()A、是一个分布式的、面向列的开源数据库B、是一种编程模型,用于大规模数据集(大于1TB)的并行运算C、是Hadoop集群当中的资源管理系统模块D、将要储存的文件分散在不同的硬盘上,并记录他们的位置正确答案:A40.以下选项哪个是MapReduce正确的运行模型()A、.Map-Shuffle-ReduceB、Map-Reduce-ShuffleC、Shuffle-Map-ReduceD、Reduce-Map-Shuffle正确答案:A41.下列有关flume的描述不正确的是A、flume是Apache的一个子项目B、flume主要是一个日志采集,传输系统C、flume和sqoop功能相似,因此可以相互替代D、flume可以同时采集集群内部和集群外部的日志数据正确答案:C42.以下对数据节点理解错误的是(.A、数据节点用来存储具体的文件内容B、数据节点通常只有一个C、数据节点的数据保存在磁盘中D、数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作正确答案:B43.日志消息的级别中那个是不会影响系统但值得注意()A、ALEKKTB、CRITC、NOTICED、DEBUG正确答案:C44.下面哪个选项不属于DataNode的职责?()A、保存数据块B、启动DataNode线程,向NameNode定期汇报数据块信息C、管理数据块D、定期向NameNode发送心跳信息保持联系正确答案:C45.将数据从关系型数据库中导出到HDFS上,应当使用命令_____?()A、importB、exportC、listD、以上都不对正确答案:A46.下列哪些不是HBase的特点()A、高可靠性B、高性能C、面向列D、紧密性正确答案:D47.在进行Hive组件配置时,JAR包冲突导致异常,出现以下错误信息()A、FailedtosetsetXIncludeAware(true)forparserB、mkdir:`input’:NosuchfileordirectoryC、E45:‘readonly’optionisset(add!tooverride)D、ERRORtool.ImportTool:ImportedFailed:Character8216isanout-of-rangedelimiter正确答案:A48.YARN中,任务进度监控是向哪个组件汇报的?()A、ResourceManagerB、NodeManagerC、ApplicationMasterD、Container正确答案:C49.hadoop平台下检查h3cu目录的健康状态采用()命令A、find/h3cuB、hdfsfsck/h3cuC、hadoopfs-lsr/h3cuD、list/h3cu正确答案:B50.一个gzip文件大小75MB,客户端设置Block大小为64MB,请我其占用几个Block?A、1B、2C、3D、4正确答案:B51.以下选项哪个是YARN的组成部分?()A、Container、ResourceManager、NodeManager、ApplicationMasterB、Container、ResourceManager、NodeManager、ApplicationManagerC、Container、ResourceManager、Scheduler、ApplicationMasterD、Container、ApplicationManager、NodeManager、ApplicationMaster正确答案:A52.HDFS能够在出错的情况下保证数据存储的可靠性,常见的出错情况不包括?()A、数据节点(DataNode)出错B、名称节点(NameNode)出错C、数据本身出错D、以上选项都不包括正确答案:D53.安装Hadoop集群时,在哪个文件指定从机是哪些机器?()A、yarn-site.xmlB、core-site.xmlC、datanodeD、slaves正确答案:D54.Flume在什么地方将事件转换为数据输出?A、拦截器B、源C、通道D、槽正确答案:C55.典型的NoSQL数据库是()A、MySQLB、HiveC、OracleD、Hbase正确答案:D56.下列哪一种命令格式是不正确的()A、scan表时间戳起始行健结束行健B、get表行健列族C、put表行键列族:列值D、alter表列族正确答案:A57.HBase分布式模式最好需要()个节点A、1B、2C、3D、4正确答案:C58.Zookeeper生产环境一般采用多少台机器组成集群?(D)A、1B、3C、5D、奇数台(且大于1)E、偶数台(且大于1)正确答案:D59.以下哪个文件是能够修改HDFS的副本保存数量参数()A、修改mapred-site.xml配置文件B、修改core-site.xml配置文件C、修改yarn-site.xml配置文件D、修改hdfs-site.xml配置文件正确答案:D60.大数据解决方案确认需求分析准备工作不包括()A、根据事先了解的初步用户需求,列出这些难点B、编制确定客户实施计划C、充分了解客户的要求,客户的业务,客户的关注重点D、和客户负责人沟通,确定客户需求小组成员正确答案:B61.大数据平台架构设计()的思想A、统一结构化设计B、分层模块化设计C、高集合化设计D、全分布设计正确答案:B62.Hadoop的安装部署的模式属于伪分布模式()A、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。B、在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。C、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境。D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案:B63.关于SecondaryNameNode的描述,哪项是正确的?()A、它是NameNode的热备B、SecondaryNameNode应与NameNode部署到一个节点C、它对内存没有要求D、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间正确答案:D64.下列sink中哪些是flume不支持的sinkA、HDFSsinkB、kafkasinkC、memorysinkD、filerollsink正确答案:C答案解析:Flume支持的sinks类型有:HDFSSink、HiveSink、LoggerSink、AvroSinkThriftSink、IRCSink、FileRollSink、NullSink、HBaseSink、KafkaSink、HTTPSink、CustomSink、ElasticSearchSink、MorphlineSolrSink65.2004年,Google公司发表了主要讲解海量数据的高效计算方法的论文是?()A、“TheGoogleFileSystem”B、“MapReduce:SimplifiedDataProcessingonLargeClusters”C、“Bigtable:ADistributedStorageSystemforStructuredData”D、“TheHadoopFileSystem”正确答案:B66.下列哪项通常是集群的最主要瓶颈()A、CPUB、网络C、磁盘IOD、内存(由于大数据面临海量数据,读写数据都需要io,然后还要冗余数据,hadoop一般备3份数据,所以IO就会打折扣。)正确答案:C67.关于MapReduce1和YARN的对比错误的是?()A、MapReduce1由JobTracker负责作业调度与任务监控B、YARN的作业调度和任务监控都是由ResourceManager组件完成C、MapReduce1的任务节点叫做TaskTracker,而Yarn的任务节点为NodeManagerD、MapReduce1的资源调配单元为Slot,而Yarn的资源调配单元为Container正确答案:B68.哪个不是HDFS默认BlockSizeA、32MBB、64MBC、128MB旧版本用64M当前新版本用128M正确答案:A69.关于ZooKeeper的说法错误的是?()A、ZooKeeper是一个高可用的分布式数据管理和协调框架B、能够很好的保证分布式环境中数据的一致性C、越来越多的分布式系统(Hadoop、HBase、Kafka)中使用ZooKeeperD、Hadoop的高可用不需要用到ZooKeeper正确答案:D70.在Hadoop配置文件中,以下属于core-site.xml文件主要内容的是()A、用于定义系统级别的参数,如HDFSURL、Hadoop的临时目录等。B、名称节点和数据节点的存放位置、文件副本的个数、文件读取权限等。C、配置ResourceManager,NodeManager的通信端口,web监控端口等。D、包括JobHistoryServer和应用程序参数两部分,如reduce任务的默认个数、任务所能够使用内存的默认上下限等。正确答案:A71.关于ZooKeeper顺序节点的说法正确的是?()A、创建顺序节点的命令为:create/testvalue1B、创建顺序节点时不能连续执行创建命令,否者报错节点已存在C、通过顺序节点,可以创建分布式系统唯一IDD、顺序节点的序号能无限增加正确答案:C72.Hadoop类库中最终面向用户提供的接口类是_____。该类是个抽象类,只能通过类的get方法得到具体类?()A、Configuration类B、FileSystem类C、Path类D、URI类正确答案:B73.配置SSH服务需配置()文件A、vi/etc/sysconfig/network-scripts/ifcfg-eth0B、vi/etc/ssh/sshdC、vi~/.bash_profileD、vi/etc/ssh/sshd_config正确答案:D74.在hadoop配置中core-site.xml的配置是()参数。A、集群全局参数B、HDFS参数C、Mapreduce参数D、集群资源管理系统参数正确答案:A75.大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的()A、新一代服务业态B、新一代技术平台C、新一代信息技术和服务业态D、新一代信息技术正确答案:C76.HBase依赖()提供消息通信机制A、ZookeeperB、ChubbyC、RPCD、Socket正确答案:A77.Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是()A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性B、根据策略对数据块进行必要的复制或删除C、当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式D、文件系统允许有修改正确答案:D78.大数据的数据量现在已经达到了哪个级别?(C)A、GBB、TBC、PBD、ZB正确答案:C79.关于SecondaryNameNode哪项是正确的?()A、它对内存没有要求B、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间C、它是NameNode的热备D、它是NameNode的热备,对内存有严格要求正确答案:B80.以下选项哪个是YARN中动态创建的资源容器()A、ResourceManagerB、NodeManagerC、ApplicationMasterD、Container正确答案:D81.下列描述中,哪项不属于Sqoop的缺点()A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型正确答案:A82.名称节点(NameNode)是HDFS的管理者,它的职责有3个方面,下面哪个选项不是NamdeNode的职责?()A、负责管理和维护HDFS的命名空间(NameSpace)B、管理DataNode上的数据块(Block)C、接收客户端的请求D、负责保存数据块正确答案:D83.Centos中修改文件或目录的访问权限命令A、chownB、passwdC、chmodD、clear正确答案:C84.Hadoop的安装部署的模式属于本地模式()A、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。B、在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。C、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境。D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案:A85.2006年,Google公司发表了用来处理海量数据的一种非关系型数据库的论文是?()A、“TheGoogleFileSystem”B、“MapReduce:SimplifiedDataProcessingonLargeClusters”C、“Bigtable:ADistributedStorageSystemforStructuredData”D、“TheHadoopFileSystem”正确答案:C86.下列关于YARN的描述错误的是?()A、ResourceManager负责整个系统的资源分配和管理,是一个全局的资源管理器B、NodeManager是每个节点上的资源和任务管理器C、ApplicationManager是一个详细的框架库,它结合从ResourceManager获得的资源和NodeManager协同工作来运行和监控任务ApplicationMasterD、调度器根据资源情况为应用程序分配封装在Container中的资源正确答案:C87.用于检查节点自身的健康状态的进程是()A、ResourceManagerB、NodeManagerC、NameNodeD、DataNode正确答案:B88.关于Flume的三大组件以下说法正确的是()。A、channel可以和任意数量的source和sink链接。B、channel只能链接单一的source和sink。C、sink在三大组件之间起着桥梁的作用。D、sink从channel消费数据并将其传递给目标地,目标地只能是hdfs。正确答案:A89.关于Sqoop数据的导入导出描述不正确的是?A、实现从MySQL到Hive的导入导出B、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出正确答案:B90.关于培训的总体目标、定制培训课程和内容和培训形式,以下说法正确的是()。A、系统使用人员的培训目的是使其可以独立完成大数据平台的日常维护,解决一般问题。B、培训过程中将针对不同的用户和不同的培训内容采用相同的培训方案,以达到最佳的培训效果。C、实践培训主要针对于技术开发人员及系统维护和客户。D、培训形式包括集中培训、现场培训、针对性培训。正确答案:D91.端口50070默认是Hadoop哪个服务的端口

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论