![1+x大数据模拟练习题与参考答案_第1页](http://file4.renrendoc.com/view2/M01/02/27/wKhkFmZrAiaAUVU6AAHefnXtoWQ026.jpg)
![1+x大数据模拟练习题与参考答案_第2页](http://file4.renrendoc.com/view2/M01/02/27/wKhkFmZrAiaAUVU6AAHefnXtoWQ0262.jpg)
![1+x大数据模拟练习题与参考答案_第3页](http://file4.renrendoc.com/view2/M01/02/27/wKhkFmZrAiaAUVU6AAHefnXtoWQ0263.jpg)
![1+x大数据模拟练习题与参考答案_第4页](http://file4.renrendoc.com/view2/M01/02/27/wKhkFmZrAiaAUVU6AAHefnXtoWQ0264.jpg)
![1+x大数据模拟练习题与参考答案_第5页](http://file4.renrendoc.com/view2/M01/02/27/wKhkFmZrAiaAUVU6AAHefnXtoWQ0265.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1+x大数据模拟练习题与参考答案一、单选题(共80题,每题1分,共80分)1、HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()。A、一次写入,少次读B、多次写入,少次读C、多次写入,多次读D、一次写入,多次读正确答案:D2、Hadoop的安装部署的模式属于伪分布模式()A、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。B、在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。C、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境。D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案:B3、大数据平台操作演示不包括()A、分析本次演示的目的和听众群体B、实现呈现技巧提升C、在大数据平台操作演示前需要做好准备工作D、准备好演示环境正确答案:B4、HBase依赖()提供消息通信机制A、ZookeeperB、ChubbyC、RPCD、Socket正确答案:A5、Sqoop的底层实现是()?A、HDFSB、MapReduceC、HbaseD、Hadoop正确答案:B6、下列哪个程序通常与NameNode在一个节点启动?A、SecondaryNameNodeB、DataNodeC、TaskTrackerD、Jobtracker正确答案:D7、大数据处理中数据应用层不包括()A、数据可视化B、数据分析C、数据建模D、数据挖掘正确答案:A8、HDFS启动成功的标识是()A、jps显示NameNodeB、jps显示DataNodeC、jps显示SecondaryNameNodeD、jps显示NameNode\DataNode\SecondaryNameNode正确答案:D9、建立在Hadoop文件系统之上的分布式的列式数据库?()A、HBaseB、HiveC、YARND、Mahout正确答案:A10、关于Sqoop数据的导入导出描述不正确的是?A、实现从MySQL到Hive的导入导出B、实现从MySQL到Oracle的导入导出C、实现从HDFS到Oracle的导入导出D、实现从HDFS到MySQL的导入导出正确答案:B11、以前在传统数据库与Hadoop之间,数据传输没有专门的工具,两者数据的互导是比较困难的,_____的出现解决了这个问题?()A、SqoopB、ZookeeperC、FlumeD、Hive正确答案:A12、关于SecondaryNameNode的描述,哪项是正确的?()A、它对内存没有要求B、它是NameNode的热备C、SecondaryNameNode应与NameNode部署到一个节点D、它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间正确答案:D13、下列选项哪个不是ZooKeeper的应用场景?()A、Master选举B、分布式锁C、分布式协调/通知D、存储非关系型数据正确答案:D14、安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?()A、psB、netstatC、pingD、ifconfig正确答案:B15、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是:()A、一次写入,少次读写B、多次写入,少次读写C、一次写入,多次读写D、多次写入,多次读写正确答案:C16、查看HDFS的报告命令是()A、bin/hdfsdfsadmin-reportB、bin/hdfs-reportC、bin/hdfsdeadmin-reportD、bin/hdfsdfs-report正确答案:A17、Zookeeper服务端默认的对外服务端口是?()A、2181B、3888C、2888D、8088正确答案:A18、安装Hadoop集群时,在哪个文件指定从机是哪些机器?()A、datanodeB、slavesC、yarn-site.xmlD、core-site.xml正确答案:B19、HMaster的主要作用是()A、用于启动任务管理多个HRegionServerB、负责响应用户I/O请求,向HDFS文件系统读写数据C、负责协调集群中的分布式组件D、最终保存HBase数据行的文件正确答案:A20、对于GFS架构,下面哪个说法是错误的?()A、GFSMaster节点管理所有的文件系统所有数据块。B、GFS存储的文件都被分割成固定大小的块,每个块都会被复制到多个块服务器上(可靠性)。块的冗余度默认为3。C、GFSMaster还管理着系统范围内的活动,比如块服务器之间的数据迁移等D、GFSMaster与每个块服务器通信(发送心跳包),发送指令,获取状态正确答案:A21、关于ZooKeeper的说法错误的是?()A、ZooKeeper是一个高可用的分布式数据管理和协调框架B、能够很好的保证分布式环境中数据的一致性C、越来越多的分布式系统(Hadoop、HBase、Kafka)中使用ZooKeeperD、Hadoop的高可用不需要用到ZooKeeper正确答案:D22、flume中那种source类型支持Unix的命令标准在生产数据()A、Avr0SourceB、ThriftSourceC、ExecSourceD、JMSSource正确答案:C23、大数据平台Hadoop的组件中,提供分布式协作服务的组件是()A、HBaseB、ZooKeeperC、SqoopD、Hive正确答案:B24、MapReduce编程模型,键值对<key,value>的key必须实现哪个接口?()A、WritableComparableB、ComparableC、WritableD、LongWritable正确答案:A25、列出mysql数据库中的所有数据库sqoop命令是?()A、sqooplist-tables–connectB、sqoopimport–connectC、sqooplist-databases–connectD、sqoopcreate-hive-table–connect正确答案:C26、ZooKeeper树中节点叫做什么?()A、inodeB、ZxidC、ZnodeD、Zknode正确答案:C27、对于HDFS文件读取过程,描述不正确的是?()A、HDFS客户端通过Configuration对象的open(.方法打开要读取的文件B、DistributedFileSystem负责向远程的名称节点(NameNode)发起RPC调用,得到文件的数据块信息,返回数据块列表C、通过对数据流反复调用read(.方法,把数据从数据节点传输到客户端D、当客户端读取完数据时,调用FSDataInputStream对象的close(.方法关闭输入流正确答案:A28、Hadoop类库中最终面向用户提供的接口类是_____。该类是个抽象类,只能通过类的get方法得到具体类?()A、Configuration类B、FileSystem类C、Path类D、URI类正确答案:B29、在hive中已知表test(name)的记录如下,tomTom_greentomlyLily代码select*fromtestwherenamerlike'tom.*'的结果有()条记录A、0B、1C、3D、2正确答案:C30、下列是关于flume和sqoop对比的描述,不正确的是()A、flume主要用于采集多数据源小数据而sqoop用来迁移单数据源数据B、flume和sqoop都是分布式处理任务C、flume主要用来采集日志而sqoop主要用来做数据迁移D、flume主要采集流式数据而sqoop主要用来迁移规范化数据正确答案:B31、大数据的数据量现在已经达到了哪个级别?(C)A、GBB、TBC、PBD、ZB正确答案:C32、与Hadoop1.x相比,Hadoop2.x采用全新的架构,最明显的变化就是增加了哪个组件?()A、MapReduceB、PigC、HBaseD、Yarn正确答案:D33、采用多副本冗余存储的优势不包含(.A、保证数据可靠性B、加快数据传输速度C、容易检查数据错误D、节约存储空间正确答案:D34、报告hdfs使用情况采用()命令A、hdfsdfs-getfacl/user/testnameB、hdfsdfsadmin-setSpaceQuota500g/path/xxx/C、hdfsdfsadmin-reportD、hdfsdfsadmin-clrSpaceQuota/user/testname正确答案:C35、下面哪个程序负责HDFS数据存储?()A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNodeE、tasktracker正确答案:C36、下列有关flume的描述不正确的是A、flume是Apache的一个子项目B、flume主要是一个日志采集,传输系统C、flume和sqoop功能相似,因此可以相互替代D、flume可以同时采集集群内部和集群外部的日志数据正确答案:C37、关于ZooKeeper的特性说法错误的是?()A、当节点发生变化时,通过watcher机制,可以让客户端得到通知B、是版本机制有效避免了数据更新时出现的先后顺序问题C、能改变ZooKeeper服务器状态的操作称为事务操作D、watch能触发多次正确答案:D38、以下关于日志采集工具Flume的说法不正确的是?A、Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的日志收集系统B、Flume适用于大量数据的实时数据采集C、Flume支持多级级联和多路复制D、Flume的数据源和目标都是可定制、可扩展的正确答案:C39、将数据从关系型数据库中导出到HDFS上,应当使用命令_____?()A、importB、exportC、listD、以上都不对正确答案:A40、在MapReduce中Shuffle的主要作用是()A、经过映射后的输出数据会被排序,然后每个映射器会进行分区B、通过实现自定义的Partitioner来指定哪些数据进入哪个ReducerC、对映射后的数据进行排序,然后输入到ReducerD、将数据进行拆分正确答案:C41、向HDFS上传文件,正确的shell命令是?()A、hdfsdfs-getB、hdfsdfs-putC、hdfsdfs-appendToFileD、hdfsdfs-copyToLocal正确答案:B42、2003年,Google公司发表了主要讲解海量数据的可靠存储方法的论文是?()A、“TheGoogleFileSystem”B、“MapReduce:SimplifiedDataProcessingonLargeClusters”C、“Bigtable:ADistributedStorageSystemforStructuredData”D、“TheHadoopFileSystem”正确答案:A43、以下选项哪个是MapReduce正确的运行模型()A、Map-Reduce-ShuffleB、Reduce-Map-ShuffleC、Shuffle-Map-ReduceD、.Map-Shuffle-Reduce正确答案:D44、下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?()A、binB、shareC、sbinD、etc正确答案:C45、Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是()A、安全模式目的是在系统启动时检查各个DataNode上数据块的有效性B、根据策略对数据块进行必要的复制或删除C、当数据块最小百分比数满足的最小副本数条件时,会自动退出安全模式D、文件系统允许有修改正确答案:D46、下列关于MapReduce说法不正确的是()A、MapReduce来源于google的学术论文B、MapReduce程序只能用java语言编写C、MapReduce隐藏了并行计算的细节,方便使用D、MapReduce是一种计算框架正确答案:B47、hadoop2.0与hadoop1.0区别()A、增加MapReduce2B、增加YARNC、增加HDFS2D、增加容错机制正确答案:B48、下面哪个选项不属于Google的三驾马车?()A、HDFSB、MapReduceC、BigTableD、GFS正确答案:A49、多用户的情况下,哪个YARN调度器可以最大化集群的吞吐和利用率?()A、CapacitySchedulerB、FIFOSchedulerC、FairSchedulerD、以上都不是正确答案:A50、数据节点(DataNode)负责存储数据,一个数据块会在多个DataNode中进行冗余备份,那么HDFS默认存储几份?()A、1B、2C、3D、5正确答案:C51、大数据处理中数据处理层不包括()A、数据清洗B、数据分析C、数据规约D、数据提取正确答案:B52、日志消息的级别中那个是不会影响系统但值得注意()A、ALEKKTB、CRITC、NOTICED、DEBUG正确答案:C53、大数据的特点不包括下面哪一项()。A、多结构化数据B、价值密度高C、增长速度快D、巨大的数据量正确答案:B54、下列哪些不是ZooKeeper的特点()A、原子性B、多样系统映像C、顺序一致性D、可靠性正确答案:B55、下面哪个选项不属于DataNode的职责?()A、保存数据块B、启动DataNode线程,向NameNode定期汇报数据块信息C、管理数据块D、定期向NameNode发送心跳信息保持联系正确答案:C56、以下选项哪个是HDFS的名称节点()A、DataNodeB、SecondaryNodeC、NodeD、NameNode正确答案:D57、大数据解决方案确认需求分析准备工作不包括()A、编制确定客户实施计划B、充分了解客户的要求,客户的业务,客户的关注重点C、和客户负责人沟通,确定客户需求小组成员D、根据事先了解的初步用户需求,列出这些难点正确答案:A58、flume有哪个组件用于采集数据()A、sinkB、channelC、sourceD、webserver正确答案:C59、Sqoop将导入或导出命令翻译成什么程序来实现导入导出()A、SparkB、MapReduceC、StormD、Tez正确答案:B60、Centos中修改文件或目录的访问权限命令A、chownB、passwdC、chmodD、clear正确答案:C61、在Hadoop配置文件中,以下属于core-site.xml文件主要内容的是()A、用于定义系统级别的参数,如HDFSURL、Hadoop的临时目录等。B、名称节点和数据节点的存放位置、文件副本的个数、文件读取权限等。C、配置ResourceManager,NodeManager的通信端口,web监控端口等。D、包括JobHistoryServer和应用程序参数两部分,如reduce任务的默认个数、任务所能够使用内存的默认上下限等。正确答案:A62、下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是()A、FSDataInputStream扩展了DataInputStream以支持随机读B、为实现细粒度并行,输入分片(InputSplit.应该越小越好C、一台机器可能被指派从输入文件的任意位置开始处理一个分片D、输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分割正确答案:B63、从Vi编辑模式下保存配置返回到Centos7系统使用()A、按“shift”+“:”组合B、按“Esc”键,然后按“shift”+“:”组合C、按“Esc”键,然后按“shift”+“:”,输入wq回车D、直接输入“exit”正确答案:C64、关于ZooKeeper临时节点的说法正确的是?()A、创建临时节点的命令为:create-s/tmpmyvalueB、一旦会话结束,临时节点将被自动删除C、临时节点允许有子节点D、临时节点不能手动删除正确答案:B65、以下哪个不是HDFS的进程()A、SecondaryNodeB、NameNodeC、ResourceManagerD、DataNode正确答案:C66、关于Flume的三大组件以下说法正确的是()。A、channel可以和任意数量的source和sink链接。B、channel只能链接单一的source和sink。C、sink在三大组件之间起着桥梁的作用。D、sink从channel消费数据并将其传递给目标地,目标地只能是hdfs。正确答案:A67、HDfS中的block默认保存几份?A、3份B、2份C、1份D、不确定正确答案:A68、对Sqoop描述不正确的是?()A、Sqoop的底层实现是MapReduceB、Sqoop主要采集关系型数据库中数据,常用于离线计算批量处理C、Sqoop只支持从关系型数据库导入到HDFS,不支持从HDFS导入到关系型数据库。D、Sqoop脚本最终会变成提交到YARN上的一个个map任务正确答案:C69、Hadoop的安装部署的模式属于本地模式()A、默认的模式,无需运行任何守护进程(daemon),所有程序都在单个JVM上执行。B、在一台主机模拟多主机。即,Hadoop的守护程序在本地计算机上运行,模拟集群环境,并且是相互独立的Java进程。C、完全分布模式的守护进程运行在由多台主机搭建的集群上,是真正的生产环境。D、高容错全分布模式的守护进程运行在多台主机搭建的集群上正确答案:A70、Flume在什么地方将事件转换为数据输出?A、槽B、通道C、拦截器D、源正确答案:B71、下列哪项通常是集群的最主要的性能瓶颈A、CPUB、网络C、磁盘D、内存正确答案:C72、下列描述中,哪项不属于Sqoop的缺点()A、无法控制任务的并发度B、格式紧耦合C、安全机制不够完善D、connector必须符合JDBC模型正确答案:A73、ZooKeeper是一个典型的分布式数据一致性解决方案,下列哪项是不属于它实现的功能()A、分布式锁B、数据发布/订阅C、响应用户I/O请求D、负载均衡正确答案:C74、考虑到安全和效率,Hadoop设计了机架感知(rack-aware)功能,下面关于机架感知说法正确的是?()A、三个冗余备份可在同一个机架上B、三个冗余备份在不同的机架上C、三个冗余备份其中有两个在同一个架构上,另外一个备份在不同的机架上D、上述说法都不对正确答案:C75、下列哪一种命令格式是不正确的()A、put表行键列族:列值B、scan表时间戳起始行健结束行健C、alter表列族D、get表行健列族正确答案:B76、以下选项哪个是YARN的组成部分?()A、Container、ResourceManager、NodeManager、ApplicationMasterB、Container、ResourceManager、NodeManager、ApplicationManagerC、Container、ResourceManager、Scheduler、ApplicationMasterD、Container、ApplicationManager、NodeManager、ApplicationMaster正确答案:A77、HDFS有一个LZO(withindex)文件大小75MB,客户端设置Block大小为64MB。当运行mapreduce任务读取该文件时inputsplit大小为?A、64MBB、75MBC、一个map读取64MB,另外一个map读取11MB正确答案:C78、关于ZooKeeper顺序节点的说法正确的是?()A、创建顺序节点的命令为:create/testvalue1B、创建顺序节点时不能连续执行创建命令,否者报错节点已存在C、通过顺序节点,可以创建分布式系统唯一IDD、顺序节点的序号能无限增加正确答案:C79、以下选项哪个命令可以生成公钥()A、ifupteam0B、nmcliconshC、nmclidevD、ssh-keygen正确答案:D80、下面关于分布式文件系统HDFS的描述正确的是:()A、分布式文件系统HDFS是谷歌分布式文件系统GFS(GoogleFileSystem)的一种开源实现B、分布式文件系统HDFS比较适合存储大量零碎的小文件C、分布式文件系统HDFS是GoogleBigtable的一种开源实现D、分布式文件系统HDFS是一种关系型数据库正确答案:A二、多选题(共20题,每题1分,共20分)1、下列属于hadoop的发行版本的是()A、ApacheB、ClouderaC、RedhatD、Centos正确答案:ABC2、下面哪些是大数据的基本特征?()A、数据类型多B、数据体量大C、价值密度低D、处理速度快正确答案:ABCD3、Hadoop大数据有哪两大核心技术?()A、数据采集B、可视化C、分布式存储D、分布式处理正确答案:CD4、下面的命令描述正确的是()A、切换当前用户帐户为admin的命令:suadminB、改用户Tom设置密码命令:passwdTomC、创建一个名称为test组的命令:groupaddtestD、删除用户名为Tom的命令:userdelTom正确答案:BCD5、Client端上传文件的时候下列哪项正确A、数据经过NameNode传递给DataNodeB、Client端将文件以Block为单位,管道方式依次传到DataNodeC、Client只上传数据到一台DataNode,然后由NameNode负责Block复制工作D、当某个DataNode失败,客户端会继续传给其它DataNode正确答案:BD6、Hadoop优点是以下()种。A、高可靠性B、成本低C、扩容能力强D、高效率正确答案:ABCD7、大数据平台安装部署步骤包括()A、服务器操作系统安装B、Hadoop平台安装C、服务器上架D、网络环境分配正确答案:ABCD8、Hadoop集群验证步骤包括()A、初始化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030全球镀铜光亮剂行业调研及趋势分析报告
- 2025年全球及中国母婴健康产后护理行业头部企业市场占有率及排名调研报告
- 2025年全球及中国敏捷渗透测试行业头部企业市场占有率及排名调研报告
- 2025年全球及中国LTCC用导电银浆行业头部企业市场占有率及排名调研报告
- 2025建筑安装工程承包合同范本版
- 教室租赁合同范本
- 2025工矿企业大型成套设备采购合同范本
- 装修设计合同范本大全
- 2025劳动合同试用期法律疑难问题详解
- 门店合伙协议合同范本
- 2024年1月高考适应性测试“九省联考”数学 试题(学生版+解析版)
- JT-T-1004.1-2015城市轨道交通行车调度员技能和素质要求第1部分:地铁轻轨和单轨
- (高清版)WST 408-2024 定量检验程序分析性能验证指南
- (正式版)JBT 11270-2024 立体仓库组合式钢结构货架技术规范
- DB11∕T 2035-2022 供暖民用建筑室温无线采集系统技术要求
- 《复旦大学》课件
- 针灸与按摩综合疗法
- Photoshop 2022从入门到精通
- T-GDWJ 013-2022 广东省健康医疗数据安全分类分级管理技术规范
- 校本课程生活中的化学
- DB43-T 2775-2023 花榈木播种育苗技术规程
评论
0/150
提交评论