集群部署与数据存储智慧树知到期末考试答案章节答案2024年长春职业技术学院_第1页
集群部署与数据存储智慧树知到期末考试答案章节答案2024年长春职业技术学院_第2页
集群部署与数据存储智慧树知到期末考试答案章节答案2024年长春职业技术学院_第3页
集群部署与数据存储智慧树知到期末考试答案章节答案2024年长春职业技术学院_第4页
集群部署与数据存储智慧树知到期末考试答案章节答案2024年长春职业技术学院_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

集群部署与数据存储智慧树知到期末考试答案+章节答案2024年长春职业技术学院大数据的计量单位已经越过TB级别发展到ZB,甚至更高的级别来衡量了。()

答案:对使用Hadoop中的MapReduce编程模型非常简单,只需要定义好map和reduce函数的输入和输出键值对的类型即可。()

答案:对关于hdfs元数据,Edits编辑日志中记录了文件系统的所有操作。()

答案:错数据应用层主要采用了大数据采集技术,实现对数据的ETL操作。()

答案:错Map的主要工作是将多个任务的计算结果进行汇总。()

答案:错hive中包含数据库、表、分区、桶四类数据模型。()

答案:错MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。()

答案:对内部表的数据有Hive自身管理,外部表的数据有HDFS管理。()

答案:对Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写。()

答案:错Region服务器是HBase中最核心的模块。()

答案:对HDFS是整个Hadoop体系的基础,负责数据的存储与管理。()

答案:对Hadoop的核心主要是指HDFS和MapReduce。()

答案:对Client与HRegionServer进行数据读写类操作。()

答案:对Hive将元数据保存在关系数据库中,大大减少了在查询过程中执行语义检查的时间。()

答案:对HDFS是分布式文件系统,其命名空间包括块、目录和文件。()

答案:对HBase是四维坐标(即行键、列族、列、时间戳)定位数据。()

答案:对Hive中数据表info更名为info1,其实现命令如下:hive>altertableinforenametoinfo1;()

答案:对Hive中showtables命令用来显示数据表名称。()

答案:对HDFS只设置唯一一个名称节点带来的局限性包括()。

答案:隔离问题###性能的瓶颈###命名空间的限制###集群的可用性关于HBase特性,是下列选项中的哪些?()

答案:可伸缩###高性能###面向列###高可靠性使用ApacheSqoop的主要好处有哪些?()

答案:只导入必要的数据###支持所有主要的RDBMS###直接将数据加载到Hive/HBase/HDFS###支持并行数据传输和容错以下()属于Sqoop的命令。

答案:list-databases###export###import下面关于Zookeeper功能的描述正确的是()。

答案:HRegionServer把自己以Ephedral方式注册到Zookeeper中,HMaster随时感知各个HRegionServer的健康状况###ZookeeperQuorum存储-ROOT-表地址、HMaster地址###Zookeeper避免HMaster单点问题除了键入sqoop语法之外,还可以使用指定sqoop-(toolname)语法的别名脚本,sqoop提供了以下哪些脚本()

答案:sqoop-import###sqoop-export###sqoop-import-all-tables关于HBaseRegion进行的管理控制,分别为下列中哪些选项?()。

答案:合并###拆分###负载均衡下面关于Hive存储的文件格式描述正确的是()

答案:DRC是ORC的前身###SequenceFile是—种二进制存储###TEXTFILE是Hive的默认存储格式HDFS中的NameNode节点用于存放元数据,数据内容包含()。

答案:文件与数据块的映射表###数据块与数据节点的映射表Hive中向数据表添加数据的主要方式有()。

答案:通过查询语句向表中插入数据###创建表时加载数据###向表中装载数据(Load)下面关于Hive的索引描述不正确的是()。

答案:Hive查询时,命中索引会更快的返回查询结果###Hive要访问数据中满足条件的特定值时,命中索引则会更快的返回查询结果###Hive使用了索引加速数据查询MapReduce程序执行的阶段主要有:()

答案:Split###Map###Shuffle###Reduce在HBase中,关于Region描述,下列选项中哪些是正确的()

答案:每个Region服务器负责管理一个Region集合,通常在每个Region服务器上,会放置10~1000个Region。###同一个Region只能分布在一个RegionServer节点上,不会被拆分到多个Region服务器上的###Region是负载均衡和数据分发的基本单位HadoopMapReduce计算的流程是()。

答案:Map任务—Shuffle—Reduce任务下列不属于Hadoop特点的是()。

答案:高成本关于Sqoop的说法,不正确的是?()

答案:主要设计目的是在Hadoop与传统数据库之间进行数据的ETL操作当Zookeeper的节点数据发生变更时,被触发的事件是()。

答案:NodeDataChanged()是Zookeeper集群工作的核心,也是事务性请求(写操作)的唯一调度和处理者。

答案:LeaderSqoop的底层实现是?()

答案:HadoopZnode有两种类型,分别是()和永久节点。

答案:临时节点Hive是由哪家公司开源的()。

答案:Facebook在Hadoop体系中,分布式文件系统是指()

答案:HDFSHive是为了解决哪类问题()

答案:海量结构化日志的数据统计大数据的文件系统是()。

答案:HDFSMapReduce体系结构主要由TaskTracker、Task、JobTracker和()组成。

答案:Client在词频统计中,对于文本行"hellohadoophelloworld",经过WordCount的Reduce函数处理后的结果是()。

答案:<“hadoop”,1><“hello”,2><“world”,1>下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较错误的是()。

答案:后者相比前者学习起来更难下面哪个配置是在mapred-site、xml中配置的()。

答案:运行MapReduce作业的主机和端口shuffle和sort输出的key实现了下面哪个接口()

答案:WritableComparableOutputFormat是MapReduce输出的基类,所有的MapReduce输出都实现OutputFormat接口。()

答案:对Sqoop本质上是使用MR程序进行数据迁移的工具。()

答案:对Hive中descnew_info命令用来显示当前数据表字段结构。()

答案:对安装Hadoop时,配置项”dfs、replication”是配置在文件core-site、xml()。

答案:对HDFS集群开始启动时,其处于安全模式,可以进行读操作,不能进行写操作。()

答案:对大数据技术是一系列技术的总称,它是集合了数据采集与传输、数据存储、数据处理与分析、数据挖掘、数据可视化等技术,是一个庞大而复杂的技术体系。()

答案:对Zookeeper的选举机制,实际上是采用算法FastLeaderElection,投票数大于半数则胜出的机制。()

答案:对设置免密登录需要先用ssh-keygen生成一对密钥()。

答案:对Watcher事件类型(EventType)常见的表示事件类型枚举属性及属性含义()

答案:NodeDataChanged(3):表示Watcher监听的数据节点内容发生变更时(无论内容数据是否变化)###NodeChildrenChanged(4):表示Watcher监听的数据节点的子节点列表发生变更时###NodeDeleted(2):表示Watcher监听的数据节点被删除时###NodeCreated(1):表示Watcher监听的数据节点被创建时下列成员属于MapReduce体系结构中的有:()

答案:JobTracker###TaskTrackerHadoop有3大核心组件分别是()。

答案:Yarn###MapReduce###HDFSYARN作为Hadoop的资源管理器,它的引入为集群带来了哪些好处?()

答案:资源利用率高###数据共享方便###运维成本降低下面关于HiveSQL编译描述不正确的是()

答案:HiveSQL的Parser层是为了将SQL转化为执行计划的###编译器遍历ASTTree,抽象出查询的基本组成单元OperatorTree###MapReduce任务是需要遍历QueryBlock后生成的HDFS的适用性和局限性,以下说法正确的是()。

答案:适合数据批量读写、吞吐量高###不支持多用户并发写相同文件###适合一次写入多次读取、顺序读写###不适合交互式应用,低延迟很难满足以下对名称节点理解正确的是()。

答案:名称节点作为中心服务器,负责管理文件系统的命名空间及客户端对文件的访问###名称节点的数据保存在内存中###名称节点通常用来保存元数据Client使用HBaseRPC机制与哪些组件进行通信?()

答案:HRegionServer###HMasterWatcher机制主要包括()

答案:Zookeeper客户端###Zookeeper服务端###客户端的ZookeeperWatchManagerHDFS中第二名称节点的作用是()。

答案:合并FsImage和EditLog文件###作为名称节点的检查点端口9870默认是Hadoop3、X哪个服务的端口?()。

答案:NameNodeZookeeper是由()组成的树。

答案:节点HDFS集群采用主从结构,节点主要包括()和数据节点。

答案:名称节点如何查看sqoop命令列表?()

答案:Sqoophelp对MapReduce的体系结构,以下说法错误的是()。

答案:以计算为中心,更看重吞吐率Sqoop的作用是?()

答案:是一个建立在HDFS之上,面向列的针对结构化和半结构化数据的动态数据库Sqoop中的()命令是将数据导入到集群中。

答案:export在使用MapReduce程序WordCount进行词频统计时,对于文本行“hellohadoophelloworld”,经过WordCount程序的Map函数处理后直接输出的中间结果,应该是下面哪种形式()。

答案:<“hello”,1>、<“hello”,1>、<“hadoop”,1>和<“world”,1>下列说法中,关于Zookeeper说法错误的是()。

答案:Zookeeper是一个分布式协调服务的收费框架HBase语言大小写不敏感。()

答案:对在Hadoop中每个应用程序被表示成一个作业,每个作业又被分成多个任务,JobTracker的负责作业的分解、状态监控以及资源管理。()

答案:对非全新集群选举时是优中选优,保证Leader是Zookeeper集群中数据最完整、最可靠的一台服务器。()

答案:对Hive的数据库、表、分区在HDFS的表现形式是文件夹。()

答案:对下列选项中,属于Zookeeper集群的角色有()。

答案:Leader###Observer###FollowerHive中主要包括4种数据模型,分别为哪些选项?()。

答案:表(Table)###外部表(ExternalTable)###分区(Partition)以下()哪些项属于sqoop2优点。

答案:完善权限管理机制###仅仅负责数据的读写###多种交互方式HBase表的索引结构,包含下列哪些选项()

答案:列限定符###行键###时间戳###列族关于HBase表的单元格描述,下面哪些是正确的()

答案:可以保存一个数据的多个版本###它是具体存储数据的地方关于MapReduce过程中的split阶段,说法正确的是:()

答案:理想的split大小与HDFS块一样大###split的多少决定了Map任务的数目下面关于Hive内外表描述不正确的是()

答案:外表存储必须指定LOCATION###内外表删除时,都会删除元数据和存储###内部表数据由HDFS自身管理,外部表数据由Hive管理编写MapReduce程序时,下列叙述错误的是()。

答案:启动MapReduce进行分布式并行计算的方法是start()通过执行()命令,查看该节点的Zookeeper角色

答案:zkServer.shstatusHBase表中关于列族描述,下列选项哪个是不正确?()

答案:不能修改一旦NameNode关闭,就无法访问Hadoop集群的是()

答案:NameNodesqoop安装完成后,查看sqoop版本的命令是?()

答案:Sqoopversion如何查看当前sqoop中都有哪些job?()

答案:sqoopjob–listZnode的类型在创建时被指定,创建后仍能改变。()

答案:错HBase是面向行的存储模式。()

答案:错关于MapReduce的shuffle过程,叙述正确的是()。

答案:每个Reduce任务真正开始之前,大部分时间都在从Map端领取所需的数据###并非所有场合都可以使用合并操作###Map任务的输出结果不是立即写入磁盘,而是首先写入缓存###Shuffle分为Map任务端的Shuffle和Reduce任务段的ShuffleHBase的主要组件有3个,是下列选项中的哪些?()

答案:HRegionServer###ZooKeeper###HMaster以下对数据节点理解正确的是()。

答案:数据节点在名称节点的统一调度下进行数据块的创建、删除和复制等操作###数据节点用来存储具体的文件内容###数据节点的数据保存在磁盘中格式化文件系统指令()。

答案:$hadoopnamenode-format###$hdfsnamenode-format下列概念正确的有()

答案:过半机器数(Quorum):指大于集群机器数量的一半,即大于或等于(n/2+1)。###ZXID:是指一个事务ID,用来唯一标识一次服务器状态的变更。该值越大则说明数据越新,在选举过程中数据越新权重越大。###myid:服务器ID(SID)用来唯一标识一台Zookeeper集群中的机器,每台机器不能重复。下面哪些是MapReduce的计划的主要配置参数?()

答案:包含“reduce”功能类###输入格式###在分布式文件系统作业的输入位置###包含“map”功能类执行sqoophelp会有以下哪些帮助项?()

答案:import-all-tables###codegen###create-hive-tableSqoop是连接传统关系型数据库和Hadoop的桥梁。包括()两个方面。

答案:将关系型数据库的数据导入到Hadoop及其相关的系统中,如Hive和HBase。###将数据从Hadoop系统里抽取并导出到关系型数据库当Zookeeper客户端连接认证失败,此时客户端和服务器的连接状态就是()说明认证失败。

答案:AuthFailed在实验集群的master节点使用jps命令查看进程时,终端出现以下哪项能说明Hadoop主节点启动成功?()

答案:Namenode,JobTracker,secondaryNameNodeWatch机制有4个特点:一次性触发、分布式锁、异步发送、先注册再触发()

答案:错起初的Hadoop是使用Java语言开发的。()

答案:对Hadoop集群配置文件中,配置HDFS的属性的是以下哪一项()。

答案:hdfs-site、xmlClient端上传文件的时候下列哪项正确?()

答案:Client端将文件切分为Block,依次上传Hive有什么好处()

答案:可以通过语句自动编译MapReduceHBase是一个构建在Hadoop文件系统之上的面向列的数据库管理系统。()

答案:对安装完全分布式ApacheHadoop的核心配置文件有?()

答案:Acore-site.xml###hdfs-site.xml###yarn-site.xml###mapred-site.xmlYARN主要负责大数据计算管理中的()。

答案:资源管理###调度管理以下哪一项属于Hadoop可以运行的模式()。

答案:伪分布式模式###分布式模式###单机(本地)模式对HDFS内的文件进行操作,以下说法正确的是()。

答案:HDFS提供了Shell的操作接口###文件操作命令与Linux相似hdfs系统不支持数据的修改。()

答案:对Sqoop的使用者需要以下哪些先决条件知识()

答案:熟悉命令行界面,如bash###关系数据库管理系统###基本熟悉Hadoop的用途和操作###基本的计算机技术和术语Zookeeper的顺序性主要分为两种,分别是()和偏序。

答案:全局有序HBase表中单元格中的值是()

答案:未经解释的字符串HDFS具有高延迟性。它不适用于低延迟的数据访问。()

答案:对HDFS与传统数据存储对比,主要特点包含()。

答案:数据冗余,硬件容错###流式的数据访问###适合存储大量大文件Zookeeper作为一个分布式应用提供一致性服务的软件,提供的功能()

答案:配置管理###集群管理###分布式锁Hadoop中,MapReduce负责提供对数据的计算结果的汇总的是()。

答案:MapReduce以下()属于Sqoop的特点。

答案:数据压缩###导入SQL查询的结果###并行导入/导出###提供增量加载的功能传统关系型数据库数据定位是二维坐标,即行和列。()

答案:对–append参数是将数据追加到HDFS上一个已存在的数据集上。()

答案:对ResourceManager(RM)负责对各NodeManager上的资源进行统一管理和调度。()。

答案:对hadoopdfsadmin–report命令用于检测HDFS损坏块。()

答案:错HQL语言大小写敏感,但内容分大小写。()

答案:错Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200GB。()。

答案:错HDFS有着高容错性的特点。()

答案:对当客户端断开连接,此时客户端和服务器的连接就是SyncConnected状态,说明连接失败。()

答案:错客户端连接HBase依赖于Zookeeper,HBase存储依赖于HadoopClient。()

答案:对hcatalog是hive对外的一个统一存储格式的接口,使用hcatalog对接到hive的数据不需要担心数据在hive中的存储格式和存储位置。()

答案:对SQL语言大小写不敏感。()

答案:对Client与HMaster进行通信进行管理类操作()

答案:对HDFS的namenode保存了一个文件包括哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。()

答案:错Hive是数据库工具。()

答案:错drop内部表时,会删除hdfs上的文件夹和元数据。()

答案:对因为HDFS有多个副本,所以NameNode是不存在单点问题的。()

答案:错大数据主要具有四个特征:即大量(Volume)、多样(Variety)、高速(Velocity)和价值(Value),也就是所谓的“4V”特征。()

答案:对Hadoop实现了一个分布式文件系统,简称HDFS。()。

答案:对Hadoop集群配置文件中配置Yarn运行所需的环境变量的是hdfs-site、xml。()。

答案:错修改~/、bashrc文件保存后,修改的内容能立即生效()。

答案:错HBase通过行键、列族、列限定符和时间戳来确定一个单元格数据。()

答案:对Zookeeper具有全局数据一致性、高容错性、无序性、原子性以及实时性。()

答案:错SecondaryNameNode应与NameNode部署到一个节点()。

答案:错查看Linuxip的命令是ifconfig()。

答案:对由于Zookeeper集群的运行不需要Java环境支持,所以不需要提前安装JDK。()

答案:错InputFormat接口决定了输入文件如何被Hadoop分块。InputFormat能够从一个job中得到一个list集合。()

答案:错两个键值对<“hello”,1>和<“hello”,1>x,如果对其进行归并(merge),会得到<“hello”,<1,1>>,如果对其进行合并(combine),会得到<“hello”,2>。()

答案:错Zookeeper提供的getChildren()方法可以用于获取指定节点下的所有子节点列表。()

答案:对数据收集层是大数据技术和应用的目标。通常包括信息检索、关联分析等功能。()

答案:错NameNode本地磁盘保存了Block的位置信息。()

答案:错在Hive进行表删除操作时,要区分内部表与外部表,下面描述正确的选项有哪些?删除内部表时:。()等。

答案:没有区别###内部表删除将表的元数据和数据同时删除。###外部表删除时,元数据被删除,数据本身不删除。选举机制类型()

答案:非全新集群选举###全新集群选举以下关于sqoop-import的作用描述正确的有()

答案:导入的纪录可以存储为文本文件###导入的纪录也可以以二进制表示形式存储为Avro或SequenceFiles###该import工具将单个表从RDBMS导入HDFS###导入时,表中每一行都表示为HDFS中的单独记录下面关于Hive数据模型描述正确的是()

答案:Hive的元数据存储在HDFS中###Hive的默认分隔符是^A(1001),使用的是UTF-8的编码###Hive的数据模型只包含:表、分区Zookeeper采用了Watch机制来实现分布式数据的()功能

答案:订阅###发布在设置Linux环境中,关闭防火墙的代码有哪些()。

答案:systemctldisablefirewalld###systemctlstopfirewalld###systemctlstatusfirewalldYarn它主要由两大核心模块构成,分别是()。

答案:ApplicationMaster###ResourceManagerHadoop存储系统HDFS的体系结构的设计目标包含()。

答案:自动检测处理硬件错误###流式访问数据###简单数据一致性模型###转移计算,不移动数据位置下面关于传统关系型数据库的特性描述,正确的有哪些?()

答案:完善的事务机制###高效的查询机制下列关于hadoop集群启动中的所有进程及其作用,正确的有()

答案:SecondaryNamenode可以做备份,对一定范围内的数据做快照###Jobtracker管理任务,分配任务###Namenode管理集群,记录namenode文件信息###Datanode存储数据第一代Hadoop存在的问题()。

答案:JobTracker存在单点故障的风险###当存在多个计算框架时,譬如说流式计算框架、内存计算框架###资源划分不合理###资源竞争,导致JobTracker挂死,不便于管理一个完整的mapreduce程序在分布式运行时有三类实例进程,是哪三个?()

答案:MrAppMaster:负责整个程序的过程调度及状态协调。###ReduceTask:负责reduce阶段的整个数据处理流程。###MapTask:负责map阶段的整个数据处理流程。关于MapReduce程序,下列说法正确的有:()

答案:MapReduce程序主要包含Map、Reduce、主函数三部分###Map函数与Reduce函数在程序运行过程中会执行多次以下HDFS相关的shell命令不正确的是()。

答案:hadoopfs-copyFromLocal:将路径指定的文件或文件夹复制到路径指定的文件夹中###hadoopdfsmkdir:创建指定的文件夹下列说法中,关于zoo.cfg配置文件中的参数server.1=hadoop01:2888:3888说法正确的是()。

答案:hadoop01表示这个服务器的IP地址###1表示服务器的编号Hive驱动器主要包括哪些选项?()

答案:反编译器###编译器###解析器MapReduce中的JobTracker拆分为两个独立任务,这两个任务分别是()。

答案:每个应用程序特有的ApplicationMaster###全局的资源管理器ResourceManagerZookeeper使用WatchedEvent对象来封装服务端事件并传递。该对象包含了每个事件的()基本属性

答案:keeperState###EventType###path关于HBase表的列限定符描述,下面哪些是正确的()

答案:视为字节数组byte[]###列限定符不需要事先定义,数据添加时定义即可###通过列限定符来定位列族里的数据YARN服务组件包括()

答案:ApplicationMaster###ResourceManager###ContainerHadoop的生态系统组件之—Sqoop的功能是?()

答案:用来在Hadoop和关系数据库之间的交换数据,改进数据的互操作性Sqoop工具是通过()进行导入导出数据的。

答案:mapreduceZookeeper中的数据存储结构和标准文件系统非常类似,两者采用的层次结构是()。

答案:树形Hadoop集群的运行模式?()。

答案:各选项都是Hive与传统SQL数据库对比,下面描述不正确的是()

答案:最终执行者:Hive使用MapReduce和Excutor执行,传统SQL数据库使用Excutor执行器为了保证Leader选举能够通过半数以上台服务器选举支持,因此Zookeeper集群搭建的服务器为()。

答案:2n+1下列哪个层主要采用了大数据采集技术,实现对数据的处理?()

答案:数据处理层下面选项中,与Zookeeper功能类似的框架是()?

答案:Chubby下面中不属于Hive中的元数据信息()

答案:表的属性((只存储内部表信息)在默认情况下,HDFS块的大小为()。

答案:128MB关于HadoopMapReduce的叙述错误的是()。

答案:MapReduce的设计理念是“数据向计算靠拢”不是hadoop主要组成部分的是:()。

答案:HBase从下列选项中,选择命令用于删除整行操作()。

答案:deleteall‘student’';‘xiaoming’从下列选项中,选择命令以查询表中指定列()

答案:get‘student’'’002’'’info:"name’下列哪个程序通常与NameNode在一个节点启动?()。

答案:Jobtracker下面关于Hive格式描述正确的是()。

答案:TEXTFILE格式是Hive的默认存储格式以下哪种不是Hive支持的数据类型()

答案:LongHBase是哪个技术的开源实现()。

答案:GoogleBigtable目前,Hadoop的最高版本是哪个?()。

答案:Hadoop3.xNoSQL可划分为多种存储数据库,下列选项哪个不属于NoSql()

答案:HiveHive的元数据存储在derby和MySQL中有什么区别()

答案:多会话MapReduce为了保证任务的正常执行,采用重复执行和()等多种容错机制。

答案:推测执行下列用来存放部署Hadoop集群服务器的机架的是()

答案:Rack以下哪种是HBase支持的数据类型()

答案:string通过将以下什么工具与Hadoop集群整合后,可以查看Hadoop集群中每个Master/Slave节点的运行状态?()。

答案:GangliaHBase是哪个公司开发的()。

答案:Apache下面关于Hive和传统数据库的比较描述正确的是()

答案:Hive的针对数据仓库设计,针对的是读多写少的场景HBase依赖于Hadoop中的()提供强大的计算能力。

答案:MapReduce下列对Sqoop描述正确的是?()

答案:Sqoop可以将数据从Hbase转储到HDFS上Sqoop实现向hdfs系统导入数据使用的命令是()

答案:sqoopimport下列选择参数是sqoop指令的是()

答案:Import关于Map和Reduce两个阶段描述正确的是()。

答案:Reduce阶段负责将任务合并,用于对Map阶段的结果进行全局汇总###Map阶段负责将复杂的任务分解成若干个“简单的任务”来并行处理###Map阶段分解的任务之间没有必然的依赖关系###Map阶段用于对原始数据进行处理Sqoop不支持下列哪种数据库()

答案:RedisMap任务作为MapReduce工作流程的前半部分,它主要经历了5个阶段,分别是Copy阶段、Merge阶段、Sort阶段、Reduce阶段和Write阶段。()

答案:错Partition主要作用就是将map的结果发送到相应的reduce。这就对partition有两个要求()。

答案:均衡负载,尽量的将工作均匀的分配给不同的reduce。###效率,分配速度一定要快。sqoop的迁移的方式就是把sqoop的迁移命令转换成()

答案:mr程序HBase中的显示命名空间名称的命令是:list_namespace。()

答案:对在HBase表中添加数据的命令,是下列选项中的哪个?()

答案:put对HBase表中数据进行全表查看的命令,是下列选项中的哪个?()

答案:scanHBase表名区分大小写,所有的字符串都必须包含在单引号里()

答案:对在HBase表中按行键查询数据的命令,是下列选项中的哪个?()

答案:getHBase是一种键值类型的NoSql数据库。()

答案:对HBase依靠()来存储底层数据的。

答案:HDFS关于HBase的相关描述,下面哪些是正确的?()

答案:分布式###可伸缩的数据库###面向列关于HBase的逻辑表描述,下面选项中正确的是()

答案:稀疏的###持久化存储###有序的###多维的HBase来源于IBMBigtable()

答案:错下列关于Hive的描述,正确的有哪些?()。

答案:hive提供了一系列工具,可以用来进行数据提取转化加载(ETL)。###hive可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能。###hive可以将sq语句转换为MapReduce任务进行运行。###hive是基于Hadoop的一个数据仓库工具。Hive在删除内部表时,内部表的元数据被删除,数据本身不删除()

答案:错Hive能够用来进行海量数据的存储、查询和离线分析。()

答案:对HiveQL和SQL的一个不同之处在于Partition操作。()

答案:对Hive定义了简单的类似SQL的语言,称为()。

答案:HQL###HiveQlHive是基于()

答案:MapReduce从下列选项中,选出不是Hive基本类型的选项。()

答案:varchar按粒度大小的顺序,Hive数据被分为数据库,数据表,分区和桶。()

答案:对Hive默认分桶的数量是()。

答案:-1Hive是建立在()之上的数据仓库。

答案:HadoopZooKeeper是一个封闭源码的分布式应用程序协调服务,它是由Google的Chubby开源实现,是Hadoop和Hbase的重要组件。()

答案:错下列选项中,用于获取Zookeeper所包含的信息的Shell命令是()。

答案:getZookeeper中,Watcher机制的特点包含()。

答案:一次性触发###先注册再触发###事件封装###异步发送安装Hadoop时,发现50070对应的页面无法打开,可以通过下面哪个命令查看某个端口(TCP或UDP)是否在监听?()

答案:netstatZookeeper特点()

答案:顺序一致性###单一系统镜像###实时性Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是()

答案:文件系统允许有修改临时节点允许拥有子节点。()

答案:错在Hadoop中负责运算的组件是()

答案:MapReduceHadoop的框架最核心的设计就是:HDFS和MapReduce。()

答案:对HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。()

答案:对在MapReduce中,下面哪个阶段是并行进行的()

答案:Shuffle和SortReduceTask工作过程包含下面哪些阶段()。

答案:Write阶段###Sort阶段###Merge阶段###Copy阶段在Hadoop中,下面哪个是默认的InputFormat类型,它将每行内容作为新值,而将字节偏移量作为key()

答案:TextInputFormat关于combiner描述正确的是()。

答案:Combiner的输出是Reducer的输入###combiner使用的合适,可以在满足业务的情况下提升job的速度###Combiner绝不能改变最终的计算结果Map阶段,溢出的数据写入磁盘之前,线程会根据ReduceTask的数量进行数据分区,一个Reduce任务对应一个分区的数据。()

答案:对Google公司设计MapReduce的初衷主要是为了解决其搜索引擎中大规模网页数据的并行化处理。()

答案:对在MapReduce中,下面哪个数据流的顺序是正确的()

答案:Mapper下列属于HDFS缺点的是()

答案:不适合小文件的存取###不适合并发写入###高延迟性HDFS对于服务器性能要求很高,必须构建在高成本的机器上。()

答案:错下列属于HDFS集群的主服务器的是()

答案:NameNodeNameNode收到客户端的请求后,检查数据操作权限并判断上传的文件是否已存在,如果已存在,则拒绝客户端的上传。()

答案:对HDFS中的block默认保存几个备份。()

答案:3份HDFS是一个易于扩展的分布式文件系统。()

答案:对命令hadoopfs-ls/的功能是()

答案:查看根目录下列不属于NameNode的功能的是()

答案:保存metad

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论