大数据平台构建习题答案_第1页
大数据平台构建习题答案_第2页
大数据平台构建习题答案_第3页
大数据平台构建习题答案_第4页
大数据平台构建习题答案_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目一、安装环境准备VMwareWorkstationPro16使用时,可按()键将鼠标从VM中释放出来?A、Ctrl+Alt B、Ctrl+Alt+Del C、Ctrl+Alt+Enter D、Ctrl+Enter 答案:AVMwareWorkstationPro16新建虚拟机时,默认的磁盘大小是()?A、10GB B、20GB C、30GB D、40GB 答案:BVMwareWorkstationPro16新建虚拟机时,默认的网络适配器网络连接模式是()?A、桥接模式 B、NAT模式 C、仅主机模式 D、自定义模式 答案:BVMwareWorkstationPro16网络连接NAT模式默认情况下连接的主机虚拟适配器名称是()?A、VMnet0 B、VMnet1 C、VMnet8 D、VMnet9 答案:CVMwareWorkstationPro16网络连接仅主机模式默认情况下连接的主机虚拟适配器名称是()?A、VMnet0 B、VMnet1 C、VMnet8 D、VMnet9 答案:B假如VMwareWorkstationPro16网络连接NAT模式的子网IP为192.168.5.0,其默认网关的IP地址是()?A、192.168.5.1 B、192.168.5.2 C、192.168.5.254 D、192.168.5.255 答案:B假如VMwareWorkstationPro16网络连接NAT模式的子网IP为192.168.5.0,其默认情况下连接的主机虚拟适配器的IP地址是()?A、192.168.5.1 B、192.168.5.2 C、192.168.5.254 D、192.168.5.255 答案:AOpenEulerLinux操作系统,系统默认的()用户对整个系统拥有完全的控制权?A、root B、guest C、administrator D、supervisitor 答案:AOpenEulerLinux操作系统,下面哪个命令是用来定义shell的全局变量?A、exportfs B、alias C、exports D、export 答案:DOpenEulerLinux操作系统,创建一个新用户时,会在()目录下创建一个用户主目录。A、/usr B、/home C、/root D、/etc 答案:BOpenEulerLinux操作系统,在vi编辑器里,命令“dd”用来删除当前的()。A、行 B、字 C、字符 D、变量 答案:AOpenEulerLinux操作系统,在vi编辑器里,哪条命令是不保存强制退出?A、:wq B、:wq! C、:q! D、:quit 答案:COpenEulerLinux操作系统,使用()命令更改文件的权限?A、attrib B、change C、chmod D、file 答案:COpenEulerLinux操作系统,按下()键能终止当前运行的命令?A、Ctrl-C B、Ctrl-F C、Ctrl-B D、Ctrl-D 答案:AOpenEulerLinux操作系统,下面哪个Linux命令可以一次显示一页内容?A、pause B、cat C、more D、grep 答案:COpenEulerLinux操作系统,一个文件的权限是:rw-r-----,这个文件的所有者的权限是什么?A、read-only B、read-write C、write-only D、无权限 答案:BOpenEulerLinux操作系统,对所有用户的环境变量设置,应当放在哪个文件中?A、/etc/bashrc B、/etc/profile C、~/.bash_profile D、/etc/bashrc 答案:BOpenEulerLinux操作系统,主机通过局域网接入互联网需要配置()?A、IP地址与子网掩码 B、网关 C、DNS服务器 D、以上都需要 答案:DOpenEulerLinux操作系统,输入命令或文件时用于自动补全时,按()健?A、Enter B、Ctrl C、Alt D、Tab 答案:DOpenEulerLinux操作系统,哪个文件包含了主机名到IP地址映射关系?A、/etc/hostname B、/etc/hosts C、/etc/resolv.conf D、/etc/networks 答案:B项目二、Hadoop集群完全分布式部署下面哪些是MapReduce的特点?()(多选) A、易于编程 B、良好的扩展性 C、实时计算 D、高容错性答案:ABDYARN中资源抽象用什么表示?() A、内存 B、CPU C、磁盘空间 D、Container答案:D下面哪个是MapReduce适合做的?() A、迭代计算 B、离线计算 C、实时交互计算 D、流式计算答案:B容量调试器有哪些特点?()(多选) A、容量保证 B、灵活性 C、多重租赁 D、动态更新配置文件答案:ABCDHDFS联邦环境下,NameSpace(命名空间)包含以下哪些内容?()(多选)A、目录 B、文件 C、块 D、.以上全不正确答案:ABCHDFS联邦机制下,各NameNode间元数据是不共享的。() A、TRUE B、FALSE答案:AHDFS的副本放置策略中,同一机架不同的服务器之间的距离是()。 A、1 B、2 C、3 D、4答案:BMapReduce过程中,以下属于Shuffle机制的是?()(多选) A、Copy B、Partition C、Combine D、Sort/Merge答案:AD.ApplicationMaster采用轮询的方式通过RPC协议向ResourceManager申请和领取资源。()A、TRUE B、FALSE答案:A在YARN的任务调度中,一旦ApplicationMaster申请到资源后,使与对应的ResourceManager通信,要求它启动任务。() A、TRUE B、FALSE答案:B下列哪个命令是从HDFS下载目录/文件到本地的?() A、dfs–put B、dfs–cat C、dfs–get D、dfs–mkdir答案:C.以下选项中属于HDFS架构关键特性的是?()(多选) A、HA高可靠性 B、健壮机制 C、元数据持久化机制 D、多方式访问机制答案:ABCDHadoop集群中包含了多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?()(多选) A、HDFS B、NameNode C、DataNode D、HBase答案:BC假设HDFS在写入数据是只存2份,那么在写入过程中,HDFSClient先将数据写入DataNode1,再将数据写入DataNode2。() A、TRUE B、FALSE答案:B.容量调度器在进行资源分配,现有同级的2个队列Q1和Q2,他们的容量均为30,其中Q1已使用8,Q2已使用14,则会优先将资源分配Q1。() A、TRUE B、FALSE答案:AYARN中,从节点负责以下哪些工作?()(多选) A、集群中所有资源的统一管理和分配 B、监督container的生命周期管理C、监控每个Container的资源使用情况 D、.管理日志和不同应用程序用到的附属服务答案:BCYARN调度器分配资源的顺序,下面哪一个描述是正确的?() A、任意机器本地资源同机架 B、任意机器同机架本地资源C、本地资源同机架任意机器 D、同机架任意机器本地资源答案:C.以下哪个不属于Hadoop中MapReduce组件的特点?() A、高容错 B、良好的扩展性 C、实时计算 D、易于编程答案:CHadoop系统中,如果HDFS文件系统的备份因子是3,那么MapReduce每次允许task都是从3个有副本的机器上传输需要处理的文件。() A、TRUE B、FALSE答案:B下列选项中,哪些是MapReduce一定会有的过程?() A、Combine B、Map C、Reduce D、Partition答案:BCD项目三、Hadoop生态系统常用组件部署HBase的最小存储单元是什么?() A、Region B、Column C、ColumnFamily D、Cell答案:AHBase集群定时执行Compaction的目的是什么?()(多选) A、提升数据读取性能 B、减少同一个Region同一ColumnFamily下的文件数目C、提示数据写入能力 D、减少同一个Region的文件数目答案:BD以下哪些是Hive适用的场景?()(多选) A、数据挖掘(用户行为分析、兴趣分区、区域展示) B、实时的在线数据分析C、数据汇总(每天/每周用户点击数,点击排行) D、非实时分析(日志分析、统计分析)答案:ACD以下关于HiveSQL基本操作描述正确的是?() 创建外部表使用external关键字,创建普通表需要指定internal关键字创建外部表必须要指定location信息加载数据到Hive时源数据必须是HDFS的一个路径创建表时可以指定列分隔符答案:DSparkRDD的算子分为哪几类?()(多选) A、Memory B、Calculate C、Transformation D、Action答案:CDYARN中资源抽象用什么表示?() A、内存 B、CPU C、磁盘空间 D、Container答案:D下面哪个是MapReduce适合做的?() A、迭代计算 B、离线计算 C、实时交互计算 D、流式计算答案:B容量调试器有哪些特点?()(多选) A、容量保证 B、灵活性 C、多重租赁 D、动态更新配置文件答案:ABCDHBASE的底层数据以()的形式存在的? A、KeyValue B、列存储 C、行存储 D、实时存储答案:A关于HBASE存储模型的描述正确的是?()(多选) A、即使是key值相同,qualifier也相同的多个keyvalue也可能有多个,此时使用时间戳来区分B、同一个key值可以关联多个valueC、keyvalue中有时间戳、类型等关键信息D、每一个keyvalue都有一个qualifier标识答案:ABCDSpark的核心模块是?() A、sparkstreaming B、sparkcore C、mapreduce D、sparksql答案:BHBase的主要特点有哪些?()(多选) A、面向列 B、高性能 C、可伸缩 D、高可靠性答案:ABCDHBase的数据文件HFile中一个KeyValue格式包含Key、Value、TimeStamp、KeyType等内容。() A、TRUE B、FALSE答案:AHive是一种数据仓库处理工具,使用类SQL的HiveQL语言实现数据查询功能,所有Hive的数据都存储在HDFS中。() A、TRUE B、FALSE答案:A导入数据到Hive表时,不会检查数据合法性,只会在读取数据时候检查。()A、TRUE B、FALSE答案:AHBase的Region是由哪个服务进程来管理的?() A、HRegionServer B、ZooKeeper C、HMaster D、DataNode答案:A关于Hive与Hadoop其他组件的关系。以下描述错误的是?() A、Hive最终将数据存储在HDFS中 B、Hive是Hadoop平台的数据仓库工具C、HQL可以通过MapReduce执行任务 D、Hive对HBase有强依赖答案:DHBase的主HMaster是如何选举的?() A、由RegionServer进行裁决 B、HMaster为双主模式,不需要进行裁决C、通过ZooKeeper进行裁决 D、随机选举答案:C以下关于HiveSQL基本操作描述正确的是?() A、创建外部表必须要指定location信息B、创建外部表使用external关键字,创建普通表需要指定internal关键字C、加载数据到Hive时源数据必须是HDFS的一个路径D、创建表时可以指定列分割符答案:DSparkonYarn-client适合用于生产环境是因为可以更快的看到APP的输出。()A、TRUE B、FALSE答案:B项目四、HadoopHA集群部署ResourceManager采用高可用方案,当ActiveResourceManager发现故障时,只能通过内置的Zookeeper来启动Standby的ResourceManager,将其状态切换为active。()A、True B、False答案:BZookeeper在分布式应用中的主要作用不包括一下哪些选项?() A、选举Master节点 B、保证各节点上数据的一致性 C、分配集群资源 D、存储集群中服务器信息答案:C.在Zookeeper和YARN的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪些目录中获取Application相关信息?() A、metastore B、Statestore C、Storeage D、Warehouse答案:BZKFC进程部署在HDFS中的以下哪那个节点上?()(多选) A、ActiveNameNode B、StandbyNameNode C、DataNode D、以上全部不对答案:ABZooKeeper所有节点都可以处理读请求。() A、TRUE B、FALSE答案:A下列哪些措施是为了保障数据的完整性?()(多选) A、元数据可靠性保证 B、重建失效数据盘的副本数据 C、安全模式 D、集群数据均衡答案:ABCDHDFS中NameNode的主备仲裁,是由哪个组件控制的?() A、HDFSClient B、NodeManager C、ResourceManager D、ZooKeeperFailoverController答案:D.当Zookeeper集群的节点数为5节点时,请问集群的容灾能力和多少节点是等价的?()A、3 B、4 C、5 D、以上全不正确答案:DYARN容量调度器的主要特点有哪些?() A、容量保证 B、动态更新配置文件 C、灵活性 D、多重租赁答案:ABCDYARN中设置队列QueueA的最大使用资源量,需要配置哪个参数?()A、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percentB、yarn.scheduler.capacity.root.QueueA.maximum-capacityC、yarn.scheduler.capacity.root.QueueA.minimum.user-limit-factorD、yarn.scheduler.capacity.root.QueueA.state答案:B如果某些Containers的物理内存利用率超过了配置的内存阈值,但所有Containers的总内存利用率并没有超过设置的NodeManager内存阈值,那么内存使用过多的Containers仍可以继续运行。() A、TRUE B、FALSE答案:AYARN的基于标准调度,是对下列选项中的哪个进行标签化?() A、AppMaster B、ResourceManager C、NodeManager D、Container答案:C下列选项中,关于Zookeeper可靠性含义说法正确的是?() A、可靠性通过主备部署模式实现B、可靠性是指更新更新只能成功或者失败,没有中间状态C、可靠性是指无论哪个server,对外展示的均是同一个视图D、可靠性是指一个消息被一个Server接收,它将被所有的Server接受答案:DYarn-Client和Yarn-Cluster主要区别是ApplicationMaster进程的区别。(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论