下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大数据技术与应用智慧树知到期末考试答案+章节答案2024年咸阳职业技术学院克服MapReduce在迭代式计算和交互式计算方面的不足。()
答案:对Sqoop常用命令import是将数据导出。()
答案:错Flumeagent承载了三大组件Source、Channel、Sink。()
答案:对生效环境变量的命令是:source/etc/profile。()
答案:对下载Hadoop的官网是/。()
答案:错hadoopdfsadmin–report命令用于检测HDFS损坏块。()
答案:错DataNode是文件存储的基本单元,它将Block存储在本地文件系统中,保存了Block的Meta-data,同时周期性地将所有存在的Block信息发送给NameNode。NameNode返回文件存储的DataNode的信息。()
答案:对Channel不可以连接Source和Sink的组件。()
答案:错最早提出“大数据”时代到来的是全球知名公司谷歌()
答案:错HiveServer将用户提交的HL语句进行编译,解析成对应的Yarn任务、Spak任务或者HDFS操作,从而完成数据的提取、转换、分析。()
答案:对Hadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是200GB。()
答案:错Hadoop系统中,如果HDFS文件系统的备份因子是3,那么MapReduce每次运行的task都要从3个有副本的机器上传输需要处理的文件段。()
答案:错传统的数据仓库无法有效处理不同类型的数据。(
)
答案:对Hadoop完全分布模式配置免密登录是要?()
答案:主节点和从节点任意两个节点之间免密登录下面哪个目录保存了Hadoop集群的命令(比如启动Hadoop)?()
答案:sbinHBase的访问方式有很多,如下的访问方式中,哪一种是支持直接命令行方式访问()
答案:HbaseShell并行数据处理框架MapReduce是()公司在大数据领域的重要贡献。
答案:谷歌下列关于传统并行计算框架(比如MPI)和MapReduce并行计算框架比较正确的是:()
答案:前者是共享式(共享内存/共享存储),容错性差,后者是非共享式的,容错性好()是一个处理、存储和分析海量的分布式、非结构化数据的开源框架。
答案:Hadoop下列对HBase的理解正确的是:()
答案:HBase是针对谷歌BigTable的开源实现下列关于计算机存储容量单位的说法中,错误的是()。
答案:一个汉字需要一个字节的存储空间关于Hbase的数据模型叙述中,正确的是()
答案:Hbase表中的单元由行Key,列族名,列限定符和时间戳共同唯一确定端口50090默认是Hadoop哪个服务的端口?()
答案:SecondaryNameNodeHive是由哪家公司开源的(
)。
答案:Facebook在ZooKeeper和YARN的协同工作中,当ActiveResourceManager产生故障时,StandbyResourceManager会从以下哪个目录中获取Application相关信息()
答案:Statestore(正确答案)()指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。
答案:数据.下面关于Hivemetastore的三种模式的描述错误的是(
)。
答案:Derby方式在同一时间只能有多个进程连接使用数据库HDFS为海量的数据提供了存储,而MapReduce为海量的数据提供了计算。()
答案:对Sqoop对于数据的导入、导出都是通过MapReduce作业实现的。()
答案:对SecureCRT是一款世界一流的终端仿真程序,终端仿真其实就是用于与远程主机(计算机)进行通信。()
答案:对HBase是一个构建在HDFS上的分布式列存储系统。()
答案:对mysql到hdfs通过sqoop进行数据传输分两种,一是只支持新增不支持更新、二是可以修改和新增。()
答案:对集群的目的是为了节省成本,用廉价的pc机,取代小型机及大型机。()
答案:对Source组件只能处理单一类型格式的日志数据。()
答案:错MapReduce的核心理念是数据向计算靠拢。()
答案:错Flume具有高可靠性、高容错性,并且是可升级的、易管理的、可定制的。()
答案:对Sqoop常用命令exportt是将数据导出。()
答案:对大数据的核心就是(),大数据能够预测体现在很多方面。
答案:预测Hadoop平台中启用YARN组件的日志聚集功能,需要配置哪个参数()
答案:yarn.log-aggregation-enable(正确答案)在HBase数据库中,每个Region的建议最佳大小是:()
答案:1GB-2GB解压JDK软件jdk-linux-x64.tar.gz的正确命令是()
答案:tar-xzvfjdk-linux-x64.tar.gz查看IP地址的命令错误的为:()
答案:startnetwork下面关于Hive和传统数据库的比较描述正确的是(
)。
答案:Hive的针对数据仓库设计,针对的是读多写少的场景下列说法错误的是:()
答案:Hadoop框架是用Java实现的,MapReduce应用程序则一定要用Java来写下面关于Hive各个格式使用场景描述错误的是(
)。
答案:目前Parquet默认使用gzip压缩格式Flume是Cloudera提供的一个分布式、高可靠的、高可用的海量日志收集、聚合和传输系统。()
答案:对FlumeSource可以监听一个或者多个网络端口,也可以从本地文件系统读取数据。()
答案:对传统的数据仓库可以满足快速增长的海量数据存储需求。(
)
答案:错Flume不具有高扩展性,而且不容易地被水平扩展。()
答案:错在hive中下列哪些命令可以实现去重(
)。
答案:groupby;row_number;distinct互联网和大数据的发展,是一个从信息找人,到人找信息的过程。()
答案:错下面关于Hive数据装载描述正确的是(
)。
答案:什么场景,装载数据使用LOADDATA效率最低并行数据处理技术MapReduce是由哪家公司最先提出的()
答案:谷歌公司下面关于Hive外表table1的数据删除描述正确的是(
)。
答案:ALTERtable1SETTBLPROPERTIES('EXTERNAL'='FALSE');DROPTABLEtable1;Flume采用了三层架构,分别为agent,collector和storage,每一层均可以水平扩展。()
答案:对Sqoop不可以高效的可控的利用资源,比如它可以通过调整任务数,来控制任务的并发度,另外还可以配置数据库的访问时间等等。()
答案:错YARN调度器分配资源的顺序,下面哪一个描述是正确的()
答案:本地资源->同机架->任意机器(正确答案)停止Hadoop进程正确的命令是()。
答案:stop-all.shHive是为了解决哪类问题(
)。
答案:海量结构化日志的数据统计HDfS中的block默认保存几份?()
答案:3份下列有关大数据的典型应用,说法错误的是()
答案:大数据的应用只能让我们了解事物的现状,不能预测未来测试Sqoop安装是否成功,输入sqoopversion命令之后,系统不会提示Sqoop版本相关信息。()
答案:错今天,大数据已经广泛应用于各个行业中。例如,金融、汽车、餐饮、电信、能源、体育和娱乐等社会各行各业都已经融入了大数据的印迹。()
答案:对Sqoop启动MapReduce作业,MapReduce中主要是对输入类InputFormat和输出类OutputFormat进行定制。()
答案:对Flume于2019年被捐赠给apache软件基金会,成为Hadoop相关组件之一。()
答案:错Flume的核心是FlumeAgent。()
答案:对大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。()
答案:对Sqoop常用命令help是打印Sqoop帮助信息。()
答案:对Sqoop底层用MapReduce程序实现数据的抽取、转换、加载。()
答案:对MapReduce是基于内存计算机。()
答案:错HBase的分布式存储的最基本单元是Region。()
答案:对虚拟机是一个相对独立的环境,在这个环境里,可以安装各个版本的Windows系统。也可以根据环境自己调节环境的配置,像一般电脑一样开机。()
答案:对BlockSize是不可以修改的。()
答案:错rhadoop是用R语言开发的,MapReduce是一个框架,可以理解是一种思想,可以使用其他语言开发。()
答案:对Flume具有基于流动数据流的简单灵活的体系结构,具有可调整的可靠性机制以及许多故障转移和恢复机制,具有强大的功能和容错能力。()
答案:对添加了一个新的标识符ClusterID用于标识集群中所有的节点。当格式化一个Namenode,需要提供这个标识符或者自动生成。这个ID可以被用来格式化加入集群的其他Namenode。()
答案:对Flume支持多种接入资源数据的类型以及接出数据类型。()
答案:对通常是集群的最主要瓶颈是D磁盘。()
答案:错hadoop大数据的两大核心技术是()
答案:HDFS;MapReduceHive是采用批处理的方式处理海量数据。(
)
答案:对FlumeSource是负责接收数据到FlumeAgent的组件,接收外部源(如Web服务器)传递给它的事件,外部数据源以目标FlumeSource可以识别的格式将事件发送到FlumeSource。()
答案:对YARN中,slave节点负责以下哪些工作()
答案:监督Container的生命周期管理HIVE与传统SQL数据库对比,下面描述不正确的是(
)。
答案:最终执行者:HIVE使用MapReduce和Excutor执行,传统SQL数据库使用Excutor执行器下列关于对大数据特点的说法中,错误的是()。
答案:数据价值密度高有关HBase的叙述,正确的是()
答案:提供了简单的基于Key的查询方法下列哪个属性是hdfs—site。xml中的配置?()
答案:dfs.replicationHadoop中,如果将yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent设置为50,下面说法错误的是()
答案:QueueA中的每个用户最多只能获得50%的资源。(正确答案)下列哪项通常是集群的最主要瓶颈()。
答案:磁盘HBase三层结构的顺序是:()
答案:Zookeeper文件,-ROOT-表,.MEATA.表下列对HBase数据模型的描述错误的是:()
答案:HBase中执行更新操作时,会删除数据旧的版本,并生成一个新的版本关于Hadoop单机模式和伪分布式模式的说法,正确的是()
答案:后者比前者增加了HDFS输入输出以及可检查内存使用情况访问HBase表中的行,有哪些方式:()
答案:全表扫描MapReduce是一种编程模型,用户只需通过编写()函数来实现自己的计算逻辑。
答案:map+reduce()擅长处理和分析大量分布式的非结构化数据,以分批的方式进行历史分析。
答案:HadoopHadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令()
答案:application大数据时代,数据使用的关键是()。
答案:数据再利用Sqoop软件能够实现关系数据库和HDFS数据之间的传输,在数据导入、导出时都要生成相应的()作业,提高工作性能。
答案:MapReduce下面中不属于HIVE中的元数据信息(
)。
答案:表的属性(只存储内部表信息)MapReduce是一种并行式的计算模型,用于大规模数据集,通常是大于()的并行计算。
答案:1TBSqoop导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统。()
答案:对Sqoop就是一个工具,需要在两个以上节点上进行安装即可。()
答案:错Sqoop核心的功能有导入或迁入、导出或迁出。()
答案:对Sqoop不能自动地完成数据类型的映射与转换。()
答案:错Sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。()
答案:对Flume可以将应用产生的数据存储到任何集中存储器中,比如HDFS,HBase。()
答案:对Flume的管道是基于事务,保证了数据在传送和接收时的一致性。()
答案:对Flume是可靠的,容错性高的,可升级的,易管理的,并且不可以定制。()
答案:错实时性,Flume有一个好处可以实时的将分析数据并将数据保存在数据库或者其他系统中。()
答案:对Flume的配置很繁琐,source,channel,sink的关系在配置文件里面交织在一起,便于管理。()
答案:错Hive有四个驱动器,下面那个不是()。
答案:策略器(Strategyimplement)Hive有什么好处()。
答案:可以通过语句自动编译mapreduce(Mapreducecanbeautomaticallycompiledusingstatements)Hive的元数据存储在derby和MySQL中有什么区别()。
答案:多会话(Moresession)下列关于Hive特点总结正确的选项是()。
答案:Hive支持自定义函数,用户可以根据自己的需求去定义函数下列哪个组件不属于Hive架构()
答案:TaskManagerHBase的每个列族均对应了一个()属性。
答案:时间戳()是一个实时收集、分析、展示、监控数据的分布式数据库,它基于HBase存储和查询监控数据。
答案:OpenTSDB在水平方向,HBase的一张表由一个或多个()组成。
答案:列族HBase每个行有一个()唯一标识了行的地址。
答案:行键在垂直方向,HBase的一张表有多个()来组成。
答案:行族谷歌公司关于MapReduce模型的论文发布于()年
答案:2004大数据的开发和利用,关键在于大数据技术的支撑。其中,MapReduce是分布式数据库。()
答案:错适合MapReduce框架处理的任何和数据集要求待处理的数据集可以分解为许多小的数据子集,而且每个数据子集的处理不依赖也不影响其他数据子集的处理。()
答案:对下列关于MapReduce模型的说法错误的是()
答案:MapReduce模型是一种理论模型,无法实现以下关于yarn的描述正确的是:()
答案:支持多个框架,yarn不再是一个单纯的计算框架,而是一个框架管理器。以下关于yarn的说法正确的是:()
答案:Yarn是采用两级式资源分配方案对新一代资源管理调度框架YARN的理解正确的是:()
答案:YARN可以实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架Yarn附则整个集群的资源管理功能,每个任务都单独有一个“应用服务器”:()
答案:对Yarn各模块组成有:()
答案:Resourcemanager、nodemanager、applicationMasterHadoop环境变量中的HADOOP_HEAPSIZE用于设置所有Hadoop守护线程的内存。它默认是()。
答案:1000M配置机架感知的下面哪项正确:()
答案:如果一个机架出问题,不会影响数据读写;MapReduce会根据机架获取离自己比较近的网络数据;写入数据的时候会写到不同机架的DataNode中如果NameNode意外终止,SecondaryNameNode会接替它使集群
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024工程项目协议条款与监管办法
- SaaS平台定制技术开发服务协议
- 2023-2024学年重庆市永川北山中学高三二轮检测试题(二模)数学试题试卷
- 2024定制出租车辆运营协议典范
- 2024年履约担保协议范本下载指南
- 2024锅炉维修工程协议格式
- 2024年度汽车租赁协议格式
- 2024商业秘密保护竞业限制协议样本
- 2024年仓库转租协议条款
- 动产资产抵押协议范例2024年
- 高考地理一轮复习课件【知识精讲+高效课堂】美食与地理环境关系
- 分居声明告知书范本
- 2023年04月山东济南市槐荫区残联公开招聘残疾人工作“一专两员”公开招聘笔试参考题库+答案解析
- 消失的13级台阶
- 营销管理知识点
- 船体强度与结构设计课程设计
- 不宁腿综合征诊断与治疗
- 初中英语教学活动设计
- 三写作的载体与受体
- GB/T 451.3-2002纸和纸板厚度的测定
- 网签授权书(学生就业平台)
评论
0/150
提交评论