版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Hadoop平台构建智慧树知到期末考试答案+章节答案2024年上海思博职业技术学院zookeeper集群使用的协议()。
答案:ZAB协议在spark生态组件中,哪个产品可用于复杂的批量数据处理()。
答案:sparkcore下列通常是集群最主要的瓶颈是:()
答案:磁盘I/O在ps命令中什么参数是用来显示所有用户的进程的?()
答案:a在Hadoop集群中,负责海量数据的存储和分析的组件是___B______。
答案:HBasessh服务端的进程名为()
答案:sshd以下哪项不属于大数据思维的涵盖内容():
答案:通过采样的手段获取目标群体的统计特性Hadoop的NameNode负责____A_____。
答案:管理HDFS的数据块关于ZKFC故障转移控制器,说法正确的是()。A.当集群启动时,主备节点的概念是很模糊的,当ZKFC检查到任意一个节点是健康状态,直接将其设置为主节点。
答案:当zkfc检查到两个NN节点是健康状态,发起投票机制选出一个主节点,一个备用节点,并修改主备节点的状态。显示一个文件最后几行的命令是:()
答案:tailHDFS是Hadoop提供的_____A____。
答案:分布式文件系统如何在文件中查找显示所有以"*"打头的行?()
答案:grep‘^*’file下面哪条命令可以把f1.txt复制为f2.txt?()
答案:catf1.txt>f2.txt关于hadoopMapReduce分片(split)的概念,下列说法不正确的是()
答案:split是一个物理的存储概念在Hadoop中,可以使用___C______进行流式数据处理。
答案:Flume在Hadoop中,可以使用_____C____执行高级数据查询。
答案:YARNHBase默认使用什么作为其底层文件存储系统?()
答案:HDFSZookeeper角色分配不包括()
答案:protecter在Hadoop中,可以使用____C_____进行消息传递。
答案:Flume在思维方式方面,不是大数据显著影响的是()。
答案:存储而非计算RDD可以从hadoop兼容的文件系统生成,生成之后通过调用RDD算子对RDD的数据进行部分更新。()
答案:错在Hadoop集群中,HBase负责数据的增删改查。()
答案:对Hbase的最小存储单元不是Region而是一个Cell单元。()
答案:对假设HDFS在写入数据是只存2份,那么在写入过程中,HDFSClient先将数据写入Datanode1,再将数据写入Datanode2。()
答案:错对高价值高度聚合的信息和知识的批次处理是大数据行业主要商业诉求.()
答案:错Hadoop集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起()
答案:对在Hadoop中,可以使用Kafka进行实时数据处理。()
答案:错在HDFSNameNode中Fslmage中并没有记录具体的记录块在哪些数据节点上存储的,是通过数据节点和名称节点在运行时不断通过沟通而实时维护这些信息的,而这些信息都是存储到内存单中去了。()
答案:错HBase中Compaction的目的是减少同一个Region,同一个ColumnFamily下的文件数目。()
答案:对Hadoop中的HDFS是用来处理非结构化数据的。()
答案:错Hadoop的NameNode负责存储HDFS的文件。()
答案:错大数据不是万能的,所以我们要将大数据方法结合传统的推理预测方法,才得到一个更加精确的结果。()
答案:对HDFS系统不支持数据的修改。()
答案:对HDFS集群中的数据节点一般是一个节点运行一个数据节点进程,负责处理文件系统客户端的读/写请求,在名称节点的统一调度下进行数据块的创建、删除和复制等操作。()
答案:对一个Java源程序文件中只能定义一个public类。()
答案:错spark是由C编程语言实现的。()
答案:错Yarn-client和Yarn-cluster主要区是ApplicationMaster进程的区别.()
答案:对使用Shell命令insert对HBase中的一张表进行数据添加操作。()
答案:错Spark是基于内存的计算,所有Spark程序运行过程中的数据只能存储在内存中。()
答案:错在Hadoop中,可以使用Flume进行消息传递。()
答案:对Hadoop是一种分布式计算平台。()
答案:对对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据收集的信息量要尽量精确。()
答案:错MapReduce是分布式并行计算框架,其计算模式属于流计算,实时性好。()
答案:错因为HDFS有多个副本,所以NameNode是不存在单点问题的。()
答案:错Flume传输数据过程中,sink取走数据并写入目的地后,会将event从channe中刪除。()
答案:对HBase是Hadoop中的关系型数据库。()
答案:对Hadoop集群中的任务调度和资源管理是由HBase完成的。()
答案:错每个map槽就是一个线程。()
答案:错Hadoop支持数据的随机写。()
答案:错Hadoop是一种关系型数据库。()
答案:错配置Hadoop时,JAVA_HOME包含在()
答案:hadoop-env.sh基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有()。
答案:HDFS;HBaseHadoop自身具有严格的权限管理和安全措施保障集群正常运行。()
答案:错Hadoop及其生态系统,可以部署在()。
答案:Linux;UNIXHadoop的三种安装模式包括以下哪种()。
答案:完全分布式模式;单机模式;伪分布模式SparkStreaming计算基于DStream将流式计算分解成一系列短小的批处理作业。()
答案:错spark的master和worker通过什么方式进行通信的()。
答案:AkkaSpark任务的每个stage可划分为job,划分的标记是shuffle。()
答案:错Spark任务的Executor可以执行多个task。()
答案:错Spark和Hadoop都不适用于迭代计算的场景。()
答案:错下列不属于非关系型数据库的是()。
答案:Hive以下属于HiveSQL中DDL数据定义语言的是()。
答案:建表;删除表;修改表Hive是一种数据仓库处理工具,使用类sql的HivesqlL语言实现数据查询功能,所有Hive的数据都存储在HDFS中。()
答案:错Hive中的这条命令“LOADDATALOCAL
INPATH'/opt/college/person.csv'OVERWRITE
into
tableperson;”是个什么类型的操作(
)。
答案:从Linux本地文件person.csv导入;导入数据到表personHIVE的元数据可存储在哪里()。
答案:mysql数据库;derby数据库Hive中的这条命令“droptableperson;”是什么含义(
)
答案:删除表关于hive建表基本描述正确的是()。
答案:创建外部表需要制定external关键字加载数据到Hive表,哪种方式不正确()。
答案:Hive支持Insertinto单条记录的方法,所以可以直接在命令行插入单条记录对hive中表数据操作描述正确的是()。
答案:hive不可以修改特定行值、列值对于Hive中关于普通表和外部表描述不正确的是()。
答案:外部实质是将已存在于HDFS上的文件路径跟表关联起来Hadoop是当前大数据平台的事实标准,下列对Hadoop的描述中正确的是()。
答案:Hadoop在当前衍生出一系列优秀的开源项目,包括Hbase、Hive、Pig等;Hadoop是一个由Apache基金会开发的分布式系统开源架构;Hadoop的初始设计思路来源于Google发布的学术论文;Hadoop的两个核心部分是HDFS和MapReduce计算框架MapReduce与HBase的关系,()描述是正确的。
答案:两者不是强关联关系,没有MapReduce,HBase可以正常运行;MapReduce可以直接访问HBaseMapReduce程序对数据的处理主要分为下列哪些过程()。
答案:map;reduce;shuffleMapReduce的inputsplit一定是一个block。()
答案:错Mapreduce过程中,以下属于Shuffle机制的是()。
答案:Sort/Merge;combine;Copy;PartitionHBase依赖()技术框架提供消息通信机制。
答案:Zookeeper下列()选项是安装HBase前所必须安装的。
答案:操作系统;JDKHadoop的HBase主要特点有哪些()
答案:可伸缩;高可靠性;面向列;高性能HBase的数据文件HFile中一个Keyvalue格式包含哪些信息()。
答案:value;Key;TimeStamp;KeytypeHBase系统用于记录Region相关信息的表,具体的表包含()。
答案:…META.;-ROOT-以下哪个不是HDFS的守护进程()。
答案:MrappMaster/YarnChild下列关于HDFS的描述正确的是()
答案:NameNode磁盘元数据不保存Block的位置信息HDfS中的block默认保存几份()。
答案:3下列哪个属性是hdfs-site.xml中的配置()。
答案:yarn.resourcemanager.addressHDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是()。
答案:一次写入,多次读Hadoop生态系统中,被作为ETL使用的软件是()。
答案:SqoopHadoop作为分布式计算技术的杰出代表,其主要特征包括()。
答案:健壮性;简单性;高效性;可靠性以下命令组成错误的是()。
答案:bin/hadoopfs-cat/hadoopdata/y/txt想要修改集群的备份数量,可以修改哪个()。
答案:hdfs-site.xml关于Hadoop单机模式和伪分布式模式的说法,正确的是()。
答案:后者比前者增加了HDFS输入输出以及可检查内存使用情况()在许多情况下,能够达到99.999%的可用性。
答案:集群解压.tar.gz结尾的HBase压缩包使用的Linux命令
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 杭州市人力资源社保局劳动合同
- 天津市贯彻劳动合同法若干问题实施细则
- 《场景演练案例集》课件
- 2025年淄博道路运输从业资格证考试模拟试题
- 2025年迪庆道路运输从业人员资格考试内容有哪些
- 2025年赣州货运上岗证考试题库
- 2025年货运从业资格题库软件下载
- 矿山开采灰工施工合同
- 实习律师的领导力培养
- 企业合同印章管理规范
- 中医思维在临床中的应用护理课件
- 生产与运作管理第三版课后习题含答案版
- 高频考点之评价与文本互证考题专练-2024年高考语文二轮复习三点突破讲解专练
- 年会拜年祝福视频脚本
- 苏教版五年级数学上册期末复习课件
- 上海交通大学2003年481物理化学考研真题
- 公司财务预算报告
- 金桥焊材产品质量证明书-可-编-辑
- 国家一等奖《纪念刘和珍君》教学设计
- 2023年医疗机构消毒技术规范
- 小学生主题班会 忆伟人故事展少年风采-纪念伟大领袖毛主席诞辰130周年 课件(共33张PPT内嵌视频)
评论
0/150
提交评论