




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
hadoop考试复习试题200道I.Spark是用一下哪种编程语言实现的?()[单选题]*A.CB.C++;C.JAVA;(正确答案)D.Scala2.FusionInsightManager对服务的管理操作,下面说法错误的是?() [单选题]*A.可对服务进行启停重启操作;B.可以添加和卸载服务;C.可设置不常用的服务隐藏或显示;(正确答案)D.可以查看服务的当前状态;3.FusionInsightHD集群升级,一下描述正确的是?() *A.升级过程中不可以操作准备OMS倒换;(正确答案)B.集群内所有主机的root账户密码要保持一致;(正确答案)C.保持网络通畅,避免网络问题导致升级异常;(正确答案)D.观察期不能做扩容;(正确答案)4.FusionInsightHDLoader在创建作业时,连接器(Connector)W什么用?()[单选题]*A.确定有哪些转化步骤;B.提供优化参数,提高数据导出性能;C.配置数据如何与外部数据进行连接;(正确答案)D.配置数据如何与内部数据进行连接;[单选题]*5.下列哪个HDFS[单选题]*A.hdfsfsck/;(正确答案)B.hdfsfsck/-delete;C.hdfsdfsadmin-report;D.hdfsbalancer-threshold1;6.YARN中设置队列QueueA最大使用资源里,需要配置哪个参数?() [单选题]*A.yarnschedulercapactyrootQueueAuser-limit-factor;B.yarnschedulercapactyrootQueueAminimum-user-limit-percent;C.yarnschedulercapactyrootQueueAstate;D.yarnschedulercapactyrootQueueAmaximum-capadty正确答案).Flume的数据流可以根据headers的信息发送到不同的channel中。()[单选题]*A.正确;(正确答案).错误;.FusionInsightManager与外部管理平台对接时,支持哪些接口?() *A.SNMP;(正确答案)B.VPN;C.BGP;D.Syslog;(正确答案).HBase的数据文件HFile中一个KeyValue格式包含哪些信息?() *A.Key;(正确答案)B.Value;(正确答案)C.TimeStamp;(正确答案)D.KeyType;(正确答案)10.FusionInsightHG集群规划设计时,集群有150个节点,并采用双面组网部署,对于该集群网络宽带要求的描述,下面描述正确的有?() *A.业务平面所有节点都使用10GE网络;(正确答案)B.管理平面中控制节点使用10GE网络;C.管理平面中数据节点使用1GE网络(正确答案)D.业务平面中控制节点使用1GE网络;E.管理平面管理节点使用10GE网络;(正确答案)II.Fusionlnsight系统中Hive支持的储存格式包括?() *A.HFile;B.TextFile;(正确答案)C.SequenceFile(正确答案)D.RCFile;(正确答案)12.Spark任务的每个stage可划分为job,划分的标记是shuffle。()[单选题]*A.正确;B.错误。(正确答案)13.FusionInsightManager对服务的配置功能说法不正确的是?() [单选题]*A.服务级别的配置对所有实例生效;B.实例级别的配置只针对本实例生效;C.实例级别的配置对其他实例也生效;(正确答案)D.配置保存后需要重启服务才能生效;14.FusionInsightHD部署Solr时,如果选择索引放在本地磁盘,建议给每个SolrServer实例的数据目录单独挂载磁盘,并且磁盘配置为 RAIDO或RAID5.()[单选题]*A.正确;(正确答案)B.错误;15.关于FusioninsightHD安装流程正确的是?()[单选题]*A.安装Manager-〉执行preinstall->LLD工具进行配置->安装集群->安装后检查->安装后配置;B.LLD工具进行配置->执行preinstall->安装Manager->安装集群->安装后检查->安装后配置;(正确答案)C.安装Manager->LLD工具进行配置->执行preinstall->安装集群->安装后检查->安装后配置;D.LLD工具进行配置->执行preinstall->安装集群->安装Manager->安装后检查->安装后配置;16.关于kerberos部署,描述正确的是?()[单选题]*A.Kerberos仅有一个角色;B.Kerberos服务在同一个节点上有两个实例;(正确答案)C.Kerberos服务采用主备模式部署;D.Kerberos服务必须和LDAP服务部署在同一个节点上;.某银行规划FusioninsightHD集群有90个节点,如果控制节点规划了3个,那集群中数据节点规划推荐规划多少最为合适?() [单选题]*A.87;(正确答案)B.85;C.90;D.86;.安装FusioninsightHD软件包前,必须在本节点/etc/hosts文件中配置所有节点的主机名与业务ip的映射关系。()[单选题]*A.正确;(正确答案)B.错误;.客户IT系统中FusioninsightHD集群有150个节点,每个节点12块硬盘(不做raid,不包括os盘),每块磁盘大小1「只安装HDFS,按照默认配置最大存储多少数据?()[单选题]*A.1764TB;B.1800TB;C.600TB;D.588TB;(正确答案).FusionInsightHD节点不支持哪种主机操作系统?() [单选题]*A.Susell.1;B.RedHat6.5;C.Centos6.4;D.Ubuntu11.04;(正确答案).FusionInsightHD中,如果需要查看当前登录HBase的用户和权限组,可以在HBaseshell中执行什么命令?()[单选题]*A.use_permission;B.whoami;(正确答案)C.who;D.get_user;.FusionInsightHD产品在部署Kerbers和LDAP服务时,以下描述正确的是?()*A.部署Kerberoe服务之前,必须先部署LDAP服务;(正确答案)B.LDAP服务必须和Kerberos服务部署在同一个节点;C.Kerberos服务和LDAP服务部署到同一个节点利于数据访问,有助于性能提升;(正确答案)D.LDAP服务可以多个集群共享;.FusionInsightHDManager界面Hive日志收集,哪个选项不正确?() [单选题]*A.可指定实例进行日志收集,比如指定单独收集 MateStore的日志;B.可指定时间段进行日志收集,比如只收集 2016-1-1至I2016-1-10的日志;C.可指定节点IP进行日志收集,例如下载某个ip的日志;D.可指定特定用户进行日志收集,例如仅下载 userA用户产生的日志;(正确答案).华为FusionInsightHD集群中,Spark服务可以从以下哪些服务读取数据?()*A.YARN;B.HDFS;(正确答案)C.Hive;(正确答案)D.HBase;(正确答案)25.如果YARN集群中只有Default、QueueA、QueueB子队列,那么允许将他们的容量分别设置为60%、25%和22%。()[单选题]*A.正确;B.错误;(正确答案).FusionInsightHD系统中,关于Solr索引的存储部署一下说法正确的有() *A.利用HDFS数据存储可靠性和易于扩容的特点优先选择索引存储与 HDFS。;(正确答案)B.不论Solr索引存储在HDFS上还是存储在本地磁盘,在同一个节点上都必须要部署5个Solr实例,根据ip和不同的端口号来区分不同的实例;C.当对实例索引录入速度要求较高时,可选择索引存放于本地磁盘 ;(正确答案)D.当索引数据存放在HDFS上时,SolrServer实例与DataNode实例部署在同一个节点上;(正确答案).FusionInsightHD三层组网络适合多少节点的集群规模?() [单选题]*A.30节点以下;B.100节点以上;C.100-200节点;D.200节点以上;(正确答案)28.FusionInsightHD系统中,Kerberos仅用于组建间服务安全认证。() [单选题]*A.正确;B.错误;(正确答案)29.FusionInsightManage支持大规模集群的安装部署、监控、告警、用户管理、权限管理、审计、服务管理、健康检查、问题定位、升级和补丁。() [单选题]*A.正确;(正确答案)B.错误;.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?() [单选题]*A.客户端的文件数据经过NameNode传递给DataNode;B.客户将文件分为多个Block,根据Database的地址信息,按顺序写入每一个DataNode中;(正确答案)C.客户端根据DatabNode的地址信息,按顺序将整个文件写入每一个 Database中,然后由DataNode将文件划分为多个Block;D.客户端只上传数据到一个DatabNode,然后由NameNode负责Block复制;.FusionInsightHD系统中HBase的最小处理单元是Region,UserRegion和RegionService之间的路由信息是保存在哪?()[单选题]*Zookeeper;HDFS;Master;meta表;(正确答案)32.HBase集群定时执行Compaction的目的是什么?() *A.减少同一个Region,同一个ColumnFamily下的文件目录;(正确答案)B.提升数据读取性能;(正确答案)C.减少同一个ColumnFamily的文件数据;D.减少同一个Region的文件目录;33.FusionInsightManag蚣定时备份哪些数据?() *A.NameNode;(正确答案)B.LDAP;(正确答案)C.OMs;(正确答案)D.DBService;(正确答案)ABCD[填空题] _¥案:undefined)34通过FusioninsightManage不能完成以下哪个操作?() [单选题]*A.安装部署;B.性能监控;C.权限管理;D.虚拟机分配;(正确答案)35.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,并不会保持信息。()[单选题]*A.正确;B.错误;(正确答案)36.以下哪些是Spark服务的常驻进程?() *A.JobHistory;(正确答案)B.JDBService;(正确答案)C.SparkResource;D.NodeManage;FusioninsightHD的Streaming是基于开源ApacheStorm是一个分布式的离线计算框架。()[单选题]*A.正确;B.错误;(正确答案)FusioninsightHD系统中一个集群可以管理多个服务,每个服务可以管理多个角色,每个角色只能管理一个实例。() [单选题]*A.正确;B.错误;(正确答案)39.关于HBase的Region分裂流程Split的描述不正确的是?()[单选题]*A.Split过程中并没有真正将文件分开,仅仅是创建了引用文件 ;B.Split为了减少Region中数据大小,从而将一个Region分裂成两个Region;C.Split过程中该表会暂停服务;(正确答案)D.Split过程中被分裂的Region会暂停服务;40.Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理?()*A.大量小文件存储;B.高容错、高吞吐量;(正确答案)C.低延迟读取;D.流式数据访问;(正确答案)41.如果FusioninsightHD集群节点数不足以使数据节点单独部署的情况下,可以采用管理节点&控制节点合一部署方案,但性能会受限制。() [单选题]*A.正确;(正确答案)B.错误;42.Hadoop的NameNode用于存储文件系统的元素据。()[单选题]*A.正确;(正确答案)B.错误;关于Fusioninsight关键特性或操作说法正确的是?() [单选题]*A.能够针对整个集群或者某个服务进行监控检查,不能够针对某个节点进行健康检查;B.Manage引入角色的概念,采用RBAC的方式对系统进行权限管理;(正确答案)C.整个系统使用Kerberos管理用户,使用LDAP进行用户认证,通过CAS实现单点登录;D.对于健康检查结果,不能够导出检查报告,只能在线查看 ;查看Kafk某个Topic的Partition相信信息时,使用以下哪个命令?() [单选题]*A.bin/kafka-topics.sh--create;B.bin/kafka-topics.sh--list;C.bin/kafka-topics.sh--describe(正确答案)D.bin/kafka-topics--delete;FusioninsightHadoop集群中,在某个节点通过df-hT查询,看到的分区包含以下几个:[单选题]*/var/log(正确答案)/srv/BigData/srv/BigData/hadoop/data/5/srv/BigData/slor/solrserver3/srv/BigData/dbdata_om这些分区所对应磁盘最佳Raid级别的规划组合是?(B)A.RaidORaidlRaidONon-RaidRaidl;B.RaidlRaidlNon-RaidNon-RaidRaidl;C.RaidORaidORaidORaidORaidO;D.Non-RaidNon-RaidNon-RaidNon-RaidRaidl;FusioninsightHD系统中HDFS默认BlockSize是多少?()[单选题]*A.32MB;B.64MB;C.128MB;(正确答案)D.256MB;FusioninsightHD部署时,同一个集群内的FlumeServer节点建议至少部署几个?()[单选题]*A.1;B.2;(正确答案)C.3;D.4;FusioninsightHD系统审计日志不可以记录下面哪些操作?() [单选题]*A.手动消除警告;B.启停服务实例;C.删除服务实例;D.查询历史监控;(正确答案).基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下分布式存储组件的有?(多)()*A.MR;B.Spark;C.HDFS;(正确答案)D.HBase;(正确答案).Hadoop的HBase不适合哪些数据类型的应用场所?() [单选题]*A.大文件应用场所;(正确答案)B.海量数据应用场所;C.高吞吐应用场所;D.半结构化数据应用场所;51.Fusioninsight集群组网设计中,二层网指集群内二层交换,集群节点在一个子网里,适合节点小于200的集群场景。()[单选题]*A.正确;(正确答案)B.错误;52.FusioninsightHD中Loader作业提交到Yarn后,作业不能手工停止。()[单选题]*A.正确;B.错误;(正确答案)53.安装FusioninsightHD的Streaming组件时,Nimbus角色要求安装几个节点?()[单选题]*A.1;B.2;(正确答案)C.3;D.4;.关于FusioninsightHD中Loader作业描述正确的是?() [单选题]*A.Loader将作业提交到YARN执行后,如果此时Loader服务出现异常,则此作业执行失败;B.Loader将作业提交到YARN执行后,如果某个Mapper任务执行失败,能够自动进行重试。;(正确答案)C.Loader作业执行失败后将会产生垃圾数据,需要用户手动清除 ;D.Loader将作业提交到YARN执行后,该作业执行完成前,不能再提交其他作业。;.关于大数据的主要特征理解和描述正确的有?() *A.来源多,格式多;(正确答案)B.增长速度快,处理数据快;(正确答案)C.存储量大,计算量大;(正确答案)D.数据的价值密度低;(正确答案).Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?()[单选题]*A.container;B.applicationattempt;C.jar;□.application;(正确答案).在Fusioninsight集群规划部署时,建议管理节点最好部署()个,控制节点最少部署()个,数据节点最少部署()个?()[单选题]*A.1,2,2;B.1,3,2;C.2,3,1;D.2,3,3;(正确答案)58.FusionInsightManager界面上,当收到Kakfa盘容量不足告警,且该告警的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决。() [单选题]*A.正确;(正确答案)B.错误;59.FusionInsightHD安装过程中,执行preinstall不能完成哪项功能?()[单选题]*A.修改os配置,确保os满足FusionInsightHD的安装要求;B.安装Manager;(正确答案)C.格式化分区;D.安装os缺失的rpm包;60.SolrCloud模式是集群模式,在此模式下Solr服务强依赖于以下哪个服务?()[单选题]*A.HBase;B.HDFS;C.Zookeeper(正确答案)D.YARN;61.SparkYarn模式下的driver只能运行在客户端。()[单选题]*A.正确;B.错误;(正确答案)62.Hadoop中MapReduce组建擅长处理哪种应用场景的计算?() [单选题]*A.迭代计算;B.离线计算;(正确答案)C.实时交互计算;D.流式计算;.某高校的FusioninsightHD集群中有230个节点,在进行集群规划时,下列哪些进程应该部署在数据节点上?() *A.DatabNode;(正确答案)B.NameNode;C.NodeManage(正确答案)D.RegionService;(正确答案)E.DBServiceF.Solrserver(正确答案).FusionInsightHD集群中的节点只安装了一款网卡,也可以采用双平面隔离组网络方案。()[单选题]*A.正确;B.错误;(正确答案)65.Hadoop系统中,如果文件系统的备份因子是3,那么每次MapReduce任务运行的task所需要的文件都要从3个副本的机器上传输需要处理的文件。() [单选题]*A.正确;B.错误;(正确答案)66.YARN上有两个同济队列Q1与Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2个任务占用了30的容量,那么由于Q1的任务数多,调用器会优先将资源分配给Q1.()[单选题]*A.正确;B.错误;(正确答案).以下哪类数据不属于半结构化数据?() [单选题]*A.HTML;B.XML;C.二维表;(正确答案)D.JSON;.关于FusioninsightHD的Streaming描述正确的是? ()[单选题]*A.Supervisor负责资源分配和任务调度;B.Supervisor负责接受Nimbus分配的任务,启动和停止属于自己管理的worker进程;(正确答案)C.Supervisor是运行具体处理逻辑的进程;□.Supervisor是一个Topology中接收数据然后执行处理的组件;.HDFS的Client写入文件时,数据的第一副本写入位置是由 NameNode确定,其他副本的写入位置由DataNode确定。()[单选题]*A.正确;B.错误;(正确答案)70.关于FusioninsightManager说法错误的是?()[单选题]*A.NTPServerClient负责集群内各节点的时钟同步;B.通过FusioninsightManager可以对HDFS进行启停控制、配置参数;C.FusioninsightManager所有维护操作只能通过WebUI来完成,没有提供shell维护命令;(正确答案)D.通过FusioninsightManager可以向导式安装集群,缩短集群部署时间;71.RDD可以从Hadoop兼容文件系统生成,生成之后可以通过调用 RDD的算子对RDD的数据进行部分更新。()[单选题]*A.正确;B.错误;(正确答案)72.HDFS支持大文件存储,同事支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。()[单选题]*A.正确;B.错误;(正确答案)73.以下哪些OS版本被推荐用来搭建FusioninsightV1R2c60集群(对选)?()*A.SUSE11SP1/SP2/SP3forAMD64&intel64;(正确答案)B.Centos6.6(正确答案)C.RedNat-6.4-86_64(正确答案)D.RedNat-6.5-86_64;(正确答案)E.RedNat-6.7-86_64(正确答案)F.Ubuntu6.374.FusioninsightHD系统如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态?()[单选题]*ASYNCHRONIZED;B.EXPIRED;(正确答案)C.CONFIGURING;D.UNKNOWN;75.FusioninsightHD用户管理系统仅支持管理人机账号。() [单选题]*A.正确;B.错误;(正确答案)76.Flume的perties的配置文件可以配置多个channle来传输数据。()[单选题]*A.正确;(正确答案)B.错误;77.FusionInsightHD部署过程中,执行precheck检查每一个节点时必须调用checkNodes.Con巾gd配置文件。()[单选题]*A.正确;(正确答案)B.错误;78.FusionInsightHD系统中,如果发现Spark服务不可用,可以从哪些方面分析定位问题?()*A.查看其依赖的ZooKeeper服务是否正常;(正确答案)B.查看HDFS的服务是否正常;(正确答案)C.登录SolrServerAdmin所在的节点,确认I^节点与另一个 SolrServerAdmin实例节点是否连通;(正确答案)D.登录FusioninsightManager界面,下载Solr服务不可用期间的相关日志,进行进一步定位;(正确答案)79.Spark是基于内存的计算,所有Spark程序运行过程中的数据只能存储在内存中。()[单选题]*A.正确;B.错误;(正确答案)80.Spark应用在运行时,Stage划分的依据是哪个?()[单选题]*A.task;B.taskSet;C.action;D.shuffe;(正确答案)81.FusionInsightHD安装前准备,包括哪些步骤?() *A.完成硬件安装;(正确答案)B.文采接地主机操作系统安装;(正确答案)C.准备工具和软件。例如PuTTy、LLD、FusioninsightHD软件包等;(正确答案)D.准备划归数据,例如网络参数和角色部署位置;(正确答案)82.FusionInsightHD系统中HBase支持动态扩展列。()[单选题]*A.正确;(正确答案)B.错误;83.FusionInsightHD的Streaming对于Zookeeper弱依赖,即使ZooKeeper故障Streaming也可以正常提供服务。()[单选题]*A.正确;B.错误;(正确答案)84.采用Flume传输数据过程中,为了防止因Flume进程重启二丢失数据,推荐使用以下哪种Channel类型?()[单选题]*A.MemoryChannel;B.FileChannel;(正确答案)C.JDBCChannel;D.HDFSChannel;85.Loader的作用执行失败,则此作业运行过程中导入的数据不会被删除,必须手动删除。()[单选题]*A.正确;B.错误;(正确答案)86.Loader提供了哪些方式或接口实现作业管理?() *A.WebUI;(正确答案)B.Linux命令行;(正确答案)C.Rest接口;(正确答案)D.JAVAAPI;(正确答案)87.以下选项中,对华为FusioninsightHD系统中备用NameNode的作用描述准确的有?()*A.主NameNode的热备;(正确答案)B.备NameNode对内存没有要求;C.帮助主NameNode合并编辑日志,减少主NameNode启动时间;(正确答案)D.备NameNode应与主NameNode部署到一个节点;88.FusionInsightHD集群中,集群规模有300个节点,如果采用推荐部署方案,控制节点上一定不会存在哪些分区?() *A./;B.//srv/BigData/dbdata_om;(正确答案)C./srv/BigData;D.//srv/BigData/jurnalnode;E.//srv/BigData/hadoop/data/5(正确答案).FusionInsightHD的HBase中一张表包含以下几个Region[10,20),[20,30),[30,正无穷]分别编号为1,2,3那么11,20,222分别属于哪个Region()[单选题]*A.1,1,3;B.1,2,3;C.1,2,2;(正确答案)D.1,1,2;.关于Hive建表基本操作,描述正确的是?() [单选题]*A.创建外部表时需要指定external关键字;(正确答案)B.一旦表创建好,不可再修改表名;C.一旦表创建好,不可再修改列名;D.一旦表创建好,不可再增加新列;91.FusionInsightHD系统中,再创建Kafka的Topic时,必须设置Partition个数和副本副本个数,设置多副本可以增强 Kafka服务的容灾能力。()[单选题]*A.正确;(正确答案)B.错误;92.FusionInsightHD系统部署时,如果Solr索引默认存放在HDFS上时,以下理解正确的有?()[单选题]*A.不要有考虑个SolrServer实例上创建多少Shard;B.为保证数据可靠性,创建索引时必须创建多 Replica;C.通过HDFS读取索引占用磁盘IO,因此不建议Solr实例与DataNode部署在同一个节点上;D.当Solr月艮务参数INDEX_STORED_ON_HDFS值为HDFS时,仓U建collection的索引就是默认存储在HDFS上;(正确答案)93.FusionInsightHadoop集群中,集群规模有70个节点,如果采用推荐部署方案,在管理节点可能存在哪些分区?() *A./srv/BigData/zookeeper;(正确答案)B./srv/BigData/dbdata_om;(正确答案)C./srv/BigData;(正确答案)D./srv/BigData/jurnalnode;(正确答案)E./srv/BigData/hadoop/data/594.大数据商业咨询服务方案在规划环节主要考虑以下哪些设计?() *A.大数据商业模式设计;(正确答案)B.商业场景全景规划;(正确答案)C.典型场景需求设计;(正确答案)D.场景分解和业务设计;(正确答案)95.Loader仅支持关系型数据库与HadoopHBase之间的数据导入导出。()[单选题]*A.正确;B.错误;(正确答案)96.FusionInsightHD中使用HBase进行数据读写服务时需要连接HMaster。()[单选题]*A.正确;B.错误;(正确答案)97.关于Kerberos的TGT以下说法错误的是?()[单选题]*A.TGT全称为票据授权票据,主要由KDC服务器生成;B.TGT一次生成之后,可以无限期使用;(正确答案)C.TGT在客服端的存在方式可以是在内存中存储,也可以在本地以文件的形式存储;D.TGT中主要的信息有当前该票据的有效时长和授予该 TGT的服务端IP以及分发的客户端名称;.Hbase中如果发生一个Region的Split,将一个HFile文件真正分开到两个Region的过程在以下什么阶段?()[单选题]*A.Split过程中;B.Flush过程中;C.Compaction过程中;(正确答案)D.HFile分开过程中;.FusionInsightHDV100R002C60版本集群中,以下哪些组件需要规划元数据分区?()*A.HDFS;(正确答案)B.Zookeeper;(正确答案)C.Streaming;(正确答案)D.Redis;E.HBaseF.Kafka100.Hadoop通过ResourceManage对集群资源进行管理,它的主要功能有?()A.集群资源调度;(正确答案)B.应用程序管理;(正确答案)C.集群资源管理;(正确答案)D.日志管理;.以下关于Hadoop的HDFS描述正确的有?() *A.HDFS由NameNode,DataNode,Client组成;(正确答案)B.HDFS备NameNode上的元数据是主NameNode同步过去的;C.HDFS采用就近的机架点进行数据的第一副本存储;(正确答案)D.HDFS适合一次写入,多次读取的读写任务;(正确答案).FusionInsightManager可以对那些项目进行健康检查?()C.RegionServerC.RegionServer(正确答案)C.RegionServerC.RegionServer(正确答案)A.主机;(正确答案)B.服务;(正确答案)C.角色;D.实例;103.Hadoop系统中YARN支持那些资源类型的管理?() *A.内存;(正确答案)B.CPU;(正确答案)C.网络;D.磁盘空间;.哪个不是Flume的channel类型?()[单选题]*A.MemoryChannel;B.FileChannel;C.JDBCChannel;D.HDFSChannel;(正确答案).FusionInsightHD中Loader实例必须与哪个实例部署在一起?() [单选题]*A.DataNode;B.RegionServer;C.ResourceManager;D.NodeManager;(正确答案).Hadoop平台中HBase的Region是由哪个服务进程来管理?()[单选题]*A.HMaster;B.DataNode;D.Zookeeper;.FusionInsightHD系统中,HDFS的Block默认保留几份?()[单选题]*A.3;(正确答案)B.2;C.1;D.不确定;.Hadoop中,如果将yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent设置为50,下面说法错误的是?()[单选题]*A.一个用户提交用户,可以使用QueueA的100%;B.QueueA中每个用户最多只能获得50%的资源;(正确答案)C.如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源;D.QueueA中必须保障每个用户至少得到50%的资源;109.Solr创建Collection时,推荐使用路由算法为compositldRouter,那么该Collection可以扩展shad()[单选题]*A.正确;B.错误;(正确答案)110.在SolrCloud模式下,以下关于Solr相关概率描述正确的有?() *A.Collection是在SolrCloud集群中逻辑意义上完整的索引,可以被划分为一个或者多个Shard,这些Shard使用相同的ConfigSet;(正确答案)B.ConfigSet是SolrCloud提供服务必须的一组配置文件,包含solrconfig.xml和schema.xml等;(正确答案)C.Shard是Collection的逻辑分片,每个Shard都包含一个或者多个replica是Leader,只有Leaderreplica才能进行处理索引和查询要求;D.Replica只有处于active状态时才会接受索引和查询请求;(正确答案)III.Spark组件中哪个不属于transformation操作?()[单选题]*A.join;B.distinct;C.reduceByKey;D.reduce;(正确答案)112.关于Hive与Hadoop其他组件的关系,以下描述错误的是?() [单选题]*A.Hive最终将数据存储在HDFS中;B.HiveSQL其本质是执行MapReduce任务;C.Hive是Hadoop平台的数据仓库工具;D.Hvie对HBase有强依赖;(正确答案)113.关于FusionInsightManager功能说法错误的有哪些?() *A.通过FusionInsightManager的Audit审计界面可以查询每个重复操作;B.通过FusionInsightManager不能下载单个组件的客户端;(正确答案)C.集群部署完成后,通过FusionInsightManager不能进行集群扩容,只能通过卸载集群重新搭建来扩容集群;(正确答案)D.通过FusionInsightManager的Alarms告警界面可以查询每个告警的具体信息;114.FusionInsightHD系统中,集群节点规划时需要考虑哪些磁盘规划?() *A.主机OS磁盘规划;(正确答案)B.控制节点元数据盘规划;(正确答案)C.管理节点元数据盘规划;(正确答案)D.数据节点元数据盘规划;(正确答案)115.FusionInsightManager用户权限管理不支持哪个配置?() [单选题]*A.给用户配置角色;B.给用户配置权限;C.给用户组配置角色;D.D.给用户组配置权限;(正确答案)C.FusioninsightC.Fusioninsight123(正确答案)D.D.给用户组配置权限;(正确答案)C.FusioninsightC.Fusioninsight123(正确答案)116.华为FusioninsightHD系统中,对存储副本为3个的数据块,当有一个节点上该数据块丢失时,需要手动复制一个副本到该节点。() [单选题]*A.正确;B.错误;(正确答案)117.Spark应用运行时,如果某一个task运行失败则导致整个app运行失败。()[单选题]*A.正确;B.错误;(正确答案)118.FusionInsightHD的Manager界面对Loader的操作不包括下列哪个?() [单选题]*A.启动Loader实例;B.查看Loader服务状态;C.配置Loader参数;D.查看Loader运行日志;(正确答案)119.Flume传输数据过程中,Sink取走数据并写入目的地后,会将event从channel中删除。()[单选题]*A.正确;(正确答案)B.错误;120.在Fusioninsight集群规划时,以下哪些集群命名是系统允许的?() *A.FusionInsight-123;B.Fusioninsight_123;(正确答案)D.123FusionInsight;(正确答案)121.FusionInsightHD支持哪些日志模式下载?() *A.下载已安装的所有组件的日志;(正确答案)B.下载单个组件某个模块的日志;(正确答案)C.下载指定主机的日志;(正确答案)D.下载指定时间段的日志;(正确答案)122.FusionInsightHD集群规划时,管理节点&控制节点&数据节点合一部署适合什么样的场景?()[单选题]*A.30节点以下;(正确答案)B.100节点以上;C.100-200节点;D.200节点以上;.FusionInsightHD系统中,以下选项哪一个不是HBase写数据流程涉及的角色或服务?()[单选题]*A.Zookeeper;B.HDFS;C.HMaster;(正确答案)D.RegionServer;.HDFS机制中NameNode负责管理元数据,Clint端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息以此获取所有文件在 DataNode的位置。()[单选题]*A.正确;B.错误;(正确答案)125.以下哪些是Spark可以提供的功能?()A.分布式内存计算引擎;(正确答案)B.分布式文件系统;C.集群资源的统一调度;D.流处理功能;(正确答案)126.FusionInsightHDLLD配置工具可以生成哪些配置文件?() *A.监控告警阈值配置文件;B.集群的安装模板文件;(正确答案)C.HDFS和YARN的配置文件;D.执行precheck所需要的配置文件checkNode.Config;(正确答案)127.FusionInsightHD扩容时,添加集群中的新节点,主机 os的root用户密码与集群原所有节点的root用户密码可以不用一致。()[单选题]*A.正确;B.错误;(正确答案)128.从生命周期维度看,数据主要经历哪几个阶段?() *A.数据采集;(正确答案)B.数据存储;(正确答案)C.数据管理;(正确答案)D.数据分析;(正确答案)E.数据呈现;129.关于FusioninsightManager中Controller和NodeAgent,说法正确的是?()[单选题]*A.Controller每隔3秒向NodeAgent发送心跳;B.NodeAgent接受Controller下发的命令,执行具体的动作;(正确答案)C.每个节点都必须部署Controller;D.NodeAgent是开源增强的;.哪个模块是负责FusioninsightManager用户数据存储的?()[单选题]*A.CAS;B.AOS;C.Kerberos;D.LDAP;(正确答案).Kerberos协议中TGT主要应用侧与需要访问的服务之间的安全会话。() [耳选题]*A.正确;B.错误;(正确答案)132.FusionInsightHD中HBase的某张表的RowKey戈U分SplitKey为9,E,a,z,请问该表有几个Region?()[单选题]*A.3;B.4;C.5;(正确答案)D.6;133那一项不属于FusioninsightHD中Hive的流控特性的描述?()[单选题]*A.支持对已经建立的总连接数做阈值控制;B.支持最每个用户已经建立的连接数做阈值控制;C.支持对某个特定用户已经建立的连接数做阈值控制 ;(正确答案)D.支持对单位时间内所建立的连接数做阈值控制;.以下关于Solr角色描述正确的是?()[单选题]*A.SolrServerAdmin属于管理角色,需要部署在管理节点上。B.SolrServer负责提供创建索引和全文检索等服务,是 Solr集群中的数据计算和处理单元。;(正确答案)C.HBaselndexer是Solr的必要角色,提供将HBase中数据导入至Solr服务;.FusionInsightHD产品中,关于Kafka组件部署规划说法不正确的是?() *A.Kafka的Producer发送消息时间可以指定该消息被哪个 Consumer消费;B.在创建topic时,副本数不得大于当前存活的Broker实例个数,否则创建Topic将会失败;(正确答案)C.Kafka安装完成后就不能再配置数据存放目录了 ;D.Kafka会将元数据信息存放到ZooKeeper上;(正确答案)136.关于Kafka盘容量不足的警告,对于可能的原因以下分析不正确的是?()[单选题]*A.用于存储Kafka数据的磁盘配置,(如磁盘数目,磁盘大小等),无法满足当前业务数据流量,导致磁盘使用率达到上限;B.数据保存时间配置过长,数据累积达到磁盘使用率上限 ;C.业务规划不合理,导致数据分配不均,使部分磁盘达到是使用率上限 ;D.Broker节点故障导致;(正确答案).FusionInsightHD中Loader从SFTP服务器导入文件,如果不需要做编码转换和数据转换且速度快,选择下面哪个文件类型?() [单选题]*A.text_file;B.sequence_file;C.binary_file;(正确答案)D.graph_file;.FusionInsightHD集群三层网络时,管理节点、控制节点、数据节点建议安装在不同网段内,可以提供可靠性。() [单选题]*A.正确;B.错误;(正确答案)139.Hbase的物理存储单元是什么?()[单选题]*A.Region;B.ColumnFamily;(正确答案)C.Column;D.ROW;140.FusionInsightHD系统中,集群中其中一个Loader节点异常,其他服务没有异常的情况下,不会影响Loader服务功能的正常使用。()[单选题]*A.正确;(正确答案)B.错误;141.安装模式下安装FusionInsightHD集群时,哪些组件必须安装?() *A.Zookeeper;B.LdapServer;(正确答案)C.KrbServer;(正确答案)D.HDFS;142.SparkonYARN模式下,没有NodeManager的节点不能启动executor执行task。()[单选题]*A.正确;(正确答案)B.错误;.YARN服务中,如果要给队列QueueA设置容量为30%,应该配置哪个参数?()[单选题]*A.yarn.scheduler.capacity.reduce.QueueA.user-limit-factor;B.yarn.scheduler.capacity.reduce.QueueA.minimum-user-limit-percent;C.yarn.scheduler.capacity.reduce.QueueA.capacityE确答案)D.yarn.scheduler.capacity.reduce.QueueA.state;.FusionInsightHD的HBase中保存一张用户信息表meg_table,Rowkey为用户id,其中一列为用户昵称,现在按先后顺序往这个列写入三个KeyValue:001:li,001:Mary,001:L'meg_table',{ERSIONS=>2}会返回几条数据?()[单选题]*A.001:Li;B.001:Lily;C.001:Li,001:Mary,001:Lily;D.001:Mary,001:Lily;(正确答案).FusionInsightHDLoader作业运行前后,需要哪些节点与外部数据源通讯? [单选题]*A.Loader服务主节点;((正确答案)C)D.前面两个都不需要;.Hadoop中哪个模块负责HDFS的数据存储()[单选题]*A.NameNode;B.DataNode;(正确答案)C.Zookeeper;D.JobTracker;147.FusionInsightHD使用HBase客户端批量写入10条数据,某个RegionServer节点上包含该表的2个Region,分别A和B,10条数据中有2条属于A,4条属于A.A.正确;C.MetastoreC.Metastore实例不可用;(正确答案)B,请问写入这10条数据需要向该RegionServer发送几次RPC请求?()[单选题]*A.1;(正确答案)B.2;C.6;D.10;148.在规划Fusioninsight集群时,如果客户用于功能测试,对性能没有要求,节约成本的情况下可以采用管理节点,控制节点,数据节点合一部署,最少需要多少节点?()[单选题]*A.2;B.3;(正确答案)C.6;D.8;.Flume支持监控并传输目录下新增的文件,可实现准实时数据传输,以下描述的是哪一类Source?()[单选题]*A.spoolingdirectorysource;(正确答案)B.httpsource;C.execsource;D.syslogsource;.FusionInsightHDManager界面显示Hive服务状态为Bad时,可能的原因有哪些?()*A.DBService服务不可用;(正确答案)B.HDFS服务不可用;(正确答案)D.HBase服务不可用;.FusionInsightHD集群中,根据磁盘规划建议,/srv/BigData分区应该部署在什么磁盘上?()[单选题]*A.OS盘;(正确答案)B.元数据盘;C.数据盘;D.管理盘;152.Kerberos系统设计上采用服务端/服务器结构化与DES加密技术,能够进行相互认证,客户端和服务器端均可对对方进行身份认证。() [单选题]*A.正确;(正确答案)B.错误;.Hadoop平台中启用Yarn组件的日志聚集功能,需要配置哪个参数?() [单选题]*A.yarn.nodemanager.local-dirs;B.yarn.nodemanager.log-dirs;C.yarn.acl.enable;D.yarn.log-aggregation-enable(正确答案).FusionInsightHD产品中,关于Kafka组件部署说法不正确的是?()[单选题]*A.Kafka强依赖于Zookeeper,安装Kafka必须安装ZooKeeper;B.Kafka部署的实例个数不得小于2;C.Kafka的服务端可以产生消息;(正确答案)D.Consumer作为Kakka的客户端角色专门进行消费的消费;155.FusionInsightHD集群组网络设计中,有一种机架可以按照业务需求线性扩展,这种机架被称为?()[单选题]*A.基本框;B.扩展框;(正确答案)C.管理框;D.数据框;156.YARN容量调度器的主要特点有哪些?() *A.容量保证;(正确答案)B.灵活比;(正确答案)C.多重租赁;(正确答案)D.动态更新配置文件;(正确答案)157.FusionInsightHDLoader进行数据导入和导出,必须经过Reduce阶段进行数据处理。()[单选题]*A.正确;B.错误;(正确答案).FusionInsightHD系统中使用Sterming客户端Shell命令提交了拓扑之后,使用StormUI查看发现该拓扑时间没有处理数据,可能原因有?() *A.拓扑结构过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间;(正确答案)B.Supervisor的slots资源被耗尽,拓扑提交上去后分不到 slot去启动Worker进程;(正确答案)C.拓扑业务存在逻辑错误,提交之后无法正常进行;(正确答案)D.当数据量较大时,拓扑处理速度较慢;.Kerberos只能对集群内的服务提供安全认证。() [单选题]*B.错误;(正确答案)160.FusionInsightManager不能够管理哪个对象?()[单选题]*A.Spark;B.主机OS;(正确答案)C.YRAN;D.HDFS;161.华为FusioninsightHD系统中关于HDFS的DataNode说法正确的是?()[单选题]*A.不会检查数据的有效性;B.周期性地将本节点的Block发送给NameNode;(正确答案)C.不同的DAtaNode存储的Block一定是不同的;D.一个DAtaNode上的Block可以是相同的;162.FusionInsightHD集群中包含了多种服务,每种服务又由若干角色组成,下面哪些是服务的角色?() *A.HDFS;B.NameNode;(正确答案)C.DataNode;(正确答案)D.HBase;163.FusionInsightHDLoader可以将HDFS数据导出到以下哪些目标端?() *A.SFTP服务器;(正确答案)B.FTP服务器;(正确答案)C.Oracle数据库;(正确答案)D.DB2数据库;(正确答案).关于Hive在FusioninsightHD中的架构描述错误的是?() [单选题]*A.只要有一个Hiveserver不可用,整个Hive集群便不可用;(正确答案)B.HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果;C.MetaStore用于提供元数据服务,依赖于DBService;D.在同一时间点HiveServer只用一个处于Active状态,另一个则处于Standby;.关于HBase中HFile的描述不正确的是?()[单选题]*A.一个HFive属于一个Region;B.一个HFile包含多个列族的数据;(正确答案)C.一个HFile包含多列数据;D.一个HFile包含多行数据;166.Solr可以对结构化、半结构化、非结构化数据建立索引,并提供全文检索的能力。()[单选题]*A.正确;(正确答案)B.错误;167.FusionInsightHD系统中执行HBase写数据时,数据被写入内存MemStore、日志Hlog和HDP中,请问哪一步写入成功后才会最终返回客户端写数据成功?()[单选题]*A.MemStore;B.Hlog;(正确答案)C.HDFS;D.Memory;168.Spark和Hadoop都不适用迭代计算的场景。()[单选题]*B.错误;(正确答案)169.FusionInsightHD管理节点提供双机HA机制,主节点故障之后,准备节点需要手动实现Failover。()[单选题]*A.正确;B.错误;(正确答案)170.FusionInsightHD系统中,哪个不属于节点的磁盘分区?() [单选题]*A.OS分区;B.数据分区;C.元数据分区;D.管理分区;(正确答案)171.YARN调度器分配资源申请的顺序,下面哪一个描述是正确的?() [单选题]*A.任意机器->同机架一>本地资源;B.任意机器->本地资源,同机架;C.本地资源->同机架->任意机器;(正确答案)D.同机架->任意机器一>本地资源;172.某用户需要搭建一个350个节点的FusioninsightHD集群,哪种规划方案最佳?()[单选题]*TOC\o"1-5"\h\zA.管理节点、控制节点、数据节点合一部署,二层组网 ;B.管理节点、控制节点合一部署,数据节点独立部署,二层组网 ;C.管理节点、控制节点、数据节点都独立部署,三层组网 ;(正确答案)D.管理节点、数据节点合一部署,控制节点独立部署,二层组网 ;173.Spark任务的Executor可以运行多个task。()[单选题]*A.正确;(正确答案)B.错误;174.FusionInsightHD中,关于HBase的BloomFilter特性理解,说法不正确的是?()[单选题]*A.可以用来过来数据;(正确答案)B.可以用来优化随机读性能;C.会增加存储的消耗;D.可以准确判断某条数据不存在;.执行HBase读数据业务,需要读取哪几部分的数据?() *A.HFile;(正确答案)B.Hlog;C.MEMStone;(正确答案)D.HDFS;.FusionInsightHD产品中,关于Kafka组件说法正确的有?() *A.删除Topic时,必须确保Kafka的服务配置delete.topic.enableB已置为true;(正确答案)B.Kafka安装及运行日志保存路劲为/srv/BigData/Kafka/;C.Zookeeper服务不可用会导致Kafka服务不可用;(正确答案)D.必须使用admin用户或者kafka服务不可用;(正确答案)177.加载数据到Hive表,哪种方式不正确?()[单选题]*A.直接将本地路劲的文件load到Hive表中;B.将HDFS上的文件load到Hive表中;C.Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录 ;(正确答案)D.将其
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 遵义医科大学《产品交互设计》2023-2024学年第二学期期末试卷
- 唐山工业职业技术学院《中医四诊技能》2023-2024学年第二学期期末试卷
- 河北东方学院《幼儿园教育环境创设》2023-2024学年第二学期期末试卷
- 做账实操-代理记账公司的利润计算
- 入党积极分子民主表
- 辽宁工程技术大学《男装制版与工艺》2023-2024学年第二学期期末试卷
- 吉林航空职业技术学院《专题设计》2023-2024学年第二学期期末试卷
- 焦作大学《新闻评论与体育》2023-2024学年第二学期期末试卷
- 广东酒店管理职业技术学院《抽样设计与推断》2023-2024学年第二学期期末试卷
- 湖北大学知行学院《结构化学A》2023-2024学年第二学期期末试卷
- 阴道镜检查临床医学知识及操作方法讲解培训PPT
- AI09人工智能-多智能体
- 建设工程前期工作咨询费收费计算表
- 行为矫正技术-课件
- 八年级物理下册《实验题》专项练习题及答案(人教版)
- 脑血管造影术后病人的护理查房
- 5.0Mt-a炼焦煤选煤厂初步设计-毕业论文
- 美术高考色彩备考教学策略
- 2023智联招聘行测题库
- 中国工笔花鸟画
- T型广告牌预算表
评论
0/150
提交评论