大数据题库及答案_第1页
大数据题库及答案_第2页
大数据题库及答案_第3页
大数据题库及答案_第4页
大数据题库及答案_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据题库及答案第一部分:简单题1.spark是用以下哪种编程语言实现的A、c B、c++ C、javaD、Scala(正确答案) 2.FusionInsightManger对服务的管理操作,下面说法错误的是?A、可以对服务进行启停重启操作 B、可以添加和卸载服务 C、可设置不常用的服务隐藏和显示(正确答案)D、观察期不能做扩容 3.FusionInsighthd集群升级,以下描述正确的有A、升级过程中不可以手工操作主备OMS倒换(正确答案)B、集群内所有主机的root账户密码要保持一致(正确答案)C、保持网络畅通。避免因网络问题导致升级异常(正确答案)D、观察期不能做扩容(正确答案)4.FusionInsightHD的Loader在创建作业时。连接器(connector)有什么用?A、、确定有哪些转换步骤 B、提供有话参数。提高数据导入导出性能 C、配置作业如何与外部数据源进行连接(正确答案)D、配置作业如何与内部数据源进行连接 5.下列哪个HDFS命令可用于检测数据块的完整性?A、hdfsfack/(正确答案) B、hdfsfack/-delete C、hdfsdfsadmin-reportD、hdfsbalancer-threshold1 6.YARN中设置队伍QueueA的最大使用资源量。需要配置哪个参数A、yarn.scheduler.capacity.root.QueueA-user-limit-factor B、yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent C、yarn.scheduler.capacity.root.QueueA.stateD、yarn.scheduler.capacity.root.QueueA.maximum-capacity(正确答案) 7.Flume的数据流可以根据headers的信息发送到不同的channel中A、正确(正确答案) B、错误 8.FusionInsightHD与外部管理平台对接时,支持哪些接口?A、SNMP(正确答案)B、vpnC、BGPD、Syslog(正确答案)9.Hbase的数据文件HFile中一个Keyvalue格式包括哪些信息?A、key(正确答案)B、value(正确答案)C、Timestamp(正确答案)D、KeyType(正确答案)10.FusionInsightHD集群规划设计时,集群有150个节点,并且采用双平面组网部署,对于该集群网络宽带要求的描述,下列描述正确的有?A、业务平面所有节点都使用10GE网络(正确答案)B、管理平面控制节点都使用10GE网络C、管理平面数据节点都使用1GE网络(正确答案)D、业务平面控制节点都使用1GE网络E、管理平面管理节点都使用10GE网络(正确答案)11.FusionInsiht系统中Hive支持的储存格式包括?A、HFileB、TextFile(正确答案)C、sequenceFile(正确答案)D、RCFile(正确答案)12.Spark任务的每个Stage可划分为job,划分的标记是shuA、对 B、错(正确答案) 13.FusionInsightManger对服务的配置功能说法不正确的是?A、服务级别的配置可对所有实例生效 B、实例级别的配置只针对本实例生效 C、实例级别的配置对其他实例也生效(正确答案)D、配置保存后需要重启服务才能生效 14.FusionInsighthd部署solr时如果选择索引存放在本地磁盘建议给每个solrsever实例的数据目录单独挂载磁盘,并且磁盘配置为RAID0或RAID5A、对(正确答案) B、错 15.关于FusionInsightHD安装流程正确的是?A、安装manager-执行preinstall-LLD工具进行配置-安装集群-安装manger- B、LLD工具进行配置-执行preinstall-安装manger-安装集群-安装后检查-安装后配置(正确答案) C、安装manager-LLD工具进行配置-执行preinstall-安装集群-安装后检查-安装后配置D、LLD工具进行配置-执行preinstall-安装集群-安装manger-安装后检查-安装后配置 16.关于kerberos的部署,描述正确的是?A、kerberos仅有一个角色 B、kerberos服务在同一个节点上有两个实例(正确答案) C、kerberos服务采用主备模式部署D、kerberos服务必须和LDAP服务部署在同一个节点上 17.某银行规划的FusionInsightHD集群中有90个节点。如果控制节点就规划了三个那集群中的数据节点规划几个最为合理?A、87(正确答案) B、85 C、990D、86 18.安装FusionInsightHD软件包钱必须在本节点/etc/hosts文件中配置集群中所有节点的主机名称与业务IP的映射关系A、对(正确答案)B、错19.客户IT系统中FusionInsightHD集群中有150个节点,每个节点12块磁盘(不做Raid不包括OS盘),每块磁盘大小1T,只安装HDFS,按照默认配置最大可储存多少数据?A、1764tb B、1800tb C、600tbD、588tb(正确答案) 20.FusionInsightHD节点不支持哪种主机操作系统?A、Suse11.1 B、RedHat6.5 C、CentOS6.4D、Ubuntu11.04(正确答案) 21.FusionInsightHD中如果需要查看当前登录Hbase的用户和权限组,可以在Hbaseshell中执行什么命令?A、use-permissio B、whoami(正确答案) C、whoD、get_user 22.FusionInsightHD产品在部署kerberos和LDAP服务时以下描述正确的是?A、部署kerberos服务之前,必须先部署LDAP服务(正确答案)B、LDAP服务必须和kerberos服务部署在同一节点C、kerberos服务和LDAP服务部署到同一个节点上利于数据的访问,有助于性能的提升(正确答案)D、LDAP服务可以多个集群共享23.23.FusionsightHDmanager界面Hive日志收集,哪个选项不正确?A、可指定实例进行日志收集,比如制定单独收集METASTORE的日志B、可指定时间段进行日志收集,比如只收集2016-1-1到2016-1-10的日志C、可指定节点IP进行日志收集,例如仅下载某个IP的日志D、可指定特定用户进行日志收集,例如仅下载userA用户产生的日志(正确答案)24.24.华为FusionsightHD集群中,spark服务可以从以下哪些服务读取数据?A、YARNB、HDFS(正确答案)C、Hive(正确答案)D、Hbase(正确答案)25.25.如果YARN集群中只有Dafault、QueuA和QueueB子队列,那么允许将他们的容量分别设置为60%、25%和22%A、正确B、错误(正确答案)26.26、FusionsightHD系统中,关于solr索引的存储部署,以下说法正确的有?A、利用HDFS数据存储可靠性和易于扩容的特点选择索引存储与HDFS(正确答案)B、不论solr索引存储在HDFS上还是存储在本地磁盘,在同一节点上都必须要部署5个solr实例根据ip和不同的端口号来区分不同的solr实例C、当对实时索引录入速度要求较高时,可选择索引存放在本地磁盘(正确答案)D、当索引数据存放在HDFS上,solrserver实例与Datanode实例部署在同一节点(正确答案)27.27.FusionInsightHD三层组网适合多少节点的集群规模?A、30节点以下B、100节点以下C、100-200节点D、200节点以上(正确答案)28.28、FusionInsightHD系统中,kerberos仅用于组件间服务安全认证A、正确B、错误(正确答案)29.29、FusionInsightHD支持大规模集群得到安装部署、监控、告警、用户管理、权限管理、审计、服务管理、健康检查、问题定位、升级和补丁A、正确(正确答案)B、错误30.30.Hadoop系统中关于客户端向HDFS文件系统上传文件说法正确的是?A.客户端的文件数据经过NameNode传递给DataNodeB.客户端将文件划分为多个Block,根据DataNode的地址信息,按顺序写入每一个DataNode中(正确答案)C.客户端个根据DataNode的地址信息,按顺序将整个文件写入每一个,然后由DataNode将文件划分为多个BlockD.客户端只上传数据到一个DataNode,然后由NataNode,然后由NameNode负责Block复制。31.31.FusionlnsightHD系统中Hbase的最小处理单元是Region,UserRegion和RegionServer之间的路由信息是保存在哪?A.ZooKeeperB.HDFSC.MasterD.meta表(正确答案)32.32Hbase集群定时执行Compaction的目的是什么?A.减少同一个Region,同一个ColumnFamily下的文件数目(正确答案)B.提升数据读取性能(正确答案)C.减少同一个ColumnFamily的文件数据D.减少同一个Region的文件数目33.33FusionlnsightManager会定时备份哪些数据?A.NameNode(正确答案)B.LDAP(正确答案)C.OMs(正确答案)D.DBService(正确答案)34.34.通过FusionInsightManager不能完成以下哪个操作?A、安装部署B、性能监控C、权限管理D、虚拟机分配(正确答案)35.35.Kafka是一个分布式的消息发布订阅系统,它只是进行消息的转发,并不会保存消息。A.正确B.错误(正确答案)36.36.以下哪些是Spark服务的常驻进程?A.JobHistory(正确答案)B.JDBCServer(正确答案)C.SparkResourceD.NodeManager37.37.FusionlnsightHD的Steraming是基于开源ApacheStorm开发的,Storm是一个分布式的离线计算框架。A.正确B.错误(正确答案)38.38.FusionlnsightHD系统中一个集群可以管理多个服务,每个服务可以管理多个角色,每个角色只能管理一个实例。A.正确B.错误(正确答案)39.39.关于Hbase的Region分裂流程split的描述不正确的是?A、Split过程中并没有真正的将文件分开,仅仅是创建了引用文件B、Split为了减少region中数据大小,从而将一个region分裂成两个regionC、Split过程中该表会暂停服务(正确答案)D、Split过程中被分裂的region会暂停服务40.40.Hadoop的HDFS是一种分布式文件系统,适合以下哪种场景的数据存储和管理?A.大量小文件存储B.高容错、高吞吐量(正确答案)C.低延迟读取D.流式数据访问(正确答案)41.41.如果FusionInsightHD集群节点数不足以使数据节点单独部署的情况下,可以采用管理节点&控制节点&数据节点合一部署方案,但性能会受到限制。A.正确(正确答案)B.错误42.42.Hadoop的NameNode用于存储文件系统的元数据。A.正确(正确答案)B.错误43.43.关于FusionInsightManager关键特性,说法正确的是?A.能够针对整个集群,某个服务器进行健康检查,不能够针对节点进行健康检查B.Manager引入角色的概念,采用RBAC的方式对系统进行权限管理(正确答案)C.整个系统使用Kerberos管理用户,使用Ldap进行认证,通过CAS实现单点登录D.对于健康检查结果,不能够导出检查报告,只能够在线查看44.44.查看kafka某topic的partition详细信息时,使用如下哪个命令?A.bin/kafka-topics.sh–createB.bin/kafka-topics.sh–listC.bin/kafka-topics.sh-describe(正确答案)D.bin/kafka-topics.sh-delete45.45.FusionInsightHadoop集群中,在某个节点上通过df-hT查询,看到的分区包含以下几个:/var/log/srv/BigData/srv/BigData/hadoop/data5/srv/BigData/solr/solrserver3/srv/BigData/dbdata_om这些分区所对应磁盘最佳Raid级别的规划组合是?A、Raid0、Raid1、Raid0、Non-Raid、Raid-1B、Raid1、Raid1、Non-Raid、Non-Raid、Raid1(正确答案)C、Raid0、Raid0、Raid0、Raid0D、Non-Raid、Non-Raid、Non-Raid、Non-Raid、Raid146.46.FusionInsighHD系统中HDFS默认BlockSize是多少?A、32MB、64MC、128M(正确答案)D、256M47.47.FusionInsighHD部署时,同一集群内的Flumeserver节点建议至少部署几个?A、1B、2(正确答案)C、3D、448.48.FusionInsightHD系统设计日志不可以记录下面那些操作?A、手动清除告警B、启停服务实例C、删除服务实例D、查询历史监控(正确答案)49.49.基于Hadoop开源大数据平台主要提供了针对数据分布式计算和存储能力,如下属于分布式存储组件的有?(多选)A、MRB、SparkC、HDFS(正确答案)D、Hbase(正确答案)50.50.Hadoop的HBase不适合哪些数据类型的应用场景?A.大文件应用场景(正确答案)B.海量数据应用场景C.高吞吐率应用场景D.半结构化数据应用场景51.51.FusionInsight集群组网设计中,二层组网指集群内二层交换,集群节点在一个子网里,适用节点数小于200的集群场景A.正确(正确答案)B.错误52.52.FusionInsightHD中的Loader作业提交到Yarn后,作业不能手工停止A.正确B.错误(正确答案)53.53.安装FusionInsightHD的Streaming组件时,Nimbus角色要求安装几个节点?A、1B、2(正确答案)C、3D、454.54.关于FusionInsightHD中Loader作业描述正确的是?A.Loader将作业提交到Yam执行后,如果Loader服务出现异常,则此作业执行失败B.Loader将作业提交到Yame执行后,如果某个Mapper执行失败,能够自动进行重试(正确答案)C.Loader作业执行失败,将会产生垃圾数据,需要用户手动清除D.Loader将作业提交到Yam执行后,在该作业执行完成前,不能再提交其他作业55.55.关于大数据的主要特征理解和描述正确的有?A、来源多,格式多(正确答案)B、增长速度快,处理速度快(正确答案)C、存储量大,计算量大(正确答案)D、数据的价值密度较低(正确答案)56.56.Hadoop平台中,要查看YARN服务中一个application的信息,通常需要使用什么命令?A、containerB、applicationattemptC、jarD、application(正确答案)57.57.在FusionInsight集群规划部署时,建议管理节点最好部署()个,控制节点最少部署(),数据节点最少部署()个。A.1,2,2B.1,3,2C.2,3,1D.2,3,3(正确答案)58.58.FusionInsightManager界面上,当收到Kafka磁盘容量不足告警,且该告警的原因已经排除硬盘硬件故障时,系统管理员需要考虑扩容解决此问题。A.正确(正确答案)B.错误59.59.FusionInsightHD安装过程中,执行preinstall不能完成哪项功能?A.修改OS配置,确保OS满足FusionInsightHD的安装要求B.安装Manager(正确答案)C.格式化分区D.安装OS缺失的RPM包60.60.SolrCloud模式是集群模式,在此模式下Solr服务强依赖于以下哪个服务?A.HBaseB.HDFSC.ZooKeeper(正确答案)D.Yarn61.61.SparkonYARN模式下的driver只能运行在客户端。A.正确B.错误(正确答案)62.62.Hadoop的MapReduce组件擅长处理哪些场景的计算任务?A、迭代计算B、离线计算(正确答案)C、实时交互计算D、流式计算63.63.某高校的FusionInsightHD集群中有230个节点,在进行集群规划时,下列哪些进程应该部署在数据节点上?A.DataNode(正确答案)B.NameNodeC.NodeManager(正确答案)D.RegionServer(正确答案)E.DBServerF.SolrServer(正确答案)64.64.FusionInsightHD集群中的节点只安装了一块网卡,也可以采用双平面隔离组网方案。A.正确B.错误(正确答案)65.65.Hadoop系统中,如果文件系统的备份因子是3,那么每次mapreduce任务运行的task所需要的文件都要从3个有副本的机器上传输需要处理的文件。A.正确B.错误(正确答案)66.66.YARN上有两个同级队列Q1与Q2,容量都是50,Q1上已经有10个任务共占用了40的容量,Q2上有2个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1。A.正确B.错误(正确答案)67.67.以下哪些数据不属于半结构化数据?A.HTMLB.XMLC.二维表(正确答案)D.JSON68.68.关于FusionInsightHDStreaming客户端的Supervisor描述正确的是?A、Supervisor负责资源分配和资源调度B、Supervisor负责接管Nimbus分配的任务,启动和停止属于自己管理的worker进程(正确答案)C、Supervisor是运行具体处理逻辑的进程D、Supervisor是一个Topology中接收数据然后执行处理的组件69.69.HDFS的Client写入文件时,数据的第一副本写入位置是由NameNode确定,其他副本的写入位置是由DataNode确定A.正确B.错误(正确答案)70.70.关于FusionInsightManager,说法错误的是?A、NTPsever/client负责集群内各节点的时钟同步B、通过FusionInsightManager,可以对HDFS进行启停控制、配置参数C、FusionInsightManager所有维护操作只能够通过WebUI来完成,没有提供Shell维护命令(正确答案)D、通过FusionInsightManager,可以向导式安装集群,缩短集群部署时间71.71.RDD可以从Hadoop兼容的文件系统生成,生成之后可以通过调用RDD的算子对RDD的数据进行部分更新。A.正确(正确答案)B.错误72.72.HDFS支持大文件存储,同时支持多个用户对同一个文件的写操作,以及在文件任意位置进行修改。A.正确B.错误(正确答案)73.73.下列哪些OS版本被推荐可以用来搭建FusionInsightV1R2C60集群?A、SUSE11SP1/SP2/SP3forAMD64&Intel64(正确答案)B、CentOS-6.6(正确答案)C、RedHat-6.4-x86_64(正确答案)D、RedHat-6.5-x86_64(正确答案)E、RedHat-6.7-x86_64(正确答案)F、Ubuntu6.374.74.FusionInsightHD系统中如果修改了服务的配置项,不进行服务重启,该服务的配置状态是什么状态?A、SYNCHRONIZEDB、EXPIRED(正确答案)C、CONFIGURINGD、UNKNOWN75.75.FusionInsightHD用户管理系统仅支持管理人机帐号A.正确B.错误(正确答案)76.76.Flume的perties配置文件中可以配置多个channle来传输数据。A.正确(正确答案)B.错误77.77.FusionInsightHD部署过程中,执行precheck检查每一个节点时必须调用checkNodes.Configd配置文件。A.正确(正确答案)B.错误78.78.FusionInsightHD系统中,如果发现Solr服务不可用,可以从哪些方面分析定位问题?A.查看其依赖的ZooKeeper服务是否正常(正确答案)B.查看HDFS服务是否正确(正确答案)C.登录SolrServerAdmin所在节点,确认该节点与另外一个SolrServerAdmin实例节点网络是否连通(正确答案)D.登录FusionInsightManager界面,下载Solr服务不可用期间的相关日志,进行进一步定位(正确答案)79.79.Spark是基于内存的计算,所有Spark程序运行过程中的数据只能存储在内存中。A.正确B.错误(正确答案)80.80.Spark应用在运行时,Stage划分的依据是哪个?A、taskB、taskSetC、actionD、shuffle(正确答案)81.81.FusionInsightHD安装前准备,包括哪些步骤?A、完成硬件安装(正确答案)B、完成节点主机操作系统安装(正确答案)C、准备工具和软件。例如PuTTY,LLD,FusionInsightHD软件包等(正确答案)D、准备规划数据。例如网络参数和角色部署位置(正确答案)82.82.FusionInsightHD系统中HBase支持动态扩展列。A.正确(正确答案)B.错误83.83.FusionInsightHD的Streaming对于zookeeper弱依赖,即使zookeeper故障streaming也可以正常提供服务。A.正确B.错误(正确答案)84.84.采用Flume传输数据过程中,为了防止因Flume进程重启而丢失数据,推荐使用以下哪种channel类型?A、MemoryChannelB、FileChannel(正确答案)C、JDBCChannelD、HDFSChannel85.85.Loader的作业执行失败,则此作业运行过程中导入的数据不会被删除,必须手动删除。A.正确B.错误(正确答案)86.86.Loader提供了哪些方式或接口实现作业管理?A.WebUI(正确答案)B.Linux命令行(正确答案)C.Rest接口(正确答案)D.javaAPI(正确答案)87.87.以下选项中,对华为FusionInsightHD系统中备用NameNode的作用描述准确的有?(多选)A、主NameNode的热备(正确答案)B、备NameNode对内存没有要求C、帮助主NameNode合并编辑日志,减少主NameNode启动时间(正确答案)D、备NameNode应与主NameNode部署到一个节点88.88.FusionInsightHD集群中,集群规模有300个节点,如果采用推荐部署方案,控制节点上一定不会存在哪些分区?A./B.//srv/BigData/dbdata_om(正确答案)C./srv/BigDataD.//srv/BigData/jurnalnodeE.//srv/BigData/hadoop/data5(正确答案)89.89.FusionInsightHD的Hbase中一张表包含以下几个Region[10,20),[20,30),[30,+∞),分别编号为①,②,③,那么,11,20,222分别属于哪个Region?A、①①③B、①②③C、①②②(正确答案)D、①①②90.90、关于Hive建表基本操作描述正确的是?A.创建外部表时需要指定external关键字(正确答案)B.一旦表创建好,不可再修改表名C.一旦表创建好,不可再修改列名D.一旦表创建好,不可再增加新列91.91、FusionInsightHG系统中,在创建Kafka的Topic时必须设置Partition个数和副本个数,设置多副本可以增强Kafka服务的容灾能力。A.正确(正确答案)B.错误92.92、FusionInsightHD部署时,如果Solr索引默认存放在HDFS上时,以下理解正确的有?A、不需要考虑各solrserver实例上创建了多少shardB、为保证数据可靠性,创建索引时必须创建多ReplicaC、通过HDFS读取索引时占用磁盘IO,因此不建议Solr实例与DataNode部署在同一节点上D、当Solr服务参数INDEX_STORED_ON_HDFS值为HDFS时,创建Collection的索引就默认存储在HDFS上。(正确答案)93.93.FusionInsightHadoop集群中,集群规模有70个节点,如果采用推荐部署方案,在管理节点可能存在哪些分区?(多选题)A、/srv/BigData/zookeeper(正确答案)B、/srv/BigData/dbdata_om(正确答案)C、/srv/BigData/(正确答案)D、/srv/BigData/journalnode(正确答案)E、/srv/BigData/hadoop/data594.94.大数据商业咨询服务方案在规划环节主要考虑以下哪些设计?(多选题)A、大数据商业模式设计(正确答案)B、商业场景全景规划(正确答案)C、典型场景需求设计(正确答案)D、场景分解和业务设计(正确答案)95.95.Loader仅支持关系型数据库与HadoopHBase之间的数据的导入和导出。A.正确B.错误(正确答案)96.96.FusionInsightHD中使用HBase进行数据读写服务时需要连接HMaster。A.正确B.错误(正确答案)97.97.关于Kerberos的TGT以下说法错误的是?A、TGT全称为票据授权票据,主要由KDC服务器生成B、TGT一次生成之后,可以无限期使用(正确答案)C、TGT在客户端的存在方式可以是在内存中存储,也可以在本地以文件的形式D、TGT中主要的信息有当前该票据的有效时长和授予该TGT的服务端IP以及98.98.HBase如果发生一个Region的Split,将一个HFile文件真正分开到两个Region的过程发生在以下什么阶段?ASplit过程中BFlush过程中CCompaction过程中(正确答案)DHFile分开过程中99.99.FusionInsightHDV100R002C60的版本集群中,以下哪些组件需要规划元数据分区?A、HDFS(正确答案)B、Zookeeper(正确答案)C、Streaming(正确答案)D、RedisE、HBaseF、Kafka100.100.Hadoop通过ResourceManager对集群资源进行管理,它的主要功能有?A、集群资源调度(正确答案)B、应用程序管理(正确答案)C、集群资源管理(正确答案)D、日志管理101.101.以下关于Hadoop的HDFS描述正确的有?A、HDFS由NameNode,DataNode,Client组成(正确答案)B、HDFS备NameNode上的元数据是主NameNode同步过去的C、HDFS采用就近的机架节点进行数据的第一副本存储(正确答案)D、HDFS适合一次写入,多次读取的读写任务(正确答案)102.102.FusionInsightManager可以对哪些项目进行健康检查?A、主机(正确答案)B、服务(正确答案)C、角色D、实例103.103.Hadoop系统中YARN支持哪些资源类型的管理?A、内存(正确答案)B、Cpu(正确答案)C、网络D、磁盘空间104.104.哪个不是Flume的channel类型?A、MemoryChannelB、FileChannelC、JDBCChannelD、HDFSChannel(正确答案)105.105.FusionInsightHD中Loader实例必须与哪个实例部署在一起?A.DataNodeB.RegionServerC.ResourceManagerD.NodeManager(正确答案)106.106.Hadoop平台中HBase的Region是由哪个服务进程来管理?A、HMasterB、DataNodeC、RegionSever(正确答案)D、Zookeeper107.107.FusionInsight系统中,HDFS的Block默认保存几份?A、3份(正确答案)B、2份C、1份E、不确定108.108.Hadoop中,如果将yarn.scheduler.capacity.root.QueueA.minimum-user-limit-percent设置为50,下面说法错误的是?A.一个用户提交任务,可以使用QueueA的100%的资源B.QueueA中的每个用户最多只能获得50%的资源(正确答案)C.如果QueueA中已经有2个用户的任务运行,这时第3个用户提交的任务需要等待释放资源D.QueueA中必须保障每个用户至少得到50%的资源109.109.Solr创建Collection时,推荐选用路由算法为compositldRouter,那么该Collection可以扩展shard。A.正确B.错误(正确答案)110.110.在solrcloud模式下,以下关于solr相关概念描述正确的有?A.collection是在solrcloud集群中逻辑意义上完整的索引,可以被划分为一个或多个shard,这些sahrd使用相同的configset。(正确答案)B.configset时solrcore提供服务必须的一组配置文件,包括solrconfig.xml和schema.xml(正确答案)C.shard是collection的逻辑分片,每个shard都包含了一个或者多个replicas,通过选举确定哪个replica是leader,只有Leaderreplica才能进行处理索引和查询请求D.reptica只有处于active状态是才会接受索引和查询请求(正确答案)111.111.那个选项不属于transformation操作?A.jionB.sortC.reduceByKeyD.reduce(正确答案)112.112.关于Hive与Hadoop其他组件的关系,描述错误的是?A.HIVE最终将数据存储在HDFS中B.HiveSQL其本质是执行的MapReduce任务C.Hive是Hadoop平台的数据仓库工具D.Hive对HBase有强依赖(正确答案)113.113.关于FusionInsightManager功能说法错问题有哪些?(多选题)A、通过FusionInsightManager的Audit设计界面可以查询每个重要操作B、通过FusionInsightManager不能下载单个组件的客户端(正确答案)C、集群部署完成后,通过FusionInsightManager不能进行集群扩容,只能通过卸载集群重新搭建来扩容集群(正确答案)D、通过FusionInsightManager的admin告警界面可以查询每个告警的具体信息114.114.FusionInsightHD系统中,集群节点规划时需要考虑哪些磁盘规划?A.主机OS磁盘规划(正确答案)B.控制节点元数据盘规划(正确答案)C.管理节点元数据盘规划(正确答案)D.数据节点数据磁盘规划(正确答案)115.115.FusionInsightManager用户权限管理不支持哪个配置?A.给用户配置角色B.给角色配置权限C.给用户组配置角色D.给用户组配置权限(正确答案)116.116.华为FusionInsightHD系统中,对存储副本为3个的数据块,当有一个节点上该数据块丢失时,需要手动复制一个副本到该节点上。A.正确B.错误(正确答案)117.117.Spark应用运行时,如果某个tast运行失败则导致整个app运行失败。A.正确B.错误(正确答案)118.118.FusionInsightHD的Manager界面对Loader的操作不包括下列哪个?A.启动Loader实例B.查看Loader服务状态C.配置Loader参数D.查看Loader运行日志(正确答案)119.119.Flume传输数据过程中,Sink取走数据并写入目的地后,会将event从channel中删除。A.正确(正确答案)B.错误120.120.在FusionInsight集群规划时,以下哪些集群命名是系统允许的?A.FusionInsight-123B.FusionInsight_123(正确答案)C.FusionInsight123(正确答案)D.123FusionInsight(正确答案)121.121.FusionInsightHD支持哪些日志下载方式?A.下载已安装的所有组件的日志(正确答案)B.下载单个组建某个模块的日志(正确答案)C.下载指定主机的日志(正确答案)D.下载指定时间段的日志(正确答案)122.122.FusionInsightHD集群规划中,管理节点&控制节点&数据节点合一部署方案合适什么样的场景?A.30节点以下(正确答案)B.100节点以下C.100~200节点D.200节点以上123.123.FusionInsightHD系统中,以下选项哪一个不是HBase写数据设计的角色或服务?A.ZookeeperB.HDFSC.HMaster(正确答案)D.RegionServer124.124.HDFS机制中NameNode负责管理元数据,Client端每次读请求都需要从NameNode的元数据磁盘中读取元数据信息以此获取所读文件在DataNode的位置。A.正确B.错误(正确答案)125.125.以下哪些是Spark可以提供的功能?A.分布式内存计算引擎(正确答案)B.分布式文件系统C.集群资源的统一管理D.流处理功能(正确答案)126.126.FusionInsightHDLLD配置规划工具可以生成哪些配置文件?A.监控告警阀值配置文件B.集群的安装模板文件(正确答案)C.HDFS和YARN的配置文件D.执行Precheck所需要的配置文件CheckNodes.Config(正确答案)127.127.FusionInsightHD扩容时,添加到集群中的新节点,主机OS的root用户密码与集群原所有节点root用户密码可以不用保持一致。A.正确B.错误(正确答案)128.128.从生命周期维度看,数据主要经历那几个阶段?A.数据采集(正确答案)B.数据存储(正确答案)C.数据管理(正确答案)D.数据分析(正确答案)E.数据呈现129.129.关于FusionInsightManbager中的Controller和NodeAgent,说法正确的是?A.Controller每隔3秒向NodeAgent发送心跳B.NodeAgent接受Costroller下发的命令,执行具体的动作(正确答案)C.每个节点都必须部署ControllerD.NodeAgent是开源增强130.130.哪个模块是负责FusionInsightManbager用户数据存储的?A.CASB.AOSC.KerberosD.LDAP(正确答案)131.131.Kerberos协议中TGT主要用于应用侧与需要访问的服务之间的安全会话。A.正确B.错误(正确答案)132.132.FusionInsightHD中的HBase的某张表的RowKey划分SplitKey为9,E,a,z,请问该表有几个Region?A.3B.4C.5(正确答案)D.6133.133.哪一项不属于FusionInsightHD中Hive的流控特性的描述?A.支持对已经建立的总连接数做阀值控制B.支持对每个用户已经建立的连接数做阀值控制C.支持对某个特定用户已经建立的连接数做阀值控制(正确答案)D.支持对单位时间所建立的连接数做阀值控制134.134.以下关于Solr角色描述正确的是?A.SolrServerAdmin属于管理角色,需要部署在管理节点上。B.SolrServer负责提供创建索引和全文检索等服务,是Solr集群中的数据计算和处理单元。(正确答案)C.HBaselndexer是Solr的必要角色,提供将HBase中数据导入至Solr服务。135.135.FusionInsightHD产品中,关于Kafka组件部署规划说法正确的是?A.Kafka的Produer发送消息时可以指定该消息被哪个Consumer消费B.在创建Topic时,副本数不得大于当前存活的Borker实例个数,否则创建Topic将会失败。(正确答案)C.Kafka安装完成后将不能再配置数据存放目录了。D.Kafka会将元数据信息存放在Zookeeper上(正确答案)136.136.关于Kafka盘容量不足的告警,对于可能的原因以下分析不正确的是?A.用于存储Kafka数据的磁盘配置(如磁盘数目、磁盘大小等)无法满足当前业务数据流量,导致磁盘使用率达到上限B.数据保存时间配置过长,数据累积达到磁盘使用率上限C.业务规划不合理,导致数据分配不均,使部分磁盘达到使用率上限。D.Broker节点故障导致(正确答案)137.137.FusionInsightHD中Loader从SFTP服务器导入文件,如果不需要做编码转换和数据转换且速度最快,选择下面哪个文件类型?A.test_fileB.sequence_fileC.binary_file(正确答案)D.graph_file138.138.FusionInsightHD集群三层组网时,管理节点、控制节点、数据节点建议安装在不同网段内,可以提高可靠性。A.正确B.错误(正确答案)139.139.HBase的物理存储单元是什么?A.RegionB.ColumnFamily(正确答案)C.ColumnD.ROW140.140.FusionInsightHD系统中,集群中其中一个Loader节点异常,其他服务没有异常的情况下,不会影响Loader服务功能的正常使用。A.正确(正确答案)B.错误141.141.安全模式下安装FusionInsightHD集群时,哪些组件是必须安装的?A.ZookeeperB.LdapServer(正确答案)C.KrbServer(正确答案)D.HDFS142.142.SparkonYARN模式下,没有NodeManager的节点不能启动executor执行task。A.正确(正确答案)B.错误143.143.YARN服务中,如果要给队列QueueA设置容量为30%,应该配置哪个参数?A.yarn.scheduler.capacity.root.QueueA.user.limit-factorB.yarn.scheduler.capacity.root.QueueA.minimun-suer-limit-precentC.yarn.scheduler.capacity.root.QueueA.capacity(正确答案)D.yarn.scheduler.capacity.root.QueueA.state144.144.假设有个keyvalue为ID:name,按先后顺序写入四个keyvalue:001:li,001:mary,001:delete,001:lily,请问scan“ttt”{versions>=2}会返回哪几条数据?A001:LilyB001:delete,001:LilyC001:mary,001:delete,001:lilyD001:mary,001:lily(正确答案)145.145.Loader作业运行前后,需要保证哪些节点与外部数据源通讯?A、Loader进程所在的节点B、运行MapReduce作业的节点C、前面两个都需要(正确答案)D、前面两个都不需要146.146.哪儿模块负责HDFS数据存储?A.NameNodeB.DataNode(正确答案)C.ZooKeeperD.JobTracker147.147.FusionInsightHD使用HBase客户端批量写入10条数据,某个regionserver节点上包含该表的2个region,分别A和B,10条数据中有两条属于A,4条属于B,请问写入这10条数据需要向该regionserver发送几次RPC请求?A1(正确答案)B2C6D10148.148.在规划FusionInsightHD集群时,如果客户用于功能测试,对性能没有要求,节约成本的情况下可以采用管理节点、控制节点、数据节点合一部署,最少需要多少节点?A、2B、3(正确答案)C、6D、8149.149.Flume支持监控并传输目录下新增的文件,可实现准实时的数据传输,以上描述的是哪一类source?A、spoolingdirectorysoure(正确答案)B、httpsourceC、execsourceD、syslogsource150.150.FusionInsightHDManager界面显示HIve服务转态为Bad时,可以能的原因有哪些?A、DBServioe服务不可用(正确答案)B、HDFS服务不可用(正确答案)C、Metastore实例不可用(正确答案)D、HBase服务不可用151.151.根据建议,/srv/BigDate分区应该部署在什么磁盘上?A.OS盘(正确答案)B.元数据盘C.数据盘D.管理盘152.152.Kerberos系统设计上采用客户端/服务器结构与EDS加密技术,能够进行相互认证,客户端和服务器端均可对对方进行身份认证。A正确(正确答案)B错误153.153.启用日志聚集功能,需要配置哪个参数?Ayarn.nodemanager.local-dirsByarn.nodemanager.log-dirsCyarn.acl.enableDyarn.log-aggregation-enable(正确答案)154.154.FusionInsightHD产品中,关于Kafka组件部署说法不正确的是?A、Kafka强依赖于ZooKeeper,安装Kafka必须安装ZooKeeperB、Kafka部署的实例个数不小于2C、Kafka的服务端可以产生消息(正确答案)D、Consumer作为Kafka的客户端角色专门进行消息的消费155.155.FusionInsightHD集群组网设计中,有一种机架可以按照业务需求线性扩展,这种机架被称为()A.基本框B.扩展框(正确答案)C.管理框D.数据框156.156.YARN容量调度器的主要特点有哪些?A、容量保证(正确答案)B、灵活性(正确答案)C、多重租凭(正确答案)D、动态更新配置文件(正确答案)157.157.YARN上有两个四级队列Q1与Q2,容量都是50,Q1上已经有10个任务并占用了40的容量,Q2上有2个任务共占用了30的容量,那么由于Q1的任务数多,调度器会优先将资源分配给Q1.A正确B错误(正确答案)158.158.FusionInsightHD系统中使用Sstreaming客户端Shell命令提交拓扑之后,使用StormUI查看发现该拓扑长时间没有处理数据,可能原因有?A拓扑结构过于复杂或者并发太大,导致worker启动时间过长,超过supervisor的等待时间(正确答案)BSupervisor的是slots资源被耗尽,拓扑提交上去后分不到slot去启动Worker进程(正确答案)C拓扑业务存在逻辑错误,提交之后无法正常运行(正确答案)D当数据量较大时,拓扑处理速度较慢159.159.Kerberos只能对集群内的服务提供安全认证A正确B错误(正确答案)160.160.FusionInsightManager不能够管理哪个对象?A、SparkB、主机OS(正确答案)C、YARND、HDFS161.161.FusionInsightHD系统中关于HDFS的DataNode说法正确的是?A、不会检查数据的有效性B、周期性地将本节点的Block发送给NameNode(正确答案)C、不同的DataNode存储的Block一定是不同的D、一个DataNode上的Block可以是相同的162.162.FusionInasightHD集群中包含了多种服务,没种服务又由若干个角色组成,下面哪些是服务的角色?AHDFSBNameNode(正确答案)CDataNode(正确答案)DHBase163.163.FusionInosightHDLoader可以将HDFS数据导出到以下哪些目标端?ASFTP服务器(正确答案)BFTP服务器(正确答案)COracle服务器(正确答案)DDB2服务器(正确答案)164.164.关于Hive在FusionInsightHD中的架构描述错误的是:A、只要有一个Hiveserver不可用,整个Hive集群便不可用(正确答案)B、HiveServer负责接受客户端请求、解析、执行HQL命令并返回查询结果C、MetaDtore用于提供元数据服务,依赖于DBServiceD、在用一时间点,HiveServer只有一个处于Active状态,另一个则处于Standby165.165.关于HBase中HFile的描述不正确的是?A.一个HFile属于一个regionB.一个HFile包含多个列族的数据(正确答案)C.一个HFile包含多列数据D.一个HFile包含多行数据166.166.Solr可以对结构化、半结构化、非结构化数据建立索引,并提供全文检索的能力。A正确(正确答案)B错误167.167.FusionInsightHD系统中执行HBase些数据是,数据被写入内存Memstore,日志HLog和HDP中,请问那一步写入成功后才会最终返回客户端写数据成功?A.MemstoreB.HLog(正确答案)C.HDFSD.Memory168.168.Spark和Hadoop都不适用于迭代计算的场景。A正确(正确答案)B错误169.169.FusionInsightHD管理节点提供双机HA机制,主节点故障之后主备节点需要手动实现Failover。A正确B错误(正确答案)170.170.FusionlnsightHD系统中,哪个不属于集群节点的磁盘分区?A.OS分区B.数据分区C.元数据分区D.管理分区(正确答案)171.171.YARN调度器分配资源申请的顺序,下面哪一个描述是正确的?A.任意机器->同机架->本地资源B.任意机器->本地机器->同机架C.本地资源->同机架->任意机器(正确答案)D.同机架->任意机器->本地资源172.172.某用户需要搭建一个350个节点的FusionlnsightHD集群,哪种规划方案最佳?A.管理节点、控制节点、数据节点合一部署,二层组网B.管理节点、控制节点合一部署,数据节点独立部署,二层组网C.管理节点、控制节点、数据节点都独立部署,三层组网(正确答案)D.管理节点、数据节点合一部署,控制节点独立部署,二层组网173.173.Spark任务的Esecutor可以运行多个task.A.正确(正确答案)B.错误174.174.FusionlnsightHD中。关于HBase的BloomFilter特性理解,说法不正确的是?A.可以用来过滤数据(正确答案)B.可以用来优化随机读性能C.会增加存储的消耗D.可以准确判断某条数据不存在175.175.执行HBase读数据业务,需要读取那几部分数据?A.HFile(正确答案)B.HLogC.MemStore(正确答案)D.HDFS176.176.FusionlnsightHD产品中,关于Kafka组件说法正确的有?A.删除Topic时,必须确保Kafka的服务配置delete.topic.enable配置为true(正确答案)B.Kafka安装及运行日志保存路径为/srv/Bigdata/kafkaC.ZooKeeper服务不可用会导致Kafka服务不可用(正确答案)D.必须使用admin用户或者kafkaadmin组用户进行创建Topic(正确答案)177.177.加载数据到Hive表,哪种方式不正确?A.直接将本地路径的文件load到Hive表中B.将HDFS的文件load到Hive表汇总C.Hive支持insertinto单条记录的方法,所以可以直接在命令行插入单条记录(正确答案)D.将其他表的结果集insertinto到Hive表178.178.YARN中资源抽象用什么表示?A.内存B.CPUC.Container(正确答案)D.磁盘空间179.179.使用配置规划工具对FusioninsightHDV100R00C50集群进行规划时,可以用V100R002C60版本的配置规划工具来规划。A.正确B.错误(正确答案)180.180.FusioninsightHD部署过程中,以下关于安装集群说法正确的是?A.支持模板安装和手动安装(正确答案)B.首次登录不用修改admin账户密码C.对于组网隔离场景,在发现节点步骤的IP输入框中,应该输入各个节点的业务IPD.选择服务时,系统会自动为其选择依赖的底层服务(正确答案)181.181.FusionlnsightHD集群安装成功后,不允许修改服务、角色和实例的配置。A.正确B.错误(正确答案)182.182.FusionInsightHDHBase的管理进程是如何选择主节点的?A、随机选取B、由RegionServer进行裁决C、通过ZooKeeper进行裁决(正确答案)D、HMaster为双主模式,不需要进行裁决183.183.FusoninsightHD系统中使用Streaming客户端Shell命令查看拓扑或者提交拓扑失败,以下哪些定位手段是正确的?A.查看客户端异常堆栈,判断是否客户端使用问题(正确答案)B.查看主Nimbus的运行日志,判断是否Nimbus服务端异常(正确答案)C.查看Supervisor运行日志,判断是否Supervisor异常D.查看Worker运行日志184.184.大数据需要传统行业思维方式的转变,要把数据收集、分析作为流程的重要部分,数据驱动业务流程优化,实现智能化和自动化,并依托数据资产实现跨界拓展。A、正确(正确答案)B、错误185.185.FusionInsightHD系统中,HBase元数据metaregion路由信息保存在哪?Aroot表Bzookeeper(正确答案)CMasterDMeta表186.186.FusionInsightHD系统中,可以通过多个Flume连接从其部署的节点上采集数据。A.正确(正确答案)B.错误187.187.FusionInsightHD安装不支持非root用户的安装方式。A.正确B.错误(正确答案)188.188.Kafka集群中。Kafka服务端部署的角色时?A.ProducerB.ConsumerC.ZooKeeperD.Broker(正确答案)189.189.大数据分析相关技术主要特征包括?A.机器学习,全量特征(正确答案)B.数据背后事件关联性分析(正确答案)C.基于海量数据为基础(正确答案)D.基于精确样本为基础190.190.FusionInsightHD在安装集群成功后,有哪些项需要检查?A.Service组件健康状态(正确答案)B.系统是否有告警(正确答案)C.服务的配置状态是否为已同步(正确答案)D.主机健康状态(正确答案)191.191.FusionInsightHD系统中,LDAP数据同步方式是哪个?A.单向同步(正确答案)B.双向同步C.隔离不同步D.数据交叉同步192.192.以下关于Hadoop分布式文件系统HDFS联邦描述正确的有?A.一个Namespace使用一个blockpool管理数据块(正确答案)B.一个Namespace可使用多个blockpool管理数据块C.每个blockpool的磁盘空间时物理共享的,逻辑空间是隔离的(正确答案)D.支持NameNode/Namespace水平扩展(正确答案)193.193.FusionInsightHD的Loader中,一个连接器(connector)只可以分配给一个作业使用。A.正确B.错误(正确答案)194.194.Flume进程级联时,以下哪些sink类型用于接收上一跳Flume发送过来的数据?A.avrosinkB.thriftsink(正确答案)C.HDFSsink(正确答案)D.NullSink195.195.FusionInsightManager对外支持REST接口、SNMP接口、SYSLOG接口。A.正确(正确答案)B.错误196.196.FusionInsightHD系统中,哪个方法不能查看Loader作业执行结果?A通过Yam任务管理查看B通过LoaderUI界面查看C通过manager的告警查看D通过Nodemanager查看(正确答案)197.197.Hadoop的HBase主要特点有哪些?A.高可靠性(正确答案)B.高性能(正确答案)C.面向列(正确答案)D.可伸缩(正确答案)198.198.FusionInsight系统中,Flume数据流在单个节点内不需要经过哪个环节?A.SourceB.ChannelC.SinkD.topic(正确答案)199.199.HDFS的NameNode节点主备

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论