版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
绪论单元测试第一章单元测试第二章单元测试第三章单元测试第四章单元测试第五章单元测试1【单选题】(2分)下列对大数据的特点描述不正确的是()正确答案:CA.数据体量巨大B.速度要求快C.价值密度高D.数据类型多样1【判断题】(1分)云主机和物理机的寿命都是永久性的。()正确答案:AA.错B.对2【判断题】(1分)对于实时性要求高的应用,需要应用实时处理架构。()正确答案:AA.对B.错3【判断题】(1分)数据仓库是用来存储数据的而不是分析数据的。()正确答案:BA.对B.错4【判断题】(1分)在DWS层中,用户行为日志数据分为公共字段和事件字段。()正确答案:AA.对B.错5【单选题】(2分)项目实施流程中没有哪一步()正确答案:AA.下载数据B.数据仓库设计开发C.数据访问D.数据导出6【单选题】(2分)数据分析在企业中的作用()正确答案:BA.帮助企业经营者平衡企业的收益B.直接的获取经营的利润C.干预经营者的决策D.帮助企业经营者减少投入7【单选题】(2分)数据结构中哪项不是页面入口的来源()正确答案:BA.应用首页B.登录页C.详情页D.push8【多选题】(3分)Hadoop的三大发行版本是()正确答案:ABCA.ApacheB.HDPC.CDHD.Java9【多选题】(3分)流量分析常见指标有哪些方面()正确答案:ABCDA.受访分析B.转化路径分析C.来源分析D.访客分析10【多选题】(3分)网站流量数据分析的意义有哪些()正确答案:ABCDA.帮助提高网站流量B.提升网站用户体验C.帮助网站运营人员获取网站流量信息D.从多方面提供网站分析的数据依据1【判断题】(1分)Hadoop是一种分布式系统基础架构,主要解决海量数据存储和海量数据计算两大问题。()正确答案:AA.对B.错2【判断题】(1分)在HDFS配置文件中,主要配置的就是hdfs-site.xml配置文件。()正确答案:BA.错B.对3【判断题】(1分)在Hadoop分布式集群中,不需要对集群中的每一个节点都进行ip规划。()正确答案:AA.错B.对4【判断题】(1分)利用HDFS操作命令可以将数据文件从本地上传到HDFS上,也可以将数据文件从HDFS下载到本地。()正确答案:AA.对B.错5【判断题】(1分)在HDFSAPI操作中,closeFileSystem方法的功能是释放文件系统对象的资源。()正确答案:BA.错B.对6【判断题】(1分)MapReduce词频统计案例中,执行map任务的最后阶段,会将缓冲区的数据全部写入到磁盘。()正确答案:BA.错B.对7【判断题】(1分)Flume是Cloudera公司提供的一款高可用、高可靠、分布式的系统,可用于海量日志采集、聚合和传输。()正确答案:BA.错B.对8【单选题】(2分)能在网络中安全传输文件的软件是()。正确答案:DA.XshellB.IDEAC.VMwareD.Xftp9【单选题】(2分)创建了bigdata用户的命令是()。正确答案:DA.subigdataB.SudoersC.bigdataALLD.useraddbigdata10【单选题】(2分)论文(),主要论证的核心是如何采用分布式的架构对海量数据进行分布式计算。正确答案:DA.GFSB.HDFSC.BigTableD.MapReduce11【单选题】(2分)假如我们设定HDFS块的大小是128M,那么,一个大小为500M的数据文件,将会被拆分成()个分片正确答案:AA.4B.2C.3D.512【单选题】(2分)在Linux命令行中,使用()命令格式化hive元数据库正确答案:BA.clearB.schematoolC.delD.format13【单选题】(2分)在Hive中给表添加数据,使用()方式给表添加数据效率更高。正确答案:CA.insertintoB.appendC.LoadD.Add14【单选题】(2分)关系型数据库与HDFS之间相互数据迁移的工具是()。正确答案:AA.sqoopB.fastcopyC.distcpD.fsck15【多选题】(3分)Notepad++功能有()。正确答案:ABCDA.语法高亮度显示、语法折叠功能、支持宏、扩充基本功能的外挂模组B.编写计算机程序代码C.可以连接虚拟机,对虚拟机中的文件进行编辑。D.制作一般的纯文字说明文件16【多选题】(3分)Hadoop主要包含()三大功能组件。正确答案:ACDA.MapReduceB.HadoopC.HDFSD.YARN17【多选题】(3分)Hadoop具有()优势。正确答案:ABCDA.高容错性B.高可靠性C.高扩展性D.高效性18【多选题】(3分)下面说法正确的是()。正确答案:ABCDA.JDK包含JRE和JVMB.JRE是java运行时的类库C.JDK是Java语言的开发环境D.Java编程的核心就是JVM,JVM是JRE的一部分,它是一个虚拟出来的计算机。19【多选题】(3分)在分布式文件系统HDFS当中提供了两种操作命令,是()。正确答案:ADA.hdfsdfsB.HadoopdfsC.hdfsfsD.hadoopfs20【多选题】(3分)Hive是基于Hadoop技术的数据仓库工具,用来对数据进行()。正确答案:ABCDA.加载B.分析C.转化D.提取21【多选题】(3分)使用beeline客户端远程访问Hive之前,需要启动的两个服务是()。正确答案:ADA.hive--servermetastoreB.hive--servicemetastoreC.hive--servicehiveserverD.hive--servicehiveserver222【多选题】(3分)Hive的复杂数据类型有()三种正确答案:ABDA.MAPB.STRUCTC.CharD.ARRAY23【多选题】(3分)成功安装Zookeeper集群后,查看各节点的角色信息时,会看到1个、多个()。正确答案:ABA.followerB.leaderC.zookeeperD.zkServer24【多选题】(3分)Kafka是一种高吞吐量的分布式发布订阅消息系统,是Apache基金会开源的消息队列,该框架由()编写而成。正确答案:CDA.PythonB.C++C.ScalaD.Java1【判断题】(1分)业务字段指的是每个移动端固定的、共有的字段;公共字段代表的是用户在app中执行过的所有操作。()正确答案:AA.错B.对2【判断题】(1分)在Flume过程中,Flume对接本地磁盘文件,通过tailDir类型实时监控当前数据文件中数据内容的变化。()正确答案:BA.错B.对3【判断题】(1分)ETL拦截器主要用于过滤时间戳不合法和json数据不完整的日志。()正确答案:BA.错B.对4【判断题】(1分)Flume分流标记拦截器主要是用于区分启动日志和事件日志。()正确答案:BA.错B.对5【单选题】(2分)以下关于Flume的说法正确的是____。()正确答案:DA.Source是Flume数据传输的基本单元B.Sink是Flume数据传输的基本单元C.Channel是Flume数据传输的基本单元D.Event是Flume数据传输的基本单元6【单选题】(2分)Flume通过内部的采集数据传输机制进行快速的数据传输,传输完之后会将数据就存储到____中。()正确答案:AA.KafkaB.SourceC.HDFSD.Channel7【单选题】(2分)可以使用____命令,启动Kafka的一个消费者。()。正确答案:AA.kafka-console-consumer.shB.kafka-server-start.shC.kafka-topics.shD.kafka-console-producer.sh8【单选题】(2分)在Flume消费的整体流程中,第一部分是别名配置,在别名配置的过程当中,配置了两个数据流用来处理()。正确答案:DA.Flume环境变量B.Flume数据消费脚本C.ETL和分流标记拦截器D.启动日志数据和事件日志数据9【多选题】(3分)在Flume数据传输的过程中,当source将数据传递给channel时,数据会先后经过()两个拦截器。正确答案:CDA.UUID拦截器B.时间戳拦截器C.ETL拦截器D.Flume分流标记拦截器10【多选题】(3分)Flume的安装与部署可以分为下列哪三个步骤()。正确答案:ACDA.将Flume安装包上传至Linux操作系统B.启动Flume数据消费脚本C.在Flume的配置文件中修改指定配置D.解压到指定目录,进行环境变量的配置1【判断题】(1分)在数据仓库中,ODS层的作用是保持数据原貌,不做任何修改,起到备份数据的作用()正确答案:AA.对B.错2【判断题】(1分)在数据仓库中,DWD层的作用是对数据进行清洗()正确答案:BA.错B.对3【判断题】(1分)在ADS层中,通过在启动日志中统计不同设备ID出现的次数来分析用户活跃?()正确答案:AA.对B.错4【判断题】(1分)在ADS层中,按照设备ID对日活表分组,登录次数为1,且在一周前登录的这种分析方式,分析沉默用户?()正确答案:BA.错B.对5【判断题】(1分)DWS层统计各个主题对象的当天行为,服务于DWT层的主题宽表。DWS层的宽表字段,是站在不同维度的角度去看事实表,重点关注事实表的度量值,通过与之关联的事实表,获得不同的事实表的度量值()正确答案:BA.错B.对6【单选题】(2分)在数据仓库项目中,我们在DWD层使用()手段清洗数据正确答案:CA.KettleB.PythonC.SQLD.RDD7【单选题】(2分)在数据仓库中,用于数据清洗的是哪个层()正确答案:BA.DWSB.DWDC.DWTD.ODS8【多选题】(3分)数据仓库一般分为()正确答案:ABCDEA.ADSB.ODSC.DWTD.DWSE.DWD9【多选题】(3分)在数据仓库DWD层中,需要清洗哪些数据()正确答案:BCDA.创建分区表B.过滤核心字段C.将用户行为宽表和业务表进行数据一致处理D.空值的去除10【多选题】(3分)在数据仓库中,ODS层做了什么业务()正确答案:ABCA.采用LZO压缩B.保持数据原貌C.创建分区表D.空去除1【单选题】(2分)MySQL中,用于创建数据库的命令是()。正确答案:CA.dropdatabase数据库名;B.use数据库名;C.createdatabase数据库名;D.createtable数据库名;2【单选题】(2分)使用sqoop进行从Hive到MySQL数据库的数据迁移时,其命令为()。正确答案:DA.sqoopimportB.sqoopmergeC.sqoopjobD.sqoopexport3【单选题】(2分)pyecharts中,柱状图类是()。正确答案:DA.LineB.PieC.LiquidD.Bar4【单选题】(2分)pyecharts中,饼图类是()。正确答案:CA.BarB.LineC.PieD.Liquid5【单选题】(2分)全局配置项可通过()方法设置。正确答案:BA.add_yaxisB.set_global_optsC.set_series_optsD.reversal_axis6【判断题】(1分)使用pyecharts工具绘图时,可直接进行图表的绘制,无需在程序中导入对应的图表类。()正确答案:AA.错B.对7【判断题】(1分)使用pyecharts工具绘图时,可以通过设置初始化
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度茶店供应链金融投资合同
- 二零二五年度2025年度旅游景区保安雇佣合同
- 2025年度矿石加工技术专利许可使用合同
- 科技助力下的学校心理健康教育创新
- 2025年度矿山技术专利转让居间合同
- 二零二五年度传统酿造酒销售许可合同
- 2025年度母婴用品销售提成奖励协议
- 移动通信中的嵌入式软件技术探讨
- 2025年度高空作业劳务及高空作业设备定期检修合同
- 二零二五年度旅游产品销售顾问劳动合同模板
- 小学高年级数学阅读能力的培养与
- 包装品质彩盒外箱知识课件
- 神经外科课件:神经外科急重症
- 颈复康腰痛宁产品知识课件
- 2024年低压电工证理论考试题库及答案
- 微电网市场调查研究报告
- 《民航服务沟通技巧》教案第14课民航服务人员上行沟通的技巧
- MT/T 538-1996煤钻杆
- 小学六年级语文阅读理解100篇(及答案)
- CB/T 467-1995法兰青铜闸阀
- 气功修炼十奥妙
评论
0/150
提交评论