![大数据技术与应用 第2版 期末测试卷 2套_第1页](http://file4.renrendoc.com/view10/M02/1E/25/wKhkGWejUCKAbBsPAACITUlevKw998.jpg)
![大数据技术与应用 第2版 期末测试卷 2套_第2页](http://file4.renrendoc.com/view10/M02/1E/25/wKhkGWejUCKAbBsPAACITUlevKw9982.jpg)
![大数据技术与应用 第2版 期末测试卷 2套_第3页](http://file4.renrendoc.com/view10/M02/1E/25/wKhkGWejUCKAbBsPAACITUlevKw9983.jpg)
![大数据技术与应用 第2版 期末测试卷 2套_第4页](http://file4.renrendoc.com/view10/M02/1E/25/wKhkGWejUCKAbBsPAACITUlevKw9984.jpg)
![大数据技术与应用 第2版 期末测试卷 2套_第5页](http://file4.renrendoc.com/view10/M02/1E/25/wKhkGWejUCKAbBsPAACITUlevKw9985.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
期末测试(1)一、单选题(共50题,100分)1、下列哪个是批处理计算()(2.0)A、HBaseB、MapReduceC、HiveD、Spark正确答案:B解析:2、HDFS是一个()系统(2.0)A、分布式文件系统B、开放式文件系统C、大规模式文件系统D、小型文件系统正确答案:A解析:3、哪个不是非结构化数据(2.0)A、办公文档数据B、图片数据C、mysql表格数据D、咅频数据正确答案:C解析:4、哪个不是结构化数据(2.0)A、企业财务报表数据B、行政审批数据C、学生档案数据D、图片数据正确答案:D解析:5、大数据一般具有哪四个特征:(2.0)A、数据量大、数据类型繁多、数据产生速度慢以及数据价值密度低B、数据量大、数据类型繁多、数据产生速度快以及数据价值密度低C、数据量大、数据类型繁多、数据产生速度快以及数据价值密度高D、数据量一般、数据类型繁多、数据产生速度快以及数据价值密度低正确答案:B解析:对大数据特征的了解6、从研究现状上看,下面不属于云计算特点的是(
)(2.0)A、超大规模B、虚拟化C、私有化D、高可靠性正确答案:C解析:7、半虚拟化技术的优点是()(2.0)A、速度快B、性能高C、架构强D、时间短正确答案:B解析:8、与网格计算相比,不属于云计算特征的是(
)(2.0)A、资源高度共享B、适合紧耦合科学计算C、支持虚拟机D、适用于商业领域正确答案:B解析:9、云计算是大数据分析的()(2.0)A、前提B、不需要C、一致D、以上都不对正确答案:A解析:10、在当前的云计算领域,Google的GFS和Hadoop开发的开源系统是比较流行的两种云计算分布式存储系统。(2.0)A、HDFSB、HDFDC、HDFAD、HDFF正确答案:A解析:11、Kappa架构在()的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代。(2.0)A、HadoopB、流式架构C、Lambda
D、都不对正确答案:C解析:12、HadoopMapReduce主要采用Master/Slave(M/S)架构,其主要包括Client、JobTracker、TaskTracker和()四个组件。(2.0)A、TaskSchedulerB、Task
C、
SchedulerD、works正确答案:A解析:13、一个完整的HDFS运行在一些节点之上,这些节点运行着不同类型的()(2.0)A、坚守进程B、保护进程C、守护进程D、洽谈进程正确答案:C解析:14、()是HDFS的大脑(2.0)A、fileB、NameNodeC、DataNodeD、无正确答案:B解析:15、Common提供远程调用()(2.0)A、RPCB、计算机C、管理器D、操作者正确答案:A解析:16、HDFS的设计建立在“一次写入、()”任务的基础上。(2.0)A、多次读写B、不能读写C、多次存储D、都不对正确答案:A解析:17、MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算,概念"Map(映射)"和"Reduce()",是它们的主要思想。(2.0)A、(发射)B、(集合)C、(归约)D、都不对正确答案:C解析:18、执行()命令可以显示HDFS常用命令的使用信息(2.0)A、“hadoop”B、“hadoopdfs”C、“
dfs”D、“hadoopd”正确答案:B解析:19、MapReduce的编程框架是由一个单独运行在主节点上的()和运行在每个集群从节点上的TaskTracker共同组成的(2.0)A、JobTrackerB、jobC、taskD、element正确答案:A解析:20、在一个典型的HDFS集群中,有()个DataNode。(2.0)A、至少一个B、一个C、无D、以上都错正确答案:A解析:21、,广义上来说,Hadoop指代大数据的一个(),包括很多其他的软件(2.0)A、集群B、集合C、生态圈D、都不对正确答案:C解析:22、owner是指()(2.0)A、所属用户B、所属组别C、模式D、安全正确答案:A解析:23、在一个典型的HDFS集群中,有()个NameNode(2.0)A、任意多B、没有C、零D、一正确答案:D解析:24、Lambda的数据通道分为两条分支:实时流和————。(2.0)A、离线B、在线C、远程D、网络正确答案:A解析:25、YARN分层架构的本质是()(2.0)A、ManagerB、ReduceManagerC、JavaD、Python正确答案:B解析:26、Logstash的数据处理过程主要包括:Inputs,Filters和()
三部分(2.0)A、OutputsB、postC、pullD、pots正确答案:A解析:27、Kettle是一个()工具(2.0)A、数据仓库B、软件开发C、软件评估D、大数据可视化正确答案:A解析:28、是将把不同来源、格式、特点性质的数据在逻辑上或()上有机地集中,从而为企业提供全面的数据共享。(2.0)A、物理B、架构C、仓库D、都不对正确答案:A解析:29、在实际应用中,Fluentd主要负责从()收集日志信息,并将数据流交给后续数据存储。(2.0)A、服务器B、客户端C、日志D、网络正确答案:A解析:30、噪声数据主要包含错误数据、假数据和()。(2.0)A、真数据B、异常数据C、无措数据D、大数据正确答案:B解析:31、()根据缺失值的属性相关系数最大的那个属性把数据分成几个组,然后分别计算每个组的均值,把这些均值放入到缺失的数值里面就可以了。(2.0)A、均值填补法B、删除缺失值C、有序最近邻法D、都不是正确答案:A解析:32、回归法是试图发现()相关的变量之间的变化模式,通过使数据适合一个函数来平滑数据,即通过建立数学模型来预测下一个数值,包括线性回归和非线性回归。(2.0)A、无B、两个C、一个D、都不对正确答案:B解析:33、Kettle是纯()开发,开源的etl工具(2.0)A、cB、javaC、c++D、python正确答案:B解析:34、
Fluentd是一个开源的()采集平台(2.0)A、文本数据B、采集数据C、网络数据D、日志数据正确答案:D解析:35、()与GET相比,多了以表单形式上传参数的功能,因此除了查询信息外,还可以修改信息。(2.0)A、POSTB、costC、getD、pull正确答案:A解析:36、
VoltDB是一种较典型的()(2.0)A、内存数据库B、列式数据库C、图数据库D、文档数据库正确答案:A解析:37、大数据的存储是()的前提(2.0)A、数据分析与应用B、数据采集C、数据分析D、公司使用正确答案:A解析:38、分布式系统包含多个()的处理单元,通过计算机网络互连来协作完成分配的任务,其分而治之的策略能够更好的处理大规模数据分析问题。(2.0)A、自主B、受控制C、受保护D、手安装正确答案:A解析:39、()是直接连接于主机服务器的一种储存方式,也叫作直连式存储(2.0)A、DAQB、DAXC、DAZD、DAS正确答案:D解析:40、传统数据更注重于对象的描述,而大数据更倾向与对()的记录。(2.0)A、数据预测B、数据分析C、数据存储D、数据过程正确答案:D解析:41、在线性回归技术中,因变量是()的,自变量(单个或多个)可以是连续的,也可以是离散的(2.0)A、连续B、离散C、分离D、以上都不对正确答案:A解析:42、KNN算法的核心思想是如果一个样本在特征空间中的()最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。(2.0)A、k个B、s个C、kum个D、kim个正确答案:A解析:43、数据挖掘可以应用于以下领域(2.0)A、软件开发B、医疗卫生C、金融D、以上都是正确答案:D解析:44、在统计学中,回归分析指的是确定()以上变量间相互依赖的定量关系的一种统计分析方法。(2.0)A、一种B、两种或两种C、无穷多D、以上都不对正确答案:B解析:45、遗传算法缺点是需要的()太多,编码困难,一般计算量比较大。(2.0)A、算法复杂B、参数C、计算D、步骤正确答案:B解析:46、在大数据分析中,回归分析是一种()的建模技术(2.0)A、判断性B、条件性C、稳健性D、预测性正确答案:D解析:47、聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,聚类自动寻找并建立()的方法,通过判断样本之间的相似性,把相似样本划分在一个簇中。(2.0)A、查询B、分组规则C、筛选D、判断正确答案:B解析:48、统计分析一般针对样本数据,而数据挖掘则针对()(2.0)A、网络数据B、全体数据C、一般数据D、重点数据正确答案:B解析:49、统计分析的重点是()(2.0)A、假设检验B、条件判断C、检验D、证明正确答案:A解析:50、线性回归中,因变量是()(2.0)A、连续的B、离散的C、随机的D、都不是正确答案:A解析:期末测试(2)一、单选题(共50题,100分)1、下列哪个是批处理计算()(2.0)A、HBaseB、MapReduceC、HiveD、Spark正确答案:B解析:2、model的中文含义是()(2.0)A、架构B、软件C、开发D、模型正确答案:D解析:3、工业和信息化部在()年1月正式印发了《大数据产业发展规划》,全面部署“十三五”时期大数据产业发展工作,加快建设数据强国,为实现制造强国和网络强国提供强大的产业支撑。(2.0)A、2016B、2017C、2015D、2018正确答案:B解析:4、ApacheStorm是()(2.0)A、存储架构B、流处理框架C、内存框架D、以上都不是正确答案:B解析:5、大数据一般具有哪四个特征:(2.0)A、数据量大、数据类型繁多、数据产生速度慢以及数据价值密度低B、数据量大、数据类型繁多、数据产生速度快以及数据价值密度低C、数据量大、数据类型繁多、数据产生速度快以及数据价值密度高D、数据量一般、数据类型繁多、数据产生速度快以及数据价值密度低正确答案:B解析:对大数据特征的了解6、云计算实现了通过网络提供()(2.0)A、可伸缩的、廉价的分布式计算能力B、可伸缩的、高价的分布式计算能力C、可伸缩的、廉价的集中式计算能力D、不可伸缩的、廉价的分布式计算能力正确答案:A解析:7、从研究现状上看,下面不属于云计算特点的是(
)(2.0)A、超大规模B、虚拟化C、私有化D、高可靠性正确答案:C解析:8、完全虚拟化技术又叫()虚拟化技术(2.0)A、软件B、无差别C、硬件辅助D、服务正确答案:C解析:9、将平台作为服务的云计算服务类型是(
)(2.0)A、IaaS
B、PaaSC、SaaS
D、三个选项都不是正确答案:B解析:10、与网格计算相比,不属于云计算特征的是(
)(2.0)A、资源高度共享B、适合紧耦合科学计算C、支持虚拟机D、适用于商业领域正确答案:B解析:11、Kappa架构在()的基础上进行了优化,将实时和流部分进行了合并,将数据通道以消息队列进行替代。(2.0)A、HadoopB、流式架构C、Lambda
D、都不对正确答案:C解析:12、Hadoop本质上起源于()的集群系统(2.0)A、baiduB、GoogleC、ibmD、华为正确答案:B解析:13、Lambda的数据通道分为两条分支:实时流和————。(2.0)A、离线B、在线C、远程D、网络正确答案:A解析:14、HDFS(Hadoopdistributedfilesystem)是基于流数据模式访问和处理超大文件的需求而开发的,是一个()。(2.0)A、管理系统B、计算系统C、分布式文件系统D、都对正确答案:C解析:15、YARN分层架构的本质是()(2.0)A、ManagerB、ReduceManagerC、JavaD、Python正确答案:B解析:16、在一个典型的HDFS集群中,有()个DataNode。(2.0)A、至少一个B、一个C、无D、以上都错正确答案:A解析:17、执行()命令可以显示HDFS常用命令的使用信息(2.0)A、“hadoop”B、“hadoopdfs”C、“
dfs”D、“hadoopd”正确答案:B解析:18、Common提供远程调用()(2.0)A、RPCB、计算机C、管理器D、操作者正确答案:A解析:19、MapReduce指()(2.0)A、集成计算框架B、开源式计算框架C、复杂式计算框架D、分布式计算框架正确答案:D解析:20、HadoopMapReduce主要采用Master/Slave(M/S)架构,其主要包括Client、JobTracker、TaskTracker和()四个组件。(2.0)A、TaskSchedulerB、Task
C、
SchedulerD、works正确答案:A解析:21、,广义上来说,Hadoop指代大数据的一个(),包括很多其他的软件(2.0)A、集群B、集合C、生态圈D、都不对正确答案:C解析:22、()是HDFS的大脑(2.0)A、fileB、NameNodeC、DataNodeD、无正确答案:B解析:23、Hadoop其实是由一系列的软件库组成的框架,其中HDFS负责数据的()(2.0)A、计算B、存储C、管理D、运行正确答案:B解析:24、Hadoop是()软件基金会旗下的一个开源分布式计算平台。(2.0)A、ApacheB、googleC、baiduD、以上都不是正确答案:A解析:25、HDFS的设计建立在“一次写入、()”任务的基础上。(2.0)A、多次读写B、不能读写C、多次存储D、都不对正确答案:A解析:26、在Kafka中,消息是按()组织的。(2.0)A、topicB、partitionC、ConsumerD、都不对正确答案:A解析:27、数据泛化:一个从相对低层概念到更高层概念且对()中与任务相关的大量数据进行抽象概述的一个分析过程。(2.0)A、数据库B、数据模型C、数据识别D、数据处理正确答案:A解析:28、Logstash的数据处理过程主要包括:Inputs,Filters和()
三部分(2.0)A、OutputsB、postC、pullD、pots正确答案:A解析:29、在分箱之后,需要对每个箱子中的数据进行()。(2.0)A、不处理B、平滑处理C、变换D、归约正确答案:B解析:30、Chukwa是一个构建在
()
基础上的分布式日志处理系统,它提供了一个对大数据量日志类数据采集、存储、分析和展示的全套解决方案和框架。(2.0)A、IBMB、HadoopC、HDFSD、文件正确答案:B解析:31、Kafka是由()开发的一个开源流处理平台(2.0)A、googleB、ibmC、Apache软件基金会D、sohu正确答案:C解析:32、Kettle是一个()工具(2.0)A、数据仓库B、软件开发C、软件评估D、大数据可视化正确答案:A解析:33、将数据集合分组为若干个簇,在簇外的值即为孤立点,这些孤立点就是()数据(2.0)A、噪声B、不可用C、不值得D、都不对正确答案:A解析:34、在实际应用中,Fluentd主要负责从()收集日志信息,并将数据流交给后续数据存储。(2.0)A、服务器B、客户端C、日志D、网络正确答案:A解析:35、Chukwa中的主要部件包含有Agents、Adaptors、Collectors、Map/ReduceJobs以及HICC等。其中()负责采集最原始的数据,并发送给Collectors(2.0)A、AgentsB、AdaptorsC、
Map/ReduceD、HICC正确答案:A解析:36、NoSQL数据库的三大理论基础分别是:CAP原则、BASE和()(2.0)A、最终一致性B、最终存储性C、最终表示性D、最终运行性正确答案:A解析:37、NAS是指()(2.0)A、文件存储B、块存储C、条件存储D、网络存储正确答案:A解析:38、NoSQL数据库又叫作()数据库(2.0)A、非关系B、大型C、关系D、小型正确答案:A解析:39、分布式键值系统用于存储关系简单的()数据。(2.0)A、无B、网络C、结构化D、半结构化正确答案:D解析:40、
VoltDB是一种较典型的()(2.0)A、内存数据库B、列式数据库C、图数据库D、文档数据库正确答案:A解析:41、
大数据分析最终要应用的领域之一就是()(2.0)A、预测性分析B、条件分析
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人民版道德与法治九年级上册第五课《小康家园》配套听课评课记录
- 人教新课标地理七年级上册《2.2 海陆的变迁》听课评课记录
- 湘教版地理七年级上册 第三章 第三节《世界的语言与宗教》听课评课记录
- 人教版数学八年级下册听评课记录:第20章复习课(二)
- 环评招募合伙协议书(2篇)
- 新版华东师大版八年级数学下册《16.1.1分式》听评课记录2
- 星球版地理八年级上册《第二节 众多的人口》听课评课记录1
- 五年级上册数学听评课记录《数学好玩-图形中的规律》(4)北师大版
- 苏科版数学八年级上册听评课记录《4-4近似数》
- 人教版地理七年级上册《 聚落》听课评课记录
- 中国氢内燃机行业发展环境、市场运行格局及前景研究报告-智研咨询(2024版)
- 《自然保护区划分》课件
- 2024年湖南高速铁路职业技术学院高职单招数学历年参考题库含答案解析
- 上海铁路局招聘笔试冲刺题2025
- 学校食堂餐厅管理者食堂安全考试题附答案
- 《商用车预见性巡航系统技术规范》
- 国旗班指挥刀训练动作要领
- 春季安全开学第一课
- 植物芳香油的提取 植物有效成分的提取教学课件
- 陕鼓集团招聘笔试题目
- 肖像绘画市场发展现状调查及供需格局分析预测报告
评论
0/150
提交评论