版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
云南农业大学2020-2021大数据技术及应用期末考试2020-2021大数据技术及应用期末考试,请大家诚信考试,认真作答!请认真填写考生基本信息:[矩阵文本题]*姓名:姓名:学号:专业:1、云计算分层架构不包括()。[单选题]*AA、IaasB、PaasC、SaasD、Yaas(正确答案)2、美国海军军官莫里通过对前人航海日志的分析,绘制考了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的()。[单选题]*AA、在数据基础上倾向于全体数据而不是抽样数据B、在分析方法上更注重相关分析而不是因果分析(正确答案)C、在分析效果上更追究效率而不是绝对精确D、在数据规模上强调相对数据而不是绝对数据3、下列关于聚类挖报技术的说法中,错误的是()。[单选题]*AA、不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B、要求同类数据的内容相似度尽可能小(正确答案)C、要求不同类数据的内容相仪度尽可能小D、与分类挖据技术相似的是,都是要对数据进行分类处理4、大数据的利用过程是()[单选题]*AA、果集-挖提-清洗-统计B、果集一统计-清洗一挖据C、采集-清洗一挖据-统计D、采集一清洗--统计-挖据(正确答案)5、大数据的本质是()[单选题]*AA、洞察(正确答案)B、采集C、统计D、联系6、下面哪个()程序通常与NamenodeA在ー个节点启动。[单选题]*AA、TasktrackerB、DatanodeC、Jobtracker(正确答案)D、secondarynamenode7、HDFS默认BlockSize()。[单选题]*AA、16MB、32MC、64M(正确答案)D、128M8、云计算是对()技术的发展与运用。[单选题]*AA、并行计算B、分布式计算C、网格计算D、以上都是(正确答案)9、()是用于处理海量数据的并行编程模式和大规模数据集的并行运算的软件架构。[单选题]*AA、GFSB、Mapreduce(正确答案)C、BittableD、Chubby10、在Bigtable中,()主要用来存储子表数据以及一些日志文件。[单选题]*AA、GFS(正确答案)B、MapreduceC、SstableDD、Chubby11、推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于网站最热卖商品、客户所处城市、(),推测客户将来可能的购买行为。[单选题]*AA、客户的朋友B、客户过去的购买行为和购买记录(正确答案)C、客户的兴趣爱好D、客户的个人信息12、下列关于普查的缺点的说法中,正确的是()。[单选题]*AA、工作量较大,容易导致调查内容有限、产生重复和遗漏现象(正确答案)B、误差不易被控制C、对样本的依赖性比较强D、评测结果不够稳定13、假设一种基因同时导致两件事情,一是使人喜欢抽烟,二是使这个人和肺癌就是()关系,而吸烟和肺癌则是(A)关系。[单选题]*AA、因果;相关(正确答案)B、相关;因果C、并列;相关D、因果;并列14、医疗健康数据的基本情况不包括以下哪项?()[单选题]*AA、个人健康管理数据B、诊疗数据C、公共安全数据(正确答案)D、健康档案数据15、下面哪个进程负责MapReduce任务调度。()[单选题]*AA、NameNodeB、Jobtracker(正确答案)C、TaskTrackerD、secondaryNameNode16、Hadoop1、0默认的调度器策略是哪个。()[单选题]*AA、先进先出调度器(正确答案)B、计算能力调度器C、公平调度器D、优先级调度器A、Namenode,Datanode,TaskTrackerB、Namenode,Datanode,secondaryNameNodeC、Namenode,Datanode,HMaster17、在实验集群的master节点使用A、Namenode,Datanode,TaskTrackerB、Namenode,Datanode,secondaryNameNodeC、Namenode,Datanode,HMasterDD、Namenode,JobTracker,secondaryNameNode(正确答案)18MapReducekeyvalueMapReduce不适宜的运算。()[]*AA、MaxB、MinC、CountD、Average(正确答案)19、MapReduce编程模型,键值对<key,value>的key必须实现哪个接口?()[单选题]*AA、WritableComparable(正确答案)B、ComparableC、WritableD、LongWritable20、HBase数据库的BlockCache缓存的数据块中,哪一项不一定能提高效率。()[单选题]*ROOT表B、.META.表C、HFileindexD、普通的数据块(正确答案)21、HBase是分布式列式存储系统,记录按什么集中存放。()[单选题]*AA、列族(正确答案)B、列C、行D、不确定22、HBase的Region组成中,必须要有以下哪一项。()[单选题]*AA、StoreFileB、MemStore(正确答案)C、HFileD、MetaStore23、客户端首次查询HBase数据库时,首先需要从哪个表开始查找。()[单选题]*AA、.META.ROOT-正确答案)C、用户表D、信息表24、设计分布式数据仓库hive的数据表时,为取样更高效,一般可以对表中的连续字段进行什么操作。()[单选题]*AA、分桶(正确答案)B、分区C、索引DD、分表25、MongoDB是一种NoSQL数据库,具体地说,是()存储数据库。[单选题]*AA、键值B、文档(正确答案)C、图形D、XML26、下列关于MapReduce的说法错误的是()[单选题]*AA、MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数:Map和ReduceMapReduce采用“分而治之”集,会被切分成许多独立的分片(split)Map任务并行处理C、MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销DMapReduceJava来写(正确答案)27、下面与Zookeeper类似的框架是()[单选题]*AA、ProtobufB、JavaC、KafkaD、Chubby(正确答案)28、关于Hive与Hadoop其他组件的关系,描述错误的是()。[单选题]*AA、HIVE最终将数据存储在HDFS中HiveSQLMapReduce任务CHiveHadoop平台的数据仓库工具?DHiveHBase有强依赖(正确答案)29、下面不属于Hadoop安装步骤的是()。[单选题]*AAJDKJava环境变量B、设置免密码登录CEclipse集成开发环境(正确答案)DHadoopHadoop30、根据管理数据的模式分类,NoSQL系统可以分为不包括()。[单选题]*AA、键值系统B、文档存储系统C、图数据库D、语音管理系统(正确答案)1、下面对HBase的描述哪些是正确的()。*AA、不是开源的B、是面向列的(正确答案)C、是分布式的(正确答案)DNoSQL数据库(正确答案)2、下列关于大数据的说法中,错误的是()。*AA、大数据具有体量大、结构单一、时效性强的特征(正确答案)B、处理大数据需采用新型计算架构和智能算法等新技术C、大数据的应用注重相关分析而不是因果分析D、大数据的应用注重因果分析而不是相关分析(正确答案)3、有关HDFS文件系统说法正确的是以下那些()。*AAHDFS本身是个高可用系统架构(正确答案)HDFSNameNode、DataNode架构CHDFS数据副本的数量越大越好DHDFSNameNode分主备,主备不同时对外服(正确答案)4、大数据应用于各行业,下面关于大数据的说法正确的是()。*AA、美国的Target百货上线了一套客户分析工具,对顾客的购买记录进行分析,比女孩的父亲更加早知道女孩怀孕(正确答案)30000知道哪些早产儿出现问题并且有针对性进采取措施(正确答案)C、ExpressScripts通过一些复杂模型来检测虚假药品,及时提醒人们何时应该停止用药(正确答案)D、三者皆不是5、IBM公司用3个V来描述大数据的三个基本特征,这3V是()。*AA、体量(正确答案)B、规模C、速度(正确答案)DD、多样性(正确答案)E、复杂性6、MapReduce基于Google发布的MapReduce论文设计开发,其具有如下哪些特点()。*AA、易于编程(正确答案)B、高速度C、良好的扩展性(正确答案)D、高容错性(正确答案)7、MapReduce与HBase的关系,哪些描述是正确的()。*AAMapReduceHBase可以正常运行的保证MapReduce,HBase可以正常运行(正确答案)CMapReduceHBase(正确答案)D、它们之间没有任何关系8、下面对HBase的描述哪些是正确的()。*AA、不是开源的B、是面向列的(正确答案)C、是分布式的(正确答案)DNoSQL数据库(正确答案)9、有关HDFS文件系统说法正确的是以下那些()。*AAHDFS本身是个高可用系统架构(正确答案)HDFSNameNode、DataNode架构CHDFS数据副本的数量越大越好DHDFSNameNode分主备,主备不同时对外服(正确答案)10、下面哪些概念是HBase框架中使用的()。*AA、HDFS(正确答案)B、GridFSC、Zookeeper(正确答案)D、EXT311、NoSQL数据库得以存在的三大理论基石是()。*AA、原子性CAP理论(正确答案)CBASE原理(正确答案)D、最终一致性(正确答案)12、在高阶数据处理中,往往无法把整个流程写在单个MapReduce作业中,下列关于链接MapReduce作业的说法,正确的是()。*AAJob和JobControl类可以管理非线性作业之间的依赖(正确答案)B、ChainMapper和ChainReducer类可以用来简化数据预处理和后处理的构成(正确答案)CChainReducermapperreducerJobConf(正确答案)DD、ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能好且安全性高13、NoSQL数据库的分类主要有()。*AA、键值(Key-Value)存储数据库(正确答案)B、列存储数据库(正确答案)C、文档型数据库(正确答案)D、图形(Graph)数据库(正确答案)14、关于大数据的理念的描述,以下哪些不正确()。*AA、相关性比因果更重要B、要效率也要绝对精准(正确答案)C、大数据的核心价值是预测D、遵从隐私和法律并非大数据的风险(正确答案)15、健值数据库的相关产品主要包括()。*AA、Redis(正确答案)B、SimpleDB(正确答案)C、Memcached(正确答案)D、Chordless(正确答案)1、人们关心大数据,最终是关心大数据的应用,关心如何从业务和应用出发让大数据真正实现其所蕴含的价值,从而为人们生产生活带来有益的改变。[判断题]*对对(正确答案)错错2、Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。[判断题]*对对(正确答案)错3、Hadoop自身具有严格的权限管理和安全措施保障集群正常运行。[判断题]*对对错(正确答案)4、HBase对于空/
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度远程英语教育兼职外教合同3篇
- 二零二五年酒店员工福利待遇转让合同示例3篇
- 二零二五版寄卖合同范本:农产品寄售协议书3篇
- 二零二五版植物营养肥料试验与研究服务合同3篇
- 二零二五年度酒类批发市场租赁销售合同2篇
- 二零二五年度耕地承包与农村土地承包权登记发证合同2篇
- 二零二五年度红色文化遗址保护与修复合同3篇
- 二零二五版趸购电合同:电力批发市场交易合同2篇
- 二零二五版高端社区地下车库经营权转让合同3篇
- 二零二五年度智能化办公大楼安全防范系统合同2篇
- 【传媒大学】2024年新营销
- 乳腺癌的综合治疗及进展
- 【大学课件】基于BGP协议的IP黑名单分发系统
- 2025届广东省佛山市高三上学期普通高中教学质量检测(一模)英语试卷(无答案)
- 自身免疫性脑炎课件
- 人力资源管理各岗位工作职责
- 信阳农林学院《新媒体传播学》2023-2024学年第一学期期末试卷
- 2024建筑公司年终工作总结(32篇)
- 信息安全意识培训课件
- 2024年项目投资计划书(三篇)
- 配电安规课件
评论
0/150
提交评论