在线网课知慧《云计算与大数据技术(北京联大)》单元测试考核答案_第1页
在线网课知慧《云计算与大数据技术(北京联大)》单元测试考核答案_第2页
在线网课知慧《云计算与大数据技术(北京联大)》单元测试考核答案_第3页
在线网课知慧《云计算与大数据技术(北京联大)》单元测试考核答案_第4页
在线网课知慧《云计算与大数据技术(北京联大)》单元测试考核答案_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论1.【多选题】正确答案:ABCD下列哪些应用属于大数据技术的应用()。A.手机银行或网上银行在用户画像基础上,对用户群进行定位,挖掘潜在金融服务需求。B.音视频网站上通过分析注册用户的浏览习惯,为用户推送感兴趣的音视频。C.电商网站上对注册用户浏览信息记录、分析、挖掘,为用户推送感兴趣的商品。D.政务领域中的智慧城市建设,如智慧交通、智慧医疗、智慧教育等。2【判断题】日常我们用到的云服务器、钉钉办公软件、百度网盘等应用都是云计算服务厂商提供的云计算服务。()A.对B.错第一章单元测试1.【多选题】正确答案:ABC云计算的服务模式包括()。A.基础设施即服务B.平台即服务C.软件即服务D.系统即服务2.【多选题】(3分)正确答案:ABC云计算的劣势有()。A.风险被集中B.数据泄密的环节增多C.严重依赖网络D.信息技术产业进一步合理分工3.【多选题】(3分)正确答案:ABC云计算部署模型有()。A.私有云B.混合云C.公有云D.PaaS云4【判断题】云计算是把有形的产品(网络设备、服务器、存储设备、各种软件等)转化为服务产品(IaaS,PaaS,SaaS),并通过网络让人们远程在线使用。()A.错B.对5【判断题】云计算是一种计算模式,能够提供随时随地、便捷的、随需应变的网络接入,访问可配置的计算资源共享池。()A.错B.对第二章单元测试1【单选题】(2分)虚拟化技术主要用于云计算物理资源的池化,物理资源不包括()。A.操作系统B.服务器C.网络D.存储2.【多选题】(3分)正确答案:ABCD虚拟技术特性有()。A.分区B.相对于硬件独立C.隔离D.封装3.【多选题】(3分)正确答案:ABCD虚拟化的益处包括()。A.通过系统自愈功能提升可靠性B.实现动态负载均衡C.实现资源最优利用D.实现节能减排4.【多选题】(3分)正确答案:CD个人PC上使用比较多的虚拟化工具有()。A.XenB.KVMC.VMwareWorkstationD.VirtualBox5【判断题】虚拟化是一项技术,而云是一种环境或服务。()A.对B.错6【判断题】虚拟化的主要功能是把单个资源抽象成多个给用户使用,而云计算则是帮助不同部门或公司访问一个自动置备的资源池。()A.对B.错第三章单元测试1.【多选题】(3分)正确答案:ABD开放系统的存储类型分为内置存储和外挂存储,其中外挂存储可分为()。A.直连式存储(DAS)B.网络接入存储(NAS)C.移动存储D.存储区域网络(SAN)2.【多选题】(3分)正确答案:AD根据实现方式,可将存储虚拟化分为()。A.带外虚拟化B.块虚拟化C.文件虚拟化D.带内虚拟化3.【多选题】(3分)正确答案:BCD根据存储虚拟化实现的位置,可将存储虚拟化分为()。A.磁带或磁带库虚拟化B.基于主机的虚拟化C.基于存储设备的虚拟化D.基于网络的虚拟化4【判断题】Ceph计算模式是一种完全无中心架构()A.错B.对5【判断题】存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理,无需中断应用即可改变存储系统和数据迁移。()A.错B.对第四章单元测试1.【多选题】(3分)正确答案:ABCD软件定义网络(SDN)特点()。A.控制器软件可编程B.控制转发分离C.控制平面集中化D.转发平面通用化2.【多选题】(3分)正确答案:CDOpenFlow组件包括()。A.控制平面B.数据转发平面C.OpenFlow控制器D.OpenFlow交换机3.【多选题】(3分)正确答案:ABD根据OverLay的载体不同,VXLAN的OverLay分为()3种。A.网络OverLayB.主机OverLayC.虚实OverLayD.混合OverLay4【判断题】软件定义网络(SDN)将网络管理与底层网络基础设施分离开来,允许管理员动态调整整个网络的流量,以满足不断变化的需求。()A.对B.错5【判断题】网络虚拟化是一种网络技术,可以在物理拓扑上创建虚拟网络。基于SDN的网络架构可以更容易地实现网络虚拟化。()A.错B.对第五章单元测试1.【多选题】(3分)正确答案:ABCD虚拟化平台软件有哪些()。A.xenServerB.EsxiC.Hyper-VD.KVM2.【多选题】(3分)正确答案:CDE下列描述中正确的有()。A.,它们的设计方式使数万个服务器像一个服务器一样运行。B.是指大型机。C.集群中每个节点都运行自己的操作系统,节点之间使用网络协议进行通信。D.最大规模的集群称为仓库级计算机(WSE.集群是指一组桌面计算机或服务器通过局域网连接在一起,运转方式类似于一个更大型的计算机。F.仓库级计算机(WS3.【多选题】(3分)正确答案:AC以下属于PaaS管理工具的有()。A.CloudFoundry社区的CloudFoundryB.KVMC.红帽公司的OpenShiftD.Hyper-V4【判断题】IaaS云计算解决方案中,虚拟化平台(硬件资源、虚拟软件)主要解决如何运行虚拟机的问题。()A.对B.错5【判断题】SaaS云管理工具与业务关联性大,目前没有统一的标准版产品。()A.对B.错6【判断题】一般地,SaaS云管理软件包含两大部分:一是SaaS业务门户,二是SaaS管理门户。()A.错B.对第六章单元测试1.【多选题】(3分)正确答案:ABCD大数据4V特点是()。A.Variety(数据类型多)B.Velocity(处理速度快)C.Value(价值密度低)D.Volume(体量大)2.【多选题】(3分)正确答案:AC大数据的定义是()。A.任何超过了一台计算机处理能力的数据量B.超过个人PC机或笔记本硬盘存储容量的数据C.指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合D.具有很大价值的数据3【单选题】(2分)在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该着重于()为其行为承担责任。A.数据使用者B.数据分析者C.个人许可D.数据提供者4.【多选题】(3分)正确答案:ABCD大数据的处理流程涉及()。A.数据导入/预处理B.数据采集C.统计/分析D.数据挖掘与预测5.【多选题】(3分)正确答案:BC大数据的科学价值和社会价值正是体现在()。A.大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用B.对大数据的掌握程度可以转化为经济价值来源C.大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域D.大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新性的用途。6【判断题】通用的大数据分析系统的核心设计理念包括并行化、规模经济、虚拟化。()A.错B.对7【判断题】大数据框架技术中消息系统技术有:Kafka、StormMQ、ZeroMQ、RabbitMQ。()A.错B.对8【判断题】HadoopMapReduce、Spark属于离线计算框架技术。()A.错B.对第七章单元测试1.【多选题】(3分)正确答案:ABCHadoop2.0和Hadoop3.0区别包括()。A.Hadoop3.0的HDFS支持纠删码B.Hadoop3.0支持多于2个以上的NameNodesC.Hadoop3.0的Java运行环境升级为1.8D.Hadoop3.0新增了YARN框架2.【多选题】(3分)正确答案:ABCHadoop1.0和Hadoop2.0区别包括()。A.Hadoop2.0新增了YARN框架B.Hadoop2.0新增了HDFSfederationC.Hadoop2.0新增了HDFSHA机制D.Hadoop2.0的MapReduce本地优化,性能提升了30%3【判断题】Hadoop2.0版本加入了通用YARN资源管理器,用以协调各个组件对系统资源的利用,合理分配集群CPU、内存资源。()A.对B.错4【判断题】Hadoop2.0版本中,MapReduce2.0只是一个计算框架,具体资源调度全部交给Yarn框架。()A.对B.错5【判断题】Hadoop3.0版本中HDFS支持纠删码,纠删码相比于副本机制节省了一半以上的存储空间,普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。()A.对B.错第八章单元测试1.【多选题】(3分)正确答案:ABCD以下说法正确的是()。A.HDFS为大量用户提供性能不错的文件存取服务B.HDFS是一易于扩展的分布式文件系统C.HDFS运行在大量普通廉价机器上,提供容错机制D.HDFS源自于Google的GFS论文2.【多选题】(3分)正确答案:ABCDHDFS不适合的场景()。A.进行文件随机修改。B.对延迟要求较高的场景。C.支持多用户写入。D.存储小文件。3【判断题】传统的NFS不是一种典型的分布式系统,虽然它的文件的确放在远端(单一)的服务器上面。()A.错B.对4【判断题】HDFS文件被切分成固定大小的数据块,为实现高吞吐率,默认数据块大小为128MB。()A.对B.错5【判断题】HDFS文件不仅支持追加,还支持文件任意offset的修改。()A.对B.错6【判断题】HDFS不支持多用户写入,也无法进行文件随机修改。仅支持以append的方式,即通过追加的方式添加到文件结尾处。()A.对B.错第九章单元测试1.【多选题】(3分)正确答案:ABCD下列关于YARN描述正确的有()。A.YARN是一个通用资源管理系统和调度平台。B.YARN为上层应用提供统一的资源管理和调度。C.YARN只提供运算资源的调度。D.YARN与运行的用户程序完全解耦。2.【多选题】(3分)正确答案:ABC下列基于Yarn的计算框架描述正确是()。A.Storm是Twitter开源的分布式实时大数据处理框架。B.MapReduce是一种离线数据计算框架。C.Spark是基于内存计算的大数据并行计算框架。D.Flink是一种离线的数据计算框架。3.【多选题】(3分)正确答案:AD字节跳动公司产品对YARN的定制应用描述正确是()。A.YARN主要承载着字节跳动公司内的离线作、流式作业、模型训练三大场景。B.将HDFS做成强依赖。C.实现YARN支持单集群使用。D.公司的抖音、今日头条等产品重度依赖推荐,团队对调度器进行了深度定制。4【判断题】MapReduce、Storm、Spark、Tez等计算框架都可以整合在YARN上运行,只要他们各自的框架中有符合YARN规范的资源请求机制即可。()A.错B.对5【判断题】YARN基于ZooKeeper实现HA,主提供服务,备同步主的信息。主挂掉,备立即做切换接替主进行服务。()A.错B.对6【判断题】Mesos是一个开源的资源管理系统,可以对集群中的资源做弹性管理,目前twitter,apple等公司在大量使用Mesos管理集群资源。()A.对B.错7【判断题】YARN采用双层调度框架,ResourceManager将资源分配给AppMaster,AppMaster将资源进一步分配给各个Task。()A.错B.对8【判断题】Mesos组件中FrameworkScheduler组件是实现单个应用程序的管理和资源二次调度。()A.错B.对9【判断题】Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。()A.对B.错10【判断题】YARN天生是为批处理而设计的,很多地方与流式或模型训练场景并不匹配,为了给批处理、流式、模型训练三大场景更好的体验,字节跳动对YARN做一些定制工作。()A.对B.错第十章单元测试1.【多选题】(3分)正确答案:ABCD常用大数据采集途径有()。A.APP移动端数据采集。B.互联网数据采集。C.数据服务机构。D.智能感知设备。2.【多选题】(3分)正确答案:ABCD下列关于Flume架构描述正确的有()。A.Source将数据封装到事件(event)里,然后将事件推入Channel中。B.Source是数据的收集端,负责将数据捕获后进行特殊的格式化。C.Sink负责持久化日志或者把事件推向另一个Source。D.Channel是连接Source和Sink的组件,它将保存事件直到Sink处理完该事件。3.【多选题】(3分)正确答案:BCD下列关于数据迁移工具Sqoop描述正确的有()。A.Sqoop工具只能用于非关系型数据库之间迁移。B.Sqoop工作机制是将导入或导出命令翻译成MapReduce程序来实现。C.Sqoop是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。D.Sqoop工具本质就是迁移数据。4.【多选题】(3分)正确答案:ABC下列关于Kafka描述正确的有()。A.Kafka可以用于web/nginx日志、访问日志采集,也可用于消息服务等等。B.Kafka是一基于zookeeper协调的分布式日志系统。C.Kafka是一个分布式、分区的、多副本的、多订阅者日志系统。D.Kafka可以用于迁移数据。5【判断题】各行业海量的数据中,大约20%左右属于结构化的数据,80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化数据。()A.对B.错6【判断题】大数据的处理流程的第一步就是大数据的采集与预处理。()A.对B.错7【判断题】发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic,消费者可以消费该topic中所有的数据,同一条数据可以被多个消费者消费。()A.错B.对第十一章单元测试1.【多选题】(3分)正确答案:ABCD下列关于MapReduce2.0架构描述正确的有()。A.MapReduce2.0架构中的ResourceManager是基于应用程序对资源的需求进行调度的资源调度器。B.MapReduce2.0将JobTracker两个主要的功能资源管理和任务调度/监控分离成单独的组件。C.MapReduce2.0架构包括ResourceManager、NodeManager、ApplicationMaster、Container组件。D.MapReduce2.0架构中的NodeManager是执行应用程序的容器,监控应用程序的资源使用情况并且向调度器汇报。2【判断题】MapReduce计算框架具有数据本地性特性,本地性可避免跨节点或机架数据传输,提高运行效率。()A.错B.对3【单选题】(3分)下列适合MapReduce应用场景的是()。A.离线批处理。B.DAG计算。C.实时计算。D.流式计算。4【判断题】MapReduce2.0将JobTracker两个主要的功能资源管理和任务调度/监控分离成单独的组件。()A.对B.错5【判断题】如果任务运行在它将处理的数据所在的节点,则称该任务具有“数据本地性”。()A.对B.错第十二章单元测试1.【多选题】(3分)正确答案:BCD下列关于Spark使用场景描述正确的有()。A.将数据缓存在内存中,中间的计算结果写入到磁盘的离线数据计算框架。B.基于实时数据流的数据处理,时间在数百毫秒到数秒之间。C.复杂的海量数据批量处理,时间在数十分钟到数小时之间。D.基于历史数据的交互式查询,时间在数十秒到数十分钟之间。2.【多选题】(3分)正确答案:ABC下列关于SparkGraphX图计算描述正确的有()。A.图上的计算任务分成图并行计算和数据并行计算两种。B.图并行计算任务是指那些迭代计算任务,如PageRank。C.数据并行计算任务是指图上代数运算,如构建一个图、合并两个图、跨越多个图等。D.将SparkSQL转换成RDD,然后提交到集群执行。3.【多选题】(3分)正确答案:ABCDSpark运行架构包括()。A.运行作业任务的工作节点(WorkerNode)。B.集群资源管理器(ClusterManager)。C.每个应用的任务控制节点(Driver)。D.每个工作节点上负责具体任务的执行进程(Executor)。4【判断题】Spark可运行于独立的集群模式中,或者运行于Hadoop中,也可运行于AmazonEC2等云环境中,并且可以访问HDFS、Cassandra、HBase、Hive等多种数据源。()A.错B.对5【判断题】Spark支持使用Scala、Java、Python和R语言进行编程。()A.对B.错6【判断题】Spark运行在YARN上要比运行在Mesos上更加灵活和自然,Spark官方推荐采用这种模式。()A.对B.错7【判断题】在RDD的计算过程中,不需立刻去存储计算出的数据本身,只要记录每个RDD是经过哪些转化操作得来的。()A.错B.对第十三章单元测试1.【多选题】(3分)正确答案:ABCD下列对Storm集群结构描述正确的是()。A.Worker节点运行名为“Supervisor”的后台程序负责监听分配给它所在机器的工作。B.Supervisor负责接受Nimbus分配的任务,管理属于自己的Worker进程。C.Zookeeper负责Nimbus和多个Supervisor之间的所有协调工作。D.Nimbus负责在集群范围内分发代码、为Worker分配任务和监测故障。2.【多选题】(3分)正确答案:ABCD下列Storm工作流程描述正确的是()。A.Nimbus节点将Task和Supervisor相关的信息提交到Zookeeper集群上。B.Supervisor去Zookeeper集群上认领自己的Task,通知自己的Worker进程进行Task的处理。C.Client节点提交Topology任务。D.Nimbus节点将提交的Topology进行分片,分成一个个Task,分配给相应的Supervisor。3【判断题】Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop。()A.对B.错4【判断题】Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。()A.对B.错5【判断题】Storm将Spouts和Bolts组成的网络抽象成topology(类似Job),它可以被提交到Storm集群执行。()A.错B.对第十四章单元测试1.【多选题】(3分)正确答案:ABCD下列关于Hbase描述正确的是()。A.主要用来存储非结构化和半结构化的松散数据。B.HBase是一个开源的非关系型分布式数据库。C.运行于HDFS文件系统之上。D.是Google的BigTable的开源实现。2.【多选题】(3分)正确答案:ABD下列哪些数据库产品是NoSQL数据库()。A.MongoDB。B.Cassandra。C.MySQL。D.Redis。3【判断题】若要在HBase上使用SQL,则需要联合使用ApachePhonenix,或者联合使用Hive和HBase。()A.错B.对4【判断题】HBase存储模式是基于列存储的,每个columnfamily存储在HDFS上的一个单独文件中。()A.对B.错5【判断题】在当今云计算、大数据盛行的时代,关系型数据库性能遇到瓶颈,瓶颈的源头一般是在磁盘的I/O上。()A.对B.错6【判断题】NoSQL数据库同时具备了高性能、可扩展性强、高可用等优点。()A.对B.错第十五章单元测试1.【多选题】(3分)正确答案:ABC下列关于数据仓库工具Hive架构描述正确的是()。A.Hive的数据存储在HDFS中,大部分的HQL查询请求、Hive内部自动转换为MapReduce任务执行。B.Hive将元数据存储在关系型数据库中,有三种模式可连接到数据库。C.Hive用户接口主要有三个:CLI,JDBC/ODBC和WebUI,最常用的是CLI。D.Driver组件主要完成HQL查询语句的词法分析、语法分析、编译、优化以及查询

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论