云计算与大数据技术知到章节答案智慧树2023年北京联合大学

上传人：题*** IP属地：浙江上传时间：2023-05-07 格式：DOCX 页数：14 大小：18.32KB 积分：6 举报 版权申诉

已阅读5页，还剩9页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

云计算与大数据技术知到章节测试答案智慧树2023年最新北京联合大学绪论单元测试下列哪些应用属于大数据技术的应用（）。

参考答案:

音视频网站上通过分析注册用户的浏览习惯，为用户推送感兴趣的音视频。;手机银行或网上银行在用户画像基础上，对用户群进行定位，挖掘潜在金融服务需求。;政务领域中的智慧城市建设，如智慧交通、智慧医疗、智慧教育等。;电商网站上对注册用户浏览信息记录、分析、挖掘，为用户推送感兴趣的商品。日常我们用到的云服务器、钉钉办公软件、百度网盘等应用都是云计算服务厂商提供的云计算服务。（）

参考答案:

对第一章测试云计算的服务模式包括（）。

参考答案:

平台即服务;软件即服务;基础设施即服务云计算的劣势有（）。

参考答案:

风险被集中;数据泄密的环节增多;严重依赖网络云计算部署模型有（）。

参考答案:

公有云;私有云;混合云云计算是把有形的产品（网络设备、服务器、存储设备、各种软件等）转化为服务产品（IaaS，PaaS，SaaS），并通过网络让人们远程在线使用。（）

参考答案:

对云计算是一种计算模式，能够提供随时随地、便捷的、随需应变的网络接入，访问可配置的计算资源共享池。（）

参考答案:

对第二章测试虚拟化技术主要用于云计算物理资源的池化，物理资源不包括（）。

参考答案:

操作系统虚拟技术特性有（）。

参考答案:

隔离;封装;分区;相对于硬件独立虚拟化的益处包括（）。

参考答案:

实现节能减排;实现动态负载均衡;实现资源最优利用;通过系统自愈功能提升可靠性个人PC上使用比较多的虚拟化工具有（）。

参考答案:

VirtualBox;VMwareWorkstation虚拟化是一项技术，而云是一种环境或服务。（）

参考答案:

对虚拟化的主要功能是把单个资源抽象成多个给用户使用，而云计算则是帮助不同部门或公司访问一个自动置备的资源池。（）

参考答案:

对第三章测试开放系统的存储类型分为内置存储和外挂存储，其中外挂存储可分为（）。

参考答案:

存储区域网络（SAN）;直连式存储（DAS）;网络接入存储（NAS）根据实现方式，可将存储虚拟化分为（）。

参考答案:

带内虚拟化;带外虚拟化根据存储虚拟化实现的位置，可将存储虚拟化分为（）。

参考答案:

基于存储设备的虚拟化;基于主机的虚拟化;基于网络的虚拟化Ceph计算模式是一种完全无中心架构（）

参考答案:

对存储虚拟化是指将存储资源集中到一个大容量的资源池并实行单点统一管理，无需中断应用即可改变存储系统和数据迁移。（）

参考答案:

对第四章测试软件定义网络（SDN）特点（）。

参考答案:

控制平面集中化;转发平面通用化;控制器软件可编程;控制转发分离OpenFlow组件包括（）。

参考答案:

OpenFlow交换机;OpenFlow控制器根据OverLay的载体不同，VXLAN的OverLay分为（）3种。

参考答案:

混合OverLay;主机OverLay;网络OverLay软件定义网络(SDN)将网络管理与底层网络基础设施分离开来，允许管理员动态调整整个网络的流量，以满足不断变化的需求。（）

参考答案:

对网络虚拟化是一种网络技术，可以在物理拓扑上创建虚拟网络。基于SDN的网络架构可以更容易地实现网络虚拟化。（）

参考答案:

对第五章测试虚拟化平台软件有哪些（）。

参考答案:

KVM;xenServer;Esxi;Hyper-V下列描述中正确的有（）。

参考答案:

最大规模的集群称为仓库级计算机（WSC），它们的设计方式使数万个服务器像一个服务器一样运行。;集群中每个节点都运行自己的操作系统，节点之间使用网络协议进行通信。;集群是指一组桌面计算机或服务器通过局域网连接在一起，运转方式类似于一个更大型的计算机。以下属于PaaS管理工具的有（）。

参考答案:

红帽公司的OpenShift;CloudFoundry社区的CloudFoundryIaaS云计算解决方案中，虚拟化平台（硬件资源、虚拟软件）主要解决如何运行虚拟机的问题。（）

参考答案:

对SaaS云管理工具与业务关联性大，目前没有统一的标准版产品。（）

参考答案:

对一般地，SaaS云管理软件包含两大部分：一是SaaS业务门户，二是SaaS管理门户。（）

参考答案:

对第六章测试大数据4V特点是（）。

参考答案:

Volume（体量大）;Velocity（处理速度快）;Value（价值密度低）;Variety（数据类型多）大数据的定义是（）。

参考答案:

任何超过了一台计算机处理能力的数据量;指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合在大数据时代，我们需要设立一个不一样的隐私保护模式，这个模式应该着重于（）为其行为承担责任。

参考答案:

数据使用者大数据的处理流程涉及（）。

参考答案:

数据采集;数据挖掘与预测;数据导入/预处理;统计/分析大数据的科学价值和社会价值正是体现在（）。

参考答案:

大数据已经撼动了世界的方方面面，从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域;对大数据的掌握程度可以转化为经济价值来源通用的大数据分析系统的核心设计理念包括并行化、规模经济、虚拟化。（）

参考答案:

对大数据框架技术中消息系统技术有：Kafka、StormMQ、ZeroMQ、RabbitMQ。（）

参考答案:

对HadoopMapReduce、Spark属于离线计算框架技术。（）

参考答案:

对第七章测试Hadoop2.0和Hadoop3.0区别包括（）。

参考答案:

Hadoop3.0的Java运行环境升级为1.8;Hadoop3.0的HDFS支持纠删码;Hadoop3.0支持多于2个以上的NameNodesHadoop1.0和Hadoop2.0区别包括（）。

参考答案:

Hadoop2.0新增了HDFSfederation;Hadoop2.0新增了YARN框架;Hadoop2.0新增了HDFSHA机制Hadoop2.0版本加入了通用YARN资源管理器，用以协调各个组件对系统资源的利用，合理分配集群CPU、内存资源。（）

参考答案:

对Hadoop2.0版本中，MapReduce2.0只是一个计算框架，具体资源调度全部交给Yarn框架。（）

参考答案:

对Hadoop3.0版本中HDFS支持纠删码，纠删码相比于副本机制节省了一半以上的存储空间，普通副本机制需要3倍存储空间而这种机制只需1.4倍即可。（）

参考答案:

对第八章测试以下说法正确的是（）。

参考答案:

HDFS运行在大量普通廉价机器上，提供容错机制;HDFS源自于Google的GFS论文;HDFS是一易于扩展的分布式文件系统;HDFS为大量用户提供性能不错的文件存取服务HDFS不适合的场景（）。

参考答案:

进行文件随机修改。;对延迟要求较高的场景。;存储小文件。;支持多用户写入。传统的NFS不是一种典型的分布式系统，虽然它的文件的确放在远端（单一）的服务器上面。（）

参考答案:

对HDFS文件被切分成固定大小的数据块，为实现高吞吐率，默认数据块大小为128MB。（）

参考答案:

对HDFS文件不仅支持追加，还支持文件任意offset的修改。（）

参考答案:

错HDFS不支持多用户写入，也无法进行文件随机修改。仅支持以append的方式，即通过追加的方式添加到文件结尾处。（）

参考答案:

对第九章测试下列关于YARN描述正确的有（）。

参考答案:

YARN为上层应用提供统一的资源管理和调度。;YARN与运行的用户程序完全解耦。;YARN是一个通用资源管理系统和调度平台。;YARN只提供运算资源的调度。下列基于Yarn的计算框架描述正确是（）。

参考答案:

MapReduce是一种离线数据计算框架。;Storm是Twitter开源的分布式实时大数据处理框架。;Spark是基于内存计算的大数据并行计算框架。字节跳动公司产品对YARN的定制应用描述正确是（）。

参考答案:

公司的抖音、今日头条等产品重度依赖推荐，团队对调度器进行了深度定制。;YARN主要承载着字节跳动公司内的离线作、流式作业、模型训练三大场景。MapReduce、Storm、Spark、Tez等计算框架都可以整合在YARN上运行，只要他们各自的框架中有符合YARN规范的资源请求机制即可。（）

参考答案:

对YARN基于ZooKeeper实现HA，主提供服务，备同步主的信息。主挂掉，备立即做切换接替主进行服务。（）

参考答案:

对Mesos是一个开源的资源管理系统，可以对集群中的资源做弹性管理，目前twitter,apple等公司在大量使用Mesos管理集群资源。（）

参考答案:

对YARN采用双层调度框架，ResourceManager将资源分配给AppMaster，AppMaster将资源进一步分配给各个Task。（）

参考答案:

对Mesos组件中FrameworkScheduler组件是实现单个应用程序的管理和资源二次调度。（）

参考答案:

对Spark是一种包含流处理能力的下一代批处理框架。主要应用在广告、报表、推荐系统等业务上。（）

参考答案:

对YARN天生是为批处理而设计的，很多地方与流式或模型训练场景并不匹配，为了给批处理、流式、模型训练三大场景更好的体验，字节跳动对YARN做一些定制工作。（）

参考答案:

对第十章测试常用大数据采集途径有（）。

参考答案:

智能感知设备。;数据服务机构。;互联网数据采集。;APP移动端数据采集。下列关于Flume架构描述正确的有（）。

参考答案:

Source是数据的收集端，负责将数据捕获后进行特殊的格式化。;Source将数据封装到事件（event）里，然后将事件推入Channel中。;Channel是连接Source和Sink的组件，它将保存事件直到Sink处理完该事件。;Sink负责持久化日志或者把事件推向另一个Source。下列关于数据迁移工具Sqoop描述正确的有（）。

参考答案:

Sqoop工具本质就是迁移数据。;Sqoop工作机制是将导入或导出命令翻译成MapReduce程序来实现。;Sqoop是一款用于在Hadoop和关系数据库服务器之间传输数据的工具。下列关于Kafka描述正确的有（）。

参考答案:

Kafka是一个分布式、分区的、多副本的、多订阅者日志系统。;Kafka可以用于web/nginx日志、访问日志采集，也可用于消息服务等等。;Kafka是一基于zookeeper协调的分布式日志系统。各行业海量的数据中，大约20%左右属于结构化的数据，80%的数据属于广泛存在于社交网络、物联网、电子商务等领域的非结构化数据。（）

参考答案:

对大数据的处理流程的第一步就是大数据的采集与预处理。（）

参考答案:

对发布-订阅消息传递模式是将消息持久化到一个topic中。消费者可以订阅一个或多个topic，消费者可以消费该topic中所有的数据，同一条数据可以被多个消费者消费。（）

参考答案:

对第十一章测试下列关于MapReduce2.0架构描述正确的有（）。

参考答案:

MapReduce2.0架构包括ResourceManager、NodeManager、ApplicationMaster、Container组件。;MapReduce2.0架构中的NodeManager是执行应用程序的容器，监控应用程序的资源使用情况并且向调度器汇报。;MapReduce2.0架构中的ResourceManager是基于应用程序对资源的需求进行调度的资源调度器。;MapReduce2.0将JobTracker两个主要的功能资源管理和任务调度/监控分离成单独的组件。MapReduce计算框架具有数据本地性特性，本地性可避免跨节点或机架数据传输，提高运行效率。（）

参考答案:

对下列适合MapReduce应用场景的是（）。

参考答案:

离线批处理。MapReduce2.0将JobTracker两个主要的功能资源管理和任务调度/监控分离成单独的组件。（）

参考答案:

对如果任务运行在它将处理的数据所在的节点，则称该任务具有“数据本地性”。（）

参考答案:

对第十二章测试下列关于Spark使用场景描述正确的有（）。

参考答案:

基于历史数据的交互式查询，时间在数十秒到数十分钟之间。;基于实时数据流的数据处理，时间在数百毫秒到数秒之间。;复杂的海量数据批量处理，时间在数十分钟到数小时之间。下列关于SparkGraphX图计算描述正确的有（）。

参考答案:

图上的计算任务分成图并行计算和数据并行计算两种。;图并行计算任务是指那些迭代计算任务，如PageRank。;数据并行计算任务是指图上代数运算，如构建一个图、合并两个图、跨越多个图等。Spark运行架构包括（）。

参考答案:

集群资源管理器（ClusterManager）。;运行作业任务的工作节点（WorkerNode）。;每个应用的任务控制节点（Driver）。;每个工作节点上负责具体任务的执行进程（Executor）。Spark可运行于独立的集群模式中，或者运行于Hadoop中，也可运行于AmazonEC2等云环境中，并且可以访问HDFS、Cassandra、HBase、Hive等多种数据源。（）

参考答案:

对Spark支持使用Scala、Java、Python和R语言进行编程。（）

参考答案:

对Spark运行在YARN上要比运行在Mesos上更加灵活和自然，Spark官方推荐采用这种模式。（）

参考答案:

错在RDD的计算过程中，不需立刻去存储计算出的数据本身，只要记录每个RDD是经过哪些转化操作得来的。（）

参考答案:

对第十三章测试下列对Storm集群结构描述正确的是（）。

参考答案:

Worker节点运行名为“Supervisor”的后台程序负责监听分配给它所在机器的工作。;Supervisor负责接受Nimbus分配的任务，管理属于自己的Worker进程。;Zookeeper负责Nimbus和多个Supervisor之间的所有协调工作。;Nimbus负责在集群范围内分发代码、为Worker分配任务和监测故障。下列Storm工作流程描述正确的是（）。

参考答案:

Nimbus节点将提交的Topology进行分片，分成一个个Task，分配给相应的Supervisor。;Supervisor去Zookeeper集群上认领自己的Task，通知自己的Worker进程进行Task的处理。;Client节点提交Topology任务。;Nimbus节点将Task和Supervisor相关的信息提交到Zookeeper集群上。Storm是Twitter开源的分布式实时大数据处理框架，被业界称为实时版Hadoop。（）

参考答案:

对Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。（）

参考答案:

对Storm将Spouts和Bolts组成的网络抽象成topology（类似Job），它可以被提交到Storm集群执行。（）

参考答案:

对第十四章测试下列关于Hbase描述正确的是（）。

参考答案:

运行于HDFS文件系统之上。;主要用来存储非结构化和半结构化的松散数据。;HBase是一个开源的非关系型分布式数据库。;是Google的BigTable的开源实现。下列哪些数据库产品是NoSQL数据库（）。

参考答案:

MongoDB。;Cassandra。;Redis。若要在HBase上使用SQL，则需要联合使用ApachePhonenix，或者联合使用Hive和HBase。（）

参考答案:

对HBase存储模式是基于列存储的，每个columnfamily存储在HDFS上的一个单独文件中。（）

参考答案:

对在当今云计算、大数据盛行的时代，关系型数据库性能遇到瓶颈，瓶颈的源头一般是在磁盘的I/O上。（）

参考答案:

对NoSQL数据库同时具备了高性能、可扩展性强、高可用等优点。（）

参考答案:

对第十五章测试下列关于数据仓库工具Hive架构描述正确的是（）。

参考答案:

Hive将元数据存储在关系型数据库中，有三种模式可连接到数据库。;Hive用户接口主要有三个：CLI，JDBC/ODBC和WebUI，最常用的是CLI。;Hive的数据存储在HDFS中，大部分的HQL查询请求、Hive内部自动转换为MapReduce任务执行。;Driver组件主要完成HQL查询语句的词法分析、语法分析、编译

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

云计算与大数据技术知到章节答案智慧树2023年北京联合大学

文档简介

温馨提示

最新文档

评论

云计算与大数据技术知到章节答案智慧树2023年北京联合大学

文档简介

温馨提示

最新文档

评论

相关文档