大数据算法学习通章节答案期末考试题库2023年_第1页
大数据算法学习通章节答案期末考试题库2023年_第2页
大数据算法学习通章节答案期末考试题库2023年_第3页
大数据算法学习通章节答案期末考试题库2023年_第4页
大数据算法学习通章节答案期末考试题库2023年_第5页
已阅读5页,还剩12页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据算法学习通超星课后章节答案期末考试题库2023年任务分配的拉方法是指系统采取完全的控制将制定的任务分配给工人。()

答案:

用机器完成众包的优势有()。

答案:

省钱###省时

在repartitionjoin的改进中,说法错误的是()。

答案:

Map函数的输出键作为连接键

在数据流模型中,内存远远大于数据的规模。()

答案:

数据流模型中,数据流是指来自某个域中的元素序列。()

答案:

在数据流模型中,从数据流中可以计算简单的函数,如最大值、最小值、求和等,且处理这些函数时通常使用单个寄存器s。()

答案:

目前众包技术完全由计算机来完成。()

答案:

利用平面图的直径近似算法得到的解,在最坏情况下,也不会小于最优解的()。

答案:

二分之一

采用平面图的直径近似算法的动机是无法在要求的时间内得到()。

答案:

精确解

频繁元素计算算法又称为()算法。

答案:

MG

频繁元素计算算法有效的原因是源于()。

答案:

Zipf原则

在频繁元素计算算法中,计数器x减少的次数依赖于有几个减少计数器的步骤。()

答案:

时间亚线性算法的思想是:利用特定子图联通分量的数量估计最小生成树的()。

答案:

权重

求最小生成树是一个贪心法,可以用()算法来解决。

答案:

Prime

近似算法能给出一个优化问题的优化解。

答案:

在平面图的直径近似算法中,要求点之间的距离满足三角不等式是指在i、j、k三个点中,i到j的距离加上j到k的距离小于i到k的距离。

答案:

RatioBound越大,则近似解越坏。()

答案:

如果一次测试以大于等于p的概率获得一个证据,那么s=2/p轮测试得到证据的概率大于等于3/4。

答案:

关于证明如果输入ℇ远离有序,则存在大于ℇn个“坏索引”的问题,可以采用证明其逆否命题的方法。

答案:

基于簇的HIT生成问题的优化目标是生成最小数目基于簇的HIT。()

答案:

在判定问题的近似中,对于近似解需要区分的是()。

答案:

是###差得很远

判定问题的近似解是指:输入满足某种性质或近似满足某种性质。

答案:

下列选项中叙述正确的是()。

答案:

大多数程序在RAM模型上运行

对于大数据而言,标准计算理论模型失效的原因之一是内存是有限的,无法存储所有的内存。()

答案:

现代计算机有复杂的存储层次,存储单元的访问是以块为单位的数据移动。()

答案:

用MR进行多重集相似连接算法的常见计算包括()。

答案:

单元函数###合取函数###析取函数

外存归并排序,以()为单位进行调度。

答案:

等值连接不必在结果中去掉重复的属性。()

答案:

在迭代MapReduce中,reduce的输出必须和map的输入兼容。()

答案:

大数据算法涉及到外存的时候,通常要分析()。

答案:

IO复杂性

下列选项中,属于智能仿生算法的是()。

答案:

遗传算法###模拟退火算法

在线算法/数据流算法是面向大数据速度快的特点提出的。()

答案:

随机算法是利用随机化的方法来进行大数据处理,是大数据算法设计技术之一。()

答案:

找到一个稠密图的最小生成树的算法易于并行化的原因是每个子图的()可以被并行计算。

答案:

最小生成树

基于路径的算法的例子不包括()。

答案:

分布式不动点运算

Dijkstra算法需要并行化。()

答案:

缓存迭代的方法是()。

答案:

在Mapper前加入输入缓存###在Reducer前加入输入缓存###在Reducer后加入输出缓存

以下关于大数据的特点,叙述错误的是()。

答案:

速度慢

在内存中的二分搜索树中,通常使用()来维护树的平衡。()

答案:

旋转

为更快地保存外部搜索树,可采取按BFS的顺序将其分割。()

答案:

以下选项中,大数据涉及的领域中包括()。

答案:

社交网络###医疗数据###计算机艺术###医疗数据

在(a,b)-树中,a和b表示的是每个节点当中键值的上限和下限。()

答案:

B-树中右边的指针指向的是键值小于最右键值的子数。()

答案:

关于(a,b)—树的删除操作,删除操作出现问题的情形是:从叶子v删除元素后,v的儿子小于a-1个。()

答案:

关于(a,b)-树的插入,插入涉及到的结点最多到树高+1。()

答案:

大数据的应用包括()。

答案:

预测###推荐###商业情报分析###科学研究

目前,关于大数据已有公认的确定定义。

答案:

KD树在()层使用水平线。

答案:

偶数层

KdB-树的插入可以使用()的方法。

答案:

对数

基于位置的查找实际上是一种三维空间的查找。()

答案:

KD树可以看成是两个二叉树的交叠。()

答案:

大数据种类繁多,在编码方式、数据格式、应用特征等方面都存在差异。()

答案:

为数T的每个结点标上子树大小的I/O复杂度为()。

答案:

O(sort(N))

对给定顶点邻接链表T,其一个欧拉回路可以以()IO复杂性求得。

答案:

O(scan(N))IO

外存算法最坏情况的I/O数位Ω(N)。()

答案:

图中的独立集是指图当中点的集合,其任意两点之间不存在边。()

答案:

MapReduce是一种非递归描述性语言的通用运行平台。()

答案:

关于并行节点计算,下列选项中关于节点叙述不准确的是()。

答案:

没有额外工作要做时继续迭代

查找规模为N的表L中,每个独立集(MIS)的大小至少为()。

答案:

n/3

时间前向的处理方法是按照()来访问边。

答案:

拓扑序

并行结点计算的终止条件是()。

答案:

所有顶点同时变为非活跃状态###没有信息传递

大数据求解计算问题过程的第一步是确定该问题是否可计算。

答案:

计算在一个给定社交网络中平均每人的朋友个数,在不访问所有顶点的情况下,进行精确计算最少需要访问()个顶点。

答案:

n-1

半外存算法是假设()。

答案:

顶点放在内存中,边在外面

图的连通性算法可扩增为求图G最小生成树(MST)的算法。()

答案:

在求最小生成树时,压缩后图中某条边的权值等于该边代表的所有边的权值最大值。()

答案:

亚线性是指()等的消耗是输入规模o。()

答案:

时间###空间###IO###通讯

大数据算法是在给定的时间约束下,以大数据为输入,在给定资源约束内可以生成满足给定约束结果的算法。

答案:

MapReduce是一种比较好实现大数据算法的编程架构,在生产中得到广泛应用。

答案:

MapReduce是由()开发的分布式编程模型。

答案:

Google

在实现MapReduce程序时,需要注意的事项不包括()。

答案:

避免通信

MapReduce的执行框架处理的内容包括()。

答案:

调度###数据分布###将中间数据进行聚集、排序或洗牌###进行错误处理

理想的可扩展性有()。

答案:

数据加倍,运行时间加倍###资源加倍,运行时间减半

用Pregel计算子图同构问题,其三个步骤是()。

答案:

查询分解###搜索###Join

Pregel的编程形式,在执行计算的机器上每一阶段都利用整个图的全部状态。()

答案:

众包算法是用来解决()。

答案:

计算机计算能力不足或知识不足,需要人来帮忙

大部分时候reducer不能用作combiner。()

答案:

为解决单个计算机难以保存全部数据的问题,通常会采用并行处理的技术,此技术会涉及到时间亚线性算法。

答案:

众包通过一系列的机制和方法来指导和协调()的行为,从而达到目的。

答案:

群体

外包与众包的区别在于众包的参与者数量大且不固定的。()

答案:

关于单词共现矩阵的计算,说法正确的是()。

答案:

计算文本集合中词的共现矩阵###是一种测量语义距离的方法###语义距离可用于许多语言处理任务

用单词共现矩阵解决大规模计数问题的基本方法是()。

答案:

Mapper生成部分计数###Reducer聚合部分计数

在“词对法”中,每个mapper处理一个句子。()

答案:

f(B|A)词对法必须确定所有a被传递到同一个combiner。()

答案:

“词对法”的缺点是不易实现,排序和洗牌代价高。()

答案:

Wikipedia是众包案例的一种最成功的应用之一。()

答案:

人脸识别是利用众包改进图像()的例子。

答案:

搜索

下列属于众包应用的例子有()。

答案:

验证码###机器翻译###图像搜索###数据库查询

众包技术应用于广告中的情形之一是区分关键词与广告的相关程度。()

答案:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论