大数据技术基础智慧树知到课后章节答案2023年下东北石油大学_第1页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学_第2页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学_第3页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学_第4页
大数据技术基础智慧树知到课后章节答案2023年下东北石油大学_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据技术基础智慧树知到课后章节答案2023年下东北石油大学东北石油大学

绪论单元测试

本课程中关于大数据处理与分析部分的学习内容有:(

A:大数据分析的常用算法B:Mapreduce的编程模型C:大数据分析过程D:大数据分析分析工具

答案:大数据分析的常用算法;Mapreduce的编程模型;大数据分析过程;大数据分析分析工具

第一章测试

大数据的基本特征包括()。

A:数据的价值密度但商业价值高

B:数据规模大

C:数据来源和数据数据类型多样化

D:数据增长速度快

答案:数据的价值密度但商业价值高

;数据规模大

;数据来源和数据数据类型多样化

;数据增长速度快

下面说法正确的是()。

A:大数据是第三次信息化浪潮以后产生的数据

B:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称

C:大数据就是数据容量达到1T以上的数据

D:大数据指数据而不包括数据的分析结果

答案:大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称

下面哪些技术属于大数据技术。()

A:快速传输数据的技术。

B:人脸识别技术。

C:从各种数据源中采集数据的技术。

D:网盘数据存储技术

答案:快速传输数据的技术。

;从各种数据源中采集数据的技术。

;网盘数据存储技术

如何理解“大数据分析是相关性分析而不是因果分析”。(

A:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。B:不仅要进行相关分析分析,也要进行因果关系分析。C:不仅要知其然,还要知其所以然。D:相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。

答案:发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。;不仅要进行相关分析分析,也要进行因果关系分析。;不仅要知其然,还要知其所以然。;相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。

大数据的特征Variety是指:(

A:数据变化多端B:数据格式多样C:数据来源广泛D:数据用途丰富

答案:数据格式多样;数据来源广泛

第二章测试

在Python中,语句print(3<5>2)的输出结果为False。()

A:错B:对

答案:错

已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。()

A:错B:对

答案:对

扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。()

A:对B:错

答案:错

已知x=[1,2]和y=[3,4],那么x+y的结果是()。

A:7

B:[4,6]

C:[1,2,3,4]

D:3

答案:[1,2,3,4]

Pandas中常用的数据结构包括()。

A:Series

B:Panel

C:DataFrame

D:List

答案:Series

;Panel

;DataFrame

第三章测试

文件系统的优点不包括()。

A:文件的逻辑结构与物理结构脱钩,具有了一定的独立性

B:用户的程序与数据可分别存放在外存储器上,实现以文件为单位的数据共享

C:数据的组织不存在大量的数据冗余

D:操作系统为用户使用文件提供了友好界面

答案:数据的组织不存在大量的数据冗余

数据仓库的主要特点()。

A:相对稳定

B:集成性

C:面向主题

D:分布式存储

答案:相对稳定

;集成性

;面向主题

NoSQL即“不是SQL”,非关系型数据库,是对不同于传统的关系型数据库的统称。()

A:对B:错

答案:错

Hadoop应用在以下方面?()。

A:在线旅游

B:电子商务

C:移动数据

D:能源开采

答案:在线旅游

;电子商务

;移动数据

;能源开采

MongoDB采用BSON(BinaryJSON)来进行文档的存储与编码传输,BSON支持的常见数据类型包括?()。

A:Time

B:Double

C:ObjectID

D:Arrays

答案:Double

;ObjectID

;Arrays

第四章测试

根据处理时间的要求,可以把业务划分为:()

A:离线业务

B:近线业务

C:在线业务

D:其余选项都是

答案:其余选项都是

下面哪些技术属于数据融合技术?()

A:统一数据编码

B:特征编码

C:特征离散化

D:统一计量单位

E:数据规约

F:数据归一化处理

答案:统一数据编码

;统一计量单位

;数据规约

;数据归一化处理

以下不属于聚类分析的算法有:()

A:模糊算法

B:层次聚类算法

C:K-Means算法

D:线性回归算法

答案:线性回归算法

HadoopMaReduce中的Map和Reduce阶段的输入输出都是<key,value>键值对形式。()

A:对B:错

答案:对

监督学习是最常见的机器学习问题之一,监督学习算法进一步可以分为分类问题与回归问题两大类。()

A:错B:对

答案:对

第五章测试

市场上已经出现了很多数据可视化软件和工具,下面不是大数据可视化工具的是()。

A:Tableau

B:Premiere

C:Echarts

D:Excel

答案:Premiere

科学可视化一般分为()。

A:颜色可视化

B:大规模数据可视化

C:流场可视化

D:体可视化

答案:大规模数据可视化

;流场可视化

;体可视化

可视化是对数据的透彻理解、深入分析和综合采集,主要包括以下哪些环节。()。

A:数据获取

B:可视化应用

C:可视化模式

D:数据处理

答案:数据获取

;可视化应用

;可视化模式

;数据处理

信息可视化一般适用于大规模非数字型信息资源的可视化表达。()

A:错B:对

答案:对

我们没有办法改变标签云的形状。()

A:对B:错

答案:错

第六章测试

CRISP-DM的方案实施主要工作内容是:()

A:固化可重复的分析过程并发布结果

B:收集数据并进行数据预处理。

C:组织开发阶段开始分析程序的开发

D:设计算法和模型,进行大数据分析。

答案:固化可重复的分析过程并发布结果

CRISP-DM适合于什么样的人群?()。

A:大数据用户

B:大数据用户和大数据开发的IT人员

C:大数据管理人员

D:大数据开发的IT人员

答案:大数据用户和大数据开发的IT人员

“全校最热门图书分析”这属于以下哪些主题?()。

A:面向读者或图书管理人员的服务

B:借阅信息分析

C:知识问答

D:个性化图书推荐

答案:面向读者或图书管理人员的服务

;借阅信息分析

DataFrame.describe函数可以为我们提供哪些信息。()

A:通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多

B:通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值

C:通过freq可以知道出现次数最多的的值出现的次数

D:对数据有一个描述性统计概貌。

E:通过unique查看不重复的离散值数目,可以知道是否需要云重复值

答案:通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多

;通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值

;通过freq可以知道出现次数最多的的值出现的次数

;对数据有一个描述性统计概貌。

;通过unique查看不重复的离散值数目,可以知道是否需要云重复值

关于主题词,下面哪些说法是正确的。()

A:如果一个词条在多个分类中都现出,则认为是通用词,不是主题词。

B:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论