在线网课知慧《大数据技术基础(东北石油大学)》单元测试考核答案_第1页
在线网课知慧《大数据技术基础(东北石油大学)》单元测试考核答案_第2页
在线网课知慧《大数据技术基础(东北石油大学)》单元测试考核答案_第3页
在线网课知慧《大数据技术基础(东北石油大学)》单元测试考核答案_第4页
在线网课知慧《大数据技术基础(东北石油大学)》单元测试考核答案_第5页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

绪论1.【多选题】(10分)正确答案:ABCD本课程中关于大数据处理与分析部分的学习内容有:()A.大数据分析过程B.大数据分析分析工具C.大数据分析的常用算法D.Mapreduce的编程模型第一章单元测试1.【多选题】正确答案:ABCD大数据的基本特征包括()。A.数据来源和数据数据类型多样化B.数据规模大C.数据的价值密度但商业价值高D.数据增长速度快2【单选题】(2分)下面说法正确的是()。A.大数据是第三次信息化浪潮以后产生的数据B.大数据指数据而不包括数据的分析结果C.大数据就是数据容量达到1T以上的数据D.大数据指海量多样的数据、分析数据的方法、管理数据的系统、数据的应用的统称3.【多选题】正确答案:ABC下面哪些技术属于大数据技术。()A.快速传输数据的技术。B.从各种数据源中采集数据的技术。C.网盘数据存储技术D.人脸识别技术。4.【多选题】正确答案:ABCD如何理解“大数据分析是相关性分析而不是因果分析”。()A.发现两个现象的相关性后,经过进一步深入研究,找出因果关系,就会实现技术创新。B.不仅要知其然,还要知其所以然。C.不仅要进行相关分析分析,也要进行因果关系分析。D.相关性分析就是通过对大量数据进行统计分析,获取两个现象之间具有关联性。5.【多选题】正确答案:AD大数据的特征Variety是指:()A.数据来源广泛B.数据变化多端C.数据用途丰富D.数据格式多样第二章单元测试1【判断题】在Python中,语句print(3<52)的输出结果为False。()A.错B.对2【判断题】已知x是一个足够大的numpy二维数组,那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。()A.错B.对3【判断题】扩展库pandas中DataFrame对象的drop_duplicates()方法可以用来合并数据。()A.错B.对4【单选题】(2分)已知x=[1,2]和y=[3,4],那么x+y的结果是()。A.7B.3C.[1,2,3,4]D.[4,6]5.【多选题】正确答案:ABDPandas中常用的数据结构包括()。A.DataFrameB.PanelC.ListD.Series第三章单元测试1【单选题】(2分)文件系统的优点不包括()。A.操作系统为用户使用文件提供了友好界面B.用户的程序与数据可分别存放在外存储器上,实现以文件为单位的数据共享C.文件的逻辑结构与物理结构脱钩,具有了一定的独立性D.数据的组织不存在大量的数据冗余2.【多选题】正确答案:BCD数据仓库的主要特点()。A.分布式存储B.集成性C.相对稳定D.面向主题3【判断题】NoSQL即“不是SQL”,非关系型数据库,是对不同于传统的关系型数据库的统称。()A.错B.对4.【多选题】正确答案:ABCDHadoop应用在以下方面?()。A.能源开采B.在线旅游C.移动数据D.电子商务5.【多选题】正确答案:ACDMongoDB采用BSON(BinaryJSON)来进行文档的存储与编码传输,BSON支持的常见数据类型包括?()。A.DoubleB.TimeC.ObjectIDD.Arrays第四章单元测试1【单选题】(2分)根据处理时间的要求,可以把业务划分为:()A.在线业务B.离线业务C.其余选项都是D.近线业务2.【多选题】正确答案:BCDE下面哪些技术属于数据融合技术?()A.特征离散化B.统一数据编码C.数据归一化处理D.统一计量单位E.数据规约F.特征编码3【单选题】(2分)以下不属于聚类分析的算法有:()A.模糊算法B.线性回归算法C.层次聚类算法D.K-Means算法4【判断题】HadoopMaReduce中的Map和Reduce阶段的输入输出都是<key,A.对B.错5【判断题】监督学习是最常见的机器学习问题之一,监督学习算法进一步可以分为分类问题与回归问题两大类。()A.错B.对第五章单元测试1【单选题】(2分)市场上已经出现了很多数据可视化软件和工具,下面不是大数据可视化工具的是()。A.EchartsB.ExcelC.TableauD.Premiere2.【多选题】正确答案:ABD科学可视化一般分为()。A.流场可视化B.大规模数据可视化C.颜色可视化D.体可视化3.【多选题】正确答案:ABCD可视化是对数据的透彻理解、深入分析和综合采集,主要包括以下哪些环节。()。A.数据获取B.数据处理C.可视化应用D.可视化模式4【判断题】信息可视化一般适用于大规模非数字型信息资源的可视化表达。()A.对B.错5【判断题】我们没有办法改变标签云的形状。()A.错B.对第六章单元测试1【单选题】(2分)CRISP-DM的方案实施主要工作内容是:()A.组织开发阶段开始分析程序的开发B.设计算法和模型,进行大数据分析。C.固化可重复的分析过程并发布结果D.收集数据并进行数据预处理。2【单选题】(2分)CRISP-DM适合于什么样的人群?()。A.大数据管理人员B.大数据用户和大数据开发的IT人员C.大数据用户D.大数据开发的IT人员3.【多选题】正确答案:AD“全校最热门图书分析”这属于以下哪些主题?()。A.借阅信息分析B.个性化图书推荐C.知识问答D.面向读者或图书管理人员的服务4.【多选题】正确答案:ABCDEDataFrame.describe函数可以为我们提供哪些信息。()A.通过count提供每一列非空值的数量,各列相互比较就要可以知道是否存在空值B.对数据有一个描述性统计概貌。C.通过unique查看不重复的离散值数目,可以知道是否需要云重复值D.通过freq可以知道出现次数最多的的值出现的次数E.通过top可以统计出现次数最多的离散值,直接判断哪些书的借阅次数最多5.【多选题】正确答案:AB关于主题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论