大数据分析与挖掘知到智慧树章节测试课后答案2024年秋青岛黄海学院_第1页
大数据分析与挖掘知到智慧树章节测试课后答案2024年秋青岛黄海学院_第2页
大数据分析与挖掘知到智慧树章节测试课后答案2024年秋青岛黄海学院_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据分析与挖掘知到智慧树章节测试课后答案2024年秋青岛黄海学院第一章单元测试

下列选项中,用于搭建数据仓库和保证数据质量的是()。

A:数据展现B:数据处理C:数据收集D:数据分析

答案:数据处理HTML文档属于()。

A:半结构化数据B:不是数据C:结构化数据D:非结构化数据

答案:半结构化数据数据挖掘的英文缩写()。

A:DBB:DAC:DMD:DC

答案:DMHadoop的基础架构是()。

A:同步系统B:操作系统C:

ABC都不正确D:分布式系统

答案:分布式系统一般情况下,计算机处理的数据都是()。

A:无结构化的数据B:结构化的数据C:非结构化的数据D:半结构化的数据

答案:结构化的数据

第二章单元测试

下列语法正确的是()

A:print('hello,world')B:print(hello,world)C:print(‘hello,world’)D:print"hello,world"

答案:print('hello,world')在Python中实现多个条件判断需要用到与if语句的组合语句是()

A:elifB:elseC:ABC均不是D:pass

答案:elifPython语言属于以下哪种语言()

A:高级语言B:机器语言C:ABC都不正确D:汇编语言

答案:高级语言下列选项中,不是Python关键字的是()

A:passB:yieldC:staticD:from

答案:static下列关于字符串的表述中,不合法的是()

A:'py"th"on'B:“‘Python’”C:"p'yth'on"D:[python]

答案:[python]

第三章单元测试

已知x=np.array((1,2,3,4,5)),那么表达(x**2).max()的值为()。

A:30B:20C:15D:25

答案:25已知x=np.array((1,2,3,4,5)),那么表达式(x//5).sum()的值()。

A:2B:1C:3D:4

答案:1已知x=np.array((1,2,3),4,5),那么表达式sum(x*x)的值()。

A:65B:55C:60D:50

答案:55在Matplotlib中,用于绘制散点图的函数是()。

A:hist()B:pie()C:scatter()D:bar()

答案:scatter()下列选项中,不属于Seaborn库特点的是()

A:Seaborn是基于Matplotlib的可视化库B:可以处理大量的数据流C:基于网格绘制出更加复杂的图像集合D:多个内置主题及颜色主题

答案:可以处理大量的数据流

第四章单元测试

下列不属于HTTP请求过程的是()

A:生成请求B:超时设置C:请求重定向D:搜索文档

答案:搜索文档下列关于Python爬虫库的功能,描述不正确的是()

A:通用爬虫库——requestsB:爬虫库——ScrapyC:Html/Xml解析器——pycurlD:通用爬虫库——urllib

答案:Html/Xml解析器——pycurl下列对于Scrapy常用命令及其作用描述错误的是()

A:genspider是一个项目命令,主要用于创建爬虫模板B:list是一个全局命令,主要用于列出项目中所有可用的爬虫C:crawl是一个项目命令,主要用于启动爬虫D:startproject是一个全局命令,主要用于运行一个独立的爬虫

答案:startproject是一个全局命令,主要用于运行一个独立的爬虫下列请求头中,可以记载用户信息实现模拟登录的是()

A:CookieB:ConnectionC:HostD:User-Agent

答案:Cookie下列不属于Scrapy框架的基本组成部分的是()

A:解析中间件B:下载器与SpidersC:ItemPipelnesD:引擎与调度器

答案:引擎与调度器

第五章单元测试

下列关于Pandas数据读/写说法错误的是()

A:read_csv能够读取所有文本文档的数据B:to_excel函数能够将结构化数据写入Excel文件C:read_sql能够读取数据库的数据D:to_csv函数能够读取数据库的数据写入.csv文件

答案:read_csv能够读取所有文本文档的数据下列关于时间相关类错误的是()

A:Period是存放某个时间段的类B:Timestamp是存放某个时间点的类C:Timestamp数据可以使用标准的试卷字符串转换得来D:两个数值上相同的Period和Timestamp所代表的意义相同

答案:两个数值上相同的Period和Timestamp所代表的意义相同使用pivot_table函数制作透视表设置行分组键的参数为()。

A:indexB:dataC:rawD:values

答案:index使用其本身可以达到数据透视功能的函数是()。

A:transformB:crosstabC:pivot_tableD:groupby

答案:pivot_table下列关于groupby方法说法确的是()

A:groupby是pandas提供的一个用来分组的方法B:groupby方法是pandas提供的一个用来聚合的方法C:proupby方法的结果能够直接查看D:groupby能够实现分组聚

答案:groupby是pandas提供的一个用来分组的方法

第六章单元测试

下列关于sklearn说法错误的是()。

A:sklearn在官网被分为7个大块B:sklearn需要NumPy和SciPy库的支持C:sklearm的聚类算法几乎都已经放在cluster模块中了D:sklearm全称为scikitlearn

答案:sklearn在官网被分为7个大块下列关于train_test_split丽数的说法正确的是()。

A:train_test_split兩数可以自行决定训练集和测试集的占比。B:train_test_split能够将数据集划分为训练集、验证集和测试集。C:生成的训练集和测试集在赋值的时候可以调换位置,系统能够自动识别。D:train_test_split每次的划分结果不同,无法解决。

答案:train_test_split兩数可以自行决定训练集和测试集的占比。下列关于sklearn转换器的说法与使用方式错误的是().

A:fit在转换器中起到的作用为训练模型B:fit_transform是fit和transform的结合C:fit在转换器中起到的作用为生成规则D:transform在转换器中起到的作用为应用规则

答案:fit在转换器中起到的作用为训练模型下列算法中,sklearn中未提及的是()。

A:KNN最近邻分类算法B:Apriori关联规则算法C:LogisticRegressionD:K-Means聚类算法

答案:Apriori关联规则算法下列关于分类算法描述正确的是()。

A:分类算法的标签和回归算法完全相同B:分类算法的评价需要参考真实标签C:分类算法和聚类算法一样都没有标签D:分类算法评价可以用均方误差来判断

答案:分类算法的评价需要参考真实标签

第七章单元测试

标准化处理中,是对原始数据的一种线性变换的是()

A:标准差标准化B:离差标准化C:小数定标标准化D:零均值标准化

答案:离差标准化Pandas库中可以实现纵向堆叠的是()

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论