大数据分析与挖掘智慧树知到期末考试答案章节答案2024年青岛黄海学院

上传人：题*** IP属地：浙江上传时间：2024-07-27 格式：DOCX 页数：8 大小：15.20KB 积分：6 举报 版权申诉

免费预览已结束，剩余4页可下载查看

 下载本文档

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

大数据分析与挖掘智慧树知到期末考试答案+章节答案2024年青岛黄海学院朴素贝叶斯是一种在已知后验概率与类条件概率的情况下的模式分类方法，待分类样本的分类结果取决于各类域中样本的全体。（）

答案:错表达式4<5==5的值为True。（）

答案:对扩展库numpy的线性代数子模块linalg中提供了求解线性方程组的solve()函数和求解线性方程组最小二乘解的lstsq()函数。（）

答案:对在Python3.x中，reduce（）是内置函数，可以直接使用。（）

答案:错扩展库numpy中的arange()函数功能和内置函数range()类似.只能生成包含整数的数组，无法创建包含浮点数的数组。（）

答案:错扩展库numpy中的isclose()函数返回包含若干True/False值的数组，而allclose(）函数返回True或False值。（）

答案:对爬虫是手动请求万维网网站且提取网页数据的程序。（）

答案:错已知x是一个足够大的numpy二维数组，那么语句x[0,2]=4的作用是把行下标为0、列下标为2的元素值改为4。（）

答案:对表达式np.empty((3,5)).sum()的值一定为0。（）

答案:错ETL包括（）。

答案:数据提取;数据转换;数据加载常用的滚动计算函数包括（）。

答案:rolling_mean();rolling_sum();rolling_max();rolling_min()在利用数据挖掘技术处理和解决实际问题时，王光宏等提出了（）3个值得注意的角度

答案:数据挖掘的理论基础;用数据挖掘技术解决问题的类型;解决数据挖掘的数据准备工作大数据按照其结构的不同可以分为（）。

答案:半结构化数据;结构化数据;非结构化数据下列状态码中，表示客户端的请求有错误的是（）。

答案:403;404数据预处理过程包括哪些操作（）。

答案:数据集成;数据约减;数据转换;数据清洗Python中的数据结构可分为可变类型与不可变类型，下面属于不可变类型的是（）。

答案:字典中的键当a=11时，运行a+=11后，a的结果是（）。

答案:22DM的是（）的缩写

答案:DataMining下列选项中，针对图表描述不正确的是（）。

答案:条形图是由一系列高度不等的纵向条纹或线段表示数据分布情况DBSCAN在最坏情况下的时间复杂度是（）。

答案:O(m^2)下列关于分组聚合的说法错误的是（）。

答案:pandas提供的分组和聚合函数分别只有一个下列选项中，关于bokeh库说法不正确的是（）。

答案:Charts库可直接使用，不需要单独安装以下关于self的说法不正确的是（）。

答案:self可有可无，它的参数位置不确定下列选项中，不属于Python循环结构的是（）。

答案:嵌套的while循环K-Means算法接收的数据类型为（）。

答案:连续型下列与标准化方法有关的说法中错误的是（）。

答案:离差标准化简单易懂,对最大值和最小值敏感度不高PythonIDE不包括以下哪种（）。

答案:Rstudio定义函数时，函数体的正确缩进为（）。

答案:一个制表符Python语句temp=set（[1,2,3,,2,3,4,5]）;print(len(temp))的输出结果是（）。

答案:5下列选项中，不属于字典操作的方法是（）。

答案:dicts.pop()以下关于缺失值检测的说法中，正确的是（）。

答案:dropna方法既可以删除观测记录，亦可以制徐特征在基本KMems中，当计算部近度的商数采用（）的时候，合送的凯志危族中各点的中位数。

答案:曼哈顿距离Python语句x='car';y=2,print(x+y)的输出结果是哪一项（）。

答案:语法错误下列关于BP神经网络说法正确的是（）。

答案:BP神经网络可以用于回归对于Python中类的专有方法表述错误的是（）。

答案:__call__可以进行赋值下列关于K-Means算法初始聚类中心说法正确的是（）。

答案:样本中随机选出Python脚本文件的扩展名是（）。

答案:.py以下不属于分类器评价指标的是（）。

答案:轮廓系数下列关于分类算法描述正确的是（）。

答案:分类算法的评价需要参考真实标签下列不属于Scrapy框架的基本组成部分的是（）

答案:引擎与调度器在Matplotlib中，用于绘制散点图的函数是（）。

答案:scatter()书写文件路径时，为了减少路径中分隔符“\”符号的输入，同时也为了避免不正确的转义导致代码错误，建议使用原始字符串。（）

答案:对扩展库numpy中的append()函数和insert()函数是在原数组的基础上追加或插入元素，没有返回值。（）

答案:错在Python中，需要事先声明变量名及其类型（）

答案:错在Python中，变量的值和类型不可以随时发生改变（）

答案:错扩展库numpy的线性代数子模块linalg中提供了用来计算逆矩阵的inv()函数。（）

答案:对在对文件进行读写时，文件指针的位置会自动变化，始终表示读写的当前位置。（）

答案:对缩进对于Python代码至关重要。（）

答案:对Python3.x代码默认使用UTF8编码格式，全面支持中文。（）

答案:对关联分析是数据分析中常用的分析方法。（）

答案:对根据使用场景的不同，网络爬虫可以分为（）。

答案:聚焦爬虫;通用爬虫Numpy提供的两种基本对象是（）。

答案:ndarray;ufunc下列以大数据为单位进行计量的是（）。

答案:PB;ZB;EB下列属于监督学习的有（）。

答案:回归;分类下面描述属于广播机制的是（）。

答案:当输入数组的某个轴的长度为1时，沿着此轴运算时都用此轴上的第一组值;如果输入的数组是某个轴和输出的数组的对应轴的长度相同或者长度为1，则这个数组能够用来计算，否则出错;让所有的输入数组都向shape最长的数组看齐，shape中不足的部分通过在前面加1补齐;输出数组的shape是输入数组shape的各个轴上的最大值Python标准库对象导入语句正确的是（）。

答案:frommathimportsin;frommathimport*以下属于Pandas库中序列的属性的是（）。

答案:索引;值Pandas库中序列由（）两部分组成

答案:对应的值;索引下面说法正确的选项有（）。

答案:在Python3.x中可以使用中文做变量名;在表达式中圆括号可以改变运算顺序;正确的缩进对Python程序是非常重要的创建一个3*3的数组，下列代码中错误的是（）。

答案:np.random.random([3,3,3])以下关于数据分析预处理的过程描述正确的是（）。

答案:数据分析的预处理过程主要包括效据清洗，数据合井、敏据标准化柏数据转换，它们之间存在交叉，没有严格的先后关系以下关于pandas数据预处理说法正确的是（）。

答案:cut函数默认情况下做的是等宽法离散化（）是一个观测值，它与其他观测值的差别很大，以至于我们怀疑它是由不同的机制产生的。

答案:离群点以下关于全局变量及局部变量描述错误的是（）。

答案:局部变量可以在外部被调用下面不属于灰色预测特点的是（）。

答案:对数据的光滑性要求不高下列关于apply方法说法正确的是（）。

答案:apply方法只能够对行列进行操作下列是“3and4”的运算（）。

答案:4简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰好在一个子集中，这种聚类方法称作（）。

答案:划分聚类已知x=np.random.randint(0,100,(3,5))，那么表达式np.ceil(abs(np.sin(x))).sum()的值最大可能为（）。

答案:15.0下列关于K-Means算法的说法错误的是（）。

答案:K-Means算法是sklearn的cluster模块中唯一涉及距离计算的聚类算法可变参数*args传入函数时的存储方式为（）。

答案:元祖以下关于drop_duplicates函数的说法中错误的是（）。

答案:仅支持单-特征的数据去重下面不属于支持向量回归优点的是（）。

答案:计算复杂度低下列选项中，（）不可以直接对文本进行分类。

答案:K-Means在类的继承中，子类不能从父类中继承的是（）。

答案:__getName函数一下关于lambda表达式的描述错误的是（）。

答案:lambda表达式解释性好关于K-Means和DBSCAN的比较，以下说法不正确的是（）。

答案:K-Means丢弃被它识别为噪声的对象，而DBSCAN-般聚类所有对象在foriinrang（6）语句中，i的取值是（）。

答案:[0,1,2,3,4,5]下列对于Scrapy数据流向描述错误的是（）。

答案:Spiders处理响应并返回爬取到的Items及新的请求给引擎解析中间件以下不属于BP神经网络应用场景的是（）。

答案:文本分类以下关于决策树的说法错误的是（）。

答案:冗余属性不会对决策树的精确度造成不利的影响以下可改变原始变量，而不产生新变量的是（）。

答案:sort函数下列数据类型中，Python不支持的是哪一项（）。

答案:char数据结构set可以归类为（）。

答案:可变集合下列选项中，关于Matplotlib库说法不正确是（）。

答案:渐进、交互的方式实现数据可视化常用的离散化方法包括（）

答案:等宽法;聚类分析法（一维）;等频法Pandas库中可以实现纵向堆叠的是（）

答案:append常见的数据重复分为哪两种（）

答案:记录重复;特征重复标准化处理中，是对原始数据的一种线性变换的是（）

答案:离差标准化下列算法中，sklearn中未提及的是（）。

答案:Apriori关联规则算法下列关于train_test_split丽数的说法正确的是（）。

答案:train_test_split兩数可以自行决定训练集和测试集的占比。下列关于sklearn说法错误的是（）。

答案:sklearn在官网被分为7个大块下列关于sklearn转换器的说法与使用方式错误的是（）.

答案:fit在转换器中起到的作用为训练模型使用pivot_table函数制作透视表设置行分组键的参数为（）。

答案:index下列关于时间相关类错误的是（）

答案:两个数值上相同的Period和Timestamp所代表的意义相同使用其本身可以达到数据透视功能的函数是（）。

答案:pivot_table下列关于groupby方法说法确的是（）

答案:groupby是pandas提供的一个用来分组的方法下列关于Pandas数据读/写说法错误的是（）

答案:read_csv能够读取所有文本文档的数据下列请求头中，可以记载用户信息实现模拟登录的是（）

答案:Cookie下列对于Scrapy常用命令及其作用描述错误的是（）

答案:startproject是一个全局命令，主要用于运行一个独立的爬虫下列关于Python爬虫库的功能，描述不正确的是（）

答案:Html/Xml解析器——pycurl下列不属于HTTP请求过程的是（）

答案:搜索文档已知x=np.array((1,2,3,4,5))，那么表达(x**2).max（）的值为（）。

答案:25已知x=np.array((1,2,3,4,5))，那么表达式(x//5).sum()的值（）。

答案:1已知x=np.array((1,2,3),4,5)，那么表达式sum(x*x)的值（）。

答案:55下列选项中，不属于Seaborn库特点的是（）

答案:可以处理大量的数据流下列关于字符串的表述中，不合法的是（）

答案:[python]下列选项中，不是

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

大数据分析与挖掘智慧树知到期末考试答案章节答案2024年青岛黄海学院

文档简介

温馨提示

最新文档

评论

大数据分析与挖掘智慧树知到期末考试答案章节答案2024年青岛黄海学院

文档简介

温馨提示

最新文档

评论

相关文档