Python数据科学导引知到智慧树章节测试课后答案2024年秋内蒙古农业大学_第1页
Python数据科学导引知到智慧树章节测试课后答案2024年秋内蒙古农业大学_第2页
Python数据科学导引知到智慧树章节测试课后答案2024年秋内蒙古农业大学_第3页
Python数据科学导引知到智慧树章节测试课后答案2024年秋内蒙古农业大学_第4页
Python数据科学导引知到智慧树章节测试课后答案2024年秋内蒙古农业大学_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python数据科学导引知到智慧树章节测试课后答案2024年秋内蒙古农业大学第一章单元测试

大数据的起源是()。

A:金融

B:电信

C:公共管理

D:互联网

答案:互联网

机器学习的实质是()。

A:建立数据模型

B:挑出输入数据和输出数据的最佳映射关系/函数

C:衡量输入数据和输出数据的映射关系/函数的好坏

D:根据现有数据,寻找输入数据和输出数据的映射关系/函数

答案:根据现有数据,寻找输入数据和输出数据的映射关系/函数

Spark支持的分布式部署方式中哪个是错误的()。

A:sparkonmesos

B:sparkonYARN

C:standalone

D:Sparkonlocal

答案:Sparkonlocal

以下表述正确的是:()

A:深度学习是机器学习的一种。

B:人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。

C:机器学习指机器有学习的能力,是人类达成人工智能目标的手段。

D:人工智能是人们长远以来的目标,期待机器像人一样有智慧。

答案:深度学习是机器学习的一种。

;人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。

;机器学习指机器有学习的能力,是人类达成人工智能目标的手段。

;人工智能是人们长远以来的目标,期待机器像人一样有智慧。

有效抑制机器学习过拟合的方法是()

A:减少数据量。

B:加大数据量。

C:重新设计损失函数,引入平滑函数。

D:平滑损失函数。

答案:加大数据量。

;重新设计损失函数,引入平滑函数。

;平滑损失函数。

下面表述正确的()

A:迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。

B:监督学习指训练集所有输入数据都有相应输出数据与之对应。

C:监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。

D:强化学习指只有评价性输出结果的机器学习。

答案:迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。

;监督学习指训练集所有输入数据都有相应输出数据与之对应。

;监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。

;强化学习指只有评价性输出结果的机器学习。

关于Spark中的RDD描述正确的()

A:RDD(ResilientDistributedDatset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。

B:Resilient:表示弹性的,弹性表示。

C:Destributed:分布式,可以并行在集群计算。

D:Datset:就是一个集合,用于存放数据的。

答案:RDD(ResilientDistributedDatset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。

;Resilient:表示弹性的,弹性表示。

;Destributed:分布式,可以并行在集群计算。

;Datset:就是一个集合,用于存放数据的。

大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。()

A:对B:错

答案:对关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。()

A:对B:错

答案:错Spark的四大组件为SparkStreaming、Mlib、Graphx、SparkR。()

A:对B:错

答案:错

第二章单元测试

关于Python语言的变量,以下选项中说法正确的是()。

A:随时声明、随时使用、随时释放

B:随时命名、随时赋值、随时变换类型

C:随时命名、随时赋值、随时使用

D:随时声明、随时赋值、随时变换类型

答案:随时命名、随时赋值、随时使用

以下选项中,不是建立字典的方式是()。

A:d={'张三':1,'李四':2}

B:d={[1,2]:1,[3,4]:3}

C:d={1:[1,2],3:[3,4]}

D:d={(1,2):1,(3,4):3}

答案:d={[1,2]:1,[3,4]:3}

下列说法中正确的是()。

A:break用在while语句中,而continue用在for语句中

B:continue能结束循环,而break只能结束本次循环

C:break能结束循环,而continue只能结束本次循环

D:break用在for语句中,而continue用在while语句中

答案:break能结束循环,而continue只能结束本次循环

tuple(range(2,10,2))的返回结果为()。

A:(2,4,6,8)

B:[2,4,6,8]

C:[2,4,6,8,10]

D:(2,4,6,8,10)

答案:(2,4,6,8)

Python列表中所有元素必须为相同类型的数据。()

A:错B:对

答案:错在函数内部没有任何声明的情况下直接为某个变量赋值,这个变量一定是函数内部的局部变量。()

A:错B:对

答案:对在定义函数时,某个参数名字前面带有两个*符号表示可变长度参数,可以接收任意多个关键参数并将其存放于一个字典之中。()

A:错B:对

答案:对使用内置函数open()且以”w”模式打开的文件,文件指针默认指向文件尾。()

A:错B:对

答案:错下面代码的输出结果是()forsin"abc":

foriinrange(3):

print(s,end="")

ifs=="c":

break

A:aaabbbc

B:abbbccc

C:

aaabccc

D:aaabbbccc

答案:aaabbbc

下面代码的输出结果是()x=10y=3print(x%y,x**y)

A:130B:31000C:11000D:330

答案:11000

第三章单元测试

s=pd.Series(np.random.randint(59,100,5),index=list("ABCDE")),能够原地删除s[“A”]的操作是()。

A:s.drop(labels="A")

B:pd.drop(s,labels="A")

C:s.drop("A")

D:dels["A"]

答案:dels["A"]

若有grouped_sc=df.groupby('学校'),则查询查看分组数量应采用()

A:grouped_sc.ngroups。

B:grouped_sc.size()。

C:grouped_sc。

D:grouped_sc.head()。

答案:grouped_sc.ngroups。

下列方法中,能够利用pandas.DataFrame()创建DataFrame的是()。

A:通过随机函数创建

B:通过Python字典创建

C:通过Series创建

D:通过ndarray对象创建

答案:通过随机函数创建

;通过Python字典创建

;通过Series创建

;通过ndarray对象创建

关于缺失值填充函数pandas.DataFrame.fillna(),正确的说法是()。

A:method参数为pad表示用缺失值前面的值对缺失值进行填充。

B:axis参数表示填充维度,确定从行开始或是从列开始。

C:inplace参数用于指示是否原地替换,默认为True。

D:value参数用于指示用来填充缺失值的数据。

答案:method参数为pad表示用缺失值前面的值对缺失值进行填充。

;axis参数表示填充维度,确定从行开始或是从列开始。

;value参数用于指示用来填充缺失值的数据。

df包含"计划销售额"和"实际销售额"两列数据,若要筛选未完成计划销售额但实际销售额不低于4000的所有月份信息,可用的方式有()。

A:df[(df["计划销售额"]>df["实际销售额"])&(df["实际销售额"].ge(4000))]。

B:df[(df["计划销售额"]>df["实际销售额"])&(df["实际销售额"]>=4000)]。

C:df[(df["计划销售额"].gt(df["实际销售额"]))&(df["实际销售额"].ge(4000))]。

D:df.query("计划销售额>实际销售额&实际销售额>=4000")。

答案:df[(df["计划销售额"]>df["实际销售额"])&(df["实际销售额"].ge(4000))]。

;df[(df["计划销售额"]>df["实际销售额"])&(df["实际销售额"]>=4000)]。

;df[(df["计划销售额"].gt(df["实际销售额"]))&(df["实际销售额"].ge(4000))]。

;df.query("计划销售额>实际销售额&实际销售额>=4000")。

下列属于透视操作的是()。

A:pivot()。

B:pivot_table()。

C:transformer()。

D:crosstab()。

答案:pivot()。

;pivot_table()。

;crosstab()。

pandas读取csv文件时可使用usecols参数指定某个列作为索引。()

A:对B:错

答案:错pandas.DataFrame.sum(axis=1)表示对每行数据求和。()

A:错B:对

答案:对unstack()可将列旋转到行,从而将宽表变成长表。()

A:对B:错

答案:错

第四章单元测试

绘制折线图时用label参数可为图表添加图例,但必须与()配合使用。

A:label()。

B:ticks()。

C:legend()。

D:title()。

答案:legend()。

关于注释的说法中,正确的是()。

A:matplotlib.pyplot.annotate()的注释在静态图片中不可见。

B:matplotlib.pyplot.text()主要用于无指向型注释。

C:matplotlib对图表的注释分为静态文本注释和动画注释两种。

D:matplotlib.pyplot.annotate()主要用于动画型注释。

答案:matplotlib.pyplot.text()主要用于无指向型注释。

绘制折线图的函数是()。

A:bar()。

B:plot()。

C:polar()。

D:pie()。

答案:plot()。

在绘制两组数据对比的柱形图时,若希望两组柱形并列显示,应通过调整()实现。

A:参数x和width。

B:参数x和bottom。

C:参数x、width和bottom。

D:参数height和width。

答案:参数x和width。

导入matplotlib的可行的做法是()

A:frommatplotlibinmportpyplot。

B:importmatplotlib.pyplot。

C:importmatplotlib.pyplotasplt()。

D:importpyplotasplt。

答案:frommatplotlibinmportpyplot。

;importmatplotlib.pyplot。

;importmatplotlib.pyplotasplt()。

关于雷达图绘制,正确说法的有()。

A:xticks()可用来设置弧度信息。

B:使用polar()绘制极坐标系,然后用plot()绘制雷达图时无需闭合数据。

C:xticks()可用来设置半径信息。

D:直接使用polar()绘图时需使用np.concatenate()使数据闭合。

答案:xticks()可用来设置弧度信息。

;使用polar()绘制极坐标系,然后用plot()绘制雷达图时无需闭合数据。

;直接使用polar()绘图时需使用np.concatenate()使数据闭合。

关于箱线图绘制,正确说法的有()。

A:参数notch用于指示是否以凹口的形式展现箱线图,默认为凹口。

B:参数whis用于指定上下须与上下四分位的距离,默认为1.5倍的四分位差。

C:参数sym用于指定异常点的形状,默认为+号显示。

D:参数vert用于指示是否需要将箱线图垂直摆放,默认为水平放置。

答案:参数whis用于指定上下须与上下四分位的距离,默认为1.5倍的四分位差。

;参数sym用于指定异常点的形状,默认为+号显示。

fontdict是用来设置字体属性的字典型参数。()

A:错B:对

答案:对bar()函数可通过参数bottom选择水平/垂直的柱形条的绘制方式。()

A:错B:对

答案:错气泡图本质上仍属于散点图。()

A:错B:对

答案:对

第五章单元测试

两个变量y与x的回归模型中,通常用R方来刻画回归效果,则正确的叙述是()。

A:R方越小,残差平方和大。

B:R方越大,残差平方和大。

C:R方与残差平方和无关。

D:R方越小,残差平方和小。

答案:R方越小,残差平方和大。

如果拟合曲线几乎通过了所有实测数据点,很有可能出现的现象是()。

A:欠拟合。

B:正常拟合。

C:过拟合。

D:不确定。

答案:过拟合。

以下()是线性回归方程参数求解常用的方法。

A:梯度下降法。

B:插值法。

C:牛顿法。

D:穷举法。

答案:梯度下降法。

线性回归模型中的损失函数用来估量预测值与()的差异程度。

A:个体值。

B:真实值。

C:零值。

D:平均值。

答案:真实值。

与梯度下降法相比,当输入变量k较大时,正规方程法求解参数的速度要更慢。()

A:错B:对

答案:对梯度下降法需要选择学习率,需要多次迭代求解参数。()

A:对B:错

答案:对

A:B:C:D:

答案:;;

第六章单元测试

有关聚类分析说法错误的是()。

A:聚类分析无法提取样本特征

B:无需对样本进行标记

C:聚类分析簇间数据具有较大的差异性

D:聚类分析可以分析样本的分布特点

答案:聚类分析无法提取样本特征

下面算法中,算法分析是建立在凸球形的样本空间的是()。

A:K中心点算法

B:K-means

C:DBSCAN

D:凝聚聚类算法

答案:K中心点算法

;K-means

;凝聚聚类算法

轮廓系数只能用于K-means算法的评估。()

A:对B:错

答案:错DBSCAN算法对参数敏感。()

A:对B:错

答案:对凝聚聚类分析是一种自底向上的聚类分析算法。()

A:错B:对

答案:对关于K-means聚类说法正确的是()。

A:K-means需要事先指定K的数目

B:K-means的聚类中心是聚类中心的均值

C:K-means实现采用的是贪心策略

D:K-means的聚类中心一定是样本空间的数据

答案:K-means需要事先指定K的数目

;K-means的聚类中心是聚类中心的均值

;K-means实现采用的是贪心策略

K中心点算法是异常值敏感的聚类算法。()

A:错B:对

答案:对K-means算法是异常值敏感的聚类算法。()

A:对B:错

答案:对下面哪一个算法不是聚类分析算法()

A:KNNB:DBSCANC:K中心点算法D:

K-means

答案:KNN聚类分析的相似性度量方法,以下哪种方法只考虑了变量之间的方向()

A:B:C:D:

答案:

第七章单元测试

Logistic回归分析属于()回归

A:非概率型线性回归

B:概率型线性回归

C:非概率型非线性回归

D:概率型非线性回归

答案:非概率型线性回归

C4.5决策树构造算法的特征选择采用()

A:信息熵

B:信息增益

C:条件熵

D:基尼系数

答案:信息增益

关于朴素贝叶斯分类器,正确的有()

A:是一种概率分类器

B:利用贝叶斯公式将样本属于某个类别的概率转换为后验概率来计算

C:所谓“朴素”假设,即是样本特征(属性)的条件独立假设

D:所谓“朴素”假设,即是样本独立同分布的假设

答案:是一种概率分类器

;利用贝叶斯公式将样本属于某个类别的概率转换为后验概率来计算

;所谓“朴素”假设,即是样本特征(属性)的条件独立假设

支持向量机SVM算法采用的损失函数是()

A:Logistic损失函数

B:都可以

C:指数损失函数

D:铰链损失函数

答案:铰链损失函数

支持向量机分类器求解方法有()

A:随机梯度下降

B:序列最小优化

C:内点法

D:所有选项都不是

答案:随机梯度下降

;序列最小优化

;内点法

第八章单元测试

以下关于Boosting和Bagging说法正确的是()。

A:Bagging可以用来减小方差

B:Bagging是序列集成方法

C:AdaBoost是经典的Bagging算法

D:Boosting可以用来减小方差。

答案:Bagging可以用来减小方差

一般情况,在个体学习器性能相差较大时宜使用()结合策略。

A:学习法

B:投票法

C:加权平均法

D:集成法

答案:加权平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论