数据科学技术与应用学习通超星期末考试答案章节答案2024年_第1页
数据科学技术与应用学习通超星期末考试答案章节答案2024年_第2页
数据科学技术与应用学习通超星期末考试答案章节答案2024年_第3页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据科学技术与应用学习通超星期末考试章节答案2024年DataFrame对象使用sort_values方法按照某列进行排序后,只有该列数据按顺序调整位置,其他列保此原顺序不变。

答案:错在数据统计中,均值和中位数是相同的概念。

答案:错清洗数据有滤除和填充两种方法,当数据集比较小时,应尽量选择数据____的方式来清洗数据。

答案:填充数据记录了我国4个直辖市第一(种植业、林业、牧业和渔业)、第二(采掘业,制造业,电力、煤气、水的生产和供应业、建筑业)、第三产业(其他)2017年产值的增加量(单位:亿元)。创建了如下数据表:frompandasimportDataFramedata=[[98.99,9251.40,20783.47],[120.45,5310.63,22569.27],[218.28,7590.36,10786.74],[1339.62,8596.61,9564.04]]value=DataFrame(data,index=['上海','北京','天津','重庆'],columns=['第一','第二','第三'])现在需要在value中新增一列‘总增量’,记录每个城市的三类产业产值增量总和,使用语句:value['____']=value.sum(axis=1)

答案:总增量关于DataFrame数据对象的添加和删除操作,_______是正确的描述。

答案:DataFrame对象不能直接添加新的行数据;可以设置axis的值删除DataFrame指定行或列的数据可以使用DataFrame对象的corr()方法求两列数据的相关系数,关于相关系数的描述中________是正确的。

答案:相关系数为零时两列数据相关性最小使用merge方法对DataFrame对象temp1和temp2进行列上的合并时,设置参数________,实现按照两个对象键值的交集进行合并。

答案:how=inner调用DataFrame对象temp的fillna方法填充空值时,设置________参数可以控制是否直接更新temp对象。

答案:inplace假定DataFrame对象temp中共有12列,语句________删除空值(NaN)个数大于3的行。

答案:temp.dropna(threshold=9)统计DataFrame对象stu中各‘省份’同学人数的方法是________。

答案:stu[‘省份’].value_counts()统计量“方差”描述________。

答案:样本个体距离均值的离散程度有3张同学信息表,存储为DataFrame对象stu1,stu2,stu3,具有相同的列索引,合并的方法是________。

答案:pd.concat([stu1,sut2,sut3])关于数据文件读写,_______是错误的描述。

答案:文件中第一行必须给出列的索引名(columns),否则pandas无法读取各列内容创建students对象,下面语句筛选出_______大于67公斤同学的_______。students数据如下:

ageheightweight1

19

170

682

20

165

653

18

175

65>>>students.loc[students[‘weight’]>67,

‘height’]

答案:体重、身高创建students对象,_______语句可以选出第二个同学的身高。students数据如下:

ageheightweight1

19

170

682

20

165

653

18

175

65

答案:students.loc[2,'height']创建height对象,_______语句能选出高度为190的数据。height=Series({'13':187,'14':190,'7':185,'2':178,'9':185})

答案:height[1]关于DataFrame和Series对象,下列叙述正确的是_______。

答案:Series对象主要用于处理一维数据CSV文件是_______,可以使用_______查看。

答案:纯文本文件,文本编辑器DataFrame对象df中基于位置序号选取第2行第3列数据的方式是_______。(序号从0开始)

答案:df.iloc[1,2]DataFrame对象的列索引通常表示________。

答案:每列数据对应的现实概念观察样本多个属性值两两之间的相关性,可采用pandas提供了散点图矩阵pd.plotting.____函数。

答案:scatter_matrix利用Series.plot绘制概率密度图时,将kind参数设置为____。

答案:'kde'/kde/'density'/densityDataFrame对象temp记录了8个城市4个季度的第三产业产值,利用DataFrame.plot绘制柱状图时,可以设置参数____控制画堆叠或复式柱状图。

答案:stacked观察男、女同学对“数据科学”课程的兴趣程度与课程成绩之间的关系,应使用分组____。

答案:散点图/scatterdiagram/ScatterDiagram_________可用于展示离散数据。

答案:柱状图;饼图关于饼图的描述,错误的是_________。

答案:描述总体各样本区间的样本数量下面关于直方图的说法中,错误的是_________。

答案:分箱的数量与数据集的分布无关绘制多个子图的正确方法是_________。

答案:导入matplotlib.pyplot库,创建figure对象,调用figure.add_subplot函数比较3个班级学生高数成绩的分位数分布并观察异常值,可选择_________。

答案:箱须图下面关于使用pyplot和pandas提供的绘图函数的说法中,错误的是_________。

答案:在同一figure对象中,pyplot和pandas的绘图函数不可以混合使用/images/questionbank/icon/default.png

答案:对深度学习就是具有很多个隐藏层、每个隐藏层具有很多结点的神经网络。

答案:对神经网络中每层中不同的结点通常采用不同的激活函数。

答案:错K-means算法迭代过程同时最小化簇内凝聚度和最大化簇间分离度。(判断1分)

答案:错同一个数据集上,通常使用随机森林的方法训练分类模型需要的时间比C4.5决策树更长。

答案:对Precision(精确率)指分类问题中真实正例被正确预测出的比例。

答案:错回归分析中,性能评价指标均方根误差RMSE与测试集的大小无关。

答案:错神经网络可用于_________等问题的建模分析。(多选1分)

答案:识别垃圾短信;根据房屋特性预测房价;识别车牌_________属于神经网络常用的激活函数。(多选1分)

答案:Sigmoid;tanh;ReLU;Softmax关于训练神经网络的说法中,不正确的是_________。

答案:神经网络的隐藏层越少,训练时间越长K-means算法的核心是_________。

答案:样本间相似度计算关于聚类分析的说法,不正确的是_________。

答案:“簇”越多说明聚类效果越好K-means算法中K表示_________。

答案:聚类得到的类别数数据建模分析,_________方法需要计算样本之间的距离。

答案:k-meansF1score可用于衡量分类模型性能,根据以下混淆矩阵,F1=_________。真实类预测类Class=YesClass=NoClass=Yes(正例)abClass=No(反例)cd

答案:2a/(2a+b+c)构建决策树的算法在数据集中选择合适的_________作为树的结点。

答案:特征项建模分析时,通常用于训练的样本数量_________测试集的样本数量。

答案:大于________属于机器学习中的回归问题。

答案:根据房屋特性预测房价_________属于有监督学习(SupervisedLearning)的任务。

答案:分类问题(Classification)目前人工智能技术,特别是机器学习,主要模拟了人的_________思维过程。

答案:学习垃圾邮件分类,训练集中每个邮件的标签:1(垃圾)或0(正常),是由人工标注的。

答案:对对文本分类,提取的文本特征个数越多,特征向量维度越高,则分类准确度就越高。

答案:错词袋模型,将不同长度的文本表示成不同长度的向量。

答案:错分词工具库Jieba支持________分词模式。

答案:全模式;精确模式;搜索引擎模式文本处理中,____任务将一种自然语言文本自动翻译成另一种自然语言文本。

答案:机器翻译基于词袋模型进行文本数据分类时,从句子中提取的最重要的特征量为________。

答案:词频在文本处理常见任务类中,垃圾邮件自动处理应归类于________。

答案:文本分类词袋模型的主要缺点是________。

答案:只考虑文本中的词信息,忽略了词序、语法以及句法信息中文分词的作用是________。

答案:将中文句子划分为以词为单位的词序列识别文本中包含的情感通常使用________方法处理。

答案:文本分类Keras为建立CNN模型,提供了_______等常用层(layer)。

答案:Conv2D;MaxPooling2D与全连接前馈神经网络相比,用于图像分类的卷积神经网络CNN主要通过________操作来减少网络参数数量,提高训练效率。

答案:卷积;池化________都是著名的图像分类深度学习模型,用户可以下载这些预训练模型直接使用。

答案:VGG19;ResNet50;InceptionV3卷积神经网络的核心是通过卷积块自动提取图像的____。

答案:局部特征图片“Robot.jpg”为400*372(宽*高)的彩色图片,下列Python语句输出为________。fromskimageimportioprint(io.imread("robot.jpg",1).shape)

答案:(372,400)一个4096*2160的RGB24数字图像,需要占用存储空间约为________。

答案:253MB数字图像识别采用________建模分析方法实现。

答案:分类Python在内存中使用________来存储图像的数据。

答案:多维数组计算机数字图像,按照颜色和灰度的多少将图像分为________。

答案:二值图像、灰度图像、RGB彩色图像时间序列模型的预测结果与真实数据通常存的差距,预测时间点与原序列时间点间隔越远,差距越小。

答案:错使用普通话的语音素材作为语音库训练出的语音识别系统能够识别上海话。

答案:错时序数据可以采用深度神经网络模型来建模实现预测分析。

答案:对通常时序数据中邻近的数据点之间具有一定的相关性,而这种相关性与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论