《数据科学导论》20春期末考核答卷_第1页
《数据科学导论》20春期末考核答卷_第2页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《数据科学导论》20春期末考核-00001试卷总分:100得分:70一、单选题(共15道试题,共30分)1.下面不是分类的常用方法的有()K近邻法朴素贝叶斯决策树条件随机场标准答案:DBFR聚类用于在()欧氏空间中对数据进行聚类高维B冲维低维中高维标准答案:A聚类是一种()。有监督学习无监督学习强化学习半监督学习标准答案:B4.数据库中相关联的两张表都存储了用户的个人信息,但在用户的个人信息发生改变时只更新了一张表中的数据,这时两张表中就有了不一致的数据,这属于()异常值缺失值不一致的值重复值标准答案:C5.某商品的产量(X,件)与单位成本(Y,元/件)之间的回归方程为r=100-1.2X,这说明()。产量每增加一台,单位成本增加100元产量每增加一台,单位成本减少1.2元产量每增加一台,单位成本平均减少1.2元产量每增加一台,单位平均增加100元标准答案:C6•在k近邻法中,选择较小的k值时,学习的“近似误差”会(),“估计误差”会()。减小,减小减小,增大增大,减小增大,增大标准答案:B7.在回归分析中,自变量为(),因变量为()。离散型变量,离散型变量连续型变量,离散型变量离散型变量,连续型变量连续型变量,连续型变量标准答案:D手肘法的核心指标是()。TOC\o"1-5"\h\zSESSSERMSEMSE标准答案:B特征选择的四个步骤中不包括()子集产生子集评估子集搜索子集验证标准答案:C一元线性回归中,真实值与预测值的差称为样本的()。误差方差测差残差标准答案:DK-means聚类适用的数据类型是()。数值型数据字符型数据语音数据所有数据标准答案:A以下哪些不是缺失值的影响()数据建模将丢失大量有用信息数据建模的不确定性更加显著对整体总是不产生什么作用包含空值的数据可能会使建模过程陷入混乱,导致异常的输出标准答案:C下列两个变量之间的关系中,哪个是函数关系()。人的性别和他的身高人的工资与年龄正方形的面积和边长温度与湿度标准答案:C考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()1,2,3,41,2,3,51,2,4,51,3,4,5标准答案:C单层感知机模型属于()模型。二分类的线性分类模型二分类的非线性分类模型多分类的线性分类模型多分类的非线性分类模型标准答案:A二、多选题(共5道试题,共10分)系统日志收集的基本特征有()高可用性高可靠性可扩展性高效率标准答案:ABC距离度量中的距离可以是()欧式距离曼哈顿距离Lp距离Minkowski距离标准答案:ABCDK-means聚类中K值选取的方法是()。密度分类法手肘法大腿法随机选取标准答案:AB多层感知机的学习过程包含()。信号的正向传播信号的反向传播误差的正向传播误差的反向传播标准答案:AD一元回归参数估计的参数求解方法有()。最大似然法距估计法最小二乘法欧式距离法标准答案:ABC三、判断题(共15道试题,共30分)Jaccard系数只关心个体间共同具有的特征是否一致这个问题。标准答案:正确22•标准BP算法是在读取全部数据集后,对参数进行统一更新的算法。标准答案:错误使用SVD方法进行图像压缩不可以保留图像的重要特征。标准答案:错误特征选择和降维都是用于减少特征数量,进而降低模型复杂度、防止过度拟合。标准答案:正确一个人的身高与体重之间具有函数关系。标准答案:错误K均值(K-Means)算法是密度聚类。标准答案:错误数据科学可以回答复杂的问题,发现世界中隐藏的联系并预测和指导未来。标准答案:正确选择较小的k值,相当于用较小的邻域中的训练实例进行预测,学习的“近似误差”会减小,“估计误差”会增大,预测结果会对近邻的点实例点非常敏感。标准答案:正确利用K近邻法进行分类时,使用不同的距离度量所确定的最近邻点都是相同的。标准答案:错误对于项集来说,置信度没有意义。标准答案:正确每个类的先验概率可以通过属于该类的训练记录所占的比例来估计。标准答案:正确当维度增加时,特征空间的体积增加得很快,使得可用的数据变得稠密。标准答案:错误利用K近邻法进行分类时,k值过小容易发生过拟合现象。标准答案:正确聚合方法是自底向上的方法。标准答案:正确平均减少的不纯度越大,则特征重要度越高。标准答案:正确四、主观填空题(共5道试题,共10分)##感知机足以解决任何复杂的分类问题。标准答案:双隐层判定系数取值范围为[0,1],判定系数越接近##,表明变量之间的相关性越强。标准答案:1在线性回归分析中,当输入特征的维度从一维增加到d维(d>1),则该问题为##问题。标准答案:多元线性回归多元线性回归中,在有统计学意义的前提下,标准化偏回归系数的绝对值越大,说明相应的自变量对y的作用##。标准答案:越大在k近邻法中,通常采用##来选取最优的k值。标准答案:交叉验证法五、简答题(共2道试题,共20分)单层感知机和多层感知机分别解决的是哪类问题?标准答案:<p>1).单层感知机只能解决线性可分的问题;).多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论