《机器学习-Python实践》试卷3

上传人：q*** IP属地：山东上传时间：2024-10-22 格式：DOCX 页数：8 大小：35.58KB 积分：12 举报 版权申诉

已阅读5页，还剩3页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第1页，共1页一、单项选择题（本大题共10小题，每题3分，共30分）试卷（2021试卷（2021-2022学年第1学期）考试科目机器学习-Python实践（A卷）适用专业班级（年级）得分命题人：审阅人：班级学号姓名考试科目装订线1、个人健康和年龄的相关系数是-1.09。根据这个你可以告诉医生哪个结论？（）A.年龄是健康程度很好的预测器B.年龄是健康程度很糟的预测器C.以上说法都不对D：两者没关系2、假如我们利用Y是X的3阶多项式产生一些数据（3阶多项式能很好地拟合数据）。那么，下列说法正确的是（多选）？（）A.简单的线性回归容易造成高偏差（bias）、低方差（variance）B.简单的线性回归容易造成低偏差（bias）、高方差（variance）C.3阶多项式拟合会造成低偏差（bias）、高方差（variance）D.3阶多项式拟合具备低偏差（bias）、低方差（variance）3、假如你在训练一个线性回归模型，有下面两句话：（）1.如果数据量较少，容易发生过拟合。2.如果假设空间较小，容易发生过拟合。关于这两句话，下列说法正确的是？A.1和2都错误B.1正确，2错误C.1错误，2正确D.1和2都正确4、假如我们使用Lasso回归来拟合数据集，该数据集输入特征有100个（X1，X2，…，X100）。现在，我们把其中一个特征值扩大10倍（例如是特征X1），然后用相同的正则化参数对Lasso回归进行修正。那么，下列说法正确的是？（）A.特征X1很可能被排除在模型之外B.特征X1很可能还包含在模型之中C.无法确定特征X1是否被舍弃D.以上说法都不对5、假如使用逻辑回归对样本进行分类，得到训练样本的准确率和测试样本的准确率。现在，在数据中增加一个新的特征，其它特征保持不变。然后重新训练测试。则下列说法正确的是？（）A.训练样本准确率一定会降低B.训练样本准确率一定增加或保持不变C.测试样本准确率一定会降低D.测试样本准确率一定增加或保持不变6、下面这张图是一个简单的线性回归模型,图中标注了每个样本点预测值与真实值的残差。计算SSE（平方误差和）为多少？（）A.3.02B.0.75C.1.01D.0.6047、关于“回归（Regression）”和“相关（Correlation）”，下列说法正确的是？注意：x是自变量，y是因变量。（）A.回归和相关在x和y之间都是互为对称的B.回归和相关在x和y之间都是非对称的C.回归在x和y之间是非对称的，相关在x和y之间是互为对称的D.回归在x和y之间是对称的，相关在x和y之间是非对称的8、关于AdaBoost，下列说法中正确的是（多选）：（）A.它是一种集成学习算法B.每个分类器的权重和被它正确分类的样本的权重相同C.后一个基学习器要依赖于前一个基学习器的分类错误率和样本的权重D.后一个基学习器每次只学习前一个基学习器被分错的样本9、集成学习策略有哪些（） A．投票法B．平均法C．学习法D．上述都有10、集成学习策略常用于分类的是：（）A．投票法B．平均法C．学习法D．上述都有二、判断题（本大题共10小题，每题1分，共10分）1、决策树短时间内处理大量数据，得到可行且效果较好的结果。（）朴素贝叶斯适合高维数据。（）标量是0阶张量。（）协方差是衡量两个变量线性相关性强度及变量尺度。（）联合分布可求边缘分布，但若只知道边缘分布，无法求得联合分布。（）随机变量可以分为离散型随机变量和连续型随机变量。（）矩阵的L0范数：矩阵的非0元素的个数，通常用它来表示稀疏，L0范数越小0元素越多，也就越稀疏。（）Adaboost算法流程计算该分类器的错误率，根据错误率计算要给分类器分配的权重。（）9、Adaboost算法流程将第一个分类器分错误的样本权重增加。（）10、Adaboost算法流程然后再用新的样本权重训练数据，得到新的分类器。（）三、填空（本大题共10小题，每题3分，共30分）1、一个表示一个单独的数，它不同于线性代数中研究的其他大部分对象（通常是多个数的数组）。2、马式距离的特征则是：。3、p(x|θ)是给定参数θ的概率分布：。4、基尼指数（基尼不纯度）=*。5、Gini指数越小表示集合中被选中的样本被分错的概率越小，也就是说集合的纯度。6、表示在样本集合中一个随机选中的样本被分错的概率。7、算法在决策树生成的过程中，用信息增益比来选择特征。8、聚类结果评估：分析结果，如距离误差和(SSE)等。9、人工神经网络（ArtificialNeuralNetworks，ANNs），也简称为神经网络（NNs），是模拟进行信息处理的一种数学模型，以对大脑的生理研究成果为基础，其目的在于模拟大脑的某些机理与机制，实现一些特定的功能。10、生物

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

《机器学习-Python实践》试卷3

文档简介

温馨提示

最新文档

评论

《机器学习-Python实践》试卷3

文档简介

温馨提示

最新文档

评论

相关文档