版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1页,共1页一、单项选择题(本大题共10小题,每题3分,共30分)试卷(试卷(学年第1学期)考试科目机器学习-Python实践(A卷)适用专业班级(年级)得分命题人:审阅人:班级学号姓名考试科目装订线1、点击率预测是一个正负样本不平衡问题(例如99%的没有点击,只有1%点击)。假如在这个非平衡的数据集上建立一个模型,得到训练样本的正确率是99%,则下列说法正确的是?()A.模型正确率很高,不需要优化模型了B.模型正确率并不高,应该建立更好的模型C.无法对模型做出好坏评价D.以上说法都不对2、如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型,下列哪种做法是正确的?()A.增加树的深度B.增加学习率C.减小树的深度D.减少树的数量3、我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型?()A.对训练集随机采样,在随机采样的数据上建立模型B.尝试使用在线机器学习算法C.使用PCA算法减少特征维度D.以上都对4、机器学习中做特征选择时,可能用到的方法有?(多选)()a.卡方b.信息增益c.平均互信息d.期待交叉熵5、如何在监督式学习中使用聚类算法(多选)?()A.首先,可以创建聚类,然后分别在不同的集群上应用监督式学习算法B.在应用监督式学习算法之前,可以将其类别ID作为特征空间中的一个额外的特征C.在应用监督式学习之前,不能创建聚类D.在应用监督式学习算法之前,不能将其类别ID作为特征空间中的一个额外的特征6、下面哪句话是正确的?()A.机器学习模型的精准度越高,则模型的性能越好B.增加模型的复杂度,总能减小测试样本误差C.增加模型的复杂度,总能减小训练样本误差D.以上说法都不对7、如果使用线性回归模型,下列说法正确的是?()A.检查异常值是很重要的,因为线性回归对离群效应很敏感B.线性回归分析要求所有变量特征都必须具有正态分布C.线性回归假设数据中基本没有多重共线性D.以上说法都不对8、以下关于Bagging特点的描述不正确的是()A.Bagging是一个很低效的集成学习算法B.Bagging复杂度与基学习器同阶C.由于每一个样本被选中的概率相同,因此bagging并不侧重于训练数据集中的任何特定实例。D.对于噪声数据,bagging不太受过分拟合的影响。9、下面哪个选项中哪一项属于确定性算法?()A.随机森林B.PCAC.KmeansD.GBDT10、下列属于无监督学习的是()A、k-meansB、SVMC、最大熵D、CRF二、判断题(本大题共10小题,每题1分,共10分)1、FP——将负类预测为正类数。()2、交叉熵损失函数的好处是可以克服方差代价函数更新权重过慢的问 题。()3、逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的。()4、决策树容易发生欠拟合。()5、决策树容易发生过拟合。()6、SVM无法做多分类。()7、SVM自带正则项。()8、先从初始训练集训练出一个基学习器,再根据基学习器的表现对训 练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多的 关注,然后基于调整后的样本分布来训练下一个基学习器。()9、Boosting是一个迭代的过程,通过改变训练样本的分布,使得基分 类器聚焦在那些很难分的样本上。()10、Boosting结合了很多弱学习器来形成一个强学习器,单个模型表 现不佳,但它们在数据集的某些部分表现很好。()三、填空(本大题共10小题,每题3分,共30分)1、回归问题对数值型连续随机变量进行预测和建模的监督学习算法。回归往往会通过计算来确定模型的精确性。2、评判分类效果好坏的三个指标就是上面介绍的三个指标:,,。3、提取出的正确信息条数/提取出的信息条数是。4、模型把训练样本学习“太好了”,可能把一些训练样本自身的特性当做了所有潜在样本都有的一般性质,导致泛化能力下降叫。5、模型没有很好地捕捉到数据特征,不能够很好地拟合数据叫。6、分类是预测,比如把人分为好人和坏人之类的学习任务。7、训练用到的每个样本叫。8、boosting算法得基本原理,以及的三种典型算法原理:,,。9、Adaboost提供一种,在框架内可以使用各种方法构建子分类器,可以使用简单的弱分类器,不用对特征进行筛选,也不存在过拟合的现象。10、Adaboost算法不需要的先验知识,最后得到的强分类器的分类精度依赖于所有弱分类器。无论是应用于人造数据还是真实数据,Adaboost都能显著的提高学习精度。四、简答题(本大题共3小题,共30分)1、常见的监督学习算法有哪些?带核的SVM为什么能分类非线性问题?3、举例说明机器学习的基本过程,并举例说明基本步骤各有哪些方法?一、选择题1.B 2.C 3.D 4.ABCD 5.AB 6.C 7.A 8.A 9.B 10.A二、判断题1.对 2.对 3.对 4.对 5.对 6.错 7.对 8.对 9.对 10.对 三、填空题1.误差(Error) 2.正确率召回率F值 3.正确率 4.过拟合 5.欠拟合 6.离散值 7.训练样本 8.adaboostGBM(Gradientbosstingmachine)XGBoost 9.框架 10.弱分类器
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山西运城农业职业技术学院《电视栏目包装》2023-2024学年第一学期期末试卷
- 山西应用科技学院《设计思维与方法》2023-2024学年第一学期期末试卷
- 山西应用科技学院《风景园林规划与设计1》2023-2024学年第一学期期末试卷
- 山西医科大学《食品工艺学》2023-2024学年第一学期期末试卷
- 2024年度标准运输设备租赁合同版
- 2024年白叶离婚合同标准格式版B版
- 2024年标准化树苗买卖合同样本一
- 2024年民间借款公证合同样本
- 2024年标准建设项目分包协议版B版
- 2024年物流运输车辆智能监控系统协议3篇
- 美团合作协议书范本(2024版)
- 第21课《小圣施威降大圣》课件 2024-2025学年统编版语文七年级上册
- AQ/T 2061-2018 金属非金属地下矿山防治水安全技术规范(正式版)
- 天津市部分区2022-2023学年七年级上学期期末练习生物试题
- 小学三年级-安全知识考试试题-(附答案)-
- 医院门诊医生绩效考核标准及评分细则
- MOOC 体育保健学-江西财经大学 中国大学慕课答案
- 广东省深圳市罗湖区2022-2023学年二年级上学期数学期中复习试卷
- 康复科护理工作总结及计划
- 基于VMI的库存管理
- 建筑工程钢结构焊接变形的控制措施
评论
0/150
提交评论