版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第1页,共1页一、单项选择题(本大题共10小题,每题3分,共30分)试卷(试卷(学年第1学期)考试科目机器学习-Python实践(A卷)适用专业班级(年级)得分命题人:审阅人:班级学号姓名考试科目装订线1、关于“回归(Regression)”和“相关(Correlation)”,下列说法正确的是?注意:x是自变量,y是因变量。()A.回归和相关在x和y之间都是互为对称的B.回归和相关在x和y之间都是非对称的C.回归在x和y之间是非对称的,相关在x和y之间是互为对称的D.回归在x和y之间是对称的,相关在x和y之间是非对称的2、逻辑回归将输出概率限定在[0,1]之间。下列哪个函数起到这样的作用?()A.Sigmoid函数B.tanh函数C.ReLU函数D.LeakyReLU函数3、关于两个逻辑回归模型中的β0、β1值,下列说法正确的是?注意:y=β0+β1*x,β0是截距,β1是权重系数。()A.绿色模型的β1比黑色模型的β1大B.绿色模型的β1比黑色模型的β1小C.两个模型的β1相同D.以上说法都不对4、在n维空间中(n>1),下列哪种方法最适合用来检测异常值?()A.正态概率图B.箱形图C.马氏距离D.散点图5、逻辑回归与多元回归分析有哪些不同之处?()A.逻辑回归用来预测事件发生的概率B.逻辑回归用来计算拟合优度指数C.逻辑回归用来对回归系数进行估计D.以上都是6、如果一个SVM模型出现欠拟合,那么下列哪种方法能解决这一问题?()A.增大惩罚参数C的值B.减小惩罚参数C的值C.减小核系数(gamma参数)D.以上都不是7、我们知道二元分类的输出是概率值。一般设定输出概率大于或等于0.5,则预测为正类;若输出概率小于0.5,则预测为负类。那么,如果将阈值0.5提高,例如0.6,大于或等于0.6的才预测为正类。则准确率(Precision)和召回率(Recall)会发生什么变化(多选)?()A.准确率(Precision)增加或者不变B.准确率(Precision)减小C.召回率(Recall)减小或者不变D.召回率(Recall)增大8、集成学习策略常用于处理数值问题的是:()A.投票法B.平均法C.学习法D.上述都有9、关于学习法表述正确的事()A.平均法和投票法是对弱学习器的结果做平均或者投票,相对比较简单,但是可能学习误差较大,于是就有了学习法。B.学习法是一种更为强大的结合策略,即通过另一个学习器来进行结合。C.Stacking是学习法的典型代表。Stacking先从初级数据集训练出初级学习器,然后“生成”一个新数据集用于训练次级学习器。在这个新数据集中,初级学习器的输出被当作样例输入特征。D.上述都对10、以下关于Bagging算法的特点描述正确的是()A.Bagging通过降低基学习器的方差改善了泛化误差B.bagging对样本进行有放回的重采样,学习结果是各个学习模型的平均值C.由于重采样的样本集具有相似性以及使用相同的学习器模型,因此,各学习模型的结果相近,即模型有近似相等的偏差和方差。D.以上描述都对二、判断题(本大题共10小题,每题1分,共10分)1、矩阵的L0范数:矩阵的非0元素的个数,通常用它来表示稀疏,L0范数越小0元素越多,也就越稀疏。()2、随机事件X所包含的信息量与其发生的概率有关。发生的概率越小,其信息量就越小。()3、SVM通过寻找使得训练数据尽可能分开且分类间隔最大的超平面实现结构风险最小化。()4、logit回归输出的是Y属于某一类的概率,也可以表示某事件发生的概率。()5、P(θ|x)是在数据X的支持下,θ发生的概率:后验概率。()6、P(θ)是在没有数据支持下,θ发生的概率:先验概率。()7、F1值定义为:F1=2PR/(P+R)。()8、Adaboost算法流程将所有弱分类器加权求和,得到分类结果(注意是分类器权重)。()9、集成学习通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,以达到提高预测准确率的目的。()10、Boosting是一个顺序过程,每个后续模型都会尝试纠正先前模型的错误,后续的模型依赖于之前的模型。()三、填空(本大题共10小题,每题3分,共30分)1、算法利用信息增益进行特征的选择,信息增益反映的是给定条件后不确定性减少的程度。2、机器学习中做特征选择时,可能用到的、、、。3、已知坐标轴中两点A(2,−2)B(−1,2),这两点的曼哈顿距离(L1距离)是。4、求函数机制的方法有两大类,分别是和。5、损失函数也叫或。6、从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化叫。7、回归问题对数值型连续随机变量进行预测和建模的监督学习算法。回归往往会通过计算来确定模型的精确性。8、人工神经元模型可以看成是由3种基本元素组成,,。9、学习算法是指针对学习问题的明确规则,学习类型是由参数变化发生的形式决定的,不同的学习算法对神经元的权值调整的表达式是不同的。人工神经网络常用的算法有,,。10、在最基本的BP算法中,学习率在整个训练过程是保持不变的,学习率过,算法可能振荡而不稳定;学习率过,则收敛速度慢,训练时间。四、简答题(本大题共3小题,共30分)1、简单介绍下Logistics回归。?2、常见的分类算法有哪些?3、机器学习能解决哪些问題?每一类使用的常用方法有哪些?举例说明其应用?一、选择题1.C 2.A 3.B 4.C 5.D 6.A 7.AC 8.B 9.D 10.D二、判断题1.对 2.错 3.对 4.对 5.对 6.对 7.对 8.对 9.对 10.对三、填空题1.ID3 2.卡方信息增益平均互信息期望交叉熵 3.7 4.解析解(闭式解)数值解 5.代价函数目标函数 6.特征选择 7.误差(Error) 8.一组连接一个加法器一个激活函数 9.有监督Hebb算法单层感知器梯度LMS算法 10.大小长四、简答题1、答:Logistic回归目的是从特征学习出一个0/1分类模型,而这个模型是将特性的线性组合作为自变量,由于自变量的取值范围是负无穷到正无穷。因此,使用logistic函数(或称作sigmoid
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 隧道防排水专项施工方案改
- 服装店买卖合同协议
- 全新员工忠诚承诺与发展保证
- 便捷办公服务协议
- 分包协议合同中的权益保护
- 政府采购合同性质的解读与思考
- 活动板房建设施工招标
- 油漆工程承揽协议范本样本
- 配电工程招投标操作规范
- 起重机招标文件细节解析
- 2024年天津市专业技术人员继续教育公需课考试题+答案 (四套全)
- 煤矿带式输送机保护装置安装试验规定
- (全新)中职单招机械类技能考试复习试题库(含答案)
- 技术售后人员年终总结
- MOOC 城市生态学-华东师范大学 中国大学慕课答案
- (2024年)《豆芽发芽生长过程观察》ppt文档全文预览
- 口腔科护理技术课件
- 《早期教育概论》课程标准
- 部分地区高二上学期期末语文试卷汇编文言文阅读(含答案)
- 药物分析年终述职报告
- 电气安全与静电防护技术
评论
0/150
提交评论