人工智能导论 习题答案(吕云翔)章节习题(第6章)_第1页
人工智能导论 习题答案(吕云翔)章节习题(第6章)_第2页
人工智能导论 习题答案(吕云翔)章节习题(第6章)_第3页
人工智能导论 习题答案(吕云翔)章节习题(第6章)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、人工智能导论习题答案机器学习章节习题习题选择题. Logistics regression和一般回归分析有什么区别?Logistics regression可以用来预测事件可能性的Logistics regression可以用来度量模型拟合程度Logistics regression可以用来估计回归系数D.以上所有.想在大数据集上训练决策树,为了减少训练时间,可以:A.增加树的深度B.增加学习率(learning rate)C.减少树的深度D.减少树的数量.以下说法正确的选项是:A. 一个机器学习模型,如果有较高准确率,说明这个分类器一定是好的B.如果增加模型复杂度,那么模型的测试错误率总是会

2、降低C.如果增加模型复杂度,那么模型的训练错误率通常是会降低的D.不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别 进行学习.如果SVM模型欠拟合,以下方法哪些可以改进模型:A.增大惩罚参数C的值B.减小惩罚参数C的值C.减小核系数(gamma参数).当模型的bias高时,我们如何降低它?A.在特征空间中减少特征B.在特征空间中增加特征C.增加数据点.在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题A增加训练集量B减少神经网络隐藏层节点数C删除稀疏的特征SD SVM算法中使用高斯核/RBF核代替线性核.关于SVM泛化误差描述正确的选项是A、超平面与支持向量之

3、间距离B、SVM对未知数据的预测能力C、SVM的误差阈值.如果使用数据集的全部特征并旦能够到达100%的准确率,但在测试集上仅能 到达7()%左右,这说明:A、欠拟合B、模型很棒C、过拟合. 一般来说,以下哪种方法常用来预测连续独立变量?A.线性回归B.逻辑回顾C.线性回归和逻辑回归都行D.以上说法都不对10.下面三张图展示了对同一训练样本(散点),使用不同的模型拟合的效果(曲 线)。那么,我们可以得出哪些结论(多项选择)?A.第1个模型的训练误差大于第2个、第3个模型B.最好的模型是第3个,因为它的训练误差最小C.第2个模型最为“健壮”,因为它对未知样本的拟合效果最好D.第3个模型发生了过拟

4、合E.所有模型的表现都一样,因为我们并没有看到测试数据判断题.训练一个支持向量机,除去非支持向量后仍能分类;.在线性可分的情况下,支持向量是那些最接近决策平面的数据点;.构建一个最简单的线性回归模型需要2个系数(只有一个特征);.知道变量的均值(Mean)和中值(Median),即可以计算到变量的偏斜 度(Skewness);. Logislics regression回归的RELU函数将输出概率限定在0,1之间。.k折交叉验中的k值并不是越大越好,k值过大,会降低运算速度;.回归模型中存在多重共线性(multicollinearity)的问题,可以通过剔除 所有的共线的变量来解决此问题;.评估训练后的模型,发现模型存在高偏差,可以通过增加模型的特征的数 量来解决此问题;.点击率预测是一个正负样本不平衡问题(例如99%的没有点击,只有1 %点击)。假如在这个非平衡的数据集上建立一个模型,得到训练样本的正 确率是99%o那么,此时模型正确率并不高,应该建立

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论