机器学习学习通超星期末考试答案章节答案2024年_第1页
机器学习学习通超星期末考试答案章节答案2024年_第2页
机器学习学习通超星期末考试答案章节答案2024年_第3页
免费预览已结束,剩余3页可下载查看

付费下载

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习学习通超星期末考试章节答案2024年假定A的取值范围是-1075~923。使用十进制缩放规范化方法转换-1075结果为:

,923转换结果为:

答案:-0.1075;0.0923假定属性平均家庭总收入的均值和标准差分别为9000元和2400元,值12600元使用z-score规范化转换结果为:

答案:1.5使用min-max方法规范化数据组:200,300,400,600,1000的结果分别是

答案:0;0.125;0.25;0.5;1/star3/origin/4bf8e7c2bac9c9f3c681e68be69b7b02.png

答案:0.033使用KNN算法对两个未知类型的样本进行分类(冰川水或者湖泊水),样本数据如下表所示,其中K=3,即选择最近的3个邻居,试问表中样本G的类型是

,H的类型是

。样本Ca+浓度Mg+浓度Na+浓度Cl-浓度类型A0.1冰川水B0.3湖泊水C0.3冰川水D0.1冰川水E0湖泊水F0.4湖泊水G0.2?H0.2?

答案:湖泊水;冰川水/star3/origin/eebcf2c2a8197dec7c2429b53ae7bbb4.png

答案:0.926/star3/origin/09d56ee143f35ebc99fa20733fda5b6b.png

答案:0.966;0.875;0.918机器学习映射规则的构造,有哪三个要素1._____2.______3._______

答案:模型结构;

模型;目标函数;

策略;优化算法;

算法机器学习有哪3个基本流程(基本问题)1._____2._____3.______

答案:特征提取;规则构造;模型评估生成多项式特征的作用有哪些:

答案:增加特征的维度;在模型中加入非线性映射关系;可以在模型中加入特征间的交互关系;将多项式特征输入线性回归模型就是多项式回归模型关于离散型特征的表述哪些是正确的

答案:离散型特征是指特征不是连续数值型的而是分类型的;对于某些模型离散型特征需要编码为数字才能使用;离散型特征的常用编码方式有One-Hot编码;某些情况下离散型特征更适合用整数编码连续型特征的标准化(归一化)缩放有哪些作用

答案:将有量纲的数据转化为无量纲数据;将不同维度的特征值缩放到相同的范围,避免数量级大的特征被模型误认为占主导地位;提升模型优化的收敛速度关于样本划分下列说法错误的是?

答案:相比于自助法,在初始数据量较小时交叉验证更常用关于训练集和测试集的划分,下面比较好的做法是:

答案:将所有数据先随机打乱顺序,平均分成5份,轮流拿出其中1份作为测试集,其余的4份做为训练集,各次测试集预测的正确率求均值,正确率均值最高的模型就是我们所要选的模型关于面向回归任务模型的评价指标,下面错误的说法是

答案:R2(R-Squared)指标值越小精确度越高关于面向分类任务模型的评价指标,下面说法正确的是:

答案:F1,AUC两个指标都可以用来评价模型的综合性能关于面向分类任务模型的评价指标,下面说法错误的是:

答案:正确率高的模型一定是好的模型提高模型容量(模型复杂度)一定会导致如下效果,但不包括

答案:降低泛化误差/star3/origin/9794ae34610d49b6e0c3f427a73a8781.png

答案:欠拟合,过拟合关于训练误差和泛化误差正确的说法是

答案:测试误差是模型在测试样本集上的整体误差,通常用测试误差近似替代泛化误差通过历史数据预测股票价格是哪一种机器学习任务类型

答案:监督学习;回归/star3/origin/4a5b04842a84802de05a8c73178d0015.png

答案:特征值下列有关机器学习的说法,错误的是?

答案:机器学习和人工智能是同一个概念,其研究对象就是人工智能的算法/ananas/latex/p/4783034

答案:0.983;0.9833;0.945降低模型容量(复杂度)的方法除了范数惩罚,还有决策树模型的__________,__________和神经网络模型的__________。

答案:预剪枝;后剪枝;随机失活使用L1范数作为惩罚函数的线性回归又称为_______,使用L2范数作为惩罚函数的线性回归又称为_______。

答案:Lasso回归;岭回归通过样本改善模型的手段有哪些:

答案:增加样本采样;样本增强;过采样;欠采样关于范数惩罚下面说法正确的是:

答案:范数惩罚可以降低模型容量(复杂度);L1范数惩罚的有特征选择的作用;线性回归模型采用L2范数惩罚还可以避免线性方程组因奇异而无法求解的问题如果一个模型在训练集上正确率为99%,测试集上正确率为60%。我们应该怎么做改进?

答案:加入正则化项;增加样本数量;减少模型复杂度关于随机梯度法下面说法错误的是:

答案:随机梯度法每次更新参数的方向都是目标函数减小的方向关于模型的迭代优化算法下面说法错误的是:

答案:梯度下降法搜索的是目标函数极小值点,因此求目标函数的极大值点不能使用梯度下降法对于极大似然估计和极大后验估计下面说法错误的是:

答案:极大后验估计比极大似然估计更容易过拟合关于最小二乘估计下面说法错误的是:

答案:因为误差最小,最小二乘估计求解的模型参数就是最好的模型参数/star3/origin/73d8d9548f7b4b613e3ba5b655169bf9.png

答案:颜色为什么当两个模型的训练误差相同或接近的时候,通常会选择比较简单的一个()

答案:在相同的经验风险下,复杂度小的模型的结构风险更小下面关于SVM算法运用核函数作用,错误的是()

答案:生成数量较少的支持向量SVM分类器模型中软间隔(softmargin)的主要用途是()

答案:允许少量错分类样本,解决不完全线性可分问题在SVM模型优化求解当中,主要的运算形式是()

答案:向量内积在SVM模型的求解过程中,支持向量与拉格朗日因子α的关系是()

答案:α>0的数据点是支持向量在SVM(支持向量机)分类模型中支持向量是指()

答案:到最优分类超平面距离最近的训练样本点对应的特征向量线性SVM(支持向量机)分类模型和一般线性分类器的区别主要是()

答案:是否确保间隔最大化下面那个公式表明,事件A和B条件独立()

答案:P(AB)=P(A)P(B)朴素贝叶斯分类器的朴素之处在于()

答案:特征之间的条件独立性假设下面有关贝叶斯分类算法的认识错误的是()

答案:贝叶斯分类算法要求样本的特征必须是离散特征现在有一个表格,表格中统计了甲乙两个厂生产的产品中合格品数量、次品数量,数据如下:

甲厂

乙厂

合计合格品

475

645

1120次品

25

55

80合计

500

700

1200假设事件A为产品是甲厂生产的,事件B为产品是次品,根据表中数据分别计算概率P(AB),P(A|B),P(B|A)

答案:25/1200;25/80;25/500对CART决策树下面说法错误的是()

答案:CART回归决策树也是用基尼指数作为分支特征选择的标准下面有关决策树剪枝的说法错误的是()

答案:决策树后剪枝的依据是看某层某个非叶子节点转换成叶子节点后,模型在训练样本集上的准确度是否提升下面哪种决策树模型可以完成回归任务()

答案:CART决策树关于决策树模型下列说法错误的是()

答案:决策树只能是一棵二叉树以下哪个算法是基于规则的分类器()

答案:决策树关于线性分类模型下面说法错误的是()

答案:线性分类器的模型结构与线性回归器的模型结构是一样的关于线性回归模型的范数惩罚下面说法错误的是()

答案:惩罚系数λ越小对线性模型的参数取值范围压缩得越厉害关于线性模型下面说法错误的是()

答案:线性模型的参数除了权重参数必须有偏置项PCA分析中可以通过那个指标来帮助确定需要保留的前k个分量()

答案:累计方差贡献率下面关于降维算法说法错误的是()。

答案:降维能改善欠拟合问题与K-Means相比,基于密度的DBSCAN的优点不包括()

答案:较低的计算复杂度在DBSCAN中,对噪声点处理正确的是()

答案:噪点不属于任何簇直接无视在DBSCAN算法中,对数据点类型的划分中不包括()

答案:中心点关于k均值聚类算法下列说法错误的是()

答案:初始假设聚类中心点必须设置在真实中心点附近聚类中的簇与分类中的类的关系是()。

答案:不是一码事,但实际应用中有一定联系有关聚类算法错误的说法是()

答案:对聚类问题可以任选一种聚类算法移动运营商根据用户消费的数据,将用户划分为不同的群体,使用哪种机器学习方法比较合适()

答案:聚类分析为了提高集成学习的泛化性能,集成学习的弱学习器的多样性可以通过哪两个手段提高____,____。

答案:改变训练样本;改变模型训练参数集成学习的泛化性能可以通过哪两个手段提高____,____。

答案:降低个体学习器的泛化误差;提高个体学习器的多样性集成学习的弱分类器的组合策略有哪些____,____,____。

答案:相对多数投票法;绝对多数投票法;加权投票法集成学习的弱回归器的组合策略有哪些____,____。

答案:简单平均法;加权平均法集成学习的弱学习器的构造方式分为哪两种____,____。

答案:并行构造方式;串行构造方式集成学习中由同类型的个体学习器组成的集成模型称为____,并称这些同类型的个体学习器为____。由不同类型的个体学习器组成的集成模型称为____。

答案:同质集成模型;基学习器;异质集成模型集成学习中组成集成模型的性能一般的个体学习器又称为____,组合成的高精度的集成模型又称为____。

答案:弱学习器;强学习器随机森林模型的2个随机指的是()

答案:随机选取样本;随机选取属性下面哪些是串行构造的集成学习算法()

答案:AdaBoost集成学习;梯度提升决策树下面哪些是并行构造的集成学习算法()

答案:Bagging集成学习;随机森林下面对GBDT(梯度提升决策树)集成学习算法描述错误的是()

答案:是AdaBoost算法的一种下列对AdaBoost集成学习算法的描述错误的是()

答案:增加分类正确样本的权重,降低分类错误样本的权重来提高分类器的准确率下列关于随机森林模型的描述错误的是()

答案:只能构建分类模型关于Bagging集成学习算法,下面说法错误的是()

答案:自助采样法是指按一定的比例从n个样本的数据集中随机抽m个样本通过将多个性能一般的模型组合来得到性能优良的模型的技术称为()

答案:集成学习神经网络模型的正则化手段有哪些1.____2.____

答案:目标函数中添加正则化项;随机失活(Dropout多层感知机神经元的Sigmoid激活函数的作用有哪些1.____2.____

答案:可将原始数据非线性映射在另一个空间;;将输出限制在(0,1关于反向传播算法下面说法错误的是()

答案:反向传播算法是指反馈神经网络的优化算法多层感知机更新网络权重参数的正确顺序是什么()1.按照负梯度方向迭代更新权重,直至达到终止条件。2.把训练样本输入网络进行前向计算,得到每层神经元输出值和网络最终的输出值。3.随机初始化权重。4.基于反向传播算法,逐层求解各层权重相对于目标

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论