机器学习理论与方法知到智慧树章节测试课后答案2024年秋同济大学_第1页
机器学习理论与方法知到智慧树章节测试课后答案2024年秋同济大学_第2页
机器学习理论与方法知到智慧树章节测试课后答案2024年秋同济大学_第3页
机器学习理论与方法知到智慧树章节测试课后答案2024年秋同济大学_第4页
机器学习理论与方法知到智慧树章节测试课后答案2024年秋同济大学_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机器学习理论与方法知到智慧树章节测试课后答案2024年秋同济大学第一章单元测试

机器学习是研究发现数据模型的算法并利用这些模型做出决策。()

A:错B:对

答案:对机器学习通常要经过数据选择,模型训练,模型优化矫正等过程。()

A:错B:对

答案:对决策树模型是一种典型的聚类模型。()

A:对B:错

答案:错决策树是随机森林模型的子结构。()

A:错B:对

答案:对以下哪种情况适合使用SVM算法()。

A:邮件过滤

B:单细胞分类

C:小分子结构活性预测

D:情感分析

答案:单细胞分类

关于机器学习的基本流程,下列顺序正确的是()。

A:建模—改进—评价

B:建模—评价—改进

C:改进—评价—建模

D:评价—建模—改进

答案:建模—评价—改进

监督式学习根据输出形式可分为()。

A:回归

B:分类,回归和结构化学习

C:分类

D:分类和回归

答案:分类和回归

机器学习根据学习方式可分为()。

A:强化学习

B:半监督学习

C:监督学习

D:无监督学习

E:迁移学习

答案:强化学习

;半监督学习

;监督学习

;无监督学习

朴素贝叶斯适合下列哪种场景分析()。

A:消费者细分

B:车流量分析

C:自然语言处理

D:情感分析

答案:消费者细分

;情感分析

机器学习根据模型性质可分为()。

A:线性模型

B:贝叶斯模型

C:非线性模型

D:随机模型

答案:线性模型

;非线性模型

第二章单元测试

若非零矩阵A满足A=O,则A+E与A-E均可逆()

A:错B:对

答案:对矩阵的特征值为()

A:-1

B:0

C:1或-1

D:1

答案:-1

设P(A)=0.4,P(B)=0.7,事件A,B相互独立,则P(B-A)=()

A:0.42

B:0.12

C:0.28

D:0.3

答案:0.42

已知离散型随机变量X可取值{-3,-1,0,2},且取这些值的概率依次为,则b的取值为2()

A:错B:对

答案:对若随机变量X服从N(5,4)的分布,若P(X>c)=P(X<c),则c=()

A:6

B:4

C:5

D:7

答案:5

事件A,B,C至少有一个发生可以表示为。()

A:对B:错

答案:对事件A与B互不相容,是指P(AB)=P(A)P(B)。()

A:对B:错

答案:对

下列关于矩阵的运算法则正确的是()。

A:AB=BAB:(At)t=AC:(AB)C=A(BC)D:(A+B)C=AC+BC

答案:(At)t=A;(AB)C=A(BC);(A+B)C=AC+BC假设A和B都是同阶可逆矩阵,且A为对称矩阵,则下列等式成立的为()。

A:(ABt)-1=A-1(B-1)tB:

(AB)t=BtA

C:(AtB)-1=B-1A-1D:(ABt)-1=(B-1)t

A-1

答案:(ABt)-1=A-1(B-1)t假设感染了新冠病毒的病人中感到身体发热的概率为0.88,病人感染新冠病毒的概率为0.001,病人发热的概率为0.02,则如果检测到一个病人发热,则判断他感染了新冠病毒的概率为()。

A:0.044B:0.0002C:0.0088D:0.001

答案:0.044

第三章单元测试

机器学习模型都是从经验中Experience学习任务Task。假设我们为了让一个机器学习算法学会预测肿瘤病人的存活率。以下哪一项不是Experience的合理选择?()

A:肿瘤病人的基因组信息

B:肿瘤分期(肿瘤的恶性程度)

C:肿瘤病人的生命体征

D:肿瘤病人的转录组信息

答案:肿瘤病人的基因组信息

通过细胞的转录组信息预测细胞类型,属于以下哪一种问题?()

A:回归问题

B:聚类问题

C:分类问题

答案:分类问题

下图为某任务损失函数随参数变化的曲面图,则以下说法正确的是()

A:学习率过大可能会导致loss在B点附近来回震荡

B:当使用梯度下降法求解损失函数的最小值时,loss可能会从A点到达C点

C:当使用梯度下降法求解损失函数的最小值时,一定会使得loss到达B点

D:该损失函数可能是一元线性回归的损失函数曲面图

答案:学习率过大可能会导致loss在B点附近来回震荡

;当使用梯度下降法求解损失函数的最小值时,loss可能会从A点到达C点

以下哪一项是使用特征缩放的原因?()

A:防止梯度下降陷入局部最优

B:加快了标准方程的求解

C:降低梯度下降的每次迭代的计算成本来加速梯度下降

D:通过减少迭代次数来获得一个好的解,从而加速了梯度下降

答案:通过减少迭代次数来获得一个好的解,从而加速了梯度下降

以下说法正确的是()

A:预测蛋白质的二级结构,该任务属于非监督学习

B:利用癌症的组学数据将癌症划分成各个亚型,从而研究不同的治疗手段,该任务属于非监督学习

C:预测基因的功能,该任务属于监督学习

答案:利用癌症的组学数据将癌症划分成各个亚型,从而研究不同的治疗手段,该任务属于非监督学习

;预测基因的功能,该任务属于监督学习

利用患者的年龄来预测药物的治疗效果,并使用回归模型进行学习,则该回归模型属于一元回归模型。()

A:对B:错

答案:对在训练模型时,我们可以使用梯度下降法求解损失函数的最大值。()

A:错B:对

答案:错在模型训练过程中,学习率越大越好。()

A:对B:错

答案:错梯度下降法可以表征为。()

A:对B:错

答案:对现有以下任务:利用基因A的表达量(X)预测肿瘤的大小(Y),下图为训练数据,我们利用线性回归模型,假设,则以下说法正确的是()。

A:该训练集一共有5个样本B:C:D:损失函数可以表征为

答案:

第四章单元测试

选择模型时,我们倾向于选择高方差的模型,因为它们能够更好的适应训练集。()

A:对B:错

答案:错训练完逻辑回归分类器后,必须使用0.5作为预测正负的阈值。()

A:错B:对

答案:错训练一个逻辑回归模型时,以下哪项陈述是正确的?()

A:如果我们的模型偏差较高,一个合理的解决方案时引入正则化

B:向模型中添加许多新特性有助于防止训练集过拟合

C:向模型中添加新特征总是会在训练集上获得相同或更好的性能

D:将正则化引入到模型中,总是能在训练集上获得相同或更好的性能

答案:向模型中添加新特征总是会在训练集上获得相同或更好的性能

Sigmoid函数的优点有()

A:定义域在整个实数集上

B:不容易产生梯度消失

C:输出映射在(0,1)之间,单调连续

D:易于求导

答案:定义域在整个实数集上

;输出映射在(0,1)之间,单调连续

;易于求导

当模型出现过拟合现象时,下列哪些做法可以改善()

A:尝试添加多个特征

B:尝试增加正则化项

C:尝试使用较少的特征

D:尝试获取并使用其他特征

答案:尝试增加正则化项

;尝试使用较少的特征

下列哪些情景可以用逻辑回归()

A:从病人的肿瘤切片数据中获取一些特征,判断该肿瘤是良性还是恶性。

B:给定病人的一些临床数据,判断特定疗法能否发挥作用。

C:给出病人的一些风险因素,预测某一事件的发生概率。

D:给定病人的一些临床数据,预测病人的生存期。

答案:从病人的肿瘤切片数据中获取一些特征,判断该肿瘤是良性还是恶性。

;给定病人的一些临床数据,判断特定疗法能否发挥作用。

为了实现特征选择,选择L2正则化()

A:错B:对

答案:错过拟合在训练集上效果好,在测试集上效果差()

A:错B:对

答案:对训练逻辑回归分类器时,将阈值从0.5下调至0.3。以下哪项是正确的:()

A:分类器的准确度和召回率可能不变,但精确率较低。

B:分类器的准确度和召回率可能不变,但精确率较高。

C:分类器现在可能具有更高的召回率。

D:分类器现在可能具有更高的精确率。

答案:分类器现在可能具有更高的召回率。

Sigmoid函数的形式是()。

A:B:C:D:

答案:

第五章单元测试

分类器的实际预测输出与样本的真实输出之间的差异称为“误差”。()

A:错B:对

答案:对过拟合是可以避免的。()

A:错B:对

答案:错交叉验证法中,如果选择留一法,是为了避免不受随机样本划分的影响。()

A:对B:错

答案:对学习算法训练程度不足时,偏差会高,方差会低。()

A:错B:对

答案:对交叉验证法中的测试集是来自于()。

A:新样本

B:训练集

C:验证集

答案:训练集

一般用来评价模型在训练集上的表现时,用作标准的是()。

A:错误率

B:精度

C:训练误差

D:均方误差

答案:均方误差

当学习算法偏差高,方差低时,呈现出()。

A:欠拟合

B:模型不能用

C:过拟合

答案:欠拟合

交叉验证法中,设数据集包含m个样本,不计计算开销,比较准确的是()。

A:1折交叉验证

B:m折交叉验证

C:10折交叉验证

答案:m折交叉验证

用来比较检验分类器的统计方法中,包括以下()。

A:γ检验

B:交叉t检验

C:二项检验

D:海明检验

答案:交叉t检验

;二项检验

平均均方误差(Meansquareerror)可以分解为()

A:方差

B:偏差

C:训练误差

D:经验误差

答案:方差

;偏差

第六章单元测试

公司里面男性有60人,女性有40人,男性穿皮鞋的人数有25人,穿运动鞋的人数有35人,女性穿皮鞋的人数有10人,穿高跟鞋的人数有30人。现在你只知道有一个人穿了皮鞋,他是男性的概率是多少()。

A:0.1

B:0.2

C:0.5

D:0.25

答案:0.25

A,B,C产品占比分布为1/2,1/6,1/3;A,B,C的次品率分布为0.2,0.1,0.3;那么出现次品是A做出来的概率();

A:0.30

B:0.46

C:0.67

D:0.2

答案:0.46

下列关于朴素贝叶斯说法正确的是()。

A:对小规模数据表现良好

B:对缺失值敏感

C:不需要获得先验分布

D:对异常值敏感

答案:对小规模数据表现良好

假设吸烟的本科生比例为15%,而吸烟的研究生占23%。如果五分之一的大学生是研究生,其余的是本科生,那么吸烟的学生是研究生的概率是多少?()。

A:0.15

B:0.16

C:0.2

D:0.27

答案:0.2

朴素贝叶斯的应用场景主要有()。

A:推荐系统

B:垃圾邮件判别

C:情感判别

D:文本分类

答案:推荐系统

;垃圾邮件判别

;情感判别

;文本分类

有两枚硬币,其中一枚均匀,另一枚不均匀,随机拿一枚,并投掷10次,记X1:前9次有7次为正面,X2:第10次为反面,X3:这枚硬币不均匀,则X1,X2关于X3条件独立。()。

A:对B:错

答案:对贝叶斯学习最终输出结果为模型和模型参数。()

A:对B:错

答案:错贝叶斯估计认为参数θ是某种已知先验分布的随机变量。

A:错B:对

答案:对下列关于朴素贝叶斯说法正确的是()

A:进行分布估计

B:通过最大后验概率进行单点估计

C:生成式模型

D:判别式模型

答案:通过最大后验概率进行单点估计

;生成式模型

以下哪项是后验概率项,假设A为分类变量()。

A:P(A)

B:P(B/A)

C:P(A/B)

D:P(B)

答案:P(A/B)

第七章单元测试

决策树是基于规则的树状结构的机器学习算法,可以用来进行分类任务。()

A:对B:错

答案:对熵越小,纯度越低,不确定性越高。()

A:错B:对

答案:错一堆细胞中含有16个B细胞和48个T细胞,那么这堆细胞的熵是多少(log)()。

A:0.811

B:0.701

C:0.921

D:0.891

答案:0.811

信息增益本质上遵循的是熵减原则。()

A:错B:对

答案:对决策树深度越深越好,越能拟合数据。()

A:对B:错

答案:错过拟合是指模型在训练样本拟合过度,表现极好,而在验证数据集以及测试数据集中表现不佳。()

A:对B:错

答案:对决策树的剪枝是为了防止树的过拟合,增强其泛化能力。包括预剪枝和后剪枝。()

A:对B:错

答案:对常见的后剪枝包括()。

A:基于树深度的剪枝

B:减少错误的剪枝

C:基于代价的剪枝

D:基于规则的剪枝

答案:减少错误的剪枝

;基于规则的剪枝

决策树无法处理特征为连续值的情况。()

A:对B:错

答案:错预剪枝是人观测后手动停止树的生长的。()

A:错B:对

答案:错

第八章单元测试

最近邻算法核心思想直观,可解释性强。()

A:错B:对

答案:对最近邻算法的缺点有()。

A:对特征不平衡数据预测效果差

B:训练过程复杂度高

C:预测过程计算复杂度高

D:对类别不平衡数据预测效果差

答案:对特征不平衡数据预测效果差

;预测过程计算复杂度高

;对类别不平衡数据预测效果差

最近邻算法可用于分类和回归任务。()

A:错B:对

答案:对最近邻算法中,将k值设置更小可以降低预测计算复杂度。()

A:错B:对

答案:错最近邻算法对于类别不平衡数据预测效果好。()

A:对B:错

答案:错最近邻算法有很多新的改进版本,其中weighted-distanceknn可以有效提升更近的样本在决策时的权重。()

A:对B:错

答案:对最近邻算法理论复杂,实现难度高。()

A:对B:错

答案:错最近邻算法不需要训练过程。()

A:错B:对

答案:对最近邻算法预测过程计算复杂度高主要是因为要计算待分类样本和其他所有样本的距离。()

A:错B:对

答案:对最近邻算法计算样本间的距离时,只能用欧氏距离。()

A:错B:对

答案:错

第九章单元测试

支持向量是最接近决策平面的点。()

A:对B:错

答案:对SVM非常适合于大规模的数据。()

A:错B:对

答案:错核函数是将低维数据映射到高维空间。()

A:错B:对

答案:对以下情况中哪一情况SVM的效果会不太好()。

A:数据是经过清洗且可用的

B:数据是有噪声并且包含重合的点

C:数据的维度相对来说比较小

D:数据是线性可分的

答案:数据是有噪声并且包含重合的点

如果SVM的惩罚项C设置成非常大,会导致()。

A:不好判别

B:对于这样的C,我们可以很好的对训练集进行正确分类

C:对于这样的C,我们不能对训练集进行正确分类

答案:对于这样的C,我们可以很好的对训练集进行正确分类

如果有一个线性SVM模型过拟合了,以下哪一个操作你会优先考虑进行下一步的模型迭代()。

A:增加数据量

B:减少更多变量

C:减少数据量

D:增加更多变量

答案:增加更多变量

对于4分类问题,如果你要训练SVM模型使用一对多方法,则需要训练多少次模型()。

A:3

B:4

C:1

D:2

答案:4

SVR与SVM的不同点在于()。

A:SVR不可以使用软间隔

B:SVR可以使用核技巧和软间隔

C:SVR的支持向量在边际的外面,SVM的支持向量在边际上

D:SVR不可以使用核技巧

答案:SVR可以使用核技巧和软间隔

;SVR的支持向量在边际的外面,SVM的支持向量在边际上

SVM的有效性将基于()。

A:松弛变量的选择

B:软间隔的惩罚项C

C:核函数的选择

答案:软间隔的惩罚项C

;核函数的选择

SVM及其扩展可以应用在()。

A:分类问题

B:聚类问题

C:预测问题

答案:分类问题

;聚类问题

;预测问题

第十章单元测试

CNN网络中,每一层的输出维度由什么决定()。

A:是否进行补全(padding)

B:Kernel的尺寸

C:步长(strides)

D:该层的输入

答案:是否进行补全(padding)

;Kernel的尺寸

;步长(strides)

;该层的输入

在对病历数据进行建模时,以下那些操作是必须的()。

A:对病历进行分词

B:计算病历中所含的词的种类

C:使用数字对分词后的病历进行标记

D:打乱分词后的顺序

答案:对病历进行分词

;计算病历中所含的词的种类

;使用数字对分词后的病历进行标记

图(Graph)和图像(Image)是同一类数据。()

A:错B:对

答案:错深度学习模型只能接收数字矩阵作为输入。()

A:对B:错

答案:对Inception结构的设计目标是()。

A:增加模型宽度

B:提高模型的运行速度

C:增加模型深度

D:简化模型

答案:增加模型宽度

在生成式对抗网络(GAN)中,判别器(Discriminator)所起到的作用是()。

A:辅助生成模型进行更平稳的训练

B:储存生成模型所生成的样本

C:识别出生成模型所生成的样本所属的种类

D:识别出输入的样本是真实样本还是来源于生成模型

答案:识别出输入的样本是真实样本还是来源于生成模型

如果想使用深度学习模型去生成有一定生物活性的药物分子,可以选择哪些模型结构()。

A:CharRNN

B:GAN

C:VAE

D:Inception

答案:CharRNN

;GAN

;VAE

我们想要自己去实现一个深度学习模型,可以使用以下哪些框架()。

A:Sklearn(scikit-learn)

B:Pytorch

C:PaddlePaddle

D:TensorFlow

答案:Pytorch

;PaddlePaddle

;TensorFlow

实验室想要部署一台可以进行深度学习运算的服务器,最好选配GPU。()

A:对B:错

答案:对若使用深度学习模型对病历数据进行建模,则应该选择哪种模型()。

A:GCN

B:RNN

C:CNN

D:MLP

答案:RNN

第十一章单元测试

聚类分析所聚类的cluster数量限制在十个以内。()

A:错B:对

答案:错聚类分析的目标是尽可能的使组间差异变大。()

A:错B:对

答案:对聚类分析的方法受初始点的影响比较小。()

A:对B:错

答案:错理论上,如果某个混合高斯模型融合的高斯模型个数足够多,它们之间的权重设定得足够合理,这个混合模型可以拟合任意分布的样本。()

A:对B:错

答案:对对于每一个样本,使用EM算法学习高斯混合模型的参数,当得到的值时EM算法运行结束。()

A:对B:错

答案:错以下哪些是距离的衡量方式?()

A:Manhattandistance

B:persondistance

C:Euclideandistance

D:Cosinesimilarity

答案:Manhattandistance

;Euclideandistance

;Cosinesimilarity

聚类分析适用于多少维的数据()?

A:一百维以内

B:没有限制

C:十维以内

D:二维

答案:没有限制

新冠病毒已蔓延全世界,如果需要比较各个地区新冠病毒的基因突变特征并构建系统发育树,以下什么聚类方法最合适?()

A:层次聚类

B:K-means聚类

C:特征聚类

D:GMM聚类

答案:层次聚类

关于基于高斯混合模型(GMM)的聚类描述哪项是正确的?()

A:每个点只会分配到一个类中,并计算分配这个点的概率

B:基于高斯混合模型的聚类属于软聚类

C:GMM会学习出一个概率分配函数

D:模型初始化时每一个点会被认为是一个单独的群

答案:每个点只会分配到一个类中,并计算分配这个点的概率

;基于高斯混合模型的聚类属于软聚类

;GMM会学习出一个概率分配函数

下列说法正确的是?()

A:离散变量的混合模型,必须要假定每个类中的属性是相互独立B:EM算法常被人分为两步,E步是使用当前参数计算点的聚类结果,M步是更新参数进行迭代

C:EM算法常被用来学习高斯混合模型

D:朴素贝叶斯的方法常用来处理离散变量的混合模型

答案:EM算法常被人分为两步,E步是使用当前参数计算点的聚类结果,M步是更新参数进行迭代

;EM算法常被用来学习高斯混合模型

第十二章单元测试

假设有基因A和基因B表达量的二维数据,PC1的斜率为0.25,则基因A和基因B的载荷得分为()。

A:0.97;0.242

B:4;1

C:0.25;1

D:0.326;0.74

答案:0.97;0.242

主成分学习是一种非监督学习的降维方法。()

A:对B:错

答案:对数据降维可能会带来哪些负面影响()。

A:提高模型训练的计算量

B:损失大量有效信息

C:降低后续算法的表现

D:转化后的特征可解释性降低

答案:降低后续算法的表现

;转化后的特征可解释性降低

在生物信息学研究中,常常需要对数据进行降维,这是因为()。

A:需要对数据可视化

B:提高分析结果的准确性

C:生物学数据中大部分都是噪声

D:生物学数据往往具有变量多,样本少的特点

答案:需要对数据可视化

;生物学数据往往具有变量多,样本少的特点

自编码器的的解码器部分负责进行数据降维。()

A:对B:错

答案:错高维空间中数据具有稀疏性,容易导致模型过拟合。()

A:对B:错

答案:对下列哪些是常用的数据降维算法()。

A:线性判别分析

B:因子分析

C:支持向量机

D:主成分分析

答案:线性判别分析

;因子分析

;主成分分析

选择主成分个数时,通常累计解释方差的贡献率应在哪个区间较合适()。

A:70%~80%

B:85%~100%

C:60%~100%

D:85%~95%

答案:85%~95%

自编码器有以下哪些特点()。

A:自编码器是一种自监督算法

B:自编码器的输入和输出完全相等

C:自编码器是神经网络的一种

D:自编码器主要应用于数据降维和去除噪声

答案:自编码器是一种自监督算法

;自编码器是神经网络的一种

;自编码器主要应用于数据降维和去除噪声

如果生物学数据的不同变量间具备较强相关性,那么更适合哪种降维方法()。

A:主成分分析

B:随机森林

C:线性判别分析

D:因子分析

答案:因子分析

第十三章单元测试

异常值检测是特殊的分类任务。()

A:错B:对

答案:对通常在异常值检测中,数据符合,则该数据为异常值。()

A:错B:对

答案:错独立二元高斯分布图中每一个纵切面都是一个一元高斯分布。()

A:错B:对

答案:对基于内容的推荐系统中,对于每一部电影,我们都掌握了可用的特征,使用这些特征训练出了每一个用户的参数。但如果我们拥有用户的参数,我们无法学习得出电影的特征。()

A:错B:对

答案:错在协同过滤中,一般会将等初始值设置的比较大以获得更好的效果。()

A:对B:错

答案:错下列属于异常值检测在应用的有?()

A:表达谱数据中缺失基因的寻找

B:检测系统故障

C:筛选出身体患病的病人

D:肿瘤类型的分类

答案:表达谱数据中缺失基因的寻找

;检测系统故障

;筛选出身体患病的病人

下面对于异常值检测的数据分布说法正确的有?()

A:对于非高斯分布的数据,虽然也可以使用检测算法,但往往效果不是很好

B:应尽量将非高斯分布转化成(近似)高斯分布,然后再进行处理

C:应使用对应的概率密度分布函数来改变数据的分布

D:对于符合高斯分布的数据,直接运用检测算法

答案:对于非高斯分布的数据,虽然也可以使用检测算法,但往往效果不是很好

;应尽量将非高斯分布转化成(近似)高斯分布,然后再进行处理

;应使用对应的概率密度分布函数来改变数据的分布

;对于符合高斯分布的数据,直接运用检测算法

推荐系统常用的方法有哪些?()

A:基于聚类算法的推荐

B:基于插值的推荐

C:基于内容的推荐

D:基于协同过滤的推荐

答案:基于内容的推荐

;基于协同过滤的推荐

下面哪些属于协同过滤算法存在的不足?()

A:算法对于用户的主观评分比较依赖

B:当一个新的用户或物品进入推荐系统时,系统将无从依据

C:协同过滤算法适用于更迭快的物品(比如新闻,广告),在更新速度过快用户评论不多的情况下,比起其他算法,协同过滤算法能有好的的准确度。

D:在推荐的过程中,当前最流行的物品会更更容易被推荐

答案:协同过滤算法适用于更迭快的物品(比如新闻,广告),在更新速度过快用户评论不多的情况下,比起其他算法,协同过滤算法能有好的的准确度。

在进行crisper基因编辑实验时,通常需要进行引物的设计。有三个生物信息学工具可以对引物进行打分,其中A将引物分为有效,可能有效,无效这三个等级。B将引物分为1至10共十个等级,C对引物进行打分,满分为100分。如果想将这三个推荐工具的结果整合,下面哪个说法是正确的?()

A:可以将三个数据集合并到一个数据集,但是应该首先将每个数据集的打分方式标准化

B:直接将三个数据集进行整合,不需要任何修改即可得到期望的答案。

C:三个工具度量不同,是无法整合的,需要建立三个独立的系统。

D:如果对于引物,A工具无法对他评分,其他工具对其正常打分,那么由于缺少数据,就没有可靠的方法来合并数据集。

答案:可以将三个数据集合并到一个数据集,但是应该首先将每个数据集的打分方式标准化

第十四章单元测试

画学习曲线是为了观察模型状态,如过拟合或欠拟合。()

A:对B:错

答案:对可以采用哪些方法提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论