机器学习期末复习题及答案_第1页
机器学习期末复习题及答案_第2页
机器学习期末复习题及答案_第3页
机器学习期末复习题及答案_第4页
机器学习期末复习题及答案_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、单选题

1、在条件随机场(CRF)中,参数的学习通常使用哪种优化算法?

C)

A.K-Means聚类

B.梯度提升机(GBM)

C支持向量机(SVM)

D.随机梯度下降(SGD)

正确答案:D

2、在概率无向图模型中,什么是团分解(ClusterDecomposition)?

()

A.一种通过节点之间的边传播信息,以更新节点的边缘概率的方法

B.一种用于计算图的分割的算法

C.一种将联合概率分布分解为多个局部概率分布的方法

D.一种用于表示联合概率分布的无向树

正确答案:C

3、在数据不完备时,下列哪一种方法不是贝叶斯网络的参数学习方

法()

A.拉普拉斯近似

B.最大似然估计方法

C.蒙特卡洛方法

D.高斯逼近

正确答案:B

4、在有向图模型中,什么是条件独立性?()

A.给定父节点的条件下,子节点之间独立

B.所有节点之间都独立

C.所有节点的状态相互独立

D.任意两个节点都是独立的

正确答案:A

5、在概率有向图模型中,节点表示什么?()

A.变量

B.参数

C.条件概率

D.边

正确答案:A

6、下列哪一项表示簇中样本点的紧密程度?()

A.簇个数

B.簇大小

C.簇描述

D.簇密度

正确答案:D

7、闵可夫斯基距离表示为曼哈顿距离时p为:()

A.1

B.2

C.3

D.4

正确答案:A

8、谱聚类与K均值聚类相比,对于什么样的数据表现更好?()

A.低维数据

B.高维数据

C.线性可分数据

D.高密度数据

正确答案:B

9、SVM适用于什么类型的问题?()

A.既可用于线性问题也可用于非线性问题

B.仅适用于回归问题

C.仅适用于非线性问题

D.仅适用于线性问题

正确答案:A

10、对于在原空间中线性不可分的问题,支持向量机()

A.在原空间中寻找非线性函数划分数据

B.无法处理

C.利用核函数把数据映射到高维空间

D.在原空间中寻找线性函数划分数据

正确答案:C

11、LDA主题模型中的alpha参数控制着什么?()

A.单词分布的稀疏性

B.文档-主题分布的稀疏性

C.模型大小

D.模型收敛速度

正确答案:B

12、LDA的全称是什么?()

A.LatentDirichletAllocation

B.LinearDiscriminantAnalysis

C.LatentDataAnalysis

D.LinLatentDirichletAllocationearDataAlgorithm

正确答案:A

13、以下对于梯度下降法中学习率Ir的阐述,正确的是()

Air小,收敛速度较快

B.Ir大,收敛速度较慢

C.Ir小,收敛速度较慢且较不易收敛

D.Ir大,收敛速度较快但可能导致不收敛

正确答案:D

14、在EM算法中,E代表期望,M代表()

A.均值

B.最大化

C.最小化

D.均方误差

正确答案:B

15、梯度下降中如何有效地捕捉到目标函数的全局最优?()

A.调整学习速率

B.增加模型复杂度

C.使用梯度下降的变种算法

D.增加训练样本量

正确答案:C

二、多选题

1、下列机器学习常用算法中哪个属于分类算法?()

A.K-means

B.最小距离分类器

C.KNN(K近邻)

D.逻辑回归

正确答案:B、C、D

2、下列关于决策树的说法正确的是?()

A.CART使用的是二叉树

B.其可作为分类算法,也可用于回归模型

C.不能处理连续型特征

D.它易于理解、可解释性强

正确答案:A、B、D

3、下列属于k近邻算法中常用的距离度量方法的是?()

A.余弦相似度

B.欧式距离

C.曼哈顿距离

D.闵可夫斯基距离

正确答案:A、B、C、D

4、下列属于深度模型的是?()

A.DNN

B.Lightgbm

C.LSTM

D.Seq2Seq

正确答案:A、C、D

5、sklearn中RFECV方法分成哪两个部分?()

A.RFE

B.CV

C.NLP

D.MM

正确答案:A、B

6、以下关于蒙特卡洛方法描述正确的是()

A.蒙特卡洛方法计算值函数可以采用First-visit方法

B.蒙特卡洛方法方差很大

C.蒙特卡洛方法计算值函数可以采用Every-visit方法

D.蒙特卡洛方法偏差很大

正确答案:A、B、C

7、为什么循环神经网络可以用来实现自动问答,比如对一句自然语

言问句给出自然语言回答()

A.因为自动问答可以看成是一种序列到序列的转换

B.因为循环神经网络能够处理变长输入

C.因为循环神经网要比卷积神经网更强大

D.因为卷积神经网络不能处理字符输入

正确答案:A、B

8、通常有哪几种训练神经网络的优化方法()

A.梯度下降法

B.随机梯度下降法

C.小批量随机梯度下降法

D.集成法

正确答案:A、B、C

9、隐马尔可夫模型的三个基本问题是()

A.估值问题

B.寻找状态序列

C.学习模型参数

D.状态更新

正确答案:A、B、C

10、在数据不完备时,贝叶斯网络的参数学习方法有()

A.高斯逼近

B.蒙特卡洛方法

C.拉普拉斯近似

D.最大似然估计方法

正确答案:A、B、C

11、基于约束的方法通过统计独立性测试来学习结点间的()

A.独立性

B.相关性

C.依赖性

D.完备性

正确答案:A、B

12、基于搜索评分的方法,关键点在于()

A.确定合适的搜索策略

B.确定评分函数

C.确定搜索优先级

D.确定选择策略

正确答案:A、B

13、条件随机场需要解决的关键问题有()

A.特征函数的选择

B.参数估计

C.模型推断

D.约束条件

正确答案:A、B、C

14、以下关于逻辑斯蒂回归模型的描述正确的是()

A.针对分类的可能性进行建模,不仅能预测出类别,还可以得到属于

该类别的概率

B.直接对分类的可能性进行建模,无需事先假设数据分布,这样就避

免了假设分布不准确所带来的问题

C.模型本质仍然是一个线性模型,实现相对简单

D.逻辑斯蒂回归模型是线性回归模型

正确答案:A、B、C、D

15、LDA模型在做参数估计时,最常用的方法是()

A.Gibbs采样方法

B.变分推断

C.梯度下降

D.Beamsearch

正确答案:A、B

三、判断题

1、关于EM算法的收敛性,EM算法理论上不能够保证收敛()

正确答案:X

2、多次运行,随机化初始点是对存在局部最优点的函数求解的一种

方案()

正确答案:V

3、训练算法的目的就是要让模型拟合训练数据()

正确答案:X

4、循环神经网络按时间展开后就可以通过反向传播算法训练了

正确答案:V

5、GIS算法的收敛速度由计算更新值的步长确定。C值越大,步长越

大,收敛速度就越快()

正确答案:X

6、从最大熠思想出发得出的最大燧模型,采用最大化求解就是在求

P(y|x)的对数似然最大化()

正确答案:V

7、逻辑斯蒂回归模型是一种回归算法()

正确答案:X

8、k-means算法、EM算法是建立在凸球形的样本空间上的聚类方法

()

正确答案:V

9、DBSCAN对参数不敏感()

正确答案:X

10、分裂层次聚类采用的策略是自底向上()

正确答案:X

n、支持向量是最靠近决策表面的数据点()

正确答案:v

12、SVM中的泛化误差代表SVM对新数据的预测准确度()

正确答案:V

13、主题建模的关键是确定数据集合的主题个数()

正确答案:X

14、关于LDA模型中的K,K的指定,必须考虑数据集合的特点,选

择一个较为优化的数值()

正确答案:X

15、Gibbs采样是一类通用的采样方法,和M-H采样方法没有任何关

系()

正确答案:X

16、吉布斯采样是一种通用的采样方法,对于任何概率分布都可以采

样出对应的样本()

正确答案:X

17、EM算法通常不需要设置步长,而且收敛速度一般很快()

正确答案:V

18.EM算法首先猜测每个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论