第五届“高新匠领”职业技能大赛(人工智能算法应用赛项)理论试题库(含答案)_第1页
第五届“高新匠领”职业技能大赛(人工智能算法应用赛项)理论试题库(含答案)_第2页
第五届“高新匠领”职业技能大赛(人工智能算法应用赛项)理论试题库(含答案)_第3页
第五届“高新匠领”职业技能大赛(人工智能算法应用赛项)理论试题库(含答案)_第4页
第五届“高新匠领”职业技能大赛(人工智能算法应用赛项)理论试题库(含答案)_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五届“高新匠领”职业技能大赛(人工智能算法应用赛项)

理论试题库(含答案)

一、单选题

1.在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题()。

A、增加训练集量

B、减少神经网络隐藏层节点数

C、删除稀疏的特征

D、SVM算法中使用高斯核/RBF核代替线性核

答案:D

2.下列属于无监督学习的是:()。

A、k-means

B、SVM

C、最大炳

D、CRF

答案:A

3.Logit函数(给定为I(x))是几率函数的对数。域x=[0,1]中logit函数的范围

是多少?()

A、(-8,8)

B\(0,1)

C、(0,8)

D\(-8,o)

答案:A

4.在深度学习中,涉及到大量的矩阵相乘,现在需要计算三个稠密矩阵A,B,C的

乘积ABC,假设三个矩阵的尺寸分别为m*n,n*p,p*q,且m<n<p<q,以下计算顺

序效率最高的是()。

A、(AB)C

B、AC(B)

C、A(BC)

D、效率都相同

答案:A

5.下面哪种不属于数据预处理的方法?()

A、变量代换

B、离散化

C、聚集

D、估计遗漏值

答案:D

6.下列哪一项在神经网络中引入了非线性?()

A、随机梯度下降

B、修正线性单元(ReLU)

C、卷积函数

D、以上都不正确

答案:B

7.使用以下哪种算法进行变量选择?0

A、LASSO

B、Ridge

C\两者

D、都不是

答案:A

8.模型的高bias是什么意思,我们如何降低它?()

A、在特征空间中减少特征

B、在特征空间中增加特征

C、增加数据点

D、B和C

答案:B

9.哪一个是机器学习的合理定义?()

A、机器学习从标记的数据中学习

B、机器学习能使计算机能够在没有明确编程的情况下学习

C、机器学习是计算机编程的科学

D、机器学习是允许机器人智能行动的领域

答案:B

10.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其

他标签的数据相分离?()

A、分类

B、聚类

C、关联分析

D、隐马尔可夫链

答案:B

11.分析逻辑回归表现的一个良好的方法是AIC,它与线性回归中的R平方相似。

有关AIC,以下哪项是正确的?()

A、具有最小AIC值的模型更好

B、具有最大AIC值的模型更好

C、视情况而定

D、以上都不是

答案:A

12.请选择下面可以应用隐马尔科夫(HMM)模型的选项。()

A、基因序列数据集

B、电影浏览数据集

C、股票市场数据集

D、所有以上

答案:D

13.下列关于回归分析中的残差表述正确的是()。

A、残差的平均值总为零

B、残差的平均值总小于零

C、残差的平均值总大于零

D、残差没有此类规律

答案:A

14.基于统计的分词方法为()。

A\正向量最大匹配法

B、逆向量最大匹配法

C、最少切分

D、条件随机场

答案:D

15.在数据清理中,下面哪个不是处理缺失值的方法?0

A、估算

B、整例删除

G变量删除

D、成对删除

答案:D

16.深度学习是当前很热门的机器学习算法,在深度学习中,涉及到大量的矩阵相

乘,现在需要计算三个稠密矩阵A,B,C的乘积ABC,假设三个矩阵的尺寸分别为m

*n,n*p,p*q,且m<n<p<q,以下计算顺序效率最高的是()。

A、(AB)C

B、AC(B)

C、A(BC)

D、所以效率都相同

答案:A

17.下面两张图展示了两个拟合回归线(A和B),原始数据是随机产生的。现在,

我想要计算A和B各自的残差之和。注意:两种图中的坐标尺度一样。关于A和

B各自的残差之和,下列说法正确的是?0

AB

A、比B禺

B、A比B小

C、A与B相同

D、以上说法都不对

答案:C

18.下列哪一种操作实现了和神经网络中Dropout类似的效果?()

A、Bagging

B\oosting

C、堆叠

D、以上都不正确

答案:A

19.下列的代码片段,说法不正确的是:()。

A、表达式[1,2,3]*3的执行结果为[1,2,3,1,2,3,1,2,3]。

B、语句x=3==3,5执行结束后,变量x的值为(True,5)。

G已知x=3,那么执行语句x+=6之后,x的值为9o

D、已知x=3,并且id(x)的返回值为496103280,那么执行语句x+=6之后,表达式

id(x)==496103280的值为true。

答案:D

20.基于二次准则函数的H-K算法较之于感知器算法的优点是()?

A、计算量小

B、不可以判别问题是否线性可分

C、其解完全适用于非线性可分的情况

D、其解的适应性更好

答案:D

21.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层的

深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经网

络下一层所接收到的数据维度是多少?0

A、218x218x5

B、217x217x8

C、217x217x3

D、220x220x5

答案:A

22.下列哪些不特别适合用来对高维数据进行降维。()

A、LASSO

B、主成分分析法

C、聚类分析

D、小波分析法

答案:C

23.当数据过大以至于无法在RAM中同时处理时,哪种梯度下降方法更加有效?()

A、随机梯度下降法(StochasticGradientDescent)

B、不知道

G整批梯度下降法(FuIIBatchGradientDescent)

D、都不是

答案:A

24.()是职业道德认识和职业道德情感的统一。

A、职业道德技能

B、职业道德义务

C、职业道德信念

D、职业道德素养

答案:D

25.以下哪个图是KNN算法的训练边界()。

输入数据ABCD

A、B

B、A

C、D

D、C

答案:B

26.一个二进制源X发出符号集为{-1,1},经过离散无记忆信道传输,由于信道中

噪音的存在,接收端Y收到符号集为{7,1,0}。已知P(x=-1)=1/4,P(x=1)=3/4,P

(y=-1|x=-1)=4/5,P(y=O|x=-1)=1/5,P(y=1|x=1)=3/4,P(y=O|x=1)=1/4,求条件

炳H(Y|X)()。

A、0.2375

B、0.3275

C、0.5273

D、0.5372

答案:A

27.一个计算机程序从经验E中学习任务T,并用P来衡量表现。并且,T的表现P

随着经验E的增加而提高。假设我们给一个学习算法输入了很多历史天气的数据,

让它学会预测天气。什么是P的合理选择?0

A、计算大量历史气象数据的过程

B、正确预测未来日期天气的概率

C、天气预报任务

D、以上都不

答案:B

28.关于"回归(Regression)"和"相关(CorreIation)”,下列说法正确的是?

注意:x是自变量,y是因变量0。

A、回归和相关在x和y之间都是互为对称的

B、回归和相关在x和y之间都是非对称的

C、回归在x和y之间是非对称的,相关在x和y之间是互为对称的

D、回归在x和y之间是对称的,相关在x和y之间是非对称的

答案:C

29.被誉为国际“人工智能之父”的是0。

A、图灵(Turing)

B\费根鲍姆(Feigenbaum)

G傅京孙(K、S、Fu)

D、尼尔逊(NiIsson)

答案:A

30.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究

领域,主要研究计算机如何自动获取知识与技能,实现自我完善,这门研究分支学

科叫()。

A、专家系统

B、机器学习

C、神经网络

D、模式识别

答案:B

31.以下关于诚实守信的认识和判断中,正确的选项是()。

A、诚实守信应以追求利益最大化为准则

B、是否诚实守信要视具体对象而定

C、诚实守信是市场经济应有的法则

D、诚实守信与经济发展相矛盾

答案:C

32.假设你训练了一个基于线性核的SVM,多项式阶数为2,在训练集和测试集上

准确率都为100%。如果增加模型复杂度或核函数的多项式阶数,将会发生什么?

0

A、导致过拟合

B、导致欠拟合

C、无影响,因为模型已达100%准确率

D、以上均不正确

答案:A

33.假设你使用log-loss函数作为评估标准。下面这些选项,哪些是对作为评估

标准的log-loss的正确解释()。

A、如果一个分类器对不正确的分类很自信,log-loss会严重的批评它

B、对一个特别的观察而言,分类器为正确的类别分配非常小的概率,然后对log-

Ioss的相应分布会非常大

C、Iog-loss越低,模型越好

D、以上都是

答案:D

34.语言模型的参数估计经常使用MLE(最大似然估计)。面临的一个问题是没有

出现的项概率为0,这样会导致语言模型的效果不好。为了解决这个问题,需要使

用:()。

A、平滑

B、去噪

C、随机插值

D、增加白噪音

答案:A

35.下列哪个神经网络结构会发生权重共享?()

A、卷积神经网络

B、循环神经网络

C、全连接神经网络

D、选项A和B

答案:D

36.SVM中使用高斯核函数之前通常会进行特征归一化,以下关于特征归一化描

述不正确的是?()

A、经过特征正则化得到的新特征优于旧特征

B、特征归一化无法处理类别变量

C、SVM中使用高斯核函数时,特征归一化总是有用的

D、以上都是不正确的

答案:C

37.向量X=[1,2,3,4,-9,0]的L1范数为?()

A、1

B、19

C、6

D、V111

答案:B

38.你正在使用带有L1正则化的Iogistic回归做二分类,其中C是正则化参数,

w1和w2是x1和x2的系数。当你把C值从0增加至非常大的值时,下面哪个选

项是正确的?()

A、第一•"t'w2成了0,接着w1也成了0

B、第一个w1成了0.接着w2也成了0

Gw1和w2同时成了0

D、即使在C成为大值之后,w1和w2都不能成0

答案:B

39.下列选择中,说法是正确的是:()。

A、在Python中nulI表示空类型。

B、列表、元组、字符串是Python的无序序列。

C、查看变量类型的Python内置函数是type。。

D、查看变量内存地址的Python内置函数是ids()。

答案:C

40.下面的python代码片段,定义了函数fun()并调用了该函数,输出结果是0。

A、报错

B、123

C、1

D、23

答案:A

41.假设你需要调整参数来最小化代价函数(costfunction),可以使用下列哪项

技术?()

A、穷举搜索

B、随机搜索

GBayesian优化

D、以上任意一种

答案:D

42.下列哪一项说明了X,Y之间的较强关系。()

A、相关系数为0、9

B、eta系数为0的空假设的p-value是0、0001

C、Beta系数为0的空假设的t统计量是30

D、都不对

答案:A

43.类域界面方程法中,不能求线性不可分情况下分类问题近似或精确解的方法

是?()

A、伪逆法-径向基神经网络的训练算法,就是解决线性不可分的情况

B、基于二次准则的H-K算法:最小均方差准则下求得权矢量,二次准则解决非线

性问题

C、势函数法-非线性

D、感知器算法-线性分类算法

答案:D

44.微机系统中的系统总线(如PCI)用来连接各功能部件以构成一个完整的系统,

它需包括三种不同功能的总线,即()。

A、数据总线'地址总线和控制总线

B、同步总线、异步总线和通信总线

C、内部总线、外部总线和片内总线

D、并行总线、串行总线和USB总线

答案:A

45.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,而是都设成

0,下面哪个叙述是正确的?()

A、其他选项都不对

B、没啥问题,神经网络会正常开始训练

C、神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西

D、神经网络不会开始训练,因为没有梯度改变

答案:C

46.如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的主

要因素有()。

A、已知类别样本质量

B、分类准则

C、量纲

D、其他

答案:B

47.以P(w)表示词条w的概率,假设已知P(南京)=0.8,P(市长)=0.6,P(长江大桥)

=0.4:P(南京市)=0.3,P(长江大桥)=0.5:假设前后两个词的出现是独立的,那么

分词结果就是0。

A、南京市*长江*大桥

B、南京*市长*江大桥

C、南京市长*江大桥

D、南京市*长江大桥

答案:B

48.关于Logit回归和SVM不正确的是0。

AvLogit回归目标函数是最小化后验概率

BxLogit回归可以用于预测事件发生概率的大小

C、SVM目标是结构风险最小化

D、SVM可以有效避免模型过拟合

答案:A

49.Fisher线性判别函数的求解过程是将M维特征矢量投影在(B)中进行求解。

A、M-1维空间

B、一维空间

C、三维空间

D、二维空间

答案:B

50.与法律相比,道德0。

A、产生的时间晚

B、适用范围更广

C、内容上显得十分笼统

D、评价标准难以确定

答案:B

51.人工智能的目的是让机器能够0,以实现某些脑力劳动的机械化。

A、和人一样工作

B、完全代替人的大脑

C、模拟、延伸和扩展人的智能

D、具有智能

答案:D

52.下面哪句话是正确的?()

A、机器学习模型的精准度越高,则模型的性能越好

B、增加模型的复杂度,总能减小测试样本误差

C、增加模型的复杂度,总能减小训练样本误差

D、以上说法都不对

答案:D

53.在当前的人工智能领域,机器学习,或者更准确地说,()的技术路线已经成为

研究的主流。

A、“大数据+深度学习”

B、“数据+学习”

C、“大数据+去计算”

D、“云计算+去中心化”

答案:A

54.在LogisticRegression中,如果同时加入L1和L2范数,会产生什么效果()。

A、可以做特征选择,并在一定程度上防止过拟合

B、能解决维度灾难问题

C、能加快计算速度

D、可以获得更准确的结果

答案:A

55.已知:大脑是有很多个叫做神经元的东西构成,神经网络是对大脑的简单的数

学表达。每一个神经元都有输入、处理函数和输出。神经元组合起来形成了网络,

可以拟合任何函数。为了得到最佳的神经网络,我们用梯度下降方法不断更新模

型,给定上述关于神经网络的描述,什么情况下神经网络模型被称为深度学习模

型?0

A、加入更多层,使神经网络的深度增加

B、有维度更高的数据

C、当这是一个图形识别的问题时

D、以上都不正确

答案:A

56.下面哪些是基于核的机器学习算法?()1ExpectationMaximization(EM)(最大

期望算法)2RadiaIBasisFunction(RBF)(径向基核函数)3LinearDiscrimimateAn

alysis(LDA)(主成分分析法)4Suppor_tVec_torMachine(SVM)(支持向量机)

A、1,2,3

B、2,3和4

C、3和4

D、全部都是

答案:B

57.下面关于线性分类器与非线性分类器的区别以及优劣的说法正确的是()。(1)

如果模型是参数的线性函数,并且存在线性分类面,那么就是线性分类器,否则不

是。(2)常见的线性分类器有:LR,贝叶斯分类,单层感知机、线性回归。常见的非

线性分类器:决策树、RF、GBDT、多层感知机⑶线性分类器速度快、编程方便,

但是可能拟合效果会很好⑷非线性分类器编程复杂,但是效果拟合能力弱

A、1,2

B、3和4

G2,3和4

D、全部正确

答案:A

58.下列时间序列模型中,哪一个模型可以较好地拟合波动性的分析和预测。(D)

A、R模型

B、MA模型

GARMA模型

D、GARCH模型

答案:D

59.在逻辑回归输出与目标对比的情况下,以下评估指标中哪一项不适用?()

A、UC-ROC

B、准确度

C、LogIoss

D、均方误差

答案:D

60.E-R模型向关系模型转换时,三个实体之间多对多的联系应该转换为一个独

立的关系模式,且该关系模式的关键字由()组成。

A、多对多联系的属性

B、三个实体的关键字

C、任意一个实体的关键字1

D、任意两个实体的关键字

答案:B

61.假设有这样的一个示例:types=「娱乐,,‘体育,,’科技〕我们在使用列表时,

以下哪个选项,会引起索引错误?0

A、types[-1]

B\types[-2]

Gtypes[0]

D、types[3]

答案:D

62.关于道德与法律,正确的说法是0。

A、在法律健全完善的社会,不需要道德

B、由于道德不具备法律那样的强制性,所以道德的社会功用不如法律

C、在人类历史上,道德与法律同时产生

D、在一定条件下,道德与法律能够相互作用、相互转化

答案:D

63.关于道德评价,正确的说法是0。

A、每个人都能对他人进行道德评价,但不能做自我道德评价

B、道德评价是一种纯粹的主观判断,没有客观依据和标准

C、领导的道德评价具有权威性

D、对一种行为进行道德评价,关键看其是否符合社会道德规范

答案:D

64.目标变量在训练集上的8个实际值[0,0,0,1,1,1,1,1],目标变量的烯是多少?

0

A、-(5/81og(5/8)+3/81og(3/8))

B、5/81og(5/8)+3/81og(3/8)

G3/81og(5/8)+5/81og(3/8)

D、5/81og(3/8)-3/81og(5/8)

答案:A

65.逻辑回归的以下模型:P(y=1|x,w)=g(w0+w1x)其中g(z)是逻辑函数。在上述

等式中,通过改变参数w可以得到的P(y=1|x;w)被视为x的函数。()

A、(0,inf)

B、(-inf,0)

C、(0,1)

D\(-inf,inf)

答案:C

66.假设使用维数降低作为预处理技术,使用PCA将数据减少到k维度。然后使用

这些PCA预测作为特征,以下哪个声明是正确的?()

A、更高的“k”意味着更正则化

B、更高的“k”意味着较少的正则化

C、都不对

D、都是正确的

答案:B

67.如果增加神经网络的宽度,精确度会增加到一个阈值,然后开始降低。造成这

一现象的原因可能是0。

A、只有一部分核被用于预测

B、当核数量增加,神经网络的预测能力降低

C、当核数量增加,其相关性增加,导致过拟合

D、以上都不对

答案:C

68.()很大程度上缓解了人工收费的压力,并且有效地降低了停车场出入口的拥

堵频率。

A、自动停车系统

B、自动收费系统

C、自动驾驶系统

D、自动导航系统

答案:B

69.以下哪种算法不能用于降低数据的维数?()

A、t-SNE

B、PCA

C、LDA

D、都不是

答案:D

70.下列关于静态多态实现重载的描述中正确的是0。

A、重载的方法(函数)的方法名(函数名)可以不同

B、重载的方法(函数)必须在返回值类型以及参数类型上有所不同

C、重载的方法(函数)必须在参数顺序或参数类型上有所不同

D、重载的方法(函数)只需在返回值类型上有所不同

答案:C

71.输入图片大小为200X200,依次经过一层卷积(kerneIsize5X5,padding1,s

tride2),pooIing(kerneIsize3X3,paddingO,stridel),又一层卷积(kerneIsiz

e3X3,paddingl,stridel)之后,输出特征图大小为()。

A、97

B、98

C、96

D、95

答案:A

72.以下哪种方法不属于特征选择的标准方法:()。

A、嵌入

B、过滤

C、包装

D、抽样

答案:D

73.关于正态分布,下列说法错误的是0。

A、正态分布具有集中性和对称性

B、正态分布的均值和方差能够决定正态分布的位置和形态

C、正态分布的偏度为0,峰度为1

D、标准正态分布的均值为0,方差为1

答案:C

74.逻辑回归与多元回归分析有哪些不同?()

A、逻辑回归预测某事件发生的概率

B、逻辑回归有较高的拟合效果

C、逻辑回归系数的评估

D、以上全选

答案:D

75.设有二维数组a[l、m,I、n](2<m〈n),其第一个元素为a[IJ],最后一个元素

为a[m,n],若数组元素以行为主序存放,每个元素占用k个存储单元(k>I),则元

素a[2,2]的存储位置相对于数组空间首地址的偏移量为()。

A、(n+l)*k

B、n*k+l

C、(m+I)*k

D、m*k+l

答案:A

76.()可以大大地解放老师的双手和工作量,提升教学的效率。

A、智能搜题

B、智能批改

C、智能答题

D、智能命题

答案:B

77.下面python内置int()函数使用,不能得到预期值的是()。

A、int('12',l6)的值为16

B、int('12',8)的值为10

C、int('12')的值为12

D、int(10「,2)的值为5

答案:A

78.关于SVM泛化误差描述正确的是()。

A、超平面与支持向量之间距离

B、SVM对未知数据的预测能力

C、SVM的误差阈值

D、以上都对

答案:D

79.在感知机中(Perceptron)的任务顺序是()。(1)随机初始化感知机的权重⑵

去到数据集的下一批(batch)(3)如果预测值和输出不一致,则调整权重(4)对一

个输入样本,计算输出值

A、1,2,3,4

B、4,3,2,1

Cx1,4,3,2

D、3,4,1,2

答案:c

80.在指令系统的各种寻址方式中,获取操作数最快的方式是0。

A、直接寻址

B、间接寻址

C、立即寻址

D、寄存器寻址

答案:C

81.在存储体系中,位于主存与CPU之间的高速缓存(Cache)用于存放主存中部分

信息的副本,主存地址与Cache地址之间的转换工作0。

A、由系统软件实现

B、由硬件自动完成

C、由应用软件实现

D、由用户发出指令完成

答案:B

82.下面关于Hive的说法正确的是()。

AxHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文本映射为一

张数据库表,并提供简单的SQL查询功能

B、Hive可以直接使用SQL语句进行相关操作

C、Hive能够在大规模数据集上实现低延迟快速的查询

D、Hivez在加载数据过程中不会对数据进行任何的修改,只是将数据移动到HDF

S中Hive设定的目录下

答案:A

83.在一个n维的空间中,最好的检测outlier(离群点)的方法是:()。

A、作正态分布概率图

B、作盒形图

C、马氏距离

D、作散点图

答案:C

84.为了得到和SVD一样的投射(projection),你需要在PCA中怎样做?()

A、将数据转换成零均值

B、将数据转换成零中位数

C、无法做到

D、以上方法不行

答案:A

85.人工智能数据主要分本文数据、语音数据、图像数据、()几大类别。

A、通讯数据

B、视频数据

C、结构化数据

D、非结构化数据

答案:B

86.最出名的降维算法是PAC和LSNE。将这两个算法分别应用到数据「X」上,

并得到数据集X_projected_PCA,X_projected_tSNEo下面哪一项对X_projecte

d_PCA和X_projected_tSNE的描述是正确的?()

A、X_projected_PCA在最近邻空间能得到解释

B\X_projected_tSNE在最近邻空间能得到解释

C、两个都在最近邻空间能得到解释

D、两个都不能在最近邻空间得到解释

答案:B

87.计算机系统中,CPU对主存的访问方式属于()。

A、随机存取

B、顺序存取

C、索引存取

D、哈希存取

答案:A

88.以下关于正则化的陈述哪一个是正确的?()

A、使用太大的入值可能会导致您的假设与数据过拟合;这可以通过减小人来避免

B、使用非常大的值人不会影响假设的性能;我们不将人设置为太大的唯一原因是

避免数值问题

C、考虑一个分类问题。添加正则化可能会导致分类器错误地分类某些训练示例

(当不使用正则化时,即当入=0时,它正确地分类了这些示例)

D、由于逻辑回归的输出值OWhB(x)W1,其输出值的范围无论如何只能通过正

则化来“缩小”一点,因此正则化通常对其没有帮助

答案:C

89.SVM的效率依赖于()。

A、核函数的选择

B、核参数

C、软间隔参数

D、以上所有

答案:D

90.下列哪一个图片的假设与训练集过拟合?0

答案:A

91.航空航天领域对于()和精密性有着极高的要求。

A、科技性

B、严谨性

C、安全性

D、精确性

答案:C

92.一般做机器学习应用的时候大部分时间是花费在特征处理上,其中很关键的

一步就是对特征数据进行归一化,归一化的作用是()。

A、归一化后降低了梯度下降求最优解的速度,提高了精度

B、归一化不能提高精度

C、如果机器学习模型使用梯度下降法求最优解时,不做归一化处理,很难收敛甚

至不能收敛。

D、以上说法都不正确

答案:C

93.假如我们使用非线性可分的SVM目标函数作为最优化对象,我们怎么保证模

型线性可分?0

A、设C=1

B、设C=0

C\设c=无穷大

D、以上都不对

答案:C

94.下面哪个/些超参数的增加可能会造成随机森林数据过拟合?0

A、树的数量

B、树的深度

C、学习速率

D、学习次数

答案:B

95.bootstrap数据是什么意思?0

A、有放回地从总共M个特征中抽样m个特征

B、无放回地从总共M个特征中抽样m个特征

C、有放回地从总共N个样本中抽样n个样本

D、无放回地从总共N个样本中抽样n个样本

答案:c

96.十六进制64H转换成二进制和十进制的值分别是0。

A、1100111B96D

B、1100100B100D

G0100100B100D

D、1010110B96D

答案:B

解析:答案解析:十六进制数64H转换为二进制时,6对应二进制的110,4对

应二进制的100,组合起来就是1100100B。转换为十进制时,6乘以16的1次

方等于96,4乘以16的0次方等于4,相加得到100D。所以,十六进制64H转

换成二进制和十进制的值分别是1100100B和100D,选项B是正确的。

97.我们建立一个5000个特征,100万数据的机器学习模型。我们怎么有效地应

对这样的大数据训练:()。1我们随机抽取一些样本,在这些少量样本之上训练2

我们可以试用在线机器学习算法3我们应用PCA算法降维,减少特征数

A、1和2

B、2和3

C、以上都是

D、以上都不是

答案:C

98.下列哪一项属于特征学习算法(representationIearningaIgorithm)?(C)

A、K近邻算法

B、随机森林

C\神经网络

D\都不属于

答案:C

99.样本库功能要求为:数据接入包括()文件导入、HDFS数据导入、FTP文件导入、

NFS数据导入和数据库数据导入。

A、远程

B、本地

G云端

D、SAMBA

答案:B

100.下列关于职业道德的说法中,你认为正确的是()。

A、职业道德与人格高低无关

B、职业道德的养成只能靠社会强制规定

C、职业道德从一个侧面反映人的道德素质

D、职业道德素质的提高与从业人员的个人利益无关

答案:C

101.在以下不同的场景中,使用的分析方法不正确的有()。

A、根据商家最近一年经营及服务数据,用聚类算法判断出天猫商家在各自主营类

目下所属的商家层级

B、根据商家近几年的成交数据,用聚类算法拟合出用户未来一个月可能的消费金

额公式

C、用关联规则算法分析出购买了汽车坐垫的买家,是否适合推荐汽车脚垫

D、根据用户最近购买的商品信息,用决策树算法识别出淘宝买家可能是男还是女

答案:B

102.如果我们用了一个过大的学习速率会发生什么?()

A、神经网络会收敛

B、不好说

C、都不对

D、神经网络不会收敛

答案:D

103.给定三个变量X,Y,Zo(X,Y)、(Y,Z)和(X,Z)的Pearson相关性系数分别为C

1、C2和C3。现在X的所有值加2(即X+2),Y的全部值减2(即Y-2),Z保持不变。

那么运算之后的(X,Y)、(Y,Z)和(X,Z)相关性系数分别为D1、D2和D3。现在试

问D1、D2、D3和C1、C2、C3之间的关系是什么?()

A、D1=C1,D2<C2,D3>C3

B、D1=C1,D2>C2,D3>C3

C、D1=C1,D2>C2,D3<C3

D、1=C1,D2=C2,D3=C3

答案:D

104.下列哪项关于模型能力(modeIcapacity)的描述是正确的?()(指神经网络模

型能拟合复杂函数的能力)

A、隐藏层层数增加,模型能力增加

B、Dropout的比例增加,模型能力增加

C、学习率增加,模型能力增加

D、都不正确

答案:A

105.以下说法中错误的是0。

A、SVM对噪声(如来自其他分部的噪声样本)具备鲁棒性

B、在adaboost算法中,所有被分错样本的权重更新比例不相同

Cvboosting和bagging都是组合多个分类器投票的方法,二者都是根据单个分

类器的正确率确定其权重

D、给定n个数据点,如果其中一半用于训练,一半用户测试,则训练误差和测试误

差之间的差别会随着n的增加而减少的

答案:C

106.下列选择中,说法正确的是:()。

A、继承(inheritance)允许一个类获取另一个类的所有成员和属性。被继承的类

称为超类,而继承的类称为派生类/子类。

B、多态(Polymorphism)的意思是「多种形式」。子类可以定义自己的独特行为,

但不能共享其父类/基类的相同功能或行为

C、Python可以不支持多重继承。一个类只能从一个父类派生。

D、封装(Encapsulation)意味着将数据和成员函数包装在一起成为一个单元。不

能实现数据隐藏。

答案:A

107.Python是面向对象语言,关于类和对象的说法不正确的是:()。

A、类(Class)被视为对象的蓝图。类中的第一行字符串称为doc字符串,包含该

类的简短描述。

B、this表示类的实例,通过使用this关键字,可以在Python中访问类的属性和

方法

C、使用class关键字可以创建了一个类。一个类包含变量和成员组合,称为类成

员。

D、对象(Object)是真实存在的实体。在Python中为类创建一个对象,我们可以

使用obj=CLASS_NAME()

答案:B

108.NaiveBayes是一种特殊的Bayes分类器,特征变量是X,类别标签是C,它的

一个假定是:()。

A、各类别的先验概率P(C)是相等的

B、以0为均值,sqr(2)/2为标准差的正态分布

C、特征变量X的各个维度是类别条件独立随机变量

D、P(X|C)是高斯分布

答案:C

109.我国公民的基本道德规范是()、团结友善、勤俭自强、敬业奉献。

A、爱国爱企、明礼诚信

B、爱国守法、明礼诚信

C、爱岗敬业'诚实守信

D、遵纪守法、诚实信用

答案:B

110.下图是同一个SVM模型,但是使用了不同的径向基核函数的gamma参数,依次

是g1,g2,g3,下面大小比较正确的是()。

A、g1>g2>g3

B\g1—g2—g3

Gg1<g2<g3

D、g1>=g2>=g3

答案:C

111.随着人工智能技术的发展,通过()、虹膜识别'指纹识别等生物识别技术已

推广到银行业的各大主要应用场景中。

A、人脸识别

B、DNA识别

C、声纹识别

D、声音识别

答案:A

112.一监狱人脸识别准入系统用来识别待进入人员的身份,此系统一共包括识别

4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需

求:()。

A、二分类问题

B、多分类问题

C、层次聚类问题

D、k-中心点聚类问题

答案:B

113.Python中类型转换是指将一种数据类型转换为另一种数据类型。下列转换

不正确的是。()

A、int()将任何数据类型转换为整数类型,oct()将整数转换为十六进制

Bxtuple()函数用于转换为元组,set0函数在转换为set后返回类型。

C、Iist()函数用于将任何数据类型转换为列表类型。

D、ict()函数用于将顺序元组(键,值)转换为字典。str()函数用于将整数转换为

字符串。

答案:A

114.Logistic回归分类器是否能对下列数据进行完美分类?0

A\是

B、否

C、不确定

D、都不是

答案:B

115.关于ARMA、R、MA模型的功率谱,下列说法正确的是()

A、MA模型是同一个全通滤波器产生的

B、MA模型在极点接近单位圆时,MA谱是一个深谷

C、AR模型在零点接近单位圆时,AR谱是一个尖峰

D、RMA谱既有尖峰又有深谷

答案:D

116.模型库存放训练出的()模型或采购来的第三方算法模型。

A、实体

B、算法

C、数据

D、对象

答案:B

117.给定三个变量X,Y,Zo(X,Y)、(Y,Z)和(X,Z)的Pearson相关性系数分别为C

1、C2和C3。现在X的所有值加2(即X+2),Y的全部值减2(即Y-2),Z保持不变。

那么运算之后的(X,Y)、(Y,Z)和(X,Z)相关性系数分别为D1、D2和D3。现在试

问D1、D2、D3和C1、C2、C3之间的关系是什么?()

A、D1=C1,D2<C2,D3>C3

B、D1=C1,D2>C2,D3>C3

C、D1=C1,D2>C2,D3<C3

D、1=C1,D2=C2,D3=C3

答案:D

118.假设你使用log-loss函数作为评估标准。下面这些选项,哪些是对作为评估

标准的log-loss的正确解释()。

A、如果一个分类器对不正确的分类很自信,log-loss会严重的批评它。

B、对一个特别的观察而言,分类器为正确的类别分配非常小的概率,然后对log-

Ioss的相应分布会非常大。

C、Iog-loss越低,模型越好

D、以上都是

答案:D

119.下面关于二叉查找树的说法正确的是0。

A、二叉查找树,也称有序二叉树(orderedbinarytree),或已排序二叉树(sorted

binarytree)

B、若任意节点的左子树不空,则左子树上所有结点的值均大于它的根结点的值。

C、若任意节点的右子树不空,则右子树上所有结点的值均小于它的根结点的值。

D、任意节点的左、右子树不是二叉查找树。

答案:A

120.查询名字第二个字母为a的人()。

A、SELECT*FROMPersonsWHEREFirstName='%a%'

B、SELECT*FROMPersonsWHEREFirstNameLIKE'%_a%'

C、SELECT*FROMPersonsWHEREFirstNameLIKE'_a%'

D、SELECT*FROMPersonsWHEREFirstNameLIKE'_a_'

答案:C

解析:答案解析:在SQL查询中,'LIKE'关键字用于在'WHERE'子句中搜索列中

的指定模式。表示任意数量的字符表示一个单一的字符。题目要求查询

名字第二个字母为a的人,所以正确的模式应该是即第一个字符可以是

任意字符,第二个字符必须是a,后面可以跟任意数量的字符。因此,选项C是

正确的答案。

121.预测分析方法分为两大类,分别是定性分析法和()。

A、回归分析法

B、指数平滑法

C、定量分析法

D、平均法

答案:C

122.人工智能的概念最早是由哪一位科学家提出来的()?

A、麦卡锡

B、图林

C、冯•诺依曼

D、明斯基

答案:A

123.对于投影数据为((J2),(0),(J2))。现在如果在二维空间中重建,并将它们

视为原始数据点的重建,那么重建误差是多少?()

A、0%

B、10%

C、30%

D、40%

答案:A

124.人工智能研究的一项基本内容是机器感知。以下列()不属于机器感知的领域。

A、使机器具有视觉、听觉、触觉、味觉、嗅觉等感知能力。

B、让机器具有理解文字的能力。

C、使机器具有能够获取新知识、学习新技巧的能力。

D、使机器具有听懂人类语言的能力

答案:C

125.在计算机外部设备和主存之间直接传送而不是由CPU执行程序指令进行数

据传送的控制方式称为0。

A、程序查询方式

B、中断方式

C、并行控制方式

D、MA方式

答案:D

126.在数据库设计的需求分析阶段应完成包括()在内的文档。

A、E-R图

B、关系模式

C、数据字典和数据流图

D、任务书和设计方案

答案:B

127.()是“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库

软件工具能力范围的数据集合”。

A、数值

B、数字

C、数据

D、大数据

答案:D

128.假设你在卷积神经网络的第一层中有5个卷积核,每个卷积核尺寸为7X7,

具有零填充且步幅为1。该层的输入图片的维度是224X224X3。那么该层输出

的维度是多少?()

A、217x217x3

B、217x217x8

G218x218x5

D、220x220x7

答案:C

129.当在卷积神经网络中加入池化层(poolinglayer)时,变换的不变性会被保留,

是吗?()

A、不知道

B、看情况

C、是

D、否

答案:C

130.某超市研究销售记录数据后发现,买啤酒的人很大概率也会购买尿布,这种

属于数据挖掘的哪类问题?()。

A、关联规则发现

B、聚类

C、分类

D、自然语言处理

答案:A

131.下列哪个不属于CRF模型对于HMM和MEMM模型的优势()。

A、特征灵活

B、速度快

C、可容纳较多上下文信息

D、全局最优

答案:B

132.大数据的0与分布式计算能力也为人工智能提供了强大的储存、计算支持,

大大推动了人工智能和发展。

A、分布式储存

B、大量收集

C、智能传输

D、自动分析

答案:A

133.如果对相同的数据进行逻辑回归,将花费更少的时间,并给出比较相似的精

度(也可能不一样),怎么办?假设在庞大的数据集上使用Logistic回归模型。可

能遇到一个问题,Logistic回归需要很长时间才能训练。()

A、降低学习率,减少迭代次数

B、降低学习率,增加迭代次数

C、提高学习率,增加迭代次数

D、增加学习率,减少迭代次数

答案:D

134.Python内存池机制,下面的说法正确的是0。(1)Python提供了对内存的垃

圾收集机制,但是它将不用的内存放到内存池而不是返回给操作系统。(2)ymall

oc机制。为了加速Python的执行效率,Python引入了一个内存池机制,用于管理

对小块内存的申请和释放。⑶Python中所有大于256个字节的对象都使用pym

alloc实现的分配器,而小的对象则使用系统的malloco(4)对于Python对象

如整数,浮点数和List,都有其独立的私有内存池,对象间不共享他们的内存池。

也就是说如果你分配又释放了大量的整数,用于缓存这些整数的内存就不能再分

配给浮点数。

A、1,2和4

B、3和4

C、1,2和3

D、全部正确

答案:A

135.已知一组数据的协方差矩阵P,下面关于主分量说法错误的是0。

A、主分量分析的最佳准则是对一组数据进行按一组正交基分解,在只取相同数量

分量的条件下,以均方误差计算截尾误差最小

B、在经主分量分解后,协方差矩阵成为对角矩阵

C、主分量分析就是K-L变换

D、主分量是通过求协方差矩阵的特征值得到

答案:C

136.下列int()函数使用,不正确的是:()。

A、int('12',16)的值为16

B、int(12,,8)的值为10。

Gint('12')的值为12

D、int('101',2)的值为5。

答案:A

137.与传统数据库中的数据相比,文本数据具有其独特性,其包括四个方面。半结

构化、高维、高数据量、()。

A、语言性

B、语义性

G语音性

D、结构化

答案:B

138.以下哪种方法能最佳地适应逻辑回归中的数据?0

A、LeastSquareError

B、MaximumLikeIihood

C、Jaccarddistance

D、A和B

答案:B

139.作为行为规范,道德和法律的区别表现在()。

A、道德的作用没有法律大

B、道德规范比法律规范含糊

C、道德和法律作用的范围不同

D、道德和法律不能共同起作用

答案:C

140.智能搜题和智能批改都是OCR的文字识别和()的应用。

A、书写识别

B、手写识别

C、字体识别

D、文字感知

答案:B

141.什么是KDD?()

A、数据挖掘与知识发现

B、领域知识发现

C、文档知识发现

D、动态知识发现

答案:A

142.下列关于python中的迭代器说法不正确的是:()。

A、迭代器是一个可以记住遍历的位置的对象。

B、迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭

代器既能往前,也能后退。

G迭代器有两个基本的方法:iter()和next00

D、列表ls=[1,2,3,4],iter(ls)方法是创建迭代器对象。

答案:B

143.关于特征选择,下列对Ridge回归和Lasso回归说法正确的是?0

A、Ridge回归适用于特征选择

BvLasso回归适用于特征选择

C、两个都适用于特征选择

D、以上说法都不对

答案:B

144.构建一个神经网络,将前一层的输出和它自身作为输入。下列哪一种架构有

A、循环神经网络

B、卷积神经网络

C、限制玻尔兹曼机

D、都不是

答案:A

145.给定以下三个图表(从左往右依次为1,2,3)、哪一个选项对以这三个图表的

描述是正确的?()

A、1是tanh,2是ReLU,3是SIGMOID激活函数

B、1是SIGMOID,2是ReLU,3是tanh激活函数

C、1是ReLU,2是tanh,3是SIGMOID激活函数

D、1是tanh,2是SIGMOID,3是ReLU激活函数

答案:D

146.为了检验连续变量x.y之间的线性关系,下列哪种图最合适?()

A、散点图

B、条形图

C、直方图

D、都不对

答案:A

147.为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究

者找到一个重要的信息处理的机制是()。

A、专家系统

B、人工神经网络

C、模式识别

D、智能代理

答案:B

148.下图显示了训练过的3层卷积神经网络准确度,与参数数量(特征核的数量)

的关系。从图中趋势可见,如果增加神经网络的宽度,精确度会增加到一个特定阈

值后,便开始降低。造成这一现象的可能原因是什么?()

(

U

E

)

mX

hm

wx

E

J

A、即使增加卷积核的数量,只有少部分的核会被用作预测

B、当卷积核数量增加时,神经网络的预测能力(Power)会降低

C、当卷积核数量增加时,它们之间的相关性增加(correlate),导致过拟合

D、以上都不正确

答案:C

149.下面是三个散点图(A,B,C,从左到右)和手绘的逻辑回归决策边界。上图中哪

一个显示了决策边界过度拟合训练数据()?

A

A、

B、

C\

D、这些都没有

答案:C

150.在计算机中,某个图片文件的大小1MB,指的是0。

A、1024*1024个比特(Bit)

B、1024*1024个字节(Byte)

G1000*1000个比特(Bit)

D、1000*1000个字节(Byte)

答案:B

151.建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于

数据挖掘的哪一类任务?()

A、根据内容检索

B、建模描述

C、预测建模

D、寻找模式和规则

答案:C

152.假定你正在处理类属特征,并且没有查看分类变量在测试集中的分布。现在

你想将onehotencoding(OHE)应用到类属特征中。那么在训练集中将OHE应用到

分类变量可能要面临的困难是什么?0

A、分类变量所有的类别没有全部出现在测试集中

B、类别的频率分布在训练集和测试集是不同的

C、训练集和测试集通常会有一样的分布

D、A和B都正确

答案:D

153.在训练神经网络时,损失函数(loss)在最初的几个epochs时没有下降,可能

的原因是?()

A、学习率(learningrate)太低

B、正则参数太高

C、陷入局部最小值

D、以上都有可能

答案:A

154.()是公民道德建设的核心。

A、集体主义

B、爱国主义

C、为人民服务

D、诚实守信

答案:C

155.对于神经网络的说法,下面正确的是:(D)1增加神经网络层数,可能会增加

测试数据集的分类错误率2减少神经网络层数,总是能减小测试数据集的分类错

误率3增加神经网络层数,总是能减小训练数据集的分类错误率

A、2

B、1和3

C、1和2

D、1

答案:D

156.下列不是SVM核函数的是:()。

A、多项式核函数

B、logistic核函数

C、径向基核函数

D、Sigmoid核函数

答案:B

157.下面关于推荐系统的说法正确的是()。

A、个性化推荐:常以“推荐”、“猜你喜欢”、“发现”等形式出现,一般放在

首页位置

B、相关推荐:常以“相关推荐”、“看了还看”等形式出现,一般放在内容详情

C、热门推荐:基于各种数据进行计算,得到的排行榜,支持全局排行以及分类排行

等,位置不限

D、以上都是正确的

答案:D

158.中文同义词替换时,常用到Word2Vec,以下说法错误的是0。

A、Word2Vec基于概率统计

B、Word2Vec结果符合当前预料环境

C、Word2Vec得到的都是语义上的同义词

D\Word2Vec受限于训练语料的数量和质量

答案:C

159.下列哪个不是人工智能的研究领域()。

A、机器证明

B、模式识别

C、人工生命

D、编译原理

答案:D

160.下列哪一项没有违反诚实守信的要求()。

A、保守企业秘密

B、为了牟取暴利,制造伪劣商品

C、根据服务对象来决定是否遵守承诺

D、派人打进竞争对手内部,增强竞争优势

答案:A

161.批规范化(BatchNormaIization)的好处都有啥?()

A、在将所有的输入传递到下一层之前对其进行归一化(更改)

B、它将权重的归一化平均值和标准差

C、它是一种非常有效的反向传播(BP)方法

D、这些均不是

答案:A

162.以下几种模型方法属于判别式模型(口15匚M1皿1:26初℃^1)的有0。(1)混合

高斯模型⑵条件随机场模型⑶区分度训练⑷隐马尔科夫模型

A、2,3

B、3,4

C\1,4

D、1,2

答案:A

163.采用面向对象开发方法时,对象是系统运行时基本实体。以下关于对象的叙

述中,正确的是0。

A、对象只能包括数据(属性)

B、对象只能包括操作(行为)

C、对象一定有相同的属性和行为

D、对象通常由对象名、属性和操作三个部分组成

答案:D

164.以下描述正确的是()。

A、SVM是这样一个分类器,它寻找具有最小边缘的超平面,因此它也经常被称为

最小边缘分类器

B、在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差

C、在决策树中,随着树中结点树变得太大,即使模型的训练误差还在继续降低,

但是检验误差开始增大,这是出现了模型拟合不足的原因

D、聚类分析可以看作是一种非监督的分类

答案:D

165.在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果

知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的

权重和偏移呢?0

A、搜索每个可能的权重和偏差组合,直到得到最佳值

B、赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重

C、随机赋值,听天由命

D、以上都不正确的

答案:B

166.如果线性回归模型中的随机误差存在异方差性,那么参数的OLS估计量是0。

A、无偏的,有效的

B、无偏的,非有效的

G有偏的,有效的

D、有偏的,非有效的

答案:B

167.下面哪项操作能实现跟神经网络中Dropout的类似效果?()

AvBoosting

B、agging

C、Stacking

D、Mapping

答案:B

168.假设我们有一个数据集,在一个深度为6的决策树的帮助下,它可以使用100%

的精确度被训练。现在考虑以下两点,并基于这两点选择正确的选项0。1深度

为4时将有高偏差和低方差2深度为4时将有低偏差和低方差

A、只有1

B、只有2

C、1和2

D、没有一个

答案:A

169.下面关于炳的说法正确的是()。⑴烯的概念最早起源于物理学,用于度量一

个热力学系统的无序程度。在信息论里面,峭是对确定性的测量。(2)婚的英文原

文为entropy,最初由德国物理学家鲁道夫•克劳修斯提出,表示一个系统在不受

外部干扰时,其内部最不稳定的状态。⑶任何粒子的常态都是随机运动,也就是"

无序运动",如果让粒子呈现“有序化",必须耗费能量。所以,温度(热能)可以被看

作"有序化”的一种度量,而"端"可以看作是“无序化”的度量。⑷如果没有外部能

量输入,封闭系统趋向越来越混乱(炳越来越大)o比如,如果房间无人打扫,不可

能越来越干净(有序化),只可能越来越乱(无序化)。

A、1和2

B、3和4

C、1,2和3

D、全部正确

答案:B

170.对于一个图像识别问题(在一张照片里找出一只猫),下面哪种神经网络可以

更好地解决这个问题?()

A、循环神经网络

B、感知机

C、多层感知机

D、卷积神经网络

答案:D

171.有两个样本点,第一个点为正样本,它的特征向量是(0,7);第二个点为负样

本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类

器的分类面方程是0。

A、2x+y=4

B、x+2y=5

C\x+2y=3

D\2x-y=0

答案:C

172.《公民道德建设实施纲要》指出我国职业道德建设规范是()。

A、求真务实、开拓创新、艰苦奋斗、服务人民、促进发展

B、爱岗敬业、诚实守信、办事公道、服务群众、奉献社会

C、以人为本、解放思想、实事求是、与时俱进、促进和谐

D、文明礼貌、勤俭节约、团结互助、遵纪守法、开拓创新

答案:B

173.在k-均值算法中,以下哪个选项可用于获得全局最小?()

A、尝试为不同的质心(centr。id)初始化运行算法

B、调整迭代的次数

C、找到集群的最佳数量

D、以上所有

答案:D

174.假设我们使用原始的非线性可分版本的Soft-SVM优化目标函数。我们需要

做什么来保证得到的模型是线性可分离的?()

A、C=0

B、C=1

C\正无穷大

D、C负无穷大

答案:C

175.K-Means算法无法聚以下哪种形状的样本?()

A、圆形分布

B、螺旋分布

C、带状分布

D、凸多边形分布

答案:B

176.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?

0

A、频繁模式挖掘

B、分类和预测

C、数据预处理

D、数据流挖掘

答案:C

177.当数据过大以至于无法在RAM中同时处理时,哪种梯度下降方法更加有效?

0

A、随机梯度下降法(StochasticGradientDescent)

B、不知道

G整批梯度下降法(FuIIBatchGradientDescent)

D、都不是

答案:A

178.下列关于表达式的值的说法,正确的是:()

A、表达式1<2<3的值为True

B\表达式30r5的值为5

C、表达式0or5的值为0

D、表达式3and5的值为3

答案:A

179.下面有关分类算法的准确率,召回率,F1值的描述,错误的是?()

A、准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的

查准率

B、召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的

是检索系统查全率

C、正确率、召回率和F值取值都在0和1之间,数值越接近0,查准率或查全率

就越高

D、为了解决准确率和召回率冲突问题,引入了F1分数

答案:C

180.下面有关序列模式挖掘算法的描述,错误的是?()

AxprioriAII算法和GSP算法都属于Apriori类算法,都要产生大量的候选序列

B、FreeSpan算法和PrefixSpan算法不生成大量的候选序列以及不需要反复扫

描原数据库

C\在时空的执行效率上,FreeSpan比PrefixSpan更优

D、和AprioriAII相比,GSP的执行效率比较高

答案:C

181.考虑某个具体问题时,你可能只有少量数据来解决这个问题。不过幸运的是

你有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个

预先训练好的网络?0

A、把除了最后一层外所有的层都冻住,重新训练最后一层

B、对新数据重新训练整个模型

C、只对最后几层进行调参(finetune)

D、对每一层模型进行评估,选择其中的少数来用

答案:C

182.模型库功能要求为:模型管理包括模型()、模型删除、版本管理、模型标签、

模型收藏和模型共享。

A、评估

B、导出

C、输出

D、导入

答案:D

183.常见的生成式模型是0。

A、K近邻、SVM、决策树

B、感知机、线性判别分析(LDA)

C、线性回归、传统的神经网络、逻辑回归

D、朴素贝叶斯、隐马尔可夫模型、高斯混合模型

答案:D

184.下列哪个函数不可以做激活函数?()

A、y=tanh(x)

B\y=sin(x)

Gy=max(x,0)

D、y=2x

答案:D

185.在t-SNE算法中,可以调整以下哪些超参数?0

A、维度数量

B、平稳测量有效数量的邻居

C、最大迭代次数

D、以上所有

答案:D

186.智能语音技术具体可以分为自动语音识别、()、声纹识别、语音分类等。

A、语音学习

B、语音分析

C、语音合成

D、语音转写

答案:C

187.阅读下面的代码,下面的选项中,不正确的是:()。Ideffun():2yieId13yieI

d24yieId356x=fun()7print(next(x))

A、生成器(generator)的定义与普通函数类似,生成器使用yield关键字生成值。

B、如果一个函数包含yield关键字,那么该函数将自动成为一个生成器。

C、第6行代码,x是一个生成器对象。

D、第7行代码,输出是3。

答案:D

解析:答案解析:在Python中,生成器是一种使用简单的语法做惰性求值的迭

代器。从给出的代码来看:A选项正确,生成器的定义确实与普通函数类似,只

是使用yield关键字来生成值。B选项正确,如果一个函数包含yield关键字,

该函数就是一个生成器。C选项正确,第6行代码调用函数fun(),返回一个生

成器对象赋值给x。D选项不正确,第7行代码'print(next(X))'将会输出生成

器产生的第一个值,即1,而不是3。因此,选项D是不正确的。

188.后缀表达式“ab+cd-*"与表达式()对应。

A、(a+b)*(c-d)

B\a+b*c-d

C\a+b*(c-d)

D、(a+b)*c-d

答案:A

189.以下哪个是判别式的模型0。

A、朴素贝叶斯

B、决策树

C、高斯混合模型

D、文档主题生成模型(LDA)

答案:B

190.下面选项中,正确的是:()。

A、语句x=(3,)执行后x的值为3O

B、语句x=⑶执行后x的值为(3,)。

G已知x=3和y=5,执行语句X,y=y,x后x的值是5,y的值是3。

D、假设n为整数,那么表达式n&1==n%2的值为false。

答案:C

191.在二分类问题中,当测试集的正例和负例数量不均衡时,以下评价方案哪个

是相对不合理的()(假设precision=TP/(TP+FP),recaIl=TP/(TP+FN)□)

A、ccuracy:(TP+TN)/alI

B\F-vaIue:2*recall*precision/(recaII+precision)

C、G-mean:sqrt(precision*recaII)

D、AUC:R0C曲线下面积

答案:A

192.影响基本K-均值算法的主要因素有()。1样本输入顺序2模式相似性测度3

聚类准则4初始类中心的选取

A、1,2和4

B、3和4

C、2和4

D、全部正确

答案:A

193.Python中zip函数称为拉链函数,入参是可迭代对象,语法是zip(*iterab

les),阅读下面的代码,输出结果是:()°Numbers=[1,2,3]String=['one','two1,

'three']ResuIt=zip(numbers,string)Print(set(resu11))Print(Iist(resuI

t))

A、第4行代码输出是:{(3,1three'),(2,'two'),(1,'one'))

B、第5行代码输出是:[(3,'three'),(2,'two'),(1,'one')]

G第4行代码输出是:(3,'three'),(2,'two1),(1,'one')

D、第5行代码输出是:[⑶'three',2,'two1,1,'one']

答案:A

解析:'zip'函数在Python中用于将多个可迭代对象打包成一个元组的迭代器,

每个元组包含所有可迭代对象在相同位置的元素。给定的代码中,'Numbers'和'

String'是两

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论