人工智能单选练习试题附答案_第1页
人工智能单选练习试题附答案_第2页
人工智能单选练习试题附答案_第3页
人工智能单选练习试题附答案_第4页
人工智能单选练习试题附答案_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页人工智能单选练习试题附答案1.考虑以下问题:假设我们有一个5层的神经网络,这个神经网络在使用一个4GB显存显卡时需要花费3个小时来完成训练。而在测试过程中,单个数据需要花费2秒的时间。如果我们现在把架构变换一下,当评分是0.2和0.3时,分别在第2层和第4层添加Dropout,那么新架构的测试所用时间会变为多少?A、少于2sB、大于2sC、仍是2sD、说不准【正确答案】:C2.半监督学习包括(___)。A、纯半监督学习B、主动学习C、回归学习D、分类学习、【正确答案】:A解析:

见算法解析3.类别不平衡指分类任务中不同类别的训练样例数目(___)的情况。A、没有差别B、差别很大C、差别很小D、以上都不正确【正确答案】:B解析:

见算法解析4.批规范化(BatchNormalization)的好处都有啥?A、让每一层的输入的范围都大致固定B、它将权重的归一化平均值和标准差C、它是一种非常有效的反向传播(BP)方法D、这些均不是【正确答案】:A5.生物特征识别技术不包括(

)。A、体感交互B、指纹识别C、人脸识别D、虹膜识别【正确答案】:A解析:

弱人工智能是指不能制造出真正地推理和解决问题的智能机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有自主意识。认知智能是指机器具有主动思考和理解的能力,不用人类事先编程就可以实现自我学习,有目的推理并与人类自然交互。人类有语言,才有概念、推理,所以概念、意识、观念等都是人类认知智能的表现,机器实现以上能力还有漫长的路需要探索。答案选D。6.NMS算法中文名为()A、非极大值抑制B、非极小值抑制C、极大值抑制D、极小值抑制【正确答案】:A解析:

见算法解析7.语音是一种典型的()数据。A、无结构无序列B、有结构序列C、无结构序列D、有结构无序列【正确答案】:C解析:

循环神经网最常常遇到的问题是:①.梯度消失②.词语依赖位置较远③.梯度爆炸8.在中期图像识别技术(2003-2012)中,索引的经典模型是()。A、口袋模型B、词袋模型C、胶囊模型D、增量模型【正确答案】:B解析:

早期图像识别技术中存在的主要问题是全局特征丢掉了图像细节。9.以下哪个关于监督式学习的说法是正确的?A、决策树是一种监督式学习B、监督式学习不可以使用交叉验证进行训练C、监督式学习是一种基于规则的算法D、监督式学习不需要标签就可以训练【正确答案】:A10.下列选项中,不属于深度学习模型的是?A、线性回归B、深度残差网络C、卷积神经网络CNND、循环神经网络RNN【正确答案】:A解析:

k-means是一种无监督聚类方法。11.我国人工智能三步走战略,第二步()人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平A、到2035年B、到2030年C、到2025年D、到2020年【正确答案】:C解析:

我国人工智能三步走战略,其中第一步,到2020年人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点12.数据科学家可能会同时使用多个算法(模型)进行预测,并且最后把这些算法的结果集成起来进行最后的预测(集成学习),以下对集成学习说法正确的是()A、单个模型之间有高相关性B、单个模型之间有低相关性C、在集成学习中使用“平均权重”而不是“投票”会比较好D、单个模型都是用的一个算法【正确答案】:B13.下列选项中,哪个不是关键词提取常用的算法?A、TF-IDFB、TextRankC、SSAD、LDA【正确答案】:C14.fasterRCNN用于生成候选框proposal的模块名称()A、RPNB、CNNC、ResNetD、RoIpooling【正确答案】:A解析:

mAP表示算法处理每张照片时间。15.从互联网进化到移动互联网,()将会在移动互联网后迎来一个全新的时代。A、人工智能B、元宇宙C、数字孪生D、大数据【正确答案】:B16.下列哪一个不是神经网络的代表A、卷积神经网络B、递归神经网络C、残差网络D、xgboost算法【正确答案】:D解析:

A、防止模型过拟合而加在损失函数后面的一项;B、L1范数符合拉普拉斯分布,是不完全可微的;C、L2正则化项是模型各个参数的平方和的开方值。17.循环神经网络(recurrentneuralnetwork,RNN),是一种用于处理具有类似()的数据的神经网络。A、网格结构B、数组结构C、序列结构D、表格结构【正确答案】:C解析:

卷积神经网络(convolu-tionalneuralnetwork,CNN),是一种专门用来处理具有类似()的数据的神经网络。18.知识图谱在架构层面可分为()和数据层A、模式层B、文本层C、信息层D、知识层【正确答案】:A解析:

命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等19.人工智能产业链条主要包括:基础技术支撑、()、人工智能应用。A、智能平台建设B、大数据平台C、互联网应用D、人工智能技术【正确答案】:D20.卷积神经网络作为一种常见的深度学习网络结构已被广泛接受,下列任务的主流方法中没有用到卷积神经网络的任务是A、图像风格迁移&B、&图像分割&C、&人脸识别&D、&房价预测【正确答案】:D解析:

主要应用21.在自动驾驶中,AI需要不断地通过路面信息来调整开车的决策,这种处理模式适合用()来训练出合理的策略。A、监督学习B、非监督学习C、强化学习D、弱化学习【正确答案】:C22.一条规则形如:,其中“←"右边的部分称为(___)A、规则长度B、规则头C、布尔表达式D、规则体【正确答案】:D解析:

见算法解析23.下面对梯度下降方法描述不正确的是A、梯度下降算法是一种使得损失函数最小化的方法B、梯度反方向是函数值下降最快方向C、梯度方向是函数值下降最快方向D、梯度下降算法用来优化深度学习模型的参数【正确答案】:C24.生成式对抗网络核心是对抗式,两个网络互相竞争,一个负责生成样本,那么另一个负责做什么呢?A、判别B、计算C、统计D、生成【正确答案】:A25.在一个神经网络中,知道每一个神经元的权重和偏差是最重要的一步。如果知道了神经元准确的权重和偏差,便可以近似任何函数,但怎么获知每个神经的权重和偏移呢?A、搜索每个可能的权重和偏差组合,直到得到最佳值B、赋予一个初始值,然后检查跟最佳值的差值,不断迭代调整权重C、随机赋值,听天由命D、以上都不正确的【正确答案】:B26.人脸识别系统是容易受到外部攻击的,因而需要增加类似活体检测的技术,但还是不能解决A、照片攻击B、视频回放攻击C、照片面具攻击D、黑客网络攻击【正确答案】:D解析:

我们可以为每个聚类构建不同的模型,提高预测准确率。“类别id”作为一个特征项去训练,可以有效地总结了数据特征。所以B是正确的27.“数字孪生(DigitalTwin)”这一概念被美国()教授提出。A、MichaelArbibB、EdwardAlbertFeigenbaumC、MichaelGrievesD、ArthurSamuel【正确答案】:C解析:

隐私计算技术助力人工智能数据安全可信地进行写作。28.文本分类模型组成部分的正确顺序是:1.文本清理(Textcleaning)2.文本标注(Textannotation)3.梯度下降(Gradientdescent)4.模型调优(Modeltuning)5.文本到预测器(Texttopredictors)A、12345B、13425C、12534D、$13,452【正确答案】:C29.我们日常生活中的上下班,指纹扫描打卡考勤、虹膜扫描,应用到了人工智能中的A、机器翻译技术B、机器翻译C、虚拟现实D、模式识别【正确答案】:D解析:

RNN存在严重的梯度消失现象,因此改进出LSTM模型。30.()控制着整个LSTM单元的状态或者记忆,它会根据每个时刻的输入进行更新。A、隐状态向量B、状态向量C、显状态向量D、以上都不对【正确答案】:B解析:

使用一个滑动窗口对语料从左到右扫描,在每个窗口内,中心词需要预测它的上下文,并形成训练数据31.在训练集上每学到一条规则,就将该规则覆盖的训练样例去除,然后以剩下的训练样例组成训练集重复上述过程的方法称为(___)A、缺省规则B、序贯覆盖C、不放回学习D、一阶规则【正确答案】:B解析:

见算法解析32.CNN不具有以下那个特性。A、局部连接B、权值共享C、空间或时间上的下采样D、不定长输入【正确答案】:D解析:

朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类算法不属于深度学习模型。33.下列哪个应用领域不属于人工智能应用?()A、人工神经网络B、自动控制C、自然语言学习D、专家系统【正确答案】:B34.机器学习在向()方向演进。A、分布式隐私保护B、集中式存储C、边缘计算D、云存储【正确答案】:A解析:

长期来看专用型人工智能的发展将不依赖于对人脑认知机制的科学研究。。35.对于线性不可分的数据,支持向量机的解决方式是A、软间隔B、硬间隔C、核函数D、以上选项均不正确【正确答案】:C36.以下属于回归算法的评价指标是?A、召回率B、混淆矩阵C、均方误差D、准确率【正确答案】:C37.下列哪项关于模型能力的描述是正确的(指模型能近似复杂函数的能力)A、隐层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、都不正确【正确答案】:A38.以下哪个聚类算法不属于基于网格的聚类算法()。A、STINGB、WavelusterC、MAFID、IRH【正确答案】:D39.()适合连续特征,它假设每个特征对于每个类都符合正态分布。A、GaussianNBBernoulliNBC、MultinomialNBD、BaseDiscreteNB【正确答案】:A解析:

Scikit-Learn中accuracy_score可以实现计算模型准确率。40.下列哪个函数不可以做激活函数?A、y=tanh(x)B、y=sin(x)C、y=max(x,0)D、y=2x【正确答案】:D41..

混沌度(Perplexity)是一种常见的应用在使用深度学习处理NLP问题过程中的评估技术,关于混沌度,哪种说法是正确的?A、混沌度没什么影响B、混沌度越低越好C、混沌度越高越好D、混沌度对于结果的影响不一定【正确答案】:B42.下面对前馈神经网络描述不正确的是A、各个神经元接受前一级神经元的输入,并输出到下一级B、层与层之间通过“全连接”进行连接,即两个相邻层之间神经元完全成对连接C、同一层内的神经元相互不连接D、同一层内神经元之间存在全连接【正确答案】:D43.下列哪项不属于聚类算法()A、K-meansBIRCHC、SVMDBSCAN【正确答案】:C解析:

神经网络会将数据转化为更适合解决目标问题的形式,我们把这种过程叫做特征学习。44.关于线性回归的描述,以下正确的有:A、基本假设包括随机干扰项是均值为0,方差为1的标准正态分布B、基本假设包括随机干扰项是均值为0的同方差正态分布C、多重共线性会使得参数估计值方差减小D、基本假设包括不服从正态分布的随机干扰项【正确答案】:B45.Softmax算法中温度趋近于0时Softmax将趋于(___)A、仅探索B、仅利用C、全探索D、全利用【正确答案】:B解析:

见算法解析46.下列关于XGboost算法描述中错误的是A、由于其特殊原因,无法分布式化B、xgboost在代价函数里加入了正则项,用于控制模型的复杂度C、可以处理带有缺失值的样本D、允许使用列抽样来减少过拟合【正确答案】:A47.随着大数据、()、量子计算等新技术的快速发展,人类社会已经步入了第四次工业革命时代A、片上存储B、芯片设计C、人工智能D、泛在互联【正确答案】:C解析:

以上都是人工智能发展预测。48.下面关于Jarvis-Patrik(JP)聚类算法的说法不正确的是()。A、JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇。B、JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇。C、JP聚类是基于SNN相似度的概念。D、JP聚类的基本时间复杂度为O(m)。【正确答案】:D49.输入图片大小为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大小为?A、95B、96C、97D、$98【正确答案】:C解析:

每个神经元可以有一个或多个输入,和一个或多个输出。如图所示的神经网络结构中,隐藏层的每一个神经元都是多输入多输出。若将输出层改为一个神经元,则隐藏层每个神经元都是一个输出;若将输入层改为一个神经元,则隐藏层每个神经元都是一个输入。50.()函数一般用在多分类问题中,它是对逻辑斯蒂回归logistic的一种推广,也被称为多项式逻辑斯蒂回归模型。A、ReluB、softmaxC、TanhD、sigmoid【正确答案】:B解析:

GooLeNet中使用较多小tricks,其中全局平局池化GAP就是一个,使用GAP的优点是减少参数量,实现任意大小的输入51.Dropout是一种在深度学习环境中应用的正规化手段,他是这样运作的,在一次循环中我们先随机选择神经层中的一些单元并将其临时隐藏,然后再进行该次循环中神经网络的训练和优化过程,在下一次循环中,我们又将隐藏另外一些神经元,如此直至训练结束。根据以上描述,Dropout技术在下列哪种神经层中不能发挥优势?A、仿射层B、卷积层C、RNN层D、以上都不对【正确答案】:C解析:

LSTM一种特殊的RNN网络,该网络设计出来是为了解决长依赖问题52.以下算法中可以用于图像平滑的是()。A、均值滤波;B、对比度增强C、二值化D、动态范围压缩【正确答案】:A解析:

长短期记忆LSTM具有与循环神经网络相似的控制流,两者的区别在于LSTM中增加了忘记门导致单元内的处理过程不同。53.语义网络表达知识时,有向弧AKO链、ISA链是用来表达节点知识的A、无悖性B、可扩充性C、继承性D、连贯性【正确答案】:C解析:

从全称判断推导出特称判断或单称判断的过程,即由一般性知识推出适合于某一具体情况的结论的推理是演绎推理54.关于GoogLeNet描述正确的有:A、GoogLeNet仅仅是在宽度上进行了探索,所以它是一个很浅的网络B、GoogLeNet在宽度上进行了探索,为后人设计更加复杂的网络打开了思路C、GoogLeNet使用了Inception结构,Inception结构只有V1这一个版本D、GoogLeNet结合多种网络设计结构所以是到目前为止分类效果最好的网络结构【正确答案】:B解析:

VGG全部使用了3*3的卷积核和2*2的池化核55.关于Boltzmann描述错误的是(___)A、基于能量的模型;B、优化目标函数为最小化能力函数;C、分为显层和隐层;D、神经元都是数值型;【正确答案】:D解析:

见算法解析56.卷积层是深度神经网络的主要结构之一,已经在大量任务中用到,下面哪一个任务的主流方法中没有用到卷积层A、为图像自动生成描述标题&B、&中英文互译&C、&中文分词&D、&场景文字检测【正确答案】:C解析:

主要应用57.(___)是在一个数据集上对多个算法进行比较。A、t检验B、交叉验证t检验C、Friedman检验D、McNemar检验【正确答案】:C解析:

见算法解析58.Boosting的本质实际上是一个加法模型,通过改变训练样本()学习多个分类器并进行一些线性组合A、权重B、分布C、概率D、数量【正确答案】:A解析:

SVM的基本思想是间隔最大化来得到最优分离超平面59.关于支持向量机,哪项说法不正确()A、支持向量机可以用于处理二分类及多分类问题B、支持向量机只能用于线性可分的分类问题C、支持向量机可用于回归问题D、核函数的选择对支持向量机的性能影响较大【正确答案】:B解析:

广度优先搜索搜索的范围最广60.以下程序的输出是()?array=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]]);print(array.shape)A、(4,3)B、(3,4)C、3D、$4【正确答案】:A解析:

见算法解析61.下列关于深度学习说法错误的是A、LSTM在一定程度上解决了传统RNN梯度消失或梯度爆炸的问题B、CNN相比于全连接的优势之一是模型复杂度低,缓解过拟合C、只要参数设置合理,深度学习的效果至少应优于随机算法D、随机梯度下降法可以缓解网络训练过程中陷入鞍点的问题【正确答案】:C解析:

相同超参数数量情况下,比起自适应的学习率调整方式,SGD加手动调节通常会取得更好效果62.对于图像识别问题(比如识别照片中的猫),神经网络模型结构更适合解决哪类问题?A、多层感知器B、卷积神经网络C、循环神经网络D、感知器【正确答案】:B63.通常池化操作的效果是:A、使图片变大B、使图片变小C、使图片变成三角形D、使图片变成圆形【正确答案】:B解析:

池化操作的作用是下采样64.下列哪些属于循环神经网络()A、LeNetB、GoogleNetC、Bi-LSTMD、BERT【正确答案】:C解析:

在处理序列数据时,较容易出现梯度消失现象的模型是RNN65.当前,预训练模型参数数量、训练数据规模按照()倍/年的趋势增长。A、10B、100C、300D、$1,000【正确答案】:C解析:

量子计算机基本信息单位是量子比特,可同时具有0、1及其线性叠加态66.计算智能和感知智能的关键技术已经取得较大突破,弱人工智能应用条件基本成熟。但(

)的算法尚未突破,前景仍不明朗。A、视频智能B、语音智能C、触觉智能D、认知智能【正确答案】:D解析:

在国内计算机视觉领域,动静态图像识别和人脸识别是主要研究方向,目前由于动态检测与识别的技术门槛限制,静态图像识别与人脸识别的研究暂时处于领先位置.答案选C。67.numpy数组的ndim属性是()?A、数组的维度B、各维度大小的元组C、行数D、列数【正确答案】:A解析:

见算法解析68.用Tensorflow处理图像识别任务时,若输入数据的形状为[64,224,224,3],下面说法正确的是()A、每一张图片都是二值图片B、每一张图片都是三通道图片C、模型一次处理224张图片(batchsize为224)D、以上选项均不正确【正确答案】:B解析:

根据已知模式在数据集中寻找相似模式属于数据挖掘中的内容检索任务。69.LARS属于哪种特征选择方法(___)A、包裹式B、启发式C、嵌入式D、过滤式【正确答案】:C解析:

见算法解析70.下列哪个应用领域不属于人工智能应用?A、人工神经网络B、自动控制C、自然语言学习D、专家系统【正确答案】:B解析:

生物特征识别技术,是指通过计算机利用人体所固有的生理特征(指纹、虹膜、面相、DNA等)或行为特征(步态、击键习惯等)来进行个人身份鉴定的技术。步态识别、人脸识别、虹膜识别运用的都是生物特征,文本识别不属于生物特征识别。答案选C71.问答系统中的NLP技术,以下描述不正确的是:A、问答(QA)系统的想法是直接从文档、对话、在线搜索和其他地方提取信息,以满足用户的信息需求。QA系统不是让用户阅读整个文档,而是更喜欢简短而简洁的答案。B、QA系统相对独立很难与其他NLP系统结合使用,现有QA系统只能处理对文本文档的搜索,尚且无法从图片集合中提取信息。C、大多数NLP问题都可以被视为一个问题回答问题。范例很简单:我们发出查询指令,机器提供响应。通过阅读文档或一组指令,智能系统应该能够回答各种各样的问题。D、强大的深度学习架构(称为动态内存网络(DMN))已针对QA问题进行了专门开发和优化。给定输入序列(知识)和问题的训练集,它可以形成情节记忆,并使用它们来产生相关答案。【正确答案】:B72.梯度爆炸问题是指在训练深度神经网络的时候,梯度变得过大而损失函数变为无穷。在RNN中,下面哪种方法可以较好地处理梯度爆炸问题?A、用改良的网络结构比如LSTM和GRUsB、梯度裁剪C、DropoutD、所有方法都不行【正确答案】:B73.关于学习率初始值设定描述正确的是()A、学习率是网络自己学习得到的B、学习率不同场景是相同的C、学习率是根据不同场景,人为设定的D、学习率不是人为设定的【正确答案】:C解析:

softmax函数一般用在多分类问题中,它是对逻辑斯蒂回归logistic的一种推广,也被称为多项式逻辑斯蒂回归模型。74.混淆矩阵中TP=16,FP=12,FN=8,TN=4,召回率是()。A、1212122022年1月4日B、1212122022年1月2日C、1212122022年4月7日D、1212122022年2月3日【正确答案】:D解析:

根据精确率计算公式可得。75.下面算法中哪个不是回归算法A、线性回归B、逻辑回归C、岭回归D、随机森林【正确答案】:B76.TF-IDF模型中,TF意思是词频,IDF意思是()。A、文本频率指数B、C、逆文本频率指数D、词频指数E、逆词频指数【正确答案】:B解析:

常见的图像预处理方法不包括图像标注。77.例如在生产与采购环节,典型的AI应用场景包括智能质检,利用()等AI技术可代替人力或者协助人力完成对缺陷商品进行识别。A、机器视觉B、语音识别C、机器推理D、机器学习【正确答案】:A解析:

在用户洞察环节,银行业企业普遍面临对消费者数据开发不足的问题,AI技术的加持能够实现更深层次的客户洞察,基于多维度的用户数据构建用户画像,实现更精准的用户触达。78.下列哪一个不是无约束算法。A、梯度下降法B、拟牛顿法C、启发式优化方法D、EM算法【正确答案】:D解析:

常见的机器学习模型正则化方法包含数据增强、模型集成、引入参数范数惩罚项79.在K-摇臂赌博机中,若尝试次数非常大,在一段时间后,摇臂的奖赏能很好的近似出来,不再需要探索,则可让ε随着尝试次数增加而(___)A、增大B、置为无穷C、置为0D、减少【正确答案】:D解析:

见算法解析80.下列关于长短期记忆网络LSTM和循环神经网络RNN的关系描述正确的是()。A、LSTM是简化版的RNNB、LSTM是双向的RNNC、LSTM是多层的RNND、LSTM是RNN的扩展,通过特殊的结构设计来避免长期依赖问题【正确答案】:D解析:

dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。81.目前虚拟主播中唇形变化与语音可实现对齐,这属于计算机视觉中哪种技术()A、图像合成B、图像识别C、图像检测D、图像去噪【正确答案】:A82.在一个神经网络中,下面哪种方法可以用来处理过拟合?A、DropoutB、分批归一化(BatchNormalization)C、正则化(regularization)D、都可以【正确答案】:D83.输入图片大小为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大小为A、95B、96C、97D、$98【正确答案】:C84.人工智能发展的四波浪潮分别为互联网智能化、商业智能化、实体世界智能化和()。A、自主智能化B、工业智能化&C、&实业智能化D、科研智能化【正确答案】:A解析:

P2185.在其他条件不变的前提下,以下做法容易引起机器学习中的“过拟合”问题的是()。A、增加训练集量B、减少神经网络隐藏层节点数C、删除稀疏的特征D、SVM算法中使用高斯核/RBF核代替线性核【正确答案】:D解析:

TF-IDF模型中,TF意思是词频,IDF意思是逆文本频率指数。86.Bagging是一个低效的集成学习算法A、正确B、错误C、nanD、nan【正确答案】:B解析:

Inception模块采用多通路,不同的设计形式,每个支路使用多通路,不同大小的卷积核。87.Word2Vec提出了哪两个算法训练词向量?A、COBWSoftmaxB、Softmax、CBOWCBOW、Skip-gramDD、Skip-gramCOBWC【正确答案】:C解析:

输入门控制当前时刻的输入信息需要向状态向量中注入哪些信息。88.感知机描述错误的是:(___)A、感知机根据正确的程度进行权重调整;B、输入层接收外界输入信号传递给输出层;C、输出层是M-P神经元;D、感知机能容易实现逻辑与、或、非运算;【正确答案】:A解析:

见算法解析89.

下列哪项关于模型能力(modelcapacity)的描述是正确的?(指神经网络模型能拟合复杂函数的能力)A、隐藏层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、都不正确【正确答案】:A90.能够提取出图片边缘特征的网络是()。A、卷积层B、池化层C、全连接层D、输出层【正确答案】:A91.逻辑回归的损失函数是下列哪一种?()A、平方损失函数B、对数损失函数C、HingeLoss0-1损失函数D、绝对值损失函数【正确答案】:B92.人工智能系统()技术重点逐步从数字域扩展到物理域。A、通用性B、准确性C、稳定性D、确定性【正确答案】:C解析:

在算法层面,超大规模预训练模型等成为近两年最受关注的热点之一,不断刷新各领域榜单。93.以下关于熵、信息增益、基尼指数的相关描述中错误的是A、熵越大,不确定性越大,信息量也就越大B、信息增益越大,表示某个条件熵对信息熵减少程序越大,也就是说,这个属性对于信息的判断起到的作用越大C、Gini指数越大,不纯度越小,越容易区分,越不容易分错D、熵权法是一种客观赋权法,因为它仅依赖于数据本身的离散性【正确答案】:C94.关于常用评分函数描述错误的为(___)A、基于信息论准则;B、学习问题看做为数据压缩任务;C、学习目标为以最短编码长度描述训练数据模型;D、编码位数仅为自身所需的编码位数;【正确答案】:D解析:

见算法解析95.以下关于算法的说法中,不正确的是A、机器学习算法分为有监督、半监督和无监督三种B、卷积神经网络是重要的迁移学习算法C、决策树算法属于监督学习类别D、K-Means是属于无监督学习算法【正确答案】:B96.Transformer中抛弃了传统的CNN和RNN,整个网络结构完全是由()机制组成。ActionB、AttentionC、TransformationD、Information【正确答案】:B解析:

在RNN中,目前使用最广泛的模型便是LSTM模型,该模型能够更好地建模长序列。97.建立一个5000个特征,100万数据的机器学习模型.我们怎么有效地应对这样的大数据训练:()。A、我们随机抽取一些样本,在这些少量样本之上训练B、我们可以试用在线机器学习算法C、我们应用PCA算法降维,减少特征数D、以上所有【正确答案】:D98.Relief属于哪种特征选择方法(___)A、包裹式B、启发式C、嵌入式D、过滤式【正确答案】:D解析:

见算法解析99.对于图像分类问题,以下哪个神经网络更适合解决这个问题?A、感知器B、循环神经网络C、卷积神经网络D、全连接神经网络【正确答案】:C100.代码arr1=np.array([[1,2,3],[4,5,6]]);arr2=2*np.ones([2,3],dtype=64);print((arr1*arr2)[1][2])的输出结果是()?注:(已导入numpy库)importnumpyasnpA、6B、8C、10D、$12【正确答案】:D解析:

见算法解析101.在下列哪些应用中,我们可以使用深度学习来解决问题?A、蛋白质结构预测B、化学反应的预测C、外来粒子的检测D、所有这些【正确答案】:D102.机器学习的核心任务是在新的、未知的数据中执行得好。而这种在未知数据中执行的能力,称为A、泛化能力B、过拟合C、欠拟合D、正则化【正确答案】:A103.深度学习可以用在下列哪些NLP任务中A、情感分析B、问答系统C、机器翻译D、所有选项【正确答案】:D解析:

采用OCR技术识别摄像头拍摄的数字式电力仪表的读数104.为什么不能用多层全连接网络解决命名实体识别问题:A、序列数据的输入和输出通常是不固定的,有的序列长,有的序列短B、全连接网络的根本不能处理任何序列数据C、全连接网络的层次太深导致梯度消失,所以不能处理序列问题D、命名实体识别问题是一个无法解决的问题,全连接网络也不能解决这个问题【正确答案】:A解析:

循环神经网络之所以有作用是因为序列中的元素蕴含着顺序的规律105.卷积核与特征图的通道数的关系是:A、卷积核数量越多特征图通道数越少B、卷积核size越大特征图通道数越多C、卷积核数量越多特征图通道数越多D、二者没有关系【正确答案】:C解析:

一张RGB彩色图片不包含黄色通道。106.元宇宙本质上是对现实世界的虚拟化、数字化过程,它基于()生成现实世界的镜像。A、扩展现实技术B、区块链技术C、数字孪生技术D、云计算【正确答案】:C107.自然语言理解是人工智能的重要应用领域,下面列举中的(

)不是它要实现的目标。A、理解别人讲的话B、对自然语言表示的信息进行分析概括或编辑C、自动程序设计D、机器翻译【正确答案】:C解析:

自动识别如语音识别、图像识别,分别模仿人类的听觉和视觉,属于人类感官模拟。答案选D108.假定你已经搜集了10000行推特文本的数据,不过没有任何信息。现在你想要创建一个推特分类模型,好把每条推特分为三类:积极、消极、中性。以下哪个模型可以执行做到?()A、朴素贝叶斯B、支持向量机C、以上都不是D、nan【正确答案】:C109.sigmod激活函数在神经网络中可以将神经元计算数值变化到以下哪个范围内?A、(-1,0)B、(0,1)C、(-1,1)D、(-0.5,0.5)【正确答案】:B110.人工智能平台架构及技术要求第1部分总体架构与技术要求编制的主要目的是指导公司人工智能平台(),明确人工智能平台总体架构与技术要求。A、设计B、运行C、规划D、建设【正确答案】:D解析:

主要应用111.以下关于机器学习描述正确的是?A、深度学习是机器学习的一个分支B、深度学习与机器学习是互相包含的关系C、深度学习与机器学习同属于人工智能但相互之间没有关系D、以上都不对【正确答案】:A112.近年来,随着人工智能技术的快速发展和演变,()在多种控制领域表现优异,这类控制问题可以归结为马尔可夫决策过程,其典型成功应用案例有AlphaGo、自动驾驶狗等,这些成功案例为有效解决电网规划和调控难题提供了借鉴。A、深度强化学习技术B、多智能体技术C、深度Q-Learning技术D、深度学习技术【正确答案】:A113.模型有效的基本条件是能够()已知的样本A、结合B、拟合C、联合D、聚集【正确答案】:B解析:

批量归一化对隐含层的输入进行归一化,更好的尺度不变性(应对内部协变量偏移),更好的优化地形(输入处于不饱和区域,从而让梯度变大)114.反向传播算法一开始计算什么内容的梯度,之后将其反向传播?A、预测结果与样本标签之间的误差B、各个输入样本的平方差之和C、各个网络权重的平方差之和D、都不对【正确答案】:A115.DSSM经典模型的缺点:1.Wordhashing可能造成词语冲突;2.采用词袋模型,损失了上下文语序信息;3.搜索引擎的排序由多种因素决定,用户点击时doc排名越靠前越容易被点击,仅用点击来判断正负样本,产生的噪声较大,模型难以收敛;4.效果不可控。A、1.2.3B、1.3.4C、2.3.4D、【正确答案】:D解析:

DSSM模型总的来说可以分成哪几层结构,分别是输入层、表示层和匹配层。116.在CNN训练中,除了卷积偏置bias需要学习更新以外,()也是学习跟新的重要内容A、learning_rateB、stepC、weightD、padding【正确答案】:C解析:

Softmax不是常用的聚类算法。117.()通过将文档看成其中单词的袋装形式,被用于在NLP和文本挖掘中生成文本表征A、词袋模型B、one-hot编码C、独热编码D、languagemodel【正确答案】:A解析:

主要应用118.交叉验证法将数据集划分为k个大小相似的互斥子集,进行(___)次训练和测试。A、k+1B、kC、k-1D、k-2【正确答案】:B解析:

见算法解析119.1x1卷积的主要作用是A、加快卷积运算B、增大卷积核C、扩大感受野D、通道降维【正确答案】:D解析:

xgboost在代价函数里加入了正则项,用于控制模型的复杂度120.衡量模型预测值和真实值差距的评价函数被称为()A、损失函数B、无参数函数C、激活函数D、矩阵拼接函数【正确答案】:A解析:

DSSM经典模型的优点;1.解决了字典爆炸问题,降低了计算复杂度;2.中文方面使用字作为最细切分粒度,可以复用每个字表达的词义,减少分词的依赖,从而提高模型的泛化能力;3.字母的n-gram可以更好的处理新词,具有较强的鲁棒性;4.使用有监督的方法,优化语义embedding的映射问题;5.省去了人工特征工程;6.采用有监督训练,精度较高。121.强化学习的目标是找到()的策略A、最小损失函数B、最大化收益C、局部最优解D、全局最优解【正确答案】:B解析:

见算法解析122.下列属于特征降维的方法有A、主成分分析PCAB、数据采样C、正则化D、最小二乘法【正确答案】:A123.在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。A、大B、小C、大D、大E、小F、小【正确答案】:A124.词向量是表示自然语言里单词的一种方法,即把每个词都表示为一个N维空间内的()。A、线段B、平面C、点D、线【正确答案】:C解析:

见算法解析125.在前馈神经网络中,误差后向传播(BP算法)将误差从输出端向输入端进行传输的过程中,算法会调整前馈神经网络的什么参数A、输入数据大小B、神经元和神经元之间连接有无C、相邻层神经元和神经元之间的连接权重D、同一层神经元之间的连接权重【正确答案】:C126.自然语言处理机制涉及两个流程,其中,()是指能以自然语言文本来表达给定的意图。A、自然语言理解B、自然语言处理C、自然语言输入D、自然语言生成【正确答案】:D127.在处理序列数据时,较容易出现梯度消失现象的深度学习模型是()A、CNNB、LSTMC、GRUD、RNN【正确答案】:D解析:

数据预处理的主要步骤分为:数据清理、数据集成、数据规约和数据变换。128.人工智能的目的是让机器能够(),以实现某些脑力劳动的机械化A、模拟、延伸和扩展人的智能B、和人一样工作C、完全代替人的大脑D、彻底的替代人类【正确答案】:A129.为了增强网络的表达能力,我们需要()来将线性函数转换为非线性函数。A、损失函数B、指数函数C、三角函数D、激活函数【正确答案】:D解析:

见算法解析130.前馈型神经网络的中各个层之间是()的,反馈型神经网络中各个层之间是()的。A、有环B、有环C、有环D、无环E、无环F、有环【正确答案】:C131.在多通道卷积过程中,要生成n个featuremaps,需要()个卷积核立方体。A、n-2B、n^2C、[n/2]注[x]表示对x取整D、n【正确答案】:D解析:

见算法解析132.产生式系统的推理不包括()A、正向推理B、逆向推理C、双向推理D、简单推理【正确答案】:D133.下面有关分类算法的准确率,召回率,F1值的描述,错误的是?()A、准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率B、召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率C、正确率、召回率和F值取值都在0和1之间,数值越接近0,查准率或查全率就越高D、为了解决准确率和召回率冲突问题,引入了F1值【正确答案】:C解析:

见算法解析134.在人脸检测中,不属于该算法难点的是A、出现人脸遮挡B、人脸角度变化大C、需要检测分辨率很小的人脸D、需要检测不同性别的人脸【正确答案】:D135.代码arr1=np.array([[1,2,3],[4,5,6]]);print((arr1**2)[1,1])的输出是()?A、5B、25C、6D、$26【正确答案】:B解析:

见算法解析136.人工智能平台应提供模型推送功能,可通过云边协同套件推送至()设备。A、中间B、核心C、边侧D、侧边【正确答案】:C解析:

主要应用137.中国《中共中央关于制定国民经济和社会发展第十四个五年规划和2035远景目标纲要的建议》指出,要瞄准人工智能等前沿领域,实施一批具有前瞻性、战略性重大科技项目,推动()健康发展。A、人工智能产业B、数字经济C、实业经济D、社会主义【正确答案】:B解析:

习近平总书记多次作出重要指示,强调“要深入把握新一代人工智能发展的特点,加强人工智能和产业发展融合,为高质量发展提供新动能”。138.随着句子的长度越来越多,神经翻译机器将句意表征为固定维度向量的过程将愈加困难,为了解决这类问题,下面哪项是我们可以采用的?A、使用递归单元代替循环单元B、使用注意力机制(attentionmechanism)C、使用字符级别翻译(characterleveltranslation)D、所有选项均不对【正确答案】:B139.在深度学习网络中,反向传播算法用于寻求最优参数,在反向传播算法中使用的什么法则进行逐层求导的?A、链式法则B、累加法则C、对等法则D、归一法则【正确答案】:A140.后剪枝是先从训练集生成一颗完整的决策树,然后(___)对非叶结点进行考察。A、自上而下B、在划分前C、禁止分支展开D、自底向上【正确答案】:D解析:

见算法解析141.我们可以利用以下哪种方法实现反向传播?A、计算图B、链式法则C、代价函数D、高阶微分【正确答案】:B142.强化学习在每个时刻环境和个体都会产生相应的交互。个体可以采取一定的(),这样的行动是施加在环境中的。A、actionB、rewardC、stateD、agent【正确答案】:A解析:

见算法解析143.下列哪项不属于集成学习A、随机森林B、AdaboostC、kNND、XGBoost【正确答案】:C解析:

最广泛被使用的分类器有人工神经网络、支持向量机、最近邻居法、GuassianMixtureModel、Gaussian、NaiveBayes、决策树和RBFclassifiers。144.我国人工智能三步走战略,其中第一步,()人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点A、到2035年B、到2030年C、到2025年D、到2020年【正确答案】:D解析:

1997年5月,著名的“人机大战”,最终深蓝计算机以3.5比2.5的总比分将世界国际象棋棋王卡斯帕罗夫击败145.机器学习中,模型需要输入什么来训练自身,预测未知?A、人工程序B、神经网络C、训练算法D、历史数据【正确答案】:D146.以下两种描述分别对应哪两种对分类算法的评价标准?(1)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。A、精确率B、召回率C、ROCD、AUC【正确答案】:A147.中国国务院印发了《新一代人工智能发展规划》,阐述了我国人工智能发展规划,并提出到()年的三步走发展战略目标。A、2025B、2030C、2035D、$2,040【正确答案】:B解析:

从未来看,人们对人工智能的定位绝不仅仅只是用来解决狭窄的、特定领域的某个简单具体的小任务,而是真正像人类一样,能同时解决不同领域、不同类型的问题,进行判断和决策,也就是所谓的通用型人工智能。148.()技术助力人工智能数据安全可信地进行协作。A、量子计算B、隐私计算C、数字孪生D、数据加密【正确答案】:B解析:

人工智能系统稳定性技术重点逐步从数字域扩展到物理域。149.关于专用人工智能与通用人工智能,下列表述不当地是(

)。A、人工智能的近期进展主要集中在专用智能领域B、专用人工智能形成了人工智能领域地单点突破,在局部智能水平地单项测试中可以超越人类智能C、通用人工智能可处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题D、真正意义上完备的人工智能系统应该是一个专用的智能系统【正确答案】:D解析:

生物特征识别技术,是指通过计算机利用人体所固有的生理特征(指纹、虹膜、面相、DNA等)或行为特征(步态、击键习惯等)来进行个人身份鉴定的技术。指纹识别、人脸识别、虹膜识别运用的都是生物特征,体感交互是指人们可以很直接地使用肢体动作,与周边的装置或环境互动,而无需使用任何复杂的控制设备,便可让人们身历其境地与内容做互动,不属于生物特征识别技术。150.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科是A、专家系统B、机器学习C、神经网络D、模式识别【正确答案】:B151.Scikit-Learn中()可以实现计算模型准确率。A、accuracy_scoreB、accuracyC、f1_scoreD、f2_score【正确答案】:A解析:

DBSCAN算法将“簇”定义为:由密度可达关系导出的最大的密度相连样本集合。152.现在有某个软件需要在特定场景下的门禁系统进行识别照片来判断照片中人物的男女性别,目前通过各种渠道和方法采集了10w张人脸图片。那么()是更为合理的A、采集的照片训练集用7w张,测试集3w张B、全都用来训识别模型最好C、采集的照片训练集用7w张,验证集1w张,测试集2w张D、不需要训练啊,收集这么多数据是多余和浪费的【正确答案】:C153.关于线性回归的描述,以下说法正确的有()A、基本假设包括随机干扰项是均值为0,方差为1的标准正态分布B、基本假设包括随机干扰项是均值为0的同方差正态分布C、多重共线性会使得参数估计值方差减小D、基本假设包括不服从正态分布的随机干扰项【正确答案】:B解析:

在人脸检测算法中,不属于该算法难点的是需要检测不同性别的人脸154.模型库功能要求为:模型管理包括模型()、模型删除、版本管理、模型标签、模型收藏和模型共享。A、评估B、导出C、输出D、导入【正确答案】:D解析:

主要应用155.卷积神经网络做图像分类任务通常不包含:A、卷积操作B、池化操作C、全连接层D、均方误差损失函数【正确答案】:D解析:

深度学习系统中,参数数量非常庞大不会必然导致运算精度必然高156.预测分析方法分为两大类,分别是定性分析法和()。A、回归分析法B、指数平滑法C、定量分析法D、平均法【正确答案】:C解析:

主要应用157.模型库功能要求为:模型测试包括模型部署、()测试和服务管理,模型测试服务发布应支持向导模式,宜支持一键自动发布测试服务,模型测试服务宜支持单卡内存级分配。A、在线&B、&离线&C、&自动&D、&手动【正确答案】:A解析:

主要应用158.人工智能的研发和应用的政策,应该将()置于核心位置。A、道德B、人C、资本D、隐私【正确答案】:B解析:

在技术层面,人工智能正在从云计算向边缘计算延伸,未来将形成云计算与边缘计算协同发展的态势,为人工智能提供更强大的基础设施。159.()年是元宇宙元年,互联网迭代升级的大幕就此拉开。A、2018B、2019C、2020D、$2,021【正确答案】:D160.DilatedConvolution意思是?A、空洞卷积B、黑洞卷积C、细节卷积D、返向卷积【正确答案】:A解析:

见算法解析161.当在卷积神经网络中加入池化层(poolinglayer)时,变换的不变性会被保留,是吗?A、不知道B、看情况C、是D、否【正确答案】:C解析:

首先我们应该知道卷积或者池化后大小的计算公式,其中,padding指的是向外扩展的边缘大小,而stride则是步长,即每次移动的长度。

这样一来就容易多了,首先长宽一般大,所以我们只需要计算一个维度即可,这样,经过第一次卷积后的大小为:本题(200-5+2*1)/2+1为99.5,取99

经过第一次池化后的大小为:(99-3)/1+1为97

经过第二次卷积后的大小为:(97-3+2*1)/1+1为97162.下面不是超参数的是:A、权重和偏置B、学习率C、mini-batch的大小D、网络结构【正确答案】:A解析:

深度学习系统训练过程通常需要输入特征值和标签163.线性降维方法假设从高维空间到低维空间的函数映射是()。A、一元B、线性C、多元D、非线性【正确答案】:B解析:

概率图模型分为两类,一类是使用有向无环图表示依赖关系,称为有向图模型或贝叶斯网络,例如隐马尔可夫模型;另一类是使用无向图表示变量间的相关关系,称为无向图模型或是马尔可夫网,例如马尔可夫随机场164.如果问题存在最优解,则下面几种搜索算法中,()可以认为在这几种算法中是“智能程度相对比较高”的算法。A、广度优先搜索B、深度优先搜索C、有界深度优先搜索D、启发式搜索【正确答案】:D165.关于MNIST,下列说法错误的是()。A、是著名的手写体数字识别数据集B、有训练集和测试集两部分C、训练集类似人学习中使用的各种考试试卷D、测试集大约包含10000个样本和标签【正确答案】:C166.以下两种描述分别对应哪两种对分类算法的评价标准?

(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。

(b)描述有多少比例的小偷给警察抓了的标准。A、Precision,RecallB、Recall,PrecisionC、Precision,ROCD、Recall,ROC【正确答案】:A解析:

关联规则就是有关联的规则,形式是这样定义的:两个不相交的非空集合X、Y,如果有X→Y,就说X→Y是一条关联规则。在题目的例子中,我们发现购买啤酒就一定会购买尿布,{啤酒}→{尿布}就是一条关联规则。167.前馈神经网络是一种简单的神经网络,各神经元分层排列,是目前应用最广泛,发展最迅速的人工神经网络之一。以下关于前馈神经网络说法正确的是:A、具备计算能力的神经元与上下两层相连B、其输入节点具备计算能力C、同一层神经元相互连接D、层间信息只沿个方向传递【正确答案】:D168.下列哪项网络不属于常用的深度神经网络:()A、HopField网络B、AlexNetC、ResNetD、VGG【正确答案】:A169.在语音识别中,按照从微观到宏观的顺序排列正确的是()。A、帧-状态-音素-单词B、帧-音素-状态-单词C、音素-帧-状态-单词D、帧-音素-单词-状态【正确答案】:A170.人工智能产业链主要包括:基础技术支撑,(),人工智能应用。A、智能平台建设B、大数据C、互联网D、人工智能技术【正确答案】:D解析:

ResNet网络是参考了VGG19网络,在其基础上进行了修改,并通过短路机制加入了残差单元171.下面是一段将图像转换为向量的函数img2vector。该函数创建1×1024的NumPy数组,然后打开给定的文件,循环读出文件的前32行,并将每行的头32个字符值存储在NumPy数组中,最后返回数组。请问填充在空白处的代码应该是哪个。defimg2vector(filename):returnVect=zeros((1,1024))fr=open(filename)foriinrange(32):______________________________forjinrange(32):returnVect[0,32*i+j]=int(lineStr[j])returnreturnVectA、lineStr=fr.readlines()B、lineStr=fr.read_line()C、lineStr=readline()D、lineStr=fr.readline()【正确答案】:D解析:

机器学习算法的一般流程

(1)收集数据:可以使用任何方法。

(2)准备数据:距离计算所需要的数值,最好是结构化的数据格式。

(3)分析数据:可以使用任何方法。

(4)训练算法:此步骤不适用于k-近邻算法。

(5)测试算法:计算错误率。

(6)使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k-近邻算法判定输

入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理。172.半监督学习不包括A、直推学习B、纯半监督学习C、主动学习D、图半监督学习【正确答案】:C解析:

见算法解析173.卷积神经网络(convolu-tionalneuralnetwork,CNN),是一种专门用来处理具有类似()的数据的神经网络。A、网格结构B、数组结构C、序列结构D、表格结构【正确答案】:A解析:

Transformer中抛弃了传统的CNN和RNN,整个网络结构完全是由Attention机制组成。174.代码array=np.arange(10,31,5)中的5代表()?A、元素的个数B、步长C、第一个元素D、最后一个元素【正确答案】:B解析:

见算法解析175.下列哪一项不是常见的机器学习模型正则化方法。A、数据优化B、数据增强C、模型集成D、引入参数范数惩罚项【正确答案】:A解析:

不定长输入数据特征为RNN循环神经网络特征176.在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力A、贪心策略B、蒙特卡洛采样C、动态规划D、Bellman方程【正确答案】:A177.LSTM用于文本分类的任务中,不会出现的网络层是A、全连接B、词嵌入层C、卷积层D、以上选项均不正确【正确答案】:C178.人工智能平台应提供主要网络设备、通信线路和()系统的硬件冗余,保证高可用性,在无不可抗力环境下应满足7×24小时服务不中断。A、数据库B、主机C、电源D、集群【正确答案】:D解析:

主要应用179.在强化学习过程中,()表示随机地采取某个动作,以便于尝试各种结果;()表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值。A、探索B、开发C、开发D、探索E、探索F、输出【正确答案】:A180.ID3在分类过程中使用的()A、条件熵B、基尼指数GiniC、信息增益D、联合熵【正确答案】:C解析:

CART树在分类过程中使用的基尼指数Gini181.下列哪个模型属于监督学习的方法A、K-meansB、SVRC、DBSCAND、以上都是【正确答案】:B解析:

在pytorch中,model.eval在模型验证、模型测试阶段都可以使用182.在大规模的语料中,挖掘词的相关性是一个重要的问题。以下哪一个信息不能用于确定两个词的相关性。()A、互信息B、最大熵C、卡方检验D、最大似然比【正确答案】:B183.从给定的特征集合中选择出相关特征子集的过程,称为(___)A、特征抽取B、特征选择C、特征降维D、特征简化【正确答案】:B解析:

见算法解析184.随着集成中个体分类器(相互独立)数目T的增大,集成的错误率将呈(___)_下降,最终趋向于零A、指数级B、对数级C、线性级D、平方级【正确答案】:A解析:

见算法解析185.全局梯度下降算法、随机梯度下降算法和批量梯度下降算法均属于梯度下降算法,以下关于其有优缺点说法错误的是:A、全局梯度算法可以找到损失函数的最小值B、批量梯度算法可以解决局部最小值问题C、随机梯度算法可以找到损失函数的最小值D、全局梯度算法收敛过程比较耗时【正确答案】:C186.正则化是为了什么?()A、最小化错误率B、正规化C、防止过拟合D、最大化过拟合【正确答案】:C解析:

在其他条件不变的前提下,以下做法容易引起机器学习中的“过拟合”问题的是SVM算法中使用高斯核/RBF核代替线性核。187.以下哪个不是语音识别技术的应用场景()A、入侵检测B、语音合成C、语音翻译D、智能客服【正确答案】:A188.考虑某个具体问题时,你可能只有少量数据来解决这个问题。不过幸运的是你有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络?A、把除了最后一层外所有的层都冻结,重新训练最后一层B、对新数据重新训练整个模型C、只对最后几层进行调参(finetune)D、对每一层模型进行评估,选择其中的少数来用【正确答案】:C189.如果问题存在最优解,则下面几种搜索算法中,()必然可以得到该最优解。A、广度优先搜索B、深度优先搜索C、有界深度优先搜索D、启发式搜索【正确答案】:A解析:

在监督学习中,预测变量离散,称为分类,预测变量连续,称为回归,两者本质一样,都是对输入做预测,不过分类输出的是物体所属的类别,回归输出的是物体的值。答案选D190.在主成分分析中,将几个主分量经过线性组合构造为一个综合评价函数时,每个主分量的权数为()。A、每个主分量的方差B、每个主分量的标准差C、每个主分量的方差贡献率D、每个主分量的贡献率【正确答案】:C解析:

在进行主成分分析时,应使第一主成分在总方差中所占的比重最大。191.归结原理的特点是(___)A、发明新的概念和关系B、发现更多的规则C、缓解过拟合的风险D、将复杂的逻辑规则与背景知识联系起来化繁为简【正确答案】:D解析:

见算法解析192.用户有一种感兴趣的模式并且希望在数据集中找到相似的模式,属于数据挖掘哪一类任务?A、根据内容检索B、建模描述C、预测建模D、寻找模式和规则【正确答案】:A解析:

聚类是无监督学习方法的一种,可以用来处理无标签的数据集。193.LSTM单元中引入了哪些门来更新当前时刻的单元状态向量?A、输入门、遗忘门B、任意门、输入门C、输出门、任意门D、遗忘门、任意门【正确答案】:A解析:

LSTM是一种循环神经网络194.对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,而是都设成0,下面哪个叙述是正确的?A、其他选项都不对B、没啥问题,神经网络会正常开始训练C、神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西D、神经网络不会开始训练,因为没有梯度改变【正确答案】:C195.从全称判断推导出特称判断或单称判断的过程,即由一般性知识推出适合于某一具体情况的结论的推理是A、默认推理B、归结推理C、演绎推理D、单调推理【正确答案】:C解析:

搜索分为盲从搜索与启发式搜索196.自然语言处理机制涉及两个流程,分别是()。A、自然语言理解和自然语言转化B、自然语言理解和自然语言生成C、自然语言理解和自然语言翻译D、自然语言生成和自然语言翻译【正确答案】:B解析:

NLP问题经历了从基于规则到基于统计的过程,语法规则,词性,构词法等,这些都是基于规则的自然语言处理过程,其忽略了上下文相关性,从而使建立在数学模型上的基于统计的自然语言方法成为主流。197.Adaboost就是从()出发反复训练,在其中不断调整数据权重或者是概率分布。A、弱分类器B、强分类器C、多个分类器D、单个分类器【正确答案】:A解析:

Boosting的本质实际上是一个加法模型,通过改变训练样本权重学习多个分类器并进行一些线性组合198.以下对于标称属性说法不正确的是A、标称属性的值是一些符号或事物的名称,每种值代表某种类别、编码或状态。B、标称值并不具有有意义的顺序,且不是定量的C、对于给定对象集,找出这些属性的均值、中值没有意义。D、标称属性通过将数值量的值域划分有限个有序类别,把数值属性离散化得来。【正确答案】:D199.最早的自然语言理解方面的研究工作是()A、语音识别B、机器翻译C、语音合成D、语言分析【正确答案】:B200.下列关于LARS算法的说法正确的是(___)A、每次选择一个与残差相关性最大的特征B、是一种包裹式特征选择法C、基于线性回归平绝对误差最小化D、是通过对LASSO稍加修改而实现【正确答案】:A解析:

见算法解析201.ROIAlign在哪个模型被采用()A、fastRCNNB、fasterRCNNC、maskRCNND、YOLOv3【正确答案】:C解析:

fasterRCNN用于生成候选框proposal的模块是RPN202.以下哪些算法是分类算法()A、DBSCANB、C4.5

C.K-MeanD、EM【正确答案】:B203.下面哪种不属于数据预处理的方法?A、变量代换B、离散化C、聚集D、估计遗漏值【正确答案】:D解析:

特征选择的方法主要有三种方法:1、Filter(过滤)方法;2、Wrapper(包装)方法;3、Embedded(嵌入)方法204.C4.5决策树算法中采用()对连续属性进行离散化处理。A、二分法B、最小二乘法C、均值法D、投票法【正确答案】:A解析:

见算法解析205.DSSM经典模型的优点;1.解决了字典爆炸问题,降低了计算复杂度;2.中文方面使用字作为最细切分粒度,可以复用每个字表达的词义,减少分词的依赖,从而提高模型的泛化能力;3.字母的n-gram可以更好的处理新词,具有较强的鲁棒性;4.使用有监督的方法,优化语义embedding的映射问题;5.省去了人工特征工程;6.采用有监督训练,精度较高。A、B、C、.5.6D、3.4.6【正确答案】:C解析:

LSTM是一个非常经典的面向序列的模型,可以对自然语言句子或是其他时序信号进行建模,是一种循环神经网络。206.(

)是自然语言处理的重要应用,也可以说是最基础的应用。A、文本识别B、机器翻译C、文本分类D、问答系统【正确答案】:C解析:

专用人工智能,是指只对某一方面有自动化专业能力;通用人工智能,是指具有像人一样的思维水平以及心理结构的全面性智能化。所以真正意义上完备的人工智能系统应该是一个通用的智能系统,D选项错误,答案选D.207.当前人工智能算力持续突破,面向训练用和推断用的芯片仍在快速推进,基于()的训练芯片持续增多。A、CPUB、GPUC、FPGAD、5G通讯【正确答案】:B208.循环神经网络的英语简写是:A、CNNB、RNNC、DNND、CTC【正确答案】:B解析:

语言模型的作用是查看一句话成为一句“人话”的概率209.类脑计算系统从“()”向“()”逐步演进A、专业、通用B、静态、动态C、单一、多样D、简单、复杂【正确答案】:A解析:

机器学习在向分布式隐私保护方向演进。210.下列属于基于统计的自然语言处理进路的是()。A、基于中间语的翻译B、基于深层语法的翻译C、基于浅层语法的翻译D、基于贝叶斯公式【正确答案】:D211.独热编码的英文是:A、onehotB、twohotC、onecoldD、twocold【正确答案】:A解析:

通常池化操作的效果是使图片变小212.信息熵是度量样本集合(___)最常用的一种指标。A、精确度B、准确率C、召回率D、纯度【正确答案】:D解析:

见算法解析213.EM算法通过迭代求L(theta)=logP(Y|theta)的(),每次迭代交替进行求期望和求极大化。A、无偏估计B、极大似然估计C、区间估计D、有偏估计【正确答案】:B解析:

在分类学习中,提升方法通过反复修改训练数据的权值分布,构建一系列基本分类器并将它们线性组合,形成一个强分类器。214.不属于语音声学特征的是?A、频率B、语义C、时长D、振幅【正确答案】:B215.ROIPooling存在几次取整过程?A、1B、2C、3D、nan【正确答案】:B解析:

见算法解析216.下列关于知识图谱应⽤的说法不正确的是()。A、知识问答的实现分为两步:提问分析和答案推理B、传统的基于关键词搜索的信息搜索方法,往往无法理解用户的意图,用户需自己斟选C、问答系统让计算机自动回答用户的提问,返回相关的一系列文档D、Siri、Cortana、小度都是以问答系统为核心技术的产品和服务【正确答案】:C217.下列选项中,属于图像识别技术应用的是()A、人脸识别支付B、编写word文档C、制作多媒体D、制作ppt【正确答案】:A218.国网95598客户服务从人工模式逐渐转变为(),解放重复机械化的人力劳动,进一步改善客户服务体验。A、人工智能模式B、智能化模式C、智慧模式D、机器模式【正确答案】:B解析:

近年来基于GAN的“DeepFakes”(深度伪造)技术应用,使得“换脸”虚假视频的制作门槛不断降低,大量深度伪造数据内容开始涌现。219.2021年1月,Google推出的SwitchTransformer模型以高达1.6()的参数量打破了GPT-3作为最大AI模型的统治地位,成为史上首个()级语言模型。A、十亿B、百亿C、千亿D、万亿【正确答案】:D220.在图搜索中,选择最有希望的节点作为下一个要扩展的节点,这种搜索方法叫做()A、宽度搜索B、深度搜索C、有序搜索D、广义搜索【正确答案】:C221.根据numpy数组中ndim属性的含义确定程序的输出()。array=np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]]);print(array.ndim)A、(3,4)B、2C、(4,3)D、$4【正确答案】:B解析:

见算法解析222.人工智能的快速发展推动数据规模不断提升。据IDC测算,2025年全球数据规模将达到163(),其中80%-90%是非结构化数据。A、PBB、EBC、ZBD、YB【正确答案】:C223.代码arr3=np.array([[1,2,3],[4,5,6]]).transpose();print(arr3[1,1])的输出结果是()?A、5B、4C、3D、$2【正确答案】:A解析:

见算法解析224.一个特征的权重越高,说明该特征比其他特征()。A、更重要B、不重要C、有影响D、无法判断【正确答案】:A解析:

全连接层常做为CNN网络的最后一层。225.在CNN构建中,指定每次训练或验证数据集图片多少的变量为()。A、reluB、batchC、stepD、padding【正确答案】:B解析:

在CNN中,梯度下降法的作用是求函数最小值。226.国际组织、行业协会提出应将监管之手扩展到人工智能方面,手段不包括()。A、加大资本投资B、加强安全方面管控C、构建人工智能标准和规则D、鼓励公众参与人工智能治理【正确答案】:A227.在模型中全连接层可采用A、paddle.nn.LinearB、paddle.nn.Conv2DC、paddle.nn.MaxPool2DD、paddle.nn.ReLU【正确答案】:A解析:

不同训练数据集的神经网络结构的最优层数不同,并非层数越深效果越好,训练时间除了与层数有关以外,batchsize大小、学习率、衰减方式等都有很大影响,神经元的数量并不一定与层数正相关228.“文档”是待处理的数据对象,它由一组词组成,这些词在文档中不计顺序的额,例如一篇论文、一个网页都可以看做一个文档;这样的表示方式称为(___)?A、语句B、词袋C、词海D、词塘【正确答案】:B解析:

见算法解析229.深度学习可以用在下列哪些NLP任务中?A、情感分析B、问答系统C、机器翻译D、所有选项【正确答案】:D230.关于wordembedding下列叙述正确的是①.向量维数较低②.向量之间有更强的相关关系③.向量不再是稀疏的④.向量中的值更容易计算A、①③④B、①②③C、①③④D、①②④【正确答案】:B解析:

独热编码的缺点是:①.过于稀疏②.词与词的相关性比较小231.早期图像识别技术中存在的主要问题是()。A、全局特征丢掉了图像细节B、提取不到主要特征C、存储效率低下D、太多的错误匹配【正确答案】:A解析:

在CNN构建中,指定每次训练或验证数据集图片多少的变量为batch。232.第一个击败人类职业围棋选手、第一个战胜世界围棋冠军的人工智能机器人是由谷歌公司开发的()。AlphaGoB、AlphaGoodC、AlphaFunD、Alpha【正确答案】:A233.说话人确认(SpeakerVerification),是用以确认某段语音是否是指定的某个人所说的,是“____”问题A、多选一B、一对一C、多对多【正确答案】:B解析:

说话人辨认(SpeakerIdentification),是用以判断某段语音是若干人中的哪一个所说的技术,是“多选一”问题234.人工智能在图像识别上已经超越了人类,支持这些图像识别技术的,通常是A、云计算B、因特网C、神经计算D、深度神经网络【正确答案】:D235.要想让机器具有智能,必须让机器具有知识因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论