人工智能自然语言技术练习(习题卷2)_第1页
人工智能自然语言技术练习(习题卷2)_第2页
人工智能自然语言技术练习(习题卷2)_第3页
人工智能自然语言技术练习(习题卷2)_第4页
人工智能自然语言技术练习(习题卷2)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷2)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.信息增益和信息增益比相比有什么不同A)它们的计算方法完全相同B)信息增益总是偏向于选择取值较多的属性。信息增益比在此基础上增加了一个罚项C)信息增益可以处理连续型的数据D)信息增益比可以处理连续型的数据答案:B解析:[单选题]2.以下四个描述中,哪个选项正确的描述了XGBoost的基本核心思想A)训练出来一个一次函数图像去描述数据B)训练出来一个二次函数图像去描述数据C)不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(x),去拟合上次预测的残差。D)不确定答案:C解析:[单选题]3.深入挖掘BERT,其输出的向量有几个A)1B)2C)3D)4答案:C解析:[单选题]4.以下四个任务当中LDA可以很好的完成哪个任务?A)对图像进行文本B)对图像进行特征提取C)对文档的主题进行分类或聚类D)以上都正确答案:C解析:[单选题]5.反向传播指的是哪个变量的传递?A)训练轮次B)批处理数C)误差D)网络层数答案:C解析:[单选题]6.决策树算法最终A)拟合出一个含有参数的函数B)构造出一个含有参数的网络C)生成一个有分支的决策树D)生成一个有向图答案:C解析:[单选题]7.自然语言处理是用()技术的一种应用。A)语音识别B)虚拟现实C)人工智能D)文字识别答案:C解析:[单选题]8.奇异值分解的缺点。A)A:转换后的数据比较难理解。B)B:简化数据C)C:降低模型计算性能D)D:压缩维度答案:A解析:[单选题]9.tanh激活函数相比sigmoid是有优势的,体现在哪些方面A)解决了sigmoid输出为非0中心的问题B)tanh不易饱和C)tanh解决了sigmoid的指数运算D)tanh不会造成梯度消失答案:A解析:[单选题]10.国际码用()位()进制数表示一个汉字。A)1,8B)2,8C)1,16D)2,16答案:D解析:[单选题]11.隐马尔科夫是几元祖模型A)2B)3C)4D)5答案:D解析:[单选题]12.知识图谱用到了哪个领域的技术A)计算机视觉B)数据挖掘C)自然语言处理D)机器学习答案:C解析:[单选题]13.可以实现关键词归一化的技术是__?A)词形还原(Lemmatization)B)探测法(Soundex)C)余弦相似度(CosineSimilarity)D)N-grams答案:A解析:词形还原有助于得到一个词的基本形式,例如:playing->play,eating->eat等;其他选项的技术都有其他使用目的。[单选题]14.使用马尔科夫链的算法有:A)HMMB)SVMC)CRFD)MEMM答案:A解析:[单选题]15.概率图模型关于隐马尔可夫模型的解码算法,是用那个算法?A)前向算法B)后向算法C)Viterbi算法D)Baum-Welch算法答案:C解析:[单选题]16.人工智能近几年大火,它最早是在什么时候出现的?A)20世纪50年代B)20世纪60年代C)20世纪70年代D)20世纪80年代答案:A解析:[单选题]17.下列哪项是无监督学习的方法?()A)标签法B)分类C)聚类D)判别答案:C解析:[单选题]18.在以下四个选项中哪些属于神经网络中的参数A)学习率B)权重C)迭代次数D)隐藏层的大小答案:B解析:[单选题]19.下列关于LSTM说法不正确的是()。A)通过改进使RNN具备避免梯度消失的特性B)LSTM只能够刻画出输入数据中的短距离的相关信息,不能够捕捉到具有较长时间间隔的依赖关系C)LSTM神经网络模型使用门结构实现了对序列数据中的遗忘与记忆D)使用大量的文本序列数据对LSTM模型训练后,可以捕捉到文本间的依赖关系,训练好的模型就可以根据指定的文本生成后序的内容答案:B解析:[单选题]20.以下几个选项中,哪个可以表示超平面A)Wt*x+b=0B)w*log(x)=0C)w*ln(x)=0D)wx²=0答案:A解析:[单选题]21.NLP中常用的激活函数Tanh,它的输出的值域范围是多少?A)+1和-1B)+0和-1C)+1和0D)+2和-2答案:A解析:[单选题]22.不属于基于规则的分词方法的是()。A)正向最大匹配法B)逆向最大匹配法C)反向最大匹配法D)双向最大匹配法答案:C解析:[单选题]23.LSTM可以通过()来进行长短期记忆A)RNN控制B)前馈控制C)BP控制D)门控制答案:D解析:[单选题]24.不确定推理过程的不确定性不包括()A)证据的不确定性B)规则的不确定性C)推理过程的不确定性D)知识表示方法的不确定性答案:D解析:[单选题]25.在k-NN中,增加/减少k值会发生什么?A)K值越大,边界越光滑B)随着K值的减小,边界变得更平滑C)边界的光滑性与K值无关D)这些都不是答案:A解析:[单选题]26.以下四个选项中描述的是PCA缺点的是哪个?A)仅仅需要以方差衡量信息量,不受数据集以外的因素影响B)各主成分之间正交,可消除原始数据成分间的相互影响的因素。C)主成分各个特征维度的含义具有一定的模糊性,不如原始样本特征的解释性强。D)计算方法简单,主要运算是特征值分解,易于实现。答案:C解析:[单选题]27.tf.conv2d(a,b,c,d)函数的四个参数,哪个参数表示输入数据?A)bB)aC)cD)d答案:B解析:[单选题]28.下边哪些模型不能将文本向量化A)word2vecB)bertC)ELMOD)DSSM答案:D解析:[单选题]29.数据可视化可以导入下面那个包?A)A:sklearn.linear_modelB)B:sklearn.model_selectionC)C:matplotlib.pylabD)D:sklearn.metrics答案:D解析:[单选题]30.如果只需要将数据集分为2类,需要训练多少次A)1B)2C)3D)4答案:A解析:[单选题]31.dropout作为神经网络建模中常用的函数,它有什么用A)没有激活函数功能B)一种图像特征处理算法C)一种语音处理算法D)一种正则化方式答案:D解析:[单选题]32.对图像特征经过做几个卷积操作后,特征信号会有什么变化:A)减弱B)不变C)增强D)都有可能答案:D解析:[单选题]33.决策树分类器可以对文本数据分类。关于文本分类算法,下列说法错误的是()A)文本预处理包括文本分词和去停用词等步骤B)数据集可以是公开数据集,也可以是通过网络爬虫爬取的文本数据C)不需要进行特征工程D)对数值化后的文本数据,可采用如SVM、RF等进行分类答案:C解析:[单选题]34.贝叶斯分类模型属于()A)生成式模型B)判别式模型C)不确定D)以上都正确答案:A解析:[单选题]35.哪个激活函数修正了Relu激活函数的缺点A)tanhB)leaky-ReluC)softmaxD)sigmoid答案:B解析:[单选题]36.tf.matmul()方法的作用是什么A)相与B)乘积C)相除D)相加答案:B解析:[单选题]37.以下哪个是两个数据点A(1,3)和B(2,3)之间的欧几里得距离?A)1B)2C)4D)8答案:A解析:[单选题]38.下面哪个方式不能对NER调优A)加入BERTB)加入ALBERTC)加入SVCD)使用更高质量的数据答案:C解析:[单选题]39.word2Vec的优缺点说法正确的是A)编码的词向量中不包含语义信息B)是一种有监督的训练方式C)无法处理一词多意问题D)不确定答案:C解析:[单选题]40.()主要是进行分词以及词性标注,为语言模型构建和发音字典创建做准备。A)词语标注B)文本标注C)语音标注D)音素标注答案:B解析:[单选题]41.N元语法模型中一个词的出现和这个词之前的()个词有关A)0B)1C)N-1D)N答案:C解析:[单选题]42.transformer的作用是什么A)做分类B)做特征函数C)不确定D)做特征提取答案:D解析:[单选题]43.batch_size一般设置为多少A)61B)62C)63D)64答案:D解析:第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.Bagging的操作主要分为哪些阶段A)Aggregating阶段,将上一个阶段训练得到的n个基模型组合起来,共同做决策。在分类任务中,可采用投票法,比如相对多数投票法,将结果预测为得票最多的类别。而在回归任务中可采用平均法,即将每个基模型预测得到的结果进行简单平均或加权平均来获得最终的预测结果。B)Boostrap阶段,即采用有放回的采样方式,将训练集分为n个子样本集;并用基学习器对每组样本分布进行训练,得到n个基模型C)分别采用全部的训练样本来训练n个组件模型,要求这些个体学习器必须异构的,比如可以分别是线性学习器,SVM,决策树模型和深度学习模型。D)训练一个元模型(meta-model)来将各个组件模型的输出结果进行结合,具体过程就是将各个学习器在训练集上得到的预测结果作为训练特征和训练集的真实结果组成新的训练集;然后用这个新组成的训练集来训练一个元模型。这个元模型可以是线性模型或者树模型。答案:AB解析:[多选题]45.下列应用属于自然语言处理的是()A)机器阅读B)机器翻译C)语音识别D)人脸识别答案:AB解析:[多选题]46.NLP所涉及的领域A)信息抽取B)问答系统C)数据预处理D)模型构建答案:AB解析:[多选题]47.如果在XGBoost中加入了正则化项,可以达到哪些效果A)减少模型复杂度B)防止了过拟合C)增加模型复杂度D)防止了欠拟合答案:AB解析:[多选题]48.在评价不平衡类问题分类的度量方法有如下几种A)F1度量B)召回率(recall)C)精度(precision)D)真正率(turepositiverate,TPR)答案:ABCD解析:[多选题]49.能够跳出局部最优解的算法有A)AdamB)MomentumC)RMSpropD)Lasso答案:ABC解析:[多选题]50.GBDT主要由哪几个概念组成A)RegressionDecistionTree(即DT)B)GradientBoosting(即GB)C)Shrinkage(算法的一个重要演进分枝,目前大部分源码都按该版本实现)。D)以上都正确答案:ABCD解析:[多选题]51.下面属于维归约常用的线性代数技术的有:A)主成分分析B)特征提取C)奇异值分解D)特征加权答案:AC解析:[多选题]52.人工智能Deeplearning中,文本分类方法有哪些?A)特征工程B)TextCNNC)分类器D)FastText答案:BD解析:[多选题]53.如果模型训练中使用到了Adam动态优化器,可以使用以下哪种方式下降?A)batchB)mini-batchC)LassoD)Ridge答案:AB解析:[多选题]54.在增加了SVM模型复杂度之后,你发现训练准确率仍是100%,原因可能是?A)数据是固定的,但我们在不断拟合更多的多项式或参数,这会导致算法开始记忆数据中的所有内容B)不确定C)以上都正确D)由于数据是固定的,SVM不需要在很大的假设空间中搜索答案:AD解析:[多选题]55.关键词提取系统的实用性主要表现在以下()A)可读性B)高速性C)学习性D)健壮性答案:ABCD解析:[多选题]56.One-Hot的缺点是什么A)简单快速容易使用B)可能会产生维度爆炸C)没有语义信息D)向量的特征表示并不是很好答案:BCD解析:[多选题]57.降维最终是为了达到一个什么样的效果A)减少预测变量的个数。B)降低算法运算开销。C)去除数据噪声。D)确保这些变量是相互独立的。答案:ABCD解析:[多选题]58.关于KNN算法,下列说法正确的是()A)无需参数估计,无需训练B)既能解决分类问题也能解决回归问题C)对变量之间的共线性比较敏感D)可解释性较差,无法给出像决策树那样的规则答案:ABCD解析:[多选题]59.以下选项中,描述的反向传播算法的过程正确的是?A)初始化联结权重Wij,对于输入的训练样本,求取每个节点输出和最终输出层的输出值B)对输出层求取偏导数C)对于隐藏层求取偏导数D)求取输出误差对于每个权重的梯度,更新权重答案:ABCD解析:[多选题]60.聚类算法中应该注意的问题有哪些A)C值如何确定B)初始质心的选取C)质心的计算D)算法停止的条件答案:ABCD解析:[多选题]61.在NLP的工业应用中,基于统计的语言模型都有哪些应用A)语音识别B)机器翻译C)句法分析D)短语识别答案:ABCD解析:[多选题]62.为什么SVM要引入核函数?A)将样本从原始空间映射到一个更低维的特征空间B)将样本从原始空间映射到一个更高维的特征空间C)使得样本在高维特征空间内线性不可分。D)使得样本在高维特征空间内线性可分。答案:BD解析:[多选题]63.当LDA模型当中的Topic个数不能很好的确定是,我们可以通过以下哪些方式去选择合适的个数?A)基于经验主观判断、不断调试、操作性强、最为常用。B)基于困惑度(主要是比较两个模型之间的好坏)。C)使用Log-边际似然函数的方法,这种方法也挺常用的。D)非参数方法:Teh提出的基于狄利克雷过程的HDP法。答案:ABCD解析:[多选题]64.下列概率图说法正确的是:A)有向图:贝叶斯网络B)有向图:马尔可夫随机场C)无向图:贝叶斯网络D)无向图:马尔可夫随机场答案:AD解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.通过较少树,叶节点的数量,可以较小树的复杂度A)正确B)错误答案:对解析:[判断题]66.one-hot表示的每一个词向量只有1维是有数值的,其他维度上的数值都为0。对A)正确B)错误答案:对解析:[判断题]67.深度学习的发展主要因为数据量的提升,并且硬件算力的提升,和算法的更新A)正确B)错误答案:对解析:[判断题]68.逆文档频率是统计一个词在一篇文档中出现频次的统计量。错A)正确B)错误答案:错解析:[判断题]69.L2其实就是在目标函数上加入了L2范数A)正确B)错误答案:对解析:[判断题]70.随着Batch_Size增大,处理相同数据量的速度越快。A)正确B)错误答案:对解析:[判断题]71.RNN和LSTM都可以作为特征提取器去提取特征,并且效果良好A)正确B)错误答案:对解析:[判断题]72.ELMO有两个阶段构成:预训练和微调A)正确B)错误答案:对解析:[判断题]73.情感分析的对象是主观性文本,文本的主客观分类是情感分析的基础工作。对A)正确B)错误答案:对解析:[判断题]74.Excel支持正则表达式。对A)正确B)错误答案:对解析:[判断题]75.GBDT和随机森林的思想和流程是相同的A)正确B)错误答案:错解析:[判断题]76.最大匹配法是最简单的分词方法,他部分使用词典进行分词,如果词典好,则分词的效果好A)正确B)错误答案:错解析:[判断题]77.0型文法生成能力太弱A)正确B)错误答案:错解析:[判断题]78.基于词的n-gram模型可以描述长距离的语言约束关系A)正确B)错误答案:错解析:[判断题]79.添加了新的特征或者增加模型的复杂度可以防止欠拟合A)正确B)错误答案:对解析:[判断题]80.激活函数的性质:非线性,可微性,单调性A)正确B)错误答案:对解析:[判断题]81.理性主义与经验主义的基本出发点是一致的。()A)正确B)错误答案:错解析:[判断题]82.程度副词本身没有任何的情感倾向性,但能够进一步的增强或者减弱情感强度。对A)正确B)错误答案:对解析:[判断题]83.HMM是生成式模型,属于动态贝叶斯网络。A)正确B)错误答案:对解析:[判断题]84.KNN中,可以借助交叉验证来选择k的最优值A)正确B)错误答案:对解析:[判断题]85.通常连接主义,符号主义和行为主义指的是人工智能的三大学派A)正确B)错误答案:对解析:[判断题]86.LightGBM在处理大数据上效果很差A)正确B)错误答案:错解析:[判断题]87.DSSM不可以计算文本之间的相似度A)正确B)错误答案:错解析:[判断题]88.类模型不是数据稀疏问题的一种解决方式A)正确B)错误答案:错解析:第4部分:问答题,共10题,请在空白处填写正确答案。[问答题]89.知网系统主要由

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论