人工智能自然语言技术练习(习题卷16)_第1页
人工智能自然语言技术练习(习题卷16)_第2页
人工智能自然语言技术练习(习题卷16)_第3页
人工智能自然语言技术练习(习题卷16)_第4页
人工智能自然语言技术练习(习题卷16)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷16)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共44题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.下列关于mini-batch原理的说法,描述正确的是?A)选取数据中部分数据进行梯度下降B)和批量梯度下降相同,只是将算法进行优化C)将数据每次进行一小批次处理,通过迭代将数据全部处理D)随机选取一些数据,计算梯度进行下降,每次将学习率降低一点答案:C解析:[单选题]2.以下哪个领域包含命名实体识别任务A)图像识别B)数据挖掘C)自然语言D)不确定答案:C解析:[单选题]3.K-Means中K代表的是什么意思A)学习率B)聚类中心C)代价D)不确定答案:B解析:[单选题]4.下列不属于机器学习中典型的分类方法的是()A)决策树B)Witten-Bell平滑算法C)贝叶斯分类器D)支持向量机答案:B解析:[单选题]5.在以下四个选项当中,关于LightGBM的说法正确的有哪些A)更慢的训练速度B)更低的内存消耗C)更差的准确率D)不支持分布式答案:B解析:[单选题]6.GBDT有很多的局限性,在以下说法中关于它的局限性描述正确的是A)预测阶段的计算速度快,树与树之间可并行化计算。B)在分布稠密的数据集上,泛化能力和表达能力都很好,这使得GBDT在Kaggle的众多竞赛中,经常名列榜首。C)GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。D)采用决策树作为弱分类器使得GBDT模型具有较好的解释性和鲁棒性,能够自动发现特征间的高阶关系。答案:C解析:[单选题]7.情感分析属于什么算法A)分类B)回归C)聚类D)降维答案:A解析:[单选题]8.对LSTM的作用描述正确的是A)增大文本数量B)简化文本C)特征提取D)文本分类答案:C解析:[单选题]9.神经网络反向传播传播的是什么?A)学习率B)迭代次数C)误差D)网络层数答案:C解析:[单选题]10.为什么要使用激活函数,有什么意义和用途A)进行非线性变换,增强表达能力B)进行线性变换,增强表达能力C)进行线性变换,减少表达能力D)进行非线性变换,减少表达能力答案:A解析:[单选题]11.以下哪种情况下不需要做特征工程A)数据没有缺失值B)决策树的输入C)SVM的输入D)数据不需要做填充答案:C解析:[单选题]12.sigmoid输出的值域可以代表什么A)概率B)代价C)学习率D)权重w答案:A解析:[单选题]13.用于寻找出某个能够达到给定目标的动作序列或步骤的专家系统是()A)设计专家系统B)诊断专家系统C)预测专家系统D)规划专家系统答案:D解析:[单选题]14.ELMO的第一层LSTM中更多的得到的是什么信息A)固定的词向量B)词义信息C)语义信息D)句法信息答案:D解析:[单选题]15.人工智能关于数据预处理的方法,下面哪个不属于?A)变量代换B)离散化C)聚集D)估计遗漏值答案:D解析:[单选题]16.识别自然语言文本中具有特定意义的实体(人名,地名,机构,时间,作品等)的技术称之为()A)分词B)命名实体识别C)词性标注D)词向量答案:B解析:[单选题]17.自然语言处理与人工智能之间的关系是什么?()A)自然语言处理是人工智能领域的重要内容。B)自然语言处理和人工智能没关系。C)人工智能是自然语言处理的一部分。D)自然语言处理中包含人工智能。答案:A解析:[单选题]18.下面哪个网络常用于NLP任务中A)ANNB)CNNC)RNND)XNN答案:C解析:[单选题]19.自然语言处理的简称为()A)ScrumB)NLPC)AUPD)Crystal答案:B解析:[单选题]20.在使用TensorFlow的过程中,如果想要打印某点值,应该怎么操作A)A=tf.run()B)A=S.valueC)A=S.eval()D)tf.assign()答案:A解析:[单选题]21.以下关于LDA和PCA两个模型的相同点描述正确的是?A)两者均可以对数据进行降维B)都属于无监督学习C)都属于有监督学习D)都可以即做分类又做回归答案:A解析:[单选题]22.下列关于双向RNN结构说法正确的是()。A)只考虑预测词前面的词,并没有考虑该词后面的内容B)不仅从前往后保留该词前面的词的信息,而且还从后往前保留该词后面的词的信息C)不是由两个RNN上下叠加在一起组成D)输出与隐藏层的状态无关答案:B解析:[单选题]23.随机森林和GBDT都属于集成学习,肯定有很多异同点,在以下描述中,正确的是?A)都是由多棵树组成,最终的结果都是由多棵树一起决定。B)RF和GBDT在使用CART树时,只能做回归不能做分类。C)RF和GBDT在使用CART树时,只能做分类不能做回归。D)不确定答案:A解析:[单选题]24.现在常用的文本生成是什么样的模型A)只依赖于编码的模型如:bertB)不确定C)基于编解码的端到端的模型seq2seqD)只依赖于解码的模型答案:C解析:[单选题]25.小概率事件怎么理解?()A)发生可能性不大的事件B)发生可能性大的事件C)发生可能性不去确定的事件D)以上都正确答案:A解析:[单选题]26.以下四个选项中,关于深度学习和机器学习之间的关系,说法正确的是?A)机器学习属于深度学习B)深度学习为机器学习更方便的提取特征C)机器学习是为深度学习服务的D)无相应关系答案:B解析:[单选题]27.基于机器学习的情感分类,关键在于特征选择、()分类模型。A)标记词性B)特征提取C)特征权重量化D)情感极性判断答案:C解析:[单选题]28.tanh相比sigmoid的优势之处何以体现A)解决了sigmoid输出为非0中心的问题B)tanh不易饱和C)tanh解决了sigmoid的指数运算D)tanh不会造成梯度消失答案:A解析:[单选题]29.以下四个选项中,找出一个与其他三个不相同的模型A)ELMoB)GPTC)BERTD)Nltk答案:D解析:[单选题]30.多头机制的作用是什么A)使每个子空间都有相互之间的连接B)使计算变得跟深,更不容易理解C)本质是多个独立的Attention的计算,作为一个集成的作用防止过拟合,然后每个子空间之间相互独立D)不确定答案:C解析:[单选题]31.多分类问题中最经典的模型是()。A)CRF模型B)聚类模型,C)多项逻辑斯谛回归D)神经网络模型答案:A解析:[单选题]32.假定现在有一个四分类问题,用One-vs-all策略训练一个SVM的模型,需要训练几个SVM模型?A)1B)2C)3D)4答案:D解析:[单选题]33.中文同义词替换时,常用到Word2Vec,以下说法错误的是A)Word2Vec基于概率统计B)Word2Vec结果符合当前预料环境C)Word2Vec得到的都是语义上的同义词D)Word2Vec受限于训练语料的数量和质量答案:C解析:[单选题]34.什么激活函数,如何理解激活函数A)激活函数其实就是一个线性变换的过程B)激活函数并无实际意义C)上层节点的输出和下层节点的输入之间具有一个函数关系,这个函数称为激活函数D)使自变量与因变量之间存在一个Y=W*X+b的一次函数关系答案:C解析:[单选题]35.TF-IDF应该如何构建A)文档中出现频率最高的词B)文档中最重要的词C)词向量化D)文本分类答案:B解析:[单选题]36.在NLP中的实体识别任务中,如果使用Bi-LSTM+CRF框架,Bi-LSTM是什么作用A)从前向后,单向提取特征B)从后向前,单向提取特征C)从前向后,从后向前,双向提取特征D)不确定答案:C解析:[单选题]37.过拟合是训练模型阶段常发生的事情,那么如何理解过拟合?A)指曲线能不能去很好的描述现有的数据B)一条曲线过分的去描述了现有的数据C)指的是在训练集上表现良好,测试集上表现很差D)指的是在训练测试集上表现都不好答案:A解析:[单选题]38.若参数C(costparameter)被设为无穷,下面哪种说法是正确的?A)只要最佳分类超平面存在,它就能将所有数据全部正确分类B)软间隔SVM分类器将正确分类数据C)二者都不对D)不确定答案:A解析:[单选题]39.TextRank可以提取到关键词那么它是由哪个算法发展来的?A)TextRnnB)TextCNNC)FasttextD)PageRank答案:D解析:[单选题]40.自然语言处理不能做什么?()A)分词B)词编码C)自动文摘D)计算机病毒答案:D解析:[单选题]41.马尔可夫过程模型属于A)假设一个事件的概率仅依赖于过去某一状态B)假设一个事件的概率仅依赖于过去所有状态C)假设一个事件的概率仅依赖于现有状态D)其余选项皆错答案:C解析:[单选题]42.NLP任务的标准流程中第一步是做什么A)预处理B)特征提取C)特征工程D)wordembedding答案:A解析:[单选题]43.自然语言处理以()为基础。A)数学B)心理学C)逻辑学D)语言学答案:D解析:第2部分:多项选择题,共22题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.GRU中也使用了门机制,分别是什么门A)更新门B)输入门C)重置门D)输出门答案:AC解析:[多选题]45.以下四个选项中,有哪些是属于机器学习的A)监督式学习B)非监督式学习C)半监督式学习D)强化学习答案:ABCD解析:[多选题]46.在深度学习中,进行前向算法需要有()和()才能由前往后正常计算A)联合权重wB)正弦函数C)激活函数D)余弦函数答案:AC解析:[多选题]47.概率图模型的判别式模型,以下哪些算法属于判别式模型?A)HMMB)SVMC)CRFD)MEMM答案:BCD解析:[多选题]48.TextCNN网络结构是__?A)输入B)池化C)卷积D)全连接-softmax答案:ABCD解析:[多选题]49.下列哪些选项对于搜索参数的方式,是正确的?A)没有足够计算资源,通过每天观察,不断调整参数B)同时试验多种模型,获得学习曲线C)没有足够计算资源,通过试验多种模型,获得学习曲线D)拥有足够资源时,通过每天观察一个参数,来进行调整答案:AB解析:[多选题]50.LightGBM的优化方向有哪些A)带深度限制的Leaf-wise的叶子生长策略B)直方图做差加速直接C)支持类别特征(CategoricalFeature)D)以上不都是答案:ABC解析:[多选题]51.可以度量文本相似度的算法有哪些A)主题模型B)LDAC)BERTD)Word2Vec+VSM答案:ABCD解析:[多选题]52.寻找获取数据集Dataset中的关系,是为了总结数据的某一特征的表示,这个过程包括了以下哪些步骤?A)决定要使用的表示的特征和结构B)决定如何量化和比较不同表示拟合数据的好坏C)选择一个算法过程使评分函数最优D)决定用什么样的数据管理原则以高效地实现算法。答案:ABCD解析:[多选题]53.对树进行了剪枝的操作回答道什么样的效果A)减少模型复杂度B)防止了欠拟合C)增加模型复杂度D)防止了过拟合答案:AD解析:[多选题]54.Adam算法是结合了()和()一起A)RMSprop算法B)均方误差C)Momentum算法D)交叉熵答案:AC解析:[多选题]55.中文实体识别的挑战性主要表现在以下()A)中文词灵活多变B)中文词的嵌套情况复杂C)中文词存在简化表达现象D)以上都不对答案:ABC解析:四、填空题(5题)[多选题]56.自然语言处理总体上包含哪些部分?()A)自然语言学习B)自然语言理解C)自然语言生成D)自然语言应用答案:BC解析:[多选题]57.Bagging可以分为哪些阶段进行,分别是怎么做的?A)Aggregating阶段,将上一个阶段训练得到的n个基模型组合起来,共同做决策。在分类任务中,可采用投票法,比如相对多数投票法,将结果预测为得票最多的类别。而在回归任务中可采用平均法,即将每个基模型预测得到的结果进行简单平均或加权平均来获得最终的预测结果。B)Boostrap阶段,即采用有放回的采样方式,将训练集分为n个子样本集;并用基学习器对每组样本分布进行训练,得到n个基模型C)分别采用全部的训练样本来训练n个组件模型,要求这些个体学习器必须异构的,比如可以分别是线性学习器,SVM,决策树模型和深度学习模型。D)训练一个元模型(meta-model)来将各个组件模型的输出结果进行结合,具体过程就是将各个学习器在训练集上得到的预测结果作为训练特征和训练集的真实结果组成新的训练集;然后用这个新组成的训练集来训练一个元模型。这个元模型可以是线性模型或者树模型。答案:AB解析:[多选题]58.特征归一化常用的方式有哪些A)线性函数归一化B)非线性函数归一化C)零均值归一化D)以上都是答案:AC解析:[多选题]59.以下哪些网络是循环神经网络A)RNNB)LSTMC)GRUD)以上都是的答案:ABCD解析:[多选题]60.(基于表示方法)文本表示分类都有哪些?A)短文本表示B)One-hot表示C)词表示D)CBOW答案:BD解析:[多选题]61.可用于文本分类的机器学习方法有()A)支持向量机B)K最近邻C)神经网络D)决策树答案:ABCD解析:[多选题]62.应用最宽泛的深度学习框架是哪个A)caffeB)tensorflowC)torchD)mxnet答案:ABCD解析:[多选题]63.在神经网络中,单个神经元能解决什么问题A)与B)或C)非D)异或答案:ABC解析:[多选题]64.搜索是常见的NLP应用,那么以下几个选项中,哪些可能是实现搜索的一部分A)用协同过滤模型(CollaborativeFilteringmodel)来检测相似用户表现(查询)B)在术语中检查Levenshtein距离的模型C)将句子译成多种语言D)不确定答案:AB解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.LightGBM是google开源出来的A)正确B)错误答案:错解析:[判断题]66.Batch_Size太小,模型表现效果极其糟糕(error飙升)。A)正确B)错误答案:对解析:[判断题]67.XGBoost属于深度学习的一个经典算法A)正确B)错误答案:错解析:[判断题]68.单个神经细胞可被视为一种只有两种状态的机器激动时为?是?,未激动时为?否?。()A)正确B)错误答案:对解析:[判断题]69.正则表达式是一个描述字符模式的对象。对A)正确B)错误答案:对解析:[判断题]70.自然语言处理=数据挖掘+机器学习。A)正确B)错误答案:错解析:[判断题]71.特征归一化可以用到SVM,逻辑回归,线性回归等模型中A)正确B)错误答案:对解析:[判断题]72.文本向量化是将文本表示成一系列能够表达文本语义的机读向量。对A)正确B)错误答案:对解析:[判断题]73.情感分析可应用于舆情分析。对A)正确B)错误答案:对解析:[判断题]74.分布式表示的优点是考虑到了词之间存在的相似关系,减小了词向量的维度。对A)正确B)错误答案:对解析:[判断题]75.发生了过拟合之后,可以从数据入手,获取更多的数据集A)正确B)错误答案:对解析:[判断题]76.Word2vec中使用了深度网络进行训练A)正确B)错误答案:错解析:[判断题]77.在早期研究中,通常以格语法为基础进行语义角色标注A)正确B)错误答案:对解析:[判断题]78.情感词的强度指的是情感的强弱。对A)正确B)错误答案:对解析:[判断题]79.图灵测试是指让人和机器进行交流,如果人无法判断和自己交流的对象是人还是机器,就说明这个机器有智能了。A)正确B)错误答案:对解析:[判断题]80.机器学习中,传统的基于规则的方法,其中的规律可以人工显性的明确出来A)正确B)错误答案:对解析:[判断题]81.K-Means算法试图找到误差准则函数最小的簇A)正确B)错误答案:对解析:[判断题]82.CYK分析法首先需要对文法进行Chomsky范式化处理A)正确B)错误答案:对解析:[判断题]83.N-Gram中的n越大效果,但消耗时间越久A)正确B)错误答案:对解析:[判断题]84.支持向量机属于判别模型A)正确B)错误答案:对解析:[判断题]85.随机森林是由多棵树构成的A)正确B)错误答案:对解析:[判断题]86.在模型输入的时候,我们并不需要对文本进行处理A)正确B)错误答案:错解析:[判断题]87.逆文档频率IDF则更注重词的区分能力。对A)正确B)错误答案:对解析:[判断题]88.通俗来讲,所谓因子图就是对函数进行因子分解得到的一种概率图A)正确B)错误答案:对解析:第4部分:问答题,共10题,请在空白处填写正确答案。[问答题]89.()是一个从非结构化文本信息中获取用户感兴趣或有用模式的过程。答案:文本挖掘解析:[问答题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论