人工智能自然语言技术练习(习题卷17)_第1页
人工智能自然语言技术练习(习题卷17)_第2页
人工智能自然语言技术练习(习题卷17)_第3页
人工智能自然语言技术练习(习题卷17)_第4页
人工智能自然语言技术练习(习题卷17)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷17)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共43题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.下列关于doc2vec算法的描述错误的是?()A)DM模型在给定上下文和文档向量的情况下预测单词的概率B)DM模型在训练时,首先将每个文档的ID和语料库中的所有词初始化一个K维的向量C)DBOW模型的训练方法是忽略输入的上下文,让模型去预测段落中的随机一个单词D)在预测单词的概率时,利用了部分文档的语义。答案:D解析:[单选题]2.集成学习GBDT有很多优点,但同时也有缺点,它的缺点主要表现在什么地方?A)GBDT只能处理高维稀疏的数据集上B)GBDT在处理文本分类特征问题上,相对其他模型的优势不如它在处理数值特征时明显。C)GBDT在高维稀疏的数据集上,表现比支持向量机要好D)训练过程需要并行训练答案:B解析:[单选题]3.像个性化推荐,机器创作等这类任务,用到了以下哪个内容A)深度学习B)GANC)自编码D)迁移学习答案:A解析:[单选题]4.GPT的思想是什么A)遮蔽掉一定量的词B)预测下一句是否正确C)训练一个语言模型D)在没有标注的数据上进行网络学习,然后添加一层再去具体的任务上进行微调答案:D解析:[单选题]5.零均值归一化会将均值映射到多少A)0B)1C)2D)3答案:A解析:[单选题]6.语料库的加工方式不包括A)人工方式B)半自动方式C)自动方式D)干预方式答案:D解析:[单选题]7.在词类构造中,采用词的自动聚类技术时,构造基于A)基于词的n-gram模型B)基于词性的n-gram模型C)基于词自动聚类的n-gram模型D)以上三项都可答案:C解析:[单选题]8.EM算法的得到广泛的应用,具体它是一个什么优化算法A)梯度下降优化算法B)非梯度优化算法C)动态优化算法D)不确定答案:B解析:[单选题]9.下列哪个不是目前命名实体识别技术的难点?()A)长度不确定B)嵌套情况复杂C)分词准确度不高D)命名实体的构成规律复杂答案:C解析:[单选题]10.tf.subtract的返回值是什么类型的数据A)范数B)数组C)矢量D)Tensor答案:D解析:[单选题]11.Transformer的编码层是总共是有几层构成的A)1B)2C)3D)4答案:B解析:[单选题]12.早期语料库语言学研究不包括A)语言习得B)音系研究C)方言学与语料库技术的结合D)发展模式答案:D解析:[单选题]13.神经网络的训练过程,经常要做数据划分,以下说法正确的是?A)可以不设置训练集B)可以不设置测试集C)可以不设置验证集D)不确定答案:C解析:[单选题]14.NLP中常用的语言模型是为了求得什么A)一句话或者一个词出现的概率B)一个词的词向量C)一个稠密的向量矩阵D)不确定答案:A解析:[单选题]15.tf.reshape有什么作用A)插入维度1进入一个tensor中B)改变tensor的形状C)改变tensor的数据类型D)转为32位整型-int32答案:B解析:[单选题]16.下面哪个个关于softmax函数的说法是正确的?A)主要用于二分类B)算出来为概率值C)将最小的概率值所对应的类别作为输入样本的输出类别D)所有的概率相加大于1答案:B解析:[单选题]17.马尔科夫是个几元组模型A)1B)2C)3D)4答案:C解析:[单选题]18.国标码用()个字节表示一个汉字,每个字节的ASCII码都大于()。A)两128B)一128C)两127D)一127答案:C解析:[单选题]19.()是一种基于图的文本排序算法,它可以用于自动摘要和提取关键词。A)TF-IDF算法B)TextRank算法C)LDA算法D)主题模型答案:B解析:[单选题]20.情感分析是一种特殊的文本分析,它侧重于确定个人的偏见或情绪。通过对自然语言语境中的文本进行分析,来判断作者的态度。()A)高兴与难过B)看法与见解C)偏见或情绪D)兴奋与沮丧答案:C解析:[单选题]21.tf里的con1d的作用是什么A)二维卷积B)一维卷积C)lstm操作D)GRU操作答案:B解析:[单选题]22.KNN算法更适合于()的分类问题。A)稀有事件B)易发事件C)不确定D)以上都正确答案:A解析:[单选题]23.语料库研究属于()A)实验研究B)非实验研究C)田野研究D)化学研究答案:B解析:[单选题]24.以下四个任务中,逻辑回归可以做哪个A)数据降维B)垃圾邮件分类C)电影票房预测D)房价预测答案:B解析:[单选题]25.哪个网络结构常用于人脸识别A)LeNET5B)(CNN:AlexNet)C)VGGD)ResNet答案:B解析:[单选题]26.造成自然语言处理困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种合样的()A)一致性或统一性B)复杂性或重复性C)歧义性或多义性D)一致性或多义性答案:C解析:[单选题]27.在对数据或者任务进行建模时,需要对目标进行怎样的操作A)度量化B)抽象化C)具体化D)理想化答案:A解析:[单选题]28.聚类算法是常用的算法,在以下四个选项中,哪个是聚类算法A)SVMB)KNNC)ID3D)K-Means答案:D解析:[单选题]29.relu激活函数取负数时,激活后的数值为:A)-1B)0C)1D)x答案:B解析:[单选题]30.如果文法中的每一条产生式α→β都满足|α|<=|β|,即规则左部的符号个数少于或等于规则右部的符号个数(例如,xYz→xyz),这种文法就称为A)0型文法B)1型文法C)2型文法D)左线性文法答案:B解析:[单选题]31.使用TensorFlow去定义常量的操作,以下正确得是?A)tensor=tf.constant(1)B)tensor=tf.constant([1,2])C)tensor=tf.constant(-1,shape=[2,3])D)a=tf.constant([1.0,2.0],name="a)答案:D解析:[单选题]32.决策树算法的缺点是()。A)学习时间长,且效果不可保证B)易出现过拟合,易忽略数据集属性的相关性C)时空复杂度高,样本容量较小或数据集偏斜时容易误分D)对非线性问题没有通用解决方案答案:B解析:[单选题]33.计算机在处理向量肯定是比处理字符串更加方便,因此我们将字符串转换为向量的过程叫什么A)文本表示B)文本分类C)文本摘要D)文本挖掘答案:A解析:[单选题]34.以下几个选项中关于ID3算法正确的是A)适用于二分类B)使用信息增益比选取特征C)能够很好的处理连续值D)不确定答案:A解析:[单选题]35.人工智能中regularization的作用A)防止过拟合B)边缘检测C)提取特征D)简化数据答案:A解析:[单选题]36.属于特征提取方法的是()。A)BOW模型B)数据标准化C)训练模型D)模型融合答案:A解析:[单选题]37.聚类算法,是哪种学习方式A)有监督B)无监督C)半监督D)强化学习答案:B解析:[单选题]38.如何去理解牛顿法?A)实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的B)是一种在实数域和复数域上近似求解方程的方法C)改善每次需要求解复杂的Hessian矩阵的逆矩阵的缺陷,它使用正定矩阵来近似Hessian矩阵的逆,从而简化了运算的复杂度D)不确定答案:B解析:[单选题]39.什么是梯度下降,如何去理解梯度下降A)实现简单,当目标函数是凸函数时,梯度下降法的解是全局解。一般情况下,其解不保证是全局最优解,梯度下降法的速度也未必是最快的B)是一种在实数域和复数域上近似求解方程的方法C)改善每次需要求解复杂的Hessian矩阵的逆矩阵的缺陷,它使用正定矩阵来近似Hessian矩阵的逆,从而简化了运算的复杂度D)不确定答案:A解析:[单选题]40.在模型构建前期,对数据进行划分,正常的将数据集进行切分为三个集合,下面哪个不被包含?A)确认集B)测试集C)验证集D)训练集答案:A解析:[单选题]41.在调整NNLM的权重时,使用的方法是什么A)BP+SGDB)BPC)SGDD)BP+BGD答案:A解析:[单选题]42.网格搜索虽然有很多的优点,但是也有个关键的弊端是?A)十分耗时B)十分快速C)计算资源少D)效率快答案:A解析:[单选题]43.Attention是通过那种方式计算权重的A)tanhB)reluC)softmaxD)sigmoid答案:C解析:第2部分:多项选择题,共23题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.LDA和PCA有很多的异同点,对于不同点描述正确的是?A)LDA有监督的降维方法;B)PCA无监督的降维方法;C)LDA可以用于降维,还可以用于分类;D)PCA只用于降维;答案:ABCD解析:[多选题]45.BERT虽然目前比较火,但是也很多需要改进的地方,例如___?A)参数量太大B)输入遮蔽的时候随机遮蔽单个字C)输入句子最大限度512D)有很强烈的语义信息答案:ABC解析:[多选题]46.以下哪些网络结构可用于处理文本分类任务A)fastTextB)textCNNC)textRNND)以上都不可以答案:ABC解析:[多选题]47.ELMO中使用双向的LSTM有什么可以优化的地方A)将LSTM替换成TransformerB)双向的LSTM在最后拼接的时候融合效果差C)适应性广,普适性强D)可以动态调整的词向量答案:BC解析:[多选题]48.超参数应该可以如何调优A)网格搜索B)不确定C)随机搜索D)贝叶斯优化算法答案:ACD解析:[多选题]49.常见的词嵌入算法有哪些?()A)Word2VecB)TextRankC)AHPD)Doc2Vec答案:AD解析:[多选题]50.朴素贝叶斯不是以()为基础的分类方法。A)概率论B)天文学C)地理学D)物理学答案:BCD解析:[多选题]51.EM算法在高斯混合模型中的应用包含哪些步骤A)明确隐变量,写出完全数据的对数似然函数。B)EM算法的E步:确定Q函数C)求Q函数对theta的极大值,即求新一轮迭代的模型参数。D)以上都正确答案:ABCD解析:[多选题]52.随机森林也有很多明显的缺点,以下描述正确的是A)它可以处理很高维度的数据,并且不用降维,无需做特征选择;B)随机森林已经被证明在某些噪音比较大的分类或回归问题上会过拟合。C)对于有不同取值的属性数据,取值划分较多的属性会对随机森林产生更大的影响,所以随机森林在这种数据上产出的属性权值是不可信的。D)以上都正确答案:BC解析:[多选题]53.语料库管理程序的基本要求包括()A)用户界面友好B)程序完备性好C)数据安全D)可以检索答案:ABCD解析:[多选题]54.下面有关文本分析正确的说法是哪些?()A)时间和日期都是需要识别的命名实体。B)句法分析可以表达组成句子的词语之间的搭配或修辞关系C)文本分类可以通过贝叶斯分类器完成。D)信息抽取不需要了解实体之间的语义关系答案:ABC解析:[多选题]55.BOW模型有什么特点A)高纬度B)低纬度C)高稀疏性D)低稀疏性答案:AC解析:[多选题]56.以前为什么深度学习不火,而最近几年的到了很大的发展呢?A)算力的能力上升B)算法有了很大的发展C)更好的正则化和优化方法D)数据量变得越来越大答案:ABCD解析:[多选题]57.以下几个模型中,哪些是基于N-Gram的A)BERTB)GPTC)NNLMD)CBOW答案:CD解析:[多选题]58.在下列参数中,哪些属于神经网络超参数?A)学习率αB)动量梯度下降的参数βC)mini-Batch的大小D)隐藏层数目答案:ABCD解析:[多选题]59.BP算法中最重要的两个环节,分别是什么?A)激励传播B)权重更新C)信息传播D)激活函数答案:AB解析:[多选题]60.线性回归中最小化代价函数是寻找哪些最优参数A)K(拐点数)B)W(权重)C)B(偏置)D)以上都正确答案:BC解析:[多选题]61.下列选项中,哪些是比较常用的梯度下降优化器?A)dropoutB)动量梯度下降法C)RMSpropD)Adam答案:BCD解析:[多选题]62.语料库的构建原则包括()A)代表性B)结构性C)平衡性D)规模性答案:ABCD解析:[多选题]63.关于AI人工智能的特征工程,以下哪些是对的??A)文本预处理B)特征提取C)文本表示提升算法的效果D)分类器答案:ABC解析:[多选题]64.以下哪些属于LSTMA)输入门B)输出门C)遗忘门D)重置门答案:ABC解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.中文文本分析不需要分词。错A)正确B)错误答案:错解析:[判断题]66.Word2vec,ELMO,LSTM都可以去进行特征提取A)正确B)错误答案:错解析:[判断题]67.中文的词性标注至今还没有统一的标注标准。对A)正确B)错误答案:对解析:[判断题]68.命题是指具有真假意义的陈述句A)正确B)错误答案:对解析:[判断题]69.BERT可以处理的最长序列是768A)正确B)错误答案:错解析:[判断题]70.层次softmax使用的是霍夫曼树来编码输出层词典A)正确B)错误答案:对解析:[判断题]71.将字或者词转化成向量的过程,称为词嵌入A)正确B)错误答案:对解析:[判断题]72.NLP中存在着两种不同的研究方法:一种是理性主义方法,另一种是经验主义方法。()A)正确B)错误答案:对解析:[判断题]73.语言模型在自然语言处理中占有重要的地位,在语音识别,机器翻译,汉语自动分词和句法分析等都有应用A)正确B)错误答案:对解析:[判断题]74.EM算法的应用一般有混合高斯、协同过滤、k-means。算法一定会收敛,但是可能会收敛到局部最优A)正确B)错误答案:对解析:[判断题]75.聚类的形式和方法有:基于划分,基于层次,基于密度,基于网络A)正确B)错误答案:对解析:[判断题]76.舆情分析主要是分析民众对热点事件或新闻事件的看法。对A)正确B)错误答案:对解析:[判断题]77.最大匹配法主要分为三种:正向最大匹配法,逆向最大匹配法,双向匹配分词A)正确B)错误答案:对解析:[判断题]78.只有大的语料库才可以有效利用语料检索系统.错A)正确B)错误答案:错解析:[判断题]79.ELMO相比较word2vec来说解决了一词多义问题A)正确B)错误答案:对解析:[判断题]80.最大匹配法的优点是程序简单易行,开发周期短A)正确B)错误答案:对解析:[判断题]81.CNN通过卷积的方式进行特征提取A)正确B)错误答案:对解析:[判断题]82.TextRank不能提取到关键词A)正确B)错误答案:错解析:[判断题]83.Relu会使一部分神经元的输出为0,这样就造成了网络的稀疏性A)正确B)错误答案:对解析:[判断题]84.seq2seq并不是编解码的结构A)正确B)错误答案:错解析:[判断题]85.文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。对A)正确B)错误答案:对解析:[判断题]86.语义分析从分析的深度上分为浅层语义分析和深层语义推理两个层次A)正确B)错误答案:对解析:[判断题]87.LDA只能做聚类A)正确B)错误答案:错解析:[判断题]88.由于EM的计算方法中每一次迭代都分两步,其中一个为期望步(E步),另一个为极大步(M步),所以算法被称为EM算法(ExpectationMa

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论