人工智能自然语言技术练习(习题卷13)_第1页
人工智能自然语言技术练习(习题卷13)_第2页
人工智能自然语言技术练习(习题卷13)_第3页
人工智能自然语言技术练习(习题卷13)_第4页
人工智能自然语言技术练习(习题卷13)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷13)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.以下哪个是激活函数呢?A)sigmodeB)tanhC)EELUD)PLU答案:B解析:[单选题]2.关于HMM的解码问题,用什么算法处理A)前向算法B)后向算法C)Viterbi算法D)Baum-Welch算法答案:C解析:[单选题]3.概率图模型中的有向图模型和无向图模型有什么相同的地方A)都是转换成了概率相加的形式B)将复杂的联合分布分解为多个因子相加C)将复杂的联合分布分解为多个因子的乘积D)以上所有答案:C解析:[单选题]4.下面哪一个说法更能解释随机梯度下降的原理A)随机赋值,祈祷它们是正确的B)搜索所有权重和偏差的组合,直到得到最佳值C)赋予一个初始值,通过检查跟最佳值的差值,然后迭代更新权重D)以上都不正确答案:C解析:[单选题]5.以下哪个不属于无监督学习A)聚类B)降维C)回归算法D)PCA答案:C解析:[单选题]6.tf.Graph.get_operations()的作用是什么A)返回图中的操作节点列表B)为节点创建层次化的名称,并返回一个上下文管理器C)返回图中的操作节点列表D)完成图的构建,即将其设置为只读模式答案:C解析:[单选题]7.提取关键词的常见方法是()A)词频B)标签C)分词D)关键字答案:A解析:[单选题]8.()函数用于搜索搭配词语。A)concordanceB)common_contextsC)collocationsD)Sorted答案:C解析:[单选题]9.KS检验与卡方检验的相同点A)处理方式相同B)得到的效果相同C)二者都用于类别数据D)都采用实际频数和期望频数只差进行检验答案:D解析:[单选题]10.relu是常用的激活函数,它可以将小于()的数输出为0A)-1B)0C)1D)x答案:B解析:[单选题]11.能通过对过去和现在已知状况的分析,推断未来可能发生的情况的专家系统是()A)修理专家系统B)预测专家系统C)调试专家系统D)规划专家系统答案:B解析:[单选题]12.通过(1,3)(2,5)(3,7)(4,9)这些数据可以构建怎样的线性函数A)Y=W*X+bB)Y=lnXC)Y=X²D)Y=K*X²答案:A解析:[单选题]13.One-Hot是怎样的一种向量化表达方式A)分布式表示B)基于矩阵的表示C)基于神经网络的表示D)离散型表示答案:D解析:[单选题]14.评估回归模型的指标,用哪个?A)A:FR²B)B:MFFEC)C:MSED)D:ABC全错答案:C解析:[单选题]15.深度学习中的?超参数?指哪个?A)隐藏层的大小B)激活值C)权重D)偏置答案:A解析:[单选题]16.tf开始执行每个变量里的初始化操作的函数是哪个A)variables_initializer()B)global_variables_initializer()C)sess.runD)global_initializer()答案:B解析:[单选题]17.什么情况下神经网络模型被称为深度学习模型?A)加入更多层,使神经网络的深度增加B)有维度更高的数据C)当这是一个图形识别的问题时D)以上都不正确答案:A解析:[单选题]18.以下哪个函数表示双曲正切激活函数?A)ReluB)sigmoidC)tanhD)sin答案:C解析:[单选题]19.以下几个网络在NLP中最为常用的是哪个?A)CNNB)NNC)RNND)SVM答案:C解析:[单选题]20.以下选项关于神经网络中,在对超参数的选择和调试中,其中最重要的参数应该是什么?A)mini-Batch的大小B)动量梯度下降的参数βC)学习率αD)隐藏层数目答案:C解析:[单选题]21.tensoflow中的函数Graph.get_operations()的作用是什么A)返回图中的操作节点列表B)为节点创建层次化的名称,并返回一个上下文管理器C)完成图的构建,即将其设置为只读模式D)返回图中的操作节点列表答案:D解析:[单选题]22.什么是决策树,如何去理解决策树?A)一种树形结构,其中每个内部节点表示一个属性上的测试,每个分支代表一个测试输出,每个叶节点代表一种类别B)两个变量之间的关系是二次函数的关系,图像是条抛物线C)两个变量之间的关系是一次函数关系的关系D)两个变量之间的关系是指数函数的关系答案:A解析:[单选题]23.关于损失函数的意义说法正确的是A)损失函数越小,模型鲁棒性越好B)损失函数越小,模型鲁棒性越差C)损失函数越大,模型鲁棒性越好D)不确定答案:A解析:[单选题]24.ELMO中使用的特征提取器是什么A)单向LSTMB)TransformerC)双向LSTMD)CNN答案:C解析:[单选题]25.自然语言处理主要是关于()的技术。A)机械学B)通信学C)物理学D)逻辑学答案:D解析:[单选题]26.对于超参数随机取值指的是?A)随机选择标尺取值B)随机取值就是有效范围内随机均匀取值C)选择合适的标尺进行取值D)随机的进行均匀的取值答案:C解析:[单选题]27.Word2Vec的训练方式属于__?A)无监督B)有监督C)半监督D)自主学习答案:A解析:[单选题]28.不属于中文的实体边界识别变得更加有挑战性原因的是)。A)中文词数量繁多B)中文词灵活多变C)中文词的嵌套情况复杂D)中文词存在简化表达现象答案:A解析:[单选题]29.以下几个关于LightGBM说法正确的是A)基于Histogram的决策树算法B)不支持并行C)不支持分布式D)效率高但是精度低答案:A解析:[单选题]30.零均值归一化是怎么做的A)原始数据进行线性变换B)使结果映射到[0,1]的范围C)实现对原始数据的等比缩放D)将原始数据映射到均值为0、标准差为1的分布上答案:D解析:[单选题]31.以下关于GBDT说的是它的优点,并且说法正确的是A)GBDT在高维稀疏的数据集上,表现不如支持向量机或者神经网络。B)GBDT在处理文本分类特征问题上,相对其他模型的优势不如它在处理数值特征时明显。C)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。D)预测阶段的计算速度快,树与树之间可并行化计算。答案:D解析:[单选题]32.以下几个描述中,关于优化算法减小学习率的原因,说法正确的是?A)一种默认定式B)减少内存容量C)避免在最优解附近大幅度摆动D)减少迭代次数答案:C解析:[单选题]33.哪些是产生式模型A)HMMB)SVMC)CRFD)MEMM答案:A解析:[单选题]34.线性整流函数(RectifiedLinearUnit,ReLU),又称修正线性单元A)Sigmoid函数B)tanh函数C)ReLUD)leakyReLU答案:C解析:[单选题]35.造成RNN梯度消失与下面哪个因素有关A)激活函数求导B)学习率C)批处理数D)网络层数答案:A解析:[单选题]36.Fasttext做分类,会有以下哪个优点A)网络层数较多B)复杂度高C)精度高D)快速答案:D解析:[单选题]37.以下四个选项中,BP算法属于以下哪一类A)梯度上升问题B)梯度优化C)梯度消失问题D)梯度下降法答案:D解析:[单选题]38.特征工程本质上是一个什么样的过程A)特征工程是一个表示和展现数据的过程B)特征工程是一个文本分类的过程C)特征工程是一个回归过程D)特征工程是一个聚类过程答案:A解析:[单选题]39.下列哪个不是体现出的随机森林的随机性A)样本的随机性(Bagging):在Bagging时,随机选择样本B)特征的随机性(Randomsubspace)C)随机特征组合(Randomcombination)D)随机代价函数答案:D解析:[单选题]40.以下哪个操作可以停止树的循环A)加入L2正则B)加入L1正则C)设置树的最大深度D)以上都可以答案:C解析:[单选题]41.熵表示的是什么A)自变量和因变量之间的关系B)表示数据的多少C)表示数据中心包含信息量的大小D)不确定答案:C解析:[单选题]42.使用以下哪种方式编码的词向量包含语义信息A)one-hotB)bagofwordsC)word2vecD)TF-IDF答案:C解析:[单选题]43.tf.Variable(tf.random_normal([20,10,5,16])),在该操作中,关于定义的卷积核高度是多少?A)10B)6C)16D)20答案:D解析:第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.下述相似度公式正确的是?A)汉明距离相似度:1-汉明距离/关键词长度B)欧几里得距离相似度:1/(1+欧几里得距离)C)曼哈顿距离相似度:1/(1+曼哈顿距离)D)编辑距离相似度:(1-编辑距离/两者之间长度)答案:BC解析:[多选题]45.关于KNN算法,以下哪些描述没有问题?A)A:当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。B)B:计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最近邻点。C)C:使用KDTree可以加快k近邻的搜索效率D)D:可理解性差,无法给出像决策树那样的规则。答案:ABC解析:[多选题]46.以下四个选项中属于Bert家族成员的有哪些A)albertB)RoBertaC)Sentence-BertD)SpanBert答案:ABCD解析:[多选题]47.以下哪些属于长短期记忆网络A)输入门B)输出门C)遗忘门D)重置门答案:ABC解析:[多选题]48.HMM和CRF在工业应用中都很常见,那么他们的区别是什么A)前者描述的是P(X,Y)=P(X|Y)*P(Y),是generativemodelB)后者描述的是P(Y|X),是discriminativemodelC)前者你要加入对状态概率分布的先验知识,而后者完全是datadriven.D)没有什么区别答案:ABCD解析:[多选题]49.常用的dropout函数,有哪些特性?下列描述正确的是?A)具有正则化功能B)具有激活函数功能C)常用于图像处理D)机器学习算法答案:ABC解析:[多选题]50.自然语言处理应用?A)客服系统B)查找同义词C)道标识别D)文本挖掘答案:ABD解析:[多选题]51.目前较常用的无监督关键词提取算法有()A)TF-IDF算法B)TextRank算法C)主题模型算法D)以上都不对答案:ABC解析:[多选题]52.关于LightGBM的优点,说法正确的是A)更快的训练速度B)更低的内存消耗C)更好的准确率D)分布式支持,可以快速处理海量数据答案:ABCD解析:[多选题]53.对模型进行调优是可以使用以下哪种方法A)调整学习率B)选择合适的算法模型C)良好的文本表示D)不确定答案:ABC解析:[多选题]54.聚类的相似度计算方法A)SVMB)余弦相似度C)欧氏距离D)Ligist答案:BC解析:[多选题]55.以下关于NNLM的几种说法正确的有哪些A)从语言模型出发,将模型最优化的过程转换为求词向量表示的过程B)使用了非对称的前项窗口C)滑动窗口便利整个语料库D)计算量正比语料库的大小答案:ABCD解析:[多选题]56.卷积神经网络中的卷积操作分别都是有哪些部分构成的A)卷积层B)RELUC)POOLING层D)pedding答案:ABC解析:[多选题]57.如果要预处理的特征是多个特征的时候,可以怎么进行A)PCA降维B)LDA降维C)特征选择D)衍生变量(生成更有意义的特征)答案:ABCD解析:[多选题]58.GBDT中如果按照高维的ID特征做分裂时都有什么缺点A)计算量大B)子树的泛化能力弱C)容易过拟合D)以上都正确答案:ABCD解析:[多选题]59.DSSM的核心优势有哪些A)可以很好的把握语义焦点B)可以对上下文语义进行很好地建模C)可以通过语义很好的计算出相似度D)不确定答案:ABC解析:[多选题]60.以下哪些方法可以解决过拟合问题A)增加数据量B)加入正则化C)降低模型复杂度D)收敛之前迭代答案:ABCD解析:[多选题]61.关于集成学习算法,下面是Boosting的算法都有哪些??A)A:RandomForestClassifierB)B:AdaboostC)C:XgboostD)D:RandomForestRegressor答案:BC解析:[多选题]62.常用的优化器包括哪些A)AdamB)SGDC)momentumD)Ridge答案:ABC解析:[多选题]63.为什么要必须进行降维A)多重共线性和预测变量之间相互关联。多重共线性会导致解空间的不稳定,从而可能导致结果的不连贯。B)高维空间本身具有稀疏性。一维正态分布有68%的值落于正负标准差之间,而在十维空间上只有2%。C)过多的变量,对查找规律造成冗余麻烦。D)仅在变量层面上分析可能会忽略变量之间的潜在联系。例如几个预测变量可能落入仅反映数据某一方面特征的一个组内。答案:ABCD解析:[多选题]64.生成式模型在统计学角度与判别式模型相比有什么优点A)适用较多类别的识别B)能更充分利用先验知识C)分类边界更灵活D)研究单类问题灵活性强答案:BD解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.隐马尔科夫模型的优点是该方法对过程的状态预测效果良好,可考虑用于生产现场危险状态的预测。缺点是不适宜用于系统中长期预测A)正确B)错误答案:对解析:[判断题]66.tanh函数是sigmoid的向下平移和伸缩后的结果A)正确B)错误答案:对解析:[判断题]67.语句fromnltkimportword_tokenize是用于导入nltk中的英文词性标注模块。错A)正确B)错误答案:错解析:[判断题]68.感知机利用误分类最小策略,求得分离超平面,不过此时的解有无穷多个。A)正确B)错误答案:对解析:[判断题]69.将隐马尔科夫模型表示成五元组的形式,其中V为发射概率集合。A)正确B)错误答案:错解析:[判断题]70.扩展库jieba的函数cut可以用来对中文文本进行分词并返回包含分词结果的列表。对A)正确B)错误答案:对解析:[判断题]71.HMM的参数估计可使用最大似然估计方法。A)正确B)错误答案:错解析:[判断题]72.删除插值和katz回退都使用低阶分布的信息来确定计数为0的n元语法的概率A)正确B)错误答案:对解析:[判断题]73.英语BNP可以分成以下两类:由序数词,基数词和限定词修饰的名词短语;由形容词和名词修饰的名词短语A)正确B)错误答案:对解析:[判断题]74.深度学习属于连接主义学派的A)正确B)错误答案:对解析:[判断题]75.反向传播是指对神经网络沿着从输入层到输出层的顺序,依次计算并存储模型的中间变量(包括输出)A)正确B)错误答案:错解析:[判断题]76.在做NLP任务的时候,可以直接把汉字作为模型输入A)正确B)错误答案:错解析:[判断题]77.RNN是NLP的核心网络之一A)正确B)错误答案:对解析:[判断题]78.如果训练集较小,直接使用batch梯度下降法A)正确B)错误答案:对解析:[判断题]79.相比单层的神经网络,引入多层的神经网络就可以使线性模型变成非线性模型,来拟合非线性的结构A)正确B)错误答案:对解析:[判断题]80.概率图模型包括了朴素贝叶斯模型、最大熵模型、隐马尔可夫模型、条件随机场、主题模型等,在机器学习的诸多场景中都有着广泛的应用。A)正确B)错误答案:对解析:[判断题]81.文本校对系统的任务是检查文本中的语法、词汇和文字方面可能存在的错误,报告给用户并提出修改建议A)正确B)错误答案:对解析:[判断题]82.LSTM网络可应用于文本分类任务。对A)正确B)错误答案:对解析:[判断题]83.自然语言处理是一门融语言学、计算机科学、数学、心理学、逻辑学、声学于一体的科学,而以声学为基础。()A)正确B)错误答案:错解析:[判断题]84.感知器分类器最早由Rosenblatt提出(Rosenblatt,1962),其又被称作正确驱动的方法。A)正确B)错误答案:错解析:[判断题]85.EM中的M步,结合E步求出的隐含变量条件概率,求出似然函数下界函数的最大值A)正确B)错误答案:对解析:[判断题]86.CBOW中是使用中心词预测上下文单词的A)正确B)错误答案:错解析:[判断题]87.机器学习一般指深度神经网络,端到端的学习A)正确B)错误答案:错解析:[判断题]88.用任何一个汉字在语料中出现的次数,除以所有汉字出现的总次数,就可以得到这个汉字的频率。A)正确B)错误答案:对解析:第4部分:问答题,共10题,请

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论