人工智能自然语言技术练习(习题卷15)_第1页
人工智能自然语言技术练习(习题卷15)_第2页
人工智能自然语言技术练习(习题卷15)_第3页
人工智能自然语言技术练习(习题卷15)_第4页
人工智能自然语言技术练习(习题卷15)_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.线性回归使用的目标函数是以下哪个A)信息增益B)信息熵C)交叉熵D)均方误差答案:D解析:[单选题]2.不属于常用的正则表达式函数的是()。A)matchB)searchC)findallD)matplotlib函数答案:D解析:[单选题]3.语言就是()A)句子的集合B)产生式的集合C)符号串的集合D)句型的集合答案:A解析:[单选题]4.基于直方图的稀疏特征优化多线程优化。是以下哪个框架做的优化A)LightGBMB)XGBoostC)随机森林D)GBDT答案:A解析:[单选题]5.TF-DF算法的主要思想是()A)字词的重要性随着它在文档中出现次数的增加而上升,随着它在语料库中出现频率的升高而下降B)字词的重要性随着它在文档中出现次数的增加而下降,随着它在语料库中出现频率的升高而下降C)字词的重要性随着它在文档中出现次数的增加而下降,随着它在语料库中出现频率的升高而上升D)字词的重要性随着它在文档中出现次数的增加而上升,随着它在语料库中出现频率的升高而上升答案:A解析:[单选题]6.贝叶斯定理实质上是对()的陈述。A)联合概率B)边际概率C)条件概率D)后验概率答案:C解析:[单选题]7.XGBoost虽然是在GBDT的基础上进行的改进但是它可以吧哪些方面发挥到极致A)速度B)代价C)准确率D)以上都是答案:A解析:[单选题]8.结构化数据是()?A)数据库中的数据B)HTML文档C)文本D)图片答案:A解析:[单选题]9.特征的归一化属于以下哪个选项中A)特征工程B)分类C)回归D)聚类答案:A解析:[单选题]10.使用word2vec后会得到的是___?A)得到的是一个向量空间,相似的词之间距离小,不想近的词之间距离大B)一个句子出现的概率C)得到一个词出现的概率D)以上都不是答案:A解析:[单选题]11.下面哪个选项说的不是Batch归一化的作用A)减少了隐藏值分布变化的数量B)减少了输入值改变的问题C)有轻微的正则化效果D)增加了输入值改变的问题答案:D解析:[单选题]12.在Katz回退算法中,将从非零计数中减去的计数量分配给A)计数为零的高元语法B)所有零概率事件C)未知事件D)A和C答案:A解析:[单选题]13.CRF又叫什么A)拉索回归B)支持向量机C)隐马尔科夫D)条件随机场答案:D解析:[单选题]14.EM算法,什么是EM,最大期望算法A)是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。B)自变量和因变量之间的关系C)找出最优超平面进行分类D)不确定答案:A解析:[单选题]15.Bagging在做分类的Voting过程中(每个基学习器进行投票)如何做的A)每个基学习器预测结果进行平均B)每个基学习器预测结果进行投票,得票数最多的类为预测类C)从众多分类结果中,随机出来一个结果D)不去定答案:B解析:[单选题]16.tf.to_double的作用?A)将张量转换为float64类型B)转为32位整型-int32C)转为64位整型-int64D)字符串转为数字答案:A解析:[单选题]17.在以下四个选项中,可以将高级语言程序设计语言源程序翻译成计算机可执行代码的软件是?A)汇编程序B)编译程序C)管理程序D)服务程序答案:B解析:[单选题]18.ELMO是一种什么样的模型A)语言模型B)基于神经网络的语言模型C)基于统计的语言模型D)预训练语言模型答案:D解析:[单选题]19.SVM和LR都可以做分类,那么有什么异同点A)都属于分类算法B)SVM通过超平面来划分,进行分类C)LR通过计算样本属于哪个类别的概率进行分类D)都属于回归算法答案:D解析:[单选题]20.L1正则的特点是:A)A:各个参数的平方和B)B:是模型参数中非零参数的个数C)C:各个参数绝对值之和D)D:以上都不对答案:C解析:[单选题]21.多层长短期记忆人工神经网络LSTM,组合成多层网络结构后,可以处理更大范围的()A)不稳定性B)静态性C)动态性D)鲁棒性答案:C解析:[单选题]22.以下哪一个不是知网描述的关系A)上下位关系B)实体-值关系C)实体-属性关系D)反义关系答案:C解析:[单选题]23.关于梯度下降最优化方法,以下描述正确的是A)一般情况下不能保证得到全局最优解B)梯度下降速度最快C)目标函数是非凸集,梯度下降的解是最优解D)思想简单,实现困难答案:A解析:[单选题]24.下面哪个不是编辑距离里的编辑操作A)删除B)替换C)添加D)相乘答案:D解析:[单选题]25.用户希望对以下这句话进行预测?我的祖国是中国,我的母语是?,则应该采用以下哪种神经网络结构进行处理?A)多层感知机B)生成对抗网络C)循环神经网络D)卷积神经网络答案:C解析:[单选题]26.贝叶斯作为常用的理论基础,它的定理实质上是对()的陈述。A)联合概率B)边际概率C)条件概率D)后验概率答案:C解析:[单选题]27.以下归一化的描述,正确的是()A)通过中值和均值进行确定B)通过平均值和最小值确定C)通过方差和均值确定D)通过标准差和均值确定答案:C解析:[单选题]28.我们知道在概率图中有很多的节点,这些节点分别有什么意义A)随机变量B)关系C)代价D)学习率答案:A解析:[单选题]29.SVM中,若C趋于无穷,以下哪种说法正确?A)数据仍可正确分类B)数据无法正确分类C)不确定D)以上都不对答案:A解析:[单选题]30.tf.mul的作用是什么A)相乘B)相加C)相减D)相除答案:A解析:[单选题]31.下列不是自然语言处理中用到的知识的是()。A)语音学知识B)词法学知识C)汉语学知识D)话语学知识答案:C解析:[单选题]32.MSE代表什么意思A)信息熵B)均方误差C)交叉熵D)信息增益答案:B解析:[单选题]33.以下哪种不是文法的表示类型?A)无约束短语结构文法B)上下文有关文法C)上下文无关文法D)反则文法答案:D解析:[单选题]34.以下有关文本分词的说法正确的是哪个?()A)英文文本不需要分词。B)分词算法都需要一个词典。C)基于统计的分词方法的性能与训练语料库的质量密切相关D)分词合适与否不会引起句子的歧义答案:C解析:[单选题]35.RNN经典结构的输人和输出的序列长度为()。A)多对一~B)一对多C)等长的多对多D)非等长的多对多答案:C解析:[单选题]36.什么是贝叶斯的决策,如何去理解A)就是判断自变量和因变量之间的关系B)就是在不完全情况下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最有决策。C)不确定D)就是通过选择最优的超平面去进行最好的分类超平面答案:B解析:[单选题]37.构建或研究语料库的时候,一般应考虑代表性、结构性、平衡性、()4个特性。A)规模性B)便捷性C)安全性D)高效性答案:A解析:[单选题]38.m阶马尔可夫心愿的状态是指A)某个信源符号B)m个随机状态的某个具体消息C)某一转移概率D)状态转移图答案:D解析:[单选题]39.直方图算法,其算法中有一个参数:K,K代表的是什么意义A)代价B)常数C)学习率D)不确定答案:B解析:[单选题]40.语料库研究属于()A)实验研究B)非实验研究C)田野研究D)化学研究答案:B解析:[单选题]41.ReinforcementLearning是什么网络A)全连接网络B)迁移学习C)循环神经网络D)强化学习答案:D解析:[单选题]42.NLP中CBOW也有很多的应用,下边关于CBOW说法正确的是A)使用中心词预测上下文单词B)与上下问的词序是相关的C)和Skip-Gram是相同的D)使用上下文单词预测中心词答案:D解析:[单选题]43.TextRank是由__演变而来的A)TextrnnB)PageRankC)fastTextD)TextCNN答案:B解析:第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.XGBoost的目标函数由哪些组成A)损失函数B)正则项C)梯度下降D)以上都正确答案:AB解析:[多选题]45.以下几个选项中,哪些可以用逻辑回归算法去完成A)电影票房的预测B)垃圾邮件的分类C)房价的预测D)情感分类答案:BD解析:[多选题]46.下面对专家系统叙述错误的是:()A)专家系统是运用知识和推理来解决问题的;B)专家系统是把关于问题求解的知识隐含于程序中的;C)专家系统不具有透明性,无法回答用户?Why?和?How?等问题;D)利用骨架系统开发专家系统,相对于其他开发工具,其效率是最高的,灵活性是最好的,局限性也是最少的。答案:BCD解析:[多选题]47.GPT的缺点有哪些A)适用双向的LSTM特征提取能力弱B)使用了单向的语言模型C)使用单向的Transformer,会丢失很多信息D)不确定答案:BC解析:[多选题]48.以下哪些是卷积神经网络的内容A)卷积B)池化C)循环神经结构D)以上都不对答案:AB解析:[多选题]49.N-gram对NLP中的什么任务有不错的效果A)中文词性标注B)中文分词C)中文文本分析D)以上都正确答案:ABCD解析:[多选题]50.下列选项中,关于数据归一化描述正确的有哪些?A)更容易收敛得到最优解B)权重值较小C)权重值大D)无特点答案:AB解析:[多选题]51.LightGBM有什么优点A)速度快B)支持分布式C)占用内存小D)代码清晰易懂答案:ABCD解析:[多选题]52.神经网络中最常用的Dropout,可以起到什么作用A)防止过拟合B)每次训练,都对每个神经网络单元,按一定概率临时丢弃C)将词向量化D)防止欠拟合答案:AB解析:[多选题]53.Transformer中的decode层是由那几个构成的A)self-AttentionB)Attention层C)前馈神经网络D)CNN答案:ABC解析:[多选题]54.以下概率图模型分类正确的是A)有向图:贝叶斯网络B)有向图:马尔可夫随机场C)无向图:贝叶斯网络D)无向图:马尔可夫随机场答案:AD解析:[多选题]55.softmax函数的描述以下正确的是哪些选项?A)用于多类别分类B)映射到概率空间C)压缩数据D)用于卷积层答案:ABC解析:[多选题]56.神经网络一般包括哪几层A)输入层B)隐藏层C)输出层D)以上都包括答案:ABCD解析:[多选题]57.深度学习文本分类方法有哪些A)特征工程B)TextCNNC)分类器D)FastText答案:BD解析:[多选题]58.梯度消失对于模型的训练非常重要,会造成模型学不到新的东西。下列说法中,关于其描述正确的选项都有哪些?A)梯度消失对神经网络无影响B)可以通过激活函数防止梯度消失C)尽量避免梯度消失D)梯度消失反向传播时,由于梯度值过小或消失的现象答案:BCD解析:[多选题]59.采用EM算法求解的模型有哪些A)混合高斯B)协同过滤C)k-meansD)以上都正确答案:ABCD解析:[多选题]60.神经网络一般是由多层构成的一个网络,一般分别由哪些层构成A)隐藏层B)输入层C)输出层D)不确定答案:ABC解析:[多选题]61.长短期记忆网络的门指哪几项A)输入门B)遗忘门C)输出门D)更新门答案:ABC解析:[多选题]62.语料库的规模取决于()A)语料获取的可能性B)语料加工的深度C)语料加工能力D)语料成分集合的大小答案:ABCD解析:[多选题]63.DataFrame类型可以由如下类型创建:A)A:二维ndarray对象B)B:由一维ndarray、列表、字典、元组或Series构成的字典C)C:Series类型D)D:其他的DataFrame类型答案:ABCD解析:[多选题]64.语料库的用途有()A)用于语言研究B)用于编纂工具参考书籍C)用于语言教学D)用于NLP答案:ABCD解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.情感分类主要用于判别自然语言文字中表达的观点、喜好以及与感受和态度等相关的信息。对A)正确B)错误答案:对解析:[判断题]66.在LSTM中常用的激活函数有sigmoid和tanhA)正确B)错误答案:对解析:[判断题]67.特征归一化为了消除数据特征之间的量纲影响A)正确B)错误答案:对解析:[判断题]68.NLTK的fdist.plot函数可绘制指定的常用词累计频率图。对A)正确B)错误答案:对解析:[判断题]69.jieba分词支持精确模式、全模式和搜索引三种模式。对A)正确B)错误答案:对解析:[判断题]70.NNLM和N-Gram是完全相同的A)正确B)错误答案:错解析:[判断题]71.常用的损失函数之后均方误差MSEA)正确B)错误答案:错解析:[判断题]72.SVM既可以做分类也可以做回归A)正确B)错误答案:对解析:[判断题]73.上下文无关文法(2型)的规则体系便于构造,是研究得最多的一种文法A)正确B)错误答案:对解析:[判断题]74.分布式表示将每个词根据上下文从高维空间映射到一个低维度、稠密的向量上。对A)正确B)错误答案:对解析:[判断题]75.在做NLP任务的一系列任务时,通常要做去停用词的处理,否者效果可能就不会很好A)正确B)错误答案:对解析:[判断题]76.Doc2vec不仅提取文本的语义信息,而且提取了文本的语序信息。对A)正确B)错误答案:对解析:[判断题]77.机器学习算法=模型表征+模型评估+优化算法。A)正确B)错误答案:对解析:[判断题]78.感知机和深度学习的神经网络是相同的A)正确B)错误答案:错解析:[判断题]79.支持向量机是聚类算法,同时他也可以做分类A)正确B)错误答案:错解析:[判断题]80.基于情感词典的情感分析需要找出文档中的情感词、否定词和程度副词。对A)正确B)错误答案:对解析:[判断题]81.HAL是一个具有高级语言处理能力,并且能够理解汉语和说汉语的智能计算机。()A)正确B)错误答案:错解析:[判断题]82.LSA使用到的就是共现矩阵A)正确B)错误答案:对解析:[判断题]83.当数据输入到决策树中前,必须要做特征工程A)正确B)错误答案:错解析:[判断题]84.深度学习是一种随着经验积累、自动提高性能、完成特定任务的计算机程序A)正确B)错误答案:错解析:[判断题]85.GBDT每轮迭代的时候,都去拟合损失函数在当前模型下的负梯度。A)正确B)错误答案:对解析:[判断题]86.基于规则的分词能够较好地处理未登录词和歧义词,不需要人为的搭建和维护词典。错A)正确B)错误答案:错解析:[判断题]87.LR能以概率的形式输出结果,而非只是0,1判定

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论