




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷11)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.谓语动词句法成分关系特征()A)路径和位置B)位置和动词原形C)框架和位置D)路径和框架答案:A解析:[单选题]2.以下四个说法中,哪个是GBDT的优点A)在分布稠密的数据集上,泛化能力和表达能力都很好;B)GBDT在高维稀疏的数据集上表现不佳;C)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。D)不确定答案:A解析:[单选题]3.基于LDA主题模型的文本情感分析不包括()。A)文本转换B)主题提取和情感词提取C)主题情感摘要生成D)系统评测答案:A解析:[单选题]4.SVM中的代价参数C表示什么?A)交叉验证的次数B)用到的核函数C)在分类准确性和模型复杂度之间的权衡D)以上都不对答案:C解析:[单选题]5.美元货币符号?$?表示匹配字符串的()位置。A)结束B)开始C)中间D)表示货币的字符串答案:A解析:[单选题]6.下列算法中,训练数据集是无label的数据,是杂乱无章的,经过变换后变得有序,先无序,后有序是哪个算算法A)SVMB)逻辑回归C)线性回归D)聚类答案:D解析:[单选题]7.交叉检验的方法不包括以下几项A)口头信息、书面信息与实际状况之间的验证B)不同数据和信息之间的关系的合理性验证C)不同时间的关联数据之间的合理性验证D)同一个人对不同问题提供的信息的验证答案:D解析:[单选题]8.BP算法说的是那两个参数之间的误差率A)最大化实际输出与训练集的误差率B)最小化实际输出与训练集的误差率C)均值化实际输出与训练集的误差率D)范数化实际输出与训练集的误差率答案:B解析:[单选题]9.以下哪些是神经网络中的?超参数??A)隐藏层的大小B)激活值C)权重D)偏置答案:A解析:[单选题]10.()是指从文本中抽取出特定的事件或事实信息。例如,从时事新闻报道中抽取出某一恐怖事件的基本信息,如时间、地点、事件制造者、受害人、袭击目标、伤亡人数等。A)文本分类B)文本聚类C)信息抽取D)信息过滤答案:C解析:[单选题]11.下列是对于Batch归一化的描述,其中它的流程步骤不包括下列哪个选项?A)求每个训练批次数据的均值B)求每个训练批次数据的方差C)使用求得的均值和方差对该批次的训练数据做归一化,获得0-1分布D)求每个训练批次的和答案:D解析:[单选题]12.马尔科夫链达到最稳定状态时,其稳定概率与()无关A)初始转发B)中间状态C)当前状态D)最末状态答案:A解析:[单选题]13.关于对于数据切分的问题,以下说法正确的是?A)可以不设置训练集B)可以不设置测试集C)可以不设置验证集D)不确定答案:C解析:[单选题]14.Relu(RectifiedLinearUnit)又叫做什么A)随机纠正线性单元B)广义线性模型C)双曲正切D)修正线性单元函数答案:D解析:A选项指的是RRelu[单选题]15.katz指数又称ADL指数,由难到易分为()类A)4B)5C)6D)7答案:C解析:[单选题]16.下列关于不精确推理过程的叙述错误的是()。A)不精确推理过程是从不确定的事实出发B)不精确推理过程最终能够推出确定的结论C)不精确推理过程是运用不确定的知识D)不精确推理过程最终推出不确定性的结论答案:B解析:[单选题]17.句法成分相关特征之一()A)短语类型B)句法成分句子C)句法成分词D)句法成分词性答案:A解析:[单选题]18.NiLTK的安装步骤为()。A)安装NLP虚拟环境→安裝NLTK一→检查是否存在NLTK→下载NLTK数据包B)安装NLTK→安装NLP虚拟环境→检查是否存在NLTK→下载NLTK数据包C)安装NLP虚拟环境一安装NLTK一下载NLTK数据包一检查是否存在NLTKD)下载NLTK数据包→安装NLP虚拟环境→安装NLTK→检查是否存在NLTK答案:A解析:[单选题]19.梯度爆炸如何解决??A)对于RNN,可以通过梯度截断,避免梯度消失B)可以通过添加正则项,避免梯度爆炸C)使用LSTM等自循环和门控制机制,避免梯度爆炸D)优化激活函数,譬如将sigmold改为relu,避免梯度消失答案:B解析:[单选题]20.格语法提供了一种用于分析特定句子()的方法A)主旨B)含义C)成分D)类别答案:B解析:[单选题]21.NLP任务想要做的好,最基础的操作是什么A)文本的向量化B)下有任务的处理C)模型的选择D)都不正确答案:A解析:[单选题]22.以下哪个与支持向量机无关A)使用核函数B)将低维向量向高维向量转换C)使低维线性不可分的数据在高维线性可分D)使用向量的都叫支持向量机答案:D解析:[单选题]23.循环神经网络RNN的作用描述正确的是A)增大文本数量B)简化文本C)特征提取D)文本分类答案:C解析:[单选题]24.dropout作为常用的函数,它能起到什么作用A)没有激活函数功能B)一种正则化方式C)一种图像特征处理算法D)一种语音处理算法答案:B解析:[单选题]25.如果网络中遇到了梯度爆炸问题,下列选项中哪个可以很好的解决?A)梯度剪切,正则B)增加拟合数据C)增加训练数据维度D)增加隐藏层答案:A解析:[单选题]26.加入正则项,可以解决处理以下哪个问题A)正常拟合B)过拟合C)欠拟合D)不确定答案:B解析:[单选题]27.MSE(MeanSquareError)均方误差可以用到以下哪个算法当中A)逻辑回归B)GBDTC)聚类D)KNN答案:B解析:[单选题]28.虽然随机森林和GBDT都属于集成学习,他们有什么不同之处A)都是由多棵树组成,最终的结果都是由多棵树一起决定。B)组成随机森林的树可以并行生成,而GBDT是串行生成C)RF和GBDT在使用CART树时,可以是分类树或者回归树。D)不确定答案:B解析:[单选题]29.如果对图像进行池化,ksize=[1,4,4,1]那么图像会变成多大A)缩小到1/2B)扩大四倍C)扩大两倍D)缩小到1/16答案:D解析:[单选题]30.关于traintest.Dev数据集说法错误的是A)可以直接使用训练集来验证算子的准确率B)训练集用于算子的拟合C)验证集和测试集用来评判算子的准确度D)可以不配置验证集答案:A解析:[单选题]31.XGBoost中的节点的分裂方式A)枚举出了不同树结构的贪心法B)通过基尼系数C)通过信息增益D)通过信息增益比答案:A解析:[单选题]32.NLP可以说是人工智能中最难的一个方向,那么它的难体现在哪个地方A)语言的多样性,多变性等B)算力能力的提升C)数据量变得很大D)算法没有更新答案:A解析:[单选题]33.对于数据的处理过程过采样和欠采样可以解决什么问题的A)词向量化处理B)提取特征C)样本类别不平衡D)文本摘要处理答案:C解析:[单选题]34.K-Means最明显的缺点是什么?A)耗时耗内存B)耗时但是节省内存C)不耗时但是耗内存D)不耗时也不耗内存答案:A解析:[单选题]35.逻辑回归的损失函数是什么A)信息熵B)信息增益C)对数损失D)均方误差答案:C解析:[单选题]36.在NLP,处理句子文本时,哪种基于语法的文本句法分析方法可以用于名词短语检测等任务A)部分语音标注B)依存句法分析(DependencyParsing)和选取句法分析(ConstituencyParsing)C)SkipGram和N-Gram提取D)连续性词包答案:B解析:[单选题]37.Bagging的核心思想是什么A)核心思想为并行地训练一系列各自独立的同类模型,然后再将各个模型的输出结果按照某种策略进行聚合B)核心思想是并行地训练一系列各自独立的不同类模型,然后通过训练一个元模型(meta-model)来将各个模型输出结果进行结合C)不确定D)核心思想为串行地训练一系列前后依赖的同类模型,即后一个模型用来对前一个模型的输出结果进行纠正答案:A解析:[单选题]38.关于数据处理定理下列说法不正确的是A)若X、Y、Z组成一个马尔可夫链,则有I(X;Z)大于等于I(X;Y)B)若X、Y、Z组成一个马尔可夫链,则有I(X;Z小于等于I(X;Y)C)数据处理过程中熵不会增加D)通过数据处理后,一般只会增加信息的损失,最多保持原来的信息答案:A解析:[单选题]39.在模型训练的阶段,使用的优化算法中,超参数学习率会怎么变化A)保持不变B)持续较小C)持续增大D)不变答案:B解析:[单选题]40.在自然语言中,主要应用到的是深度学习神经网络是以下哪个A)ANNB)CNNC)RNND)XNN答案:C解析:[单选题]41.欧氏距离也可以叫做什么()A)非负距离B)平面距离C)绝对值距离D)平方范数距离答案:D解析:[单选题]42.在TF-IDF计算中和哪些因素相关A)不确定B)词意C)词序D)词权重答案:D解析:[单选题]43.集成学习GBDT是很好的算法,同时也有很多优点,以下对其优点的描述A)在分布稠密的数据集上,泛化能力和表达能力都很好;B)GBDT在高维稀疏的数据集上表现不佳;C)训练过程需要串行训练,只能在决策树内部采用一些局部并行的手段提高训练速度。D)不确定答案:A解析:第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.Adaboost中有两种权重,体现在()A)A:样本权重B)B:代价函数C)C:梯度下降D)D:弱分类器权重答案:AD解析:[多选题]45.Transformer中的encode层是由那几个构成的A)self-AttentionB)Attention层C)前馈神经网络D)CNN答案:AC解析:[多选题]46.seq2seq可以做机器翻译等之类的NLP任务,那么在编码器中可以用以下哪些模型做特征提取?A)CNNB)RNNC)LSTMD)SVM答案:ABC解析:[多选题]47.以下四个选项中,使用到了Transformer做特征提取模型有哪些A)BERTB)ALBERTC)GPTD)ELMO答案:ABC解析:[多选题]48.下列()是违约概率模型A)风险中性定价模型B)信用监测模型C)信用风险计算方法D)以上都正确答案:ABCD解析:[多选题]49.pytorch框架可用于解决以下哪些问题A)NLPB)CVC)DMD)都不能答案:ABC解析:[多选题]50.从区间[a,b]中随机获取一个x值,对于该操作,下列选项中描述正确的有哪些?A)取最小值的对数得到a的值B)取最小值的对数得到b的值C)取最大值的对数得到a的值D)取最大值的对数得到b的值答案:AD解析:[多选题]51.自然语言处理(NLP)中为什么要进行文本表示文本表示A)根本原因是计算机不方便对文本字符串进行处理B)便于机器学习C)良好的文本表示可以提升算法的效果D)无实际意义答案:ABC解析:[多选题]52.文本分类(基于表示方法)A)短文本表示B)One-hot表示C)词表示D)CBOW答案:BD解析:[多选题]53.线性函数归一化,是怎么去实现的A)将原始数据映射到均值为0、标准差为1的分布上B)对原始数据的等比缩放C)使结果映射到[1,2]的范围D)以上都正确答案:AB解析:[多选题]54.下面那个是bert的训练任务A)编解码B)均方误差C)遮蔽语言模型D)下一句预测答案:CD解析:[多选题]55.词_袋_子模型的优点A)简单方便快速B)在语料充足的前提下,对于简单自然语言处理任务效果不错C)准确率较低D)无法关注词语间的顺序答案:AB解析:[多选题]56.情感分析的应用领域有()A)商品评论B)舆情分析C)信息预测D)推荐系统答案:ABCD解析:[多选题]57.下列选项中关于tf.nn.SoftMax函数的描述以下正确的是哪些选项?A)用于多类别分类B)映射到概率空间C)压缩数据D)用于卷积层答案:ABC解析:[多选题]58.使用tensorflow关于实现交叉熵损失函数的API,以下选项正确的是哪些?A)entropy=-tf.reduce_sum(y_actual*tf.log(y_predict))B)entropy=-tf.reduce_mean(y_actual*tf.log(y_predict))C)entropy=-tf.reduce_max(y_actual*tf.log(y_predict))D)entropy=-tf.reduce_any(y_actual*tf.log(y_predict))答案:AB解析:[多选题]59.专家系统的结构包含哪些?A)人机界面和知识库B)推理机C)动态数据库D)知识库答理系统和解释模块答案:ABCD解析:[多选题]60.CBOW模型的神经网络包含了()A)输入层B)隐藏层C)输出层D)全连接层答案:ABC解析:[多选题]61.下列关于数据归一化的描述,正确的选项有哪些?A)归一化可以预防过拟合B)归一化没有实质作用C)归一化将所有数据样本值缩放到0-1之间D)归一化是一种激活函数答案:AC解析:[多选题]62.使用了Transformer做特征提取的预训练模型有哪些A)BERTB)ALBERTC)GPTD)ELMO答案:ABC解析:[多选题]63.文档是怎么生成的?A)首先需要列出几个主题B)然后以一定概率选择主题C)以一定概率选择主题中会包括的促会D)组成一篇文章答案:ABCD解析:[多选题]64.在工业中,NLP有哪些应用落地较好?A)语音识别B)自动翻译C)控制装置D)人脸识别答案:ABC解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.BERT使用的单向的TransformerA)正确B)错误答案:对解析:[判断题]66.深度学习可以同时应用在图像和自然语言领域A)正确B)错误答案:对解析:[判断题]67.一个字符的Unicode编码是确定的A)正确B)错误答案:对解析:[判断题]68.采用sigmoid等函数,算激活函数时(指数运算),计算量大A)正确B)错误答案:对解析:[判断题]69.神经网络的一般三要素:输入层、隐藏层和输出层A)正确B)错误答案:对解析:[判断题]70.过多增加隐层和神经元节点会带来更好的结果A)正确B)错误答案:错解析:[判断题]71.在分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-then的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。A)正确B)错误答案:对解析:[判断题]72.KNN模型训练所消耗的时间跟选择的K有关A)正确B)错误答案:对解析:[判断题]73.神经网络的一般结构是由输入层、隐藏层(神经元)、输出层构成的A)正确B)错误答案:对解析:[判断题]74.文本向量化按照向量化的粒度可以将其分为以字单位、以词为单位和以句子为单位向量表达。对A)正确B)错误答案:对解析:[判断题]75.GPT并不是预训练模型A)正确B)错误答案:错解析:[判断题]76.CNN不能做文本特征提取,只适用于图像A)正确B)错误答案:错解析:[判断题]77.深度学习的应用非常的广泛,例如:文本分类等任务A)正确B)错误答案:对解析:[判断题]78.基于机器学习的分类方法,指通过专家经验,依靠人工提取规则进行的分类。错A)正确B)错误答案:错解析:[判断题]79.最大概率法在拥有大量标注语料的前提下,可以在一定程度上避免切分歧义A)正确B)错误答案:对解析:[判断题]80.正则表达式也可以称为规则表达式。对A)正确B)错误答案:对解析:[判断题]81.使用softmax会使得输出单元从多个变成了一个A)正确B)错误答案:错解析:[判断题]82.中括号?[]?表示可以匹配多个字符,表示包含在中括号内部的字符都会被匹配。对A)正确B)错误答案:对解析:[判断题]83.模型太过于复杂的话,会造成欠拟合A)正确B)错误答案:错解析:[判断题]84.TextRank算法的基本思想来自Google的PageRank算法。对A)正确B)错误答案:对解析:[判断题]85.随机森林中是由多棵树构成的A)正确B)错误答案:对解析:[判断题]86.PCA中文名称主成分分析A)正确B)错误答案:对解析:[判断题]87.HMM模型包括三个基本问题,分别为概率计算问题,学习问题,预测问题。A)正确B)错误答案:对解析:[判断题]88.基于规则的标注方法是较早的一种词性标注方法,这种方法需要获取能表达一定的上下文关系及其相关语境的规则库。对A)正确B)错误答案:对解析:第4部分:问答题,共10题,请在空白处填写正确答案。[问答题]89.简要叙述NLTK的主要功能。答案:获取语料库、获取语料库、字符串处理、词性标注、分类、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公交营运工作管理制度
- 巾帼建功学校管理制度
- 全面成本要素管理制度
- 公司在岸人员管理制度
- 商业公司售后管理制度
- 桥梁桥墩装修方案(3篇)
- 车位整体划转方案(3篇)
- 碳钢储罐维修方案(3篇)
- 土方工程资料管理制度
- 购置厂房付款方案(3篇)
- 宁夏回族自治区中卫市各县区乡镇行政村村庄村名居民村民委员会明细及行政区划代码
- rg-wall1600系列下一代防火墙命令手册
- (人教版教材)初中地理《巴西》完整版
- 喷淋系统调试报告doc
- 科研经费审计报告模板
- DB4416∕T 5-2021 地理标志产品 河源米粉
- 雨季监理实施细则
- 课件:基础生命支持
- 分层审核检查表LPA全套案例
- 柔版印刷常见故障及解决办法
- 三标一体文件编写指南
评论
0/150
提交评论