版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
试卷科目:人工智能自然语言技术练习人工智能自然语言技术练习(习题卷4)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能自然语言技术练习第1部分:单项选择题,共45题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.不同标注集的根本差别在于()A)如何对某些词进行分类B)如何排布词语C)如何对某种字符进行分类D)如何排布字符答案:A解析:[单选题]2.TextRank是由以下哪个算法改进来的A)TextRnnB)TextCNNC)FasttextD)PageRank答案:D解析:[单选题]3.在tf中常用的reshape函数它的用途是做什么?A)维度转化B)相加C)相乘D)相减答案:A解析:[单选题]4.在TensorFlow框架中,如何正确的调用Adam优化器?A)tf.example.AdamOptimizerB)tf.train.AdamOptimizerC)tf.nn.AdamOptimizerD)tf.AdamOptimizer答案:B解析:[单选题]5.()根据文本的不同特征划分为不同的类A)文本概括B)文本分类C)文本聚类D)都可以答案:C解析:[单选题]6.RMSprop相比较与算法Momentum,建议可以采取更大的()A)学习率B)样本集C)损失函数D)激活函数答案:A解析:[单选题]7.在编写模型或者训练模型的时候,如果模型过于复杂的话,会出现什么情况A)正常拟合B)过拟合C)欠拟合D)不确定答案:B解析:[单选题]8.LSTM的输出有两个:当前时刻LSTM输出值、和()A)输入门B)遗忘门C)当前时刻的单元状态D)更新门答案:C解析:[单选题]9.以下四个算法中,哪个体现了XGBoost的本质A)随机森林B)GBDTC)线性回归D)逻辑回归答案:B解析:[单选题]10.词袋模型是最早的以词语为基本处理单元的文本向量化方法.以下哪个选项不是词袋模型的A)基于分布假设B)存在语义鸿沟C)维度灾难D)无法保留次序信息答案:C解析:[单选题]11.基于统计的分词方法为()A)正向最大匹配法B)逆向最大匹配法C)最少切分D)条件随机场答案:D解析:[单选题]12.人工智能中关于距离空间处理的分类情况,一般:A)需要权重训练B)不需要权值训练C)不能分类D)需要选定特殊距离空间答案:B解析:[单选题]13.所有的预测正确(正类负类)的占总的比重,这种计算方法可以计算?A)召回率B)准确率C)精准率D)F1值答案:B解析:[单选题]14.关于TF-IDF,以下哪种说法是正确的A)词的重要度和词类内频成正比和所有类别词频成反比B)词的重要度和词类内频成正比和所有类别词频成正比C)词的重要度和词类内频成正比和所有类别词频成反比D)以上都不是答案:B解析:[单选题]15.移进-归约算法中操作有()(1)移进(2)归约(3)接收(4)拒绝A)(1)(2)B)(1)(2)(3)C)(3)(4)D)(1)(2)(3)(4)答案:D解析:[单选题]16.()是统计一个词出现在文档集中文档频次的统计量。A)逆文档频率B)词频C)词频-逆文档频率D)以上都不对答案:A解析:[单选题]17.贝叶斯可以用什么图去进行表示A)无向图B)有无向图C)有向图D)不确定答案:C解析:[单选题]18.CRF模型思想主要来源于()。A)无向图模型B)最大熵模型C)马尔可夫随机场D)统计方法答案:B解析:[单选题]19.句法分析主要是()A)解析句子中各个成分的依赖关系B)从文本中识别具有特定类标的实体C)抽取目标文本中的主要信息D)对大规模的文档进行索引答案:A解析:[单选题]20.人工智能起源于哪个年代?A)20世纪50年代B)20世纪60年代C)20世纪70年代D)20世纪80年代答案:A解析:[单选题]21.以下几个选项中,哪个用来处理多分类任务A)tanhB)softmaxC)sigmoidD)relu答案:B解析:[单选题]22.下列哪个说法是正确的?A)神经网络的更深层通常比前面层计算更复杂的输入特征。B)神经网络的前面层通常比更深层计算更复杂的输入特性。C)神经网络由输入和隐藏层构成D)神经网络的隐藏层只能是一层答案:A解析:[单选题]23.一个家用电器制造商雇佣你帮助其分析社交媒体数据来决定它们的哪个冰箱质量是最可靠的。你会用以下哪一个工具来分析?()A)文本挖掘工具B)情感分析软件C)网页挖掘技术D)数据挖掘软件答案:B解析:[单选题]24.下列不是知识表示法的是()。A)计算机表示法B)谓词表示法C)框架表示法D)产生式规则表示法答案:A解析:[单选题]25.LDA模型是应用比较广泛的一种主题模型,包含词、()和文档3层结构。A)主题B)词频C)权重D)词性答案:A解析:[单选题]26.关于NLP中常用的Glove说法错误的是A)可以学习的到词向量B)学习得到的词向量可以区分一词多意C)通过局部数据来训练计算的D)通过全局数据来统计共现概率答案:C解析:[单选题]27.以下__模型是基于上下文的EmbeddingA)one-hotB)bagofwordsC)ELMOD)word2vec答案:C解析:[单选题]28.CNN中卷积层的作用是什么?A)特征缩放B)特征提取C)数据清洗D)数据提取答案:B解析:[单选题]29.K-Means中的K应该如何去选择A)贪心法则B)马尔科夫C)肘部法则D)概率图答案:C解析:[单选题]30.以下四个选项中代表的随机森林缩写的是哪个?A)RFB)GBDTC)XGBoostD)LightGBM答案:A解析:[单选题]31.SVM算法的性能取决于:A)核函数的选择B)核函数的参数C)软间隔参数CD)以上所有答案:D解析:[单选题]32.在神经网络中常使用到的非线性激活函数sigmoid,该函数的模型曲线是()?A)X型B)S型C)L型D)U型答案:B解析:[单选题]33.关于机器学习的聚类中的肘部法则是指()A)就是从K值和代价函数J的二维图中找出J下降变平滑的拐点对应的K值。B)最大K值C)最小K值D)随机K值答案:A解析:[单选题]34.tf.add函数是对两个tensor做什么运算?A)维度转化B)相加C)相减D)相乘答案:B解析:[单选题]35.下列正确的是A)句法是指描述词语排列的方法B)句法结构一般用树状数据结构表示C)句法分析,是指对输入的单词序列判断其构成是否合乎给定的语法,分析出合乎语法的句子的句法结构。D)其它3项都对答案:D解析:[单选题]36.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为A)y=x+1B)y=x+2C)y=x-1D)y=2x+1答案:A解析:[单选题]37.关于常用的交叉熵函数,说法正确的是__?A)在二分类中交叉熵函数和最大似然函数表达式相同B)交叉熵函数是从信息论角度得到的C)交叉熵函数是从概率角度得到的D)最大似然函数是从概率角度的到的答案:C解析:[单选题]38.以下几种说法当中,关于随机森林的说法错误的是A)随机森林的结果是多数表决表决的B)随机森林对异常值不敏感C)随机森林是减少模型的方差D)组成随机森林的树可以串行生成答案:D解析:[单选题]39.假如说特征过少,模型过于简单,可能会发生什么情况A)正常拟合B)过拟合C)欠拟合D)不确定答案:C解析:[单选题]40.()是1966年由美国语言学家菲尔摩提出的一种语言学理论是语法体系深层结构中的语义概念。A)格语法B)贝叶斯分类器C)限制学说D)选择限制学说答案:A解析:[单选题]41.GBDT使用的是什么思想A)BaggingB)BoostingC)逻辑回归D)线性回归答案:B解析:[单选题]42.常用的激活函数其中包括Tanh,它的导数的范围是在哪个区间?A)(0,1]B)(0,0.1]C)(0,-1]D)(0,10]答案:A解析:[单选题]43.K-Means想要进行并行计算,可以进行以下哪种操作A)Hadoop集群B)增加K的个数C)增加样本的特征D)以上都可以答案:A解析:第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]44.词性标注后会降低()处理的复杂度。A)词义标注B)信息检索C)字音转换D)简繁转换答案:ABCD解析:[多选题]45.决策树有着广泛的应用,那么具体它可以做什么任务A)聚类B)分类C)回归D)降维答案:BC解析:[多选题]46.EM算法过程中,可以分为哪两个步骤A)期望步B)极大步C)不确定D)选择最优K取值答案:AB解析:[多选题]47.对HMM参数说法正确的是A)Y:隐状态B)A:输出观察值概率矩阵C)B:状态转移概率矩阵D)Π:初始状态概率矩阵答案:AD解析:[多选题]48.判别式Discriminativemodel模型使用的方式有:A)HMMB)SVMC)CRFD)MEMM答案:BCD解析:[多选题]49.AlphaGo中使用了哪些技术?A)决策神经网络B)评估神经网络C)历史经验D)线性代数答案:AB解析:[多选题]50.神经网络在NLP中有哪些常见应用领域A)机器创作B)个性化推荐C)文本分类D)情感分析答案:ABCD解析:[多选题]51.调参指的是调哪些参数A)学习率B)batch_sizeC)模型结构D)以上都正确答案:AB解析:[多选题]52.关于KNN说法正确的是A)A:当样本不平衡时,如一个类的样本容量很大,而其他类样本容量很小时,有可能导致当输入一个新样本时,该样本的K个邻居中大容量类的样本占多数。B)B:计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最近邻点。C)C:使用KDTree可以加快k近邻的搜索效率D)D:可理解性差,无法给出像决策树那样的规则。答案:ABCD解析:[多选题]53.Jieba.cut方法的3个参数分别是?A)cat_allB)HMMC)SepD)sentence答案:ABD解析:[多选题]54.GBDT的原理,下面描述正确的是?A)根据训练集训练一颗初始决策树;B)计算之前所有树在此数据集上预测结果之和与真实结果的差值,又叫残差;C)把残差作为当前树作为拟合的目标在训练集上训练;D)直到达到设置的阈值--如树的个数,早期停止策略答案:ABCD解析:[多选题]55.传统文本相似度计算方式有哪些A)欧几里得距离B)曼哈顿距离C)SimHashD)余弦相似性答案:ABCD解析:[多选题]56.GateRecurrentUnit的门包括下面哪几项A)更新门B)遗忘门C)输入门D)重置门答案:AD解析:[多选题]57.以下选项当中,哪些项构成了XGBoost的目标函数?A)损失函数B)正则项C)梯度下降D)以上都正确答案:AB解析:[多选题]58.以下几种关于GPT的说法正确的是什么A)使用的是Transformer而不是LSTMB)使用的是LSTM而不是TransformerC)其中Transformer是单向的D)使用了双向的Transformer答案:AC解析:[多选题]59.下列哪些是对马尔科夫模型的正确理解()A)马尔科夫模型的基本假设是人事变动概率B)用以估计历年年平均调动概率的周期越长,根据过去所推测未来人员变动就越准确C)采用马尔科夫模型可以预测组织任何时刻点上的各类人员分布状况D)模型中的转移率是指组织中人员进行水平调动的比率,不包含被提升或降级的人数答案:AB解析:[多选题]60.XGBoost和GBDT有很多异同点,针对于他们的不同点,下列说法正确的是A)GBDT是机器学习算法,XGBoost是该算法的工程实现。B)在使用CART作为基分类器时,XGBoost显式地加入了正则项来控制模型的复杂度,有利于防止过拟合,从而提高模型的泛化能力。C)GBDT在模型训练时只使用了代价函数的一阶导数信息,XGBoost对代价函数进行二阶泰勒展开,可以同时使用一阶和二阶导数。D)传统的GBDT采用CART作为基分类器,XGBoost支持多种类型的基分类器,比如线性分类器。答案:ABCD解析:[多选题]61.所有主题模型都基于以下()基本假设。A)每个文档包含多个主题B)每个主题包含多个词C)词由主题构成D)主题与词无关答案:AB解析:[多选题]62.基于神经网络的语言模型一般分为哪几层A)输入层B)投影层C)隐藏层D)输出层答案:ABCD解析:[多选题]63.正常情况下,集成学习一般有哪些步骤A)不确定B)生产一组?个体学习器C)以上都正确D)用某种策略将他们结合起来答案:BD解析:[多选题]64.关键词抽取的算法主要分为哪两类A)有监督B)半监督C)无监督D)不确定答案:AC解析:第3部分:判断题,共24题,请判断题目是否正确。[判断题]65.RNN可用于判断输入句子的情感倾向。对A)正确B)错误答案:对解析:[判断题]66.线性回归中的因变量和自变量呈现一次函数关系A)正确B)错误答案:对解析:[判断题]67.Bagging是bootstrapaggregating。思想就是从总体样本当中随机取一部分样本进行训练,通过多次这样的结果,进行投票获取平均值作为结果输出,这就极大可能的避免了不好的样本数据,从而提高准确度。A)正确B)错误答案:对解析:[判断题]68.字表不可以用数组来存放。A)正确B)错误答案:错解析:[判断题]69.TextCNN是用于机器翻译的算法A)正确B)错误答案:错解析:[判断题]70.感知器的基本组成单位是神经元,每一个神经元是一个二元线性分类器,对应的线性函数为g(x)=(w·x)+b。()A)正确B)错误答案:对解析:[判断题]71.线性可分支持向量机利用间隔最大化求得最优分离超平面,这时,解是唯一的A)正确B)错误答案:对解析:[判断题]72.DRMM是交互性的深度匹配模型A)正确B)错误答案:对解析:[判断题]73.seq2seq是经典的预训练语言模型A)正确B)错误答案:错解析:[判断题]74.在LSTM中sigmoid的激活函数的作用是作为一个门A)正确B)错误答案:对解析:[判断题]75.线性回归算法只能做回归,不能做分类A)正确B)错误答案:对解析:[判断题]76.首先gbdt是通过采用加法模型(即基函数的线性组合),以及不断减小训练过程产生的残差来达到将数据分类或者回归的算法。A)正确B)错误答案:对解析:[判断题]77.大五码是中国台湾地区标准汉字字符集(CNS11643)。A)正确B)错误答案:对解析:[判断题]78.舆情分析可以帮助分析哪些话题是目前的热点,分析传播路径以及发展趋势,对于不好的與论导向可以进行有效的控制A)正确B)错误答案:对解析:[判断题]79.用户自建的图灵机器人可以离线进行智能问答。()A)正确B)错误答案:错解析:[判断题]80.NLP的最终目的应该是在语法理解的基础上实现相应的操作。()A)正确B)错误答案:错解析:[判断题]81.未登录词问题是分词错误的主要来源A)正确B)错误答案:对解析:[判断题]82.回退模型是根据低一阶的分布,将从非零计数中减去的计数量分配给计数为零的高元语法。A)正确B)错误答案:对解析:[判断题]83.中文文本分词最常用的是以基于词典的分词方法为主,以统计分词方法为辅进。对A)正确B)错误答案:对解析:[判断题]84.深度学习中比较擅长做特征抽取A)正确B)错误答案:对解析:[判断题]85.浅层句法分析的结果并不是一颗完整的句法树,但各个语块是完整句法树的一个子图,只要加上语块之间的依附关系,就可以构成完整的句法树A)正确B)错误答案:对解析:[判断题]86.seq2seq不是一种编解码模型A)正确B)错误答案:错解析:[判断题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 财政部货物类合同管理规定
- 钢琴启蒙老师年终总结
- 煤气检查和使用安全:预防火灾和中毒事故
- 《色彩心理学》课件
- 《船用卸扣》规范
- 进出口业务知识培训
- 抗蠕虫药相关行业投资规划报告范本
- 骨代谢异常的生物化学诊断课件
- 铁路安全警示教育室
- 防治结核病的内容讲解
- 《电气控制系统设计与装调》教案 项目五 任务二小车自动往返控制线路设计与安装
- 意识形态知识培训课
- 网络安全行业防火墙解决方案
- 个人开车与单位免责协议书
- JGJT46-2024《建筑与市政工程施工现场临时用电安全技术标准》知识培训
- 四川公务员考试(公共基础知识)真题试卷汇编1
- 《护理文书书写》课件
- 广东省广州市海珠区2024-2025学年三年级上学期月考英语试卷
- 2023年北京市重点校初三(上)期末历史试题汇编:第一次工业革命
- 《最后一片叶子》课件
- 2024年小轿车买卖合同标准版本(三篇)
评论
0/150
提交评论