人工智能机器学习技术练习(习题卷29)_第1页
人工智能机器学习技术练习(习题卷29)_第2页
人工智能机器学习技术练习(习题卷29)_第3页
人工智能机器学习技术练习(习题卷29)_第4页
人工智能机器学习技术练习(习题卷29)_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能机器学习技术练习人工智能机器学习技术练习(习题卷29)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能机器学习技术练习第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.以下哪项是解决NLP用例(如语义相似性、阅读理解和常识推理)的更好选择?A)ELMoB)OpenAI?sGPTC)ULMFit答案:B解析:[单选题]2.如果一个SVM模型出现欠拟合,那么下列哪种方法能解决这一问题?A)增大惩罚参数C的值B)减小惩罚参数C的值C)减小核系数(gamma参数)答案:A解析:[单选题]3.使用小括号定义的数据类型是(A)列表B)集合C)字典D)元组答案:D解析:[单选题]4.主成分分析是一种常用的(__)方法。A)降维B)分类C)回归D)聚类答案:A解析:[单选题]5.()是以样本统计量作为未知总体参数的估计量,并通过对样本单位的实际观察取得样本数据,计算样本统计量的取值作为被估计参数的估计值。A)参数估计B)逻辑分析C)方差分析D)回归分析答案:A解析:参数估计是统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。[单选题]6.缓解过拟合的一个办法是允许支持向量机在一些样本上出错,()形式适合这种方法。A)硬间隔支持向量机B)软间隔支持向量机C)线性核函数支持向量机D)多项式核函数支持向量机答案:B解析:软间隔允许某些样本不满足约束,可缓解过拟合。[单选题]7.有关数据仓库的开发特点,不正确的描述是A)数据仓库开发要从数据出发B)数据仓库使用的需求在开发出去就要明确C)数据仓库的开发是一个不断循环的过程,是启发式的开发D)在数据仓库环境中,并不存在操作型环境中所固定的和较确切的处理流,数据仓库中数据分析和处理更灵活,且没有固定的模式答案:A解析:[单选题]8.bootstrap数据是什么意思?(提示:考?bootstrap?和?boosting?区别)A)有放回地从总共M个特征中抽样m个特征B)无放回地从总共M个特征中抽样m个特征C)有放回地从总共N个样本中抽样n个样本D)无放回地从总共N个样本中抽样n个样本答案:C解析:[单选题]9.在给定文件中查找与设定条件相符字符串的命令A)gzipB)grepC)lsD)find答案:B解析:[单选题]10.在同一个问题中,错误率和精度的关系是(__)。A)错误率等于精度值加1B)错误率加精度等于1C)精度减错误率等于1D)两者之间没有关系答案:B解析:[单选题]11.核矩阵是()的。A)没有规律B)半正定C)正定D)样本矩阵答案:B解析:只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用。[单选题]12.下图中主成分的最佳数量是多少?alt="">A)7B)30C)40D)不知道答案:B解析:可以在上图中看到,主成分的数量为30时以最小的数量得到最大的方差。[单选题]13.普通反向传播算法和随时间的反向传播算法(BPTT)有什么技术上的不同()A)与普通反向传播不同的是,BPTT会在每个时间步长内减去所有对应权重的梯度B)与普通反向传播不同的是,BPTT会在每个时间步长内叠加所有对应权重的梯度C)BPTT使用的是二阶梯度D)没有差别答案:B解析:[单选题]14.()算法是通过智能体不断与环境进行交互,通过试错的方式来获得最佳策略A)有监督学习B)半监督学习C)无监督学习D)强化学习答案:D解析:[单选题]15.有如下数据集,分别使用1-最近邻,3-最近邻,对数据点x=5.0分类,则:class="fr-ficfr-dibcursor-hover"A)最近邻:+;3-最近邻:-B)最近邻:+;3-最近邻:+C)最近邻:-;3-最近邻:-D)最近邻:-;3-最近邻:+答案:A解析:[单选题]16.逻辑回归的以下模型:P(y=1|x,w)=g(w0+w1x)其中g(z)是逻辑函数。在上述等式中,通过改变参数w可以得到的P(y=1|x;w)被视为x的函数。在上面的问题中,你认为哪个函数会产生(0,1)之间的p?A)逻辑函数B)对数似然函数C)两者的复合函数D)都不会答案:A解析:对于从-∞到+∞的实数范围内的x的值。逻辑函数将给出(0,1)的输出。[单选题]17.自然语言处理包括语言识别、语音合成和()A)语言翻译B)语言理解C)语言交流D)语言训练答案:B解析:[单选题]18.tf.nn.rnn_cell.MultiRNNCell()函数的作用是()。A)生成卷积神经网络B)生成LSTMC)生成池化层D)生成多层RNN网络答案:D解析:[单选题]19.下列误差和错误中,哪一项是由于训练样本的错误而导致?A)泛化误差B)偏差C)方差D)噪声答案:D解析:[单选题]20.数据仓库是随着时间变化的,下面的描述不正确的是A)数据仓库随时间的变化不断增加新的数据内容;B)捕捉到的新数据会覆盖原来的快照;C)数据仓库随事件变化不断删去旧的数据内容;D)数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合.答案:C解析:[单选题]21.有关TensorFlowAPI,以下说法中正确的是:()A)tf.Variable和一般编程语言中?变量(Variable)?的含义完全相同。B)tf.placeholder定义的对象,对应于深度神经网络中的?超参数(Hyperparameter)?。C)通过tf.constant定义的对象,因为是常量,所以,在session.run()运行前就可以用eval()方法获得对象的值。D)session.run()运行一个训练过程时,TensorFlow会使用符号执行(SymbolicExecution)对计算图进行优化。答案:D解析:[单选题]22.CART决策树通常采用()剪枝方法。A)REP(错误率降低)B)CCP(代价复杂度)C)PEP(悲观剪枝)D)预剪枝答案:B解析:[单选题]23.两个种子点A(-1,1),B(2,1),其余点为(0,0),(0,2),(1,1),(3,2),(6,0),(6,2),利用Kmeans算法,点群中心按坐标平均计算。最终种子点A需要移动的次数,种子点B需要移动的次数,属于种子点A的点数(不包含A),属于种子点B的点数(不包含B)分别为()A)2,2,3,3B)1,1,3,3C)1,1,2,4D)2,2,2,4答案:A解析:[单选题]24.(__)是指对已有数据在尽量少的先验假设条件下进行探索,并通过作图,制表等手段探索数据结构和规律的一种方法。A)统计分析B)验证性分析C)数据洞见D)探索性数据分析答案:D解析:[单选题]25.(__)不属于机器学习理论基础。A)数据科学B)哲学C)心理学D)人工智能答案:A解析:[单选题]26.对应GradientBoostingtree算法,以下说法正确的是:A)2和4B)2和3C)1和3D)1和4答案:C解析:最小样本分裂个数是用来控制?过拟合?参数。太高的值会导致?欠拟合?,这个参数应该用交叉验证来调节。第二点是靠bias和variance概念的。[单选题]27.()算法的训练数据集部分有特征有标签,部分有特征无标签A)有监督学习B)半监督学习C)无监督学习D)强化学习答案:B解析:[单选题]28.有关决策树的说法哪个是错误的()A)可以转化为决策规则B)对新样本起到分类预测的作用C)决策树的深度越大越好D)决策树的算法和神经网络的原理不一样答案:C解析:[单选题]29.唤醒功能作为麦克风阵列技术中重要的一环,误唤醒率指标是低于()次/天?[]*A)1B)2C)3D)0.5答案:A解析:[单选题]30.7.以下哪个不是原型聚类算法()A)K均值算法B)学习向量量化LVQC)高斯混合聚类D)PCA算法答案:D解析:[单选题]31.(__)是一系列为达到某既定目标所需完成的实践,包括对应的工具、方法、资源和人。A)关键过程B)平台与架构C)数据治理D)数据管理策略答案:A解析:[单选题]32.随机森林相比Bagging,进一步在决策树的训练过程中引入了()选择A)随机属性B)重点属性C)最优属性D)集成属性答案:A解析:[单选题]33.下面不属于数据科学平台的有(__)。A)dataikuB)endorC)knimeD)alpine答案:B解析:[单选题]34.从1,2,...,15中小明和小红两人各任取一个数字,现已知小明取到的数字是5的倍数,请问小明取到的数大于小红取到的数的概率是多少A)7/14B)8/14C)9/14D)10/14答案:C解析:[单选题]35.下列不属于无监督学习方法的是()A)K-meansB)线性降维C)DBSCAND)支持向量机答案:D解析:[单选题]36.当决策树很小时,训练和检验误差都很大,这种情况称作(___)。A)模型拟合不足B)模型过拟合C)泛化能力好D)模型拟合适当答案:A解析:[单选题]37.(__)试图学得一个线性模型以尽可能准确地预测实值输出标记。A)决策树B)线性回归C)贝叶斯分类器D)神经网络答案:B解析:[单选题]38.OpenCV提供图像文件读写的模块是()。A)coreB)imgcodecsC)imgprocD)highgui答案:B解析:[单选题]39.处理文本数据,循环神经网络与前馈神经网络相比有()的优点。A)不会梯度消失B)训练结果不会发散C)不需要激活函数D)可以接受有序的输入序列答案:D解析:[单选题]40.关于K-Means和DBSCAN的比较,以下说法不正确的是()。A)K-Means丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象B)K-Means使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C)K-Means很难处理非球形的簇和不同大小的簇,而DBSCAN可以处理不同形状和不同大小的簇D)K-Means可以发现不是明显分离的簇,即使簇有重叠它也可以发现,但是DBSCAN会合并有重叠的簇答案:A解析:[单选题]41.(__)是将数据转换为产品的艺术。A)数据柔术B)数据处理C)数据加工D)数据设计答案:A解析:[单选题]42.关于贝叶斯网的学习描述错误的为A)贝叶斯的学习过程为对训练样本计数;B)估计出每个结点的条件概率;C)网络结构为已知;D)评分搜索为求解的常用办法;答案:C解析:[单选题]43.为了允许支持向量机在一些样本上出错,引入()的概念。A)软间隔B)硬间隔C)间隔D)误差答案:A解析:[单选题]44.人工神经网络的特点和优越性不包括______。A)自学习功能B)自动识别功能C)高速寻找优化解的能力D)联想存储功能答案:B解析:[单选题]45.编译程序是一种A)翻译程序B)目标程序C)汇编程序D)解释程序答案:A解析:[单选题]46.K-Means算法中的初始中心点()A)可随意设置B)必须在每个簇的真实中心点的附近C)必须足够分散D)直接影响算法的收敛结果答案:D解析:[单选题]47.Spark的四大组件下面哪个不是A)SparkStreamingB)MlibC)GraphxD)SparkR答案:D解析:[单选题]48.图像识别常用softmax函数接在模型的输出上,其作用为:()。A)增加不同类别之间的区分度B)突出输出向量中类标的对应的维度C)对输出归一化,同时以概率的更好解释输出向量D)过滤无用的环境信息答案:C解析:[单选题]49.以下集合是凸集的是A){(x,y)|y=x+1}B){(x,y)|x的平方+y的平方=1}C){(x,y)|x的平方+y的平方>1}D){(x,y)|x=1|y=1}答案:A解析:凸集,实数R上(或复数C上)的向量空间中,如果集合S中任两点的连线上的点都在S内,则称集合S为凸集。所以直线是凸集,A正确。{(x,y)|x^2+y^2<=1}是凸集。C选项恰好是圆形外面的区域,而任意两点连线上的点在圆形。D选项是两条直线。[单选题]50.下列的哪种方法可以用来降低深度学习模型的过拟合问题?1增加更多的数据;2使用数据扩增技术(dataaugmentation);3使用归纳性更好的架构;4正规化数据;5降低架构的复杂度.A)145B)123C)1345D)所有项目都有用答案:D解析:[单选题]51.20世纪70年代开始,人工智能进入首次低谷期的原因不包括A计算机内存有限A)计算机内存有限B)摄像设备没有出现C)计算机处理速度不够快D)理论基础薄弱答案:B解析:[单选题]52.一般,KNN最近邻方法在()的情况下效果较好?A)样本较多但典型性不好B)样本较少但典型性好C)样本呈团状分布D)样本呈链状分布答案:B解析:[单选题]53.下面对属性进行离散化的方法为()A)preprocessing.scale()B)pd.qcut()C)pd.shapeD)pgroupby()答案:B解析:[单选题]54.以下关于数据科学描述错误的是A)数据科学研究数据的共性B)降低计算量不是数据科学关心的问题C)数据科学可以研究非结构化数据D)数据科学需要与其他学科结合在一起答案:B解析:[单选题]55.下面关于Adaboost算法的描述中,错误的是()A)是弱分类器的线性组合B)提升树是以分类树或者回归树为基本分类器的提升办法C)该算法实际上是前向分步算法的一个实现,在这个方法里,模型是加法模型,损失函数是指数损失,算法是前向分步算法。D)同时独立地学习多个弱分类器答案:D解析:[单选题]56.在线性模型y=w1x1+w2x2+…+wnxn中,y值代表()A)预测值B)特征值C)权重值D)模型参数答案:A解析:[单选题]57.在下图中,数据集被聚类算法聚集成了()个类别A)1B)2C)3D)4答案:C解析:[单选题]58.以下哪个模型不是分类模型()A)最近邻B)K均值C)朴素贝叶斯D)逻辑回归答案:B解析:第2部分:多项选择题,共17题,每题至少两个正确答案,多选或少选均不得分。[多选题]59.预剪枝使得决策树的很多分子都没有展开,会导致()。A)显著减少训练时间开销B)显著减少测试时间开销C)降低过拟合风险D)提高欠拟合风险答案:ABCD解析:预剪枝使得决策树的很多分支都没有展开,这不仅降低了过拟合的风险,还显著减少了决策树的训练时间开销和测试时间开销。但另一方面,有些分支的当前划分虽不能提升泛化性能,其至可能导致泛化性能暂时下降,但在其基础上进行的后续划分却有可能导致性能显著提高;预剪枝基于贪心原则,禁止这些分支展开,提高了欠拟合的风险。[多选题]60.我们想要减少数据集中的特征数即降维,以下方案合适的是()。A)使用前向特征选择方法B)使用后向特征排除方法C)我们先,把所有特征都使用,去训练一个模型,得到测试集上的表现。然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现。如果表现比原来还要好,我们可以去除这个特征D)查看相关性表,去除相关性最高的一些特征答案:ABCD解析:前向特征选择方法和后向特征排除方法是特征选择的常用方法。如果前向特征选择方法和后向特征排除方法在大数据上不活用,可以用这里C中方法。用相关性的度量去删除多余特征也是一个可行的方法。[多选题]61.缺失数据的处理主要涉及的关键活动包括().A)缺失数据的识别B)缺失数据的分析C)删除或插补缺失数据D)缺失数据的溯源答案:ABC解析:[多选题]62.支持向量机可能解决的问题()A)线性分类B)非线性分类C)回归分析D)BP算法答案:ABC解析:[多选题]63.下面关于数据产品开发相关描述正确的有(__)。A)?数据产品?在数据科学中是统称B)数据产品开发是数据科学的重要研究任务之一C)数据产品开发是数据科学区别于其他学科的重要研究任务D)数据科学的学习目的之一是提升自己的数据产品开发能力答案:ABCD解析:[多选题]64.从不同的学习场景看,半监督学习可大致分为四大类A)半监督分类B)半监督回归C)半监督聚类D)半监督降维答案:ABCD解析:[多选题]65.深度学习的主要过程包括()A)选择适合问题的网络结构B)选择适合网络结构的问题C)用大量数据训练网络对权重初始化D)优化网络答案:ABCD解析:[多选题]66.数据战略的基本问题有(__)。A)数据战略的定位B)数据战略的目标C)数据战略的侧重点D)数据战略的范畴答案:ABCD解析:[多选题]67.(__)可以帮助解决训练集在特征空间中线性不可分的问题。A)硬间隔B)软间隔C)核函数D)拉格朗日乘子法答案:BC解析:[多选题]68.SVM常用的核函数有()A)h次多项式核函数B)高斯径向基函数核函数C)Sigmoid型核函数D)拉普拉斯核函数答案:ABCD解析:[多选题]69.数据加工是一种数据转换的过程,可分为(__)。A)单维度转换B)高维度转换C)低维度转换D)多维度转换答案:AD解析:[多选题]70.下列关于包裹式选择的描述正确的是(__)。A)包裹式特征选择方法直接针对给定学习器进行优化B)从最终学习器性能来看,包裹式特征选择比过滤式特征选择更好C)包裹式特征选择的计算开销通常比过滤式特征选择大得多D)包裹式特征选择的典型算法:LVW算法,其特征子集搜索采用了随机策略答案:ABCD解析:[多选题]71.ID3算法从功能上看有哪两点明显不足?A)预测目标值只能为连续实数值,不能是离散值,因此只能处理回归问题,不能处理分类问题B)预测目标值只能为离散值,不能是连续实数值,因此只能处理分类问题,不能处理回归问题C)实例各特征的取值必须是离散值,而不能是连续实数值D)实例各特征的取值必须是连续实数值,而不能是离散值答案:BC解析:[多选题]72.Zookeeper运行的模式可以为()A)StandAloneB)StooolC)StandUpD)集群模式答案:AD解析:[多选题]73.(__)主要关注的是过去。A)描述性分析B)诊断性分析C)预测性分析D)规范性分析答案:AB解析:[多选题]74.()是关键词提取的算法。A)TF-IDFB)TextRankC)LDAD)PCA答案:ABC解析:[多选题]75.分析工具包括(__)和商务智能可视化、垂直分析、统计计算、数据服务、语音与自然语言理解、搜索等。A)数据分析平台B)数据科学平台C)机器学习D)人工智能答案:ABCD解析:第3部分:判断题,共16题,请判断题目是否正确。[判断题]76.传统的机器学习方法的表现主要算法,目前的机器学习主要是强化学习,具有自学习能力A)正确B)错误答案:对解析:[判断题]77.逻辑回归算法又叫做对数几率回归,作为一种分类算法,在统计学中属于广义的线性模型A)正确B)错误答案:对解析:[判断题]78.分类学习的目的是从给定的人工标注的分类训练样本数据集中学习出一个分类函数或者分类模型,也常常称作分类器A)正确B)错误答案:对解析:[判断题]79.贝叶斯网学习而言,模型就是一个贝叶斯网,每个贝叶斯网描述了一个在训练数据上的概率分布A)正确;B)错误;答案:对解析:[判断题]80.信息熵是度量样本集合纯度最常用的一种指标。信息熵的值越大,说明样本集合的纯度越高。A)正确B)错误答案:错解析:[判断题]81.在机器学习算法中,没有最好的算法,只有?更适合?解决当前任务的算法A)正确B)错误答案:对解析:[判断题]82.分类是预测数据对象的离散类别,预测是用于数据对象的连续取值A)正确B)错误答案:对解析:[判断题]83.Softmax回归可以处理多元分类问题,Logistic回归只能处理二元分类问题A)正确B)错误答案:对解析:[判断题]84.使用已训练好的模型对测试集中的实例进行分类预测。如果要调用sklearn中的某个函数来评价预测的准确率,应该选择accuracy_score,而不应该选择mean_squared_errorA)正确B)错误答案:对解析:[判断题]85.精确率越高,意味着误报率越低,因此,当误报的成本较高时,精确率指标有助于判断模型的好坏。A)正确B)错误答案:对解析:[判断题]86.基于VC维的泛化误差界是是分布无关、数据独立的A)正确B)错误答案:对解析:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论