人工智能机器学习技术练习(习题卷28)_第1页
人工智能机器学习技术练习(习题卷28)_第2页
人工智能机器学习技术练习(习题卷28)_第3页
人工智能机器学习技术练习(习题卷28)_第4页
人工智能机器学习技术练习(习题卷28)_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能机器学习技术练习人工智能机器学习技术练习(习题卷28)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能机器学习技术练习第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.分类的类别标签列是()A)类别数值B)类别的不同C)具有次序、大小的意义答案:B解析:[单选题]2.混淆矩阵对角线上的值()A)越大越好B)越小越好C)无所谓大小答案:A解析:[单选题]3.下列属于非线性分类方法的是()A)最小距离分类器B)线性鉴别分析C)感知机D)核SVM答案:D解析:[单选题]4.以下对Velocity相关描述不正确的是()。A)Velocity是指速度快B)实时分析数据处理要求速度快C)大数据中所说的?速度?包括两种:增长速度和处理速度D)通常而言,处理速度比增长速度快答案:D解析:[单选题]5.对于以下代码,Char*p=newchar[100];正确的是A)p和new出来的内存都在栈上B)p和new出来的内存都在堆上C)p在堆上,new出来的在栈上D)p在栈上,new出来的在堆上答案:D解析:[单选题]6.以下有关可视化认识错误的是哪个()。A)可视化是简单地把原始的数据用图的形式展示出来的方法B)可视化可以作为数据预处理的一种方法,找出其中的噪声C)可视化本身是一种数据分析方法,使用图表把数据中隐藏的规律展示出来D)通过数据的可视化,可以促进数据分析人员对数据的认识和规律发现答案:A解析:[单选题]7.归纳推理是()推理A)从一般到个别B)从个别到一般C)从个别到个别D)从一般到一般答案:B解析:[单选题]8.()是指数据减去一个总括统计量或模型拟合值时的残余部分A)极值B)标准值C)平均值D)残值答案:D解析:残值在数理统计中是指实际观察值与估计值(拟合值)之间的差。[单选题]9.以下哪种方法会增加模型的欠拟合风险()A)添加新特征B)增加模型复杂度C)减小正则化系数D)数据增强答案:D解析:[单选题]10.(__)是在不影响数据分析结果准确性的前提下,对原始数据进行一定的变换操作,对其中的个人(组织)敏感数据进行替换或删除操作。A)数据加工B)数据保护C)数据脱敏D)数据清洗答案:C解析:[单选题]11.下面不属于NewSQL的有(__)。A)memsqlB)trafodionC)mariaDBD)objectivity答案:D解析:[单选题]12.KNN算法属于一种典型的()算法A)监督学习B)无监督学习C)半监督学习D)弱监督学习答案:A解析:[单选题]13.梯度下降算法的正确步骤是(1计算预测值和真实值之间的误差2迭代更新,直到找到最佳权重参数3把输入传入网络,得到输出值4初始化权重和偏差⑤对每个产生误差的神经元,改变对应的权重值以减小误差A)1234⑤B)54321C)431⑤②D)321⑤4答案:C解析:[单选题]14.多层感知机方法中,可用作神经元的非线性激活函数()A)logistic函数B)范数C)线性内积D)加权求和答案:A解析:[单选题]15.以下描述中不正确的是(___)。A)归纳是指从特殊到一般的泛化过程B)归纳是指从具体的事实归结出一般性规律C)演绎是指从特殊到一般的特化过程D)演绎是指从基础原理推演出具体情况答案:C解析:[单选题]16.下列关于半朴素贝叶斯描述错误的为A)假设属性之间完全独立;B)假设属性之间部分相关;C)独依赖估计为半朴素贝叶斯最常用的策略;D)假设所以属性都依赖于同一个属性;答案:A解析:[单选题]17.(__)采用概率模型来表达聚类原型。A)k均值算法B)学习向量量化C)高斯混合聚类密度聚类D)密度聚类答案:C解析:[单选题]18.(__)可以理解为对数据管理的管理。A)数据治理B)数据统治C)数据宰相D)数据战略答案:A解析:[单选题]19.下面的代码中,不是用来用来评价所训练模型的预测准确性的是:A)fromsklearn.metricsimportmean_absolute_errorB)fromsklearn.metricsimportmean_squared_errorC)fromsklearn.model_selectionimporttrain_test_splitD)fromsklearn.metricsimportaccuracy_score答案:C解析:[单选题]20.专家系统中知识库的知识可以获取的来源是()A)领域专家B)专家系统的用户C)计算机系统管理员D)专家系统程序的开发者答案:A解析:[单选题]21.在k均值算法中,假定聚类簇数k=3,则在算法开始时随机选取(__)个样本作为初始均值向量A)1B)2C)3D)任意答案:C解析:[单选题]22.sparks中默认的存储级别()。A)MEMORY_ONLYB)MEMORY_ONLY_SERC)MEMORY_AND_DISKD)MEMORY_AND_DISK_SER答案:A解析:[单选题]23.在非均等代价下,希望最小化__。A)召回率B)错误率C)错误次数D)总体代价答案:D解析:[单选题]24.有关深度学习加速芯片,以下的说法中不正确的是:()A)GPU既可以做游戏图形加速,也可以做深度学习加速B)用于玩游戏的高配置显卡,也可以用于深度学习计算。C)GoogleTPU已经发展了三代,它们只能用于推断(Inference)计算,不能用于训练(Training)计算D)FPGA最早是作为CPLD的竞争技术而出现的答案:C解析:[单选题]25.随机森林是()分类方法中最具代表性的一个。A)串行B)并联C)串联D)并行答案:D解析:[单选题]26.BP神经网络的学习规则是()A)梯度上升法B)梯度下降法C)梯度提升法D)梯度曲线法答案:B解析:[单选题]27.列表a=[1,2,[3,4]],以下的运算结果为True的是()。A)length(a)==3B)len(a)==4C)len(a)==3D)length(a)==4答案:C解析:[单选题]28.下图中,主成分的最佳数目是多少?A)10B)20C)30D)无法确定答案:C解析:本题考查的是PCA的基本概念。显然,当主成分数目为30的时候,积累的方差比例最大。[单选题]29.()算法是决策树学习的基本算法,其他多数决策树学习方法都是它的变体。A)Find-SB)KNNC)概念D)ID3答案:D解析:[单选题]30.线性模型有很好的(__)。A)可描述性B)分类结果C)可解释性D)聚类结果答案:C解析:[单选题]31.若对于数据分布D和概率密度函数p(∙),错误率与精度可分别描述为(__)。A)若测试数据集的精度高或错误率小,则模型的泛化能力强;反之,则泛化能力弱。B)若测试数据集的精度低或错误率小,则模型的泛化能力强;反之,则泛化能力弱。C)若测试数据集的精度高或错误率高,则模型的泛化能力强;反之,则泛化能力弱。D)若测试数据集的精度小或错误率高,则模型的泛化能力强;反之,则泛化能力弱。答案:A解析:[单选题]32.事件A在另外一个事件B已经发生条件下的发生概率,称为(__)。A)先验概率B)后验概率C)条件概率D)统计概率答案:C解析:[单选题]33.下列关于TF-IDF说法正确的是?A)该值与特征项在文档中出现的频率成反比B)该值与特征项在文档中出现的频率成正比C)该值与在整个语料库中出现该特征项的文档库成正比D)该值与特征项在文档中出现的频率无关答案:B解析:[单选题]34.相关关系是指()。A)变量间的非独立关系B)变量间的因果关系C)变量间的函数关系D)变量间不确定性的依存关系答案:D解析:[单选题]35.以下对支持向量机中的支撑向量描述正确的是()A)最大特征向量B)最优投影向量C)最大间隔支撑面上的向量D)最速下降方向答案:C解析:[单选题]36.感知器(Perceptron)执行任务的顺序是1初始化随机权重2得到合理权重值3如果预测值和输出不一致,改变权重4对一个输入样本,计算输出值A)43②①B)①②34C)134②D)14③②答案:D解析:[单选题]37.下列哪项不是目前深度学习的必备技术()A)卷积可视化解释B)反向传播算法C)非线性激活函数D)深度神经网络答案:A解析:[单选题]38.(__)直接把最终将要使用的学习器的性能作为特征子集的评价标准。A)过滤式选择B)包裹式选择C)嵌入式选择D)正则化答案:B解析:[单选题]39.下列直接影响传统机器学习算法成败的关键因素是哪个A)预处理B)后处理C)训练方法D)特征提取答案:D解析:[单选题]40.下列对于PCA说法:①我们须在使用PCA前标准化数据;②我们应该选择使得模型有最大variance的主成分;③我们应该选择使得模型有最小variance的主成分;④我们可以使用PCA在低维度上做数据可视化。正确的是()。A)①、②、④B)②、④C)③、④D)①、③答案:A解析:须在使用PCA前标准化数据,应选择使得模型有最大variance的主成分,PCA在低维度上做数据可视化。[单选题]41.对于非概率模型而言,可按照判别函数线性与否分成线性模型与非线性模型。下面哪个模型不属于线性模型?A)感知机B)AdaBoostC)K-meansD)k近邻答案:B解析:[单选题]42.增加以下哪些超参数可能导致随机森林模型过拟合数据(1).决策树的数量;(2).决策树的深度;(3).学习率。A)(1)B)(2)C)(3)D)(2)、(3)答案:B解析:[单选题]43.以下描述不正确的是(__)。A)互动资源结算属于项目时间管理B)合同管理属于项目采购管理C)效绩报告属于项目沟通管理D)项目团队建设属于项目整体管理答案:D解析:[单选题]44.一般,K-NN最近邻方法在什么情况下效果好()A)样本较多但典型性不好B)样本较少但典型性较好C)样本呈团状分布D)样本呈链状分布注:最近邻属于分类算法,样本多而且典型性不好容易造成分类错误(尤其是在分类边界上的样本点)。样本分布对聚类算法的影响较大。答案:B解析:[单选题]45.下列关于数据转换,正确的是()A)json内的取值只能有统一格式B)pdf文件在不同平台上打开显示不同C)可以通过python将csv文件转换成Excel格式D)excel存储数据的量无限制答案:C解析:[单选题]46.逻辑回归的以下模型:P(y=1|x,w)=g(w0+w1x)其中g(z)是逻辑函数。在上述等式中,通过改变参数w可以得到的P(y=1|x;w)被视为x的函数。A)(0,inf)B)(-inf,0)C)(0,1)D)(-inf,inf)答案:C解析:对于从-∞到+∞的实数范围内的x的值。逻辑函数将给出(0,1)的输出。[单选题]47.下面选项中不是双目摄像头的内参的是()。A)焦距(Focallength)B)基础矩阵(Fundamentalmatrix)C)扭曲值(Distortion)D)光点中心(Opticalcenter)答案:B解析:[单选题]48.混合高斯聚类中,运用了以下哪种过程()A)EM算法B)集合运算C)密度可达D)样本与集合运算答案:A解析:[单选题]49.使用什么函数接收用输入的数据()。A)accept()B)input()C)readline()D)login()答案:B解析:[单选题]50.下面哪个属于映射数据到新的空间的方法?A)傅立叶变换B)特征加权C)渐进抽样D)维归约答案:A解析:[单选题]51.在支持向量机中,软间隔支持向量机的目标函数比硬间隔支持向量机多了一个()。A)偏置项bB)系数C)松弛变量D)两种情况的目标函数相同答案:C解析:[单选题]52.关于ZooKeeper临时节点的说法正确的是()A)创建临时节点的命令为:create-s/tmpmyvalueB)一旦会话结束,临时节点将被自动删除C)临时节点不能手动删除D)临时节点允许有子节点答案:B解析:[单选题]53.下列关于支持向量的说法,正确的是()。A)到分类超平面的距离最近的且满足一定条件的几个训练样本点是支持向量B)训练集中的所有样本点都是支持向量C)每一类样本集中都分别只有一个支持向量D)支持向量的个数越多越好答案:A解析:在支持向量机中,距离超平面最近的且满足一定条件的几,个训练样本点被称为支持向量。一般情况下,支持向量的个数等于训练样本数目,并不是越多越好。[单选题]54.下面关于SIFT特征描述错误的是()?A)具有尺度不变性B)具有旋转不变性C)检查的是图像中的极大极小值D)受光照变化影响大答案:D解析:[单选题]55.下面数据结构能够支持随机的插入和删除操作、并具有较好的性能的是A)链表和哈希表B)数组和链表C)哈希表和队列D)堆栈和双向队列答案:A解析:[单选题]56.在构造决策树时,以下哪种不是选择属性的度量的方法A)信息值B)信息增益C)信息增益率D)基尼指数答案:A解析:[单选题]57.学习器的实际预测输出与样本的真实输出之间的差异称为__。A)错误率B)精度C)误差D)查准率答案:C解析:[单选题]58.假正率是指(__)。A)正样本预测结果数/正样本实际数B)被预测为负的正样本结果数/正样本实际数C)被预测为正的负样本结果数/负样本实际数D)负样本预测结果数/负样本实际数答案:C解析:第2部分:多项选择题,共17题,每题至少两个正确答案,多选或少选均不得分。[多选题]59.关于决策树的CART分类树构造算法和ID3算法,下列说法正确的是?A)选择切分特征时,ID3算法使用基尼指数B)选择切分特征时,CART算法使用信息熵C)选择切分特征时,CART算法使用基尼指数来度量一个数据集的混乱程度D)选择切分特征时,ID3算法使用信息熵答案:CD解析:[多选题]60.下列关于BP网络说法正确的是(__)。A)标准BP算法每次仅针对一个训练样例更新连接权和阈值B)BP神经网络经常遭遇过拟合C)早停策略可用来缓解BP网络的过拟合问题D)晚停策略可用来缓解BP网络的欠拟合问题答案:ABC解析:[多选题]61.按标注活动的自动化程度,数据标注可以分为(__)。A)手工标注B)文本标注C)半自动标注D)自动标注答案:ACD解析:[多选题]62.下列关于AUC面积的描述,正确的是()。A)AUC被定义为ROC曲线下与坐标轴围成的面积B)AUC面积的值大于1C)AUC等于0.5时,则真实性最低,无应用价值D)AUC越接近1.0,检测方法真实性越高答案:ACD解析:AUC面积的值小于等于1。[多选题]63.影响K-Means聚类算法结果的主要因素有()A)样本顺序B)相似性度量C)初始聚类中心D)样本类别答案:BC解析:[多选题]64.以下有关特征数据归一化的说法,正确的是()。A)特征数据归一化加速梯度下降优化的速度B)特征数据归一化有可能提高模型的精度C)线性归一化适用于特征数值分化比较大的情况D)概率模型不需要做归一化处理答案:ABD解析:归一化方法比较适用在数值比较集中的情况。这种方法的缺陷是如果max和min不稳定,很容易使得归一化结果不稳定,使得后续使用效果也不稳定。实际使用中可以用经验常量值来替代max和min。非线性归一化经常用在数据分化比较大的场景,有些数值很大,有些很小。[多选题]65.下列算法属于深度学习的是()A)卷积神经网络B)循环神经网络C)决策树D)受限玻尔兹曼机答案:ABD解析:[多选题]66.下列关于随机森林说法正确的是(__)。A)随机森林是Bagging的一个扩展变体B)随机森林在决策树的训练过程中引入了随机属性选择C)随机森林简单且容易实现D)随机森林计算开销大答案:ABC解析:[多选题]67.P{H|X}是给定观测值X条件下H出现的概率,统称为(__)。A)先验概率B)后验概率C)条件概率D)模型答案:BC解析:[多选题]68.下列表示同一种学习方法的是(__)。A)集成学习B)多分类器系统C)基于委员会的学习D)平均策略答案:ABC解析:[多选题]69.对于机器学习中的原始数据,存在的问题可能有()。A)错误值B)重复C)异常值D)不完整答案:ABCD解析:[多选题]70.__是对关于单个学习器泛化性能的假设进行检验。A)二项检验B)t检验C)交叉验证t检验D)McNemar检验答案:AB解析:[多选题]71.下列属于原型聚类算法的是(__)。A)k均值算法B)学习向量量化C)高斯混合聚类密度聚类D)密度聚类答案:ABC解析:[多选题]72.数据能力的评价方法有哪些A)评价结果B)评价方法C)评价过程D)评价产品答案:AC解析:[多选题]73.给定两个特征向量,以下哪些方法可以计算这两个向量相似度()A)欧式距离B)夹角余弦C)信息熵D)曼哈顿距离答案:ABD解析:[多选题]74.关于Zookeeper客户端命令行操作,其中可以监听节点的命令有()A)ls-wpathB)create-wC)get-wpathD)set-w答案:AC解析:[多选题]75.基因遗传算法的组成部分包括()**A)初始化编码B)适应度函数C)选择D)交叉和变异答案:ABCD解析:第3部分:判断题,共16题,请判断题目是否正确。[判断题]76.随机梯度下降运行速度快,内存开销很小,可以支持使用海量数据集进行训练A)正确B)错误答案:对解析:[判断题]77.核函数的值等于将向量xi和xj使用函数K映射至H后,两个新向量的内积。A)正确B)错误答案:对解析:[判断题]78.梯度下降算法一定能收敛于全局最小值A)正确B)错误答案:错解析:[判断题]79.dropna()方法可以删除数据中所有的缺失值。A)正确B)错误答案:对解析:[判断题]80.对于PCA(主成分分析)转化过的特征,朴素贝叶斯的?不依赖假设?总是成立,因为所有主要成分是正交的,这个说法是:A)正确的B)错误的答案:错解析:这个说法是错误的,首先,?不依赖?和?不相关?是两回事,其次,转化过的特征,也可能是相关的.[判断题]81.选择切分特征时,ID3算法使用信息熵。A)正确B)错误答案:对解析:[判断题]82.强化学习在某种意义上可看作具有?延迟标记信息?的监督学习问题。A)正确B)错误答案:对解析:[判断题]83.专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用A)正确B)错误答案:对解析:[判断题]84.阶跃函数与sigmoid函数均为典型激活函数A)正确B)错误答案:对解析:[判断题]85.JupyterNotebook可以将文件保存为ipynb格式。A)正确B)错误答案:对解析:[判断题]86.迁移学习是指为了解决新领域训练样本较少无法训练而使用其他相近领域的训练成果迁移应用到新领域帮助训练学习的方法A)正确B)错误答案:对解析:[判断题]87.Pandas中的索引对象是可以修改的。A)正确B)错误答案:错解析:pandas中的索引对象是不可以修改的第4部分:问答题,共9题,请在空白处填写正确答案。[问答题]88.回归与分类的联系与区别是什么?答案:P102解析:[问答题]89.决策树学习的关键是如何选择最优划分属性。一般而言,随着划分过程不断进行,我们希望决策树的分支结点的_______越来越高答案:纯度解析:[问答题]90.试阐述LD

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论