人工智能机器学习技术练习(习题卷15)_第1页
人工智能机器学习技术练习(习题卷15)_第2页
人工智能机器学习技术练习(习题卷15)_第3页
人工智能机器学习技术练习(习题卷15)_第4页
人工智能机器学习技术练习(习题卷15)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试卷科目:人工智能机器学习技术练习人工智能机器学习技术练习(习题卷15)PAGE"pagenumber"pagenumber/SECTIONPAGES"numberofpages"numberofpages人工智能机器学习技术练习第1部分:单项选择题,共58题,每题只有一个正确答案,多选或少选均不得分。[单选题]1.基于二次准则函数的H-K算法较之于感知器算法的优点是()?A)计算量小B)可以判别问题是否线性可分C)其解完全适用于非线性可分的情况[单选题]2.关于梯度提升树,说法正确的是()A)梯度提升树中样本的权重是不等的B)梯度提升树只需构建一棵树C)梯度提升树回归可以跨越训练集中label的值范围[单选题]3.关于BP算法反向传播的说法正确的是()。A)BP算法反向传播进行更新时一般用到微积分的链式传播法则B)BP算法更新量与步长关系不大C)BP算法反向传播的预测误差值一般由真实标签值和预测标签值的差计算得来D)BP算法反向传播的目的是只对权值进行更新[单选题]4.卷积神经网络中说的梯度下降,是指()的梯度。A)参数本身B)激活函数C)损失函数D)图像大小[单选题]5.下面选项中t不是s的子序列的是A)s=<{2,4},{3,5,6},{8}>t=<{2},{3,6},{8}>B)s=<{2,4},{3,5,6},{8}>t=<{2},{8}>C)s=<{1,2},{3,4}>t=<{1},{2}>D)s=<{2,4},{2,4}>t=<{2},{4}>[单选题]6.假设我们使用kNN训练模型,其中训练数据具有较少的观测数据(下图是两个属性x、y和两个标记为?+?和?o?的训练数据)。现在令k=1,则图中的Leave-One-Out交叉验证错误率是多少?A)0%B)20%C)50%D)100%[单选题]7.DataFrame1和RDDR最大的区别()A)科学统计支持B)多了多schemaC)存储方式不一样D)外部数据源支持[单选题]8.考察一个由三个卷积层组成的CNN:kernel=3×3,stride=2,padding=SAME。最低层输出100个特征映射(featuremap),中间层200个特征映射,最高层400个特征映射。输入是200×300的RGB图片,总参数的数量是多少?()A)903400B)2800C)180200D)720400[单选题]9.以下对字典的说法错误的是()。A)字典可以为空B)字典的键不能相同C)字典的键不可变D)字典的键的值不可变[单选题]10.()的基本想法是适当考虑一部分属性间的相互依赖信息,从而既不需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系。A)贝叶斯判定准则B)贝叶斯决策论C)朴素贝叶斯分类器D)半朴素贝叶斯分类器[单选题]11.()是预测一个数量(连续型),属于监督学习A)分类B)回归C)聚类D)强化学习[单选题]12.以下哪种方法不属于特征选择的标准方法:A)嵌入B)过滤C)包装D)抽样[单选题]13.类域界面方程法中,不能求线性不可分情况下分类问题近似或精确解的方法是?A)伪逆法B)感知器算法C)基于二次准则的H-K算法D)势函数法[单选题]14.下列哪种算法可以用神经网络构建?1K-NN最近邻算法;2线性回归;3逻辑回归。A)1and2B)2and3C)1,2and3D)Noneoftheabove[单选题]15.抖动技术可以?A)改善图像的空间分辨率;B)改善图像的幅度分辨率;C)利用半输出技术实现;D)消除虚假轮廓现象;[单选题]16.在下面给出的三个残差图中,下面哪一个代表了与其他模型相比更差的模型?注意:1/所有的残差都已经标准化2/图中横坐标是预测值,纵坐标是残差A)1B)2C)3D)无法比较[单选题]17.以下哪项是非线性降维方法A)PCA(主成分分析)B)LDA(线性判别)C)ICA(独立成分分析)D)KPCA(核化线性降维)[单选题]18.()算法的训练数据集既有特征,又有标签A)有监督学习B)半监督学习C)无监督学习D)强化学习[单选题]19.zookeeper的作用不包括()。A)分布式配置同步B)加强集群稳定性C)对Task执行进行调度D)加强集群持续性[单选题]20.数据科学是一门以实现?从数据到信息??从数据到知识??从数据到智慧?的转化为主要研究目的,以?数据驱动??数据业务化??数据洞见??数据产品研发?为主要研究任务的()。A)新兴科学B)交叉性学科C)独立学科D)一整套知识体系[单选题]21.卷积神经网络中的dropout模块的作用是()。A)防止结果发散B)防止梯度消失C)防止报错D)防止过拟合[单选题]22.Zookeeper-Stat结构体中numChildren是()A)znode数据变化号B)znode访问控制列表的变化号C)znode子节点数量D)znode的数据长度[单选题]23.()是指过滤器在图像上滑动的距离。A)卷积核大小B)卷积步长C)过滤器大小D)图像大小[单选题]24.符号集a、b、c、d,它们相互独立,相应概率为1/2、1/4、1/8、1/16,其中包含信息量最小的符号是()A)aB)bC)cD)d[单选题]25.做卷积运算的缺点是,卷积图像的大小会不断缩小,另外图像的左上角的元素只被一个输出所使用,所以在图像边缘的像素在输出中采用较少,也就意味着你丢掉了很多图像边缘的信息。为了解决这个问题,在卷积过程中引入了()。A)poolingB)paddingC)convolutionD)FC[单选题]26.下面关于回归过程的说法,错误的是A)收集数据:采用任意方法收集数据B)分析数据:绘出数据的可视化二维图将有助于对数据做出理解和分析,在采用缩减法求得新回归系数之后,可以将新拟合线绘在图上作为对比C)训练算法:找到回归系数D)用算法:使用回归,可以在给定输入的时候预测出一个数值,这是对分类方法的提升,因为这样只可以预测连续型数据[单选题]27.半监督学习不包括A)直推学习B)纯半监督学习C)主动学习D)图半监督学习[单选题]28.在选择神经网络的深度时,下面哪些参数需要考虑?1神经网络的类型(如MLP,CNN);2输入数据;3计算能力(硬件和软件能力决定);4学习速率;5映射的输出函数.A)1,2,4,5B)2,3,4,5C)都需要考虑D)1,3,4,5[单选题]29.知识图谱是由()演化而来。[]*A)符号主义B)认知主义C)联结主义D)行为主义[单选题]30.机器学习从不同的角度,有不同的分类方式,以下哪项不属于按系统学习能力分类的类别______。A)监督学习B)无监督学习C)弱监督学习D)函数学习[单选题]31.下面对线性模型中偏置值b的说法正确的是(__)。A)无任何意义B)决定超平面的位置C)决定的超平面的方向D)是样本点到超平面上的映射[单选题]32.以下几种模型方法属于判别式模型的有1)混合高斯模型2)条件随机场模型3)区分度训练4)隐马尔科夫模型A)1,4B)3,4C)2,3D)1,2[单选题]33.()试图学得一个属性的线性组合来进行预测的函数。A)决策树B)贝叶斯分类器C)神经网络D)线性模型[单选题]34.进行主成分分析的前提条件是各变量间()。A)高度相关B)低度相关C)相互独立D)完全相关[单选题]35.下列关于数据标准化的说法中,不正确的是()A)Z-Score标准化适用于特征最大值和最小值未知,数据较分散的情况B)聚类算法要求数据集无量纲化C)Logistic标准化函数σ(x)满足σ(0)=1D)Min-Max标准化易受离群值影响[单选题]36.以下不属于影响聚类算法结果的主要因素有()A)已知类别的样本质量B)分类准则C)特征选取D)模式相似性测度[单选题]37.F1参数的大小反映了模型的(__)。A)准确度B)误差C)稳定性D)偏差[单选题]38.10.基于层次的聚类算法包括()。A)合并的层次聚类B)基于密度的聚类算法C)基于划分的算法D)基于网络的聚类算法[单选题]39.当不知道数据所带标签时,可以使用()促使带同类标签的数据与带其他标签的数据相分离。A)分类B)聚类C)关联分析D)隐马尔可夫链[单选题]40.zookeeper节点的特性()A)可以存储数据B)不可以存储数据C)可以计算数据D)可以协调数据[单选题]41.为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究者找到一个重要的信息处理的机制是()A)专家系统B)人工神经网络C)模式识别D)智能代理[单选题]42.()的主要目的是提升数据质量,将数据形态更加符合某一算法需求,进而提升数据计算的效果和降低其复杂度。A)数据加工B)数据分析C)数据挖掘D)数据处理[单选题]43.()选择成为支持向量机的最大变数。A)核函数B)样本空间C)模型D)算法[单选题]44.做一个二分类预测问题,先设定阈值为0.5,概率大于等于0.5的样本归入正例类(即1),小于0.5的样本归入反例类(即0)。然后,用阈值n(n>0.5)重新划分样本到正例类和反例类,下面哪一种说法正确是()1.增加阈值不会提高召回率2..增加阈值会提高召回率3..增加阈值不会降低查准率4.增加阈值会降低查准率A)1B)2C)1、3D)2、4[单选题]45.选择哪一个解作为输出,将由学习算法的归纳偏好决定,常见的做法是引人()。A)线性回归B)线性判别分析C)正则化项D)偏置项[单选题]46.一阶规则的基本成分是A)原子命题B)谓词C)量词D)原子公式[单选题]47.马尔可夫随机场是典型的马尔可夫网,这是一种著名的(__)模型。A)无向图B)有向图C)树形图D)环形图[单选题]48.可用作数据挖掘分析中的关联规则算法有()。A)机器学习、对数回归、关联模式B)K均值法、SOM机器学习C)Apriori算法、FP-Tree算法D)RBF机器学习、K均值法、机器学习[单选题]49.一般来说,下列哪种方法常用来预测连续独立变量?A)线性回归B)逻辑回顾C)线性回归和逻辑回归都行D)以上说法都不对[单选题]50.以下对大数据?涌现?描述不正确的是()。A)安全涌现是大数据涌现现象B)小数据可能没价值,但是小数据组成的大数据却很有价值,这叫做价值涌现C)小数据可能质量没问题,但是大数据质量会出现问题这叫质量涌现D)小数据可能不涉及隐私,但是大数据可能严重威胁个人隐私,这叫隐私涌现[单选题]51.让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,就是()?A)监督学习B)倍监督学习C)半监督学习D)无监督学习[单选题]52.贝叶斯网借助(__)来刻画属性之间的依赖关系。A)有向图B)无环图C)有向无环图D)欧拉图[单选题]53.()是一种处理时序数据的神经网络,常用于语音识别,机器翻译等领域。[]*A)前馈神经网络B)卷积神经网络C)循环神经网络D)对抗神经网络[单选题]54.电影投资金额和电影收入之间的关系可以用一个一元线性回归方程来表示,下列说法正确的是()。A)投资越多收入越少B)投资越少收入越多C)投资越多收入越多D)投资和收入的关系不确定[单选题]55.Softmax算法中温度趋近于0时Softmax将趋于A)仅探索B)仅利用C)全探索D)全利用[单选题]56.数据治理任务通常有三个部分不包含(__)。A)主动定义或序化规则B)接触数据的业务流程C)为数据利益相关者提供持续D)跨界的保护、服务和应对并解决因不遵守规则而产生的问题[单选题]57.(__)不是常用的噪声处理方法。A)聚类B)回归C)分类D)分箱[单选题]58.考虑如下数据集,其中CustomerID(顾客id),TransactionID(事务id),ItemsBought(购买项)。如果将每个事务id看成一个购物篮,计算项集{e},{b,d},{b,D,e}的支持度:A)s({e})=0.8s({b,d})=0.2s({b,D,e})=0.2B)s({e})=0.7s({b,d})=0.3s({b,D,e})=0.3C)s({e})=0.6s({b,d})=0.4s({b,D,e})=0.3D)s({e})=0.8s({b,d})=0.1s({b,D,e})=0.1第2部分:多项选择题,共21题,每题至少两个正确答案,多选或少选均不得分。[多选题]59.支持向量机是一类模型的统称,通常包括A)线性支持向量机B)线性非可分向量机C)线性可分支持向量机D)非线性支持向量机[多选题]60.以下能力中,数据工程师需要具备的能力或素质是()。A)数据洞见B)数据的ETL操作C)数据的备份与恢复D)主数据管理及数据集成[多选题]61.关于K均值和DBSCAN的比较,以下说法正确的是()A)K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念B)K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇。C)K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇D)K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象[多选题]62.从复杂度和价值高低两个维度,可以将数据分析分为(__)。A)描述性分析B)诊断性分析C)预测性分析D)规范性分析[多选题]63.常用于K近邻算法中的距离度量方法有()A)欧式距离B)曼哈顿距离C)闵可夫斯基距离D)海明距离[多选题]64.以下哪些滤波器能在卷积窗口的边界上使卷积掩膜中心像素和它的4-邻接点的系数降至0附近。A)同态滤波B)高斯滤波C)巴特沃斯滤波D)中值滤波[多选题]65.下列属于无监督学习的有()A)聚类B)分类C)回归D)降维[多选题]66.关于贝叶斯网的结构描述正确的为A)有效表达了属性件的条件独立性;B)给定了父结点集;C)同父,顺序和V型结构为主要涉及的技术;D)所有属性之间相互独立;[多选题]67.下面属于线性分类方法的是()A)Logistic回归B)决策树C)最近邻D)Fisher鉴别[多选题]68.下列关于支持向量的说法错误的是(__)。A)支持向量回归机的支持向量落在它规定的间隔带之内B)支持向量回归机的支持向量落在它规定的间隔带之外C)支持向量回归机的支持向量只占训练集的一部分D)训练集中的全部样本都是支持向量[多选题]69.以下对数据描述正确的是()。A)数据是现实世界的记录B)数据是人类社会赖以生存的和发展的三大资源之一C)数据分为显性数据和隐性数据D)数据是对信息进行计量和记录而产生的记录[多选题]70.随机森林相比决策树的优点有()A)对离群点更加鲁棒B)准确率更高C)泛化误差收敛D)大型数据集上更加有效[多选题]71.如将A、B、C三个分类器的PR曲线画在一个图中,其中A、B的PR曲线可以完全包含住C的PR曲线,A与B的PR曲线有交点,A、B、C的平衡点分别为0.79、0.66、0.58,以下说法中正确的是()。A)学习器A的性能优于学习器CB)学习器A的性能优于学习器BC)学习器B的性能优于学习器CD)学习器C的性能优于学习器B[多选题]72.下列方法中,解决欠拟合的方法有哪些()A)正则化方法B)集成学习方法C)添加新特征D)减少正则化系数[多选题]73.数据科学的基本流程包含(__)。A)数据可视化B)数据加工C)数据化D)数据洞见[多选题]74.关于回归算法,下列说法正确的是()A)线性回归可以让预测值跨越训练集中label的范围B)KNN回归可以让预测值跨越训练集中label的范围C)KNN在预测异常样本时是有效的。D)线性回归使用梯度下降法来进行学习。[多选题]75.数据战略等于(__)之?和?。A)数据管理目标B)行动方案C)目标管理D)动态机制第3部分:判断题,共12题,请判断题目是否正确。[判断题]76.在解决函数优化问题时,基因遗传算法的全局性不好,容易陷入局部最优值A)正确B)错误[判断题]77.?独依赖估计?是半朴素贝叶斯分类器最常用的一种策略A)正确B)错误[判断题]78.贝叶斯分类器在推断阶段使用训练数据学习后验概率A)正确B)错误[判断题]79.基于VC维和Rademacher复杂度推导泛化误差界,所得到的结果均与具体学习算法无关,对所有学习算法都适用A)正确B)错误[判断题]80.逻辑回归是通过回归的思想来解决分类问题的算法A)正确B)错误[判断题]81.基于Rademacher复杂度的泛化误差界是是分布无关、数据独立的A)正确B)错误[判断题]82.Pandas中利用merge函数合并数据表时默认的是内连接方式。A)正确B)错误[判断题]83.误差逆传播算法(BP)仅可用于多层前馈神经网络的学习算法A)正确B)错误[判断题]84.机器学习的目标是使计算机能模拟人的学习行为,自动地通过学习来获取知识和技能,不断改善性能,实现自我完善A)正确B)错误[判断题]85.信息增益即数据集的熵与在特征条件下的条件熵之差。信息增益越大,说明条件克服的不确定性越大,具有更强的分类能力A)正确B)错误[判断题]86.同一个列表中的元素的数据类型可以各不相同。A)正确B)错误[判断题]87.FOIL不支持函数和逻辑表达式嵌套A)正确B)错误第4部分:问答题,共9题,请在空白处填写正确答案。[问答题]88.在现实生活中朴素贝叶斯分类器有多种使用方式,若任务数据更替频繁,则可以采用()方式,先不进行任何训练,待收到预测请求后再根据当前数据进行概率估值[问答题]89.可看作学习算法在给定数据和参数空间上的实例化[问答题]90.随机森林的基本思想包括()()[问答题]91.C4.5算法,在决策树生成过程中,以______为特征选择的准则。[问答题]92.是否可以对三分问题应用逻辑回归算法?A)是B)否[问答题]93.剪枝处理分为_____和______,前者使得决策树的很多分支都没有展开,降低过拟合的风险,但也容易带来欠拟合的风险,后者使得决策树完全展开,泛化性能往往优于前者,但训练和测试时间长。[问答题]94.在学习任务的真实边界比较复杂时,用决策树解决会相当复杂,此时采用__________,可以实现斜划分甚至更复杂的划分形式。[问答题]95.LineaRegression类中的调用方法为fit(x,y,sample_weight=None),传入的参数x、y和sample_weight分别是(),()和()类型。[问答题]96.聚类结果()高且()低。[多选题]97.机器学习包含下列哪几种训练学习方法?A)监督学习B)混合学习C)半监督学习D)无监督学习[多选题]98.以下可以有效解决过拟合的方法是:()A)增加样本数量B)增加特征数量C)训练更多的迭代次数D)采用正则化方法[多选题]99.下列关于支持向量机的说法正确的是(__)。A)支持向量机的学习策略是间隔最大化B)支持向量机的基本模型是特征空间上间隔最大的线性分类器C)支持向量机只能对线性可分的样本进行分类D)传统支持向量机只能求解二分类问题[多选题]100.规整数据(TidyData)应满足的基本原则有()。A)每个实体占且仅占一个关系(表)。B)每个观察占且仅占一行。C)每个变量占且仅占一列。D)每一类观察单元构成一个关系(表)。1.答案:B解析:2.答案:A解析:3.答案:A解析:4.答案:C解析:5.答案:C解析:6.答案:D解析:本题考查的是kNN算法和Leave-One-Out交叉验证。KNN算法是标记类算法,取当前实例最近邻的k个样本,k个样本中所属的最多类别即判定为该实例的类别。本题中k=1,则只需要看最近邻的那一个样本属于?+?还是?o?即可。Leave-One-Out交叉验证是一种用来训练和测试分类器的方法,假定数据集有N个样本,将这个样本分为两份,第一份N-1个样本用来训练分类器,另一份1个样本用来测试,如此迭代N次,所有的样本里所有对象都经历了测试和训练。分别对这10个点进行观察可以发现,每个实例点最近邻的都不是当前实例所属的类别,因此每次验证都是错误的。整体的错误率即为100%。7.答案:B解析:8.答案:A解析:9.答案:D解析:10.答案:D解析:11.答案:B解析:12.答案:D解析:13.答案:B解析:14.答案:B解析:1.KNN是关于距离的学习算法,没有任何参数,所以无法用神经网络构建。2.神经网络实现最小二乘法。3.逻辑回归相当于一层的神经网络。15.答案:D解析:16.答案:C解析:17.答案:D解析:18.答案:A解析:19.答案:C解析:20.答案:C解析:21.答案:D解析:22.答案:C解析:23.答案:B解析:24.答案:A解析:25.答案:B解析:26.答案:D解析:27.答案:C解析:28.答案:C解析:29.答案:A解析:30.答案:D解析:31.答案:B解析:32.答案:C解析:33.答案:D解析:34.答案:B解析:35.答案:C解析:36.答案:A解析:37.答案:C解析:38.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论