




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1人工智能基础知识科普考试题库400题(供参考)一、单选题1.C5.0和QUEST决策树只能处理()目标值的问题。A、随机型B、连续型C、离散型D、分类型答案:D2.事务对数据对象加锁后拥有何种控制权是由封锁的()决定的。A、状态B、类型C、种类D、属性答案:B3.1999年,第一款集成了硬件3D加速单元的GPU是由哪个公司发布?A、MicrosoftB、intelC、NVIDIAD、AMD答案:C解析:重大事件4.Apriori算法主要使用标准的发现关联规则的步骤,先发现数据中的(),然后从中产生关联规则。A、聚类数据集B、中位数C、拟合数据集D、频繁项目集答案:D5.神经网络研究属于下列哪个学派A、符号主义B、连接主义C、行为主义D、其他选项均不对答案:B解析:神经网络研究属于连接主义学派6.数据挖掘技术包括三个主要的部分()。A、数据、模型、技术B、算法、技术、领域知识C、数据、建模能力、算法与技术D、建模能力、算法与技术、领域知识答案:C7.简单遗传算法的遗传操作主要有三种:选择操作,交叉操作,()操作A、连接B、复制C、变异D、结合答案:C8.下列哪个不是人工智能的研究领域()。A、机器证明B、模式识别C、人工生命D、编译原理答案:D解析:编译原理是程序设计语言研究的内容。9.人工智能产业三大要素是技术产品、改造提升行业融合和()。A、算法运算B、云计算C、深度学习D、集成应用答案:D10.下列哪部分不是专家系统的组成部分A、用户B、综合数据库C、推理机D、知识库答案:A解析:专家系统的组成部分是综合数据库、推理机、知识库11.新一代人工智能关键共性技术的研发部署要以()为核心,以数据和硬件为基础,以提升感知识别、知识计算、认知推理、运动执行、人机交互能力为重点A、软件B、算力C、云平台D、算法答案:D解析:新一代人工智能关键共性技术的研发部署要以算法为核心,以数据和硬件为基础,以提升感知识别、知识计算、认知推理、运动执行、人机交互能力为重点12.下列不是知识表示法的是()A、计算机表示法B、“与/或”图表示法C、状态空间表示法D、产生式规则表示法答案:A13.规则学习的目标是产生一个能覆盖尽可能多的样例的规则集,最直接的做法是()A、序贯覆盖B、剪枝优化C、假设验证D、预测分布答案:A14.趋势可以是线性的,也可以是()。A、曲线性的B、正态性的C、非线性的D、离散性的答案:C15.关于python编程语言,下列描述正确的是A、Python中整型有限制大小B、append函数用于给列表增加元素C、del用于删除变量D、Python中列表无法嵌套答案:C解析:Python中的del语句作用是删除变量,其对整型无限制,append()函数用于在列表末尾添加新的对象,Python中列表可嵌套16.讨论变量之间的关系,主要有三个方法:()、方差分析和回归分析A、参数分析B、逻辑分析C、假设分析D、相关分析答案:D17.()是利用样本的实际资料计算统计量的取值,并以引来检验事先对总体某些数量特征的假设是否可信作为决策取舍依据的一种统计分析方法A、假设检验B、逻辑分析C、方差分析D、回归分析答案:A18.对没有标签的数据进行分类的问题属于机器学习中哪一类问题()。A、回归B、分类C、聚类D、强化答案:C解析:聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。19.信念传播算法将变量消去法中的求和操作看作一个()过程,较好地解决了求解多个边际分布时的重复计算问题。A、消息传递B、消息累加C、消息分辨D、以上都对答案:A20.通过迭代优化来近似求解的是()A、学习向量量化B、k均值算法C、高斯混合聚类D、以上都不对答案:B21.下列不属于特征降维的作用是A、降低时间复杂度和空间复杂度B、较简单的模型在小数据集上有更强的鲁棒性C、提升模型效果D、降低算法的计算开销答案:B22.()是数据库管理系统运行的基本工作单位。A、事务B、数据仓库C、数据单元D、D数据分析答案:A23.专家系统是一个复杂的智能软件,它处理的对象是用符号表示的知识,处理的过程是()的过程。A、思维B、思考C、推理D、递推答案:C24.若A与B是任意的两个事件,且P(AB)=P(A)·P(B),则可称事件A与B()。A、等价B、互不相容C、相互独立D、相互对立答案:D25.()是将比较复杂的问题划分为若干阶段,通过逐段求解,最终求得全局最优解A、线性规划B、整数规划C、多目标规划D、动态规划答案:D26.超市收银员用扫描器直接扫描商品的条形码,商品的价格信息就会呈现出来,这主要利用了人工智能中的()技术。A、智能代理B、模式识别C、机器翻译D、专家系统答案:B解析:扫描条形码应该是应用了模式识别中的图像识别技术。27.对零次数据进行初步加工,不包括()A、清洗B、变换C、集成D、脱敏答案:D28.分布式人工智能研究核心领域是()A、专家系统B、分散控制C、Agent(爱真体)D、互联网答案:C29.根据机器智能水平由低到高,正确的是()A、计算智能、感知智能、认知智能B、计算智能、感应智能、认知智能C、机器智能、感知智能、认知智能D、机器智能、感应智能、认知智能答案:A解析:机器智能水平由低到高依次是:计算智能、感知智能、认知智能30.语言模型的参数估计经常使用MLE(最大似然估计)。面临的一个问题是没有出现的项概率为0,这样会导致语言模型的效果不好。为了解决这个问题,需要使用()A、平滑B、去噪C、随机插值D、增加白噪音答案:A31.如果在大型数据集上训练决策树。为了花费更少的时间来训练这个模型,下列哪种做法是正确的A、增加树的深度B、增加学习率C、减少树的数量D、减小树的深度答案:D解析:一般用决策树进行分类,从根结点开始,对实例的某一特征进行测试,根据测试结果,将实例分配到其子结点。这时,每一个子结点对应着该特征的一个取值。如此递归地对实例进行测试并分类,直至达到叶结点。最后将实例分到叶结点的类中。——引自李航《统计学习方法》决策树深度越深,在训练集上误差会越小,准确率越高。但是容易造成过拟合,而且增加模型的训练时间。对决策树进行修剪,减小树的深度,能够提高模型的训练速度,有效避免过拟合。单决策树中,学习率不是一个有效参数。决策树是单树,随机森林由多个决策树组成。32.()的特点是使用先验知识来分析或解释每个训练样本,以推理出样本哪些特征与目标函数相关或不相关。A、遗传算法B、分析学习C、归纳学习D、贝叶斯学习答案:B33.朴素贝叶斯算法属于()A、无监督学习B、半监督学习C、强化学习D、有监督学习答案:D解析:朴素贝叶斯算法属于有监督学习34.二项分布的数学期望为()。A、n(1-n)pB、np(1-p)C、npD、n(1-p)答案:C35.1955年,麦卡锡、明斯基、香农和诺切斯特四位学者首次提出“artificialintelligence(人工智能)”这个概念时,希望人工智能研究的主题是A、避免计算机控制人类B、全力研究人类大脑C、人工智能伦理D、用计算机来模拟人类智能答案:D36.贝叶斯网络是基于概率推理的()模型。A、数据B、数学C、判断D、图形答案:B37.下列哪部分不是专家系统的组成部分()。A、用户B、综合数据库C、推理机D、知识库答案:A38.()问题更接近人类高级认知智能,有很多重要的开放问题。A、自然语言处理B、计算机视觉C、语音识别D、知识图谱答案:A解析:自然语言处理问题更接近人类高级认知智能,有很多重要的开放问题。39.在方差分析中,()反映的是样本数据与其组平均值的差异。A、总离差B、组间误差C、抽样误差D、组内误差答案:D40.从方法论角度看,基于统计的数据分析方法可分为哪两个不同层次。A、基本分析方法元分析方法B、线性分析方法元分析方法C、基本分析方法线性分析方法D、时间序列分析方法线性分析方法答案:A41.物联网为人工智能的()提供了基础设施环境,同时带来了多维度、及时全面的海量训练数据。A、应用层B、感知层C、数据层D、以上都是答案:B解析:物联网为人工智能的感知层提供了基础设施环境,同时带来了多维度、及时全面的海量训练数据。42.最初的决策树算法是心理学家兼计算机科学家EBHunt1962年在研究人类的概念学习过程时提出的CLS,这个算法确立了决策树()的学习策略A、分而治之B、合而治之C、自下而上D、自上而下答案:A43.人工智能从其应用范围上又可分为()。A、ANI与AGIB、ANI与AIC、AGI与VRD、AI与VR答案:A解析:人工智能从其应用范围上又可分为ANI与AGI。44.在图灵测试中,如果有超过()的测试者不能分清屏幕后的对话者是人还是机器,就可以说这台计算机通过了测试并具备人工智能.A、30%B、40%C、50%D、60%答案:A45.我国《新一代人工智能发展规划》中规划,到()年成为世界主要人工智能创新中心。A、2020B、2025C、:D、2030E、2035答案:C解析:《国务院关于印发新一代人工智能发展规划》二、总体要求:(三)战略目标提到46.假设使用逻辑回归进行n多类别分类,使用One-vs-rest分类法。下列说法正确的是?()A、对于n类别,需要训练n个模型B、对于n类别,需要训练n-1个模型C、对于n类别,只需要训练1个模型D、以上说法都不对答案:A47.()算法是一种最有影响的挖掘关联规则频繁项目集的算法A、FP-growthB、EClatC、聚类D、Apdori答案:D48.专家系统是以为基础,以推理为核心的系统。A、专家B、软件C、知识D、解决问题答案:C49.在数据加工过程中,将特征值按比例缩小,使之落入一个特定的区间的方法是()A、标准化B、平滑处理C、特征构造D、聚集答案:A50.()主要提供内存计算框架A、Spark核心层B、资源计算层C、服务核心层D、Spark层答案:A51.避免由于过拟合造成貌似线性可分的结果,一个解决的办法是允许支持向量机在一些样本上出错,为此引入()的概念。A、软间隔B、正则化C、硬间隔D、核函数答案:A52.以下技术中,不属于人工智能技术的是()A、自动计算,通过编程计算456*457*458*459的值B、文字识别,如通过OCR快速获得的图像中出汉字,保存为文本C、语音输入,通过话筒将讲话内容转成文本D、麦克风阵列,如利用灵云该技术实现远场语音交互的电视答案:A解析:自动计算不属于人工智能技术。53.随着集成中个体分类器(相互独立)数目T的增大,集成的错误率将呈()下降,最终趋向于零A、指数级B、对数级C、线性级D、平方级答案:A54.在已知模型的环境中学习称为()。A、已知模型学习B、有模型学习C、模型学习D、学习模型答案:B55.()是指能够按照人的要求,在某一个领域完成一项工作或者一类工作的人工智能。A、超人工智能B、强人工智能C、弱人工智能D、人工智能答案:C56.将数值类型的属性值(如年龄)用区间标签(例如0~18、19-44、45~59和60~100等)或概念标签,称为数据()处理。A、离散化B、标准化C、特征构造D、聚集答案:A57.在专家系统的开发过程中使用的专家系统工具一般分为专家系统的和通用专家系统工具两类。A、模型工具B、外壳C、知识库工具D、专用工具答案:B58.数据管理以()活动为基础。A、数据分析B、数据处理C、数据预处理D、数据可视化答案:C59.测试集应尽可能与训练集A、相容B、相等C、互斥D、包含答案:C解析:测试集来测试学习器对新样本的判别能力,然后以测试集上的测试误差作为泛化误差的近似,测试集应该尽可能与训练集互斥,即测试样本尽量不在训练集中出现、未在训练过程中使用过60.在有监督学习中,我们如何使用聚类方法?①我们可以先创建聚类类别,然后在每个类别上用监督学习分别进行学习②我们可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习③在进行监督学习之前,我们不能新建聚类类别④我们不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习A、②和④B、①和②C、③和④D、①和③答案:B61.以下哪种模型是自然语言处理后Bert时代的预训练模型()A、Word2VecB、RNNC、XLNetD、LSTM答案:C解析:XLNet是自然语言处理后Bert时代的预训练模型62.()算法是决策树学习的基本算法,其他多数决策树学习方法都是它的变体A、Find-S算法B、KNN算法C、概念算法D、ID3算法答案:D63.以下关于机器学习说法错误的是A、机器学习可以解决图像识别问题B、目前机器学习已经可以代替人类C、机器学习在一定程度上依赖于统计学习D、监督学习和非监督学习都属于机器学习答案:B64.神经网络中最基本的成分是()模型。A、神经元B、阈值C、兴奋D、节点答案:A65.下列属于无监督学习的模型是()A、k-meansB、线性回归C、神经网络D、决策树答案:A解析:k-means是聚类,属于无监督学习。66.下列哪项不是构建知识图谱用到的主要技术()A、词性标注B、实体链接C、关系抽取D、命名实体识别答案:A解析:词性标注不是构建知识图谱用到的主要技术67.机器学习中L1正则化和L2正则化的区别是?()A、使用L1可以得到稀疏的权值,使用L2可以得到平滑的权值B、使用L1可以得到平滑的权值,使用L2可以得到平滑的权值C、使用L1可以得到平滑的权值,使用L2可以得到稀疏的权值D、使用L1可以得到稀疏的权值,使用L2可以得到稀疏的权值答案:A68.有统计显示,在未来,非结构化数据的占比将达到()以上。A、0.6B、0.7C、0.8D、0.9答案:D69.以下哪类算法属于关联分析()。A、决策树B、Apriori算法C、EMD、K-Mean答案:B70.一般来说,下列哪种方法常用来预测连续独立变量?A、线性回归B、逻辑回归C、线性回归和逻辑回归都行D、以上说法都不对答案:A解析:线性回归实数预测。逻辑回归分类71.随机试验所有可能出现的结果,称为()A、基本事件B、样本C、全部事件D、样本空间答案:D72.时间序列分析方法的选择,主要取决于需要解决的问题,以及时间序列的()。A、特点B、离散度C、聚合度D、线性关系答案:A73.()是人工智能地核心,是使计算机具有智能地主要方法,其应用遍及人工智能地各个领域。A、深度学习B、机器学习C、人机交互D、智能芯片答案:B74.用于相似度度量的距离()要满足距离度量的所有基本性质A、一定B、不一定C、可能D、以上都不对答案:B75.以下哪一个不属于人脸识别技术?A、人脸搜索B、人脸比对C、人脸检测D、翻拍识别答案:D76.按标注活动的自动化程度,以下()不属于数据标注的类别。A、手工标注B、自动化标注C、半自动化标注D、半手工标注答案:D77.不属于人工智能的学派是()A、符号主义B、机会主义C、行为主义D、连接主义答案:B解析:不属于人工智能的学派是机会主义78.SOM网络是一种()的无监督神经网络,它能将高维输入数据映射到低维空间。A、竞争学习型B、增量学习型C、在线学习型D、匹配学习型答案:A79.回归分析的任务,就是根据()和因变量的观察值,估计这个函数,并讨论与之有关的种种统计推断的问题A、相关变量B、样本C、已知数据D、自变量答案:D80.进入21世纪以来,随着数据的爆发式增长,计算能力的大幅度提升和深度学习的发展和成熟,人工智能迎来了()发展浪潮A、第一次B、第二次C、第三次D、第四次答案:C解析:进入21世纪以来,随着数据的爆发式增长,计算能力的大幅度提升和深度学习的发展和成熟,人工智能迎来了第三次发展浪潮81.人工智能发展的第三次热潮,是从以下哪个时间段开始的()A、2000年后B、2006年后C、2012年后D、2015年后答案:B解析:1956年达特茅斯会议提出人工智能的概念,人工智能的第一次热潮出现;1980年专家系统和人工神经网络出现,兴起第二次浪潮;2006年深度学习正式定义,第三次浪潮兴起82.以下()属于数据统计方法中的离中趋势分析。A、数值平均数B、位置平均数C、离散系数D、线性相关答案:C83.一般来讲,下列语言属于人工智能语言的是。A、VBB、PascalC、LogoD、Prolog答案:D84.()是自然语言处理的重要应用,也可以说是最基础的应用。A、文本识别B、机器翻译C、文本分类D、问答系统答案:C解析:文本分类问题算是自然语言处理领域中一个非常经典的问题.根据预定义的类别不同,文本分类分两种:二分类和多分类,85.在数据科学项目的活动流程中,()主要回答的是“我们用什么方式记录和展现数据结果”。A、数据的获得与管理B、模式/模型的验证和优化C、结果的可视化与文档化D、模式/模型的应用及维护答案:C86.以下选项不是聚类算法的是()A、分层聚类B、K平均值聚类C、两步聚类D、离散聚类答案:D87.维利昂特在1984年发表的论文创立了()研究领域,使机器学习有了坚实的数学基础,扫清了学科发展的障碍。A、计算学习理论B、机器学习理论C、机器科学理论D、机器数据理论答案:A88.下面关于RandomForest和GradientBoostingTrees说法正确的是?()A、RndomForest的中间树不是相互独立的,而GrdientBoostingTrees的中间树是相互独立的B、两者都使用随机特征子集来创建中间树C、在GradientBoostingTrees中可以生成并行树,因为它们是相互独立的D、无论任何数据,GraientBoostingTrees总是优于RanomFores答案:B89.()聚类算法采用概率模型来表达聚类原型。A、K均值算法B、学习向量量化C、高斯混合聚类答案:C90.下列核函数特性描述错误的是A、只要一个对称函数所对应的核矩阵半正定,就能称为核函数B、核函数选择作为支持向量机的最大变数C、核函数将影响支持向量机的性能D、核函数是一种降维模型答案:D解析:只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用.事实上,对于一个半正定核矩阵,总能找到一个与之对应的映射,任何一个核函数都隐式地定义了一个称为“再生核希尔伯特空间”的特征空间,我们希望样本在特征空间内线性可分,因此特征空间的好坏对支持向量机的性能至关重要,在不知道特征映射的形式时,我们并不知道什么样的核函数是合适的,而核函数也仅是隐式地走义了这个特征空间,于是,“核函数选择”成为支持向量机的最大变数91.()是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。A、机器学习B、深度学习C、有监督学习D、无监督学习答案:A解析:机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。92.2018年开发者大会,百度发布了国内首款云端通用AI处理器()。A、百度鸿鹄B、百度昆仑C、百度灵云D、百度鸿基答案:B解析:2018年开发者大会,百度发布了国内首款云端通用AI处理器是百度昆仑。93.关于人工智能的发展历史下列说法中不正确的是()。A、其发展阶段经历了三次大的浪潮。B、第一次是50-60年代注重逻辑推理的机器翻译时代。C、人工智能的概念形成于20世纪40年代。D、第二次是70-80年代依托知识积累构建模型的专家系统时代。答案:C解析:人工智能的概念形成于20世纪60年代。94.OLAM技术一般简称为”数据联机分析挖掘”,下面说法正确的是:()A、OLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性B、由于OLAM的立方体和用于OLAP的立方体有本质的区别C、基于WEB的OLAM是WEB技术与OLAM技术的结合D、OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作答案:D95.新一代调度技术支持系统以运行控制平台、()两种平台协同为支撑。A、云计算平台(调控云)B、调度数据网平台C、调度管理系统D、能量管理系统答案:A96.()的思想是给定训练样例集将样例投影到一条直线上,使得同样例的投影点尽可能接近、异类样例投影点尽可能远离;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定样本的类别.A、多分类学习&B、&对数几率回归&C、&线性判别分析&D、&多分类学习答案:C解析:基础概念97.下面对强化学习、有监督学习和无监督学习描述正确的是A、都是人工智能的学习算法B、都是深度学习的学习算法C、都需要标注数据D、都不需要标注信息答案:A98.下列属于无监督学习的是:()A、k-meansB、SVMC、最大熵D、CRF答案:A99.神经网络研究属于下列哪个学派?A、符号主义B、连接主义C、行为主义D、以上都不是答案:B100.数据清洗的方法不包括()A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理答案:D101.AI是()的英文缩写。A、AutomaticIntelligenceB、ArtificalIntelligenceC、AutomaticeInformationD、ArtificalInformation答案:B解析:人工智能(ArtificialIntelligence),英文缩写为AI102.数据科学是以各类数据为研究对象,建立在应对()挑战的众多关键技术基础上的科学。A、数据处理B、数据分析C、数据压缩D、数据收集答案:A103.人工智能发展历程中第二次热潮是()期间的算法应用升级。A、20世纪50年代B、20世纪70年代C、20世纪80年代D、2006年答案:C解析:人工智能发展历程中第二次热潮是20世纪80年代算法应用升级。104.机器学习中的决策树学习的本质是一种逼近离散值目标函数的过程,决策树代表的是一种()过程A、预测B、回归C、分类D、聚类答案:C105.Mahout的核心是()算法及其实现。A、人工智能B、数据挖掘C、云计算D、机器学习答案:D106.语义网络表达知识时,有向弧AKO链、ISA链表达节点知识的()A、无悖性B、可扩充性C、继承性D、完整性答案:C107.被誉为计算机科学与人工智能之父的是()。A、图灵B、费根鲍姆C、纽维尔D、西蒙答案:A108.以下不属于AI机器决策优点的是()?A、具有一致性和逻辑性B、获取和处理投研信息范围广、内容全C、可减少人为疏漏和失误D、可以进行简单问题的直接回复、复杂问题转人工支持答案:D解析:以下不属于AI机器决策优点的是可以进行简单问题的直接回复、复杂问题转人工支持?109.传统科学计算中的建模方法可分为从()出发的建模和从数据出发的建模两类A、机理B、检索C、设计D、存储答案:A解析:传统科学计算中的建模方法可分为从机理出发的建模和从数据出发的建模两类110.在数据预处理阶段,我们常常对数值特征进行归一化或标准化(standardization,normalization)处理。这种处理方式理论上不会对下列哪个模型产生很大影响?()A、k-MeansB、k-NNC、决策树答案:C111.知识图谱可用于提高查询质量,知识图谱本质是A、知识数据库B、多关系图C、有向无环图D、层次结构树答案:C解析:知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。知识图谱由节点和边组成112.关于竞争型学习算法描述错误的是A、是一种监督学习策略B、每个时刻只有一个竞争获胜的神经元被激活C、其他神经元的状态被抑制D、ART网络通过竞争型学习算法寻优答案:A解析:竞争学习为无监督学习策略113.若变量间存在显式的因果关系,则常使用()模型。A、贝叶斯网B、马尔可夫网C、切比雪夫网D、D珀尔网答案:A114.或图通常称为()。A、框架网络B、语义图C、博亦图D、状态图答案:D解析:基础概念115.随机森林是Bagging的一个扩展变体,它在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入了()选择。A、随机属性B、分支属性C、机器属性D、以上都不对答案:A116.以下说法错误的一项是()A、负梯度方向是使函数值下降最快的方向B、当目标函数是凸函数时,梯度下降法的解是全局最优解C、梯度下降法比牛顿法收敛速度快D、拟牛顿法不需要计算Hesse矩阵答案:C117.CRISP-DM将数据挖掘的过程抽象为四个层次:阶段、一般任务、()和过程实例A、具体任务B、分析C、规划D、建模答案:A118.如果将时间序列绘制成图,时间序列通常会表现出以下特征中的一种多多种,()、离群值、季节性周期变化。A、聚合B、趋势C、连续D、回归答案:B119.第一个成功应用的专家系统是()。A、ELIZAB、DendralC、XconD、Deepblue答案:B120.()以当前的假设作为输入,输出一个新的问题供执行系统去探索。A、执行器B、评价器C、泛化器D、实验生成器答案:D121.学习器在训练集上的误差称为“训练误差”或()。A、经验误差B、泛化误差C、精度误差D、特定误差答案:A122.关于RBF神经网络描述错误的是A、单隐层前馈神经网络B、隐层神经元激活函数为径向基函数C、输出层是对隐层神经元输出的非线性组合D、可利用BP算法来进行参数优化答案:C解析:输出层则是对隐层神经元输出的线性组合123.下面对人类智能和机器智能的描述哪一句是不正确的A、人类智能能够自我学习,机器智能大多是依靠数据和规则驱动B、人类智能具有自适应特点,机器智能则大多是“依葫芦画瓢”C、人类智能和机器智能均具备常识,因此能够进行常识性推理D、人类智能具备直觉和顿悟能力,机器智能很难具备这样的能力答案:C124.图像识别任务可以分为三个层次,根据处理内容的抽象性,从低到高依次为A、图像分析,图像处理,图像理解B、图像分析,图像理解,图像处理C、图像处理,图像分析,图像理解D、图像理解,图像分析,图像处理答案:C解析:图像识别任务可以分为三个层次,根据处理内容的抽象性,从低到高依次为图像处理,图像分析,图像理解125.下列选项中,不属于生物特征识别技术的是()A、步态识别B、声纹识别C、文本识别D、虹膜识别答案:C126.在数据量大的情况下,对于相同的文本分类任务,对Bert模型和word2vec模型的分类效果判断正确的是()A、bert分类效果优于word2vecB、word2vec分类效果优于bertC、效果一致D、以上选项均不正确答案:A解析:在数据量大的情况下,对于相同的文本分类任务,bert分类效果优于word2vec127.列算法,哪项不属于深度学习模型?()A、支持向量机SVMB、深度残差网络C、卷积神经网络CNND、循环神经网络RNN答案:A解析:支持向量机SVM属于统计学习128.人工智能在图像识别上已经超越了人类,支持这些图像识别技术的,通常是A、云计算B、因特网C、神经计算D、深度神经网络答案:D129.人工智能的主要学派有:符号主义、连接主义和()A、语义网络B、行为主义C、逻辑主义D、以上没有正确答案答案:B130.下列哪个不是专门用于可视化时间空间数据的技术:()A、等高线图B、饼图C、曲面图D、矢量场图答案:B131.HDFS默认BlockSize的大小是()。A、32MBB、64MBC、128MBD、256M答案:B132.如果我使用数据集的全部特征并且能够达到100%的准确率,但在测试集上仅能达到70%左右,这说明:()。A、欠拟合B、模型很棒C、过拟合答案:C133.下列()不是多艾真体系统的模型A、bdi模型B、协商模型C、联合规划模型D、自协调模型答案:C134.属于常见损失函数:A、计算预测值函数B、求偏导数函数C、均方误差损失函数D、更新参数函数答案:C解析:均方误差损失函数属于常见损失函数。135.关于贝叶斯网的学习描述错误的为A、贝叶斯的学习过程为对训练样本计数B、估计出每个结点的条件概率C、网络结构为已知D、评分搜索为求解的常用办法答案:C解析:若网络结构己知,即属性间的依赖关系己知,则贝叶斯网的学习过程相对简单,只需通过对训练样本“计数”,估计出每个结点的条件概率表即可,但在现实应用中我们往往并不知晓网络结构,于是,贝叶斯网学习的首要任务就是根据训练数据集来找出结构最"恰当"的贝叶斯网136.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科叫()。A、专家系统B、机器学习C、神经网络D、模式识别答案:B137.4目前,多数NoSQL数据库是针对特定应用场景研发出来的,其设计遵循()原则,更加强调读写效率、数据容量以及系统可扩展性。A、EASY原则B、READ原则C、BASE原则D、BASIC原则答案:C138.图像识别主要是以()为基础的A、元素B、像素C、特征D、部件答案:C139.为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?()A、探索性数据分析B、建模描述C、预测建模D、寻找模式和规则答案:B140.生物特征识别技术不包括()。A、体感交互B、指纹识别C、人脸识别D、虹膜识别答案:A141.以下()的说法是正确。A、术语NoSQL是“No!SQL”的缩写B、术语NoSQL可以理解为“NotOnlySQL”的缩写C、NoSQL数据库始终遵循ACID原则D、NoSQL数据库属于关系数据库技术答案:B142.HBase依靠()存储底层数据。A、HDFSB、HadoopC、MemoryD、MapReduce答案:A143.()和假设检验又可归结为统计推断的范畴,即对总体的数量特征做出具有一定可靠程度的估计和判断A、参数估计B、逻辑分析C、方差分析D、回归分析答案:A144.剪枝方法和程度对决策树泛化性能的影响相当显著,有实验研究表明,在数据带有噪声时通过剪枝甚至可将决策树的泛化性能提高()。A、0.2B、0.25C、30%D、0.35答案:B145.选择直接把最终将要使用的学习器的性能作为特征子集的评价标准的是()A、子集的搜索与评价B、过滤式选择C、包裹式选择D、压缩感知答案:C146.机器学习是()研究发展到一定阶段的必然产物。A、深度学习B、人工智能C、神经网络D、计算机工程答案:B解析:机器学习是人工智能研究发展到一定阶段的必然产物。147.有三种方法可以帮助决策者确定决策的作用:()、场景分析和What-If分析A、建模B、测试C、假设分析D、回归分析答案:B148.下列哪部分不是专家系统的组成部分()。A、用户B、综合数据库C、推理机D、知识库答案:A解析:专家系统通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取等6个部分构成149.以下()属于数据可视化方法体系中的基础方法。A、视觉编码方法论B、视觉隐喻C、地理信息可视化D、时变数据可视化答案:B150.人工神经网络在20世纪()年代兴起,一直以来都是人工智能领域的研究热点A、50B、60C、70D、80答案:D151.()是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。A、专家系统B、机器系统C、智能芯片D、人机交互答案:A152.两步聚类的两个主要步骤为()和聚类A、建模B、测试C、分析D、预聚类答案:D153.数据库系统的核心是()A、数据库B、数据库管理系统C、数据模型D、软件工具答案:B154.下列哪项不属于知识图谱的分布式表示方法()A、word2vecB、TransDC、TransHD、TransE答案:A解析:word2vec属于文字的向量表示。155.()是规则的置信度与先导的置信度之间的绝对差。A、置信度差B、信息差C、置信度值D、标准差答案:A156.()是将人类语言经过处理转化为机器所能理解语言的一门技术。A、自然语言处理B、计算机视觉C、语音识别D、大数据答案:A解析:自然语言处理是将人类语言经过处理转化为机器所能理解语言的一门技术。157.多层前馈神经网络描述错误的是A、输出层与输入层之间包含隐含层,且隐含层和输出层都拥有激活函数的神经元B、神经元之间存在这同层连接以及跨层连接C、输入层仅仅是接收输入,不进行函数处理D、每层神经元上一层与下一层全互连答案:B解析:神经网络每层神经元与下层神经完全互连,神经元之间不存在同层连接,也不存在跨层连接,这样的神经网络结构通常称为“多层前馈神经网络”158.描述性分析主要关注的是()A、“过去”,回答“已发生什么”B、“过去”,回答“为什么发生”C、“模拟与优化”的问题D、“未来”,回答“将要发生什么”答案:A159.输入32*32的图像,用大小5*5的卷积核做步长为1的卷积计算,输出图像的大小是A、28*23B、28*28C、29*29D、23*23答案:B160.人工智能应用研究的两个最重要最广泛领域为:()A、专家系统、自动规划B、专家系统、机器学习C、机器学习、智能控制D、机器学习、自然语言理解答案:B解析:人工智能应用研究的两个最重要最广泛领域为:专家系统、机器学习161.深度学习可以用在下列哪项NLP任务中A、情感分析B、问答系统C、机器翻译D、所有选项答案:D162.“数据的故事化描述”是指为了提升数据的()和(),将数据还原成关联至特定的情景的过程。A、可理解性可记忆性可体验性B、可接受性可记忆性可体验性C、可接受性可记忆性可呈现性D、可理解性可记忆性可呈线性答案:A163.如果从来样(sampling)的角度来看待数据集的划分过程,则保留类别比例的采样方式通常称为()。A、分层采样B、留出采样C、随机采样D、泛化采样答案:A164.考虑值集{12243324556826},其四分位数极差是:()A、31B、24C、55D、3答案:A165.下列关于bootstrap说法正确的是?A、从总的M个特征中,有放回地抽取m个特征(m<M)B、从总的M个特征中,无放回地抽取m个特征(m<M)C、从总的N个样本中,有放回地抽取n个样本(n<N)D、从总的N个样本中,无放回地抽取n个样本(n<N)答案:C166.下列关于回归分析中的残差表述正确的是()A、残差的平均值总为零B、残差的平均值总小于零C、残差的平均值总大于零D、残差没有此类规律答案:A167.“大数据”一词从()年提出来的A、2008B、2009C、2010D、2011答案:B168.2PC主要包括表决阶段和()。A、响应阶段B、操作阶段C、执行阶段D、处理阶段答案:C169.关于正态分布,下列说法错误的是A、正态分布具有集中性和对称性B、正态分布的均值和方差能够决定正态分布的位置和形态C、正态分布的偏度为0,峰度为1D、标准正态分布的均值为0,方差为1答案:C170.()是指将“数据”转换为“产品”的艺术。A、数据柔性B、数据运用C、数据挖掘D、数据开发答案:A171.机器学习在()正式被视为“解决知识工程瓶颈问题的关键”而走上人工智能主舞台的。A、二十世纪七十年代B、二十世纪六十年代C、二十世纪九十年代D、二十世纪八十年代答案:D172.1997年5月12日,轰动全球的人机大战中,“更深的蓝”战胜了国际象棋之子卡斯帕罗夫,这是()。A、人工思维B、机器思维C、人工智能D、机器智能答案:C173.一般而言,随着划分过程不断进行,我们希望决策树的分支结点所包含的样本尽可能属于同一类别,即结点的()越来越高。A、纯度B、精度C、准确度D、可信度答案:A174.决策树学习的关键是如何从候选属性集中选择一个最有助于分类实例的属性,而其选择是以()为依据的A、分类B、聚类C、概率D、信息熵答案:D175.专家系统的推理机的最基本的方式是。A、直接推理和间接推理B、正向推理和反向推理C、逻辑推理和非逻辑推理D、准确推理和模糊推理答案:B176.二十世纪五十年代到七十年代初,人工智能处于()期。A、理论B、知识C、推理D、智能答案:C解析:二十世纪五十年代到七十年代初,人工智能处于推理期。177.在证据理论中,信任函数与似然函数的关系为()。A、Bel≤PlB、Bel<PlC、Bel≥PlD、Bel>Pl答案:A解析:概念理解178.数据产品开发中,需要综合考虑三个不同的指标,下列哪项不是三项指标之一A、查全率B、查准率C、响应时间D、响应速度答案:A179.下列哪项不是噪声数据的主要表现形式A、错误数据B、虚假数据C、异常数据D、重复数据答案:D180.以下不属于对抗生成网络的应用是?A、文字生成B、图像生成C、图像识别D、数据增强答案:C181.知识图谱中的边称为?A、连接边B、关系C、属性D、特征答案:B182.在人工神经网络算法中,不属于实现“人工神经元”的方法的有()。A、感知器B、线性单元C、Sigmoid单元D、Untied单元答案:D183.下列不属于数据预处理和特征工程的流程的是A、数据获取B、数据清洗C、模型解释D、数据标准化答案:C184.遗传算法借鉴的生物进化的三个基本原则是A、两性繁衍突变进化B、适者生存突变进化C、适者生存两性繁衍进化D、适者生存两性繁衍突变答案:D185.()通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifiersystem)、基于委员会的学习(mittee-basedlearning)等A、集成学习B、归纳学习C、分类学习D、整理学习答案:A186.概率模型的训练过程就是()过程。A、参数估计B、概率估计C、极大似然估计D、分布估计答案:A187.我们想要减少数据集中的特征数,即降维。选择以下适合的方案①使用前向特征选择方法②使用后向特征排除方法③我们先把所有特征都使用,去训练一个模型,得到测试集上的表现然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现,如果表现比原来还要好,我们可以去除这个特征④查看相关性表,去除相关性最高的一些特征A、①②B、②③④C、①②④D、①②③④答案:D188.人工智能的三个阶段包含了计算智能、()、认知智能。A、弱人工智能B、感知智能C、行为智能D、强人工智能答案:B解析:人工智能的三个阶段包含了计算智能、感知智能、认知智能。目前仍处于初级阶段。189.人工智能的近期目标是()。A、实现机器智能B、实现自我学习C、降低搭建成本D、超越人类答案:A解析:人工智能近期目标:是实现机器智能。即先部分地或某种程度地实现机器智能,从而使现有的计算机更灵活好用和更聪明有用。答案选A190.Boosting算法要求基学习器能对特定的数据分布进行学习,可通过()实施,对无法接受带权样本的基学习算法,则可通过()来处理A、重赋权法,重采样法B、重采样法,重赋权法C、赋权法,采样法D、采样法,赋权法答案:A191.以下不属于数据变换的方法有()A、平滑处理B、标准化C、特征构造D、去除虚假数据答案:D192.世界上第一次正式的AI会议于()年召开,JohnMarthy正式提出“ArtifiialIntelligene”这一术语A、1954B、1955C、1956D、1957答案:C193.以下()不属于机器学习中基于实例学习方法。A、ID3算法B、K近邻方法C、局部加权回归法D、基于案例的推理答案:A194.无监督的建模技术有()、关联分析、预报三类A、聚合B、离散C、相关性分析D、聚类答案:D195.在IBMSPSS中,将评判准则和评判方法抽象为数学计算方法,就是()的内容。A、数据挖掘B、统计分析C、数理统计D、优化技术答案:D196.()的本质是一种逼近离散值目标函数的过程。A、基于实例学习B、概念学习C、决策树学习D、人工神经网络学习答案:C197.关于k折交叉验证,下列说法正确的是?()A、k值并不是越大越好,k值过大,会降低运算速度B、选择更大的k值,会让偏差更小,因为k值越大,训练集越接近整个训练样本C、选择合适的k值,能减小验方差D、以上说法都正确答案:D198.()就是要得到一些数据大致是什么样的,它的区间是什么,它的统计指标,以及这样的数据是怎么分布的等信息。A、数据搜查B、数据检查C、数据探查答案:C199.在数据挖掘中,()可以从大量数据中挖掘出有价值的数据项之间的相关生关系。A、关联规则B、相关分析C、线性分析D、分布规则答案:A200.()是指数据减去一个总括统计量或模型拟合值时的残余部分A、极值B、标准值C、平均值D、残值答案:D多选题1.下列哪种方法可以用来减小过拟合?()A、更多的训练数据B、L1正则化C、L2正则化D、减小模型的复杂度答案:ABCD2.人工智能主要分为()A、计算智能B、感知智能C、认知智能D、以上都不正确答案:ABC解析:基础概念3.选择下列哪些属于可以通过机器学习解决的任务?A、聚类B、分类C、描述D、派生答案:AB4.机器学习系统的组成要素包括()A、任务B、性能指标C、经验来源D、算法答案:ABC5.NoSQL中常用的数据模型包括()A、Key-ValueB、Key-DocumentC、Key-ColumnD、图存储答案:ABCD6.关于神经网络,下列说法正确的是A、增加网络层数,可能会增加测试集分类错误率B、增加网络层数,一定会增加训练集分类错误率C、减少网络层数,可能会减少测试集分类错误率D、减少网络层数,一定会减少训练集分类错误率答案:AC解析:一般来说,神经网络层数越多,模型越复杂,对数据的分类效果越好。所以,从最简单的层数开始,增加网络层数都能使得训练误差和测试误差减小。但是,神经网络层数过多容易造成过拟合,即对训练样本分类效果很好,误差小,但是测试误差很大。为了避免发生过拟合,应该选择合适的神经网络层数并使用正则化技术来让神经网络更加稳健。7.数据分析的三个基本类型是()A、描述性分析B、流动性分析C、预测性分析D、规范性分析E、范围性分析答案:ACD8.以下属于仿生算法的有()。A、蚁群算法B、遗传算法C、人工神经网络D、蒙特卡洛方法E、归并排序算法答案:ABC9.在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是A、将负样本重复10次,生成10w样本量,打乱顺序参与分类&B、&直接进行分类,可以最大限度利用数据&C、&从10w正样本中随机抽取1w参与分类&D、&将负样本每个权重设置为10,正样本权重为1,参与训练过程答案:ACD解析:基础概念10.从能力角度来讲,人工智能是智能机器所执行的通常与人类智能有关的智能行为,如()、感知、理解、通信、设计、思考、规划、学习和问题求解等思维活动。A、判断B、推理C、证明D、识别答案:ABCD11.基因遗传算法的两个常用的结束条件为()。A、达到一定的迭代次数B、适应度函数达到一定的要求C、达到一定的变异次数D、达到一定的交叉次数答案:AB12.数据变换的类型有()A、平滑处理B、特征构造C、聚集D、标准化E、离散化答案:ABCDE13.在强化学习中,主体和环境之间交互的要素有()。A、状态B、动作C、回报D、强化答案:ABC14.人工智能研究的主要因素有()。A、计算能力B、算法C、数据D、天气答案:ABC15.如何在监督式学习中使用聚类算法()?A、首先,可以创建聚类,然后分别在不同的集群上应用监督式学习算法B、在应用监督式学习算法之前,可以将其类别ID作为特征空间中的一个额外的特征C、在应用监督式学习之前,不能创建聚类D、在应用监督式学习算法之前,不能将其类别ID作为特征空间中的一个额外的特征答案:AB16.人工智能特指使用机器代替人类实现()等功能,其本质是对人的意识和思想的信息过程的模拟A、认知B、识别C、分析D、决策答案:ABCD解析:基础概念17.非机器学习有哪些类型?A、假设与推理学习B、概念与分类学习C、人工智能D、规则推理答案:CD18.数据可视化的基本模型有:A、顺序模型B、循环模型C、分析模型D、挖掘模型答案:ABCD19.常用的聚类性能度量外部指标有哪些()A、Jaccard系数B、FM指数C、Rand指数D、DB指数答案:ABC20.下列关于词袋模型说法正确的是()。A、词袋模型可以忽略每个词出现的顺序B、词袋模型不可以忽略每个词出现的顺序C、TensorFlow支持词袋模型D、词袋模型可以表出单词之间的前后关系答案:AC解析:基础概念理解21.以下哪些是常用的概念模型()。A、ER图B、语言模型C、面向对象模型D、谓词模型答案:ACD22.常见的聚类技术有()A、分层聚类B、K平均值聚类C、两步聚类D、Konhonennetwork答案:ABCD23.NoSQL数据库的主要优势体现在()。A、易于数据的分散存储与处理B、数据的频繁操作代价低以及数据的简单处理效率高C、适用于数据模型不断变化的应用场景D、数据统计及分析的准确率高答案:ABC24.知识表示必须兼顾()。A、表达能力强B、易于推理C、易于扩展D、容易修改知识库答案:ABCD25.下面关于数据粒度的描述正确的是?A、粒度是指数据仓库小数据单元的详细程度和级别B、数据越详细,粒度就越小,级别也就越高C、数据综合度越高,粒度也就越大,级别也就越高D、粒度的具体划分将直接影响数据仓库中的数据量以及查询质量答案:ABD26.以下哪几项是数据科学的重要活动()A、数据加工B、数据审计C、数据分析D、数据呈现答案:ABCD27.MapReduce计算框架是一种分布式计算模型,其主要特征有()。A、自动实现分布式并列计算B、支持大规模海量数据处理C、借鉴函数式编程思路D、简洁易用答案:ABCD28.下列哪些属于AI的子领域?A、机器学习B、计算机视觉C、语音识别D、自然语言处理答案:ABCD29.因为机器在进行人脸检测、分析和识别的过程中需要对人脸图像进行(),所以皮肤颜色越深,面部的特征信息就越难提取,尤其是在一些暗光情况下,更加难以检测和区分。A、变形B、预处理C、特征提取D、扭曲答案:BC30.人工智能是解决机器()的学科A、感知B、理解C、决策D、证明答案:ABC31.自然语言处理产生的对话系统,对企业有哪些好处?A、节省人工B、提高奖金C、节省费用D、降低耗电答案:AC32.在机器学习中,建立假设或者模型的三个阶段指的是()。A、建模B、模型测试C、模型应用D、分析模型答案:ABC33.机器学习的要素有哪些?A、一致性假设B、样本空间划分C、泛化能力答案:ABC34.以下哪种评估方法受随机样本的影响?A、留一法B、交叉验证法C、流出法D、自助法答案:BCD35.关于连接主义,描述正确的是()A、基础理论是神经网络B、深度学习属于连接主义C、又称为仿生学派D、产生在20实际50年代答案:ABCD36.机器学习的基本活动包括()。A、训练经验的选择B、目标函数的选择C、目标函数的表示D、函数逼近算法的选择答案:ABCD37.NoSQL数据库中采用的主要数据模型有()。A、Key-ValueB、Key-DocumentC、Key-ColumnD、图存储答案:ABCD38.一般说来,人工智能技术包括A、深度学习、机器学习B、计算机视觉、自然语言处理C、人机交互、生物信息技术、智能芯片D、虚拟现实/增强现实、机器人技术答案:ABCD解析:人工智能技术包括5种:机器学习、机器人技术、自然语言处理、生物识别技术、计算机视觉39.机器学习预测类任务包括()?A、分类B、回归C、聚类D、关联规则挖掘答案:AB40.技术发展水平上,()和()是我国人工智能市场技术最成熟的两个领域,应用场景主要集中在机器人、无人机、医疗、家居、教育、无人驾驶等领域A、智能语音B、自然语言处理C、类脑智能计算D、人机混合智能答案:AB解析:基础概念41.以下属于AI机器决策优点的有()A、具有一致性和逻辑性B、获取和处理投研信息范围广、内容全C、可减少人为疏漏和失误D、可以进行简单问题的直接回复、复杂问题转人工支持答案:ABC42.下列属于“统计学习”的有()A、BP算法B、支持向量机C、一般的“核”方法习D、决策树答案:BC解析:二十世纪九十年代中期,“统计学习”闪亮登场并迅速占据主流舞台,代表性技术是支持向量机以及更一般的“核方法”。43.人工智能有几大学派?A、符号主义B、联结主义C、行为主义D、仿生主义答案:ABC44.根据结构不同,智能传感器可以分为()A、模块式传感器B、集成式传感器C、混合式传感器D、控制型传感器答案:ABC解析:基础概念45.从产业链的角度来讲,人工智能分为三层,由()组成A、基础层B、技术层C、应用层D、过程层答案:ABC解析:基础概念46.我们希望减少数据集中的特征数量。你可以采取以下哪一个步骤来减少特征()?A、使用正向选择法(ForwardSelection)B、使用反向消除法(BackwardElimination)C、逐步选择消除法(Stepwise)D、计算不同特征之间的相关系数,删去相关系数高的特征之一答案:ABCD47.大数据处理流程可以概括为以下哪几步?A、统计和分析B、挖掘C、导入和预处理D、采集答案:ABCD48.人工智能现在的技术应用方向主要有?A、自然语言处理B、控制系统C、计算机视觉D、语音识别答案:ACD49.新建数据库至少包括()A、主要数据文件B、次要数据文件C、日志文件D、系统文件答案:AC50.对人工智能的发展趋势划分,一般可分为()。A、强人工智能B、泛人工智能C、弱人工智能D、超人工智能答案:ACD解析:基础概念理解51.考察聚类内的特征指标有()A、SSBB、聚类半径C、SSED、标准差答案:BCD52.随机试验必须符合以下几个条件?A、它可以在相同条件下重复进行B、每次试验只出现这些可能结果中的一个C、预先要能断定出现哪个结果D、试验的所有结果事先已E、预先要能知道哪个结果出现的概率。答案:ABD53.关于K均值和DBSCAN的比较,以下说法正确的是()。A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇答案:BCD54.在应用层,我国人工智能企业主要选择在()、智能运载工具等领域A、智能机器人B、智能医疗C、智能金融D、智能零售答案:ABCD解析:基础概念55.计算智能的主要内容包括()A、神经计算B、进化计算C、免疫计算D、蚁群算法答案:AB56.请问下面哪些是离散型变量()。A、示波器B、心电图及脑动电图扫描器对脑电波的测量C、过去数月的总销售额D、公司每年的红利答案:CD57.以下哪种方法是用来解决过拟合问题的?A、减少模型复杂度B、增加正则化项C、L1范数或L2范数D、使用特征选择算法E、使用线性模型拟合二次曲线数据答案:ABCD58.机器学习中处理缺失值的常用方法包括()?A、去掉该属性B、使用默认值C、使用属性平均值D、预测最可能的值答案:ABCD59.常用的数据归约方法有()。A、量归约B、维归约C、值归约D、类归约答案:BC60.下述网络属于数据挖掘领域中神经网络的是()。A、前向神经网络B、反馈神经网络C、自组织神经网络D、生物神经网络答案:ABC解析:神经网络可以分为4种类型,前向型、反馈型、随机型、自组织型。61.计算智能的主要研究领域包括()。A、神经计算B、进化计算C、模糊计算D、数字计算答案:ABC解析:数字计算不属于计算智能。62.针对大数据的影响以下说法正确的是()A、数据科学将成为科研体系中的重要组成部分,并逐渐取得与包括物理化学生命科学等学科在内的自然科学分庭抗争的地位。B、科学研究和市场产业的联系将变得更加密切C、从发现基本原理到产业化的周期将会大大被缩短D、以上都不对答案:AB63.对人工智能常见的误解有哪些?()A、人工智能就是机器学习B、机器学习只是人工智能中的一个方向C、人工智能最近十年受到深度学习的驱动较多D、人工智能就是深度学习答案:AD解析:基础概念64.人工智能应用类企业的切入领域有()。A、机器人B、教育培训C、医疗设备D、智能家居答案:ABCD65.在计算机视觉应用中,常用的图像特征有()。A、颜色特征B、纹理特征C、形状特征D、空间关系特征答案:ABCD66.神经网络的拓扑结构可以分为()。A、前向型B、反馈型C、自组织竞争型D、随机型答案:ABCD67.对于规则的专家系统的缺点,下列说法正确的是A、规则之间的关系不明确B、低效的搜索策略C、没有学习能力D、没有统一的结构答案:ABC68.“以数据为中心”是数据产品区别于其他类型产品的本质特征。数据产品“以数据为中心”的特征不仅体现在“以数据为核心生产要素”,而且还表现在以下三个方面。()A、数据驱动B、数据密集式C、数据挖掘D、数据范式答案:ABD69.数据脱敏需要满足以下()要求。A、单向性B、匿名处理C、无残留D、易于实现答案:ACD70.变量之间的关系可以分为两类:一类是(),另一类是()。A、逻辑关系B、相关关系C、假设-验证关系D、函数关系答案:BD71.下列机器学习方法属于基于获取知识的表示分类的是A、产生式规则B、归纳推理C、决策树D、神经网络答案:ACD解析:机器学习方法属于基于获取知识的表示分类的是产生式规则、决策树、神经网络72.人工智能是“研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学”,被视为计算机科学的一个分支,其研究包括机器人、()等A、语言识别B、图像识别C、自然语言处理D、专家系统答案:ABCD解析:基础概念73.传统关系数据库技术的优点有()。A、数据一致性高B、数据冗余度低C、复杂查询的能力强D、产品成熟度高答案:ABCD74.缺失数据的处理主要涉及以下哪三个关键活动。()A、缺失数据的识别B、缺失数据的分析C、删除或插补缺失数据D、缺失数据的忽略答案:ABC75.大数据的处理需要经过几个流程?A、数据加工B、数据采集C、数据建模D、数据清洗答案:ABCD76.与数据工程师不同的是,数据科学家不仅需要掌握理论知识和实践能力,更需要具备良好的精神素质—即3C精神()。A、A创造性地做事(CreativeWorking)B、仔细地总结(CarefulConclusion)C、批判性地思考(CriticalThinking)D、好奇性地提出问题(CuriousAsking)答案:ACD77.噪声数据的产生原因主要有:()A、数据采集设备有问题B、在数据录入过程中发生了人为或计算机错误C、数据传输过程中发生错误D、由于命名规则或数据代码不同而引起的不一致答案:ABCD78.数据脱敏的三个基本活动是()A、识别敏感信息B、脱敏处理C、脱敏处理的评价D、脱敏操作E、脱敏标准制定答案:ABC79.《新一代人工智能伦理规范》提出了增进人类福祉、()、提升伦理素养等基本伦理要求。A、促进公平公正B、保护隐私安全C、确保可控可信D、强化责任担当答案:ABCD解析:《新一代人工智能伦理规范》80.我国人工智能基础层产业发展至今,已在智能芯片设计领域取得一定成就,其产品主要聚焦()工具等应用场景A、智能手机B、安防监控C、智能运载工具D、以上都不正确答案:ABC解析:基础概念81.人工智能包括哪些要素()A、算力B、算法C、数据D、场景答案:ABCD82.数据分析分为哪三个基本类型()A、诊断性分析B、描述性分析C、预测性分析D、规范性分析答案:BCD83.可视分析学是一门以可视交互为基础,综合运用()等技术等多个学科领域的知识,以实现人机协同完成可视化任务为主要目的分析推理学科。A、物理学B、图形学C、数据挖掘D、人机交互答案:BCD84.计算智能的主要研究领域包括()。A、神经计算B、进化计算C、模糊计算D、数字计算答案:ABC85.常用的数据审计方法有()。A、预定义审计B、自定义审计C、可视化审计D、结构化审计答案:ABC86.下面哪些属于AI的应用领域?A、智慧教育B、智慧城市C、智慧家居D、智慧医疗答案:ABCD87.大数据有()特征A、Volume(数据量大)B、Veriety(类型多)C、Value(价值密度低)D、Velocity(速度快)答案:ABCD88.常见的脏数据的类型有哪些?A、格式错误的值B、重复值C、逻辑错误的值D、缺失值答案:ABCD89.有哪些因素推动了大数据的出现?A、社交媒体B、数据挖掘C、普适计算D、摩尔定律答案:ABCD90.“噪声”是指测量变量中的随机错误或偏差,噪声数据的主要表现形式有哪些?A、错误数据B、虚假数据C、异常数据D、缺失数据答案:ABC91.根据整数和实数,可以将数值变量分为()。A、名词性变量B、顺序数值变量C、顺序变量D、连续数值变量E、离散数值变量答案:DE92.决策树剪枝的基本策略有()。A、中剪枝B、前剪枝C、先剪枝D、后剪枝E、预剪枝答案:DE93.语音识别的方法()。A、声道模型方法B、模板匹配的方法C、利用仍神经网络的方法D、语音知识方法答案:ABCD94.数据科学的三要素()A、理论B、实践C、精神D、运用E、挖掘答案:ABC95.边缘计算是指在靠近物或数据源头的一侧,采用()为一体的开放平台,就近提供最近端服务。A、网络B、计算C、存储D、应用核心能力答案:ABCD96.两步聚类的两个主要步骤为()。A、建模B、测试C、聚类D、预聚类答案:CD97.数据统计有三大任务,分别是()。A、统计分析B、参数估计C、假设检验D、回归分析答案:BCD98.声纹识别与语音识别的不同点有()A、声纹识别不考虑语音中的字词信息B、语音识别强调共性C、语音识别不考虑说话人是谁D、声纹识别强调说话人的个人特性答案:ABCD解析:声纹识别和语音识别在原理上一样,都是通过对采集到的语音信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断。但二者的根本目的,提取的特征、建立的模型是不一样的。声纹识别不注重语音信号的语义,而是从语音信号中提取个人声纹特征,挖掘出包含在语音信号中的个性因素。99.云计算的特点()A、超大规模B、可靠性C、虚拟化D、安全性答案:AC100.回归分析有很多种类,常见的有()。A、线性回归B、系数回归C、逻辑回归D、曲线回归答案:ACD判断题1.物联网采集到各类信息后,直接对信息进行识别和分析,来实现物与物、物与人的泛在连接。A、正确B、错误答案:B解析:物联网采集到各类信息后,需要通过各类可能的网络接入,实现物与物、物与人的泛在连接2.运行阶段的数据异常可导致智能系统运行错误。A、正确B、错误答案:A解析:正确3.被称为“神经网络之父”和“人工智能教父”的是辛顿A、正确B、错误答案:A解析:GeoffreyHinton,被称为“神经网络之父”、“深度学习鼻祖”,他曾获得爱丁堡大学人工智能的博士学位,并且为多伦多大学的特聘教授4.AI的英文缩写是ArtificalInformation。A、正确B、错误答案:B5.人工智能技术可通过对特征库学习自动查找系统漏洞和识别关键目标,提高攻击效率。A、正确B、错误答案:A解析:正确6.到目前为止,有少数通用的人工智能技术,所有大部分人工智能应用都是被限定在特定场景中,而少数则可能“通吃。A、正确B、错误答案:B7.人工智能提升数据资源价值,数据权属问题更为突出。A、正确B、错误答案:A解析:正确8.目前已有人工智能通过图灵测试A、正确B、错误答案:B9.人工神经元网络只需要很少的数据便可掌握处理特定问题的能力()A、正确B、错误答案:B解析:错误10.广义人工智能是指通过计算机实现人的头脑思维所产生的效果,通过研究和开发用于模拟、延伸人的智能的理论、方法、技术及应用系统所构建而成的,其构建过程中综合了计算机科学、数学、生理学、哲学等内容A、正确B、错误答案:A解析:正确11.人工智能因其技术的局限性和应用的广泛性,给网络安全、数据安全、算法安全和信息安全带来风险A、正确B、错误答案:A解析:正确12.人工智能特指使用机器代替人类实现认知、识别、分析、决策等功能,其本质是对人的意识和思想的信息过程的模拟A、正确B、错误答案:A解析:正确13.专家系统的结构包含人机界面、知识库,推理机,动态数据库,知识库答理系统和解释模块。A、正确B、错误答案:A14.反向推理是以已知事实作为出发点,按照一定的策略,运用知识库中的知识,推断出结论的过程。A、正确B、错误答案:B15.人工智能是引领未来的战略性技术,正在对经济发展、社会进步和人类生活产生深远影响A、正确B、错误答案:A解析:正确16.人工智能算法设计与优化需要以海量优质数据资源为基础。A、正确B、错误答案:A解析:正确17.PaaS为各类基层创新应用提供应用开发运行所需技术组件支撑,主要包括企业数据接入组件、企业数据库与存储组件、企业数据计算处理组件和应用开发运行组件A、正确B、错误答案:A18.由机器学习算法构成的模型,在理论层面上,它并不能表征真正的数据分布函数,只是逼近它而已。A、正确B、错误答案:A19.图像分类是指根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。A、正确B、错误答案:A20.知识的框架表示法中,一个框架由若干个称为“槽”的结构组成,而每一个这样的结构又可拥有若干个侧面()A、正确B、错误答案:A解析:正确21.基于人工智能技术的数据深度伪造将威胁网络安全、社会安全和国家安全。A、正确B、错误答案:A解析:正确22.人工智能发展历程的第一次热潮是20世纪50年代神经网络相关基础理论的提出。A、正确B、错误答案:A解析:本题说法是正确的。23.开源学习框架存在安全风险,可导致人工智能系统数据泄露。A、正确B、错误答案:A解析:正确24.要想让机器具有智能,必须让机器具有知识。因此,在人工智能中有一个研究领域,主要研究计算机如何自动获取知识和技能,实现自我完善,这门研究分支学科叫机器学习。A、正确B、错误答案:A25.大数据人才整体上需要具备数学与统计知识A、正确B、错误答案:A26.无监督学习又称归纳性学习,分为聚类和降维A、正确B、错误答案:A27.强人工智能(Bottom-UpAI)包括以下两类:类人的人工智能和类人脑的人工智能。A、正确B、错误答案:B解析:强人工智能包括以下两类:类人的人工智能和非类人的人工智能。28.大数据的应用注重因果分析而不是相关分析A、正确B、错误答案:B29.限定人工智能是数字计算机或数字计算机控制的机器人在执行智能生物体才有的一些任务上的能力A、正确B、错误答案:A解析:正确30.大数据的思维会把原来销售的概念变成服务的概念。A、正确B、错误答案:A31.人工智能标准体系结构包括基础共性、支撑技术与产品、基础软硬件平台、关键领域技术、产品与服务、行业应用、安全/伦理”等七个部分A、正确B、错误答案:B解析:人工智能标准体系结构包括基础共性、支撑技术与产品、基础软硬件平台、关键通用技术、关键领域技术、产品与服务、行业应用、安全/伦理”等八个部分32.监督学习的学习数据既有特征(feature),也有标签(label)。A、正确B、错误答案:A解析:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。33.人工智能三大核心中算法深度学习突破人工智能算法瓶颈。A、正确B、错误答案:A解析:本题说法是正确的。34.选择样本数据时,我们一般采用随机抽取的方式组成自己的训练集和测试集来使用A、正确B、错误答案:A35.大数据是通过传统数据库技术和数据处理工具不能处理的庞大而复杂的数据集合。A、正确B、错误答案:A36.数据质量和安全直接影响人工智能系统算法模型的准确性,进而威胁人工智能应用安全。A、正确B、错误答案:A解析:正确37.人工智能是对人的意识和思维过程的模拟,利用机器学习和数据分析方法赋予机器类人的能力A、正确B、错误答案:A解析:正确38.迁移学习和对抗生成网络,能减少对昂贵标注样本的依赖A、正确B、错误答案:A39.符号学派的不足是难以构建完备的知识规则库A、正确B、错误答案:A40.选择样本数据时,我们一般采用随机抽取的方式组成自己的训练集和测试集来使用。A、正确B、错误答案:A41.图灵测试是图灵于1950年提出的一个关于判断机器是否能够思考的著名试验,测试某机器是否能表现出与人等价或无法区分的智能。()A、正确B、错误答案:A42.谷歌研究提出,随着训练数据数量级的增加,相同机器视觉算法模型的性能呈指数上升。A、正确B、错误答案:B解析:歌研究提出,随着训练数据数量级的增加,相同机器视觉算法模型的性能呈线性上升。43.训练数据污染可导致人工智能决策错误。A、正确B、错误答案:A解析:正确44.将大规模的训练数据与标签值通过人工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深信服aES产品技术白皮书-V1.5
- 3.3汽化和液化 说课稿2025年初中人教版物理八年级上册
- 我奋斗我幸福心得体会
- 积极心理学理论下护理在细菌性阴道炎患者中的应用
- 《会计信息系统应用》课件 学习情境5 薪资管理系统应用
- 餐厨垃圾收运合作协议书
- 二零二五图书仓储与仓储物流信息化合同样本
- 二零二五年度办公大楼自来水供应与智能抄表服务合同
- 健康饮食规划实践指南
- 三农村资源利用优化方案设计
- 2024年10月自考15040习概试题及答案含评分参考
- TSGD7002-2023-压力管道元件型式试验规则
- DB11T 1833-2021 建筑工程施工安全操作规程
- 信息检索课件 第2章 文献检索方法(1)-2
- 汽车维修行业服务标准及规范
- 民间借贷利息计算表
- 智鼎在线测评题库28题
- 网络安全事件应急预案演练方案
- 广告导视标牌项目重难点施工方案
- 液压站操作说明书
- 医院围手术期管理制度培训课件
评论
0/150
提交评论