人工智能复习测试卷_第1页
人工智能复习测试卷_第2页
人工智能复习测试卷_第3页
人工智能复习测试卷_第4页
人工智能复习测试卷_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页人工智能复习测试卷1.考虑值集{12243324556826},其四分位数极差是A、31B、24C、55D、3【正确答案】:A2.关于列表数据结构,下面描述正确的是A、可以不按顺序查找元素B、必须按顺序插入元素C、不支持in运算符D、所有元素类型必须相同【正确答案】:A解析:

关于列表数据结构,3.下面关于SVM中核函数的说法正确的是?()A、核函数将低维空间中的数据映射到高维空间B、它是一个相似度函数C、A、B都对D、A、B都不对【正确答案】:C4.下列属于无监督学习的模型是()A、k-meansB、线性回归C、神经网络D、决策树【正确答案】:A解析:

k-means是聚类,属于无监督学习。5.据WardMO(2010)的研究,超过()的人脑功能用于视觉信息的处理,视觉信息的处理是人脑的最主要功能之一A、0.45B、0.55C、0.5D、$0.75【正确答案】:C6.下列哪个if语句是正确的?A、ifa>=22:&B、&ifa>=22&C、&if(a=>22)&D、&if(a>=22)【正确答案】:A解析:

见函数库7.下列贝叶斯描述错误的是(___)A、贝叶斯是概率框架下实施决策的基本方法;B、贝叶斯基于概率和误判损失来选择最优的类别标记;C、贝叶斯中期望损失定义为风险;D、贝叶斯判定准则为最大化总体风险;【正确答案】:D解析:

数学基础8.人工智能处在感知智能阶段的表现是什么?A、机器开始像人类一样能理解、思考与决策B、机器开始像人类一样会计算,传递信息C、机器开始看懂和听懂,做出判断,采取一些简单行动【正确答案】:C9.“ab”+”c”*2结果是()。A、abc2B、abcabcC、abccD、ababcc【正确答案】:C10.根据机器智能水平由低到高,正确的是()A、计算智能、感知智能、认知智能B、计算智能、感应智能、认知智能C、机器智能、感知智能、认知智能D、机器智能、感应智能、认知智能【正确答案】:A解析:

机器智能水平由低到高依次是:计算智能、感知智能、认知智能11.读取文件时并指定文件以空格分隔,则应该添加A、sep="\n”B、sep="\t”C、sep=""D、sep="\r”【正确答案】:C12.PHOTO_PATH="./photo/{}.jpg"指令可以实现()A、复制.jpg文件到photo目录下B、定义一个名为photo的存储路径C、打开photo里所有的jpg文件D、重命名目录【正确答案】:B13.浅拷贝的含义是A、拷贝父对象,不拷贝父对象的内部对象B、完全拷贝父对象和子对象C、仅是引用父对象D、仅是引用子对象【正确答案】:A14.下列贝叶斯描述错误的是A、贝叶斯是概率框架下实施决策的基本方法B、贝叶斯基于概率和误判损失来选择最优的类别标记C、贝叶斯中期望损失定义为风险D、贝叶斯判定准则为最大化总体风险【正确答案】:D解析:

使用贝叶斯判定准则来最小化决策风险15.()就是让机器通过处理和识别过程,把语音信号转变为相应的文本或信息的高技术。A、语音分析技术B、语音转化技术C、语音合成技术D、语音识别技术【正确答案】:D解析:

语音识别技术就是让机器通过处理和识别过程,把语音信号转变为相应的文本或信息的高技术。16.下述()不是知识的特征。

A、复杂性和明确性B、进化和相对性C、客观性和依附性D、可重用性和共享性【正确答案】:A17.下列数据类型中,不支持分片操作的是()。A、字符串B、列表C、字典D、元组【正确答案】:C18.下列哪一项属于特征学习算法(representationlearningalgorithm)?()A、K近邻算法B、随机森林C、神经网络D、都不属于【正确答案】:C19.关于用4V来表示大数据的主要特征,描述错误的是A、大数据的时间分布往往不均匀,近几年生成数据的占比最高B、“如何从海量数据中洞见(洞察)出有价值的数据”是数据科学的重要课题之一C、数据类型的多样性往往导致数据的异构性,进而加大数据处理的复杂性,对数据处理能力提出了更高要求D、数据价值与数据量之间存在线性关系【正确答案】:D20.在非均等代价下,希望最小化()A、召回率B、错误率C、错误次数D、总体代价【正确答案】:D21.哪条命令可以检查Atlas300(3000)加速卡是否在位?A、1spci|grep'npu'B、1spci|grep'd100'C、1spcigrep'atlas'D、atlasinfo【正确答案】:B22.假定你在神经网络中的隐藏层中使用激活函数X。在特定神经元给定任意输入,你会得到输出「-00001」。X可能是以下哪一个激活函数()A、ReLUB、tanhC、SIGMOIDD、以上都不是【正确答案】:B23.下面哪个Linux命令可以一次显示一页内容?A、pauseB、catC、moreD、grep【正确答案】:C解析:

pause函数功能是暂停进程;cat函数功能是连接文件并打印;more函数功能是一次显示一屏文本,满屏后停下来;grep函数功能是查找文件里符合条件的字符串。24.在集成学习中,对于数据型输出,最常见的结合策略是()A、平均法B、投票法C、学习法【正确答案】:A25.计算numpy中元素个数的方法()A、np.sqrt()B、np.size()C、np.identity()D、np.sum()【正确答案】:B26.在Python文件操作中,使用关键字()可以在文件访问后自动将其关闭。A、WithB、assertC、nonlocalD、break【正确答案】:A27.Apriori算法主要使用标准的发现关联规则的步骤,先发现数据中的(),然后从中产生关联规则。A、聚类数据集B、中位数C、拟合数据集D、频繁项目集【正确答案】:D28.以下卷积神经网络模型中,最早用于手写数字识别的是()A、LeNet-5B、AlexNetC、ResNet50D、ResNet152【正确答案】:A解析:

最早用于手写数字识别的卷积神经网络模型是LeNet-529.当训练数据较少时更()发生过拟合。A、不容易B、容易C、不会【正确答案】:B30.C(B|A)表示在规则A->B中,证据A为真的作用下结论B为真的A、可信度B、信度C、信任增长度D、概率【正确答案】:B31.字典中多个元素之间使用____分隔开,每个元素的“键”与“值”之间使用____分隔开。A、逗号、分号B、逗号、冒号C、分号、逗号D、分号、分号【正确答案】:B32.数据库系统的核心是()A、数据库B、数据库管理系统C、数据模型D、软件工具【正确答案】:B33.对一班只坐了10个人的国际航班进行新冠病毒筛查,方案如下:从该航班中随机选取三个人进行测试(所有人员在飞机上相互隔离,不存在相互传染的可能性),如果三人中至少有一人在测试时结果呈现阳性,那么这趟航班所有人员都将被拒收。假设某人为阳性且被设备正常检测出的概率为0.95,而检测为阴性的人被设备误判为阳性的概率为0.01,已知这趟航班的10名人员有四人为阳性,则这趟航班被接收的概率约为()。A、0.157B、0.167C、0.177D、$0.19【正确答案】:D解析:

按照条件概率乘法法则P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),如上公式也可变形为:P(A)=P(A|B)*P(B)/P(B|A)。设事件A表示该航班被接收,事件Bi表示测试的人中有i个阳性,利用含完备事件组的贝叶斯公式可算出这趟航班被接收的概率为0.18734.如果从来样(sampling)的角度来看待数据集的划分过程,则保留类别比例的采样方式通常称为()。A、分层采样B、留出采样C、随机采样D、泛化采样【正确答案】:A35.下列哪项不属于知识图谱的分布式表示方法()A、word2vecB、TransDC、TransHD、TransE【正确答案】:A解析:

word2vec属于文字的向量表示。36.下列对人工智能芯片的表述,不正确的是()。A、一种专门用于处理人工智能应用中大量计算任务的芯片B、能够更好地适应人工智能中大量矩阵运算C、目前处于成熟高速发展阶段D、相对于传统的CPU处理器,智能芯片具有很好的并行计算性能【正确答案】:C37.()是建立在numpy基础上的高效数据分析处理库,是Python的重要数据分析库。A、numpyB、pandasC、MatplotlibD、PIL【正确答案】:B解析:

pandas是建立在numpy基础上的高效数据分析处理库,是Python的重要数据分析库。38.在安装Linux操作系统时,必须创建的两个分区?A、/和/bootB、/和/swapC、/home和/usrD、/var和/trap【正确答案】:B解析:

解析:1,/,根分区,一般所有文件都放在根目录下。

2,swap,虚拟内存,交换分区,一般大小为机器内存的1-2倍。

起码有如上两个分区才可以安装linux系统39.隐马尔可夫模型(HiddenMarkovModel,简称HMM)主要用于(___)数据建模A、时长B、时间C、时态D、时序【正确答案】:D解析:

数学基础40.以下哪种情况说明模型出现了过拟合()A、模型对训练集拟合程度高,对测试集拟合程度高B、模型对训练集拟合程度高,对测试集拟合程度低C、模型对训练集拟合程度低,对测试集拟合程度高D、模型对训练集拟合程度低,对测试集拟合程度低【正确答案】:B41.两个变量线性相关的强度以及这些变量的尺度,一般用()来衡量。A、方差B、期望C、协方差D、标准差【正确答案】:C解析:

参考《深度学习》P5542.比较成熟的分类预测模型算法包括Logistic回归模型、广义线性模型、()、神经网络A、决策树B、arima模型C、holt-winter模型D、k-means模型【正确答案】:A43.有两个样本点,第一个点为正样本,它的特征向量是(0,-1);第二个点为负样本,它的特征向量是(2,3),从这两个样本点组成的训练集构建一个线性SVM分类器的分类面方程是()。A、2x+y=4B、x+2y=5C、x+2y=3D、2x-y=0【正确答案】:C解析:

对于两个点来说,最大间隔就是两点连线的垂直平分线,因此求出垂直平分线即可。44.模型刷新就是典型的利用新数据重新训练模型的方式,其关键是训练前的()A、数据整理B、数据预处理C、数据挖掘D、数据准备【正确答案】:D45.下列关于Python函数调用说法错误的是()。A、函数的递归调用必须有一个明确的结束条件B、函数的递归调用每次进入更深一层递归时,问题规模相比上次递归都应有所减少C、函数的递归调用效率不高,递归层次过多会导致栈溢出(在计算机中,函数调用是通过栈(stack)这种数据结构实现的,每当进入一个函数调用,栈就会加一层栈帧,每当函数返回,栈就会减一层栈)D、函数的递归调用由于栈的大小是无限的,所以,递归调用的次数过多,也不会导致栈溢出【正确答案】:D46.下面哪个/些超参数的增加可能会造成随机森林数据过拟合?1树的数量2树的深度3学习速率A、只有1B、只有2C、只有3D、都正确【正确答案】:B解析:

通常情况下,我们增加树的深度有可能会造成模型过拟合。学习速率在随机森林中并不是超参数。增加树的数量可能会造成欠拟合47.PCA的步骤不包括()A、构建协方差矩阵B、矩阵分解得到特征值和特征向量C、特征值排序D、特征值归一化【正确答案】:D48.MapReduce默认的分区函数是()。A、hashB、diskC、reduceD、map【正确答案】:A49.下面的数据中哪个不属于噪声数据()A、重复数据B、虚假数据C、错误数据D、异常数据【正确答案】:A50.神经网络训练过程中,一般会遇到停滞期,即神经网络在进入全局最小值之前陷入局部最小值。以下哪个策略可以避免上述情况?A、增加参数数量B、减少参数数量C、在开始时将学习率降低10倍D、改变几个时期的学习率【正确答案】:D51.我国《新一代人工智能发展规划》中规划,到()年成为世界主要人工智能创新中心。A、2020B、2025C、2030D、$2,035【正确答案】:C解析:

《国务院关于印发新一代人工智能发展规划》二、总体要求:(三)战略目标提到52.有一长为16m的篱笆,要围成一个矩形场地,则矩形场地的最大面积是________m2A、16B、14C、15D、$18【正确答案】:A解析:

解析:设矩形的长为xm,则宽为(16-2x)/2=(8-x)m(053.下列哪项不是机器学习中基于实例学习的常用方法()A、K近邻方法B、局部加权回归法C、基于案例的推理D、Find-s算法【正确答案】:D54.以下()不属于数据统计分析工具。A、WekaB、SASC、SPSSD、Matlab【正确答案】:A55.()是一种模拟人类专家解决领域问题的计算机程序系统。A、专家系统B、进化算法C、遗传算法D、禁忌搜索【正确答案】:A解析:

专家系统能够利用人类专家的知识和解决问题的方法来处理该领域问题。56.________命令既可以删除列表中的一个元素,也可以删除整个列表。A、delB、deleteFromC、deleteD、drop【正确答案】:A57.关于Python内存管理,下列说法错误的是()。A、变量不必事先声明B、变量无须先创建和赋值而直接使用C、变量无须指定类型D、可以使用del释放资源【正确答案】:B58.HiAI移动计算平台提供丰富的上层功能业务API,可在移动设备高效运行。A、TRUEB、FALSE【正确答案】:A59.从产品形态看,以下()属于数据产品中的知识类产品。A、规约数据B、摘录C、规则库D、数据业务化【正确答案】:C60.最小二乘法就是试图找到一条直线,使所有样本到直线上的()之和最小。A、曼哈顿距离B、欧氏距离C、马氏距离D、切比雪夫距离【正确答案】:B61.在Matplotlib库中,plt.savefig()将输出图形存储为文件,默认为()格式,可以通过dpi修改输出质量。A、PNGB、JPEGC、JPGD、PS【正确答案】:A解析:

在Matplotlib库中,plt.savefigPNG将输出图形存储为文件,默认为PNG格式,可以通过dpi修改输出质量。62.下面关于最小二乘法(OrdinaryLeastSquares)的说法,正确的是:A、最小二乘法是通过最小化预测值y和真实的y在训练数据上的误差来寻找最优解的方法B、当自变量X的特征很多的时候,使用最小二乘法可以求得最优解C、最小二乘法是通过求导来找出最优解,是一种迭代的方法D、使用最小二乘法求最优解比梯度下降方法好【正确答案】:A63.当需要在字符串中使用特殊字符时,python使用()作为转义字符。A、\B、/C、#D、%【正确答案】:A解析:

当需要在字符串中使用特殊字符时,python使用\作为转义字符。64.关于K均值和DBSCAN的比较,以下说法不正确的是()A、K均值丢弃被它识别为噪声的对象,而DBSCAN一般聚类所有对象B、K均值使用簇的基于原型的概念,而DBSCAN使用基于密度的概念C、K均值很难处理非球形的簇和不同大小的簇,DBSCAN可以处理不同大小和不同形状的簇D、K均值可以发现不是明显分离的簇,即便簇有重叠也可以发现,但是DBSCAN会合并有重叠的簇【正确答案】:A65.假如我们建立一个60000个特征,1000万数据集的机器学习模型,我们怎么有效的应对这样的大规模数据的训练A、对样本进行抽样,在经过抽样的样本上训练B、应用PCA算法降维,减少特征数量C、根据重要性对特征进行筛选D、以上所有【正确答案】:D66.感知机由()神经元组成。A、两层B、三层C、一层D、四层【正确答案】:A67.如果将时间序列绘制成图,时间序列通常会表现出以下特征中的一种多多种,()、离群值、季节性周期变化。A、聚合B、趋势C、连续D、回归【正确答案】:B68.智能语音应用中具备辨别声音来源方向的硬件设备/技术是()A、语音识别B、语种识别C、说话人识别D、麦克风阵列【正确答案】:D解析:

麦克风阵列是一组位于空间不同位置的全向麦克风按一定的形状规则布置形成的阵列,加上相应的算法就可以解决声源定位69.下面哪个文件定义了网络服务的端口?A、/etc/netportB、/etc/servicesC、/etc/serverD、/etc/netconf【正确答案】:B解析:

解析:每个网络服务会绑定自己的端口,/etc/services只是默认端口.上面的文件并不能决定服务用哪个端口70.某数据框df需要进行多条件筛选,其一般性语法为A、df.loc[(筛选条件1)&&(筛选条件2)]B、df.loc[(筛选条件1)且(筛选条件2)]C、df.loc[(筛选条件1)and(筛选条件2)]D、df.loc[(筛选条件1)&(筛选条件2)]【正确答案】:D解析:

pandas中多条件筛选条件之间用&连接71.有三种方法可以帮助决策者确定决策的作用:()、场景分析和What-If分析A、建模B、测试C、假设分析D、回归分析【正确答案】:B72.什么命令用来只更新已经安装过的rpm软件包?A、rpm-U*.rpmB、rpm-F*.rpmC、rpm-e*.rpmD、rpm-q*.rpm【正确答案】:B解析:

解析:rpm命令是RPM软件包的管理工具。rpm原本是RedHatLinux发行版专门用来管理Linux各项套件的程序,由于它遵循GPL规则且功能强大方便,因而广受欢迎。逐渐受到其他发行版的采用。RPM套件管理方式的出现,让Linux易于安装,升级,间接提升了Linux的适用度。73.如果一个SVM模型出现欠拟合,那么下列哪种方法能解决这一问题?()A、增大惩罚参数C的值B、减小惩罚参数C的值C、减小核系数(gamma参数)【正确答案】:A74.Hadoop的作者是下面哪一位()。A、MartinFowlerB、DougcuttingC、KentBeckD、GraceHopper【正确答案】:B75.已知函数y=f(x)=x^2+1,则在x=2,Δx=0.1时,Δy的值为()A、0.4B、0.41C、0.43D、$0.44【正确答案】:B解析:

选B.Δy=f(2.1)-f(2)=2.12-22=0.41.76.以下激活函数中,不具有“正向无边界”特征的是?A、ReLUB、SigmoidC、softplusD、Mish【正确答案】:B77.下列选项中,不属于生物特征识别技术的是()A、步态识别B、声纹识别C、文本识别D、虹膜识别【正确答案】:C78.()技术可以将所有数据的特性通过图的方式展现出来。A、支持向量机B、神经网络C、数据可视化D、数据挖掘【正确答案】:C79.添加用户时使用参数()可以指定用户目录。A、-dB、-pC、-uD、-c【正确答案】:A80.为了更好的了解需要分析的时间序列,时间序列分析通常从绘制时间序列的()开始。A、回归曲线B、散点图C、分布图D、线性关系【正确答案】:B81.()是一种基于贝叶斯法则为基础的,通过概率手段进行学习的方法。A、遗传算法B、分析学习C、归纳学习D、贝叶斯学习【正确答案】:D82.关于“与/或”图表示法的叙述中,正确的是:。A、“与/或”图就是用“AND”和“OR”连续各个部分的图形,用来描述各部分的因果关系。B、“与/或”图就是用“AND”和“OR”连续各个部分的图形,用来描述各部分之间的不确定关系。C、“与/或”图就是用“与”节点和“或”节点组合起来的树形图,用来描述某类问题的层次关系。D、“与/或”图就是用“与”节点和“或”节点组合起来的树形图,用来描述某类问题的求解过程。【正确答案】:D83.对于神经网络的说法,下面正确的是:()A、增加神经网络层数,可能会增加测试数据集的分类错误率B、减少神经网络层数,总是能减小测试数据集的分类错误率C、增加神经网络层数,总是能减小训练数据集的分类错误率【正确答案】:A84.()主要提供内存计算框架A、Spark核心层B、资源计算层C、服务核心层D、Spark层【正确答案】:A85.已知x=3,那么执行语句x*=6之后,x的值为_________。A、18B、9C、3D、$2【正确答案】:A86.python包安装命令正确的是A、pipinstallxxxB、condainstallxxxC、pythoninstallxxxD、ipythoninstallxxx【正确答案】:A87.变量[0,0,1,1,1]的信息熵为()。A、-(3/5log(3/5)+2/5log(2/5))B、3/5log(3/5)+2/5log(2/5)C、2/5log(3/5)+3/5log(2/5)D、3/5log(2/5)–2/5log(3/5)【正确答案】:A解析:

H(X)=-sum(p(xi)*log(p(xi)))(i=1,2,3,…,n)88.优秀的编程规范应该是()A、模块的内聚程度要尽量高,且各模块间的耦合程度要尽量强B、模块的内聚程度要尽量高,且各模块间的耦合程度要尽量弱C、自模块的内聚程度要尽量低,且各模块间的耦合程度要尽量弱D、模块的内聚程度要尽量低,且各模块间的耦合程度要尽量强【正确答案】:B解析:

优秀的编程规范应该是模块的内聚程度要尽量高,且各模块间的耦合程度要尽量弱89.信念传播算法将变量消去法中的求和操作看作一个()过程,较好地解决了求解多个边际分布时的重复计算问题。A、消息传递B、消息累加C、消息分辨D、以上都对【正确答案】:A90.以下技术中,不属于人工智能技术的是()A、自动计算,通过编程计算456*457*458*459的值B、文字识别,如通过OCR快速获得的图像中出汉字,保存为文本C、语音输入,通过话筒将讲话内容转成文本D、麦克风阵列,如利用灵云该技术实现远场语音交互的电视【正确答案】:A解析:

自动计算不属于人工智能技术。91.从已知事实出发,通过规则库求得结论的产生式系统的推理方式是A、正向推理B、反向推理C、双向推理D、目标驱动推理【正确答案】:A92.pandas每个索引都有一些方法和属性,下列()方法用来删除传入的值,并得到新的Index。A、diffB、deleteC、dropD、isin【正确答案】:C解析:

pandas每个索引都有一些方法和属性,下列drop方法用来删除传入的值,并得到新的Index。93.python内置函数isinstance的作用是A、判断一个对象是否是一个已知的类型B、判断一个对象是否是一个已知的变量C、判断一个对象是否是一个已知的实例D、判断一个对象是否是一个已知的函数【正确答案】:A解析:

解析:isinstance()函数来判断一个对象是否是一个已知的类型,类似type()94.下面()不是Python合法的标识符。A、int32B、selfC、_name_D、40XL【正确答案】:D95.下列哪个模型属于无监督学习A、KNN分类B、逻辑回归C、DBSCAND、决策树【正确答案】:C96.描述性分析主要关注的是()A、“过去”,回答“已发生什么”B、“过去”,回答“为什么发生”C、“模拟与优化”的问题D、“未来”,回答“将要发生什么”【正确答案】:A97.用树形结构来表示实体之间联系的模型称为A、关系模型B、层次模型C、网状模型D、数据模型【正确答案】:B解析:

层次模型是最早发展出来的数据库模型。它的基本结构是树形结构,这种结构方式在现实世界中很普遍,如家族结构、行政组织机构,它们自顶向下、层次分明。98.关于“与/或”图表示知识的叙述,错误的有()。A、用“与/或”图表示知识方便使用程序设计语言表达,也便于计算机存储处理B、“与/或”图表示知识时一定同时有“与节点”和“或节点”C、“与/或”图能方便地表示陈述性知识和过程性知识D、能用“与/或”图表示的知识不适宜用其他方法表示【正确答案】:D解析:

D选项说法太绝对。“与/或”图可以系统地将整个问题分解为互相独立的小问题,然后分而解决。“与/或”图是由“与节点”及“或节点”组成的结构图。99.(A->B)∧A=>B是A、附加律B、拒收律C、假言推理D、US【正确答案】:C100.感知机描述错误的是A、感知机根据正确的程度进行权重调整B、输入层接收外界输入信号传递给输出层C、输出层是M-P神经元D、感知机能容易实现逻辑与、或、非运算【正确答案】:A解析:

感知机由两层神经元组成,输入层接收外界输入信号后传递给输出层,输出层是M-P神经元,亦称“阔值逻辑单元”,感知机能容易地实现逻辑与、或、非运算101.np.exp(x).round(5)的结果是2.71828,x的值是()A、0B、1C、2D、$2.72【正确答案】:B解析:

见函数库102.在Linux系统中,下列哪个命令可以用来查看kernel版本信息:()A、checkB、lskernelC、kernelD、uname【正确答案】:D103.操作系统主要是对计算机系统的全部()进行管理,以方便用户、提高计算机使用效率的一种系统软件。A、应用软件B、系统软硬件C、资源D、设备【正确答案】:C104.下列关于线性回归分析中的残差(Residuals)说法正确的是A、残差均值总是为零B、残差均值总是小于零C、残差均值总是大于零D、以上说法都不对【正确答案】:A解析:

线性回归分析中,目标是残差最小化。残差平方和是关于参数的函数,为了求残差极小值,令残差关于参数的偏导数为零,会得到残差和为零,即残差均值为零。105.()的本质是一种逼近离散值目标函数的过程。A、基于实例学习B、概念学习C、决策树学习D、人工神经网络学习【正确答案】:C106.协同过滤和基于内容的模型是两种流行的推荐引擎,在建立这样的算法中NLP扮演什么角色?A、从文本中提取特征B、测量特征相似度C、为学习模型的向量空间编程特征D、以上都是【正确答案】:D107.特征A对训练数据集D的信息增益比的定义是()和()之比。A、信息增益与训练数据集的信息熵之比B、信息增益与训练数据集的经验熵之比C、信息增益与训练数据集的条件熵之比D、信息增益与训练数据集的交叉熵之比【正确答案】:B解析:

当熵和条件熵中的概率由数据估计(特别是极大似然估计)得到时,所对应的熵与条件熵分别称为经验熵(empiricalentropy)和经验条件熵(empiricalconditionalentropy)。108.神经网络研究属于下列哪个学派?A、符号主义B、连接主义C、行为主义D、以上都不是【正确答案】:B109.下列关于JupyterNotebook的描述错误的是A、JupyterNotebook有两种模式:编辑模式、命令模式B、JupyterNotebook有两种形式的单元:Code单元、Markdown单元C、JupyterNotebookMarkdown可以使用LaTeX语法D、JupyterNotebook可以支持Python等多种语言【正确答案】:B解析:

JupyterNotebook有三种形式的单元:Code单元、Markdown单元、原始单元110.Transformer架构首先是由下列哪项引入的?A、GloVeBERTC、OpenAI'sGPTD、ULMFit【正确答案】:C111.深度学习中如果神经网络的层数较多比较容易出现梯度消失问题。严格意义上来讲是在以下哪个环节出现样度消失间题?A、反向传播更新参数B、正向传播更新参数C、反向传播计算结果D、正向传播计算结果【正确答案】:A112.以下哪种方法不属于数据转换方法()。A、分箱B、数据调整C、数据清理D、数据重新编码【正确答案】:C113.()是时间序列分析中最灵活和准确的方法。A、指数平滑模型B、自回归模型C、移动平均模型D、差分自回归移动平均模型【正确答案】:A114.探究数据科学的流程是()。A、采集、探索、加工、验证、建模、报告B、采集、探索、加工、建模、验证、报告C、探索、采集、加工、验证、建模、报告D、探索、采集、加工、建模、验证、报告【正确答案】:B115.下列关于Python的说法中,错误的是()。A、Python是从ABC发展起来的B、Python源程序需编译和连接后才可生成可执行文件C、Python是开源的,它可以被移植到许多平台上D、Python是一门高级的计算机语言【正确答案】:B116.在已知模型的环境中学习称为()。A、已知模型学习B、有模型学习C、模型学习D、学习模型【正确答案】:B117.在人工神经网络算法中,不属于实现“人工神经元”的方法的有()。A、感知器B、线性单元C、Sigmoid单元D、Untied单元【正确答案】:D118.Prolog语言的三种基本语句是:。A、顺序、循环、分支B、陈述、询问、感叹C、事实、规则、询问D、肯定、疑问、感叹【正确答案】:C119.以下对文件描述错误的是()。A、文件是一个存储在辅助存储器上的数据序列B、文本文件和二进制文件都是文件C、文件中可以包含任何数据内容D、文本文件不能用二进制文件方式读入【正确答案】:D120.HBase依靠()存储底层数据。A、HDFSB、HadoopC、MemoryD、MapReduce【正确答案】:A121.以下说法错误的一项是()A、负梯度方向是使函数值下降最快的方向B、当目标函数是凸函数时,梯度下降法的解是全局最优解C、梯度下降法比牛顿法收敛速度快D、拟牛顿法不需要计算Hesse矩阵【正确答案】:C122.选择直接把最终将要使用的学习器的性能作为特征子集的评价标准的是()A、子集的搜索与评价B、过滤式选择C、包裹式选择D、压缩感知【正确答案】:C123.下面哪个是Python中的不变的数据结构()。A、setB、listC、tupleD、dict【正确答案】:C解析:

tuple元组与列表list相似,但是tuple不可改变。set集合,dict字典。124.HUAWEIHiAI平台中的人脸检测是属于哪个模块?A、HiAIEngineB、HiAIFrameworkC、HiAIFoundationD、HiAIService【正确答案】:A125.利用计算机来模拟人类的某些思维活动,如医疗诊断、定理证明,这些应用属于()A、数值计算B、自动控制C、人工智能D、模拟仿真【正确答案】:C126.在方差分析中,()反映的是样本数据与其组平均值的差异。A、总离差B、组间误差C、抽样误差D、组内误差【正确答案】:D127.以下()属于数据统计方法中的离中趋势分析。A、数值平均数B、位置平均数C、离散系数D、线性相关【正确答案】:C128.从加工程度看,以下()属于数据产品中的应用类产品。A、洞见与行动B、实施指南C、桌面应用D、预料库【正确答案】:C129.下列不是知识表示法的是()A、计算机表示法B、谓词表示法C、框架表示法D、产生式规则表示法【正确答案】:A130.C5.0和QUEST决策树只能处理()目标值的问题。A、随机型B、连续型C、离散型D、分类型【正确答案】:D131.Root用户无法在装有Atlas300(3000)加速卡的服务器上安装DDK(DeviceDevelopmentKit),只能使用普通用户进行安装。A、TRUEB、FALSE【正确答案】:A132.以下不属于数据变换的方法有()A、平滑处理B、标准化C、特征构造D、去除虚假数据【正确答案】:D133.一个SVM模型存在欠拟合问题,下面怎么做能提高模型的性能?A、增大惩罚参数CB、减小惩罚参数CC、减小核函数系数(gamma值)D、增大核函数系数(gamma值)【正确答案】:A解析:

C值小时对误差分类的惩罚减小,当C趋于0时,表示我们不再关注分类是否正确,只要求margin越大,容易欠拟合。134.图像识别任务可以分为三个层次,根据处理内容的抽象性,从低到高依次为A、图像分析,图像处理,图像理解B、图像分析,图像理解,图像处理C、图像处理,图像分析,图像理解D、图像理解,图像分析,图像处理【正确答案】:C解析:

图像识别任务可以分为三个层次,根据处理内容的抽象性,从低到高依次为图像处理,图像分析,图像理解135.在数据预处理阶段,我们常常对数值特征进行归一化或标准化(standardization,normalization)处理。这种处理方式理论上不会对下列哪个模型产生很大影响?()A、k-MeansB、k-NNC、决策树【正确答案】:C136.()学派认为未知参数与其他变量一样,都是随机变量,因此参数估计和变量推断能统一在推断框架下进行。A、贝叶斯B、珀尔C、马尔可夫D、切比雪夫【正确答案】:A137.面向对象方法中,继承是指()。A、—组对象所具有的相似性质B、—个对象具有另一个对象的性质C、各对象之间的共同性质D、类之间共享属性和操作的机制【正确答案】:D138.以下()属于数据可视化方法体系中的基础方法。A、视觉编码方法论B、视觉隐喻C、地理信息可视化D、时变数据可视化【正确答案】:B139.人工智能发展历程中第二次热潮是()期间的算法应用升级。A、20世纪50年代B、20世纪70年代C、20世纪80年代D、2006年

【正确答案】:C解析:

人工智能发展历程中第二次热潮是20世纪80年代算法应用升级。140.()的人工神经网络适合学习、分类等应用。A、反馈型B、随机型网络C、自组织竞争型D、前向型【正确答案】:D141.下列哪个不是专门用于可视化时间空间数据的技术:()A、等高线图B、饼图C、曲面图D、矢量场图【正确答案】:B142.python安装拓展库常用的工具是A、yumB、prmC、pipD、install【正确答案】:C143.Numpy中创建全为0的矩阵使用A、zerosB、onesC、emptyD、arange【正确答案】:A144.运行一个脚本,用户不需要什么样的权限?A、readB、writeC、executeD、browseonthedirectory【正确答案】:B解析:

解析:文件的读、写、执行权限:

读read——>允许查看文件的内容,包括的命令:cat、vim、grep、head、tail、more、less等--r

写write——>允许修改文件内容,包括的命令:vim、>>、>(重定向)--w

执行execute——>运行脚本里的命令:./a.sh(相对路径)、/lianxi/a.sh(绝对路径)直接运行文件,需要给脚本文件授予可执行权限.--x145.以下对Hash函数的特征描述错误的是()A、容易计算B、单向性C、需要加密处理D、抗碰撞性【正确答案】:C146.下列哪项不是构建知识图谱用到的主要技术()A、词性标注B、实体链接C、关系抽取D、命名实体识别【正确答案】:A解析:

词性标注不是构建知识图谱用到的主要技术147.范数是将向量映射到()的函数。A、正值B、负值C、非负值D、非正值【正确答案】:C解析:

范数是将向量映射到非负值的函数。148.剪枝方法和程度对决策树泛化性能的影响相当显著,有实验研究表明,在数据带有噪声时通过剪枝甚至可将决策树的泛化性能提高()。A、0.2B、0.25C、30%

D、$0.35【正确答案】:B149.逻辑回归模型中的激活函数Sigmoid函数值范围是A、[0,1]B、[-1,1]C、(-∞~∞)D、(0,1)【正确答案】:D解析:

Sigmoid函数将变量映射在0至1之间150.下列哪部分不是专家系统的组成部分()A、用户B、综合数据库C、推理机D、知识库【正确答案】:A151.电力专用纵向加密认证装置是嵌入式设备,主要模块包括非Intel指令CPU、千/百兆网络接口、双电源模块、()等等A、GPS芯片B、GPRS芯片C、电力专用加密算法芯片D、天线【正确答案】:C解析:

电力专用纵向加密认证装置是嵌入式设备,主要模块包括非Intel指令CPU、千/百兆网络接口、双电源模块、电力专用加密算法芯片等等152.TensorF1ow是下列哪个公司首先开发的?A、OracleB、FacebookC、英伟达D、Google【正确答案】:D解析:

TensorFlow由谷歌人工智能团队谷歌大脑(GoogleBrain)开发和维护153.下列不属于人工智能学派的是A、符号主义B、行为主义C、机会主义D、连接主义【正确答案】:C解析:

人工智能学派为符号主义学派、连接主义学派、行为主义学派154.为了解决如何模拟人类的感性思维,例如视觉理解、直觉思维、悟性等,研究者找到的一个重要的信息处理的机制是()。A、专家系统B、人工神经网络C、模式识别D、.智能代理【正确答案】:B解析:

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。155.表达式int('101',2)的值为______。A、5B、6C、10D、$3【正确答案】:A156.下列()不是多艾真体系统的模型A、bdi模型B、协商模型C、联合规划模型D、自协调模型【正确答案】:C157.()决策树选择信息增益最大的属性来划分。A、CART决策树B、C4.5算法C、多变量决策树D、ID3算法【正确答案】:D158.深度学习可以用在下列哪项NLP任务中A、情感分析B、问答系统C、机器翻译D、所有选项【正确答案】:D159.避免由于过拟合造成貌似线性可分的结果,一个解决的办法是允许支持向量机在一些样本上出错,为此引入()的概念。A、软间隔B、正则化C、硬间隔D、核函数【正确答案】:A160.下列神经网络特点描述错误的是A、适应性B、由简单单元组成C、广泛并行互连的网络D、线性特性【正确答案】:D解析:

神经网络中的神经元接收到的总输入值将与神经元的阀值进行比较,然后通过“激活函数”处理以产生神经元的输出,激活函数时非线性函数161.贝叶斯学习是一种以贝叶斯法则为基础的,并通过()手段进行学习的方法。A、逻辑B、概率C、推理D、假定【正确答案】:B162.关于bagging下列说法错误的是:()A、各基分类器之间有较强依赖,不可以进行并行训练。B、最著名的算法之一是基于决策树基分类器的随机森林。C、当训练样本数量较少时,子集之间可能有重叠。D、为了让基分类器之间互相独立,需要将训练集分为若干子集。【正确答案】:A163.用于终止某一进程执行的命令是()A、endB、stopC、killD、free【正确答案】:C164.数据管理以()活动为基础。A、数据分析B、数据处理C、数据预处理D、数据可视化【正确答案】:C165.关于列表的说法,描述错误的是()。A、list是不可变的数据类型B、list是一个有序序列,没有固定大小C、list可以存放任意类型的元素D、使用list时,其下标可以是负数【正确答案】:A166.字典对象的_____方法返回字典的“键”列表。A、keySet()B、keys()C、values()D、list()【正确答案】:B167.目前,绝大部分数据或数据中的绝大部分属于()A、结构化数据B、半结构化数据C、非结构化数据D、大数据【正确答案】:C168.计算numpy中元素个数的方法A、np.sqrt()B、np.size()C、np.identity()D、np.len()【正确答案】:B169.下列哪个函数不可以做非线性激活函数?()A、y=tanh(x)B、y=sin(x)C、y=max(x,0)D、y=2x【正确答案】:D170.输入32*32的图像,用大小5*5的卷积核做步长为1的卷积计算,输出图像的大小是A、28*23B、28*28C、29*29D、23*23【正确答案】:B171.linux操作系统中,文件权限-rwxr-xr-x,对文件拥有者而言,具有()权限。A、可读,可写入,可执行B、可读C、可读,可执行D、可写入【正确答案】:A172.()是一种处理时序数据的神经网络,常用于语音识别、机器翻译等领域。A、前馈神经网络B、卷积神经网络C、循环神经网络D、对抗神经网络【正确答案】:C173.ping使用的协议是:A、TCPB、UDPC、SMBD、ICMP【正确答案】:D解析:

ICMP(InternetControlMessageProtocol)协议是因特网控制报文协议,ICMP常被认为是网络层协议174.TensorFlow程序开发时经常会使用到placeholder,placeholder是指A、常量B、变量C、张量D、占位符【正确答案】:D解析:

Placeholder的中文意思就是占位符因为每增加一个常量,TensorFlow都会在计算图中增加一个结点,所以说拥有几百万次迭代的神经网络会拥有极其庞大的计算图,而占位符却可以解决这一点,它只会拥有占位符这一个结点175.在Python中,设a=2,b=3,表达式a=3值是()A、1B、0C、TrueD、FALSE【正确答案】:C解析:

本题主要考查Python基本运算。Python比较运算优先级高于逻辑运算,因此C选项正确。176.隐马尔可夫模型(HiddenMarkovModel,简称HMM)是结构最简单的(___)?A、动态贝叶斯网B、动态马尔科夫网C、动态拉普拉斯网D、静态马尔可夫网【正确答案】:A解析:

数学基础177.()是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。A、文本识别B、文本分类C、机器翻译D、问答系统【正确答案】:C178.留出法直接将数据集划分为()个互斥的集合A、一B、二C、三D、四【正确答案】:B解析:

留出法直接将数据集划分为两个互斥的集合,其中一个集合作为训练集,另一个作为测试集,在训练集上训练出模型后,用测试集来评估其测试误差,作为对泛化误差的估计179.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?()A、频繁模式挖掘B、分类和预测C、数据预处理D、数据流挖掘【正确答案】:C180.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择?A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法【正确答案】:B181.在scikit-learn中,DBSCAN算法对于()参数值的选择非常敏感A、pB、epsC、n_jobsD、algorithm【正确答案】:B182.二十世纪五十年代到七十年代初,人工智能处于()期。A、理论B、知识C、推理D、智能【正确答案】:C解析:

二十世纪五十年代到七十年代初,人工智能处于推理期。183.Python内置函数______用来返回序列中的最小元素。A、least()B、min()C、mini()D、max()【正确答案】:B184.2018年“全球十大突破性技术”,对抗性神经网络简称为()A、GANB、LSTMCNND、GRU【正确答案】:A解析:

2018年“全球十大突破性技术”,对抗性神经网络简称为GAN185.数据的存储结构分为两种,它们是()A、线性存储和数组存储B、顺序存储和链式存储C、线性存储和树型存储D、数组存储和指针存储【正确答案】:B186.关于“与/或”图表示知识的叙述,错误的有()A、用“与/或”图表示知识方便使用程序设计语言表达,也便于计算机存储处理B、“与/或”图表示知识时一定同时有“与结点”和“或结点”C、“与/或”图能方便地表示陈述性知识和过程性知识D、能用“与/或”图表示的知识不适宜用其他方法表示【正确答案】:D解析:

能用“与/或”图表示的知识也可用其他方法表示187.代码model.fit(mnist.train.inmage,mnist.train.labels.epochs=5)中的epochs参数代表?A、全体训练集将被训练5次B、全体测试集将被测试5次C、全体训练集将被分为6份D、全体训练集将被分为5份【正确答案】:A188.参数估计分为()A、点估计和区间估计B、区间估计和无偏估计C、点估计和无偏估计D、区间估计和一致估计【正确答案】:A189.逻辑回归模型是解决什么问题的模型?A、分类问题B、聚类问题C、回归问题【正确答案】:A190.从已知事实出发,通过规则库求得结论的产生式系统的推理方式是A、正向推理B、反向推理C、双向推理【正确答案】:A191.在统计语言模型中,通常以概率的形式描述任意语句的可能性,利用最大相似度估计进行度量,对于一些低频词,无论如何扩大训练数据,出现的频度仍然很低,下列哪种方法可以解决这一问题A、一元切分B、一元文法C、数据平滑D、N元文法【正确答案】:C192.下面哪个/些超参数的增加可能会造成随机森林数据过拟合()A、树的数量B、树的深度C、学习速率【正确答案】:B193.以下关于NoSQL数据库中分片处理表述不正确的是()。A、通过系统程序员编写代码的方式自行处理B、由数据库系统提供统一的自动分片功能C、提升了NoSQL数据库的读/写性能,尤其是读取性能D、提升了NoSQL数据库的故障恢复能力【正确答案】:A194.()是将比较复杂的问题划分为若干阶段,通过逐段求解,最终求得全局最优解A、线性规划B、整数规划C、多目标规划D、动态规划【正确答案】:D195.最初的决策树算法是心理学家兼计算机科学家EBHunt1962年在研究人类的概念学习过程时提出的CLS,这个算法确立了决策树()的学习策略A、分而治之B、合而治之C、自下而上D、自上而下【正确答案】:A196.下列程序段执行后,输出结果是()。n=1s=1whilenA、24B、10C、120D、$15【正确答案】:A197.在长度为n的顺序表中查找一个元素,假设需要查找的元素有一半的机会在表中,并且如果元素在表中,则出现在表中每个位置上的可能性是相同的。则在平均情况下需要比较的次数大约为A、3n/4B、nC、n/2D、n/4【正确答案】:A解析:

因为需要查找的元素有一半机会在表中,所以二分之--的情况下平均比较次数为n/2,另二分之一的情况下平均比较次数为n。总的平均比较次数为(n/2+n)/2=3n/4。198.下面的语句哪个会无限循环下去:A、forainrange(10):time.sleep(10)B、while1C、whileTrue:breakD、a=[3,-1,',']foriina[:]:ifnota:break【正确答案】:B199.4目前,多数NoSQL数据库是针对特定应用场景研发出来的,其设计遵循()原则,更加强调读写效率、数据容量以及系统可扩展性。A、EASY原则B、READ原则C、BASE原则D、BASIC原则【正确答案】:C200.专家系统是一个复杂的智能软件,它处理的对象是用符号表示的知识,处理的过程是()的过程。A、思维B、思考C、推理D、递推【正确答案】:C201.如果问题存于最优解,则下面几种搜索算法中,()必然能够得到该最优解。A、广度优先搜索B、深度优先搜索C、有界深度优先搜索D、启发式搜索【正确答案】:A202.TCP/IP中,哪个协议是用来进行IP自动分配的?ARPB、NFSC、DHCPDNS【正确答案】:C解析:

解析:DHCP(DynamicHostConfigurationProtocol)动态主机配置协议,位于应用层。当某主机尚未分配IP地址并且被设置为动态获取方式时,DHCP服务器就会根据DHCP协议给作为DHCP客户端的这台主机分配IP,使得主机能够利用这个IP上网203.以下()不属于机器学习中基于实例学习方法。A、ID3算法B、K近邻方法C、局部加权回归法D、基于案例的推理【正确答案】:A204.一般情况,K-NN最近邻方法在()的情况下效果较好.A、样本较多但典型性不好B、样本较少但典型性好C、样本呈团状分布D、样本呈链状分布【正确答案】:B205.HUAWEIHiAIEngine能够轻松将多种AI能力与App集成。A、TRUEB、FALSE【正确答案】:A206.数据分析与数据可视化密不可分,在python中,哪个是常用数据可视化工具。A、pytorchB、numpyC、pyechartsD、json【正确答案】:C解析:

数据分析与数据可视化密不可分,在python中,pyecharts是常用数据可视化工具。207.数据挖掘技术包括三个主要的部分()。A、数据、模型、技术B、算法、技术、领域知识C、数据、建模能力、算法与技术D、建模能力、算法与技术、领域知识【正确答案】:C208.为了充分发挥GPU算力,需要尽可能多的将任务交给GPU执行。现在有一个任务数组T=[1,2,3,4,5],数组元素表示在这1秒内新增的任务个数,且每秒都有新增任务,直到数结束。假设GPU最多一次执行N=3个任务,一次执行耗时1秒,在保证GPU尽量不空闲的情况下,一个GPU最少需要多长时间执行完成?A、5秒B、6秒C、7秒D、8秒【正确答案】:B解析:

如果本次任务大于了GPU最多一次执行的任务数3,那么就得将这次任务交给下一次的任务处理,前三组任务都没有遗留,第四组任务剩余了4-3=1个任务没处理,第五组任务剩余了1+5-3=3个任务没处理,这3个任务需第6秒处理完成。209.()是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。A、机器学习B、深度学习C、有监督学习D、无监督学习【正确答案】:A解析:

机器学习是专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。210.我们想要减少数据集中的特征数,即降维。选择以下适合的方案①使用前向特征选择方法②使用后向特征排除方法③我们先把所有特征都使用,去训练一个模型,得到测试集上的表现然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现,如果表现比原来还要好,我们可以去除这个特征④查看相关性表,去除相关性最高的一些特征A、①②B、②③④C、①②④D、①②③④【正确答案】:D211.()是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。A、文本识别B、机器翻译C、文本分类D、问答系统【正确答案】:B解析:

机器翻译,有时简称为MT(不要与计算机辅助翻译,机助人译(MAHT)或交互式翻译混淆),是计算语言学的一个子领域,它研究如何使用软件将文本或语音从一种语言翻译到另一种语言。212.在图灵奖获得者JimGray看来,人类科学研究活动已经经历过三种不同范式的演变过程,目前正在从()转向A、实验科学范式理论科学范式B、理论科学范式计算科学范式C、计算科学范式数据密集型科学发现范式D、理论科学范式数据密集型科学发现范式【正确答案】:C213.在pytorch中,若网络模型变量名为model,对model.eval()的说法正确的是()A、model.eval()可以在模型训练阶段使用B、model.eval()只能在模型测试阶段使用C、model.eval()在模型验证、模型测试阶段都可以使用D、model.eval()在模型训练、模型验证、模型测试阶段都可以使用【正确答案】:C解析:

model.eval()在模型验证、模型测试阶段都可以使用在模型验证、模型测试阶段都可以使用214.()是一个主要用于绘制二维图形的Python库。用途:绘图、可视化.A、numpyB、pandasC、MatplotlibD、PIL【正确答案】:C解析:

Matplotlib是一个主要用于绘制二维图形的Python库。用途:绘图、可视化.215.若一个属性可以从其他属性中推演出来,那这个属性就是()A、结构属性B、冗余属性C、模式属性D、集成属性【正确答案】:B216.下列朴素贝叶斯估计描述错误的是(___)A、采用属性条件独立性假设;B、假设属性之间相互独立;C、为了避免条件概率是所以属性上的联合概率;D、假设属性之间是相关的;【正确答案】:D解析:

数学基础217.Kvps={‘1’:1,’2’:2}theCopy=kvpskvps[‘1’]=5sum=kvps[‘1’]+theCopy[‘1’]Printsum上述代码的结果是A、1B、2C、10D、$7【正确答案】:C218.以下()为MapReduce计算框架执行流程的第二步骤。A、输入文件B、Map阶段C、中间处理D、Reduce阶段【正确答案】:B219.下列不属于数据脱敏操作必须满足的要求的是A、单向性B、无残留C、易于实现D、双向性【正确答案】:D220.一般来讲,下列语言属于人工智能语言的是()。A、VJB、C#C、FoxproD、LISP【正确答案】:D解析:

软硬件知识221.关于SMO神经网络描述错误的是A、一种竞争学习型的无监督神经网络B、将高维输入数据映射到低维空间,保持输入数据在高维空间的拓扑结构C、SMO寻优目标为每个输出神经元找到合适的权重D、输出层神经元以矩阵方式排列在二维空间【正确答案】:C解析:

SOM的训练目标就是为每个输出层神经元找到合适的权向量,以达到保持拓扑结构的目的222.SOM网络是一种()的无监督神经网络,它能将高维输入数据映射到低维空间。A、竞争学习型B、增量学习型C、在线学习型D、匹配学习型【正确答案】:A223.假设有列表a=['name','age','sex']和b=['Dong',38,'Male'],请使用一个语句将这两个列表的内容转换为字典,并且以列表a中的元素为“键”,以列表b中的元素为“值”,这个语句可以写为A、c=dict(zip(b,a))&B、&c=dict(zip(a,b))&C、&c=dict(list(a,b))&D、&c=dict(list(b,a))【正确答案】:B解析:

见函数库224.任意长度的Python列表、元组和字符串中最后一个元素的下标为____。A、1B、NullC、-1D、$0【正确答案】:C225.函数f(x)=2x^2-1在区间(1,1+Δx)上的平均变化率Δy/Δx等于()A、4B、4+2ΔxC、4+2(Δx)2D、4x【正确答案】:B解析:

解析:选B.因为Δy=[2(1+Δx)2-1]-(2×12-1)=4Δx+2(Δx)2,所以ΔyΔx=4+2Δx,故选B.226.()作为第四次工业革命的核心,其前沿算法和基础理论正在发生巨大变化。A、计算B、模型C、数据D、存储【正确答案】:A解析:

计算作为第四次工业革命的核心,其前沿算法和基础理论正在发生巨大变化。227.以下不是点估计中统计量标准的是()A、无偏性B、一致的C、有效的D、随机性【正确答案】:D228.K折法是下列哪个函数?A、RepeatedKFoldB、KFoldC、LeaveOneOut【正确答案】:B229.某篮运动员在三分线投球的命中率是2(1),他投球10次,恰好投进3个球的概率()。A、128(15)B、16(3)C、8(5)D、16(7)【正确答案】:A230.下列哪项不是目前深度学习的必备技术?A、卷积可视化解释B、反向传播算法C、非线性激活函数D、深度神经网络【正确答案】:A解析:

卷积可视化不是目前深度学习的必备技术231.将输出标记的对数作为线性模型逼近的目标是A、对数几率回归B、对数线性回归C、极大似然法D、正则化【正确答案】:B解析:

对数线性回归在形式上仍是线性回归,但实质上已是在求取输入空间到输出空间的非线性函数映射232.要实现将实数型变量a的值保留三位小数,以下python可以实现的是()A、a%0.001B、a//0.001C、round(a,3)D、round(3,a)【正确答案】:C解析:

本题主要考查Python函数。round(x,n)方法返回x的小数点四舍五入到n个数字,故要实现将实数型变量a的值保留三位小数,可以使用语句round(a,3),故本题选C选项。233.下列哪行python代码有语法错误()A、for(subitem:allItems):B、for(key,value)inip_map:C、withopen(src_file,'r')asread_stream:D、read_stream=open(src_file,'r')【正确答案】:A234.在数据科学项目的活动流程中,()主要回答的是“我们用什么方式记录和展现数据结果”。A、数据的获得与管理B、模式/模型的验证和优化C、结果的可视化与文档化D、模式/模型的应用及维护【正确答案】:C235.第一个成功应用的专家系统是()。A、ELIZAB、DendralC、XconDeepblue【正确答案】:B236.知识图谱中的边称为?A、连接边B、关系C、属性D、特征【正确答案】:B237.()为人工智能技术的发展提供了其所需要的关键要素A、物联网B、大数据C、云计算技术D、以上都是【正确答案】:D解析:

物联网、大数据、云计算技术都是为人工智能技术的发展提供了其所需要的关键要素238.()是利用样本的实际资料计算统计量的取值,并以引来检验事先对总体某些数量特征的假设是否可信作为决策取舍依据的一种统计分析方法A、假设检验B、逻辑分析C、方差分析D、回归分析【正确答案】:A239.对零次数据进行初步加工,不包括()A、清洗B、变换C、集成D、脱敏【正确答案】:D240.决策树中,同一路径上的所有属性之间是()关系A、因果B、相关C、逻辑或D、逻辑与【正确答案】:D241.掷2n+1次硬币,正面向上次数多于反面向上次数的概率是()。A、0.5B、n/(2n+1)C、(n-1)/(2n+1)D、(n+1)/(2n+1)【正确答案】:A解析:

正面多于反面的概率应与反面多于正面的概率一样,又因抛2n+1次硬币,故正反面次数不可能一样,故二者概率均为0.5(亦可根据伯努利分布求解)242.下面哪种写法表示如果cmd1成功执行,则执行cmd2命令?A、cmd1&&cmd2B、cmd1|cmd2C、cmd1D、cmd2E、cmd1||cmd2【正确答案】:A解析:

解析:在linux中,&和&&,|和||:

&表示任务在后台执行,如要在后台运行redis-server,则有redis-server&

&&表示前一条命令执行成功时,才执行后一条命令,如echo'1‘&&echo'2'

|表示管道,上一条命令的输出,作为下一条命令参数,如echo'yes'|wc-l

||表示上一条命令执行失败后,才执行下一条命令,如catnofile||echo"fail"243.()是指能够按照人的要求,在某一个领域完成一项工作或者一类工作的人工智能。A、超人工智能B、强人工智能C、弱人工智能D、人工智能【正确答案】:C244.一种将数据转换成信息的分析过程叫做()。A、描述性分析B、诊断性分析C、预测性分析D、规范性分析【正确答案】:A245.创建一个3x3并且值从0到8的矩阵A、np.arange(9)B、np.arange(9).reshape(3,3)C、np.arange(9).reshape(8)D、np.arange(8).reshape(8)【正确答案】:B246.HBase依赖()提供消息通信机制A、ZookeeperB、ChubbyC、RPCD、Socket【正确答案】:A247.假如你在训练一个线性回归模型,有下面两句话:①如果数据量较少,容易发生过拟合。②如果假设空间较小,容易发生过拟合。关于这两句话,下列说法正确的是?A、①和②都错误B、①正确,②错误C、①错误,②正确D、①和②都正确【正确答案】:B248.a=[[1.,2.,1.],[1.,2.,1.]],a+3的值为()。A、[[1.,2.,1.],[4.,5.,4.]]B、[[4.,5.,4.],[4.,5.,4.]]C、以上都不对D、[[4.,5.,4.],[1.,2.,1.]]【正确答案】:C249.设随机变量X与Y相互独立,且均服从区间[0,3]上的均匀分布,则P{max{X,Y}≤1}=A、1212122022年1月9日B、1212122022年2月9日C、1212122022年1月6日D、1212122022年1月3日【正确答案】:A解析:

P{max{X,Y}≤1}=P{X≤1,Y≤1}=P{X≤1}P{Y≤1}=1/3*1/3=1/9250.哪个范数指向量中各个元素平方和的1/2次方A、p范数B、0范数C、1范数D、2范数【正确答案】:D251.如果处理以下形状的数据时,适宜采用DBSCAN的是A、球形B、SS形C、椭球形D、方形【正确答案】:B252.下列关于L1和L2正则描述错误的是?A、L1和L2正则的引入都能预防过拟合&B、&L1正则的引入会使得权重产生更多的0元素&C、&L1正则兼具特征选择的功能&D、&L1正则项是非凸的,L2正则项是凸的【正确答案】:D解析:

数学基础253.关于“与/或”图表示知识的叙述,错误的有。A、用“与/或”图表示知识方便使用程序设计语言表达,也便于计算机存储处理。B、“与/或”图表示知识时一定同时有“与节点”和“或节点”。C、“与/或”图能方便地表示陈述性知识和过程性知识。D、能用“与/或”图表示的知识不适宜用其他方法表示。【正确答案】:D254.在高斯混合分布中,其隐变量的含义是:A、表示高斯分布的方差B、表示高斯分布的均值C、表示数据分布的概率D、表示数据从某个高斯分布中产生【正确答案】:D解析:

首选依赖GMM的某个高斯分量的系数概率(因为系数取值在0~1之间,因此可以看做是一个概率取值)选择到这个高斯分量,然后根据这个被选择的高斯分量生成观测数据。然后隐变量就是某个高斯分量是否被选中:选中就为1,否则为0。255.根据机器智能水平由低到高,正确的排序是(

)。A、计算智能、感知智能、认知智能B、感知智能、认知智能、计算智能C、计算智能、认知智能、感知智能D、认知智能、计算智能、感知智能【正确答案】:A解析:

计算智能,通常指基于清晰规则的数值运算,比如数值加减、微积分、矩阵分解等。感知智能,其核心在于模拟人的视觉、听觉和触觉等感知能力。认知智能,则具有人类思维理解、知识共享、行动协同或博弈等核心特征。计算智能、感知智能、认知智能,由低到高。答案选A256.机器学习在()正式被视为“解决知识工程瓶颈问题的关键”而走上人工智能主舞台的。A、二十世纪七十年代B、二十世纪六十年代C、二十世纪九十年代

D、二十世纪八十年代

【正确答案】:D257.关于python程序设计语言,下列说法不正确的是()A、python源文件以***.py为扩展名B、python的默认交互提示符是:>>>C、python只能在文件模式中编写代码D、python具有丰富和强大的模块【正确答案】:C解析:

本题主要考查Python程序设计语言。python源文件以***.py为扩展名,python的默认交互提示符是:>>>,python能在文件模式中编写代码,也能在交互模式中编写代码,python具有丰富和强大的模块,故本题选C选项。258.哪项词向量模型支持一词多义?()A、word2vecB、fasttextC、gloveD、elmo【正确答案】:D解析:

elmo支持一词多义259.事务对数据对象加锁后拥有何种控制权是由封锁的()决定的。A、状态B、类型C、种类D、属性【正确答案】:B260.Map阶段的输入是以()形式的行数据。A、字符B、链表C、行列式D、键值对【正确答案】:D261.设矩阵A=[3,-1,-2;1,0,-1;-2,1,4],则A的伴随矩阵(1,2)位置的元素是()。A、-6B、6C、-2D、$2【正确答案】:B262.抛掷一枚质地均匀的硬币,若抛掷95次都是正面朝上,则抛掷第100次正面朝上的概率是()A、小于1/2B、等于1/2C、大于1/2D、无法确定【正确答案】:B解析:

解:∵抛掷一枚质地均匀的硬币是随机事件,正面朝上的概率是

∴抛掷第100次正面朝上的概率是

故答案选:B263.若按照一定的顺序依次访问树中的每一个结点,而且每个结点只被访问一次,则称这样的操作为()A、排序B、查找C、遍历D、建立【正确答案】:C264.下列选项中属于感知技术的是()。A、机器学习技术和计算实施技术B、计算实施技术和语音识别技术C、语音识别技术和机器视觉D、机器视觉和机器学习技术【正确答案】:C解析:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论