版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1392023年人工智能知识考试复习题库500题(含各题型)一、单选题1.当训练数据较少时更()发生过拟合。A、不容易B、容易C、不会答案:B2.一幅256*256的图像,若灰度级数为16,则存储它所需的比特数是()()A、256kB、512kC、1mD、2m答案:A3.长短期记忆LSTM具有与循环神经网络相似的控制流,两者的区别在于LSTM中增加了()导致单元内的处理过程不同。A、输入门B、记忆门C、忘记门D、输出门答案:C4.关于集成学习,下列说法错误的是A、集成学习一定能提升个体学习器的性能B、Bagging方法中,个体学习器之间彼此独立C、Boosting是一种重视错误样本的学习方法D、Boosting方法中,个体学习器存在强依赖答案:A5.考虑某个具体问题时,你可能只有少量数据来解决这个问题。不过幸运的是你有一个类似问题已经预先训练好的神经网络。可以用下面哪种方法来利用这个预先训练好的网络?A、把除了最后一层外所有的层都冻结,重新训练最后一层B、对新数据重新训练整个模型C、只对最后几层进行调参(finetune)D、对每一层模型进行评估,选择其中的少数来用答案:C6.自然语言中的词语需要转化为计算机可以记录处理的数据结构,通常会把自然语言中的词语转化为以下哪种数据结构:A、标量B、向量C、结构体D、有向图答案:B7.设某树的度为3,且度为3的结点数为4,度为1的结点数为9,没有度为2的结点。则该树中总的结点数为A、22B、21C、13D、20答案:A8.关于神经网络的说法中,正确的是()A、增加网络层数,总能减小训练集错误率B、减小网络层数,总能减小测试集错误率C、增加网络层数,可能增加测试集错误率答案:C9.假设你需要调整超参数来最小化代价函数(costfunction),会使用下列哪项技术?A、穷举搜索B、随机搜索C、Bayesian优化D、都可以答案:D10.以下哪个聚类算法不是属于基于原型的聚类()A、模糊均值B、EM算法C、SOMD、LIQUE答案:D11.通过()的方式,可以实现信息更快的向前传播,梯度更快的向后传播A、跨界连接B、跨层短接C、跨级连接D、跨级短接答案:B12.以下说法正确的是()。A、聚类是非监督学习B、分类是非监督学习C、聚类是监督学习D、以上都不对答案:A13.在数据集上使用2-fold交叉验证,应该在kf=KFold(n_splits=_)"_"处填入:A、2B、4C、6$;8%答案:A14.以下关于逻辑回归说法不正确的是A、logistic回归本质上是线性回归B、逻辑回归支持二分类和多分类问题,但不支持连续特征C、logistic回归在特征到结果的映射中加入了一层函数映射,即先把特征线性求和,然后使用函数g(z)作为假设函数来预测。D、逻辑回归支持二分类和多分类问题,支持类别特征,但类别特征在字符串索引后需要进行one-hot算子处理。答案:B15.逻辑回归将输出概率限定在[0,1]之间。下列哪个函数起到这样的作用?A、Sigmoid函数B、tanh函数C、ReLU函数D、LeakyReLU函数答案:A16.GoogLeNet从角度改进了之前的图像分类网络?A、增加网络宽度B、轻量化网络模型C、改善网络退化现象D、增加网络深度答案:A17.小王和老张交换名片后,小王打开手机中安装的灵云智能输入法app,拍照老张的名片,很快得到名片文字信息并保存,这其中最主要应用的技术是()A、模式识别B、文字合成C、图像搜索D、图像还原答案:A18.深度学习可以用在下列哪项NLP任务中A、情感分析B、问答系统C、机器翻译D、所有选项答案:D19.DBSCAN算法将“簇”定义为:由()导出的最大的密度相连样本集合。A、密度直达关系B、密度可达关系C、密度相连关系答案:B20.下列哪项算法构建了深度学习的重要基础:()A、霍夫曼编码B、最大流-最小割算法C、A*算法D、SGD反向传播答案:D21.数据清洗过程不包括A、补全缺失的数据B、修改格式和内容错误的数据C、修改逻辑错误的数据D、数据ETL答案:D22.()是人工智能的核心,是使计算机具有智能的主要方法,其应用遍及人工智能的各个领域。A、深度学习B、人机交互C、机器学习D、智能芯片答案:C23.在一个简单的MLP模型中,输入层有8个神经元,隐藏层有5个神经元,输出层有1个神经元。隐藏输出层和输入隐藏层之间的权重矩阵的大小是多少?A、[1X5],[5X8]B、[8×5],[1×5]C、[5×8],[5×1]D、[5×1],[8×5]答案:D24.下列哪个函数不可以做非线性激活函数?()A、y=tanh(x)B、y=sin(x)C、y=max(x,0)D、y=2x答案:D25.卷积神经网络作为一种常见的深度学习网络结构已被广泛接受,下列任务的主流方法中没有用到卷积神经网络的任务是A、图像风格迁移B、图像分割C、人脸识别D、房价预测答案:D26.下列哪个是CNN网络的超参数。A、权重B、偏置C、激活函数D、学习率答案:D27.以下不是贝叶斯回归的优点的是哪一项A、它能根据已有的数据进行改变B、它能在估计过程中引入正则项C、贝叶斯回归的推断速度快答案:C28.感知器在空间中可以展现为?A、线B、平面C、超平面D、点答案:C29.以下对字典的说法错误的是()。A、字典可以为空B、字典的键不能相同C、字典的键不可变D、字典的键的值不可变答案:D30.循环神经网络优势在于()A、对序列的每个元素进行相同的计算,输出取决于之前的数据状态B、对序列的每个元素进行不同的计算,输出取决于之后的数据状态C、对序列的每个元素进行相同的计算,输出取决于之后的数据状态D、以上都不对答案:A31.下列哪个不是激活函数()。A、sigmodB、reluC、tanhD、hidden答案:D32.将输出标记的对数作为线性模型逼近的目标是(___)。A、对数几率回归B、对数线性回归C、极大似然法D、正则化答案:B33.下列哪个神经网络结构会发生权重共享A、卷积神经网络B、&;&循环神经网络C、&;&全连接神经网络D、&;&卷积和循环神经网络答案:D34.相同的词可以如何实现多个词嵌入?A、GloVeB、Word2VecC、ELMoD、Nltk答案:C35.下列方法中,能够返回某个字串在字符串中出现的次数的是()。A、len()B、count()C、find()D、split()答案:B36.尽管人工智能学术界出现“百家争鸣”的局面,但是,当前国际人工智能的主流派仍属于:()A、连接主义B、符号主义C、行为主义D、经验主义答案:B37.下面关于模型预测性能的评估以及交叉验证,说法正确的是()A、在scikit-learn包里面使用交叉验证方法,可以使用代码:fromsklearnimportcross_validationB、课程中的交叉验证,把数据集分成了5份,其中4份作为训练集,剩下一份作为测试集,这种方法叫做留一交叉验证法C、需要把数据分成训练集和测试集,用测试集来评估从训练集学习得来的模型的预测性能,是因为从训练集学习得来的模型可能对于训练集的数据拟合得很好,但是对于训练集以外的数据没有太大的泛化能力D、从训练集中得到的模型,用训练集的数据得到的预测准确率一般会比用测试集得到的预测准确率低答案:C38.CRF(条件随机场)和HMM(隐马尔可夫模型)之间的主要区别是什么?A、CRF是生成式的,而HMM是判别式模型B、CRF是判别式模型,HMM是生成式模型。C、CRF和HMM都是生成式模型D、CRF和HMM都是判别式模型。答案:B39.一般一颗决策树不包含A、一个根节点B、若干个内部节点C、若干个外部节点D、若干个叶子节点答案:C40.以下哪种问题主要采用无监督学习方法?A、频繁项挖掘B、股价预测C、图像分类D、文本情感分析答案:A41.以下哪种方法不可以有效防止过拟合?()A、使用Mini-batchB、设置EarlyStopingC、使用DropoutD、更换网络架构答案:A42.图像识别任务可以分为三个层次,根据处理内容的抽象性,从低到高依次为A、图像分析,图像处理,图像理解B、图像分析,图像理解,图像处理C、图像处理,图像分析,图像理解D、图像理解,图像分析,图像处理答案:C43.深度学习中神经网络类型很多,以下神经网络信息是单向传播的是:A、LSTMB、卷积神经网络C、循环神经网络D、GRU答案:B44.多义现象可以被定义为在文本对象中一个单词或短语的多种含义共存。下列哪一种方法可能是解决此问题的最好选择?A、随机森林分类器B、卷积神经网络C、梯度爆炸D、上述所有方法答案:B45."df.csv"是一个在当前ipynb文件根目录下的csv表格,该文件具有3列数据,读取过程中为避免将第一行数据读取为dataframe的column名,应采取以下哪种语句读入()A、df=pandas.read_csv('df.csv')B、df=pandas.read_csv('df.csv',header=None)C、df=pandas.read_csv('df.csv')D、df=pandas.read_excel('df.csv',header=None)答案:B46.测试集应尽可能与训练集A、相容B、相等C、互斥D、包含答案:C47.关于集成学习,以下说法错误的是A、集成学习一定能提升个体学习器的性能B、Bagging方法中,个体学习器之间彼此独立C、Boosting是一种重视错误样本的学习方法D、Boosting方法中,个体学习器存在强依赖答案:A48.在执行了以下的文本清理步骤之后,可从下面的语句中生成多少三元组短语(trigram)操作:[1].停用词移除[2].使用单一空格替换标点符号语句:#Analytics-vidhyaisagreatsourcetolearndata_science.A、3B、4C、5D、6答案:C49.DBSCAN在最坏情况下的时间复杂度是()。A、O(m)B、O(m2)C、O(logm)D、O(m*logm)答案:B50.下列哪一项属于特征学习算法(representationlearningalgorithm)?()A、K近邻算法B、随机森林C、神经网络D、都不属于答案:C51.随着卷积层数的增加,下面描述正确的是:①.在一定层数范围内,效果越来越好②.能够抽取的特征更加复杂③.层数越多越容易发生梯度消失A、①③B、①②③C、②③D、①②答案:B52.哪个不是常用的聚类算法()。A、K-MeansB、DBSCANC、GMMsD、Softmax答案:D53.有一个28x28的图片,并使用输入深度为3和输出深度为8在上面运行一个3x3的卷积神经网络。注意,步幅是1,你正在使用相同的填充(padding)当使用给定的参数时,输出特征图的尺寸是多少?()A、13宽、13高、8深B、28宽、28高、8深C、13宽、28高、8深D、28宽、13高、8深答案:B54.如何对featuremaps继续进行卷积操作?通过多通道卷积。假设上一个卷积层已得到3个3X3的featuremaps,3个2x2的卷积核可表示为具有三个通道卷积核立方体,生成一个()大小的featuremap。A、2X2B、3X3C、2X3D、6X6答案:A55.蒙特卡罗强化学习算法的本质,是通过多次尝试后求平均来作为期望累计奖赏的金丝,但它在求平均时是采用哪种方式进行?A、逐一式B、循环式C、分组式D、批处理答案:D56..混沌度(Perplexity)是一种常见的应用在使用深度学习处理NLP问题过程中的评估技术,关于混沌度,哪种说法是正确的?A、混沌度没什么影响B、混沌度越低越好C、混沌度越高越好D、混沌度对于结果的影响不一定答案:B57.基于统计的异常点检测算法不包括A、基于正态分布的异常点检测算法B、基于距离的异常点检测算法C、3δ原则D、简单统计分析答案:A58.变量a的值为字符串类型的“2”,如何将它转换为整型?A、castTolnt(a)B、int(a)C、integer(a)D、castTointeger(a)答案:B59.在集成学习中,当训练数据很多时,最常见的结合策略是()。A、平均法B、投票法C、学习法答案:C60.下列哪项是自然语言处理的Python开发包?A、openCVB、jiebaC、sklearnD、XGBoost答案:B61.标准循环神经网络隐含层的输入对于网络输出的影响随时间A、不断递归而衰退B、不断递归而增强C、先增强后减弱D、先减弱后增强答案:A62.在Python中__________表示空类型。A、NoneB、nullC、undefinedD、0答案:A63.对于一个图像识别问题(在一张照片里找出一只猫),下面哪种神经网络可以更好地解决这个问题?A、循环神经网络B、感知机C、多层感知机D、卷积神经网络答案:D64.如果我们用了一个过大的学习速率会发生什么?()A、神经网络会收敛B、不好说C、都不对D、神经网络不会收敛答案:D65.以下不属于多层前馈神经网络特点的是A、每层神经元与下一层神经元之间完全互连B、每层神经元与下一层神经元之间不完全互连C、神经元之间不存在同层连接D、神经元之间不存在跨层连接答案:B66.半监督学习包括(___)。A、纯半监督学习B、主动学习C、回归学习D、分类学习、答案:A67.不同于通常涉及大量的规则编码的早期常识语言处理,现代NLP算法是基于()A、自动识别B、机器学习C、模式识别D、算法辅助答案:B68.下述()不是人工智能中常用的知识格式化表示方法。A、框架表示法B、产生式表示法C、语义网络表示法D、形象描写表示法答案:D69.下列选项中,不属于深度学习模型的是A、线性回归B、深度残差网络C、卷积神经网络CNND、循环神经网络RNN答案:A70.下面的问题,属于分类问题的是;A、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工在接下来一段时间内的工资涨幅B、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工下一季度的绩效考核分数C、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工是否可能会在接下来的一段时间内离职D、根据员工的薪水、工作压力、成长环境、工作年限、绩效考核等数据,预测员工下一季度的销售额答案:C71.下面不属于有监督学习的算法的是A、决策树B、随机森林C、线性回归D、K-Means答案:D72.超市收银员用扫描器直接扫描商品的条形码,商品的价格信息就会呈现出来,这主要利用了人工智能中的()技术。A、智能代理B、模式识别C、机器翻译D、专家系统答案:B73.人工神经元网络与深度学习的关系是()A、人工神经元网络是深度学习的前身B、深度学习是人工神经元网络的一个分支C、深度学习是人工神经元网络的一个发展D、深度学习与人工神经元网络无关答案:C74.下面哪项操作能实现跟神经网络中Dropout的类似效果A、BoostingB、BaggingC、StackingD、Mapping答案:B75.下列算法常用于聚类的问题是()A、k-meansB、逻辑回归模型C、决策树模型D、随机森林模型答案:A76.以下哪些是通用逼近器?A、KernelSVMB、NeuralNetworksC、BoostedDecisionTreesD、以上所有答案:D77.()有跟环境进行交互,从反馈当中进行不断的学习的过程。A、监督学习B、非监督学习C、强化学习D、线性回归答案:C78.下列关于JupyterNotebook的描述错误的是A、JupyterNotebook有两种模式:编辑模式、命令模式B、JupyterNotebook有两种形式的单元:Code单元、Markdown单元C、JupyterNotebookMarkdown可以使用LaTeX语法D、JupyterNotebook可以支持Python等多种语言答案:B79.数据挖掘技术主要有分类、估计、()、关联分析和预报。A、回归B、统计C、聚类D、假设答案:C80.下列哪一项在神经网络中引入了非线性A、随机梯度下降B、Sigmoid激活函数C、增大权重和偏置的初始化值D、以上都不正确答案:B81.以下关于特征工程的说法不正确的是A、特征工程指的是把原始数据转变为模型的训练数据的过程B、它的目的就是获取更好的训练数据特征,使得机器学习模型逼近这个上限C、特征工程在机器学习中占有非常重要的作用,一般认为括特征构建、特征提取、特征选择三个部分。D、特征提取是从特征集合中挑选一组具有明显物理或统计意义的特征子集。答案:D82.常见的数据集划分方式不包括A、留出法B、装袋法C、交叉验证法D、自助法答案:B83.阅读以下文字:假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置。()A、除去神经网络中的最后一层,冻结所有层然后重新训练B、对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对答案:B84.下面哪项操作能实现跟神经网络中Dropout的类似效果?A、BoostingB、BaggingC、StackingD、Mapping答案:B85.下述()不是人工智能中常用的知识格式化表示方法。A、框架表示法B、产生式表示法C、语义网络表示法D、形象描写表示法答案:D86.在深度学习中,我们经常会遇到收敛到localminimum,下面不属于解决localminimum问题的方法是?()A、随机梯度下降B、设置MomentumC、设置不同初始值D、增大batchsize答案:D87.混淆矩阵中TP=16,FP=12,FN=8,TN=4,精确率是()。A、1212122022年1月4日B、1212122022年1月2日C、1212122022年4月7日D、1212122022年2月3日答案:C88.以下方法属于无监督学习的是?()A、LogisticRegressionB、SVMC、DBSCAND、DecisionTree答案:C89.如果我们希望预测n个类(p1,p2...pk)的概率使得所有n的p的和等于1,那么下列哪个函数可以用作输出层中的激活函数?A、SoftmaxB、ReLuC、SigmoidD、Tanh答案:A90.独热编码的缺点是:①.过于稀疏②.词与词的相关性比较小③.易于编码④.容易存储A、③④B、①②C、①③D、②④答案:B91.数据分析常用包pandas的函数to_datetime可以将字符串转换为时间戳,现需要将”20220601”转换为时间戳,请问下列哪项语句可以实现该项需求A、pd.to_datetime('20220601',format='%Y%m%d')B、pd.to_datetime('20220601',format='%Y%M%d')C、pd.to_datetime('20220601',format='%Y%m%D')D、pd.to_datetime('20220601',format='%Y%M%D')答案:A92.Matplotlib库中,用来绘制等值图的pyplot的基础图标函数是()。A、plt.vlines()B、plt.plot_date()C、plt.contour(X,Y,Z,N)D、plt.specgram(x,NFFT=256,pad_to,F)答案:C93.在python中,x=[11,8,7,2,3],x.insert(4,[4,5]),列表x的值为()。A、[11,8,7,2,[4,5],3]B、[11,8,7,2,4,5,3]C、[11,8,7,[4,5],2,3]D、[11,8,7,4,5,2,3]答案:A94.机器学习中,模型需要输入什么来训练自身,预测未知?A、人工程序B、神经网络C、训练算法D、历史数据答案:D95.图像识别是以图像的主要()为基础的A、元素B、像素C、特征D、部件答案:C96.()的思想是给定训练样例集将样例投影到一条直线上,使得同样例的投影点尽可能接近、异类样例投影点尽可能远离;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投影点的位置来确定样本的类别.A、多分类学习B、对数几率回归C、线性判别分析D、多分类学习答案:C97.OCR是指对文本书面资料(印刷字体、手写字体)的图像文件进行分析识别处理,获取文字及版面信息的过程,其中文全程是()。A、光学字符识别B、文字识别C、字符识别D、书面识别答案:A98.在选择神经网络的深度时,下面哪些参数需要考虑?1神经网络的类型(如MLP,CNN)2输入数据3计算能力(硬件和软件能力决定)4学习速率5映射的输出函数A、1,2,4,5B、2,3,4,5C、都需要考虑D、1,3,4,5答案:C99.回归分析的任务,就是根据()和因变量的观察值,估计这个函数,并讨论与之有关的种种统计推断的问题A、相关变量B、样本C、已知数据D、自变量答案:D100.对线性回归模型进行性能评估时,以下说法正确的是A、均方根误差接近1最好B、均方根误差越大越好C、决定系数越接近1越好D、决定系数越接近0越好答案:C101.下列哪一项在神经网络中引入了非线性?A、随机梯度下降B、修正线性单元(ReLU)C、卷积函数D、以上都不正确答案:B102.为什么批量梯度下降法(BGD)寻优路径相对比较平滑()A、批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值减小的方向B、批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值增加的方向C、批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值不变的方向D、批量梯度下降法(BGD)每一次对模型参数的调整,都朝向代价函数值发生变化的方向答案:A103.机器学习中的决策树学习的本质是一种逼近离散值目标函数的过程,决策树代表的是一种()过程A、预测B、回归C、分类D、聚类答案:C104.以下的场景中,适合使用聚类算法的是:A、根据顾客的年龄、收入、职业、购买频率、购买习惯等相关信息,预测顾客的消费额B、据顾客的年龄、收入、职业、购买频率、购买习惯等相关信息,预测顾客是否会重复购买C、根据顾客的年龄、收入、职业、购买频率、购买习惯等相关信息,把顾客分成不同顾客群体,针对不同的顾客群体采取针对性强的产品推广方法D、据顾客的年龄、收入、职业、购买频率、购买习惯等相关信息,给顾客推荐不同的商品答案:C105.传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,称为什么?A、给定标签B、离散C、分类D、回归答案:D106.关于knn说法不正确的是()A、需要及时测试样本与所有训练样本的距离B、可以用于分类和回归C、有参模型D、是一种基于样本的算法答案:A107.Python内置函数_____用来返回序列中的最大元素。A、maxin()B、max()C、min()D、least()答案:B108.下面哪个选项中哪一项属于确定性算法A、PCAB、K-MeansC、以上都不是D、AB都是答案:A109.对于MLP,输入层中的节点数为10,隐藏层为5.从输入层到隐藏层的最大连接数是:A、50B、小于50C、超过50D、这是一个任意值答案:A110.CNN网络设计中,学习率的设置往往对训练收敛起到关键作用,关于学习率的说法,错误的是()A、学习率太小,更新速度慢B、学习率过大,可能跨过最优解C、学习率也是有网络学习而来D、学习率可在网络训练过程中更改答案:C111.以下不属于回归分析的是()。A、线性回归B、BP神经网络C、ARIMAD、SVM支撑向量机答案:C112.机器学习算法中,以下不属于集成学习策略的是?A、BoostingB、StackingC、BaggingD、Marking答案:D113.下列关于深度学习说法错误的是A、LSTM在一定程度上解决了传统RNN梯度消失或梯度爆炸的问题B、CNN相比于全连接的优势之一是模型复杂度低,缓解过拟合C、只要参数设置合理,深度学习的效果至少应优于随机算法D、随机梯度下降法可以缓解网络训练过程中陷入鞍点的问题答案:C114.下列选项中,哪个不是关键词提取常用的算法()A、TF-IDFB、TextRankC、SSAD、LDA答案:C115.()是下面代码的运行结果。A、importnumpyasnpa=np.arange(12).reshape((3,4))print(mean())[4,5,6,7]B、16.5C、5.5D、[1.5,5.5,9.5]答案:C116.模型出现过拟合,以下何种措施无法降低过拟合现象A、添加正则化项B、降低模型复杂度C、减少训练数据量D、使用Dropout答案:C117.python安装拓展库常用的工具是A、yumB、prmC、pipD、install答案:C118.属于常见损失函数:A、计算预测值函数B、求偏导数函数C、均方误差损失函数D、更新参数函数答案:C119.以下哪些方法不可以直接来对文本分类?A、K-MeansB、决策树C、支持向量机D、kNN答案:A120.为了对某图像中的目标进行分析和识别,一般需要对图像进行()处理。A、图像加噪B、图像采集C、图像压缩D、图像分割答案:D121.在卷积神经网络中,要求输入尺寸必须固定的层是?()A、卷积层B、全连接层C、池化层D、以上都不是答案:B122.深度神经网络的运行过程是由三个算法依次运行组成,下面不属于这三个算法中的是A、归一化B、正向传播C、反向传播D、梯度下降答案:A123.根据机器智能水平由低到高,正确的是()A、计算智能、感知智能、认知智能B、计算智能、感应智能、认知智能C、机器智能、感知智能、认知智能D、机器智能、感应智能、认知智能答案:A124.下面关于Jarvis-Patrik(JP)聚类算法的说法不正确的是()。A、JP聚类擅长处理噪声和离群点,并且能够处理不同大小、形状和密度的簇。B、JP算法对高维数据效果良好,尤其擅长发现强相关对象的紧致簇。C、JP聚类是基于SNN相似度的概念。D、JP聚类的基本时间复杂度为O(m)。答案:D125.人工神经网络学习中()主要采用反向传播算法。A、单元学习算法B、多层网络学习C、决策树学习D、概念学习答案:B126.传统GBDT以()作为基分类器A、线性分类器B、CARTC、gblinearD、svm答案:B127.K折法是下列哪个函数?A、RepeatedKFoldB、KFoldC、LeaveOneOut答案:B128.代码arr5=np.arange(0,6).reshape([2,3]);print(arr5[1,:])的输出结果是()?A、[01]B、[345]C、[23]D、[012]答案:B129.影响基本K-均值算法的主要因素不包括下列哪一个选项?A、样本输入顺序B、模式相似性测度C、聚类准则D、初始类中心的选取答案:C130.以下关于熵、信息增益、基尼指数的相关描述中错误的是A、熵越大,不确定性越大,信息量也就越大B、信息增益越大,表示某个条件熵对信息熵减少程序越大,也就是说,这个属性对于信息的判断起到的作用越大C、Gini指数越大,不纯度越小,越容易区分,越不容易分错D、熵权法是一种客观赋权法,因为它仅依赖于数据本身的离散性答案:C131.在前馈神经网络中,误差后向传播(BP算法)将误差从输出端向输入端进行传输的过程中,算法会调整前馈神经网络的什么参数A、输入数据大小B、神经元和神经元之间连接有无C、相邻层神经元和神经元之间的连接权重D、同一层神经元之间的连接权重答案:C132.在模型中全连接层可采用A、paddle.nn.LinearB、paddle.nn.Conv2DC、paddle.nn.MaxPool2DD、paddle.nn.ReLU答案:A133.对应GradientBoostingtree算法,以下说法正确的是:1.当增加最小样本分裂个数,我们可以抵制过拟合2.当增加最小样本分裂个数,会导致过拟合3.当我们减少训练单个学习器的样本个数,我们可以降低variance4.当我们减少训练单个学习器的样本个数,我们可以降低biasA、2和4B、2和3C、1和3D、1和4答案:C134.假设我们使用原始的非线性可分版本的Soft-SVM优化目标函数。我们需要做什么来保证得到的模型是线性可分离的?A、C=0B、C=1C、C正无穷大D、C负无穷大答案:C135.Adaboost就是从()出发反复训练,在其中不断调整数据权重或者是概率分布。A、弱分类器B、强分类器C、多个分类器D、单个分类器答案:A136.下面哪种方法没办法直接应用于自然语言处理的任务?A、去语法模型B、循环神经网络C、卷积神经网络D、主成分分析(PCA)答案:D137.循环神经网络不同于卷积神经网络,它比较擅长解决以下哪些问题?A、序列相关问题B、图像分类C、图像检测D、推荐问题答案:A138.有如下两组数据{(-1,0),(-1,2),(1,2)}{(0,0),(1,0),(1,1)}我们在该数据集上训练一个线性SVM模型,该模型中的支持向量是哪些?()A、(−1,2),(1,1),(1,0)B、(−1,0),(−1,2),(1,1),(1,0)C、(−1,0),(1,2),(0,0),(1,1)D、(−1,0),(-1,2),(0,0),(1,0)答案:C139.在Skip-gram实际实现的过程中,通常会让模型接收()个tensor输入。A、1B、2C、3D、4答案:C140.对于给定的关于天气信息的数据集,已知空气的温度、湿度、气压、是否降雨以及pm2.5指数,需要建立一个回归模型预测pm2.5指数,这是一个()。A、半监督学习B、强化学习C、无监督学习D、有监督的学习答案:D141.下列不属于特征降维的作用是A、降低时间复杂度和空间复杂度B、较简单的模型在小数据集上有更强的鲁棒性C、提升模型效果D、降低算法的计算开销答案:B142.传统的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的数字,又称为什么呢A、给定标签B、离散C、分类D、回归答案:D143.()是用来评估神经网络的计算模型对样本的预测值和真实值之间的误差大小。A、损失函数B、优化函数C、反向传播D、梯度下降答案:A144.梯度下降算法的正确步骤是什么?1计算预测值和真实值之间的误差2重复迭代,直⾄得到⽹络权重的最佳值3把输⼊传⼊⽹络,得到输出值4随机值初始化权重和偏差5对每个产⽣误差的神经元,调整相应的(权重)值以减⼩误差A、1,2,3,4,5B、5,4,3,2,1C、3,2,1,5,4D、4,3,1,5,2答案:D145.下面有关分类算法的准确率,召回率,F1值的描述,错误的是?()A、准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率B、召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率C、正确率、召回率和F值取值都在0和1之间,数值越接近0,查准率或查全率就越高D、为了解决准确率和召回率冲突问题,引入了F1值答案:C146.人工神经元内部运算包含哪两个部分:A、非线性变换和激活变换B、线性变换和非线性变换C、向量变换和标量变换D、化学变换和电变换答案:B147.以下哪些分类方法可以较好地避免样本的不平衡问题()A、KNNB、SVMC、BayesD、神经网络答案:A148.循环神经网络中,假设输入是一个32*32*3的图像,3表示RGB三通道,卷积核的结构是5*5*3,共6个不同的卷积核,一个卷积核产生一个featuremap,则输出的featuremap矩阵的结构是()。A、27*27*3B、28*28*3C、27*27*6D、28*28*6答案:D149.假设你有5个大小为7x7、边界值为0的卷积核,同时卷积神经网络第一层的深度为1。此时如果你向这一层传入一个维度为224x224x3的数据,那么神经网络下一层所接收到的数据维度是多少?()A、218x218x5B、217x217x8C、217x217x3D、220x220x5答案:A150.我们可以将深度学习看成一种端到端的学习方法,这里的端到端指的是A、输入端-输出端B、输入端-中间端C、输出端-中间端D、中间端-中间端答案:A151.阅读以下文字:假设我们拥有一个已完成训练的、用来解决车辆检测问题的深度神经网络模型,训练所用的数据集由汽车和卡车的照片构成,而训练目标是检测出每种车辆的名称(车辆共有10种类型)。现在想要使用这个模型来解决另外一个问题,问题数据集中仅包含一种车(福特野马)而目标变为定位车辆在照片中的位置。A、除去神经网络中的最后一层,冻结所有层然后重新训练B、对神经网络中的最后几层进行微调,同时将最后一层(分类层)更改为回归层C、使用新的数据集重新训练模型D、所有答案均不对答案:B152.重复K-折交叉验证应该使用哪个函数?A、RepeatedKFoldB、KFoldC、LeaveOneOut答案:A153.在用于文本分类的隐狄利克雷分布(LDA)模型中,α和β超参数表征什么?A、α:文档中的主题数量,β:假主题中的词条数量B、α:主题内生成的词条密度,β:假词条中生成的主题密度C、α:文档中的主题数量,β:假主题中的词条数量D、α:文档中生成的主题密度,β:真主题内生成的词密度答案:D154.常用的图像特征包括A、颜色特征B、形状特征C、纹理特征D、像素特征答案:D155.K-Means算法无法聚以下哪种形状的样本A、圆形分布B、螺旋分布C、带状分布D、凸多边形分布答案:B156.逻辑回归模型是解决什么问题的模型?A、分类问题B、聚类问题C、回归问题答案:A157.当数据太大而不能同时在RAM中处理时,哪种梯度技术更有优势A、全批量梯度下降B、随机梯度下降答案:B158.不属于常见激活:A、sigmoidB、ReluC、NMSD、Tanh答案:C159.以下关于数据质量的说法不正确的是A、数据质量是基于一组定性或定量变量的值的条件下提出的概念B、数据内部一致性的问题非常重要C、一组数据特性满足业务需求的程度D、数据清洗的必要性不大答案:D160.现要将某气象观测站每天不同时间点的气温及湿度的观察值保存,方便以后进行调用及查询,在Python3哪种数据结构更合适?A、字符串B、列表C、集合D、字典答案:D161.损失函数反映了神经网络的目标输出和实际输出的误差,在深度学习中常用的损失函数是:A、指数损失函数B、均方损失函数C、对数损失函数D、Hinge损失函数答案:B162.在深度学习神经网络中,感知器是最简单的神经网络,关于其结构说法正确的是:A、其隐含层只有两层B、其隐含层只有一层C、其网络中使用的是Sigmoid激活函数D、其网络中使用的是Relu激活函数答案:B163.梯度下降算法中,损失函数曲面上轨迹最混乱的算法是以下哪种算法?A、SGDB、BGDC、MGDD、MBGD答案:A164.代码arr3=np.array([[1,2,3],[4,5,6]]).transpose();print(arr3[1,1])的输出结果是()?A、5B、4C、3D、2答案:A165.在图搜索中,选择最有希望的节点作为下一个要扩展的节点,这种搜索方法叫做()A、宽度搜索B、深度搜索C、有序搜索D、广义搜索答案:C166.数据挖掘技术包括三个主要的部分()。A、数据、模型、技术B、算法、技术、领域知识C、数据、建模能力、算法与技术D、建模能力、算法与技术、领域知识答案:C167.假设一个公司的薪资水平中位数是35000,排名前25%和75%分别是60000和20000,如果某人的薪水是3000,那么他可以被看出异常值吗A、可以B、不可以C、需要更多信息D、以上说法都不对答案:A168.使用一个滑动窗口对语料()扫描,在每个窗口内,中心词需要预测它的上下文,并形成训练数据A、从左到右B、从上到下C、从右到左D、从下到上答案:A169.声明1:可以通过将所有权重初始化为0来训练网络。声明2:可以通过将偏差初始化为0来很好地训练网络以上哪些陈述是真实的?A、1对2错误B、1错误2对C、1和2都对D、1和2都错误答案:B170.下列关于深度学习神经网络结构的描述,正确的是()A、不同的神经网络结构,层数与神经元数量正相关,层数越多,神经元数量越多B、网络结构的层次越深,其学习特征越多,10层的结构要优于5层结构C、深层网络结构中,学习到的特征一般与神经元的参数量有关,也与样本的特征多少有关D、网络的层次越深,其训练时间越久,5层的网络比4层的训练时间长答案:C171.下列哪项不是噪声数据的主要表现形式A、错误数据B、虚假数据C、异常数据D、重复数据答案:D172.用于分类与回归应用的主要算法有()A、随机森林、AprioriB、逻辑回归、K均值、决策树C、支持向量机、SOM神经网络D、决策树、BP神经网络、朴素贝叶斯答案:D173.读取文件时并指定文件以空格分隔,则应该添加A、sep="\n”B、sep="\t”C、sep=""D、sep="\r”答案:C174.特征是描述样本的特性的维度,关于其在传统机器学习和深度学习的可解释性,以下说法正确的是:A、特征在传统机器学习可解释性强,而在深度学习可解释性弱B、特征在传统机器学习可解释性弱,而在深度学习可解释性强C、特征在传统机器学习和深度学习可解释性均弱D、特征在传统机器学习和深度学习可解释性均强答案:A175.我们想在大数据集上训练决策树,为了减少训练时间,我们可以A、增加树的深度B、增大学习率(LearninRate)C、对决策树模型进行预剪枝D、减少树的数量答案:C176.在以下模型中,训练集不需要标注信息的是()A、k-meansB、线性回归C、神经网络D、决策树答案:A177.下面哪一项对梯度下降(GD)和随机梯度下降(SGD)的描述是正确的?1在GD和SGD中,每一次迭代中都是更新一组参数以最小化损失函数。2在SGD中,每一次迭代都需要遍历训练集中的所有样本以更新一次参数。3在GD中,每一次迭代需要使用整个训练集的数据更新一个参数。A、只有1BB、只有2C、只有3D、都正确答案:A178.Scikit-Learn中()可以实现计算模型准确率。A、accuracy_scoreB、accuracyC、f1_scoreD、f2_score答案:A179.ID3算法选择划分属性的准则是A、信息增益B、增益率C、基尼系数D、信息熵答案:A180.Python中有这样一个示例:types=['娱乐','体育','科技'],在使用列表时,以下哪个选项,会引起索引错误A、types[-1]B、types[-2]C、types[0]D、types[3]答案:D181.表达式3andnot5的值为_______。A、FALSEB、3C、TRUED、2答案:A182.有监督学习中,“近朱者赤近墨者黑”是用来形容下列哪个模型?A、KMeansB、SVMC、KNND、神经网络答案:C183.下列不属于数据脱敏操作必须满足的要求的是A、单向性B、无残留C、易于实现D、双向性答案:D184.下面有关分类算法的准确率,召回率,F1值的描述,错误的是?A、准确率是检索出相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率B、召回率是指检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率C、正确率、召回率和F值取值都在0和1之间,数值越接近0,查准率或查全率就越高D、为了解决准确率和召回率冲突问题,引入了F1分数答案:C185.手写数字识别的例子中,输入的图片为长和宽都是28像素的图片,输出判断数字0-9的概率。要构建前馈型神经网络去解决这个问题,输入层是()维的,输出层是()维的。A、784;10B、28;10C、784;1D、28;1答案:A186.有关深度学习加速芯片,以下的说法中不正确的是:()A、GPU既可以做游戏图形加速,也可以做深度学习加速B、用于玩游戏的高配置显卡,也可以用于深度学习计算。C、GoogleTPU已经发展了三代,它们只能用于推断(Inference)计算,不能用于训练(Training)计算D、FPGA最早是作为CPLD的竞争技术而出现的答案:C187.从给定的特征集合中选择出相关特征子集的过程,称为(___)A、特征抽取B、特征选择C、特征降维D、特征简化答案:B188.使用一组槽来描述事件的发生序列,这种知识表示法叫做()A、语义网络法B、过程表示法C、剧本表示法D、框架表示法答案:C189.下面对强化学习、监督学习和深度卷积神经网络学习的描述正确的是A、评估学习方式、有标注信息学习方式、端到端学习方式B、有标注信息学习方式、端到端学习方式、端到端学习方式C、评估学习方式、端到端学习方式、端到端学习方式D、无标注学习、有标注信息学习方式、端到端学习方式答案:A190.以下机器学习中,在数据预处理时,不需要考虑归一化处理的是:()A、logistic回归B、SVMC、树形模型D、神经网络答案:C191.在高斯混合分布中,其隐变量的含义是在高斯混合分布中,其隐变量的含义是A、表示高斯分布的方差B、表示高斯分布的均值C、表示数据分布的概率D、表示数据从某个高斯分布中产生答案:D192.循环神经网最常用的激活函数是tanh,除了tanh还可以使用:①.relu②.sigmoid③.softmax④.完全不使用激活函数A、①③④B、①②③C、①③④D、①②④答案:B193.以下属于生成式模型的是:()A、SVMB、随机森林C、隐马尔可夫模型HMMD、逻辑回归答案:C194.下列有关朴素贝叶斯的说法不正确的是:A、易于实现,但学习和预测的效率低B、在数据较少的时仍然有效C、特征独立性假设使模型变得简单D、可以处理多分类问题答案:A195.以下哪种算法不属于数据挖掘技术中的算法()。A、聚类B、神经网络C、决策树D、RSA加密算法答案:D196.欠拟合通常是由于(___)而造成的。A、权值学习迭代次数足够多B、学习能力低下C、训练集过多模型复杂D、数据有噪声答案:B197.1x1卷积的主要作用是A、加快卷积运算B、增大卷积核C、扩大感受野D、通道降维答案:D198.关于神经网络中经典使用的优化器,以下说法正确的是A、Adam的收敛速度比RMSprop慢B、相比于SGD或RMSprop等优化器,Adam的收敛效果是最好的C、对于轻量级神经网络,使用Adam比使用RMSprop更合适D、相比于Adam或RMSprop等优化器,SGD的收敛效果是最好的答案:D199.文本分类模型组成部分的正确顺序是?1.文本清理(Textcleaning)2.文本标注(Textannotation)3.梯度下降(Gradientdescent)4.模型调优(Modeltuning)5.文本到预测器(Texttopredictors)A、12345B、13425C、12534D、13452答案:C200.L1正则和L2正则的共同点是什么?A、都会让数据集中的特征数量减少B、都会增大模型的偏差C、都会增大模型方差D、没有正确选项答案:D201.以下哪一项是不合法的布尔表达式A、xinrange(6)B、3=aC、e>5and4==fD、(x-6)>5答案:B202.模型的高bias(偏差)是什么意思,如何降低它()?A、在特征空间中减少特征B、在特征空间中增加特征C、增加数据点D、B和CE、以上所有答案:B203.为了将特征转变成Embedding表示,所有特征均需转变成()A、数字B、字符C、符号D、英文答案:A204.代码array=np.arange(10,31,5)中的5代表()?A、元素的个数B、步长C、第一个元素D、最后一个元素答案:B205.下列选项中,属于人工智能应用的是()A、人与计算机下棋B、利用计算机播放视频C、利用计算机制作动画D、利用计算机进行英译汉的翻译答案:A206.预测分析过程包括:数据的准备、预测模型开发、模型验收和评估、使用PMML实现大数据预测的有效部署。()是指对数据的采集和整理A、数据的准备B、预测模型开发C、模型验收D、评估答案:A207.以下关于L1正则化和L2正则化的说法正确的是?A、防止模型欠拟合而加在损失函数后面的一项B、L1范数符合拉普拉斯分布,是完全可微的C、L1正则化项是模型各个参数的平方和的开方值D、L1正则化可以产生稀疏权值矩阵,即产生一个稀疏模型,可以用于特征选择答案:D208.图像灰度的方差表示图像的哪种属性A、图像整体亮度B、图像饱和度C、图像对比度D、图像细节答案:C209.批规范化(BatchNormalization)的好处都有啥?A、让每⼀层的输⼊的范围都⼤致固定B、它将权重的归⼀化平均值和标准差C、它是⼀种⾮常有效的反向传播(BP)⽅法D、这些均不是答案:A210.属性划分的目标是让各个划分出来的子节点A、属于同一类别B、尽可能属于同一类别C、属于不同类别D、尽可能属于不同类别答案:B211.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗A、可以B、不好说C、不一定D、不能答案:D212.深度神经网络中,隐藏层无法学习的情况被称为()问题A、梯度下降B、梯度消失C、梯度爆炸D、以上都不对答案:B213.人工智能产业链条主要包括:基础技术支撑、()、人工智能应用。A、智能平台建设B、大数据平台C、互联网应用D、人工智能技术答案:D214.以下那种CNN结构中不包含残差结构?A、ResNetB、DarkNetC、Inception-ResNetv2D、VGG答案:D215.在线性回归中,对回归系数的显著性检验采用()A、Z检验B、T检验;$F检验C、χ2检验答案:B216.深度学习神经网络训练时需要大量的矩阵计算,一般我们需要配用硬件让计算机具备并行计算的能力,以下硬件设备可提供并行计算能力的是:A、主板B、内存条C、GPUD、CPU答案:C217.以下哪个模型属于生成模型()()A、支持向量机B、逻辑回归C、DNND、朴素贝叶斯答案:D218.线性降维方法假设从高维空间到低维空间的函数映射是()。A、一元B、线性C、多元D、非线性答案:B219.下列哪个神经网络结构会发生权重共享?A、卷积神经网络B、循环神经网络C、全连接神经网络D、选项A和B答案:D220.图像处理中无损压缩的目的是()A、滤除图像中的不相干信号B、滤除图像中的高频信号C、滤除图形中的低频信号D、滤除图像中的冗余信号答案:D221.scikit-learn中的SGD方法是指?A、梯度下降法B、随机梯度下降答案:B222.对于神经网络的说法,下面正确的是:1.增加神经网络层数,可能会增加测试数据集的分类错误率2.减少神经网络层数,总是能减小测试数据集的分类错误率3.增加神经网络层数,总是能减小训练数据集的分类错误率A、1B、1和3C、1和2D、2答案:A223.VGG网络在深度学习发展过程中做出了重要贡献,下面关于VGG描述正确的是:A、VGG全部使用了3*3的卷积核和2*2的池化核B、VGG证明了网络越深越好,所以程序员应该没有限制的搭建更深的网络C、VGG是到目前为止分类效果最好的网络结构D、VGG没有使用全连接网络结构答案:A224.pandas每个索引都有一些方法和属性,下列()方法用来删除传入的值,并得到新的Index。A、diffB、deleteC、dropD、isin答案:C225.一个仅给出测试用例标签的模型将会获得极高的分数,但对于尚未出现过的数据它则无法预测出任何有用的信息。这种情况称为:A、过拟合B、欠拟合C、正拟合D、负拟合答案:A226.在遗传算法中,变量x的定义域为[-2,5],要求其精度为10-6,现用二进制进行编码,则码长为()A、20B、21C、22D、23答案:D227.人工智能三大核心,()的提升大幅度推动人工智能发展。A、算法B、运算力C、大数据D、创造力答案:B228.在选择神经⽹络的深度时,下⾯哪些参数需要考虑?1神经⽹络的类型(如MLP,CNN)2输⼊数据3计算能⼒(硬件和软件能⼒决定)4学习速率5映射的输出函数A、1,2,4,5B、2,3,4,5C、都需要考虑;D、$1,3,4,5答案:C229.一般情况下,KNN最近邻方法在()情况下效果最好()A、样本呈现团状分布B、样本呈现链状分布C、样本较多但典型性不好D、样本较少但典型性好答案:D230.在ε-greedy策略当中,ε的值越大,表示采用随机的一个动作的概率越(),采用当前Q函数值最大的动作的概率越()。A、大;小B、大;大C、小;小D、小;大答案:A231.以下哪种分类方法对样本质量要求最高()。A、KNNB、支持向量机C、贝叶斯D、神经网络答案:A232.当决策树出现过拟合的时候,可以采取以下哪些措施()A、剪枝B、增加训练次数C、进行交叉检验D、以上均可答案:A233.启发式搜索是寻求问题()解的一种方法A、最优B、一般C、满意D、最坏答案:C234.优化器是训练神经网络的重要组成部分,使用优化器的目的不包含以下哪项:A、加快算法收敛速度B、减少手工参数的设置难度C、避过过拟合问题D、避过局部极值答案:C235.如何选取合适的卷积核大小?A、分布范围广>较小的卷积核,大的感受野B、分布范围小>较小的卷积核,小的感受野C、分布范围小>较大的卷积核,小的感受野D、分布范围大>较小的卷积核,小的感受野答案:B236.下面关于最小二乘法(OrdinaryLeastSquares)的说法,正确的是:A、最小二乘法是通过最小化预测值y和真实的y在训练数据上的误差来寻找最优解的方法B、当自变量X的特征很多的时候,使用最小二乘法可以求得最优解C、最小二乘法是通过求导来找出最优解,是一种迭代的方法D、使用最小二乘法求最优解比梯度下降方法好答案:A237.下面对强化学习、有监督学习和无监督学习描述正确的是A、都是人工智能的学习算法B、都是深度学习的学习算法C、都需要标注数据D、都不需要标注信息答案:A238.DSSM模型总的来说可以分成哪几层结构,分别是()A、表示层、匹配层B、输入层、匹配层C、输入层、表示层D、输入层、表示层和匹配层。答案:D239.()的人工神经网络适合学习、分类等应用。A、反馈型B、随机型网络C、自组织竞争型D、前向型答案:D240.数字图像处理中的()技术可应用于机动车车牌识别系统。A、图像变换B、图像增强C、图像分割D、图像复原答案:C241.下列哪个包不是用于处理图像的?()A、ScipyB、skimageC、opencvD、gensim答案:D242.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗A、可以B、不好说C、不一定D、不能答案:D243.我们在训练神经网络过程中,使用梯度下降法不断更新哪种数值,进而使得损失函数最小化?A、样本数目B、特征值C、超参数D、参数答案:D244.人工智能的目的是让机器能够(),以实现某些脑力劳动的机械化A、模拟、延伸和扩展人的智能B、和人一样工作C、完全代替人的大脑D、彻底的替代人类答案:A245.假设我们有一个使用ReLU激活函数(ReLUactivationfunction)的神经网络,假如我们把ReLU激活替换为线性激活,那么这个神经网络能够模拟出同或函数(XNORfunction)吗?A、可以B、不好说C、不一定D、不能答案:D246.无监督学习需要()A、学习程序自己形成和评价概念,没有教师B、学习程序在教师监督下形成和评价概念C、学习程序有时需要教师,有时不需要教师,以形成和评价概念D、以上说法都不对答案:A247.预测分析方法分为两大类,分别是定性分析法和()。A、回归分析法B、指数平滑法C、定量分析法D、平均法答案:C248.ONE-HOT-ENCODING可用于什么特征处理A、类别型特征B、有序性特征C、数值型特征D、字符串型特征答案:A249.不属于深度学习模型的选项是()A、朴素贝叶斯B、深度残差网络C、卷积神经网络CNND、循环神经网络RNN答案:A250.两个种子点A(-1,1),B(2,1),其余点为(0,0),(0,2),(1,1),(3,2),(6,0),(6,2),利用Kmeans算法,点群中心按坐标平均计算。最终种子点A需要移动的次数,种子点B需要移动的次数,属于种子点A的点数(不包含A),属于种子点B的点数(不包含B)分别为()()A、2,2,3,3B、1,1,3,3C、1,1,2,4D、2,2,2,4答案:A251.LSTM是一个非常经典的面向序列的模型,可以对自然语言句子或是其他时序信号进行建模,是一种()。A、循环神经网络B、卷积神经网络C、朴素贝叶斯D、深度残差网络答案:A252.哪些文本分析技术可被用于名词短语检测、动词短语检测、主语检测和宾语检测?A、词性标注(PartofSpeechTagging)B、SkipGram和N-Gram提取C、连续性词袋(BagofWords)D、依存句法分析(DependencyParsing)和成分句法分析(ConstituencyParsing)答案:D253.python循环效率低的根本原因是()A、以上都不对B、python的可解释性强C、numpy等python库的效率更高D、python运行程序时逐行翻译答案:D254.()适合连续特征,它假设每个特征对于每个类都符合正态分布。A、GaussianNBB、BernoulliNBC、MultinomialNBD、BaseDiscreteNB答案:A255.我们想在大数据集上训练决策树,为了使用较少时间,我们可以()A、增加树的深度B、增加学习率C、减少树的深度D、减少树的数量答案:C256.留出法直接将数据集划分为(___)个互斥的集合。A、一B、二C、三D、四答案:B257.假如我们使用Lasso回归来拟合数据集,该数据集输入特征有100个(X1,X2,…,X100)。现在,我们把其中一个特征值扩大10倍(例如是特征X1),然后用相同的正则化参数对Lasso回归进行修正。那么,下列说法正确的是A、特征X1很可能被排除在模型之外B、特征X1很可能还包含在模型之中C、无法确定特征X1是否被舍弃D、以上说法都不对答案:B258.下列选项中对泊松分布与二项分布的关系描述正确的是?A、泊松分布可以代替二项分布B、泊松分布是二项分布当n很大p很小时的近似计算C、泊松分布与二项分布的数学模型都是拉格朗日概型D、泊松分布与二项分布没有关系答案:B259.一个完整机器学习项目需要以下哪些流程?①抽象成数学问题②获取数据③特征预处理与特征选择④训练模型与调优⑤模型诊断与融合⑥上线运行A、①②③④⑤B、②③④⑤⑥C、①②③④⑤⑥D、①②④⑤⑥答案:C260.下列选项中,可以通过扫描仪将其转换成数字图像输入电脑中,然后通过OCR软件识别成文本信息的是()A、报纸B、FLASH动画C、歌曲D、电影答案:A261.随着句子的长度越来越多,神经翻译机器将句意表征为固定维度向量的过程将愈加困难,为了解决这类问题,下面哪项是我们可以采用的?A、使用递归单元代替循环单元B、使用注意力机制(attentionmechanism)C、使用字符级别翻译(characterleveltranslation)D、所有选项均不对答案:B262.关于学习率的描述正确的是:A、学习率和w、b一样是参数,是系统自己学习得到的B、学习率越大系统运行速度越快C、学习率越小系统一定精度越高D、学习率的大小是根据不同场景程序员自己设定的,不宜太大或者太小答案:D263.在某个list末尾增加两个元素obj1,obj2,可以使用下列哪些表达式A、list.append(obj1,obj2)B、list.append([obj1,obj2])C、list.extend(obj1,obj2)D、list.extend([obj1,obj2])答案:D264.GooLeNet中使用较多小tricks,其中全局平局池化GAP就是一个,使用GAP的优点是()A、提供更好的分类B、减少参数量,实现任意大小的输入C、加速模型收敛D、增加网络深度答案:B265.下列选项中,是合页损失函数的是()。A、exp(yf(x))B、[1-yf(x)]_+C、log[1+exp(-yf(x))D、exp(-yf(x))答案:B266.下列哪项不属于聚类算法()A、K-meansB、BIRCHC、SVMD、DBSCAN答案:C267.下面关于模型预测性能的评估以及交叉验证,说法正确的是:A、在scikit-learn包里面使用交叉验证方法,可以使用代码:fromsklearnimportcross_validationB、需要把数据分成训练集和测试集,用测试集来评估从训练集学习得来的模型的预测性能,是因为从训练集学习得来的模型可能对于训练集的数据拟合得很好,但是对于训练集以外的数据没有太大的泛化能力C、课程中的交叉验证,把数据集分成了5份,其中4份作为训练集,剩下一份作为测试集,这种方法叫做留一交叉验证法D、从训练集中得到的模型,用训练集的数据得到的预测准确率一般会比用测试集得到的预测准确率低答案:B268.对于机器学习表述下列正确的是()。A、机器学习和人工智能是独立的两种技术B、机器学习是人工智能的核心技术和重要分支C、机器学习的目标是让机器设备像人类一样学习书本知识D、机器学习是指一系列程序逻辑控制算法答案:B269.在分类学习中,提升方法通过反复修改训练数据的(),构建一系列基本分类器并将它们线性组合,形成一个强分类器。A、偏差B、方差C、采样样本D、权值分布答案:D270.在其他条件不变的前提下,以下哪种做法容易引起机器学习中的过拟合问题A、增加训练集量B、&;&减少神经网络隐藏层节点数C、&;&在损失函数中增加正则项D、&;&SVM算法中使用高斯核/RBF核代替线性核答案:D271.下方法中属于无监督学习算法的是()A、线性回归B、支持向量机C、决策树D、K-Means聚类答案:D272.以下不属于聚类算法的是A、K均值B、DBSCANC、AprioriD、Jarvis-Patrick(JP)答案:C273.输入图片大小为200×200,依次经过一层卷积(kernelsize5×5,padding1,stride2),pooling(kernelsize3×3,padding0,stride1),又一层卷积(kernelsize3×3,padding1,stride1)之后,输出特征图大小为?A、95B、96C、97D、98答案:C274.目前RNN中常用的激活函数是()A、reluB、sigmoidC、eluD、Swish答案:B275.混淆矩阵中TP=16,FP=12,FN=8,TN=4,召回率是()。A、1212122022年1月4日B、1212122022年1月2日C、1212122022年4月7日D、1212122022年2月3日答案:D276.下列哪项属于集成学习()A、决策树模型B、kNN分类C、AdaboostD、k-means答案:C277.回归算法预测的标签是?A、自变型B、离散型C、应变型D、连续型答案:D278.深度学习系统训练过程通常需要输入:A、特征值B、标签C、特征值和标签D、预测值答案:C279.梯度下降算法的正确步骤是什么?a.计算预测值和真实值之间的误差b.重复迭代,直至得到网络权重的最佳值c.把输入传入网络,得到输出值d.用随机值初始化权重和偏差e.对每一个产生误差的神经元,调整相应的(权重)值以减小误差()A、abcdeB、edcbaC、cbaedD、dcaeb答案:D280.批量梯度下降,小批量梯度下降,随机梯度下降最重要的区别在哪里?A、梯度大小B、梯度方向C、学习率D、使用样本数答案:D281.以下那种操作会方法图像中的噪声?A、拉普拉斯滤波B、中值滤波C、高斯滤波D、均值滤波答案:A282.计算词语间距离的方法有很多,一下选项中属于常用方法的是:A、正切相似度B、余弦相似度C、绝对距离D、球面距离答案:B283.在Python中,设a=2,b=3,表达式a<bandb>=3值是()A、1B、0C、TRUED、FALSE答案:C284.下列应用了人工智能技术的是()①用手写板输入汉字②视频聊天③与计算机对弈④OCR文字识别A、①②③B、①②④C、①③④D、②③④答案:C285.在数字图像的特征提取中,经常会用到Hessian矩阵来提取关键点,以下关于Hessian矩阵的描述不正确的是?A、图像上某个点的Hessian矩阵,其最大特征值对应其领域内最大曲率的强度B、如果Hessian矩阵是负正定的,则临界点处有局部极小值C、如果Hessian矩阵是不定矩阵,则临界点处没有极值D、Hessian矩阵的特征值,用于衡量特征向量方向的凹凸性答案:B286.假设对给定数据应用了Logistic回归模型,并获得了训练精度X和测试精度Y。现在要在同一数据中添加一训练精度提高B训练准确度提高或保持不变C测试精度提高或保持不变D以上均错些新特征,以下哪些是错误的选项A、现在要在同一数据中添加一训练精度提高B、训练准确度提高或保持不变C、测试精度提高或保持不变D、以上均错些新特征答案:B287.数据清洗的方法不包括()。A、缺失值处理B、噪声数据清除C、一致性检查D、重复数据记录处理答案:D288.某银行的贷款系统,操作员只需要输入客户资料,该系统就会提示操作员是否能够提供贷款以及相应的贷款额度,这主要应用了人工智能中的()A、机器博弈B、专家系统C、模式识别D、机器翻译答案:B289.循环神经网最常常遇到的问题是:①.梯度消失②.词语依赖位置较远③.梯度爆炸④.维数灾难A、①③④B、①②③C、①③④D、①②④答案:B290.以下哪种神经网络技术可以用于语音识别的处理A、卷积神经网络B、循环神经网络C、深层神经网络D、浅层神经网络答案:B291.机器学习的算法中,以下哪个不是无监督学习?A、GMMB、XgboostC、聚类D、关联规则答案:B292.下列哪项关于模型能力(modelcapacity)的描述是正确的?(指神经网络模型能拟合复杂函数的能力)A、隐藏层层数增加,模型能力增加B、Dropout的比例增加,模型能力增加C、学习率增加,模型能力增加D、都不正确答案:A293.Transformer架构首先是由下列哪项引入的?A、GloVeB、BERTC、OpenAI'sGPTD、ULMFit答案:C294.Python中的变量var如果包含字符串的内容,下面哪种数据类型不可能创建var?A、listB、stringC、charD、dict答案:C295.文字检测网络TextBoxes基于下列哪个网络A、Fastr-cnnB、Fasterr-cnnC、SSDD、YOLO答案:C296.关于反向传播,以下说法错误的是?A、反向传播只能在前馈神经网络中运用B、反向传播可以结合梯度下降算法更新网络权重C、反向传播会经过激活函数D、反向传播指的是误差通过网络反向传播答案:A297.神经网络中最基本的成分是()模型。A、神经元B、阈值C、兴奋D、节点答案:A298.高层的特征是低层特征的组合,从低层到高层的特征表达越来越(),也即越来越能表现语义或者意图。A、具体和形象化B、抽象和概念化C、具体和概念化D、抽象和具体化答案:B299.假如你在训练一个线性回归模型,有下面两句话:1.如果数据量较少,容易发生过拟合。2.如果假设空间较小,容易发生过拟合。关于这两句话,下列说法正确的是A、1和2都错误B、1正确,2错误C、1错误,2正确D、1和2都正确答案:B300.混淆矩阵中TP=16,FP=12,FN=8,TN=4,准确率是()。A、1212122022年1月4日B、1212122022年1月2日C、1212122022年4月7日D、1212122022年2月3日答案:B多选题1.Python的集成工具类IDE包括()。A、IDLEB、SublimeC、PyCharmD、Anaconda&Spyder答案:CD2.数据处理阶段现存问题有哪些A、数据采集容易,效率高B、训练数据量需求大,数据稀缺C、样本没有统一格式,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 45168-2024保健食品中吡啶甲酸铬的测定
- A证(企业负责人)-安全员A证考试模拟题练习
- 沪科版九年级物理全一册《第十七章从指南针到磁浮列车》章末测试卷含答案
- 国企工会换届上的领导讲话-凝聚奋进力量 彰显工会作为
- 科技孵化器入驻企业潜力筛选
- 电力系统设备故障预防与处理流程
- 高一化学二第三章有机化合物练习
- 2024届安徽省示范高中培优联盟高考化学三模试卷含解析
- 2024高中地理第3章地理信息技术应用第2节遥感技术及其应用学案湘教版必修3
- 2024高中物理第二章交变电流第二节交变电流的描述达标作业含解析粤教版选修3-2
- 专业微信小程序开发协议范例版
- 小学二年级数学100以内加减法竖式计算单元练习习题
- 12G614-1砌体填充墙结构构造
- 苏教版五年级上册数学计算题大全1000道带答案
- JT-T-1078-2016道路运输车辆卫星定位系统视频通信协议
- 两家公司成立新公司合作协议书
- 小学四年级小数单位换算练习题100道
- 人教版七年级下册数学-第五章-相交线与平行线-单元检测题
- (正式版)HGT 22820-2024 化工安全仪表系统工程设计规范
- 项目质量管理的沟通与协调机制
- 中医常见的护理诊断及护理措施
评论
0/150
提交评论