2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下(多选、判断题)_第1页
2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下(多选、判断题)_第2页
2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下(多选、判断题)_第3页
2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下(多选、判断题)_第4页
2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下(多选、判断题)_第5页
已阅读5页,还剩129页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE12024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下(多选、判断题汇总)多选题1.RNN在NLP领域的应用包括(__)。A、语言模型与文本生成B、机器翻译C、语音识别D、图像描述生成答案:ABCD解析:语言模型与文本生成;机器翻译;语音识别;图像描述生成;情感分析;对话系统等。2.3D点云常见的任务有()。A、3D物体识别B、3D物体重建C、3D物体跟踪D、3D纹理贴图答案:AC3.Analytics3.0的主要特点有().A、引入嵌入式分析。B、重视行业数据,而不只是企业内部数据。C、以产品与服务的优化为主要目的。D、注重规范性分析。答案:ABCD4.下面对WEB描述正确的是()A、WEB即全球广域网B、WEB即万维网C、WEB采用HTTP通讯协议D、WEB采用HTTPS通讯协议答案:ABCD5.LSTM应用场景应用场景有哪些()A、翻译语言B、语音识别C、图像识别D、股票预测答案:ABD解析:C:CNN应用于图像识别。6.下面对数据集划分表达正确的是()A、测试集,训练集,验证集必须来源于同一个数据集B、测试集,训练集,验证集可以来源于不同数据集C、模型开发过程中,可以没有验证集,但测试集和训练集必须有D、模型开发过程中,可以没有测试集,但验证集和训练集必须有答案:AC7.下列哪些概念是属于强化学习的。()A、动作B、环境和观察状态C、智能体D、奖励答案:ABCD8.人工智能产品采用B/S架构,B/S架构优点是()。A、只需要在服务端对模型进行升级B、用户不用为每个AI应用单独安装客户端软件C、数据、计算都在云端,更安全D、模型计算在客户端计算机上答案:ABC9.下列关于错误率和精度描述有误的是(__)。A、错误率是分类错误的样本占样本总数的比例B、精度是指分类正确的样本数占样本总数的比例C、精度表示统计分类器预测出来的结果与真实结果不相同的个数,然后除以总的样例集D的个数D、错误率表示用统计分类正确的样本数,除以总的样例集D的个数答案:CD10.以下那些方法不常用于灰度内插值。()A、最近邻内插法B、三次内插法C、双线性内插值法D、三次样条插值法答案:ABD11.下列关于L1正则化与L2正则化描述正确的是(__)。A、L1范数正则化有助于降低过拟合风险B、L2范数正则化有助于降低过拟合风险C、L1范数正则化比L2范数正则化更有易于获得稀疏解D、L2范数正则化比L1范数正则化更有易于获得稀疏解答案:ABC12.某厂商开发了一个听歌识曲的应用,该应用使用了下列哪些技术()A、声纹识别B、声音特征提取C、声音特征比对D、文本转语音答案:BC13.数据能力的评价方法有哪些A、评价结果B、评价方法C、评价过程D、评价产品答案:AC14.下列()模型是强化学习模型A、DQNB、ACC、YOLOD、UNET答案:AB15.市面上哪些产品使用了语音合成技术。()A、小米的小爱机器人B、喜马拉雅APP小说智能阅读C、微信的语音转写D、抖音短视频AI配音答案:ABD16.POC曲线由()和()构成。A、查准率B、命中率C、虚警率D、准确率答案:BC17.下列关于密度聚类说法错误的是(__)。A、DBSCAN是一种著名的密度聚类算法B、密度聚类从样本数量的角度来考察样本之间的可连接性C、密度聚类基于不可连接样本不断扩展聚类簇易获得最终的聚类结果D、密度直达关系通常满足对称性答案:BCD18.关于卷积神经网络的叙述中正确的是()。A、可用于处理时间序列数据B、可用于处理图像数据C、卷积网络中使用的卷积运算就是数学中的卷积计算D、至少在网络的一层中使用卷积答案:ABD解析:神经网络中的卷积:我们通常是指由多个并行卷积组成的运算。(因为单个核只能特区一种类型的特征,我们usually希望可以在多个位置提取多个特征)输入也不仅仅是实值的网格,而是由一系列观测数据的向量构成的网格。我们有的时候会希望跳出核中的一些位置来降低计算的开销(相应的代价是提取特征没有先前那么好了)我们就把这个过程看作对全卷积函数输出的下采样(downsling).如果只是在输出的每个方向上每间隔s个像素进行采样,那么可重新定义一个下采样卷积函数。我们把s称为下采样卷积的步幅(stride)。在任何卷积网络的实现中都有一个重要性质:能够隐含地对输入V用零进行填充(pad)使得它加宽。数学中的卷积:考虑到函数f和g应该地位平等,或者说变量x和y应该地位平等,一种可取的办法就是沿直线x+y=t卷起来。19.下面关于L1范式正则化描述正确的是(__)。A、压缩感知问题可以通过L1范数最小化问题求解B、L1范数正则化有助于降低过拟合风险C、采用L1范数时平方误差项等值线与正则化项等值线的交点常出现在坐标轴上D、L1范数正则化比L2范数正则化更有易于获得稀疏解答案:ABCD20.实践教学的四个围绕包括()A、围绕“基础”B、围绕“产品过程”C、围绕“技能”D、围绕“熟练”答案:ABCD21.Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于(__)、(__)、(__)规则。A、逻辑关联B、布尔关联C、单维D、单层答案:BCD22.循环神经网络主要被应用于哪些场景。()A、语音识别B、语音建模C、机器翻译D、图像识别答案:ABC23.大数据“涌现”现象有(____)。A、价值涌现B、质量涌现C、隐私涌现D、数量涌现答案:ABC24.模型部署后,可以不依赖网络才能工作的部署方式是()A、云端部署B、移动端部署C、边缘端部署D、以上都依赖答案:BC25.目前LSTM已经应用到()领域。A、自然语言处理B、语音识别C、图像标注D、发动机答案:ABC26.哪些项不属于使用池化层相比于相同步长的卷积层的优势?()A、参数更少B、可以获得更大下采样C、速度更快D、有助于提升精度答案:BCD27.循环神经网络与普通全连接神经网络主要区别是()A、循环神经网络有信息反馈机制B、全连接神经网络输出与历史输入无关C、循环神经网络的输出与历史输入有关D、以上都不是答案:AB28.()可以做LSTM学习。A、MATLABB、tensorflowC、kreasD、word答案:ABC29.迁移学习的目的()A、降低数据量B、加快模型收敛C、提高模型泛化能力D、加快模型推理速度答案:ABC30.(__)是“黑客精神和技能”。A、大胆创新B、喜欢挑战C、追求完美D、不断改进答案:ABCD31.关于TPU,下列说法错误的是()A、TPU是一款专用于机器学习的芯片B、TPU是一款专用于数据处理的芯片C、TPU能用于深度神经网络训练D、TPU可以提供高吞吐量的高精度计算答案:BD32.下列关于嵌入式选择描述正确的是(__)。A、嵌入式选择是将特征选择过程与学习器训练过程融为一体B、嵌入式选择在学习器训练过程中自动地进行了特征选择C、对于嵌入式选择,特征选择过程与学习器训练过程在同一个优化过程中完成D、嵌入式特征选择方法直接针对给定学习器进行优化答案:ABC33.模型部署前,需要对模型进行剪枝,下面模型剪枝描述正确的是()A、模型剪枝目的是加快模型推理速度B、模型剪枝后通常预测精度有所降低C、模型剪枝后模型的参数量变少D、模型剪枝后,模型训练收敛速度提高答案:ABC34.确定图像分割的阈值的方法有(__)。A、可变阈值法B、判别分析法C、中值滤波D、p尾法答案:ABD35.冯·诺伊曼被人们称为“()”和“()”。A、博弈论之父B、计算机之父C、人工智能之父D、深度学习之父答案:AB36.计算两个框的IOU,不可能的值有()A、-1B、0C、2D、1答案:AC37.下面属于范数规则化的作用的是(__)和(__)。A、保证模型尽可能的简单,避免过拟合B、约束模型特征C、最小化问题D、最大化问题答案:AB38.下列适用于图像语义分割技术的应用场景有()A、CT肿瘤体积计算B、眼球图片血管提取C、视频会议智能更换背景D、车流统计答案:ABC39.下列关于交叉验证法描述正确的是(__)。A、交叉验证法先将数据集划分为k个大小相似的互斥子集B、交叉验证法将数据集划分成的k个子集应尽可能保持数据分布的一致性C、通常把交叉验证法称为k折交叉验证D、假定数据集D中包含m个样本,若令交叉验证法中的系数k=m,则得到了交叉验证法的一个特例:自助法答案:ABC40.下列哪些情况可以通过调整学习率来缓解()A、模型收敛的太慢,调大学习率B、模型发散,调小学习率C、模型过拟合了D、模型欠拟合了答案:AB41.下面属于数据加工的有(__)。A、数据审计B、数据清洗C、数据变换D、数据集成答案:ABCD42.视频内容审核工作主要有两个目的()A、版权B、合规C、正能量D、广告E、质量答案:AB43.以下可能会导致过拟合的是(___)。A、训练集中含有噪声样本B、训练集中缺乏代表性样本C、训练集的样本数目过少D、训练集中样本的维度过少答案:AB44.下列关于贝叶斯分类器说法正确的是(__)。A、贝叶斯分类算法是一大类分类算法的总称B、贝叶斯分类算法以样本可能属于某类的概率作为分类依据C、朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种D、朴素贝叶斯分类算法采用了属性条件独立性假设答案:ABCD45.层次聚类试图在不同层次对数据集进行划分。这里数据集的划分可采用(__)或(__)策略。A、自顶向下B、自底向上C、自左至右D、自右至左答案:AB46.深度神经网络模型按部署端可分为()方式A、云端部署B、移动端部署C、边缘端部署D、以上都不是答案:ABC47.实现人工神经元的方法有(__)。A、感知器B、线性单元C、SIGMOD单元D、决策单元答案:ABC48.基于语义的情感词典方法有(__)等流程。A、构建词典B、统计词频C、构建倾向性计算算法D、确定阈值答案:ACD49.现代计算机的CPU是由()、()和存储单元组成。A、运算单元B、控制单元C、输入单元D、输出单元答案:AB50.关于《劳动法》的相关规定,下列说法正确的是()A、工作时间(又称劳动时间),是指法律规定的劳动者在一昼夜和一周内从事生产、劳动或工作的时间。B、所谓全面保护,是对劳动者权益和权能的保护,包括人身权益和财产权利、法定权利和约定权益C、小王在失业前公司为他累计缴费失业保险6年,他可以领取18个月的失业保险金D、劳动规章是劳动法的最主要的表现形式答案:AB51.下列关于聚类法方法描述正确的是(__)。A、k均值算法属于原型聚类B、学习向量化算法试图找到一组原型向量来刻画聚类结构C、高斯混合聚类采用概念模型来表达聚类原型D、学习向量化算法属于层次聚类答案:AB52.分类模型的误差包括(___)。A、训练误差B、泛化误差C、再代入误差D、表现误差答案:ABC53.人工智能项目开发过程中,项目成本包括()A、时间成本B、资源成本C、风险成本D、市场成本答案:ABC54.假阳率的其它名称不正确的是()A、错误率B、虚警率C、查全率D、查准率答案:ACD55.下列属于结合策略的是(__)。A、投票法B、平均法C、学习法D、排序法答案:ABC56.下面描述正确的是()。A、开运算是先腐蚀在膨胀B、开运算是先膨胀在腐蚀C、闭运算是先腐蚀在膨胀D、闭运算是先膨胀在腐蚀答案:AD57.人体姿态数据采集时,属于采集图像数据质量要求的是()A、照片清晰度B、拍摄光线要求C、图片大小D、姿态要求答案:ABD58.为大数据提供基础设施服务,有(__)和数据计算、数据管理与监控、集群服务、众包等。A、数据存储B、数据加工C、数据治理D、app开发答案:ABCD59.下面对后向计算描述错误的是()A、后向计算是模型学习过程B、后向计算目的是预测数据结果C、后向计算目的是训练模型参数D、后向计算的时候容易发生梯度弥散现象答案:ACD60.下列关于Boosting算法说法正确的是(__)。A、Boosting算法要求基学习器能对特定的数据分布进行学习B、oosting对无法接受带权样本的基学习算法,可通过重采样法进行处理C、Boosting算法在训练的每一轮都要检查当前生成的基学习器是否满足基本条件D、一旦当前生成的基学习器不满足条件,则当前基学习器被抛弃,且学习过程停止答案:ABCD61.L2正则化描述正确的是()A、L2正则化是通过绝对值来约束模型权重B、L2正则化是通过平方值来约束模型权重C、L2正则化后,不重要的权重会被直接约束为0D、L2正则化后,不重要的权重绝对值会被约束的很小答案:BD62.模型使用自监督学习后,再训练当前任务,通常会使模型()A、精度更高B、需要的训练数据量降低C、模型的推理速度更快D、模型的收敛速度更快答案:ABD63.下列关于随机森林说法正确的是(__)。A、随机森林是Bagging的一个扩展变体B、随机森林在决策树的训练过程中引入了随机属性选择C、随机森林简单且容易实现D、随机森林计算开销大答案:ABC64.训练模型时候的损失曲线图,下列哪张图最有可能是过拟合导致的()A、1B、2C、3D、4答案:AC65.NERF技术描述正确的是()A、NERF技术被称为神经辐射场技术B、NERF技术是通过多角度照片进行的三维建模C、NERF是通过3D点云设备采集的数据进行建模D、NERF技术通过几个角度的对象照片信息来预测该对象其它角度照片信息答案:ABD66.智能问答系统模型结构中编码器的作用是()。A、问题输入B、答案输出C、问题转换为特征D、特征转换为答案答案:AC67.学习率变小,可能会使模型训练的时候()A、模型发散B、模型收敛速度变慢C、训练数据损失曲线变得平滑D、模型前向计算过程加快答案:BC68.下面描述错误的是()。A、阿尔法狗属于强人工智能B、人脸识别属于弱人工智能C、无人驾驶属于强人工智能D、工业机器人属于强人工智能答案:ACD69.以下关于机器学习的发展历程描述正确的是(___)。A、机器学习是人工智能研究发展到一定阶段的必然产物B、二十世纪五十年代到七十年代出,人工智能研究处于“推理期”C、图灵在1950年关于图灵测试的文章中,就曾提到了机器学习的可能D、人工智能在二十世纪五十到八十年代经历了“推理期”和“知识期”答案:ABCD70.(__)由两个簇的最近样本决定,(__)由两个簇的最远样本决定,(__)由两个簇的所有样本共同决定。A、样本距离B、最小距离C、最大距离D、平均距离答案:BCD71.下列制度,()属于劳动标准制度A、休息休假制度B、工资制度C、劳动安全卫生制度D、女职工和未成年职工特殊保护制度答案:ABCD72.从互联网下载开源数据集有()问题需要注意A、数据版权和授权方式B、数据有效性C、数据一致性D、数据来源答案:ABCD73.以下关于大数据描述正确的是(____)。A、“涌现”是大数据的本质特征B、大数据是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析C、促进大数据发展行动纲要是2016年由国务院发布的D、大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合答案:ABD74.模型部署前,需要对模型进行量化,下面常见的量化参数精度有()A、double64B、int8C、int4D、int2答案:BCD75.图像识别技术的过程分以下几步:信息的获取、(__)、(__)、分类器设计和分类决策。A、辨认B、预处理C、统计D、特征抽取和选择答案:BD76.以下属于数据科学的研究目的的是(____)。A、数据洞见B、数据生态系统建设C、数据业务化D、数据产品的研发答案:ABCD77.适用于内容审核场景的有()A、智能鉴黄B、违禁违规C、暴力犯罪D、低俗恶趣E、政治倾向答案:ABCDE78.(__)属于图像平滑的滤波。A、盒式滤波B、双边滤波C、导向滤波D、贝叶斯变换答案:ABC79.数据科学的基本流程包含(__)。A、数据可视化B、数据加工C、数据化D、数据洞见答案:BCD80.半监督学习中,对未标记样本所揭示的数据分布信息与类别标记相联系的假设的有(__)和(__)。A、归纳假设B、聚类假设C、流形假设D、基本假设答案:BC81.离散数据常用的编码方式有()。A、词向量B、霍夫曼编码C、标准化D、独热编码答案:ABD82.关于TPU,下列说法正确的是()A、TPU是一款专用于机器学习的芯片B、TPU是一款专用于数据处理的芯片C、TPU能用于深度神经网络训练D、TPU可以提供高吞吐量的低精度计算答案:ACD83.某厂商生产的手机中有一个对语音话机器人,该机器人使用了下列哪些技术()A、声纹识别B、语音识别C、文本转语音D、自然语义问答模型答案:BCD84.下列哪些操作会使得图像变模糊。()A、去掉低频信号,保留高频信号B、去掉高频信号,保留低频信号C、使用高斯核对图像进行卷积运算D、使用拉普拉斯核对图像进行卷积运算答案:BC85.下面哪些对3D点云描述正确的是()。A、3D点云数据只有顶点数据,无线和面的数据。B、3D点云数据相对与完整3D数据,数据量更少,处理起来更高效C、3D点云技术常用到自动驾驶行业中D、可以通过3D点云数据完全还原物体的纹理贴图信息答案:ABC86.模型采用WEB部署方式提供服务,哪些协议是WEB服务的通讯协议()A、HTTPB、HTTPSC、UDPD、TCP答案:AB87.下列哪些设备属于边缘计算设备?()A、GTX1080B、RK3399C、RTX3060D、JETSONNX答案:CD88.下列主流模型中属于图像侦测的模型有()、A、RCNNB、UNETC、SEQ2SEQD、YOLO答案:AD89.下列哪些分布是离散分布。()A、高斯分布B、均匀分布C、伯努利分布D、多项分布答案:CD90.SGD优化器中用到了哪些技术()A、反向传播算法B、小批量学习C、动态学习率D、动量学习答案:AB91.用区域聚合法分割图像,要求(__)。A、各个点在平面上相邻接B、各个点是在平面上分散C、邻接点的特征相似D、点与点之间无关答案:AC92.下列哪些算法可以用来构造神经网络()。A、kNNB、线性回归C、逻辑回归答案:BC解析:kNN是一种基于实例的学习算法,不具有任何训练参数。因此不能用来构造神经网络,线性回归和逻辑回归都可以用来构造神经网络模型,其实二者就是单神经元的神经网络。93.企业应用包括(__)和人力资本、金融、生产能力、后台自动化等。A、销售B、营销C、法律D、客户服务答案:ABCD94.对图像生成模型描述正确的是()。A、图像生成模型是通过特征转换为图像B、图像生成模型是通过图像转化为特征C、图像生成模型是无监督学习D、GAN是生成模型答案:ACD95.许多功能更为强大的非线性模型可在线性模型基础上通过引入(__)和(__)而得A、层级结构B、高维映射C、降维D、分类答案:AB96.适用于推荐系统的业务场景的有()。A、新闻分发B、电商首页商品展示C、短视频推送D、电商商品自动评价答案:ABC97.下面哪些计算卡是边缘计算卡()A、TeslaA100B、JetsonNanoC、RK3399PROD、HI3559A答案:BCD98.卷积神经网络可以用于()。A、图像分类B、目标提取C、图像分割D、中文分词答案:ABC99.(__)是数据科学的主要理论基础之一。A、机器学习B、统计学C、数据D、黑客精神与技能答案:AB100.以下()属于常见语音数据异常。A、丢帧B、喷麦C、重音D、音调较高答案:ABC101.NPU特点描述错误的是()。A、擅长神经网络模型推理B、擅长神经网络模型训练C、功耗高D、功耗低答案:BC102.训练CNN时,GPU显存溢出,此时可以采取什么办法?()A、减少mini_batch大小B、移除一些卷积层C、减少图片输入大小D、增加激活函数答案:ABC103.召回率的其它名称为()A、正确率B、查全率C、命中率D、查准率答案:BC104.以下说法正确的是()。A、负梯度方向是使函数值下降最快的方向B、当目标函数是凸函数时,梯度下降法的解是全局最优解C、梯度下降法比牛顿法收敛速度快D、拟牛顿法不需要计算Hesse矩阵答案:ABD解析:牛顿法是二阶收敛,梯度下降是一阶收敛,所以牛顿法就更快。105.对于正交属性空间中的样本点,若存在一个超平面对所有样本进行恰当的表达,则这样的超平面应具有(__)和(__)的性质。A、最近重构性B、最大可分性C、最远重构性D、最小可分性答案:AB106.()和()被分别成为“计算机之父”和“计算机科学之父”A、高斯B、费曼C、冯·诺伊曼D、图灵答案:CD107.下列对误差值与错误值描述错误的是()。A、错误值不可以消除B、错误值可以消除C、误差值不可消除D、误差值可以消除答案:AD108.下面对SEQ2SEQ描述正确的是()。A、它是一种编解码结构B、输入输出序列长度必须一致C、输入输出都是序列数据D、语言翻译比较适合这种结构答案:ACD109.人工智能项目开发过程中,输入输出分析包括()A、输入数据的来源B、输入数据的内容C、输入数据的格式D、输出数据的内容答案:BCD110.表达高斯分布,需要哪些参数()。A、偏差B、期望C、均值D、方差答案:CD111.下列对MSE指标和MAE指标描述正确的是()A、MAE指标值越大,模型精度越低。B、MAE指标值越大,模型精度越高C、MSE指标值越大,模型精度越低D、MSE指标值越大,模型精度越高答案:AC112.人工智能产品采用C/S架构,C和S分别是()。A、客户端B、网页端C、服务端D、数据端答案:AC113.P-R曲线由()和()构成。A、查准率B、查全率C、准确率D、错误率答案:AB114.常见的插补缺失值方法有()。A、均值插补B、同类均值插补C、多重插补D、极大似然估计答案:ABCD115.在ROC空间中,以(__)为横轴,以(__)为纵轴。A、TPrateB、FNrateC、FPrateD、TNrate答案:AC116.数据战略的影响因素(__)。A、当前业务需求B、潜在风险C、数据战略范畴D、未来需求答案:ABD117.手势识别需要用到的技术有()。A、图像侦测B、图像超分C、关键点检测D、图像生成答案:AC118.下面属于探索性分析主要关注的四大主题的有(__)。A、耐抗性B、方差C、重新表达D、启示答案:ACD119.车牌识别的用到了哪些人工智能图像处理技术。()A、图像关键点定位B、图像生成C、图像文本识别D、图像语义分割答案:CD120.关于梯度消失和梯度消失,以下说法正确的是:(__)。A、根据链式法则,如果每一层神经元对上一层的输出的偏导乘上权重结果都小于1的话,那么即使这个结果是0.99,在经过足够多层传播之后,误差对输入层的偏导会趋于0B、可以采用ReLU激活函数有效的解决梯度消失的情况C、根据链式法则,如果每一层神经元对上一层的输出的偏导乘上权重结果都大于1的话,在经过足够多层传播之后,误差对输入层的偏导会趋于无穷大D、可以通过减小初始权重矩阵的值来缓解梯度爆炸答案:ABCD解析:使用标准化初始w,那么各个层次的相乘都是0-1之间的小数,而激活函数f的导数也是0-1之间的数,其连乘后,结果会变的很小,导致梯度消失。若我们初始化的w是很大的数,w大到乘以激活函数的导数都大于1,那么连乘后,可能会导致求导的结果很大,形成梯度爆炸。121.常用的Python科学计算库有()。A、NumpyB、SciKit-learnC、PandasD、SciPy答案:ABCD122.下面哪些是基于核的机器学习算法(__)。A、最大期望算法B、径向基核函数C、线性判别分析法D、支持向量机答案:BCD解析:SVM(可支持向量机),KFD(基于核的Fisher判别分析),KPCA(核成分分析)。径向基函数核(RadialBasisFunction,RBFkernel),也被称为高斯核(Gaussiankernel)或平方指数核(SquaredExponential.,SEkernel)[1],是常见的核函数(kernelfunction)。RBF核被应用各类核学习(kernellearning)算法中,包括支持向量机(SupportVectorMachine,SVM)、高斯过程回归(GaussianProcessRegression,GPR)等。123.P{H|X}是给定观测值X条件下H出现的概率,统称为(__)。A、先验概率B、后验概率C、条件概率D、模型答案:BC124.下面哪些英文缩写是正确的()A、语音识别,ASRB、文本转语音TTSC、文本阅读OCRD、声纹识别VPR答案:AB125.下面哪些深度学习模型使用了Transformer网络结构()A、GPTB、AEC、BERTD、GAN答案:AC126.下列对误差值与错误值描述正确的是()。A、错误值不可以消除B、错误值可以消除C、误差值不可消除D、误差值可以消除答案:BC127.图像处理中的开运算是先对图像进行()操作,再对图像进行()A、低通滤波B、腐蚀C、高通滤波D、膨胀答案:BD128.属于数据变换的类型有(__)。A、平滑处理B、聚类C、标准化D、特征构造答案:ABD129.导致模型过拟合的原因有()A、数据质量低B、数据量少C、模型规模太大D、模型参数量太少答案:BC130.Transformer网络结构中,包含()子网络结构A、CNNB、RNNC、MLPD、ATTENTION答案:CD131.下面那些函数属于常用的激活函数。()A、SigmoidB、TanhC、MeanD、Relu答案:ABD132.支持向量机中定义的间隔值为w的二范式的-2次方,这样看间隔貌似仅与权重w有关,这意味着偏置项b(__)。A、没有任何意义B、对间隔不会产生影响C、通过约束隐式地影响着w的取值D、对间隔会产生影响答案:CD133.感知机能容易实现逻辑(__)、(__)、(__)运算A、加减B、与C、或D、非答案:BCD134.人工智能模型开发过程中,数据方案包括数据采集,()方面的内容A、数据清洗B、数据标准化C、数据标注D、数据增强答案:ACD135.在知识图谱中下列概念属于实体的是()。A、人名B、地名C、父子D、商品名答案:ABD136.OCR中使用到的图像技术有()。A、图像侦测B、图像生成C、图像识别D、图像定点答案:AC137.下面关于L1范式正则化描述正确的是(__)。A、L1范数正则化使得学习得到的结果满足稀疏化,从而方便人们提取特征B、L1范数是指向量中各个元素绝对值之和C、L1范数正则化也有个美称叫“稀疏规则算子”D、压缩感知问题可以通过L1范数最小化问题求解答案:ABCD138.通过爬虫技术从互联网上爬取数据有()潜在的法律问题A、容易IP地址被封B、容易造成被爬取对象的服务器负载提高C、容易爬取到侵权数据D、容易违反计算机信息安全罪答案:CD139.以下能力中,数据工程师需要具备的能力或素质是()。A、数据洞见B、数据的ETL操作C、数据的备份与恢复D、主数据管理及数据集成答案:BCD140.灰度图像,高为128,宽为256,3张图片同时输入到人工智能模型中,格式为NHWC,那不是NHWC值的是()。A、(5,3,256,128)B、(5,1,128,256)C、(5,256,128,1)D、(5,128,256,1)答案:ABC141.模型测试评估方案应包括()内容。A、测试数据集的制作B、测试环境的搭建C、测试用例的编写D、测试指标的制定答案:ABC142.模型蒸馏是模型优化中的重要技术,下面对模型蒸馏描述正确的是()。A、模型蒸馏会对教师模型参数进行改变B、模型蒸馏是把大模型的知识传递给小模型C、模型蒸馏是为了加快模型的推理速度D、模型蒸馏是教师学生训练模型答案:BCD143.以下对大数据4V特性描述正确的是(____)。A、Value是指价值密度低B、大数据中所说的“速度”包括两种:计算速度和处理速度C、大数据时间分布是不均匀的D、在大数据中,价值价值与数据总量的大小存在线性关系答案:AC144.根据《促进大数据发展行动纲要》(国发〔2015〕50号),大数据的主要特征包括A、容量大B、类型多C、存取速度快D、价值密度低答案:ABCD145.模型训练完成后,在部署前,对模型进行优化的手段有()A、量化B、加先验C、蒸馏D、剪枝答案:ACD146.数据科学项目的基本流程涉及发活动包括(__)和数据的管理与获取、结果的可视化与文档化、模式/模型的验证和优化。A、模式/模型的应用和维护B、项目目标定义C、项目成本控制D、模式/模型的洞见答案:ABD147.基于统计的分词方法的优点有(__)。A、分速度快B、效率高C、结合上下文识别生词D、消除歧义答案:ABCD148.关于Dropout说法正确的是:(__)。A、Dropout背后的思想其实就是把DNN当做一个集成模型来训练,之后取所有值的平均值,而不只是训练单个DNNB、DNN网络将Dropout率设置为p,也就是说,一个神经元被保留的概率是1-p。当一个神经元被丢弃时,无论输入或者相关的参数是什么,它的输出值就会被设置为0C、丢弃的神经元在训练阶段,对BP算法的前向和后向阶段都没有贡献。因为这个原因,所以每一次训练,它都像是在训练一个新的网络D、ropout方法通常和L2正则化或者其他参数约束技术(比如MaxNorm)一起使用,来防止神经网络的过拟合答案:ABCD解析:dropout是指在深度学习网络的训练过程中,对于神经网络单元,按照一定的概率将其暂时从网络中丢弃。注意是暂时,对于随机梯度下降来说,由于是随机丢弃,故而每一个mini-batch都在训练不同的网络。防止过拟合的方法:提前终止(当验证集上的效果变差的时候);L1和L2正则化加权;softweightsharingDropout。ropout率的选择:经过交叉验证,隐含节点dropout率等于0.5的时候效果最好,原因是0.5的时候dropout随机生成的网络结构最多。dropout也可以被用作一种添加噪声的方法,直接对input进行操作。输入层设为更接近1的数。使得输入变化不会太(0.8)。149.下列哪种音频格式无损的?()A、peB、wavC、mp3D、aac答案:AB150.下面不属于探索性统计中常用数据分布统计量的是(__)。A、残差B、偏态C、峰态D、众数答案:AD151.当闵可夫斯基距离公式中的系数p值为1时,可得到(__)的公式。A、欧氏距离B、曼哈顿距离C、街区距离D、切比雪夫距离答案:BC152.Feigenbaum等人在著名的《人工智能手册》中将机器学习划分为机械学习和(_)四种。A、深度学习B、示教学习C、类比学习D、归纳学习答案:BCD153.常见的图像判别类任务有()A、图像创作B、图像语义分割C、图像侦测D、图像识别答案:BCD154.人工智能模型开发过程中,模型研发方案应该包含()A、模型实施方案B、数据方案C、模型设计,训练,优化方案D、模型测试评估方案答案:BCD155.多模态数据通常包含()数据。A、文本B、语音C、图片D、视频答案:ABCD156.端到端设计的优势是()A、模型结构设计更灵活容易B、容易使用多模态输入C、容易解释模型工作过程D、不需要人工提取数据特征答案:ABD157.数据科学项目主要涉及的角色有(__)和项目发起人、客户、项目经理。A、数据科学家B、领域专家C、数据工程师D、操作人员答案:ACD158.数据标准化的目的为()。A、约束输入数据的值范围B、把输入数据的分布变为标准正太分布C、使得输入数据的分布服从均值为0,方差为1D、对数据做归一化操作答案:AC159.下列关于偏差、方差、均方差、泛化误差描述有误的是(__)。A、方差度量了学习算法的期望预测与真实结果的偏离程度。B、偏差度量了同样大小的训练集的变动所导致的学习性能的变化。C、泛化误差表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度。D、泛化误差可分解为偏差、方差与噪音之和。答案:ABC160.CPU和GPU分别称为()和()A、运算控制器B、中央处理器C、存储控制器D、图形处理器答案:CD161.关于Python,下列说法正确的是()A、Python拥有一个很棒的语言库生态环境,历史上也一直都是科学计算和数据分析的重要工具B、Python之所以适合AI项目,其实也是基于Python的很多有用的库都可以在AI中使用C、有高效率的高层数据结构,简单而有效地实现面向对象编程。D、Python既支持面向过程的函数编程也支持面向对象的抽象编程。答案:ABCD162.下列属于半监督学习方法的是(__)。A、半监督支持向量机B、图半监督学习C、生成式方法D、支持向量机答案:ABC163.以下哪些滤波器能在卷积窗口的边界上使卷积掩膜中心像素和它的4-邻接点的系数降至0附近。A、同态滤波B、高斯滤波C、巴特沃斯滤波D、中值滤波答案:BC164.下面()框架是深度学习研发框架A、Scikit-LearnB、PytorchC、TensorflowD、PaddlePaddle答案:BCD165.深度学习可进一步分为(__)。A、无监督和生成式学习深度网络B、半监督深度神经网络C、监督学习深度网络D、混合深度网络答案:ACD166.(__)不属于元分析方法。A、加权平均法B、优化方法C、时序法D、关联法答案:CD167.数据清洗的目的是()A、检查数据的一致性B、处理无效值C、处理重复数据D、处理缺失值答案:ABCD168.下列哪些现象属于乘性噪声。()A、电视光栅的退化B、二值图像上的胡椒盐噪声C、信道传输受扰D、胶片材料的退化答案:AD169.在模型评估与度量的方法中,下列描述正确的是(__)。A、在留出法中,如果从采样的角度来看待数据集划分的过程,则保留类别比例的采样方式通常称为分层采样B、通常,我们可通过实验测试来对学习器的泛化误差进行评估并进而做出选择。C、我们需要一个测试集来测试学习器对新样本的判别能力D、测试样本不可从样本真实分布中独立同分布采样而得答案:ABC170.(__)是图像降噪的方法。A、空间域合成法B、中值滤波器C、最小值滤波D、非线性小波变换答案:ABCD171.目前比较流行的深度学习框架包括()。A、PytorchB、TensorflowC、SciPyD、PaddlePaddle答案:ABD172.关于我国自有的深度学习框架,下列说法正确的是()A、我国自有的深度学习框架是PyTorchB、PaddlePaddle属于百度的深度学习框架C、PaddleOCR旨在打造一套丰富、领先且实用的OCR工具库D、PaddleOCR属于飞桨文字识别开发套件答案:BCD173.数据科学的基本流程包含(__)。A、数据产品的提供B、数据应用C、结果展示D、数据可视化答案:AC174.大数据的主要特征(____)。A、容量大B、类型多C、存取速度快D、应用价值高答案:ABCD175.下列哪些场景使用了语音唤醒技术。()A、语音控制空调开关B、智能翻译笔C、微信聊天语音转文本D、启动小米音响需要说“你好,小爱”答案:AD176.下列哪些情况不可能是学习率太大导致的()A、模型收敛的太慢B、模型无法收敛,并发散崩溃C、模型迅速收敛到损失函数最小值D、模型内部参数大部分变为0答案:ACD177.使用人工智能技术监控电梯间电动车驶入的优势有()A、发现电梯间驶入电动车,及时告警并通知物业人员B、提高工作监管效率C、后台可随时查看统计记录,回看违规事件答案:ABC178.图结构可以分为()A、有向图B、无向图C、有关系图D、无关系图答案:AB179.下列哪些业务场景使用了语音合成。()A、I同传B、小说智能阅读C、视频AI字幕D、地震预警语音播报答案:BD180.数据清洗的目的是()。A、检查数据的一致性B、处理无效值C、处理缺失值D、处理重复数据答案:ABCD181.从行为目的与思维来看,数据统计方法可以分为(__)。A、描述统计B、洞见统计C、推断统计D、归纳统计答案:AC182.神经网络的拓扑结构可以分为()和随机型网络等。A、前向型B、后向型C、反馈型D、自组织竞争型答案:ACD解析:神经网络的拓扑结构有前向型、反馈型、自组织竞争型和随机型网络等。183.下列关于支持向量的说法错误的是(__)。A、支持向量回归机的支持向量落在它规定的间隔带之内B、支持向量回归机的支持向量落在它规定的间隔带之外C、支持向量回归机的支持向量只占训练集的一部分D、训练集中的全部样本都是支持向量答案:BD184.下列关于EM算法描述正确的是(__)。A、EM算法是常用的估计参数隐变量的利器B、EM算法即是期望最大化算法C、EM算法常被用来学习高斯混合模型的参数D、EM算法是一种迭代式的方法答案:ABCD185.模型部署前,需要对模型进行量化,量化通常会()A、降低模型预测精度B、提高模型推理速度C、模型训练时候加快收敛D、提高模型泛化能力答案:AB186.人工智能可以分为:弱人工智能阶段、()、()。A、强人工智能阶段B、超人工智能阶段C、快速人工智能阶段D、虚拟人工智能阶段答案:AB187.数据战略等于(__)之“和”。A、数据管理目标B、行动方案C、目标管理D、动态机制答案:ABC188.数据战略的基本问题有(__)。A、数据战略的定位B、数据战略的目标C、数据战略的侧重点D、数据战略的范畴答案:ABCD189.图像数据增强的目的是()。A、增加样本数据量B、增加样本多样性C、提高模型推理速度D、提高模型泛化能力答案:ABD190.以下哪些产品属于数据产品A、数据报表平台B、DMPC、搜索与精准化产品D、风控产品答案:ABCD191.下列数据中,哪些样本的期望为0.2。()A、正样本值为0.4,负样本值为-0.2,正样本数量为20,负样本数量为30B、正样本值为0.2,负样本值为0,正样本数量为15,负样本数量为35C、正样本值为1,负样本值为0,正样本数量为20,负样本数量为80D、正样本值为1,负样本值为-1,正样本数量为60,负样本数量为40答案:AB192.训练CNN时,GPU显存溢出,此时可以采取什么办法()A、减少mini_batch大小B、移除一些卷积层C、减少图片输入大小D、增加激活函数答案:ABC解析:D:反而会加重负担。193.下列关于学习器的性能度量说法正确的是(__)。A、对于二分类问题,可将样例根据其真实类别与学习器预测类别的组合划分为:真正例、假正例、真反例、假反例B、查准率和查全率是一对矛盾的度量C、一般来说,查准率越高,查全率往往也偏高D、一般来说,查准率越高,查全率往往偏低答案:ABD194.SEQ2SEQ网络结构适合于哪些常见场景()。A、翻译B、问答C、分类D、回归答案:AB195.CNN相比于全连接的DNN有哪些优势?()A、参数更少B、泛化更好C、训练更快D、更容易搭建答案:ABC196.下图属于图像中包含了哪些人工智能图像任务()A、图像侦测B、图像生成C、图像检测D、图像语义分割答案:ACD197.以下对数据描述正确的是(____)。A、数据只包含显性数据和隐性数据B、数值是数据的一种形式C、数据到智慧是人们认知提升的过程D、数据是现实世界的记录答案:BCD198.人工智能项目开发流程包括()A、需求分析B、模型研发C、实施部署D、文档交付答案:ABCD199.从结构化角度来看,数据可分为(____)。A、结构化数据B、非结构化数据C、无结构化数据D、半结构化数据答案:ABD200.数据产品的存在和表现形式有(__)和数据类产品。A、情感类产品B、信息类产品C、知识类产品D、智慧类产品答案:BCD201.按标注的实现层次,数据标注可以分为(__)。A、语义标注B、图像标注C、语法标注D、文字标注答案:AC202.(__)可以帮助解决训练集在特征空间中线性不可分的问题。A、硬间隔B、软间隔C、核函数D、拉格朗日乘子法答案:BC203.训练深度神经完了过的时候,下面那种现象可能是梯度弥散导致的()A、无论输入什么数据,模型输出为始终NanB、无论输入什么数据,前向计算的结果都不再变化或变化特别小,且不为NanC、后向计算的时候,靠近输出入的层的模型权重不再变化。D、损失函数的输出结果越来越大答案:BC204.下列表示同一种学习方法的是(__)。A、集成学习B、多分类器系统C、基于委员会的学习D、平均策略答案:ABC205.在神经网络学习中,sigmoid函数可用作(__)。A、损失函数B、优化函数C、激活函数D、响应函数答案:CD206.下面对学习率描述正确的是()A、学习率越大,模型收敛越快,但也可能导致模型发散B、学习率越小,模型收敛越慢,但也可能导致模型发散C、学习率越大,模型越不容易陷入局部最小值D、学习率越小,模型越不容易陷入局部最小值答案:AC207.人工智能模型开发过程中,不属于模型研发阶段的工作是()A、输入输出分析B、数据方案C、模型设计D、指标制定答案:BC208.下列对强化学习描述正确的是()A、强化学习是加强正确动作的发生概率,降低错误动作的发生概率B、强化学习是一种奖惩学习C、AlphaGo是一种下围棋的强化学习模型D、图像识别是通过强化学习来实现的答案:ABC209.()、算法、()构成人工智能3要素A、公式B、算力C、数据D、程序答案:BC210.技术指导的主要方法包括()A、普通授课B、工作指导C、研讨D、录像、多媒体教学答案:ABCD211.CNN相比于全连接的DNN有哪些优势()A、参数更少B、泛化更好C、训练更快D、更容易搭建;答案:ABC解析:D:DNN直接对数据做加权线性连接,而CNN则是移动卷积核,并对图像中的各区域做卷积操作。212.关于《网络安全法》,下列说法正确的是()A、国家实施网络可信身份战略,支持研究开发安全、方便的电子身份认证技术,推动不同电子身份认证之间的互认。B、网络产品、服务的提供者不得设置恶意程序C、按照规定留存相关的网络日志不少于六个月D、网络运营者不得泄露、篡改、毁损其收集的个人信息答案:ABCD213.数据科学的基本流程包含(__)。A、数据化B、探索性分析C、数据分析D、数据存储答案:ABC214.从培训的对象,培训可分为()A、个人技能培训B、企业培训C、心态培训D、能力培训答案:AB215.3D点云常见的任务有哪些()。A、3D物体识别B、3D物体重建C、3D物体跟踪D、3D纹理贴图答案:AC216.市面上哪些产品使用了语音识别技术。()A、小米的小爱机器人B、喜马拉雅APP小说智能阅读C、微信的语音转写D、抖音短视频AI配音答案:AC217.劳动者的社会保险分为()A、基本养老保险B、基本医疗保险C、工伤保险D、失业保险答案:ABCD218.以下关于神经网络模型描述正确的是(__)。A、神经网络模型是许多逻辑单元按照不同层级组织起来的网络,每一层的输出变量都是下一层的输入变量B、神经网络模型建立在多神经元之上C、神经网络模型中,无中间层的神经元模型的计算可用来表示逻辑运算D、神经网络模型一定可以解决所有分类问题答案:ABC解析:现在很多分类问题的准确率都很低尤其是医学图像方面,而且容易受环境,如光照影响。219.一个交叉验证将数据集分成两个互补的子集,分别是(__)和(__)。A、训练集B、测试集C、子集D、补集答案:AB220.()、()、()构成人工智能3要素A、算法B、算力C、数据D、程序答案:ABC221.下列现象可能是欠拟合导致的有()A、模型训练损失降到0B、模型训练损失不收敛C、训练指标与测试指标表现都很差D、训练指标表现好,测试指标表现差答案:BC222.下列属于生成模型的场景有()A、戴口罩检测B、低分辨率图片变成高分辨率图片C、通过输入文本语义,输出一幅符合文本语义的图像D、人脸检测答案:BC223.有两种策略常用来缓解BP网络的过拟合,分别是()和()。A、晚停B、早停C、正则化D、加入损失函数答案:BC解析:通常有两种策略来缓解BP网络的过拟合。第一种策略是早停(earlystopping):将数据分成训练集合验证集,训练集用来计算梯度、更新连接权和阈值,验证集用来估计误差,若训练集误差降低但验证集误差升高,则停止训练,同时返回具有最小验证集误差的连接权和阈值。第二种策略是正则化(regularization),其基本思想是在误差目标函数中增加一个用于描述网络复杂度的部分,例如连接权和阈值的平方和。224.数据加工的主要动机往往来自(__)。A、实时要求B、质量要求C、计算要求D、数量要求答案:BC225.下列关于AUC面积描述正确的是(__)。A、UC被定义为ROC曲线下与坐标轴围成的面积B、AUC面积的值大于1C、AUC等于0.5时,则真实性最低,无应用价值D、AUC越接近1.0,检测方法真实性越高答案:ACD226.人工智能项目开发过程中,资源成本包括()A、机会成本B、数据成本C、设备成本D、人力成本答案:BCD227.人脸活体检测常用的技术手段有()。A、人脸关键点检测B、静默活体检测C、人脸语义分割D、交互式活体检测答案:BD228.下列属于朴素贝叶斯分类器的特点的是(__)。A、算法逻辑简单,易于实现B、算法逻辑复杂,不易于实现C、分类过程中时空开销小D、分类过程中时空开销大答案:AC229.写字楼人脸闸机使用时的人脸识别效果不佳,可能的主要因素有()。A、光线角度问题B、网络问题C、面部遮挡问题D、人脸相似度过大答案:ABC230.下列关于包裹式选择的描述正确的是(__)。A、包裹式特征选择方法直接针对给定学习器进行优化B、从最终学习器性能来看,包裹式特征选择比过滤式特征选择更好C、包裹式特征选择的计算开销通常比过滤式特征选择大得多D、包裹式特征选择的典型算法:LVW算法,其特征子集搜索采用了随机策略答案:ABCD231.教学的方法包括()A、讲授法B、问答法C、演示法D、自学法答案:ABC232.卷积神经网络中常用的池化函数包括()。A、最大池化函数B、L2范数C、相邻矩形区域内的平均值D、基于据中心像素距离的加权平均函数答案:ABCD解析:最大池化函数;L2范数;相邻矩形区域内的平均值;基于据中心像素距离的加权平均函数;重叠池化;空金字塔池化。233.编解码神经网络结构通常包括()A、编码器B、特征生成器C、解码器D、以上都是答案:BC234.互联网数据采集有()劣势A、后期数据清洗难度大B、容易侵权C、获取数据成本高D、干扰数据多答案:ABD235.下面属于数据科学家的主要职责有(__)。A、提出“好问题”B、完成“数据加工”C、实现“数据洞见”D、数据“故事化”答案:ABCD236.下列哪些数据适合独热编码?()A、文本中的单词B、性别C、身高D、年龄阶段(婴儿、小孩、青年、中年、老年)答案:BD237.下面哪些概念属于CNN网络模型。()A、感受野B、步长C、通道D、反馈答案:ABC238.下列属于数值优化算法的是(__)。A、梯度下降法B、牛顿法C、极大似然法D、逻辑回归答案:AB239.下面属于数据科学主要研究内容的有(__)。A、理论基础B、数据加工C、数据计算D、数据产品开发答案:BCD240.衡量数据样本质量包括()方面。A、数据量B、多样性C、覆盖性D、均衡性答案:ABCD241.数据产品的主要特征有(__)。A、数据为中心B、多样性C、层次性D、增值性答案:ABCD242.下列哪些任务属于回归任务()A、人脸识别B、人脸关键点定位C、人物位置跟踪D、人物性别辨识答案:BC243.框A面积为30,框B面积为20,两个框可能的IOU值有()A、1/3B、0C、1D、2/3答案:ABD244.根据训练数据是否拥有标记信息,学习任务可大致分为(___)和(___)。A、监督学习B、训练集C、无监督学习D、测试集答案:AC245.下列关于核函数的说法正确的是(__)。A、任何一个函数都可以作为核函数B、只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用C、任何一个核函数都隐式地定义了一个再生核希尔伯特空间D、核函数可将低维空间中线性可分的数据映射到高维空间,使其线性不可分答案:BC246.人工智能项目开发过程中,项目经理的职责是()A、质量监督B、项目进度督导C、客户对接D、研发人员调度答案:BC247.下列RGB颜色正确的是()A、(255,0,0)是红色B、(0,255,0)是绿色C、(0,0,255)是蓝色D、以上都不对答案:ABC248.按标注活动的自动化程度,数据标注可以分为(__)。A、手工标注B、文本标注C、半自动标注D、自动标注答案:ACD249.人工智能项目开发过程中,可行性分析包括()A、数据来源的可行性B、模型功能实现的可行性C、指标可达的可行性D、现场实施的可行性答案:ABCD250.常见的模型参数的量化精度有()A、FLOAT32B、INT8C、INT4D、INT2答案:BCD251.人工智能产品采用B/S架构,B和S分别代表()。A、客户端B、网页端C、服务端D、数据端答案:BC252.感知机中,(__)接收外界输入信号后传递给(__)。A、输入层B、输出层C、第一层D、第二层答案:AB253.下面属于数据科学理论基础的有(__)。A、统计学B、数据可视化C、机器学习D、领域知识答案:ABCD254.文本摘要的方法可以分为()A、分类式摘要B、抽取式摘要C、判别式摘要D、生成式摘要答案:BD255.噪声数据的主要表现形式有(__)。A、错误数据B、虚假数据C、异常数据D、冗余数据答案:ABC256.对人工智能模型进行减枝的目的是()A、降低模型的参数量B、提高模型的精度C、加快模型在边缘计算设备上的推理速度D、提高模型泛化能力答案:AC257.词性标注中包含的词性有()A、动词B、商品名C、量词D、数词答案:ACD258.下列哪些变换属于仿射变换。()A、平移B、旋转C、错切D、缩放答案:ABCD259.下面哪些指标取值范围是0到1,值越大,模型效果越好()A、MSEB、R2C、mAPD、余弦相似度答案:BC260.下列哪些场景可以使用关键点检测来实现。()A、手势识别B、跌倒识别C、人体姿态识别D、人脸检测答案:ABC261.图像数据结构化的优势是()。A、更易统计B、更易存储C、更易计算D、更易传输答案:ABCD262.数据采集的方法包括()A、互联网数据采集B、众包、行业合作C、各种传感器数据D、商业设计答案:ABC263.下列关于支持向量机的说法正确的是(__)。A、支持向量机的学习策略是间隔最大化B、支持向量机的基本模型是特征空间上间隔最大的线性分类器C、支持向量机只能对线性可分的样本进行分类D、传统支持向量机只能求解二分类问题答案:ABD264.下面对正确率计算正确的是()A、正样本10个,负样本15个,模型预测正样本错误8个,预测负样本正确10个,正确率为18/25B、正样本10个,负样本15个,模型预测正样本错误8个,预测负样本错误10个,正确率为7/25C、正样本10个,负样本15个,模型预测正样本正确8个,预测负样本正确10个,正确率为18/25D、正样本10个,负样本15个,模型预测正样本错误8个,预测负样本正确10个,正确率为12/25答案:BCD265.下列哪些任务属于聚类()A、物以类聚,人以群分B、近朱者赤,近墨者黑C、同流合污,臭味相投D、龙生龙,凤生风,老鼠儿子会打动答案:AC266.常见的人工智能模型部署方式有()A、云端部署B、边缘设备部署C、移动端部署D、防火墙部署答案:ABC267.高斯白噪音产生的原因有()。A、图像传感器在拍摄时不够明亮、亮度不够均匀B、电路各元器件自身噪声和相互影响C、图像传感器长期工作,温度过高D、相机分辨率太低答案:ABC268.常见的聚类模型有()A、K-meansB、DBSCANC、LogisticRegressionD、Hierarchicalclustering答案:ABD269.下列关于偏差、方差、均方差、泛化误差的作用表述正确的是(__)。A、偏差刻画了模型本身的拟合能力B、方差刻画了数据扰动所造成的影响C、噪声刻画了学习问题本身的难度D、泛化误差可分解为方差与噪音之和。答案:ABC270.3D重建技术适用于哪些应用场景。()A、城市建筑建模B、VR/ARC、自动驾驶D、元宇宙内容建模答案:ABD271.模型欠拟合的时候,则()A、扩大网络规模,防止欠拟合B、扩大模型参数,防止欠拟合C、缩小网络规模,防止欠拟合D、缩小模型参数,防止欠拟合答案:AB272.()是LSTM有的模块。A、遗忘门B、输出门C、池化门D、信息增加门答案:ABD273.有两种策略常用来缓解BP网络的过拟合,分别是(__)和(__)。A、晚停B、早停C、正则化D、加入损失函数答案:BC274.下面哪些计算卡使用的计算芯片是国产的()A、TeslaA100B、JetsonNanoC、RK3399PROD、HI3559A答案:CD275.常见的样本数据划分方式为()A、训练集,验证集B、验证集,测试集C、训练集,测试集D、训练集,验证集,测试集答案:CD276.方差越大,数据()。A、集中度越小B、集中度越大C、标准差越大D、标准差越小答案:BC277.活体检测适用于下列哪些场景。()A、人脸支付B、身份认证C、银行摄像头监控D、人脸解锁答案:ABD278.下列公式(其中p表示模型预测值,t表示样本目标值)正确的是()A、MSE=|p-t|B、MAE=|p-t|C、MSE=(p-t)2D、MAE=(p-t)2答案:BC279.下列使用了文本匹配的应用场景有()A、搜索引擎B、电商搜索C、新闻推荐D、文章摘要答案:ABC280.下列关于聚类,说法正确的是(__)。A、聚类任务中也可使用有标记训练样本B、聚类试图将数据集中的样本划分为若干个通常是不相交的子集C、聚类可作为一个单独的过程,用于寻找数据内在的分布结构D、聚类不可作为分类等其他学习任务的前驱过程答案:ABC281.为什么RNN网络的激活函数要选用双曲正切而不是sigmod呢()A、使用sigmod函数容易出现梯度消失B、sigmod的导数形式较为复杂C、双曲正切更简单D、sigmoid函数实现较为复杂答案:AB解析:第一,采用sigmoid等函数,反向传播求误差梯度时,求导计算量很大,而Relu求导非常容易。第二,对于深层网络,sigmoid函数反向传播时,很容易就会出现梯度消失的情况(在sigmoid接近饱和区时,变换太缓慢,导数趋于0),从而无法完成深层网络的训练。282.下列哪种图像格式不包含动画?()A、jpgB、pngC、bmpD、gif答案:ABC283.算法是()与()的核心区别A、非人工智能程序B、人工智能程序C、强人工智能程序D、弱人工智能程序答案:AB284.YOLO模型的训练是()A、非端到端B、端到端的C、黑盒的D、白盒的答案:BC285.指标方案制定应包含()内容A、评估数据集制定B、指标值制定C、指标类目制定D、数据集划分方法答案:ABC286.人工智能项目开发过程中,技术经理的职责是()A、技术实施B、项目进度督导C、技术选型D、技术保障答案:CD287.选用边缘计算设备的时候,应该考虑哪些因素()A、成本B、算力C、功耗D、支持的模型答案:ABCD288.下面属于数据科学家应具备的能力有(__)。A、拥有数据产品研发能力B、掌握数据可视化C、能灵活运用领域实务知识D、熟练掌握Python答案:ABCD289.下面对onnx格式描述错误的是()。A、它用于定义模型优化方法B、它用户模型在不同框架下进行交换C、它用于定义模型评估方式D、它用于模型标准结构定义答案:ACD290.从方法体系看,数据可视化方法可以分为三个不同的层次(__)。A、领域方法B、基础方法C、方法论D、智能方法答案:ABC291.数据脱敏操作必须满足().A、单向性B、无残留C、易于实现D、不对称加密答案:ABC292.数据治理的基本活动主要包含(__)和改进。A、计划B、执行C、记录D、检查答案:ABD293.下列名称中,哪些属于同一种方法(__)。A、可重复采样B、自助采样C、有放回采样D、顺序采样答案:ABC294.关于演示法的优点有()A、有助于激发受训者的学习兴趣B、可利用多种感官,做到看、听、想、问相结合C、有利于获得感性知识,加深对所学内容的印象D、演示前需要一定的费用和精力做准备答案:ABC295.图像降噪中对滤波器的要求是(__)。A、没要求B、不能损坏图像轮廓和边缘等重要信息C、使图像清晰,视觉效果好D、使图像尽可能明亮答案:BC296.商标可以分为()。A、公益商标B、商品商标C、服务商标D、私人商标答案:BC297.数据加工是一种数据转换的过程,可分为(__)。A、单维度转换B、高维度转换C、低维度转换D、多维度转换答案:AD298.数据产品以数据为中心表现在(__)。A、数据驱动B、数据载体C、数据密集型D、数据范式答案:ACD299.下列关于密度聚类说法正确的是(__)。A、密度直达关系通常满足对称性B、密度可达关系满足直递性,但不满足对称性C、密度相连关系满足对称性D、密度相连关系满足直递性答案:BC300.下列哪些项属于传统循环神经网络的性质。()A、上一时刻的网络状态信息将会作用于下一时刻的网络状态B、并行处理序列中所有信息C、容易梯度爆炸/消失D、易于搭建答案:AC301.取得人工智能训练师三级等级证书的人员能够完成以下()的工作A、指导人工智能训练师五级解决数据采集问题B、指导人工智能训练师四级解决数据采集问题C、指导人工智能训练师五级解决数据标注问题D、指导人工智能训练师四级解决数据处理问题答案:ABCD302.常见的图像噪音有()。A、高斯噪音B、泊松噪音C、乘性噪音D、椒盐噪声答案:ABCD303.分析工具包括(__)和商务智能可视化、垂直分析、统计计算、数据服务、语音与自然语言理解、搜索等。A、数据分析平台B、数据科学平台C、机器学习D、人工智能答案:ABCD304.下列关于神经网络描述正确的是(__)。A、我们在机器学习中谈论神经网络是指的是生物学意义上的神经网络B、神经网络中最基本的成分是神经元模型C、在MP神经元模型中,神经元接受来自n个其他神经元传递过来的信号D、神经元接收到的总输入值将与神经元的阈值进行比较,然后通过激活函数处理以产生神经元的输出。答案:BCD305.下列属于PaddlePaddle优势的是()。A、开发便捷的深度学习框架B、超大规模深度学习模型训练技术C、多端多平台部署的高性能推理引擎D、产业级开源模型库答案:ABCD306.()是关键词提取的算法。A、TF-IDFB、TextRankC、LDAD、PCA答案:ABC307.下面算法中不属于图像锐化处理的是()。A、低通滤波B、加权平均法C、高通滤波D、中值滤波答案:ABD308.下列哪些现象是过拟合导致的()A、模型在训练集上表现好,在测试集上表现差B、模型在测试集上表现好,在训练集上表现好C、损失函数快速收敛到最小值D、损失函数不收敛答案:BC309.以下描述正确的是(__)。A、对重复数据通常采用条件过滤方法B、对无关数据通常采用重复过滤方法C、噪声是指测量变量过程中的随机错误或误差D、数据清洗是指在数据审计活动基础上,将脏数据清洗成干净数据的过程答案:CD310.下列关于RNN、LSTM、GRU说法正确的是(__)。A、RNN引入了循环的概念B、LSTM可以防止梯度消失或者爆炸C、GRU是LSTM的变体D、RNN、LSTM、GRU是同一神经网络的不同说法,没有区别答案:ABCD解析:RNN:循环神经网络,是非线性动态系统,将序列映射到序列;LSTM:LSTM通过刻意的设计来避免长期依赖问题。记住长期的信息在实践中是LSTM的默认行为,而非需要付出很大代价才能获得的能力;GRU:LSTM有很多变体,其中较大改动的是GatedRecurrentUnit(GRU),它将忘记门和输入门合成了一个单一的更新门。同样还混合了细胞状态和隐藏状态,和其他一些改动。最终的模型比标准的LSTM模型要简单。效果和LSTM差不多,但是参数少了1/3,不容易过拟合。311.文本匹配需要应用到的技术有()。A、文本特征提取B、文本实体命名C、文本相似度比较D、文本情感分析答案:AC312.TextRank首先会提取词汇,形成();然后依据词汇的关联,建立()。A、节点B、词表C、链接D、句子答案:AC313.下列应用了文本情感分析的场景有()。A、网络舆情监控B、大众点评商家评论C、新闻推荐D、电商搜索答案:AB314.一个好的分类模型必须具有(___)。A、低训练误差B、低泛化误差C、过拟合D、欠拟合答案:AB315.目前,机器学习领域所面临的主要挑战包括().A、过拟合B、维度灾难C、特征工程D、算法的可扩展性答案:ABCD316.在知识图谱中下列概念属于关系的是()。A、职位上下级B、父子C、朋友D、人名答案:ABC317.下列关于自助法描述错误的是(__)。A、自助法在数据集较大、难以有效划分训练集或测试集是很有用B、自助法能从初始数据集中产生多个不同的训练集C、自助法产生的数据集没有改变初始数据集的分布D、在初始数据量足够时,留出法和交叉验证法较自助法更为常用答案:AC318.隐马尔科夫模型和马尔科夫随机场都是(__)模型,而(__)是判别式模型。A、生成式模型B、随机模型C、条件随机场D、感知机模型答案:AC319.学习率变大,可能会使模型训练的时候()A、模型发散B、模型收敛速度加快C、训练数据损失曲线变得不稳定D、模型前向计算过程加快答案:ABC320.计算机软件著作权,是指自然人、法人或者其他组织对计算机软件作品享有的()的总称A、财产权利B、精神权利C、使用权利D、无限期权利答案:AB321.根据学习形式,数据科学中机器学习可分为(__)。A、人工神经网络和增强学习B、基于实例学习C、遗传算法D、贝叶斯学习答案:ABCD322.关于FPGA说法错误的是()A、FPGA最厉害的地方是,我们可以配置它的可编程架构来实现我们需要的任意数字功能组合。B、FPGA的中文名称是深度学习处理器C、FPGA具有高性能、低功耗的优势D、FPGA可以以大规模并行的方式实施算法,可以非常迅速和有效地执行大数据的处理。答案:BC323.下列不属于聚类性能度量内部指标的是(__)。A、DB指数B、Dunn指数C、Jaccard系数D、FM系数答案:CD324.在一个完整的多人脸识别算法中,通常包括哪些必要的技术步骤()A、人脸关键点定位B、人脸检测C、人脸特征提取D、人脸特征对比答案:BCD325.onnx的组成包含()A、可扩展计算图模型的定义B、训练方式定义C、标准数据类型的定义D、内置运算符的定义答案:ACD326.下列属于聚类性能度量内部指标的是(__)。A、DB指数B、Dunn指数C、Jaccard系数D、FM系数答案:AB327.从学科定位看,数据科学处于()的重叠之处,具有显著的跨学科性。A、数学与统计知识B、计算机科学C、黑客精神与技能D、领域实务知识答案:ACD328.下列不包含声纹识别应用场景的是()。A、语音支付B、语音播放C、AI文章阅读D、智能翻译答案:BCD329.图像识别的精度会受到以下那些因素的影响。A、数据类别数量不平衡B、输入图像尺寸不同C、图像中存在类标之外的环境干扰D、图像中存在随机噪声答案:ACD330.()可以作为激活函数。A、tanhB、reluC、preluD、svm答案:ABC331.互联网数据采集有()优势A、数据量大B、数据一致性好C、数据获取方便D、数据格式统一答案:AC332.下列属于无监督学习任务的还有(__)。A、密度估计B、异常检测C、聚类D、分类答案:ABC333.在BP网络中,常用于缓解其过拟合的策略有()。A、早停策略B、正则化策略C、全局最小策略D、局部最小策略答案:AB解析:通常有两种策略来缓解BP网络的过拟合。第一种策略是早停(earlystopping):将数据分成训练集合验证集,训练集用来计算梯度、更新连接权和阈值,验证集用来估计误差,若训练集误差降低但验证集误差升高,则停止训练,同时返回具有最小验证集误差的连接权和阈值。第二种策略是正则化(regularization),其基本思想是在误差目标函数中增加一个用于描述网络复杂度的部分,例如连接权和阈值的平方和。334.数据科学的(__)往往来自于统计学。A、理论B、方法C、技术D、工具答案:ABCD335.在图像生成式对抗神经网络结构中,判别网络的作用是()。A、判断图像来源于生成器还是真实数据B、生成图像数据C、对图像进行分类D、指导生成器生成图像答案:AD336.实践培训讲义应以操作技术点为重点,主要说明()A、操作原理B、操作要领C、操作顺序D、注意事项答案:ABCD判断题1.独占许可使用和排他许可使用还应以口头的形式签订合同,并且可以向著作权行政管理部门进行登记。A、正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论