2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）

上传人：浪*** IP属地：河北上传时间：2024-09-30 格式：PDF 页数：134 大小：23.35MB 积分：12 举报 版权申诉

2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）_第2页

2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）_第3页

2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）_第4页

2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）_第5页

已阅读5页，还剩129页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

2024年江西省“天工杯”人工智能训练师职业技能大赛试题

库-下(多选'判断题汇总)

多选题

1.RNN在NLP领域的应用包括(_)o

A、语言模型与文本生成

B、机器翻译

C、语音识别

D、图像描述生成

答案：ABCD

解析：语言模型与文本生成;机器翻译;语音识别；图像描述生成;情感分析；对话

系统等。

2.3D点云常见的任务有()。

A、3D物体识别

B、3D物体重建

G3D物体跟踪

D、3D纹理贴图

答案：AC

3.Analytics3.0的主要特点有().

A、引入嵌入式分析。

B、重视行业数据,而不只是企业内部数据。

C、以产品与服务的优化为主要目的。

D、注重规范性分析。

答案：ABCD

4.下面对WEB描述正确的是（）

A、WEB即全球广域网

B、WEB即万维网

C、WEB采用HTTP通讯协议

D、WEB采用HTTPS通讯协议

答案：ABCD

5.LSTM应用场景应用场景有哪些（）

A、翻译语言

B、语音识别

C、图像识别

D、股票预测

答案：ABD

解析：C:CNN应用于图像识别。

6.下面对数据集划分表达正确的是（）

A、测试集，训练集，验证集必须来源于同一个数据集

B、测试集，训练集，验证集可以来源于不同数据集

C、模型开发过程中，可以没有验证集，但测试集和训练集必须有

D、模型开发过程中，可以没有测试集，但验证集和训练集必须有

答案：AC

7.下列哪些概念是属于强化学习的。（）

A、动作

B、环境和观察状态

C、智能体

D、奖励

答案：ABCD

8.人工智能产品采用B/S架构，B/S架构优点是（）。

A、只需要在服务端对模型进行升级

B、用户不用为每个AI应用单独安装客户端软件

C、数据、计算都在云端，更安全

D、模型计算在客户端计算机上

答案：ABC

9.下列关于错误率和精度描述有误的是（_）。

A、错误率是分类错误的样本占样本总数的比例

B、精度是指分类正确的样本数占样本总数的比例

C、精度表示统计分类器预测出来的结果与真实结果不相同的个数，然后除以总

的样例集D的个数

D、错误率表示用统计分类正确的样本数，除以总的样例集D的个数

答案：CD

10.以下那些方法不常用于灰度内插值。（）

A、最近邻内插法

B、三次内插法

C、双线性内插值法

D、三次样条插值法

答案：ABD

11.下列关于L1正则化与L2正则化描述正确的是（_）。

A、L1范数正则化有助于降低过拟合风险

B、L2范数正则化有助于降低过拟合风险

C、L1范数正则化比L2范数正则化更有易于获得稀疏解

D、L2范数正则化比L1范数正则化更有易于获得稀疏解

答案：ABC

12.某厂商开发了一个听歌识曲的应用，该应用使用了下列哪些技术（）

A、声纹识别

B、声音特征提取

C、声音特征比对

D、文本转语音

答案：BC

13.数据能力的评价方法有哪些

A、评价结果

B、评价方法

C、评价过程

D、评价产品

答案：AC

14.下列（）模型是强化学习模型

A、DQN

B、AC

C、YOLO

D、UNET

答案：AB

15.市面上哪些产品使用了语音合成技术。（）

A、小米的小爱机器人

B、喜马拉雅APP小说智能阅读

C、微信的语音转写

D、抖音短视频AI配音

答案：ABD

16.POC曲线由（）和（）构成。

A、查准率

B、命中率

C、虚警率

D、准确率

答案：BC

17.下列关于密度聚类说法错误的是（_）。

A、DBSCAN是一种著名的密度聚类算法

B、密度聚类从样本数量的角度来考察样本之间的可连接性

C、密度聚类基于不可连接样本不断扩展聚类簇易获得最终的聚类结果

D、密度直达关系通常满足对称性

答案：BCD

18.关于卷积神经网络的叙述中正确的是（）。

A、可用于处理时间序列数据

B、可用于处理图像数据

C、卷积网络中使用的卷积运算就是数学中的卷积计算

D、至少在网络的一层中使用卷积

答案：ABD

解析：神经网络中的卷积:我们通常是指由多个并行卷积组成的运算。（因为单

个核只能特区一种类型的特征，我们usually希望可以在多个位置提取多个特征）

输入也不仅仅是实值的网格，而是由一系列观测数据的向量构成的网格。我们有

的时候会希望跳出核中的一些位置来降低计算的开销（相应的代价是提取特征没

有先前那么好了）我们就把这个过程看作对全卷积函数输出的下采样（downslin

g）■如果只是在输出的每个方向上每间隔s个像素进行采样，那么可重新定义一

个下采样卷积函数。我们把s称为下采样卷积的步幅（stride）。在任何卷积网

络的实现中都有一个重要性质：能够隐含地对输入V用零进行填充（pad）使得

它加宽。数学中的卷积：考虑到函数千和g应该地位平等，或者说变量x和y

应该地位平等，一种可取的办法就是沿直线x+y=t卷起来。

19.下面关于L1范式正则化描述正确的是（_）。

A、压缩感知问题可以通过L1范数最小化问题求解

B、L1范数正则化有助于降低过拟合风险

C、采用L1范数时平方误差项等值线与正则化项等值线的交点常出现在坐标轴上

D、L1范数正则化比L2范数正则化更有易于获得稀疏解

答案：ABCD

20.实践教学的四个围绕包括（）

A、围绕“基础”

B、围绕“产品过程”

C、围绕“技能”

D、围绕“熟练”

答案：ABCD

21.Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心

是基于两阶段频集思想的递推算法。该关联规则在分类上属于（__）、（_）、

（_）规则。

A、逻辑关联

B、布尔关联

C、单维

D、单层

答案：BCD

22.循环神经网络主要被应用于哪些场景。（）

A、语音识别

B、语音建模

C、机器翻译

D、图像识别

答案：ABC

23.大数据“涌现”现象有（一）。

A、价值涌现

B、质量涌现

C、隐私涌现

D、数量涌现

答案：ABC

24.模型部署后，可以不依赖网络才能工作的部署方式是（）

A、云端部署

B、移动端部署

C、边缘端部署

D、以上都依赖

答案：BC

25.目前LSTM已经应用到（）领域。

A、自然语言处理

B、语音识别

C、图像标注

D、发动机

答案：ABC

26.哪些项不属于使用池化层相比于相同步长的卷积层的优势？（）

A、参数更少

B、可以获得更大下采样

G速度更快

D、有助于提升精度

答案：BCD

27.循环神经网络与普通全连接神经网络主要区别是()

A、循环神经网络有信息反馈机制

B、全连接神经网络输出与历史输入无关

C、循环神经网络的输出与历史输入有关

D、以上都不是

答案：AB

28.()可以做LSTM学习。

A、MATLAB

B\tensorfIow

C、kreas

D\word

答案：ABC

29.迁移学习的目的()

A、降低数据量

B、加快模型收敛

C、提高模型泛化能力

D、加快模型推理速度

答案：ABC

30.(_)是“黑客精神和技能”。

A、大胆创新

B、喜欢挑战

C、追求完美

D、不断改进

答案：ABCD

31.关于TPU,下列说法错误的是()

A、TPU是一款专用于机器学习的芯片

B、TPU是一款专用于数据处理的芯片

C、TPU能用于深度神经网络训练

D、TPU可以提供高吞吐量的高精度计算

答案：BD

32.下列关于嵌入式选择描述正确的是(_)。

A、嵌入式选择是将特征选择过程与学习器训练过程融为一体

B、嵌入式选择在学习器训练过程中自动地进行了特征选择

C、对于嵌入式选择，特征选择过程与学习器训练过程在同一个优化过程中完成

D、嵌入式特征选择方法直接针对给定学习器进行优化

答案：ABC

33.模型部署前，需要对模型进行剪枝，下面模型剪枝描述正确的是()

A、模型剪枝目的是加快模型推理速度

B、模型剪枝后通常预测精度有所降低

C、模型剪枝后模型的参数量变少

D、模型剪枝后，模型训练收敛速度提高

答案：ABC

34.确定图像分割的阈值的方法有(_)。

A、可变阈值法

B、判别分析法

C、中值滤波

D、p尾法

答案：ABD

35.冯•诺伊曼被人们称为“（）”和“。

A、博弈论之父

B、计算机之父

C、人工智能之父

D、深度学习之父

答案：AB

36.计算两个框的IOU,不可能的值有0

A、-1

B、0

C、2

D、1

答案：AC

37.下面属于范数规则化的作用的是（_）和（_）。

A、保证模型尽可能的简单，避免过拟合

B、约束模型特征

C、最小化问题

D、最大化问题

答案：AB

38.下列适用于图像语义分割技术的应用场景有（）

A、CT肿瘤体积计算

B、眼球图片血管提取

C、视频会议智能更换背景

D、车流统计

答案：ABC

39.下列关于交叉验证法描述正确的是（_）。

A、交叉验证法先将数据集划分为k个大小相似的互斥子集

B、交叉验证法将数据集划分成的k个子集应尽可能保持数据分布的一致性

C、通常把交叉验证法称为k折交叉验证

D、假定数据集D中包含m个样本，若令交叉验证法中的系数k=m,则得到了交

叉验证法的一个特例：自助法

答案：ABC

40.下列哪些情况可以通过调整学习率来缓解（）

A、模型收敛的太慢，调大学习率

B、模型发散，调小学习率

C、模型过拟合了

D、模型欠拟合了

答案：AB

41.下面属于数据加工的有（_）o

A、数据审计

B、数据清洗

C、数据变换

D、数据集成

答案：ABCD

42.视频内容审核工作主要有两个目的（）

A、版权

B、合规

G正能量

D、广告

E、质量

答案：AB

43.以下可能会导致过拟合的是（—）。

A、训练集中含有噪声样本

B、训练集中缺乏代表性样本

C、训练集的样本数目过少

D、训练集中样本的维度过少

答案：AB

44.下列关于贝叶斯分类器说法正确的是（_）。

A、贝叶斯分类算法是一大类分类算法的总称

B、贝叶斯分类算法以样本可能属于某类的概率作为分类依据

C、朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种

D、朴素贝叶斯分类算法采用了属性条件独立性假设

答案：ABCD

45.层次聚类试图在不同层次对数据集进行划分。这里数据集的划分可采用（_）

或（_）策略。

A、自顶向下

B、自底向上

C、自左至右

D、自右至左

答案：AB

46.深度神经网络模型按部署端可分为（）方式

A、云端部署

B、移动端部署

C、边缘端部署

D、以上都不是

答案：ABC

47.实现人工神经元的方法有（_）。

A、感知器

B、线性单元

GSIGMOD单元

D、决策单元

答案：ABC

48.基于语义的情感词典方法有（_）等流程。

A、构建词典

B、统计词频

C、构建倾向性计算算法

D\确定阈值

答案：ACD

49.现代计算机的CPU是由（）、（）和存储单元组成。

A、超导单兀

B、控制单元

C、输入单元

D、输出单元

答案：AB

50.关于《劳动法》的相关规定，下列说法正确的是（）

A、工作时间（又称劳动时间），是指法律规定的劳动者在一昼夜和一周内从事

生产、劳动或工作的时间。

B、所谓全面保护，是对劳动者权益和权能的保护，包括人身权益和财产权利、

法定权利和约定权益

C、小王在失业前公司为他累计缴费失业保险6年，他可以领取18个月的失业保

险金

D、劳动规章是劳动法的最主要的表现形式

答案：AB

51.下列关于聚类法方法描述正确的是（_）。

A、k均值算法属于原型聚类

B、学习向量化算法试图找到一组原型向量来刻画聚类结构

C、高斯混合聚类采用概念模型来表达聚类原型

D、学习向量化算法属于层次聚类

答案：AB

52.分类模型的误差包括（_）。

A、训练误差

B、泛化误差

C、再代入误差

D、表现误差

答案：ABC

53.人工智能项目开发过程中，项目成本包括（）

A、时间成本

B、资源成本

C、风险成本

D、市场成本

答案：ABC

54.假阳率的其它名称不正确的是（）

A、错误率

B、虚警率

C、查全率

D、查准率

答案：ACD

55.下列属于结合策略的是（_）。

A、投票法

B、平均法

C、学习法

D、排序法

答案：ABC

56.下面描述正确的是（）。

A、开运算是先腐蚀在膨胀

B、开运算是先膨胀在腐蚀

C、闭运算是先腐蚀在膨胀

D、闭运算是先膨胀在腐蚀

答案：AD

57.人体姿态数据采集时，属于采集图像数据质量要求的是（）

A、照片清晰度

B、拍摄光线要求

C、图片大小

D、姿态要求

答案：ABD

58.为大数据提供基础设施服务，有（_）和数据计算、数据管理与监控、集群服

务,众包等。

A、数据存储

B、数据加工

C、数据治理

D、app开发

答案：ABCD

59.下面对后向计算描述错误的是（）

A、后向计算是模型学习过程

B、后向计算目的是预测数据结果

C、后向计算目的是训练模型参数

D、后向计算的时候容易发生梯度弥散现象

答案：ACD

60.下列关于Boosting算法说法正确的是（—）。

A、Boosting算法要求基学习器能对特定的数据分布进行学习

B、oosting对无法接受带权样本的基学习算法，可通过重采样法进行处理

C、Boosting算法在训练的每一轮都要检查当前生成的基学习器是否满足基本条

件

D、一旦当前生成的基学习器不满足条件，则当前基学习器被抛弃，且学习过程

停止

答案：ABCD

61.L2正则化描述正确的是（）

A、L2正则化是通过绝对值来约束模型权重

B、L2正则化是通过平方值来约束模型权重

C、L2正则化后，不重要的权重会被直接约束为0

D、L2正则化后，不重要的权重绝对值会被约束的很小

答案：BD

62.模型使用自监督学习后，再训练当前任务，通常会使模型（）

A、精度更高

B、需要的训练数据量降低

C、模型的推理速度更快

D、模型的收敛速度更快

答案：ABD

63.下列关于随机森林说法正确的是（_）。

A、随机森林是Bagging的一^1^扩展变体

B、随机森林在决策树的训练过程中引入了随机属性选择

C、随机森林简单且容易实现

D、随机森林计算开销大

答案：ABC

64.训练模型时候的损失曲线图，下列哪张图最有可能是过拟合导致的（）

A、1

B、2

C、3

D、4

答案：AC

65.NERF技术描述正确的是（）

A、NERF技术被称为神经辐射场技术

B、NERF技术是通过多角度照片进行的三维建模

C、NERF是通过3D点云设备采集的数据进行建模

DvNERF技术通过几个角度的对象照片信息来预测该对象其它角度照片信息

答案：ABD

66.智能问答系统模型结构中编码器的作用是（）。

A、问题输入

B、答案输出

C、问题转换为特征

D、特征转换为答案

答案：AC

67.学习率变小，可能会使模型训练的时候（）

A、模型发散

B、模型收敛速度变慢

C、训练数据损失曲线变得平滑

D、模型前向计算过程加快

答案：BC

68.下面描述错误的是（）。

A、阿尔法狗属于强人工智能

B、人脸识别属于弱人工智能

C、无人驾驶属于强人工智能

D、工业机器人属于强人工智能

答案：ACD

69.以下关于机器学习的发展历程描述正确的是（—）。

A、机器学习是人工智能研究发展到一定阶段的必然产物

B、二十世纪五十年代到七十年代出，人工智能研究处于“推理期”

C、图灵在1950年关于图灵测试的文章中，就曾提到了机器学习的可能

D、人工智能在二十世纪五十到八十年代经历了“推理期”和“知识期”

答案：ABCD

70.（_）由两个簇的最近样本决定，（_）由两个簇的最远样本决定，（_）由两

个簇的所有样本共同决定。

A、样本距离

B、最小距离

C、最大距离

D、平均距离

答案：BCD

71.下列制度，（）属于劳动标准制度

A、休息休假制度

B、工资制度

C、劳动安全卫生制度

D、女职工和未成年职工特殊保护制度

答案：ABCD

72.从互联网下载开源数据集有（）问题需要注意

A、数据版权和授权方式

B、数据有效性

C、数据一致性

D、数据来源

答案：ABCD

73.以下关于大数据描述正确的是（—）。

A、“涌现”是大数据的本质特征

B、大数据是对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分

析

C、促进大数据发展行动纲要是2016年由国务院发布的

D、大数据是以容量大'类型多'存取速度快、应用价值高为主要特征的数据集

合

答案：ABD

74.模型部署前，需要对模型进行量化，下面常见的量化参数精度有（）

A、doubIe64

B\int8

C、int4

D\int2

答案：BCD

75.图像识别技术的过程分以下几步：信息的获取、（_）、（_）、分类器设计和

分类决策。

A、辨认

B、预处理

C、统计

D、特征抽取和选择

答案：BD

76.以下属于数据科学的研究目的的是（一）。

A、数据洞见

B、数据生态系统建设

C、数据业务化

D、数据产品的研发

答案：ABCD

77.适用于内容审核场景的有()

A、智能鉴黄

B、违禁违规

C、暴力犯罪

D\低俗恶趣

E、政治倾向

答案：ABCDE

78.(_)属于图像平滑的滤波。

A、盒式滤波

B、双边滤波

C、导向滤波

D、贝叶斯变换

答案：ABC

79.数据科学的基本流程包含(_)。

A、数据可视化

B、数据加工

C、数据化

D、数据洞见

答案：BCD

80.半监督学习中，对未标记样本所揭示的数据分布信息与类别标记相联系的假

设的有（_）和（_）。

A、归纳假设

B、聚类假设

C、流形假设

D、基本假设

答案：BC

81.离散数据常用的编码方式有（）。

A、词向量

B、霍夫曼编码

C、标准化

D、独热编码

答案：ABD

82.关于TPU,下列说法正确的是（）

A、TPU是一款专用于机器学习的芯片

B、TPU是一款专用于数据处理的芯片

C、TPU能用于深度神经网络训练

D、TPU可以提供高吞吐量的低精度计算

答案：ACD

83。.某厂商生产的手机中有一个对语音话机器人，该机器人使用了下列哪些技术

A、声纹识别

B、语音识别

C、文本转语音

D、自然语义问答模型

答案：BCD

84.下列哪些操作会使得图像变模糊。（）

A、去掉低频信号，保留高频信号

B、去掉高频信号，保留低频信号

C、使用高斯核对图像进行卷积运算

D、使用拉普拉斯核对图像进行卷积运算

答案：BC

85.下面哪些对3D点云描述正确的是（）。

A、3D点云数据只有顶点数据，无线和面的数据。

B、3D点云数据相对与完整3D数据，数据量更少，处理起来更高效

C、3D点云技术常用到自动驾驶行业中

D、可以通过3D点云数据完全还原物体的纹理贴图信息

答案：ABC

86.模型采用WEB部署方式提供服务，哪些协议是WEB服务的通讯协议（）

A、HTTP

B、HTTPS

C\UDP

D、TCP

答案：AB

87.下列哪些设备属于边缘计算设备？（）

A、GTX1080

B、RK3399

GRTX3060

D、JETSONNX

答案：CD

88.下列主流模型中属于图像侦测的模型有（）、

A、RCNN

B、UNET

GSEQ2SEQ

D、YOLO

答案：AD

89.下列哪些分布是离散分布。（）

A、高斯分布

B、均匀分布

C、伯努利分布

D、多项分布

答案：CD

90.SGD优化器中用到了哪些技术（）

A、反向传播算法

B、小批量学习

C、动态学习率

D、动量学习

答案：AB

91.用区域聚合法分割图像，要求(_)。

A、各个点在平面上相邻接

B、各个点是在平面上分散

G邻接点的特征相似

D、点与点之间无关

答案：AC

92.下列哪些算法可以用来构造神经网络()。

A、kNN

B、线性回归

G逻辑回归

答案：BC

解析：kNN是一种基于实例的学习算法，不具有任何训练参数。因此不能用来构

造神经网络，线性回归和逻辑回归都可以用来构造神经网络模型，其实二者就是

单神经元的神经网络。

93.企业应用包括(_)和人力资本、金融、生产能力、后台自动化等。

A、销售

B、营销

C、法律

D、客户服务

答案：ABCD

94.对图像生成模型描述正确的是（）。

A、图像生成模型是通过特征转换为图像

B、图像生成模型是通过图像转化为特征

C、图像生成模型是无监督学习

DxGAN是生成模型

答案：ACD

95.许多功能更为强大的非线性模型可在线性模型基础上通过引入（_）和（_）

而得

A、层级结构

B、高维映射

C、降维

D、分类

答案：AB

96.适用于推荐系统的业务场景的有（）。

A、新闻分发

B、电商首页商品展示

C、短视频推送

D、电商商品自动评价

答案：ABC

97.下面哪些计算卡是边缘计算卡（）

A、TesIaA100

BvJetsonNano

GRK3399PR0

D、HI3559A

答案：BCD

98.卷积神经网络可以用于（）。

A、图像分类

B、目标提取

C、图像分割

D、中文分词

答案：ABC

99.（_）是数据科学的主要理论基础之一。

A、机器学习

B、统计学

C、数据

D、黑客精神与技能

答案：AB

100.以下（）属于常见语音数据异常。

A、丢帧

B、喷麦

C、重音

D、音调较高

答案：ABC

101.NPU特点描述错误的是（）o

A、擅长神经网络模型推理

B、擅长神经网络模型训练

C、功耗图

D、功耗低

答案：BC

102.训练CNN时，GPU显存溢出，此时可以采取什么办法？（）

A、减少mini_batch大小

B、移除一些卷积层

C、减少图片输入大小

D、增加激活函数

答案：ABC

103.召回率的其它名称为（）

A、正确率

B、查全率

C、命中率

D、查准率

答案：BC

104.以下说法正确的是（）。

A、负梯度方向是使函数值下降最快的方向

B、当目标函数是凸函数时，梯度下降法的解是全局最优解

C、梯度下降法比牛顿法收敛速度快

D、拟牛顿法不需要计算Hesse矩阵

答案：ABD

解析：牛顿法是二阶收敛,梯度下降是一阶收敛,所以牛顿法就更快。

105.对于正交属性空间中的样本点，若存在一个超平面对所有样本进行恰当的表

达，则这样的超平面应具有（_）和（_）的性质。

A、最近重构性

B、最大可分性

C、最远重构性

D、最小可分性

答案：AB

106.（）和（）被分别成为“计算机之父”和“计算机科学之父”

A\图斯

B、费曼

C、冯•诺伊曼

D、图灵

答案：CD

107.下列对误差值与错误值描述错误的是（）。

A、错误值不可以消除

B、错误值可以消除

C、误差值不可消除

D、误差值可以消除

答案：AD

108.下面对SEQ2SEQ描述正确的是（）。

A、它是一种编解码结构

B、输入输出序列长度必须一致

C、输入输出都是序列数据

D、语言翻译比较适合这种结构

答案：ACD

109.人工智能项目开发过程中，输入输出分析包括（）

A、输入数据的来源

B、输入数据的内容

C、输入数据的格式

D、输出数据的内容

答案：BCD

110.表达高斯分布，需要哪些参数（）。

A、偏差

B、期望

C、均值

D、方差

答案：CD

111.下列对MSE指标和MAE指标描述正确的是（）

A、MAE指标值越大，模型精度越低。

B、MAE指标值越大，模型精度越高

C、MSE指标值越大，模型精度越低

D、MSE指标值越大，模型精度越高

答案：AC

112.人工智能产品采用C/S架构，C和S分别是（）。

A、客户端

B、网页端

C、服务端

D、数据端

答案：AC

113.P-R曲线由（）和（）构成。

A、查准率

B、查全率

C、准确率

D、错误率

答案：AB

114.常见的插补缺失值方法有（）。

A、均值插补

B、同类均值插补

G多重插补

D、极大似然估计

答案：ABCD

115.在ROC空间中，以（_）为横轴，以（_）为纵轴。

A、TPrate

B、FNrate

C、FPrate

D、TNrate

答案：AC

116.数据战略的影响因素（_）。

A、当前业务需求

B、潜在风险

C、数据战略范畴

D\未来需求

答案：ABD

117.手势识别需要用到的技术有（）。

A、图像侦测

B、图像超分

C、关键点检测

D、图像生成

答案：AC

118.下面属于探索性分析主要关注的四大主题的有（_）。

A、耐抗性

B、方差

C、重新表达

D、启K

答案：ACD

119.车牌识别的用到了哪些人工智能图像处理技术。（）

A、图像关键点定位

B、图像生成

C、图像文本识别

D、图像语义分割

答案：CD

120.关于梯度消失和梯度消失，以下说法正确的是：（_）。

A、根据链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都小

于1的话，那么即使这个结果是0.99,在经过足够多层传播之后，误差对输入

层的偏导会趋于0

B、可以采用ReLU激活函数有效的解决梯度消失的情况

C、根据链式法则，如果每一层神经元对上一层的输出的偏导乘上权重结果都大

于1的话，在经过足够多层传播之后，误差对输入层的偏导会趋于无穷大

D、可以通过减小初始权重矩阵的值来缓解梯度爆炸

答案：ABCD

解析：使用标准化初始w,那么各个层次的相乘都是07之间的小数，而激活函

数千的导数也是07之间的数，其连乘后，结果会变的很小，导致梯度消失。若

我们初始化的w是很大的数,w大到乘以激活函数的导数都大于1,那么连乘后，

可能会导致求导的结果很大，形成梯度爆炸。

121.常用的Python科学计算库有（）。

A、Numpy

B、SciKit-learn

C、Pandas

D\SciPy

答案：ABCD

122.下面哪些是基于核的机器学习算法(_)。

A、最大期望算法

B、径向基核函数

C、线性判别分析法

D、支持向量机

答案：BCD

解析：SVM(可支持向量机)，KFD(基于核的Fisher判别分析)，KPCA(核成

分分析)。径向基函数核(RadiaIBasisFunction,RBFkerneI),也被称为高斯

核(GaussiankerneI)或平方指数核(SquaredExponentiaI.,SEkerneI)[1],

是常见的核函数(kerneIfunction)oRBF核被应用各类核学习(kernellearni

ng)算法中，包括支持向量机(SupportVectorMachine,SVM)x高斯过程回归(G

aussianProcessRegression,GPR)等。

123.P{H|X}是给定观测值X条件下H出现的概率，统称为(_)。

A、先验概率

B、后验概率

C、条件概率

D、模型

答案：BC

124.下面哪些英文缩写是正确的（）

A、语音识别，ASR

B、文本转语音TTS

G文本阅读OCR

D、声纹识别VPR

答案：AB

125.下面哪些深度学习模型使用了Transformer网络结构（）

A、GPT

B、AE

C、BERT

D、GAN

答案：AC

126.下列对误差值与错误值描述正确的是（）。

A、错误值不可以消除

B、错误值可以消除

C、误差值不可消除

D、误差值可以消除

答案：BC

127.图像处理中的开运算是先对图像进行（）操作，再对图像进行（）

A、低通滤波

B、腐蚀

C、局通滤波

D、膨胀

答案：BD

128.属于数据变换的类型有（_）。

A、平滑处理

B、聚类

C、标准化

D、特征构造

答案：ABD

129.导致模型过拟合的原因有（）

A、数据质量低

B、数据量少

C、模型规模太大

D、模型参数量太少

答案：BC

130.Transformer网络结构中，包含（）子网络结构

A、CNN

B、RNN

C、MLP

D、ATTENTION

答案：CD

131.下面那些函数属于常用的激活函数。（）

A、Sigmoid

B、Tanh

C\Mean

D、ReIu

答案：ABD

132.支持向量机中定义的间隔值为w的二范式的-2次方，这样看间隔貌似仅与

权重W有关，这意味着偏置项b（_）o

A、没有任何意义

B、对间隔不会产生影响

C、通过约束隐式地影响着w的取值

D、对间隔会产生影响

答案：CD

133.感知机能容易实现逻辑（_）、（_）、（_）运算

A、加减

B、与

C、或

D、非

答案：BCD

134.人工智能模型开发过程中，数据方案包括数据采集，（）方面的内容

A、数据清洗

B、数据标准化

C、数据标注

D、数据增强

答案：ACD

135.在知识图谱中下列概念属于实体的是（）。

A、人名

B、地名

C、父子

D、商品名

答案：ABD

136.OCR中使用到的图像技术有（）。

A、图像侦测

B、图像生成

C、图像识别

D、图像定点

答案：AC

137.下面关于L1范式正则化描述正确的是（_）o

A、L1范数正则化使得学习得到的结果满足稀疏化，从而方便人们提取特征

B、L1范数是指向量中各个元素绝对值之和

C、L1范数正则化也有个美称叫“稀疏规则算子”

D、压缩感知问题可以通过L1范数最小化问题求解

答案：ABCD

138.通过爬虫技术从互联网上爬取数据有（）潜在的法律问题

A、容易IP地址被封

B、容易造成被爬取对象的服务器负载提高

C、容易爬取到侵权数据

D、容易违反计算机信息安全罪

答案：CD

139.以下能力中，数据工程师需要具备的能力或素质是()。

A、数据洞见

B、数据的ETL操作

C、数据的备份与恢复

D、主数据管理及数据集成

答案：BCD

140.灰度图像，高为128,宽为256,3张图片同时输入到人工智能模型中，格

式为NHWC,那不是NHWC值的是()。

A、(5,3,256,128)

B、(5,1,128,256)

G(5,256,128,1)

D、(5,128,256,1)

答案：ABC

141.模型测试评估方案应包括()内容。

A、测试数据集的制作

B、测试环境的搭建

C、测试用例的编写

D、测试指标的制定

答案：ABC

142.模型蒸播是模型优化中的重要技术，下面对模型蒸僧描述正确的是（）。

A、模型蒸播会对教师模型参数进行改变

B、模型蒸镭是把大模型的知识传递给小模型

C、模型蒸僧是为了加快模型的推理速度

D、模型蒸播是教师学生训练模型

答案：BCD

143.以下对大数据4V特性描述正确的是（—）。

A、Value是指价值密度低

B、大数据中所说的“速度”包括两种：计算速度和处理速度

C、大数据时间分布是不均匀的

D、在大数据中，价值价值与数据总量的大小存在线性关系

答案：AC

144.根据《促进大数据发展行动纲要》（国发〔2015〕50号），大数据的主要

特征包括

A、容量大

B、类型多

C、存取速度快

D、价值密度低

答案：ABCD

145.模型训练完成后，在部署前，对模型进行优化的手段有（）

A、量化

B\加先验

G蒸播

D、剪枝

答案：ACD

146.数据科学项目的基本流程涉及发活动包括(_)和数据的管理与获取、结果的

可视化与文档化、模式/模型的验证和优化。

A、模式/模型的应用和维护

B、项目目标定义

C、项目成本控制

D、模式/模型的洞见

答案：ABD

147,基于统计的分词方法的优点有(_)。

A、分速度快

B、效率高

C、结合上下文识别生词

D、消除歧义

答案：ABCD

148.关于Dropout说法正确的是：(—)。

A、Dropout背后的思想其实就是把DNN当做一个集成模型来训练，之后取所有

值的平均值，而不只是训练单个DNN

B、DNN网络将Dropout率设置为p,也就是说，一个神经元被保留的概率是1-p。

当一个神经元被丢弃时，无论输入或者相关的参数是什么，它的输出值就会被设

置为0

C、丢弃的神经元在训练阶段，对BP算法的前向和后向阶段都没有贡献。因为这

个原因，所以每一次训练，它都像是在训练一个新的网络

D\ropout方法通常和L2正则化或者其他参数约束技术（比如MaxNorm）一起使

用，来防止神经网络的过拟合

答案：ABCD

解析：dropout是指在深度学习网络的训练过程中，对于神经网络单元，按照一

定的概率将其暂时从网络中丢弃。注意是暂时，对于随机梯度下降来说，由于是

随机丢弃，故而每一个mini-batch都在训练不同的网络。防止过拟合的方法：

提前终止（当验证集上的效果变差的时候）；L1和L2正则化加权;softweightsh

aringDropoutoropout率的选择：经过交叉验证，隐含节点dropout率等于0.

5的时候效果最好，原因是0.5的时候dropout随机生成的网络结构最多。drop

out也可以被用作一种添加噪声的方法，直接对input进行操作。输入层设为更

接近1的数。使得输入变化不会太（0.8）。

149.下列哪种音频格式无损的？（）

A、pe

B、wav

C、mp3

D、aac

答案：AB

150.下面不属于探索性统计中常用数据分布统计量的是（_）。

A、残差

B、偏态

C、峰态

D、众数

答案：AD

151.当闵可夫斯基距离公式中的系数p值为1时，可得到（_）的公式。

A、欧氏距离

B、曼哈顿距离

C、街区距离

D、切比雪夫距离

答案：BC

152.Feigenbaum等人在著名的《人工智能手册》中将机器学习划分为机械学习

和（_）四种。

A、深度学习

B、示教学习

C、类比学习

D、归纳学习

答案：BCD

153.常见的图像判别类任务有（）

A、图像创作

B、图像语义分割

C\图像侦测

D、图像识别

答案：BCD

154.人工智能模型开发过程中，模型研发方案应该包含（）

A、模型实施方案

B、数据方案

C、模型设计，训练，优化方案

D、模型测试评估方案

答案：BCD

155.多模态数据通常包含（）数据。

A、文本

B、语音

C、图片

D、视频

答案：ABCD

156.端到端设计的优势是（）

A、模型结构设计更灵活容易

B、容易使用多模态输入

C、容易解释模型工作过程

D、不需要人工提取数据特征

答案：ABD

157.数据科学项目主要涉及的角色有（_）和项目发起人'客户'项目经理。

A、数据科学家

B、领域专家

C、数据工程师

D、操作人员

答案：ACD

158.数据标准化的目的为（）。

A、约束输入数据的值范围

B、把输入数据的分布变为标准正太分布

C、使得输入数据的分布服从均值为0,方差为1

D、对数据做归一化操作

答案：AC

159.下列关于偏差、方差、均方差、泛化误差描述有误的是（_）。

A、方差度量了学习算法的期望预测与真实结果的偏离程度。

B、偏差度量了同样大小的训I练集的变动所导致的学习性能的变化。

C、泛化误差表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,

即刻画了学习问题本身的难度。

D、泛化误差可分解为偏差、方差与噪音之和。

答案：ABC

160.CPU和GPU分别称为（）和（）

A、运算控制器

B、中央处理器

C、存储控制器

D、图形处理器

答案：CD

161.关于Python,下列说法正确的是（）

A、Python拥有一个很棒的语言库生态环境，历史上也一直都是科学计算和数据

分析的重要工具

B、Python之所以适合AI项目，其实也是基于Python的很多有用的库都可以在

AI中使用

C、有高效率的高层数据结构，简单而有效地实现面向对象编程。

DxPython既支持面向过程的函数编程也支持面向对象的抽象编程。

答案：ABCD

162.下列属于半监督学习方法的是（_）。

A、半监督支持向量机

B、图半监督学习

C、生成式方法

D、支持向量机

答案：ABC

163.以下哪些滤波器能在卷积窗口的边界上使卷积掩膜中心像素和它的4-邻接

点的系数降至0附近。

A、同态滤波

B\图斯滤波

C、巴特沃斯滤波

D、中值滤波

答案：BC

164.下面()框架是深度学习研发框架

A、Seikit-Learn

B\Pytorch

C、TensorfIow

D、PaddIePaddIe

答案：BCD

165.深度学习可进一步分为(_)。

A、无监督和生成式学习深度网络

B、半监督深度神经网络

C、监督学习深度网络

D、混合深度网络

答案：ACD

166.(_)不属于元分析方法。

A、加权平均法

B、优化方法

C、时序法

D、关联法

答案：CD

167.数据清洗的目的是()

A、检查数据的一致性

B、处理无效值

C、处理重复数据

D、处理缺失值

答案：ABCD

168.下列哪些现象属于乘性噪声。（）

A、电视光栅的退化

B、二值图像上的胡椒盐噪声

C、信道传输受扰

D、胶片材料的退化

答案：AD

169.在模型评估与度量的方法中，下列描述正确的是（_）。

A、在留出法中，如果从采样的角度来看待数据集划分的过程，则保留类别比例

的采样方式通常称为分层采样

B、通常，我们可通过实验测试来对学习器的泛化误差进行评估并进而做出选择。

C、我们需要一个测试集来测试学习器对新样本的判别能力

D、测试样本不可从样本真实分布中独立同分布采样而得

答案：ABC

170.（_）是图像降噪的方法。

A、空间域合成法

B、中值滤波器

C、最小值滤波

D、非线性小波变换

答案：ABCD

171.目前比较流行的深度学习框架包括（）。

A、Pytorch

B\TensorfIow

C、SciPy

D\PaddIePaddIe

答案：ABD

172.关于我国自有的深度学习框架，下列说法正确的是（）

A、我国自有的深度学习框架是PyTorch

B\PaddlePaddle属于百度的深度学习框架

C、PaddIeOCR旨在打造一套丰富、领先且实用的OCR工具库

D、PaddIeOCR属于飞桨文字识别开发套件

答案：BCD

173.数据科学的基本流程包含（_）。

A、数据产品的提供

B、数据应用

C、结果展示

D、数据可视化

答案：AC

174.大数据的主要特征（一）。

A、容量大

B、类型多

C、存取速度快

D、应用价值高

答案：ABCD

175.下列哪些场景使用了语音唤醒技术。（）

A、语音控制空调开关

B、智能翻译笔

C、微信聊天语音转文本

D、启动小米音响需要说“你好，小爱”

答案：AD

176.下列哪些情况不可能是学习率太大导致的（）

A、模型收敛的太慢

B、模型无法收敛，并发散崩溃

C、模型迅速收敛到损失函数最小值

D、模型内部参数大部分变为0

答案：ACD

177.使用人工智能技术监控电梯间电动车驶入的优势有（）

A、发现电梯间驶入电动车，及时告警并通知物业人员

B、提高工作监管效率

C、后台可随时查看统计记录，回看违规事件

答案：ABC

178.图结构可以分为（）

A、有向图

B、无向图

C\有关系图

D\无关系图

答案：AB

179.下列哪些业务场景使用了语音合成。（）

A、I同传

B、小说智能阅读

C\视频AI字幕

D、地震预警语音播报

答案：BD

180.数据清洗的目的是（）。

A、检查数据的一致性

B、处理无效值

C、处理缺失值

D、处理重复数据

答案：ABCD

181.从行为目的与思维来看,数据统计方法可以分为（_）。

A、描述统计

B、洞见统计

C、推断统计

D、归纳统计

答案：AC

182.神经网络的拓扑结构可以分为（）和随机型网络等。

A、前向型

B、后向型

C、反馈型

D、自组织竞争型

答案：ACD

解析：神经网络的拓扑结构有前向型、反馈型、自组织竞争型和随机型网络等。

183.下列关于支持向量的说法错误的是（_）。

A、支持向量回归机的支持向量落在它规定的间隔带之内

B、支持向量回归机的支持向量落在它规定的间隔带之外

C、支持向量回归机的支持向量只占训练集的一部分

D、训练集中的全部样本都是支持向量

答案：BD

184.下列关于EM算法描述正确的是（_）。

A、EM算法是常用的估计参数隐变量的利器

B、EM算法即是期望最大化算法

C、EM算法常被用来学习高斯混合模型的参数

D、EM算法是一种迭代式的方法

答案：ABCD

185.模型部署前，需要对模型进行量化，量化通常会（）

A、降低模型预测精度

B、提高模型推理速度

C、模型训练时候加快收敛

D、提高模型泛化能力

答案：AB

186.人工智能可以分为：弱人工智能阶段、（）、（）。

A、强人工智能阶段

B、超人工智能阶段

C、快速人工智能阶段

D、虚拟人工智能阶段

答案：AB

187.数据战略等于（_）之“和”。

A、数据管理目标

B、行动方案

C、目标管理

D、动态机制

答案：ABC

188.数据战略的基本问题有（_）。

A、数据战略的定位

B、数据战略的目标

C、数据战略的侧重点

D、数据战略的范畴

答案：ABCD

189.图像数据增强的目的是（）。

A、增加样本数据量

B、增加样本多样性

C、提高模型推理速度

D、提高模型泛化能力

答案：ABD

190.以下哪些产品属于数据产品

A、数据报表平台

B、DMP

C、搜索与精准化产品

D、风控产品

答案：ABCD

191.下列数据中，哪些样本的期望为0.2。（）

A、正样本值为0.4,负样本值为-0.2,正样本数量为20,负样本数量为30

B、正样本值为0.2,负样本值为0,正样本数量为15,负样本数量为35

C、正样本值为1,负样本值为0,正样本数量为20,负样本数量为80

D、正样本值为1,负样本值为-1,正样本数量为60,负样本数量为40

答案：AB

192.训练CNN时，GPU显存溢出，此时可以采取什么办法（）

A、减少mini_batch大小

B、移除一些卷积层

C、减少图片输入大小

D、增加激活函数

答案：ABC

解析：D:反而会加重负担。

193.下列关于学习器的性能度量说法正确的是（_）。

A、对于二分类问题，可将样例根据其真实类别与学习器预测类别的组合划分为:

真正例、假正例、真反例、假反例

B、查准率和查全率是一对矛盾的度量

C、一般来说，查准率越高，查全率往往也偏高

D、一般来说，查准率越高，查全率往往偏低

答案：ABD

194.SEQ2SEQ网络结构适合于哪些常见场景（）。

A、翻译

B、问答

C、分类

D、回归

答案：AB

195.CNN相比于全连接的DNN有哪些优势？（）

A、参数更少

B、泛化更好

C、训练更快

D、更容易搭建

答案：ABC

196.下图属于图像中包含了哪些人工智能图像任务（）

A、图像侦测

B、图像生成

C、图像检）则

D、图像语义分割

答案：ACD

197.以下对数据描述正确的是（—）。

A、数据只包含显性数据和隐性数据

B、数值是数据的一种形式

C、数据到智慧是人们认知提升的过程

D、数据是现实世界的记录

答案：BCD

198.人工智能项目开发流程包括（）

A、需求分析

B、模型研发

C、实施部署

D、文档交付

答案：ABCD

199.从结构化角度来看，数据可分为（一）。

A、结构化数据

B、非结构化数据

C、无结构化数据

D、半结构化数据

答案：ABD

200.数据产品的存在和表现形式有(_)和数据类产品。

A、情感类产品

B、信息类产品

C、知识类产品

D、智慧类产品

答案：BCD

201.按标注的实现层次，数据标注可以分为(_)。

A、语义标注

B、图像标注

C、语法标注

D、文字标注

答案：AC

202.(_)可以帮助解决训练集在特征空间中线性不可分的问题。

A、硬间隔

B、软间隔

C、核函数

D、拉格朗日乘子法

答案：BC

203.训练深度神经完了过的时候，下面那种现象可能是梯度弥散导致的()

A、无论输入什么数据，模型输出为始终Nan

B、无论输入什么数据，前向计算的结果都不再变化或变化特别小，且不为Nan

C、后向计算的时候，靠近输出入的层的模型权重不再变化。

D、损失函数的输出结果越来越大

答案：BC

204.下列表示同一种学习方法的是（_）。

A、集成学习

B、多分类器系统

C、基于委员会的学习

D、平均策略

答案：ABC

205.在神经网络学习中，sigmoid函数可用作（_）。

A、损失函数

B、优化函数

C、激活函数

D、响应函数

答案：CD

206.下面对学习率描述正确的是（）

A、学习率越大，模型收敛越快，但也可能导致模型发散

B、学习率越小，模型收敛越慢，但也可能导致模型发散

C、学习率越大，模型越不容易陷入局部最小值

D、学习率越小，模型越不容易陷入局部最小值

答案：AC

207.人工智能模型开发过程中，不属于模型研发阶段的工作是（）

A、输入输出分析

B、数据方案

C、模型设计

D、指标制定

答案：BC

208.下列对强化学习描述正确的是（）

A、强化学习是加强正确动作的发生概率，降低错误动作的发生概率

B、强化学习是一种奖惩学习

C、AlphaG。是一种下围棋的强化学习模型

D、图像识别是通过强化学习来实现的

答案：ABC

209.（）x算法、（）构成人工智能3要素

A、公式

B、算力

C、数据

D、程序

答案：BC

210.技术指导的主要方法包括（）

A、普通授课

B、工作指导

C、研讨

D、录像、多媒体教学

答案：ABCD

211.CNN相比于全连接的DNN有哪些优势（）

A、参数更少

B、泛化更好

C、训练更快

D、更容易搭建；

答案：ABC

解析：D:DNN直接对数据做加权线性连接，而CNN则是移动卷积核，并对图像中

的各区域做卷积操作。

212.关于《网络安全法》，下列说法正确的是（）

A、国家实施网络可信身份战略，支持研究开发安全、方便的电子身份认证技术，

推动不同电子身份认证之间的互认。

B、网络产品、服务的提供者不得设置恶意程序

C、按照规定留存相关的网络日志不少于六个月

D、网络运营者不得泄露、篡改、毁损其收集的个人信息

答案：ABCD

213.数据科学的基本流程包含（_）o

A、数据化

B、探索性分析

C、数据分析

D、数据存储

答案：ABC

214.从培训的对象，培训可分为（）

A、个人技能培训

B、企业培训

C、心态培训

D、能力培训

答案：AB

215.3D点云常见的任务有哪些（）。

A、3D物体识别

B、3D物体重建

G3D物体跟踪

D、3D纹理贴图

答案：AC

216.市面上哪些产品使用了语音识别技术。（）

A、小米的小爱机器人

B、喜马拉雅APP小说智能阅读

C、微信的语音转写

D、抖音短视频AI配音

答案：AC

217.劳动者的社会保险分为（）

A、基本养老保险

B、基本医疗保险

C、工伤保险

D、失业保险

答案：ABCD

218.以下关于神经网络模型描述正确的是(_)。

A、神经网络模型是许多逻辑单元按照不同层级组织起来的网络，每一层的输出

变量都是下一层的输入变量

B、神经网络模型建立在多神经元之上

C、神经网络模型中，无中间层的神经元模型的计算可用来表示逻辑运算

D、神经网络模型一定可以解决所有分类问题

答案：ABC

解析:现在很多分类问题的准确率都很低尤其是医学图像方面，而且容易受环境,

如光照影响。

219.一个交叉验证将数据集分成两个互补的子集，分别是(_)和(_)。

A、训练集

B、测试集

C、子集

D、补集

答案：AB

220.()x()、()构成人工智能3要素

A、算法

B、算力

C、数据

D、程序

答案：ABC

221.下列现象可能是欠拟合导致的有（）

A、模型训练损失降到0

B、模型训练损失不收敛

C、训练指标与测试指标表现都很差

D、训练指标表现好，测试指标表现差

答案：BC

222.下列属于生成模型的场景有（）

A、戴口罩检测

B、低分辨率图片变成高分辨率图片

C、通过输入文本语义，输出一幅符合文本语义的图像

D\人脸检）则

答案：BC

223.有两种策略常用来缓解BP网络的过拟合，分别是（）和（）。

A、晚停

B、早停

G正则化

D、加入损失函数

答案：BC

解析：通常有两种策略来缓解BP网络的过拟合。第一种策略是早停（earlystop

ping）：将数据分成训练集合验证集，训练集用来计算梯度、更新连接权和阈值，

验证集用来估计误差，若训练集误差降低但验证集误差升高，则停止训练，同时

返回具有最小验证集误差的连接权和阈值。第二种策略是正则化（regularizati

on）,其基本思想是在误差目标函数中增加一个用于描述网络复杂度的部分，例如

连接权和阈值的平方和。

224.数据加工的主要动机往往来自（_）。

A、实时要求

B、质量要求

C、计算要求

D、数量要求

答案：BC

225.下列关于AUC面积描述正确的是（_）。

A、UC被定义为ROC曲线下与坐标轴围成的面积

B、AUC面积的值大于1

C、AUC等于0.5时，则真实性最低，无应用价值

D、AUC越接近1.0,检测方法真实性越高

答案：ACD

226.人工智能项目开发过程中，资源成本包括（）

A、机会成本

B、数据成本

C、设备成本

D、人力成本

答案：BCD

227.人脸活体检测常用的技术手段有（）。

A、人脸关键点检）则

B、静默活体检测

C、人脸语义分割

D、交互式活体检测

答案：BD

228.下列属于朴素贝叶斯分类器的特点的是（_）。

A、算法逻辑简单，易于实现

B、算法逻辑复杂，不易于实现

C、分类过程中时空开销小

D、分类过程中时空开销大

答案：AC

229.写字楼人脸闸机使用时的人脸识别效果不佳，可能的主要因素有（）。

A、光线角度问题

B、网络问题

C、面部遮挡问题

D、人脸相似度过大

答案：ABC

230.下列关于包裹式选择的描述正确的是（_）。

A、包裹式特征选择方法直接针对给定学习器进行优化

B、从最终学习器性能来看，包裹式特征选择比过滤式特征选择更好

C、包裹式特征选择的计算开销通常比过滤式特征选择大得多

D、包裹式特征选择的典型算法：LVW算法，其特征子集搜索采用了随机策略

答案：ABCD

231.教学的方法包括（）

A、讲授法

B、问答法

C、演不法

D、自学法

答案：ABC

232.卷积神经网络中常用的池化函数包括（）。

A、最大池化函数

B、L2范数

C、相邻矩形区域内的平均值

D、基于据中心像素距离的加权平均函数

答案：ABCD

解析：最大池化函数;L2范数；相邻矩形区域内的平均值;基于据中心像素距离的

加权平均函数;重叠池化；空金字塔池化。

233.编解码神经网络结构通常包括（）

A、编码器

B、特征生成器

C、解码器

D、以上都是

答案：BC

234.互联网数据采集有（）劣势

A、后期数据清洗难度大

B、容易侵权

C、获取数据成本高

D、干扰数据多

答案：ABD

235.下面属于数据科学家的主要职责有（_）。

A、提出“好问题”

B、完成“数据加工”

C、实现“数据洞见”

D、数据“故事化”

答案：ABCD

236.下列哪些数据适合独热编码？（）

A、文本中的单词

B、性别

C、身高

D、年龄阶段（婴儿、小孩、青年、中年、老年）

答案：BD

237.下面哪些概念属于CNN网络模型。（）

A、感受野

B、步长

C、通道

D、反馈

答案：ABC

238.下列属于数值优化算法的是(_)。

A、梯度下降法

B、牛顿法

C、极大似然法

D、逻辑回归

答案：AB

239.下面属于数据科学主要研究内容的有(_)。

A、理论基础

B、数据加工

C、数据计算

D、数据产品开发

答案：BCD

240.衡量数据样本质量包括()方面。

A、数据量

B、多样性

C、覆盖性

D、均衡性

答案：ABCD

241.数据产品的主要特征有(_)。

A、数据为中心

B、多样性

C、层次性

D、增值性

答案：ABCD

242.下列哪些任务属于回归任务（）

A、人脸识别

B、人脸关键点定位

C、人物位置跟踪

D、人物性别辨识

答案：BC

243.框A面积为30,框B面积为20,两个框可能的IOU值有（）

Ax1/3

B、0

C、1

D、2/3

答案：ABD

244.根据训练数据是否拥有标记信息，学习任务可大致分为（—）和（__）。

A、监督学习

B、训练集

C、无监督学习

D、测试集

答案：AC

245.下列关于核函数的说法正确的是（_）。

A、任何一个函数都可以作为核函数

B、只要一个对称函数所对应的核矩阵半正定,它就能作为核函数使用

C、任何一个核函数都隐式地定义了一个再生核希尔伯特空间

D、核函数可将低维空间中线性可分的数据映射到高维空间，使其线性不可分

答案：BC

246.人工智能项目开发过程中，项目经理的职责是()

A、质量监督

B、项目进度督导

C、客户对接

D、研发人员调度

答案：BC

247.下列RGB颜色正确的是()

A、(255,0,0)是红色

B、(0,255,0)是绿色

C、(0,0,255)是蓝色

D、以上都不对

答案：ABC

248.按标注活动的自动化程度，数据标注可以分为(_)。

A、手工标注

B、文本标注

C、半自动标注

D、自动标注

答案：ACD

249.人工智能项目开发过程中，可行性分析包括（）

A、数据来源的可行性

B、模型功能实现的可行性

C、指标可达的可行性

D、现场实施的可行性

答案：ABCD

250.常见的模型参数的量化精度有（）

A、FL0AT32

B、INT8

C、INT4

D、INT2

答案：BCD

251.人工智能产品采用B/S架构，B和S分别代表（）。

A、客户端

B、网页端

C、服务端

D、数据端

答案：BC

252.感知机中，（_）接收外界输入信号后传递给（_）。

A、输入层

B、输出层

C、第一层

D、第二层

答案：AB

253.下面属于数据科学理论基础的有(_)。

A、统计学

B、数据可视化

C、机器学习

D、领域知识

答案：ABCD

254.文本摘要的方法可以分为()

A、分类式摘要

B、抽取式摘要

C、判别式摘要

D、生成式摘要

答案：BD

255.噪声数据的主要表现形式有(_)。

A、错误数据

B、虚假数据

C、异常数据

D、冗余数据

答案：ABC

256.对人工智能模型进行减枝的目的是()

A、降低模型的参数量

B、提高模型的精度

C、加快模型在边缘计算设备上的推理速度

D、提高模型泛化能力

答案：AC

257.词性标注中包含的词性有（）

A、动词

B、商品名

C、量词

D、数词

答案：ACD

258.下列哪些变换属于仿射变换。（）

A、平移

B、旋转

C、错切

D、缩放

答案：ABCD

259.下面哪些指标取值范围是0到1,值越大，模型效果越好（）

A、MSE

B、R2

C、mAP

D、余弦相似度

答案：BC

260.下列哪些场景可以使用关键点检测来实现。（）

A、手势识别

B、跌倒识别

C、人体姿态识别

D\人脸检测

答案：ABC

261.图像数据结构化的优势是（）。

A、更易统计

B、更易存储

C、更易计算

D、更易传输

答案：ABCD

262.数据采集的方法包括（）

A、互联网数据采集

B、众包'行业合作

C、各种传感器数据

D、商业设计

答案：ABC

263.下列关于支持向量机的说法正确的是（_）。

A、支持向量机的学习策略是间隔最大化

B、支持向量机的基本模型是特征空间上间隔最大的线性分类器

C、支持向量机只能对线性可分的样本进行分类

D、传统支持向量机只能求解二分类问题

答案：ABD

264.下面对正确率计算正确的是（）

A、正样本10个，负样本15个，模型预测正样本错误8个，预测负样本正确10

个，正确率为18/25

B、正样本10个，负样本15个，模型预测正样本错误8个，预测负样本错误10

个，正确率为7/25

C、正样本10个，负样本15个，模型预测正样本正确8个，预测负样本正确10

个，正确率为18/25

D、正样本10个，负样本15个，模型预测正样本错误8个，预测负样本正确10

个，正确率为12/25

答案：BCD

265.下列哪些任务属于聚类（）

A、物以类聚，人以群分

B、近朱者赤，近墨者黑

C、同流合污，臭味相投

D、龙生龙，凤生风，老鼠儿子会打动

答案：AC

266.常见的人工智能模型部署方式有（）

A、云端部署

B、边缘设备部署

C、移动端部署

D、防火墙部署

答案：ABC

267.高斯白噪音产生的原因有（）。

A、图像传感器在拍摄时不够明亮、亮度不够均匀

B、电路各元器件自身噪声和相互影响

C、图像传感器长期工作，温度过高

D、相机分辨率太低

答案：AB

人人文库> 全部分类> 教育资料 > 辅导培训

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）

文档简介

温馨提示

最新文档

评论

2024年江西省“天工杯”人工智能训练师职业技能大赛试题库-下（多选、判断题）

文档简介

温馨提示

最新文档

评论

相关文档