2022年广东省人工智能工程应用职业技能竞赛预选赛复习试题含答案_第1页
2022年广东省人工智能工程应用职业技能竞赛预选赛复习试题含答案_第2页
2022年广东省人工智能工程应用职业技能竞赛预选赛复习试题含答案_第3页
2022年广东省人工智能工程应用职业技能竞赛预选赛复习试题含答案_第4页
2022年广东省人工智能工程应用职业技能竞赛预选赛复习试题含答案_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页2022年广东省人工智能工程应用职业技能竞赛预选赛复习试题含答案1.33.(

)是最常见的评估指标,是预测正确的样本数量数除以所有样本数量。一般来说,其值越高,分类器越好。A、精确率B、准确率C、召回率D、断续器【正确答案】:B解析:答案解析:准确率(Accuracy)是最常见的评估指标,准确率是预测正确的样本数量数除以所有样本数量。一般来说,准确率越高,分类器越好2.34.在分类任务中,常常使用混淆矩阵来评估模型的性能,关于混淆矩阵真阳性(TP)和真阴性(TN)说法正确的是()。A、TP表示实际和预测都为真,TN表示实际和预测都为假B、TP表示实际为真预测为假,TN表示实际为真预测为假C、TP表示实际为假预测为真,TN表示实际为真预测为假D、TP表示实际为真预测为真,TN表示实际为真预测为假【正确答案】:A解析:答案解析:混淆矩阵中,真阳性表示实际和预测都为真,真阴性表示实际和预测都为假。3.19.人工智能时代的三大基石指的是算法、算力和()。A、数据B、宽带C、信号D、以上都不是【正确答案】:A解析:答案解析:成就人工智能时代的三大基石是是数据(即算料)、算法和算力。4.13.在芯片划痕分类检测过程中,可以使用下面什么指标来评估模型?()A、均方根误差B、均方绝对误差C、R方D、F1分数【正确答案】:D解析:答案解析:芯片划痕检测是分类任务,所以需要选择分类模型的评价指标,其中F1分数为分类模型的评价指标。5.下列选项中,哪一项不是自然语言处理技术的应用领域?()A、机器翻译B、问答系统C、文本分类D、条形码识别【正确答案】:D解析:答案解析:条形码识别不属于人工智能应用,是利用光电原理实现的。6.6.为了保障数据标注质量,一般需要进行标注检查。下列选项中,不符合标注检查要求的是()。A、检查是否存在漏标B、检查被标注目标的标签类别是否正确C、检查标注框是否为圆形D、检查标注框是否完整贴合目标【正确答案】:C解析:答案解析:数据标注往往需要检查是否存在漏标、检查被标注目标的标签类别是否正确、检查是否重复标注、检查标注框是否完整贴合目标。7.32.一般情况下,可以将数据集分为训练集、验证集和测试集,其中主要用于评估模型的泛化能力的是()。A、训练集B、验证集C、测试集D、以上都不是【正确答案】:C解析:答案解析:测试集用于评估最终模型的泛化能力。8.16.一般情况下,可以将数据集分为训练集、验证集和测试集,其中验证集的作用是()。A、用于训练模型B、用于调整模型的参数C、用于评估模型的泛化能力D、以上都不是【正确答案】:B解析:答案解析:验证集用于调整模型的超参数和用于对模型识别效果进行初步评估。9.18.(

)是指在所有正样本中预测正确的比例,即模型正确预测了多少个正样本。A、精确率B、准确率C、召回率D、断续器【正确答案】:C解析:答案解析:召回率(Recall)和灵敏度(TPR)是同一个概念,指在所有正样本中预测正确的比例,即模型正确预测了多少个正样本10.17.下列选项中,正确描述了无监督学习特点的是()。A、利用少量的具有标记信息的样本和大量没有标记的样本进行学习B、利用具有标记信息的样本进行学习C、对没有类别标记的样本进行学习D、利用自身生成的标签进行学习【正确答案】:C解析:答案解析:无监督学习是对没有类别标记的样本进行学习,学习目的通常是发现数据内在结构,典型任务是聚类和降维。11.3.在模型训练过程中,如果出现内存不足的情况,下面操作正确的是()。A、减少模型的训练迭代次数B、减少训练时的学习率C、减少训练的批次量大小D、以上方法都不对【正确答案】:C解析:答案解析:训练过程中,当每次参与计算的数据太大可能造成内存不足的情况,此时可以减少每次计算的数据量。即减少批次量大小。12.23.增强数据的任务目标是(

)。A、提取数据特征B、生成大量额外的数据C、清楚相似数据D、清除无效数据【正确答案】:B解析:答案解析:增强数据任务目标是以较低的成本生成大量额外的数据。13.10.在多分类任务中,往往需要使每个类别的数量大致平衡,下面操作正确的是()。A、对数据量少的类别进行欠采样B、对数据量少的类进行过采样C、对数据量多的类别进行过采样D、以上方法都不对【正确答案】:B解析:答案解析:处理数据不平衡一般采用欠采样和过采样两种方法。欠采样是通过减少丰富类的大小来平衡数据集,当数据量不足时就应该使用过采样,它尝试通过增加稀有样本的数量来平衡数据集。14.20.在下列选项中,不属于“智能”的能力的是()。A、感知能力B、记忆与思维能力C、学习与适应能力D、生存和繁衍能力【正确答案】:D解析:答案解析:生存和繁衍能力属于生物本能,不属于智能。15.2.对海量数据进行存储往往需要对数据进行编码,将文本数据编码为二进制时,常见的编码格式不包括()。A、UTF-8B、GBKC、WEBPD、Unicode【正确答案】:C解析:答案解析:常见的字符编码格式包括UTF-8,GBK,ASCII,Unicode等,webp为图像的编码格式。16.7.在多分类任务中,数据不平衡往往对模型结果会有影响,下面说法正确的是()。A、欠采样可以使数据量少的类别样本更加丰富B、过采样可以使数据量少的类别样本更加丰富C、对数据量多的类别可以进行过采样D、以上说法都不对【正确答案】:B解析:答案解析:处理数据不平衡一般采用欠采样和过采样两种方法。欠采样是通过减少丰富类的大小来平衡数据集,当数据量不足时就应该使用过采样,它尝试通过增加稀有样本的数量来平衡数据集。17.1.假设将一张图像数据输入进计算机视觉模型中,得到结果为[["score":0.7926366,"name":"美人梅"]["score":0.63683325,"name":"樱花"]["score":0.037346818,"name":"垂丝海棠"]],

如果将置信度设置为0.7,根据模型的预测结果可以知道预测图像的类型为()。A、美人梅B、樱花C、垂丝海棠D、都不是【正确答案】:A解析:答案解析:根据预测的结果可以看到每个类别的概率,大于置信度则认为识别正确,所以模型预测为美人梅。18.25.在分类任务中,常常使用混淆矩阵来评估模型的性能,关于混淆矩阵假阳性(FP)和假阴性(FN)说法正确的是()。A、FP表示实际和预测都为真,FN表示实际和预测都为假B、FP表示实际为真预测为假,FN表示实际为真预测为假C、FP表示实际为假预测为真,FN表示实际为真预测为假D、FP表示实际为真预测为真,FN表示实际为真预测为假【正确答案】:C解析:答案解析:混淆矩阵中,假阳性表示实际为假,预测为真,假阴性表示实际为真,预测为假。19.35.计算机视觉在实际生活中应用非常广泛,下面哪项不属于计算机视觉模型的应用?()A、菜品识别B、车辆损伤识别C、文本翻译D、广告检测【正确答案】:C解析:答案解析:A,B,D都属于计算机视觉的应用,C属于自然语言处理的应用。20.8.5W1H分析法通常用于人工智能应用开发前的项目需求分析任务。下列选项中,哪一项不是5W1H分析法需要确定的内容?()A、对象(What)B、多少(多少钱)C、人员D、方法(How)【正确答案】:B解析:答案解析:5W1H分析法中指出,完成一个场景应用项目的需求分析需要从对象(What)、原因(Why)、地点(Where)、时间(When)、人员(Who)、方法(How)6个方面提出问题并进行思考和总结。21.15.文本相似度标注指的是对两份文本通过标注(

)的方法进行标注,这是使用一串数值来描述一个词的方法。A、实体B、词向量C、情感D、相似度【正确答案】:B解析:答案解析:文本相似度标注指的是对两份文本通过标注"词向量"等方法进行标注,词向量就是使用一串数值来描述一个词的方法。22.21.在芯片引脚检测过程中,不能用于模型评估指标的是()。A、准确率B、mapC、R方D、F1分数【正确答案】:C解析:答案解析:芯片引脚检测是目标检测任务,可以使用准确率、精确度、f1分数、mAP值等作为评价指标,R方不可作为目标检测的评价指标。23.12.关于芯片划痕分类检测,下列说法正确的是()A、芯片划痕分类检测的结果是离散的B、芯片划痕分类检测的结果是定量的C、芯片划痕分类检测的结果是连续的D、芯片划痕分类检测的结果是线性的【正确答案】:A解析:答案解析:芯片划痕分类检测是一个分类任务,分类任务的输出结果是离散的。24.11.在人工智能产业链中,不属于基础层提供的硬件设施的是()。A、中央处理器B、显卡C、传感器D、操作系统【正确答案】:D解析:答案解析:操作系统属于软件程序,不属于硬件设施。25.22.特征工程不包括以下哪一步骤?()A、数据采集B、数据预处理C、数据特征可视化D、数据特征挖掘【正确答案】:A解析:答案解析:特征工程中常见步骤包括数据预处理、数据特征可视化和数据特征挖掘。26.29.在使用2D标注框进行人脸图像标注时,下列说法正确的是()。A、不需要沿着目标物体的边缘进行画框标注B、每一个目标物体均需要单独标注,不可以合并在一起进行标注C、模糊不清的图像同样需要进行标注D、标注框可以超过图像边界【正确答案】:B解析:答案解析:选项A错误,标注框需紧贴目标物体的边缘进行画框标注,框的范围不可过大或过小;选项B正确;选项C错误,模糊不清及不符合项目特殊规则的图像不进行标注;选项D错误,标注框不可以超过图像边界。27.9.对引脚检测数据进行标注时,应使用以下哪种方式进行数据标注?()A、关键点B、直线C、矩形框D、圆形【正确答案】:C解析:答案解析:引脚检测的主要目的是检测芯片的引脚,因此需要使用矩形框标注出引脚的位置。28.27.计算机视觉与机器视觉极易混淆,下列说法错误的是()。A、一般来说,相对于计算机视觉,机器视觉对精度的要求更高B、机器视觉偏重于深度学习且偏向于软件C、计算机视觉的应用场景复杂,目标类别多样,规律性不强D、机器视觉技术可应用于军事行业,用于检测航空航空着陆姿势【正确答案】:B解析:答案解析:选项B错误,偏软件的是计算机视觉,计算机视觉的应用更广,而不是机器视觉。29.31.按照字段类型进行划分,个人姓名的数据属于(

)。A、文本类B、数值类C、实践类D、以上都不是【正确答案】:A解析:答案解析:文本类数据常用于描述性字段,如个人姓名、家庭住址、文章摘要等。30.28.在深度学习领域中,通常使用()来评估模型的优劣,即评估模型预测值和真实值的差异。A、优化函数B、激活函数C、损失函数D、正则方法【正确答案】:C解析:答案解析:在深度学习领域中,通常使用损失函数来评估模型的优劣,即评估模型预测值和真实值的差异。31.30.根据实现场景和实现程度的不同,可以将人工智能的研究目标分为弱人工智能、强人工智能和超强人工智能三个层次,其中“弱人工智能”层次对应着()阶段。A、拟人B、类人C、超越人D、以上都不对【正确答案】:A解析:答案解析:人工智能的研究目标分作3个层次,分别为弱人工智能、强人工智能和超强人工智能,对应拟人、类人和超越人3个阶段。32.4.图像标注的质量取决于以下哪一因素?()A、图像标注目标的大小B、标注的图像尺寸大小C、像素点判定的准确性D、图像中像素点的大小【正确答案】:C解析:答案解析:图像标注的质量好坏取决于像素点判定的准确性。标注像素点越接近被标注物的边缘像素,标注的质量就越高,标注的难度也越大。33.24.全连接神经网络的构建与训练不包括以下哪个步骤?()A、模型部署B、优化器选择C、模型设计D、训练配置【正确答案】:A解析:答案解析:模型的构建和训练包括模型的设计,训练超参数的选择,优化器选择,损失函数等。模型部署属于模型的应用。34.26.以下属于特征工程步骤的是()。A、特征融合B、数据预处理C、数据特征可视化D、以上都对【正确答案】:D解析:答案解析:特征工程中常见步骤包括数据预处理、数据特征可视化和数据特征挖掘,其中特征融合属于特征挖掘的一种。35.14.要实现强大的人工智能模型往往需要海量的数据,数据的存储就显得非常重要。对于图像数据,可以对图像进行编码,去除冗余数据进行图片数据的压缩,在图片压缩中,不包括的冗余为()。A、编码冗余B、音频信号冗余C、像素间冗余D、视觉冗余【正确答案】:B解析:答案解析:在图片压缩中,包括3种基本的冗余:编码冗余、像素间冗余和视觉冗余。1.41.数据是进行人工智能项目的基础也是非常重要的一环,下面哪些属于正确获取数据集的途径?()A、在网上寻找开源数据B、自己根据实际需求在生活中收集数据C、网络爬取隐私数据D、胡乱编造数据【正确答案】:AB解析:答案解析:收集数据一般采用三种数据采集方法:寻找开源数据、自己采集数据、网路爬虫。但是网络爬虫需要注意,避免触犯法律法规。2.43.关于数据的采集,下面说法正确的是()。A、对数据的质量控制应该贯穿整个采集过程,遵循但不限于以下原则:完整性、准确性、一致性、时效性、可访问性、可追溯性。B、图片数据的采集可以通过对视频提取帧的方式获得C、数据的采集一定要与实际的应用场景一致D、一般数据越多越好,所以数据都可以直接拿来使用【正确答案】:ABC解析:答案解析:数据的质量对模型的结果影响很大,所以采集到的数据要对其进行整理,去掉低质量的数据。3.38.图像数据采集的过程中需要注意哪些方面?(

)A、采集尽可能多的数据B、尽可能采集与真实业务场景一致的数据C、每张数据都只能有一个目标主体D、尽可能覆盖实际场景中的所有情况【正确答案】:BD解析:答案解析:在采集数据的过程中,主要的原则为尽可能采集与真实业务场景一致的数据,并覆盖可能有的各种情况,如拍照角度、光线明暗的变化等。4.44.在进行图像数据处理时,常常需要对图像数据进行数据的增强,下面属于几何变换的数据增强的方式是()。A、抖动B、平移C、裁剪D、高斯模糊【正确答案】:ABC解析:答案解析:数据增强是数据处理中常用的操作,比较常用的几何变换方法有:翻转、旋转、裁剪、缩放、平移、抖动等。比较常用的像素变换方法如调节亮度、调节对比度、高斯模糊等。5.47.在人工智能模型训练过程中,下面哪些因素可以影响训练的快慢?()A、学习率B、每次训练数据的批次大小C、计算资源的选择D、模型结构的复杂度【正确答案】:ABCD解析:答案解析:影响模型训练速度主要有3个因素:数据、算法与算力,每次训练数据的批次大小属于数据,批次的大小影响速度的快慢。计算资源属于算力,选择的计算资源越好,速度越快,模型结构属于算法,模型结构的复杂度影响模型训练的速度。其中,学习率属于算法中的超参数,学习率越大速度越快,但可能达不到最优解。6.48.数据的处理包括()。A、数据的增强处理B、模型的优化处理C、数据的重复值处理D、神经网络正向传播过程【正确答案】:AC解析:答案解析:模型优化和神经网络正向传播过程属于模型的训练和调优等过程。7.40.人工智能项目开发的基本流程可分为4个部分,分别为数据处理、模型训练、模型校验、模型部署,下面属于模型训练部分的是()。A、数据采集B、模型搭建C、数据清洗D、优化器选择【正确答案】:BD解析:答案解析:模型训练的过程包括模型的搭建、损失函数选择、优化器的选择等8.46.人工智能项目开发的基本流程可分为4个部分,分别为数据处理、模型训练、模型校验、模型部署,下面属于数据处理部分的是()。A、数据采集B、模型搭建C、数据清洗D、模型调优【正确答案】:AC解析:答案解析:数据处理包括数据采集、数据清洗、数据标注等等过程。9.49.关于人工智能的关键技术,以下说法正确的是(

)。A、自然语言处理一般处理的过程主要包括语料获取、数据预处理、特征工程、特征选择等。B、知识图谱可以用来描述真实世界中间存在的各种实体,但是不能描述各实体之间的关系C、语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术D、计算机视觉技术的任务是通过视觉的方法实现计算机对环境进行信息提取、处理、理解和分析【正确答案】:ACD解析:答案解析:选项B错误,知识图谱可以用来描述各实体之间的关系。10.36.图像数据清洗过程中,需要用到的Python库有(

)。A、OpenCVB、osC、numPyD、shutil【正确答案】:AB解析:答案解析:OpenCV库是一个开源的计算机视觉库,提供了很多用于图像数据处理的函数;Matplotlib库是一个数据可视化绘图库;os库是标准库,其函数常被用于路径操作、进程管理、环境参数等几类;shutil则是高级的文件、文件夹、压缩包处理模块。11.37.数据采集的过程中,对于数据的质量控制需要遵守以下哪些原则?()A、时效性B、可访问性C、一致性D、可追溯性【正确答案】:ABCD解析:答案解析:对数据的质量控制应该贯穿整个采集过程,遵循但不限于以下原则:完整性、准确性、一致性、时效性、可访问性、可追溯性。12.45.进行情感分类文本数据清洗时,查找缺失值需要用到的函数有(

)。A、any()B、isnull()C、apply()D、mean()【正确答案】:AB解析:答案解析:在查看是否存在缺失数据时,如果数据量较大,可以加入any()函数查看是否存在缺失数据,再采用isnull()函数查看全部数据。13.39.关于深度学习的描述,下列说法正确的是()。A、深度学习通过学习样本数据的内在规律和表示层次,进而研究信息的最佳表示及获取方法B、深度学习模型的优势在于,无论模型多么复杂,都可以快速完成模型训练C、相比于机器学习,深度学习技术所需处理的数据样本量相对较少D、深度学习以人工神经网络为架构【正确答案】:AD解析:答案解析:相比于机器学习,深度学习技术所需处理的数据样本量相对较多,并具备更强的处理能力。但是深度学习模型的缺点是需要更长的时间来执行模型,在某些情况下,取决于复杂性,执行单个模型甚至需要几天的时间,因此选项BC错误。14.42.关于图像分割任务,下面说法错误的是()。A、图像分割就是提取出指定的目标轮廓并获取它的类型B、图像分割只能获得目标的轮廓信息C、图像分割主要包括实例分割,语义分割和全景分割D、图像分割可以使用FasterRCNN算法实现【正确答案】:ABD解析:答案解析:选项A错误,“提取出指定的目标轮廓并获取它的类型”指的是“实例分割”,而实例分割是图像分割中的一种,因此该说法以偏概全,不能完全代表图像分割;选项B错误,图像分割不仅能获得目标的轮廓信息,还能获得目标的类别信息以及各种语义信息;选项C正确;选项D错误,FasterRCNN算法主要用于目标检测,图像分割可以使用MaskRCNN算法实现。15.50.人工智能理论学派“符号主义”的思想包括以下哪些观点()。A、认为智能不需要知识、不需要表示、不需要推理B、认为人工智能的核心问题是知识表示、知识推理C、认为人的认知基元是符号D、认为能够用计算机的符号操作来模拟人的认知过程【正确答案】:BCD解析:答案解析:选项A是"行为主义"的主要思想。1.51.专注于且只能解决特定领域问题的人工智能也被称为强人工智能A、正确B、错误【正确答案】:B解析:答案解析:专注于且只能解决特定领域问题的人工智能是弱人工智能,强人工智能指的是可以胜任人类所有工作的人工智能。2.54.图像数据可视化步骤可以使用Matplotlib库进行图像数据的展示A、正确B、错误【正确答案】:A解析:答案解析:Matplotlib库是一个Python数据可视化绘图库。用于在Python中创建静态画板、动画和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论