2024年人工智能训练师（高级）职业鉴定理论考试题库及答案

上传人：r*** IP属地：山东上传时间：2024-07-24 格式：DOCX 页数：163 大小：145.51KB 积分：18 举报 版权申诉

已阅读5页，还剩158页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

PAGEPAGE12024年人工智能训练师（高级）职业鉴定理论考试题库及答案一、单选题1.下列（）情形中，不构成侵权。A、未经他人同意擅自在网络上公布他人隐私B、下载网络小说供离线阅读C、伪造、篡改个人信息D、非法侵入他人电脑窃取资料答案：C2.某情感分析多分类文本模型需求，更适合选择（）算法。A、CNNB、RNNC、BertD、FastText答案：C3.在平台使用上，以下（）操作是错误的。A、按照数据集上传要求上传数据集B、为了在上传数据集环节更快捷，随意进行数据集命名C、当数据集为异常状态时，数据集不可使用，可以在平台用户群中进行反馈D、在模型训练时，考虑资源利用有效性，合理提交训练任务次数答案：B4.在对标注人员进行培训流程中，往往从（）阶段开始。A、确定培训目标和计划阶段B、建立培训资源和准备阶段C、实施培训过程和评估阶段D、提供反馈和总结阶段答案：A5.测试模型性能时可能会出现以下（）异常现象。A、超时：模型在测试过程中无法按时完成任务，导致测试结果不准确。B、崩溃：模型在测试过程中突然崩溃，导致测试结果中断。C、延迟：模型在测试过程中出现了延迟，导致测试结果不准确。D、其余三项均是答案：D6.以下关于模型正负例配比的说法正确的是（）A、一般来说，训练集负例占比越高，模型召回数据越少B、一般来说，训练集负例占比越高，模型召回数据越多C、一般来说，训练集正负例比例不完全影响模型召回数据多少D、一般来说，模型训练只需要保证正例数据的纯净度答案：C7.以下（）步骤不属于数据清洗的流程。A、数据采集和获取B、数据预处理和筛选C、数据转换和规范化D、数据分析和挖掘答案：D8.在模型训练与评估环节中，当测试工具出现问题时，应遵循以下（）上报流程。A、无法定位问题->平台oncallB、查看日志->定位问题->自行解决C、查看日志->定位问题->无法自行解决->平台oncallD、查看日志->无法定位问题->平台oncall答案：C9.在使用word进行文字编辑时，下面叙述中（）是错误的。A、word可将正在编辑的文档另存为一个纯文本（TXT）文件B、使用“文件”菜单中的“打开”命令可以打开一个已存在的word文档C、打印预览时，打印机必须是已经开启的。D、word允许同时打开多个文档答案：C10.在数据清洗过程中，最重要的步骤是（）A、标记所有数据B、仅标记重要数据C、标记重要数据并执行进一步清洗操作D、标记重要数据并执行进一步清洗操作，然后对标记有误的数据进行修正答案：B11.经常与黑客软件配合使用的是（）A、程序B、蠕虫C、系统D、木马答案：D12.模型验收阶段，需明确验收内容和角色分工，有可能涉及（）A、验收指标B、数据置信度C、模型后续优化迭代策略D、其余三项均是答案：D13.以下关于bert算法的说法正确的是（）A、Bert有1个预训练任务B、ert有2个预训练任务C、Bert有3个预训练任务D、Bert有4个预训练任务答案：B14.一个完整的微型计算机系统应包括（）A、计算机及外部设备B、主机箱、键盘、显示器和打印机C、硬件系统和软件系统D、系统软件和系统硬件答案：C15.下面对幻灯片的打印描述中，正确的是（）A、须从第一张幻灯片开始打印B、不仅可以打印幻灯片，还可以打印讲义和大纲C、须打印所有幻灯片D、幻灯片只能打印在纸上答案：B16.在制定数据标注培训流程时，培训方式不包括（）A、线上培训B、线下培训C、集中培训D、实际操作培训答案：A17.当事人申请劳动争议仲裁的时效是从知道或应当知道权利受侵害之日起（）A、15日内B、30日内C、60日内D、90日内答案：C18.测试模型性能过程中，可能会出现（）A、数据类型不匹配B、处理数据时出现超时问题C、测试数据中存在数据缺失D、其余三项均是答案：D19.模型验收阶段有可能涉及下述（）信息。A、训练数据与评估数据置信度B、模型后续优化迭代策略C、模型性能与指标分析D、其余三项均是答案：D20.以下关于模型训练参数的说法正确的是（）A、一般来讲，batchsize越大准确率越低，召回量会越高，训练时间越短B、一般来讲，batchsize越大准确率越高，召回量会越高，训练时间越短C、一般来讲，batchsize越大准确率越高，召回量会越低，训练时间越短D、一般来讲，batchsize越大准确率越高，召回量会越低，训练时间越长答案：A21.（）是指劳动关系双方当事人因劳动问题引起的纠纷。A、劳动争议B、工资争议C、休息争议D、保险争议答案：A22.模型报错后（）行为是不可取的。A、检查填写内容后后重新提交B、查询平台常见报错自查手册C、接杯水等待研发帮忙重新提交任务D、提交平台报错反馈记录答案：C23.依照我国伤亡事故报告制度，发生（）事故，应由主管部门会同劳动部门、公安部门、工会组成调查组。A、轻伤B、重伤C、死亡D、停产答案：C24.模型预测任务报错，提示“RuntimeError:CUDAoutofmemory.”原因是（）A、打分时设置的batch_size太大B、训练数据缺失C、使用太过老旧的训练模版D、模型训练超时答案：A25.（）测试集，过滤了前置策略命中数据，符合模型生效范围、真实反映线上效果。A、全量测试集B、固定测试集C、同分布测试集D、vipcase集答案：D26.以下（）情况属于模型过拟合的表现。A、模型在训练数据上的表现和实际数据的平均值或中位数差距较大，达到了数据集的方差或标准差的四倍以上B、模型在训练数据上的表现与实际数据的平均值或中位数相差较大，达到了数据集的方差或标准差的两倍以上C、模型在训练数据上的表现与实际数据的平均值或中位数相差较小，达到了数据集的方差或标准差的1倍D、模型在训练数据上的表现与实际数据的平均值或中位数相差较小，达到了数据集的方差或标准差的一半答案：B27.模型评估中的AUC是指（）A、精准率B、F1值C、ROC曲线D、ROC曲线下的面积答案：D28.影响模型性能的常见因素包括（）A、硬件和软件环境B、超参数调整C、数据质量D、其余三项均是答案：D29.以下（）算法不擅长处理位置敏感型数据。A、RNNB、CNNC、BertD、Transformer答案：B30.影响模型识别的常见客观原因或流程链路因素包括（）A、数据质量：数据质量是模型识别的关键，包括数据清洗、标准化、特征选择等步骤的质量。B、模型选择：选择合适的模型是模型识别的关键。C、评估指标：评估指标是模型识别中的重要环节。选择合适的评估指标可以帮助用户更好地了解模型的性能。D、其余三项均是答案：D31.标注规则和指南应具备（）性质才能确保标注一致性和标注结果的可靠性。A、可解释性B、可操作性C、可验证性D、其余三项均是答案：D32.在机器学习前的数据标注环节，标注人员需经过准入才可进入标注项目，以下（）指标无需关注。A、标注人员是否曾做过相关项目B、标注人员在该项目的准确率C、标注人员对该项目标准的理解D、标注项目整体的准确率答案：A33.以下（）可以使用监督学习解决。A、信用卡欺诈检测B、聚类C、图像分割D、降维答案：A34.判断一个模型训练性能优劣会涉及很多指标，以下对模型指标的描述错误的是（）A、准确率：模型在训练集上的准确率是衡量模型性能的重要指标。一个优秀的模型应该具有高准确率，这意味着它可以准确地预测输入数据。B、召回率：模型在测试集上的召回率是指模型在测试集上正确预测的比例。召回率越高，模型的性能越好。C、模型复杂度：模型的复杂度是指模型的参数数量、模型结构等因素。简单模型通常比复杂模型性能更好，因为它们更简单，更容易训练和解释。D、其余三项指标对模型均无判断价值。答案：D35.以下关于召回率的说法不正确的是（）A、召回率指用来衡量模型预测到真实标签的比例，召回率越高，可能表示模型对于真实标签的识别能力越好B、2w的随机集中总共有100条正例，其中大于阈值的有50条，则召回率为50/100=50%C、业务平时收集100条正例，这100条正例单独过模型，有30条得分在阈值以上，则召回率为30/100=30%D、业务用全是负例数据的数据集进行召回率评估，共100条数据有40条在阈值以上，则模型召回率为40/100=40%答案：D36.以下关于模型训练技巧说法正确的是（）A、模型训练过程中，调参的重要性大于新增数据B、模型训练过程中，仅靠调参可以解决的问题是有限的C、模型训练过程中，通过调参和新增数据可以解决所有模型训练问题D、模型训练过程中，训练数据纯净度不影响模型训练效果答案：B37.电子邮件的主要操作包括发邮件和（）A、收邮件B、收短信C、发短信D、收图片答案：A38.为了创造自己的品牌，某内衣专卖店注册了"活得好"商标，该商标的性质属于（）类商标。A、服务商标B、证明商标C、销售商标D、制造商标答案：C39.新《商标法》规定，商标侵权最高罚款是（）万。A、50万B、300万C、10万D、200万答案：B40.以下关于商标的法律特征描述，错误的是（）A、专有性B、专用性C、时间性D、地域性答案：B41.以下关于正负例配对模型效果影响说法正确的是（）A、在其他变量不变的情况下，在训练数据纯净的情况下，正负例配比越高，模型召回越高B、在其他变量不变的情况下，在训练数据纯净的情况下，正负例配比越低，模型召回越高C、在其他变量不变的情况下，在训练数据纯净的情况下，正负例配比越高，正例数据特征容易欠拟合D、在其他变量不变的情况下，在训练数据纯净的情况下，正负例配比越高，负例数据特征容易过拟合答案：A42.采用k折交叉验证方式进行数据集划分，以下说法不正确的是（）A、K折交叉验证是将数据划分成大小相同的K份B、划分后的K份数据集不一定互斥C、划分后，使用K-1份训练，第K份进行测试D、K折交叉验证是一种科学的数据构建方式答案：B43.在Excel中，各运算符号的优先级由高到低顺序为（）A、算术运算符、比较运算符、文本运算符和引用运算符B、文本运算符、算术运算符、比较运算符和引用运算符C、引用运算符、算术运算符、文本运算符、关系运算符D、比较运算符、算术运算符、引用运算符、文本运算符答案：C44.正则表达式中可以使用各种字符类来表示字符，以下（）字符表示匹配任意一个字母、数字或下划线。A、\wB、\dC、\D、\\答案：A45.在正则表达式中，（）特殊字符表示匹配字符串的结束位置。A、%B、$C、|D、\答案：B46.以下（）情况属于模型欠拟合的表现。A、模型在训练数据上的表现和实际数据的平均值或中位数差距较大，达到了数据集的方差或标准差的四倍以上B、模型在训练数据上的表现与实际数据的平均值或中位数相差较大，达到了数据集的方差或标准差的两倍以上C、模型在训练数据上的表现与实际数据的平均值或中位数相差较小，达到了数据集的方差或标准差的1倍D、模型在训练数据上的表现与实际数据的平均值或中位数相差较小，达到了数据集的方差或标准差的一半答案：D47.Excel工作簿是计算和存储数据的（），每一个工作簿都可以包含多张工作表，因此可在单个文件中管理各种类型的相关信息。A、文件B、表格C、图形D、文档答案：A48.模型评估指标是衡量模型性能的一种重要方式，以下是一些常见的模型评估指标及其概念，对应关系不正确的是（）A、精确率(Precision)：指模型预测为真实值的样本数占总样本数的比例，同时也考虑了假阳性(FalsePositive)的影响。B、准确率(Accuracy)：指模型预测正确的样本数占总样本数的比例。C、F1值(F1-score)：指模型预测的平均值与真实值之间的差异，可以用于评估分类模型的性能。D、召回率(Recall)：指模型预测为真实值的样本数占总样本数的比例，同时也考虑了假阴性(Falsenegative)的影响。答案：C49.以下模型指标，（）用于评估模型对于风险的识别能力。A、召回率B、准确率C、精确率D、误伤率答案：A50.以下（）工具不能用于保障数据质量。A、核对单B、数据流程图C、控制图D、甘特图答案：D51.我国劳动法律规定的最低就业年龄是（）周岁。A、18B、17C、16D、15答案：C52.模型训练后出现欠拟合的情况，以下（）处理方法不得当。A、对数据进行旋转、缩放、旋转等操作进行数据增强B、扩充数据集C、提前停止训练D、集成多个模型答案：C53.目前在中小学教学中广泛使用的计算机是（）A、微型计算机B、小型计算机C、中型计算机D、大型计算机答案答案：A54.模型训练过程中，影响模型性能的因素不包括（）A、深度学习模型中有很多超参数需要设置，例如学习率、批量大小、正则化参数等。在调整过程中需要合理配置超参数B、过拟合：深度学习模型往往会过度拟合训练数据，从而导致在测试数据上的表现不佳。常见的解决方法包括正则化、dropout、加入噪声等。C、模型的训练时间越长，模型的性能越好，如果训练时间不足，模型将无法学习到足够的特征。D、大量使用质量纯净的模型训练集样本答案：B55.以下关于数据集说法正确的是（）A、训练集是可以投训的数据集B、验证集是可以投训的数据集C、测试集是可以投训的数据集D、训练集、验证集、测试集都是不可以投训的数据集答案：A56.以下（）方法可以有效地减少模型过拟合。A、增加训练数据量B、减少模型的复杂度C、增加模型的复杂度D、增加正则化参数答案：D57.在计算机系统中，操作系统是（）A、一般应用软件B、核心系统软件C、用户应用软件D、系统支撑软件答案：B58.在模型训练过程中，造成模型性能较差的常见原因不包含（）A、模型需要大量的数据进行训练，如果数据质量不好，模型的泛化能力就会受到影响，导致模型性能较差。B、特征选择是机器学习中非常重要的一步，如果选择的特征不够相关或者不够有效，模型的性能也会受到限制。C、当数据量较小或者特征较少时，模型可能会过度拟合数据，导致性能较差。D、如果数据集量级太大，模型无法捕捉数据的集中特征。答案：D59.以下（）不是数据清洗的流程。A、数据转换B、数据采集C、缺失值处理D、数据合并答案：B60.由于CNN能够提取图像中的空间特征，所以CNN是（）领域最常用的模型。A、nlpB、语音识别C、图像处理D、音频生成答案：C61.ONNX深度学习框架提供的测试工具可以选择使用（）A、ONNXGPUTorchTesterB、ONNXGradientTesterC、ONNXTestRunnerD、ONNXTest脚本Runner答案：B62.不可以使用以下（）方法来处理数据集中的缺失值。A、插值B、删除C、填充D、复制答案：D63.在对模型性能进行测试时，以下（）环节是相对最为重要的步骤。A、创建模型B、训练模型C、部署模型D、使用测试数据集答案：B64.在制定数据标注标准规范时，以下（）步骤最重要。A、确定标注对象B、制定标注规则C、设计标注界面D、建立标注团队答案：B65.关于模型训练性能的指标描述不正确的是（）A、召回率：模型能够将目标变量预测为实际值的概率。召回率越高，说明模型的性能越好。B、准确率：模型能够准确地预测目标变量的概率。准确率越高，说明模型的性能越好。C、精确度：模型能够预测目标变量的程度。精确度越高，说明模型的性能越好。D、召回量：模型召回量越高，模型召回能力越强，不需要考虑准确率等因素答案：D66.下面（）正则表达式可以匹配一个有效的邮箱地址。A、\b[A-Za-z0-9._%+-]+[A-Za-z0-9.-]+.[A-Z|a-z]{2，}\bB、\d{3}-\d{4}-\d{3}C、\d{3}.\d{3}.\d{4}D、(\d{3})\s*\d{3}-\d{4}答案：A67.（）是计算机中用来表示存储容量大小的基本单位。A、字节B、位C、比特D、字答案：A68.判断一个机器学习模型训练性能优劣会涉及很多指标，以下对模型指标的描述错误的是（）A、准确率：模型在训练集上的准确率是衡量模型性能的重要指标。一个优秀的模型应该具有高准确率，这意味着它可以准确地预测输入数据。B、召回率：模型在测试集上的召回率是指模型在测试集上正确预测的比例。召回率越高，模型的性能越好。C、F1值：F1值是准确率和召回率的加权平均数，它是一个更加综合的指标，可以更好地反映模型的性能。D、模型可解释性：模型的可解释性是指模型能够清晰地解释其决策过程。这对于开发人员和其他利益相关者来说非常重要。不需过多解释的模型通常更易优化，且更有价值。答案：D69.以下（）方法可以用来判断模型是否出现了欠拟合或过拟合。A、绘制学习曲线B、绘制ROC曲线C、绘制PR曲线D、绘制AUC曲线答案：A70.某公司未经授权，擅自在其经营的网站提供某电影供在线观看，该公司侵犯了制作该电影的电影公司的（）A、专利权B、商标权C、信息网络传播权D、发明权答案：C71.综合评估方法是数据质量评估办法中的一种，综合评估方法不包括（）A、云模型评估法B、缺陷扣分法C、层次分析法D、第三方评测法答案：D72.在进行数据清洗前，要了解数据的（）A、使用目的B、格式要求C、数量要求D、其余三项均是答案：D73.关于机器学习中的batch_size调整方法，以下说法正确的是（）A、在训练过程中逐渐增加batch_size以提高模型性能B、在训练过程中逐渐增加batch_size以避免过拟合C、在训练过程中保持不变的batch_size，直到达到预定的停止条件D、在训练过程中逐渐减少batch_size以降低模型的复杂度答案：B74.（）数据获取方式简单易行，适用于需要收集主观数据的情况。A、调查问卷B、云计算C、数据库查询D、统计数据答案：A75.在Excel中，要在公式中引用某单元格的数据时，应在公式中键入该单元格的（）A、格式B、符号C、数表D、名称答案：D76.以下关于优化模型技巧的表述不正确的是（）A、当可使用的源数据过少时，不适合进行模型训练B、nlp模型相较于词表的优势在于，可以更好的区分语境，解决高复杂的文本问题C、模型可以解决全部类型的文本问题D、模型自身存在问题解决的限度，无法像人工审核一样追求100%答案：C77.在模型训练前，通常需要对所用的数据进行标注，在制定标注人员准入方案时，以下（）维度无需关注。A、标注项目的目标B、标注数据的内容C、标注数据的难易程度D、标注人员是否喜欢该项目答案：D78.以下（）措施不能防止计算机病毒的危害。A、软盘未写保护B、先用杀病毒软件将从别人机器上拷来的文件清查病毒C、不用来历不明的磁盘D、经常关注防病毒软件的版本升级情况，并尽量取得最高版本的防毒软件答案：A79.在word的文档窗口进行最小化操作（）A、会将指定的文档关闭B、会关闭文档及其窗口C、文档的窗口和文档都没关闭D、会将指定的文档从外存中读入，并显示出来答案：C80.以下（）数据集不适用于检验模型效果。A、训练集B、验证集C、测试集D、badcase集答案：A81.我国劳动法规定了带薪年休假制度，凡劳动者连续工作（）以上的，享受带薪年休假。A、1年B、2年C、3年D、4年答案：A82.下列（）属于计算机的硬件系统。A、程序B、电脑管家C、照片D、显示器答案：D83.在模型训练中，关于测试工具使用过程中的反馈方法描述错误的是（）A、可以使用图形化界面，例如模拟器或可视化测试工具，以便更好地理解模型的工作情况。这种方式适用于需要更直观了解模型性能的测试场景。B、在模型测试过程中，如果遇到发现模型性能不好，可先不反馈，自己学习代码知识进行debug。C、可以在训练模型时记录问题或请求，以便在测试时直接引用这些问题或请求。这种方式适用于需要对模型进行修改或优化的测试场景。D、可以向oncall平台发送消息，例如问题或请求，以便更好地理解问题或请求。答案：B84.系统存放任何程序和数据都必须有一定的（）A、存储空间B、系统性能C、吞吐速度D、能源消耗答案：A85.以下（）措施可以确保数据集的安全性和保密性。A、将数据集保存在公共云服务上B、对数据进行分类，根据分类采取不同的安全措施C、公开发布数据集以便更多人使用D、允许所有人访问数据集答案：B86.以下关于RNN算法说法错误的是（）A、RNN主要用于自然语言处理领域B、RNN主要用于图像处理领域C、RNN通过循环层实现对序列数据的处理D、RNN属于循环神经网络答案：B87.下列（）不是计算机犯罪的特征。A、计算机本身的不可或缺性和不可替代性B、在某种意义上作为犯罪对象出现的特性C、行凶所使用的凶器D、明确了计算机犯罪侵犯的客体答案：C88.要进行幻灯片页面设置、主题选择，可以在（）选项卡中操作。A、开始B、插入C、视图D、设计答案：D89.关于平台问题反馈以下方式正确的是（）A、在oncall群中直接联系相关同学处理并未提供相关故障信息B、持续进行失败任务发起，占用大量训练资源C、在明确定位任务失败原因来自平台时，不预警不反馈D、在相关渠道将问题详尽的提供给相关同事，并协助相关同事快速推进问题解决答案：D90.针对提升数据的质量，以下说法正确的是（）A、没有噪音数据B、训练数据样本平衡C、负向样本充足，种类丰富D、其余三项均是答案：D91.以下关于模型验收与评估流程的描述正确的是（）A、在模型验收合格后，对模型进行评估，包括定量和定性评估，以确定模型的优缺点，以及是否需要进行进一步改进B、模型测试后，把指标不理想的去掉，保留指标见好的输出模型评估报告给客户C、不与客户或利益相关者沟通，根据既往擅长的模型进行输出D、不对模型进行测试，训练试验结束即可输出给客户答案：A92.以下（）环节不是模型性能验收的必要环节。A、模型训练师心理测试B、效果测试（模型评估指标）C、算法指标结果分析D、算法测试报告答案：A93.下列指标指标概念中，表述正确的是（）A、模型训练需求的准确率越高，说明模型需要解决的特征类型越多，需要的算力资源越多B、模型训练需求的召回率越高，说明模型需要的精度越高C、A模型召回量为1000，准确率为90%；B模型召回量为1200，准确率为76%。则B模型能够召回比A模型更多的有效数据D、A模型召回量为1000，准确率为90%；B模型召回量为1200，准确率为76%。A模型和B模型的有效数据召回能力一致答案：C94.根据集团《劳动合同及相关人事协议管理办法》，新入职员工根据岗位不同应与公司签订的保密类相关协议包括（）A、劳动合同人事协议B、特殊聘用合同行为承诺函C、保密协议竞业限制合同D、用工协议保密合同答案：C95.网络运营者应当对其收集的用户信息严格保密，并建立健全（）A、用户信息保密制度B、用户信息保护制度C、用户信息加密制度D、用户信息保全制度答案：B96.计算机病毒是（）A、计算机程序B、数据C、临时文件D、应用软件答案：A97.在进行数据分析时，以下（）因素最重要。A、数据集的大小B、数据集的来源C、数据集的复杂度D、数据集的质量和可靠性答案：D98.以下关于进审率的说法正确的是（）A、进审率指的是接入模型后，业务每天的投稿，模型命中与总投稿数之比B、随机集中小于阈值的case数量/随机集的case数量C、进审率越高越好D、进审率越低越好答案：A99.在模型训练中，以下（）测试工具问题的反馈方法不合适。A、发挥主观能动性：在模型测试过程中，如果遇到发现模型性能不好，可先不反馈，自己学习代码知识进行debug。B、记录问题：可以在训练模型时记录问题或请求，以便在测试时直接引用这些问题或请求。这种方式适用于需要对模型进行修改或优化的测试场景。C、使用日志：可以在训练模型时记录日志，以便在测试时查看日志以了解模型的工作情况。这种方式适用于需要对模型进行详细分析的测试场景。D、使用图形化界面：可以使用图形化界面，例如模拟器或可视化测试工具，以便更好地理解模型的工作情况。这种方式适用于需要更直观了解模型性能的测试场景。答案：A100.模型验收流程通常不包括以下（）环节。A、与客户或利益相关者沟通，了解他们的需求和目标，确定模型的目的和功能B、根据模型评估结果，对模型进行改进，以提高其性能和可靠性，以满足客户的需求和目标C、将模型评估结果报告给客户或利益相关者，包括模型的性能指标、功能缺陷、安全性等方面D、在模型验收合格后，对模型进行评估，包括定量和定性评估，以确定模型的优缺点，以及是否需要进行进一步改进答案：A101.下列（）数据集通常用于模型的超参数调优和模型选择。A、训练集B、验证集C、测试集D、交叉验证集答案：B102.计算机网络的应用越来越普遍，它的最大好处在于（）A、节省人力B、存储容量大C、可实现资源共享D、使信息存储速度提高答案：C103.黑客攻击造成网络瘫痪，这种行为是（）A、违法犯罪行为B、正常行为C、报复行为D、没有影响答案：A104.以下（）数据获取方式可以获得结构化数据。A、复制B、社交媒体监测C、调查问卷D、传感器答案：C105.若想在屏幕上显示常用工具栏，应当使用（）A、“视图”菜单中的命令B、“格式”菜单中的命令C、“插入”菜单中的命令D、“工具”菜单中的命令“工具”菜单中的命令答案：A106.在制定数据标注人员的准入方案时，以下（）测试方法评估标注人员的准确性和一致性最有效。A、问卷调查B、笔试C、面试D、标注测试答案：D107.以下关于模型训练算法优劣说法正确的是（）A、FastText具有训练速度快，适用于长文本等优势B、Transformer在长距离依赖处理能力方面，表现不佳C、对于文本处理，CNN是较为常用的模型D、CNN对于位置敏感的数据表现不佳答案：D108.下面对word编辑功能的描述中（）错误的。A、word可以开启多个文档编辑窗口B、word可以插入多种格式的系统时期、时间插入到插入点位置C、word可以插入多种类型的图形文件D、使用“编辑”菜单中的‘复制’命令可将已选中的对象拷贝到插入点位置答案：D109.PowerPoint中，如果要设置文本链接，可以选择（）菜单中的“超级链接”。A、编辑B、格式C、工具D、插入答案：D110.以下（）不是人脸检测模型的实现步骤。A、语义处理B、人脸分类C、特征融合D、特征提取答案：A111.ENTER键是（）A、输入键B、回车换行键C、空格键D、换档键答案：B112.在视觉模型识别过程中，以下（）因素不会影响识别。A、图片的清晰度B、用户的发图时间C、特征在图片中的占比过小D、视觉特征无法聚类答案：B113.下列（）有关正则表达式的描述不正确。A、正则表达式可以用来匹配文本中的某些模式。B、正则表达式可以用来替换文本中的某些字符串。C、正则表达式可以用来验证输入的格式是否合法。D、正则表达式可以用来计算字符串的哈希值。答案：D114.在PowerPoint2010中，添加新幻灯片的快捷键是（）A、Ctrl+MB、Ctrl+NC、trl+OD、Ctrl+P答案：A115.下列关于《劳动法》对人的适用范围的表述，正确的是（）A、家庭聘用的保姆适用《劳动法》B、个体经济组织聘用的劳动者不适用《劳动法》C、事业单位聘用的劳动者不适用《劳动法》D、国家机关和与之形成事实劳动关系的劳动者适用《劳动法》答案：D116.在AI数据集分类中，以下（）数据集可以被用来进行无监督学习。A、未标注数据集B、半监督数据集C、监督数据集D、强化学习数据集答案：A117.根据《劳动法》规定，国家确定职业分类，对规定的职业制定职业技能标准，实行（）A、职业资格证书制度B、学历文凭制度C、培训证书制度D、技能分类制度答案：A118.用人单位违反劳动合同法律规范应当承担的的法律责任是（）A、刑事责任、民事责任、行政责任B、刑事责任C、行政责任D、民事责任答案：A119.以下（）操作可能导致模型过拟合。A、数据集去重B、降低部分训练集学习倍数C、减少模型训练轮数D、增加部分训练集学习倍数使开发机准确达100%答案：D120.以下（）模型的验收维度不是必须。A、模型训练师是否足够帅气B、是否如期交付C、测试数据是否合规D、是否完成数据指标答案：A121.以下测试集制定不合理的是（）A、结合实际业务场景进行测试集构建B、测试集和训练集用同一个数据集C、测试集划分均衡D、测试集和训练集数据互斥答案：B122.在机器学习和深度学习中，以下（）方法更适用于处理大量高维度数据。A、朴素贝叶斯B、决策树C、支持向量机D、卷积神经网络答案：D123.法律规定职工每日工作8小时，每周工作40小时，属于（）A、标准工作时间B、缩短工作时间C、不定时工作时间D、综合计算工作时间答案：A124.在数据标注培训时，需要针对标注人员进行考核，故在制定考核标准时，无需关注（）A、对培训内容的理解B、标注效率C、标注准确度D、是否喜欢这个标注项目答案：D125.模型训练因平台资源不足产生报错时，以下（）行为是正确的。A、反复提交训练任务，总能有成功的B、暂停提交任务，待平台恢复正常后再进行C、反馈群里加急研发，并催促增加资源D、跟同事大力吐槽，因为资源问题影响自己进度答案：B126.总数据量为10，模型预测有结果的为6条，无结果的为4条，其中6条有结果的数据中预测正确的是5，则模型准确率是多少，精准率是多少（）A、准确率为50%，精确率为83.3%B、准确率为83.3%，精确率为50%C、准确率为50%，精确率为50%D、准确率为83.3%，精确率为83.3%答案：A127.数据集的某些缺失值可以进行填充，填充方法不包括（）A、以业务知识或经验推测填充缺失值B、以同一指标的计算结果（均值、中位数、众数等）填充缺失值C、以不同指标的计算结果填充缺失值D、随意复制数据答案：D128.在模型训练时，以下关于训练数据合并方式不正确的是（）A、数据集合并时，剔除一些老旧且对模型效果没有影响的数据B、数据集合并时，按照正例/负例数据作为合并依据进行合并C、数据集合并时，将验证集测试集一起合并进训练集D、数据集合并时，关注不同特征下的训练数据量级，均衡的进行数据合并答案：C129.网页病毒主要通过（）途径传播。A、邮件B、文件交换C、网络浏览D、光盘答案：C130.MXNet深度学习框架提供的测试工具可以用于以下（）情况。A、训练模型并验证其性能B、训练模型并测试其可解释性C、训练模型并测试其迁移学习性能D、训练模型并测试其游戏性能答案：B131.微机病毒是指（）A、生物病毒感染B、细菌感染C、被损坏的程序D、特制的具有损坏性的小程序答案：D132.在机器学习中，如何配置不同的测试集和测试方式以评估模型的性能（）A、使用随机抽样的测试集B、使用标注过的测试集C、使用其他已知的测试集D、根据实际情况进行配置答案：D133.在使用模型测试工具时会涉及步骤1.选择模板2.准备测试集3.调整参数4.分析结果，以上步骤的正确顺序是（）A、3124B、1324C、2134D、2143答案：C134.我国著作权法中，著作权与下列（）概念相同。A、作者权B、版权C、出版权D、财产权答案：B135.关于模型评估指标描述错误的是（）A、F1值(F1-score):2×Precision×Recall÷(Precision+Recall)。它表示模型的准确性，其中Precision表示正确预测的样本数，Recall表示正确预测的样本数。B、准确率(Accuracy)：模型预测正确的样本数占总样本数的比例。C、精确率(Precision)：模型预测正确的目标样本数占总目标样本数的比例。D、召回率(Recall)：模型预测的值与实际值之间的差异。答案：D136.以下（）不是常见的正负例配比方法。A、固定配比B、最大似然配比C、随机配比D、贝叶斯配比答案：A137.在模型训练中，造成性能较差的常见原因不可能是（）A、数据集过小或数据质量差B、硬件性能过高C、训练时间过长或训练数据分布不合理D、激活函数选择不当或损失函数设计不合理答案：B138.劳动法律关系主体，一方是劳动者，另一方是（）A、用人单位B、事业单位C、企业D、团体答案：A139.模型训练后，发现trainloss仍处于下降趋势，testloss很早就不再变化，这种情况说法正确的是（）A、说明网络仍在学习B、说明网络过拟合C、说明训练超参数设置不当D、说明数据集有问题答案：B140.专利申请人就其发明创造自第一次提出专利申请后，在法定的时间内就同一发明创造再一次提出申请的，以其第一次申请的日期作为申请日，这是专利申请原则中的（）A、专利申请的单一性原则B、先申请原则C、优先权原则D、同一专利申请原则答案：C141.以下（）方式可以获取关于实际场景或现象的数据。A、现场观察B、数据采集工具C、云计算D、统计数据答案：A142.对于模型准确率描述正确的是（）A、指模型实际预测正确的样本中，被正确预测的样本占比B、是精度和召回率的调和平均值，用于综合评估模型性能C、训练好的模型在测试集上的正确率D、指模型预测结果与实际结果之间的平方误差平均值答案：C143.某一经营者先后在同一指定的商品上注册了“红玫瑰”、“白玫瑰”、“黄玫瑰”等若干个近似商标，这些商标属于（）A、集体商标B、证明商标C、等级商标D、联合商标答案：D144.以下关于模型训练正负例配比的说法正确的是（）A、为了提升模型召回量，可提升训练集正例学习倍数B、为了提升模型召回量，可降低训练集正例学习倍数C、为了提升模型召回量，清洗训练集正例数据D、一般来说，训练集正负例比例调整必然会带来模型效果的提升答案：B145.总数据量为20，模型预测有结果的为12条，无结果的为8条，其中12条有结果的数据中预测正确的是10，则模型准确率是多少，精准率是多少（）A、准确率为50%，精确率为83.3%B、准确率为83.3%，精确率为50%C、准确率为50%，精确率为50%D、准确率为83.3%，精确率为83.3%答案：A146.以下（）数据集用来衡量模型的性能。A、正例集B、训练集C、测试集D、高分集答案：C147.对于标注人员的准入条件，无需考虑（）A、标注人员的年龄B、标注人员的知识背景C、标注数据的公平性D、标注数据的鲁棒性答案：A148.以下（）不是常见的神经网络模型。A、CNNB、TransformerC、RNND、OCR答案：D149.以下（）措施是最适合用来提升数据质量。A、增加数据集的样本量B、优化模型结构C、清洗和预处理数据D、对数据集进行采样答案：C150.以网贷违约率为例，相对好用户，模型性能主要在于监测到坏用户，即可能发生的违约金额会远超过好用户偿还的借贷利息金额，造成严重偿失。以下关于召回率的描述错误的是（）A、召回率越高，代表实际被预测出来的概率越高，因此召回率的含义类似：宁可错杀一千，绝不放过一个。B、召回率（Recall）又称查全率。C、召回率表示实际为正的样本中被预测为正样本的概率。D、召回率=TP/(TP+FP)答案：D151.在进行数据清洗时，下列（）步骤应该首先执行。A、去除缺失值B、去除重复值C、数据类型转换D、数据归一化答案：C152.在模型指标的计算公式中以下（）表达的是准确率。A、(TP+TN)/(TP+TN+FP+FN)B、TP/(TP+FP)C、TP/(TP+FN)D、(2×Precision×Recall)/（Precision+Recall）答案：A153.以下关于准确率和召回率的说法不正确的是（）A、模型训练过程中总是准确率越高，召回率越低B、召回率一定时，模型准确率越高，模型效果越好C、准确率一定时，模型召回率越高，模型效果越好D、模型的准确率和召回率都是衡量模型训练效果的重要指标答案：A154.在深度学习模型训练中，以下（）方法可以有效避免训练集和验证集的过拟合。A、增加模型的复杂度B、增加训练集的大小C、减少验证集的大小D、使用正则化方法答案：D155.以下（）是标注标准规范的必要内容。A、标注的标准和要求B、标注数据的难度C、标注数据的应用D、标注数据的保密性答案：A156.以下关于常见正负例配比方法说法错误的是（）A、在模型训练过程中除了正负例配比还需要进行合理的超参设置和数据增强等预处理措施，以提升模型性能B、随机配比通常适用于数据量比较大的情况C、最大似然配比通常适用于数据量比较大的情况D、贝叶斯配比通常适用于数据量比较大特征较少的情况答案：B157.以下模型训练场景中，不符合操作规范的是（）A、当测试集处于评估状态时不进行复制、删除等操作B、模型训练运行速度较慢时，可以剔除训练集中的废弃数据C、找到测试集中模型未命中的样本，将原样本数据直接投入模型训练D、利用正则构造相似特征样本case投训答案：C158.网络运营者不得泄露、篡改、毁损其收集的个人信息；未经（）同意，不得向他人提供个人信息。但是，经过处理无法识别特定个人且不能复原的除外。A、本人B、本人单位C、被收集者D、国家主管部门答案：C159.模型训练失败，提示“nanlossencountered”，以下判断及解决方式正确的是（）A、出现了梯度消失，需要提高学习率B、出现了梯度消失，需要降低学习率C、出现梯度爆炸，可以提高学习率D、出现梯度爆炸，可以降低学习率答案：C160.以下（）行为或操作可能会导致模型训练失败。A、使用二分类数据集进行多标签模型训练B、使用不够纯净的训练集C、使用样本量少的训练集D、模型训练设置中的index字段与数据集字段一致答案：A161.在模型训练场景中，操作不符合规范的是（）A、训练集数据集命名规范合理，有可读性B、将二分类、多标签数据集进行合并后用于模型训练C、剔除训练集中被废弃的数据，提升模型运行速度D、进行nlp相关模型训练时，对比不同模型性能，快速选取更优的模型进行训练答案：B162.在深度学习过程中，造成性能较差的常见原因不可能是（）A、数据集过大B、模型结构复杂或参数过多C、硬件不足或硬件加速不当D、训练时间过长或训练数据分布不合理答案：A163.在深度学习过程中造成性能较差的常见原因可能是（）A、数据集过小或数据质量差B、模型结构复杂或参数过多C、训练时间过长或训练数据分布不合理D、激活函数选择不当或损失函数设计不合理答案：C164.在Word文档中将插入点定位于句子"飞流直下三千尺"中的"直"与"下"之间，按一下Delete键，则该句子（）A、变为"飞流下三千尺"B、变为"飞流直三千尺"C、整句被删除D、不变答案：B165.模型训练阶段可能会涉及①规则建立②模型建立③数据准备④投入训练⑤评估调整，以上的正确顺序为（）A、①②③④⑤B、①④③⑤②C、①③④⑤②D、①③②④⑤答案：D166.以下（）数据获取方式可以获得高度个性化的数据。A、复制B、传感器C、调查问卷D、用户日志答案：D167.下面关于计算机软件的描述正确的是（）A、它是系统赖以工作的实体B、它是计算机的硬件C、它是计算机的桌面D、它是指计算机的程序及文档答案答案：D168.以下（）参数不会对模型的效果造成影响。A、学习率B、内存C、训练轮数D、数据增广答案：B169.以下（）说法不会影响模型性能。A、训练数据集：数据集的大小和质量也是影响模型识别的因素之一。如果数据集过小，模型可能会过拟合，而如果数据集质量差，可能会导致模型欠拟合。B、模型算法选择：选择合适的模型算法是模型识别的关键。C、评估指标：评估指标是模型识别中的重要环节。选择合适的评估指标可以帮助用户更好地了解模型的性能。D、训练集的命名形式答案：D170.计算机病毒是编制者在计算机（）中插入的破坏计算机功能或者数据的代码。A、程序B、文件C、系统D、网络答案：A171.在进行数据整合时，不需要考虑（）A、数据源B、一致性C、权限D、数据集名称答案：D172.在反馈平台问题时，以下行为可取的是（）A、只要碰见任务失败就提工单找同事来解决B、只要功能使用有意见就给相关团队负反馈C、只要提优化需求，自己的需求必须是最高优先级D、提平台优化建议时，先判断当前需求是否紧急且无其他解决方案，再将相关功能优化建议进行归纳汇总提供给相关同学答案：D173.以下模型指标的计算公式（）表达的是召回率。A、TP/(TP+FP)B、TP/(TP+FN)C、(TP+TN)/(TP+TN+FP+FN)D、(2×Precision×Recall)/（Precision+Recall）答案：B174.在Excel中，以下（）函数可以用于将两个单元格中的文本合并成一个单元格。A、CONCATENATEB、LEFTC、RIGHTD、MID答案：A175.以下（）方式，不可以提高模型性能和泛化能力。A、正则化B、数据增强C、针对测试集特征进行重点优化D、权重初始化答案：C176.定性方法是数据质量评估办法中的一种，定性方法不包括（）A、用户反馈法B、专家评议法C、第三方评测法D、层次分析法答案：D177.在模型训练中，测试集的用途是（）A、用于模型训练和初始训练参数的设置B、用于模型训练中调整模型的超参数C、用于验证最终成型的模型的泛化能力D、用于模型训练中特征的选择答案：C178.对于用人单位对劳动者做出的开除、除名、辞退等处理，或者因其他原因解除劳动合同确有错误的，人民法院可以（）A、依法判决予以撤销B、予以变更C、发回重审D、驳回起诉答案：A179.判断模型训练效果需要对其进行测试，在测试模型性能时可能会出现（）异常现象。A、过拟合：模型在训练过程中使用了过多的数据，导致在测试阶段出现过度拟合现象。B、数据缺失：模型在训练过程中出现了数据缺失的问题，导致在测试阶段出现偏差。C、模型不稳定：模型在测试过程中出现了不稳定的情况，例如模型的精度突然降低或提高。D、其余三项均是答案：D180.PowerPoint2010的主要功能是（）A、电子演示文稿处理B、声音处理C、图像处D、文字处理答案：A181.在深度学习中，常见的正负例配比方法不包括（）A、随机配比B、固定配比C、最大似然配比D、贝叶斯配比答案：B182.衡量模型训练性能的指标通常包含（）A、召回率B、准确率C、F1值D、其余三项均是答案：D183.Excel是一个电子表格软件，其主要作用是（）A、处理文字B、处理数据C、管理资源D、演示文稿答案：B184.在Excel2003中，取消所有分类汇总的操作是（）A、按DeleteB、在编辑菜单中选“删除”选项C、在文件菜单中选“关闭”选项D、在分类汇总对话框中点“全部删除”按钮答案：D185.常见的训练数据配比方法不包括（）A、最大似然配比B、随机配比C、平均配比D、贝叶斯配比答案：C186.《劳动法》是为了保护（）的合法权益，调整劳动关系，建立和维护适应社会主义市场经济的劳动制度，促进经济发展和社会进步。A、公务员B、劳动者C、国家机关工作人员D、企业负责人答案：B187.word在编辑一个文档完毕后，要想知道它打印后的结果，可使用（）功能。A、打印预览B、模拟打印C、提前打印D、屏幕打印答案：A188.按照正则表达式的语法，用（）表示匹配任意一个字符。A、\B、\sC、\dD、\答案：A189.以下关于训练集处理说法错误的是（）A、按照个人喜好进行合并训练集B、适当降低时间久远的训练集样本学习倍数C、训练参数相似的训练集可以尝试整合到一起学习D、为了减小模型体量，可适量删除较老旧训练集答案：A190.在模型训练时，为提高模型的精度或速度，以下（）操作不可取。A、增加输入的数据量B、使用预训练模型C、随意调整数据batch_sizeD、增加训练的轮次答案：C191.下面属于office内置格式转换的是（）A、图片裁剪B、doc格式转换成pdf格式C、视频合成D、文档编辑答案：B192.在模型训练阶段，以下说法不正确的是（）A、在其他变量不变的情况下，将lr调大，loss曲线下降更慢B、在其他变量不变的情况下，将lr调小，loss曲线下降更快C、在其他变量不变的情况下，将lr调大，loss曲线下降更快D、在其他变量不变的情况下，将lr调大/调小，loss均不会发生变化答案：C193.正则表达式中可以使用各种特殊字符来表示特殊含义，（）特殊字符可以用来表示换行。A、\\B、\C、|D、\答案：A194.中文word是（）A、字处理软件B、系统软件C、硬件D、操作系统答案：A195.在Excel中，执行降序排列，在序列中空白单元格行被（）A、放置在排序数据的最后B、放置在排序数据清单的最前C、不被排序D、保持原始次序答案：A196.下列关于模型训练算法应用场景与优势的描述中，不正确的是（）A、FastText主要用于图像处理领域，通过卷积层、池化层、全连接层等组成，可以处理文本生成、翻译等问题B、RNN主要用于自然语言处理领域，存在梯度消失和梯度爆炸的问题C、Transformer是一种基于自注意力机制的神经网络模型，具有较好的长距离依赖处理能力和并行计算能力D、CNN主要用于图像处理领域，对位置敏感的数据处理效果欠佳答案：A197.《中华人民共和国数据安全法》规定开展数据处理活动，应当遵守法律、法规，尊重社会公德和伦理，遵守商业道德和职业道德，诚实守信，履行数据安全保护义务，承担社会责任，不得危害国家安全、公共利益，不得损害个人、组织的合法权益。这一规定（）①说明维护国家安全和利益是公民的权利②表明公民的权利义务相统一③是我国坚持依法治国和以德治国的体现④能消除危害他人合法权益的行为A、①②B、①④C、②③D、③④答案：C198.下面是关于计算机病毒的两种论断，经判断（1)计算机病毒也是一种程序，它在某些条件上激活，起干扰破坏作用，并能传染到其他程序中去;(2)计算机病毒只会破坏磁盘上的数据。A、只有(1）正确B、只有(2)正确C、(1）和(2)都正确D、(1）和(２)都不正确答案：A199.选择活动单元格输入一个数字后，按住（）键拖动填充柄，所拖过的单元格被填入的是按1递增或递减数列。A、ltB、CtrlC、ShiftD、el答案：B200.根据我国著作权法，著作权的产生是从（）A、作品发表日起B、版权局审查批准日起C、作品创作完成日起D、版权局颁发著作权证书日起答案：C201.以下关于CNN算法说法正确的是（）A、CNN算法适用于图像领域，无法进行文本训练B、CNN算法能够提取图像中的空间特征，所以经常用来处理图像需求C、NN算法对于位置敏感的数据处理较好，故可以用来训练短文本数据特征D、CNN算法精度由于Bert算法答案：B202.模型评估F1值的计算公式为（）A、F1=(1×Precision×Recall)/（Precision+Recall）B、F1=(2×Precision×Recall)/（Precision+Recall）C、F1=(3×Precision×Recall)/（Precision+Recall）D、F1=(4×Precision×Recall)/（Precision+Recall）答案：B203.以下关于不同参数配置说法错误的是（）A、当学习率设置的过小时，收敛过程将变得十分缓慢B、当学习率设置的过大时，梯度可能会在最小值附近来回震荡，甚至可能无法收敛C、学习率的调整会影响模型的训练速度与时长D、学习率调整一般从大到小进行调整，且越小越好答案：D204.以下（）不是商标权的取得原则。A、使用原则B、注册原则C、混合原则D、继受原则答案：D205.某猫舍需要了解大众对猫咪的话题热度，因此希望引用一个可以准确识别画面中是否有猫咪的模型，以下（）模型能力可以满足需求。A、文本模型B、音频模型C、检测模型D、人脸识别模型答案：C206.模型测试完毕分析发现有大量误召，以下不是造成该问题原因的是（）A、数据量过少B、模型复杂度过高C、训练集体量过大D、训练数据噪音过多答案：C207.准确率是模型在训练集上的准确率是衡量模型性能的重要指标。一个优秀的模型应该具有高准确率，这意味着它可以准确地预测输入数据。以下（）公式表达的是准确率。A、(TP+TN)/(TP+TN+FP+FN)B、TP/(TP+FP)C、TP/(TP+FN)D、(2×Precision×Recall)/（Precision+Recall）答案：A208.在word中，用户同时编辑多个文档，要一次将它们全部保存，需要做（）操作。A、按住Shift键，并选择“文件”菜单中的“全部保存”命令。B、按住Ctrl键，并选择“文件”菜单中的“全部保存”命令。C、直接选择“文件”菜单中“另存为”命令。D、按住Alt键，并选择“文件”菜单中的“全部保存”命令。答案：A209.新建一个演示文稿时第一张幻灯片的默认版式是（）A、项目清单B、两栏文本C、标题幻灯片D、空白答案：C210.以下（）场景属于链路影响模型识别。A、训练数据质量较差，模型性能过差B、模型结构设计过于复杂C、某业务将图片压缩，导致过模型图片过于模糊D、训练过程中出现了过拟合现象答案：C211.以下（）行为是在反馈平台问题时是可取的。A、只要碰见任务失败就提工单来解决B、提平台优化建议时，先判断当前需求是否紧急且无其他解决方案，再将相关功能优化建议进行归纳汇总提供给相关同学C、直接向oncall反馈平台故障，指出需一天内尽快修复D、训练出现报错时反复提交训练任务，不用提交平台故障工单浪费时间答案：B212.RH2测试任务报错，日志显示为“noinstancefound，needtocheckpsm”，这个问题是（）A、模型性能过差B、测试集选择错误C、模型选择错误D、模型部署无限问题答案：D213.以下（）方式可以对模型的效果起到正向作用。A、新加入的训练正例数据中包含多种特征B、在模型训练过程中加入模型预训练C、训练负例的数据没有进行提纯，其中包含了部分正例特征D、测试集的数据分布与实际的分布特征存在较大差异答案：B214.下列关于神经网络模型描述正确的是（）A、CNN属于神经网络模型，RNN、LSTM、Transformer不属于神经网络模型B、CNN、RNN属于神经网络模型，LSTM、Transformer不属于神经网络模型C、Transformer属于神经网络模型，CNN、RNN、LSTM不属于神经网络模型D、CNN、RNN、LSTM、Transformer都属于神经网络模型答案：D215.对已经注册的商标提出争议的时间为自被争议的注册商标核准注册之日起（）A、三个月内B、六个月内C、一年内D、两年内答案：C216.以下关于指标概念说法正确的是（）A、阈值以下的正例包含真正例和假正例B、阈值以上的正例包含真正例和假正例C、阈值以上的正例是真正例D、阈值以下的正例是假正例答案：B217.以下关于进审率的说法不正确的是（）A、进审率指接入模型后，业务每天投稿中被模型召回的比例B、进审率指随机集中大于阈值case的数量/随机集case的数量C、进审率与召回率代表的内容一致D、在进审逻辑下，进审率是模型交付重要的评估指标之一答案：C218.在进行上传数据集的操作时，以下（）行为可能会导致任务报错。A、上传CSV格式的数据文件B、上传的csv格式的文件里有空格C、上传文件中某行中列数与其他行不一致D、上传的是空数据集答案：C219.《中华人民共和国劳动法》是为了保护（）的合法权益，调整劳动关系。A、动物B、劳动者C、国家D、人民答案：B220.在模型评估阶段，通常会出现这样一种情况，模型在验证集上表现很好，在测试集上表现很差，在数据划分均衡的前提下，通常我们将这种现象叫做（）A、过拟合B、欠拟合C、拟合良好D、梯度消失答案：A221.模型训练后出现过拟合的情况，以下（）处理方法不得当。A、对数据进行旋转、缩放、旋转等操作进行数据增强B、扩充数据集C、继续进行训练D、集成多个模型答案：C222.以下（）指标不可作为模型的验收标准。A、精度：模型应该准确地模拟所研究的数据，并且能够在给定的误差范围内正确地预测结果。B、效率：模型应该能够在给定的时间和资源范围内完成任务，并且不需要过多的计算资源。C、可解释性：模型应该能够清晰地解释其决策过程和结果，以便更好地理解模型是如何工作的。D、丰富性：模型需要涉及尽可能多的识别元素。答案：D223.计算机病毒的危害性表现在（）A、能造成计算机器件永久性失效B、影响程序的执行，破坏用户数据与程序C、不影响计算机的运行速度D、不影响计算机的运算结果，不必采取措施答案：B224.模型的性能受多因素影响，不可能由于以下（）原因导致。A、过拟合：深度学习模型往往会过度拟合训练数据，从而导致在测试数据上的表现不佳。常见的解决方法包括正则化、dropout、加入噪声等。B、模型结构不当：模型的结构决定其性能和可解释性。如果模型的结构不合理，例如过度复杂、缺少并行化等，将会导致模型在训练和测试数据上的性能差异很大。C、超参数设置不当：深度学习模型中有很多超参数需要设置，例如学习率、批量大小、正则化参数等。如果超参数设置不当，将会影响模型的性能。D、模型训练师心态不积极答案：D225.模型训练过程中，任务时间过长的标准解决流程是（）A、耐心等待任务跑通B、同时提交多个模型训练任务，期待尽早完成C、确认是否批量任务等待，若不是kill掉重提，若是向oncall反馈等待修复D、反复kill掉任务重提，确认是否平台BUG答案：C226.以下（）是数据质量管理的主要目标。A、收集尽可能多的数据B、保证数据的完整性和准确性C、提高数据存储的效率D、增强数据传输的速度答案：B227.在Excel中，当用户希望使标题位于表格中央时，可以使用（）A、置中B、合并及居中C、分散对齐D、填充答案：B228.下列对于商标权的取得方式概述完整的是（）A、注册、使用B、转让、继承C、原始取得、继受取得、注册、转让D、注册、使用、转让、继承答案：D229.在Excel2003中，下列（）对于日期型数据的叙述错误。A、日期格式有多种显示格式B、不论一个日期值以何种格式显示，值不变C、日期字符串必须加引号D、日期数值能自动填充答案：D230.用word进行编辑时，要将选定区域的内容放到的剪贴板上，可单击工具栏中（）A、剪切或替换B、剪切或清除C、剪切或复制D、剪切或粘贴答案：C231.我国劳动法律规定，集体协商职工一方代表在劳动合同期内，自担任代表之日起（）年以内，除个人严重过失外，用人单位不得与其解除劳动合同。A、5B、4C、3D、2答案：A232.在RH2测试视觉模型的过程中，以下（）操作是不需要的。A、测试正例打包B、测试随机打包C、验证集打包D、选择匹配的模板答案：C233.对于模型训练失败，以下解决方式不正确的是（）A、回查训练集中index字段是否跟模型训练一致B、回查模型训练配置是否正确C、回查数据集具体的标注值是否正确D、回查模型调度资源是否正常答案：D234.负责互联网上网服务营业场所安全审核和对违反网络安全管理规定行为的查处的部门是（）A、公安部门B、税务部门C、工商管理部门D、文化部门答案：A235.以下会引起模型训练失败的是（）A、训练集不纯净B、训练集中的index字段与模型训练所需的index字段一致C、验证集不纯净D、使用二分类数据集进行多标签模型训练答案：D236.在机器学习中，如果一个数据集有多个目标值，例如一张风景照片可能包含天空、山脉和云等元素的多个标签，这种数据集通常被称为（）A、多源数据集（Multi-SourceDataset）B、多标签数据集（Multi-LabelDataset）C、多任务数据集（Multi-TaskDataset）D、多维数据集（Multi-DimensionalDataset）答案：B237.在机器学习中，最常用的learning_rate调整方法是（）A、自适应learning_rate调整方法B、线性learning_rate调整方法C、梯度下降法learning_rate调整方法D、随机梯度下降法learning_rate调整方法答案：B238.在判断模型泛化性的过程中，以下（）指标不是评价指标。A、召回率B、鲁棒性C、可扩展性D、可解释性答案：A239.正则化的回归分析可以避免（）A、线性化B、过拟合C、欠拟合D、连续值逼近答案：B240.要使幻灯片在放映时能够自动播放，需要为其设置（）A、超级链接B、动作按钮C、排练计时D、录制旁白答案：C241.当输入的字符串长度超过单元格的长度范围时，且其右侧相邻单元格为空，在默认状态下字符串将（）A、超出部分被截断删除B、超出部分作为另一个字符串存入B1中C、字符串显示为#D、继续超格显示答案：D242.以下关于分类模型学习过程的表述不正确的是（）A、特征提取：将特征进行融合，以便分类器更好地处理不同的特征B、分类器训练：使用训练数据集训练分类器使其能够对新的输入数据进行分类C、标签生成：使用训练数据集训练标签生成器，使其能够生成正确的分类标签D、模型评估：使用测试数据集评估分类模型的性能，并根据评估结果进行调整和优化答案：A243.以下关于模型算法差异的说法不正确的是（）A、在监督学习中，训练数据集包含输入和输出，图像分类、自然语言处理等任务都属于监督学习B、在无监督学习中，数据点没有对应关系，模型通过聚类、降维、特征提取等方式从数据集中学习到一些特征表示，然后通过已知输出对输入进行分类C、半监督学习不需要完全标注的数据，也不需要完全没有标注的数据D、强化学习是半监督学习的一种答案：D244.模型验收流程通常不包括（）A、与客户或利益相关者沟通，了解他们的需求和目标，确定模型的目的和功能B、对模型进行各种测试，包括功能测试、性能测试、安全测试、兼容性测试等C、在测试完成后，与客户或利益相关者进行沟通，确保模型能够正常运行并达到预期的效果D、在模型验收合格后，对模型进行评估，包括定量和定性评估，以确定模型的优缺点，以及是否需要进行进一步改进答案：A245.（）以上的公民具有完全的民事行为能力。A、14周岁B、15周岁C、16周岁D、18周岁答案：D246.对于训练集的命名，以下方式不正确的是（）A、结合业务线以及实际作用渠道进行合理命名B、使用规范格式进行命名C、数据集命名具有可读性D、重要的数据规范命名，过程中数据可以随意一些，优先考虑效率答案：D247.（）用于验证模型效果，可以得出模型R、F值等指标的数据集。A、测试正例集B、训练集C、badcase集D、验证集答案：D248.以下（）指标的提升对模型性能提升是负向影响。A、召回率B、准确率C、精确率D、漏放率答案：D249.按照模型的学习方式划分，以下（）不属于该类别。A、无监督学习B、人脸学习C、半监督学习D、强化学习答案：B250.按住鼠标左键，并拖动幻灯片到其他位置是进行幻灯片的（）操作。A、移动B、复制C、删除D、插入答案：A251.以下（）可以作为音频模型的深度学习框架。A、TensorFlow可以，PyTorch不可以B、TensorFlow可以，Keras、PyTorch不可以C、TensorFlow、Keras、PyTorch均不可以D、TensorFlow、Keras、PyTorch均可以答案：D252.音频模型不适用于以下（）领域。A、语音识别B、音频合成C、语义解析D、音频分类答案：C253.在计算机程序中插入的破坏计算机功能或者毁坏数据，影响计算机使用，并能自我复制的一组计算机指令或者程序代码是（）A、计算机程序B、计算机病毒C、计算机游戏D、计算机系统答案：B254.下列有关幻灯片和演示文稿的说法中不正确的是（）A、一个演示文稿文件可以不包含任何幻灯片B、一个演示文稿文件可以包含一张或多张幻灯片C、幻灯片可以单独以文件的形式存盘D、幻灯片是PowerPoint中包含文字、图形、图表、声音等多媒体信息的图片答案：C255.即时通讯与电子邮件不同，因为会话发生并可（）读取。A、片刻B、即时C、月余D、隔天答案：B256.我国负责专利申请审批的组织是（）A、国家知识产权局B、专利局C、商标局D、广电总局答案：B257.在模型训练的评估调整阶段，应该通过（）数据集来测试终版模型的泛化能力。A、验证集B、测试集C、训练集D、正例集答案：B258.劳动者违反竟业限制约定的，应当按照约定向用人单位支付（）A、赔偿金B、补偿金C、违约金D、损失费答案：C259.以下关于测试工具出现问题的上报流程，正确的是（）A、查看日志->定位问题->自行解决B、自行解决C、查看日志->定位问题->无法自行解决->平台oncallD、查看日志->无法定位问题->平台oncall答案：C260.计算机连网的主要目的是（）A、资源共享B、共用一个硬盘C、节省经费D、提高可靠性答案：A261.以下关于精确率的说法正确的是（）A、精确率与准确率等价B、精确率用来衡量模型预测到真实标签的比例C、精确率指随机集中大于阈值的正例数/随机集中所有的正例数量D、精确率越高，模型覆盖效果越好答案：B262.以下（）方法可以用于保障数据质量。A、数据分析技术B、数据备份和恢复C、数据清洗和整合D、数据审计和校验答案：B263.在进行模型验收时，应考虑模型的（）性能。A、可解释性B、可扩展性C、精度D、其余三项均是答案：D264.在训练过程中，以下（）行为是可取的。A、将测试集数据直接或间接用以投训模型，或者直接标注测试集数据进行训练B、修改或剔除测试集标注结果，使得测试集打分结果高于模型真实表现C、根据随机测试集样本特征，利用正则/其他方法构造相似特征case投训D、标注训练集中的低分样本数据，并根据数据样本特征拉取数据标注后投入训练使用答案：D265.以下关于数据集描述和操作正确的是（）A、2个参数相近且模型打分在0.5以内的训练集可以进行合并B、大批量删除模型训练里的老旧训练集C、数据相似度高但纯净度不高的两个训练集不能进行整合D、训练集和测试集样本重合度100%答案：A266.在测试工具的操作方法中，（）是一个重要的步骤。A、根据具体需求配置不同的测试集和测试方式B、编写测试用例和测试脚本C、使用自动化测试框架进行测试D、进行集成测试和端到端测试答案：B267.在专利的侵权判断中，要进行侵权对比的是（）A、专利权利要求与专利产品B、专利权利要求与被控侵权物C、专利权利要求与侵权物的技术资料D、专利产品与被控侵权物答案：B268.以下（）数据不可以制作成测试集。A、未经标注的随机数据B、以往测试集里的产生的正例样本C、外部反馈的badcase样本D、清洗打标后的正负例样本数据答案：A269.根据《失业保险条例》规定，领取失业保险金的期限最长为()A、12个月B、15个月C、18个月D、24个月答案：D270.以下关于准确率和召回率说法正确的是（）A、准确率和精确率等价B、召回率越高，模型召回能力越强，与准确率无关C、准确率越高，模型召回数据越少D、模型准确率和召回率越高，模型训练效果越好答案：D271.在制定标注人员的培训流程时，无需关注（）A、培训目标B、培训内容C、考核标准D、参培人员性别答案：D272.以下（）是测试集常见的错误操作。A、废旧测试集力的样本case可以投入模型训练B、为了得到召回率高的模型版本在测试集里灌入大量可识别的正例样本C、为了缩短模型评估任务的时长，可以随机删除小部分测试集中的样本数据D、可以将以往使用过的测试集中的正例样本进行整合，用来观测模型的召回能力答案：B273.以下对测试模型性能提出优化建议和信息反馈的工具的描述不正确的是（）A、TensorBoard是一个可视化工具，可以帮助用户跟踪训练和测试过程中模型的性能表现。B、KerasAPI是TensorFlow的一个高级API，可以让开发人员编写自定义的神经网络模型。C、PyTorch是另一种流行的深度学习框架，它也提供了一些工具和API来收集模型的性能信息D、H2O.ai是一个基于化学元素梳理的语料库，可作为模型测试集的补充。答案：D274.以下关于数据增强的说法正确的是（）A、数据增强指的是通过对数据进行旋转、缩放、翻转等操作，增加数据集的多样性，从而提升模型的泛化能力B、数据增强指的是通过对数据进行倍数调整，提升模型的拟合能力C、数据增强指的是通过针对性添加制定特征，提升部分特征的拟合能力D、数据增强指的是通过添加惩罚项，防止过拟合，从而提升模型的泛化能力答案：A275.以下算法名称对应关系不正确的是（）A、CNN-卷积神经网络B、RNN-循环神经网络C、LSTM-长短时记忆网络D、Transformer-匹配神经网络答案：D276.在使用循环神经网络（RNN）模型时，以下（）超参数用于控制网络中记忆单元的数量。A、learning_rateB、atch_sizeC、num_epochsD、hidden_size答案：D277.在模型训练中，以下测试工具问题的反馈方法（）不正确。A、如果遇到发现模型性能不好，可先不反馈，自己学习代码知识进行debug。B、使用图形化界面，如模拟器或可视化测试工具，以便更好地理解模型的工作情况。C、可向测试工具发送消息，如问题或请求，以便测试工具能够更好地理解问题或请求。D、可在训练模型时记录日志，以便在测试时查看日志以了解模型的工作情况。这种方式适用于需要对模型进行详细分析的测试场景。答案：A278.当文件被感染上病毒之后，其基本特征是（）A、文件不能

人人文库> 全部分类> 教育资料 > 考试试卷

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

2024年人工智能训练师（高级）职业鉴定理论考试题库及答案

文档简介

温馨提示

最新文档

评论

2024年人工智能训练师（高级）职业鉴定理论考试题库及答案

文档简介

温馨提示

最新文档

评论

相关文档