2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第1页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第2页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第3页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第4页
2024年人工智能训练师(初级)职业鉴定理论考试题库及答案_第5页
已阅读5页,还剩125页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE12024年人工智能训练师(初级)职业鉴定理论考试题库及答案一、单选题1.下列关于语音标注注意事项描述错误的是()。A、背景噪音过大的,需标为无效B、语音标注过程最好使用降噪耳机C、确定标注文件中是否包含有效语音D、带有口音的内容,需标为无效答案:D2.数据清洗的基本流程中纠正发现的错误的操作不包括()。A、确认并改正B、属性分离C、定义数据清洗策略D、标准化答案:C3.数据标注可依照标注的构成形式进行分类,下列不属于其分类的是()。A、结构化标注B、文本标注C、非结构化标注D、半结构化标注答案:B4.以下对于Excel基本操作的说法正确的是()。A、Excel单元格的缺省字体中文为“宋体”,英文为“TimeNewRoman”B、Excel无法设置单元格边框线的粗细C、在Excel中文字数值类型的水平对齐方式默认为右对齐D、在Excel中字符类型的水平对齐方式默认为右对齐答案:D5.下列不属于数据标注图像处理工具的是()。A、BitEdit处理软件B、Nuendo处理软件C、PalEdit处理软件D、Convert处理软件答案:B解析:Nuendo是音频制作软件6.下列关于数据集划分后,各数据集对应作用描述正确的是()。A、测试集用来查看训练效果的B、验证集是用来测试模型的实际学习能力的C、训练集是用来训练算法模型的D、分析集是用来分析模型运算情况答案:C解析:测试集用来检验最终选择最优的模型的性能如何7.以下关于数据清洗中重复数据的处理方法,描述不正确的选项是()。A、在数据库中,对于属性值相同的记录,可以将其看作是重复记录数据,相等的记录可以合并为一条记录B、合并或消除是处理重复数据的基本方法C、重复数据检测主要分为基于字段和基于记录的重复检测D、对于属性值相同的记录一般是将它们的记录时间进行修改以进一步区分答案:D8.下列关于大规模非结构化数据存储的描述错误的是_____。A、非结构化数据没有预定义的模型B、文本、图片和音频属于典型的非结构化数据C、非结构化数据适用于关系型数据库存储D、大规模的非结构化数据存储需要使用非关系型数据库答案:C9.以下对遵纪守法的意义叙述错误的是()。A、遵纪守法可能导致社会混乱和动荡B、遵纪守法是社会活动的基本准则C、遵纪守法是公平和正义的基石D、遵纪守法有助于建立社会信任答案:A10.数据仓库中基于数据源的“脏”数据质量问题可分为两类,即()。A、单因素数据源和多因素数据源问题B、单构数据源与异构数据源问题C、单数据源问题和多数据源问题D、单阶数据源问题和多阶数据源问题答案:C11.下列不属于ETL(数据仓库技术)常用的数据加载方法是()。A、旁路加载B、全量加载C、增量加载D、批量加载答案:A12.下列属于数据标注文本处理工具的是()。A、PalEdit编辑器B、EmEditor编辑器C、GoldWave编辑器D、AdobeAudition编辑器答案:B13.以下对Windows10文件资源管理器文件夹选项操作描述正确的是()。A、默认情况下文件资源管理器左侧有【用户文件夹】项目B、默认情况下文件资源管理器左侧有【回收站】项目C、在Windows10中,文件资源管理器默认打开【快速访问】窗口D、可以通过访问【文件夹选项】选项下的【搜索】选项卡设置“显示所有文件夹”答案:C14.数据采集时,应当注意的事项包含:()、采集质量。A、深度理解、及时沟通B、深度理解、建立采集规范C、建立规范、及时去重D、及时沟通、及时去重答案:A15.以下关于Windows10“邮件”应用的操作的说法正确的是()。A、“邮件”应用无法设置个性化界面颜色B、“邮件”应用不可以自定义账户在应用中的名称C、“邮件”应用可以通过【管理账户】选项添加邮件账户D、“邮件”应用发送邮件无法插入图片、文件等附件答案:C16.介于完全结构化数据和完全无结构化数据之间的数据被称为()。A、半结构化数据B、非结构化数据C、单结构化数据D、复杂结构化数据答案:A17.以下关于自然语言处理相关描述不正确的选项是()。A、自然语言处理的研究目的是实现自然语言通信的计算机系统B、自然语言处理是计算机科学领域与人工智能领域中的一个重要方向C、自然语言处理是一门机械工程学、计算机科学、数学于一体的科学D、自然语言处理研究的是人与计算机之间用自然语言进行有效沟通的各种理论和方法答案:C18.在统计学中,用()去估计总体参数的过程称为参数估计。A、样本均值B、样本中位数C、总体均值D、样本统计量答案:D19.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法不正确的是()。A、在使用“DirectQuery”选项时,在每次查看数据时不需要每次手动刷新数据B、在使用“导入”选项时,PowerBI获取最新数据后会断开与数据库连接C、在使用“DirectQuery”时,PowerBI不会将数据装载到内部数据库D、“DirectQuery”适用于数据经常更新的情况答案:D20.对于数据清洗方法,以下说法错误的是()。A、使用排序与合并是错误值的清洗方法之一B、数据缺失值的清洗方法主要分为忽略缺失值数据和填充缺失值数据C、使用简单规则库是错误值的清洗方法之一D、清洗重复值的方法主要有相似度计算和基于基本近邻排序算法等方法答案:A21.()的道德准则强调避免伤害或侵犯他人权利。A、诚实与诚信B、肩负个人责任C、保证公共利益D、自由和尊重个人权利答案:D22.数据库设计步骤依次是:系统需求的调查与分析、()。A、逻辑设计、概念设计、物理设计、实施与测试、运行维护B、物理设计、逻辑设计、概念设计、实施与测试、运行维护C、概念设计、逻辑设计、物理设计、运行维护、实施与测试D、概念设计、逻辑设计、物理设计、实施与测试、运行维护答案:D23.以下过程不属于数据资源生命周期管理的是()。A、数据获取B、数据利用C、数据加工D、数据决策答案:D24.对于常用的Excel函数,以下说法错误的是()。A、SUMIF函数用于多条件求和B、COUNTIFS用于多条件计数C、AVERAGEIFS用于多条件计算平均值D、LARGE函数用于计算第K个最大值答案:A解析:A范围内求和25.()不是数据仓库系统组成部分之一,但是在数据仓库系统开发与应用中是出发点。A、存储层B、分析工具层C、数据源D、定义层答案:C26.以下关于客服机器人的评价维度中业务识别率和准确率的说法错误的是()。A、业务识别率的定义是在整个人机对话中,被机器人识别为业务问题的数量占总提问数的比例B、在计算准确率时,回复是否正确可以由机器人进行判断,无需人工介入C、业务识别率计算公式中的业务匹配数等于总提问数减去拒识问题数减去非业务回复数D、准确率=回复正确的对话数/考察范围内的对话数答案:B27.以下关于Windows10常用输入法基本设置操作的说法正确的是()。A、Windows10不允许安装第三方输入法B、Windows10可以通过【字体】选项设置微软拼音输入法按键C、Windows10可以通过【日期和时间】选项删除输入法D、使用Windows键+空格可以快速切换输入法答案:D28.商用数据标注平台对人脸标注建立可配置模板一般不需要考虑()。A、性别B、年龄类别C、人脸肤色D、说话声音答案:D29.以下属于商业智能(BI)核心作用的选项是()。A、数据的钻取分析B、数据的自动标注C、取代传统的数据报表分析D、滤除不符合要求的数据答案:A30.以下对于数据资源管理的意义描述不正确的是()。A、企业取得竞争优势的关键B、解决企业内部数据不一致问题的根本途径C、是帮助企业降本增效的唯一途径D、是信息系统进入成熟阶段的重要标志答案:C31.在SQL(结构化查询语言)的基本功能中,对数据库安全性和可用性的控制管理体现了SQL的()功能。A、数据操作B、数据定义C、数据控制D、数据建模答案:C32.对于数字可视化技术的定义和基本概念,以下说法不正确的是()。A、数据可视化中的数据开发是指利用一定算法和工具对数据进行定量的推演和计算B、数据可视化中的数据分析是指对多维数据进行切片、块、旋转等动作剖析数据C、数据可视化是利用数据分析和开发工具发现数据中已知信息的处理过程D、数据可视化中的数据空间是指由n维属性和m个元素组成的数据集所构成的多维信息空间答案:C33.以下对于网络运营者办理入网手续时的要求的说法错误的是()。A、网络运营者为用户提供即时通讯服务不需要用户提供身份信息B、网络运营需要对用户身份信息进行审核C、用户不提供真实身份信息的,网络运营者不得为其提供相关服务D、网络运营者办理入网手续时需要用户提供真实身份信息答案:A34.以下关于SQL(结构化查询语言)的相关操作,描述正确的选项是()。A、UPDATEXXXSETXXX的SQL操作可以实现数据库字段的追加功能B、在SQL中,DELETE关键字被用在删除表中的数据记录的语句中C、定义SQL索引的时候关键词ASC表示降序D、INSERTINTOXXXVALUESXXX操作是用来实现数据库字段的更新功能答案:B35.从信息系统的发展过程来看,信息系统进入成熟阶段的重要标志是()。A、数据资源有效管理B、数据采集技术的成熟C、由人工处理数据转向计算机处理数据D、数据采集渠道的增加答案:A36.以下对于Windows10常用系统维护工具使用的说法正确的是()。A、【可靠性监视程序】只能用于监测系统中的软件问题B、在命令行输入eventvwr命令可以打开【事件查看器】C、使用Ctrl+Shift+Esc可以打开【资源查看器】D、在命令行输入resmon命令可以打开【任务管理器】答案:B37.()是商用数据标注平台不需要支持管理的数据来源。A、来自本地的文本数据集B、预训练模型的结构与参数C、来自共享存储的语音数据集D、来自云存储的图像数据集答案:B解析:二、判断题38.以下关于Windows10文件管理器的基本操作描述错误的是()。A、文件资源管理器可以对文件搜索结果进行保存B、文件资源管理器可以对文件按照名称进行分组C、在文件资源管理器窗口按Ctrl+A可以删除文件或文件夹D、在文件资源管理器窗口按Ctrl+Shift+N键可以快速创建新文件夹答案:C39.数据仓库的()特征体现在数据仓库随时间变化不断增加新的数据内容,删去旧的无用的数据内容。A、面向主题B、集成C、随时间不断变化D、不可更改答案:C40.以下关于客服机器人的评价维度中平均对话轮次的说法正确的是()。A、平均对话轮次是某类任务的对话中断数占某类任务的对话总数的比例B、平均对话轮次衡量了产品推荐的精准度C、平均对话轮次衡量了客服机器人的对话流程健康度D、平均对话轮次是反馈给用户的正确结果数占反馈结果总数的比例答案:C41.数据标注的正确流程为()、数据质检。A、数据清洗、数据标注、数据采集B、数据标注、数据采集、数据清洗C、数据采集、数据标注、数据清洗D、数据采集、数据清洗、数据标注答案:D42.下列属于常见的位图图像格式的是()。A、XML格式B、SVG格式C、JPG格式D、MP4格式答案:C43.数据抽取的数据源不包含()。A、Web数据B、文本数据C、图层数据D、数据库数据答案:C44.数据标注最常见的分类方法是根据待标注数据类型进行分类,下列不属于其分类的是()。A、标注框标注B、文本标注C、视频标注D、图像标注答案:A45.以下关于Word的操作的说法错误的是()。A、Word可以通过【段落】选项进行字体设置B、Ctrl+E可以将段落进行中间对齐C、Word可以通过水平标尺的调整调节段落文字的缩进D、Word可以通过【插入】选项卡下的【符号】选项插入特殊符号答案:A46.从事数据标注需要了解其基本概念,下列关于其基本概念描述不正确的是()。A、标签主要就是标识数据特征、类别和属性等B、标注任务是指按个人对任务的理解对数据集进行标注的过程C、数据标注员负责对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标注和批注D、标注标注员负责对文本、图像、语音、视频等数据进行标注答案:B47.空缺值数据清洗分为三个步骤,步骤的顺序为()。A、空缺值数据的处理、输出完整数据、空缺值数据的检测B、空缺值数据的检测、空缺值数据的处理、输出完整数据C、空缺值数据的处理、空缺值数据的检测、输出完整数据D、输出完整数据、空缺值数据的处理、空缺值数据的检测答案:B48.()是商业智能(BI)具备的功能。A、人工数据整理B、自动数据预处理C、制作自动化报表D、联机事务处理答案:C49.数据清洗的基本流程一共分为5个步骤,下列不属于数据清洗步骤的是()。A、数据分析B、数据合并C、干净数据回流D、定义数据清洗策略与规则答案:B50.面向主题的、集成的、不可更改的、随时间不断变换的数据集合我们称之为()。A、数据库B、数据仓库C、数据资源D、数据中心答案:B51.采集到的数据要进行质量检查,同时也要注意数据采集的()和数据质量。A、可解释度B、价值密度C、完整性D、时效性答案:D52.以下对于ETL(数据仓库技术)增量加载与全量加载区别说法正确的是()。A、全量加载能够将业务系统中的变化数据按一定的频率准确地捕获并加载到目标表中B、全量加载不会对业务系统造成太大的压力C、增量加载相比全量加载技术实现更简单D、增量加载不会影响现有业务答案:D53.根据预防系统蓝屏的方法,以下做法不恰当的是()。A、系统能正常运行无需升级驱动、BIOS等软件B、不需要定期对电脑进行病毒扫描C、定期对重要的注册表文件进行备份D、在关机时要尽量通过系统的关机按钮进行关机答案:B54.以下关于微软edge浏览器操作的说法正确的是()。A、微软edge浏览器的阅读视图无法调节页面主题B、微软edge浏览器的网页笔记无法使用荧光笔C、微软edge浏览器的标签页无法显示网页预览D、微软edge浏览器无法将网页固定到【开始】菜单答案:C55.下列关于词云图的优点描述不正确的是()。A、用途范围单一B、突出文本主旨C、过滤低频文本信息D、提炼关键信息答案:A56.商业智能(BI)工具主要有两种用途,分别是()。A、进行数据采集和进行联机事务处理B、进行数据抽样和进行可视化分析C、进行自动化报表的制作和进行可视化分析D、进行联机事务处理和进行自动化报表的制作答案:C57.数据库实体联系(Entity-Relationship,E-R)模型需要转化为()才能被数据库管理系统所支持。A、物理结构B、逻辑模型C、外模式D、关系模型答案:D58.对于各种数据结构的存储方式,以下说法错误的是()。A、财务系统的数据属于大规模非结构化数据B、非结构化数据没有预定义的模型C、MPP可以用来管理计算高质量的结构化数据D、采用MPP并行数据库集群与Hadoop集群的混合可以实现对PB量级、EB量级数据的存储和管理答案:A59.下列属于常见的数据标注结果文件格式的是()。A、xls格式B、doc格式C、ra格式D、XML格式答案:D60.DB2数据库系统属于()。A、传统的桌面数据库系统B、面向对象数据库系统C、流行的关系数据库系统D、其他数据源答案:C61.在中文分词技术中,搜索引擎模式是在精确模式的基础上对长词再次拆分提高()。A、召回率B、精准率C、精确率D、准确率答案:A62.()是PowerBI(商业智能)支持的自然语言查询语言。A、英语B、西班牙语C、俄语D、汉语答案:A63.以下不属于语音智能客服机器人的主要功能特点的选项是()。A、通过进行表情监测识别情绪变化B、人机协助C、智能意图识别D、数据统计答案:A64.()不是进行系统备份的合适时机。A、安装了重要软件后B、对系统优化后C、进行可能损坏系统的操作前D、当系统感染计算机病毒后答案:D65.爱岗敬业的具体要求不包括()。A、树立职业理想B、积极进行创新C、消极怠工D、强化职业责任答案:C66.下列关于相关分析的描述不正确的是()。A、相关分析是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法B、相关分析中所有的变量都必须是随机变量C、相关分析中相关系数是确定的D、相关分析是研究从变量群中提取共性因子的统计技术答案:D67.下列关于图像标框标注的质量标准相关内容描述正确的是()。A、标框的四周要与标注物最边缘像素点误差在3个像素以内B、标框标注的四周边框需要覆盖住标注物并且标注框需要贴合目标C、标框的四周要与标注物最边缘像素点大于4个像素,图片即为不合格D、标注物最边缘像素点不需要进行判定答案:B68.以下对于系统蓝屏可能的原因与解决方法说法错误的是()。A、一些计算机病毒会导致系统蓝屏,可以使用杀毒软件进行杀毒B、在硬件问题上可以检查硬件是否插牢与是否出现氧化现象C、系统蓝屏可以基本排除BIOS的问题D、某些硬件驱动不兼容也会发生蓝屏错误,此时应进入安全模式将其禁用并安装兼容的硬件驱动答案:C69.下列关于多重抽样检验方法的的优缺点描述正确的是()。A、不能弥补其他检验方法的疏漏B、需要耗费大量人力精力集中进行C、能够合理调配质检员的工作重心D、能够提高质检员的工作效率答案:C70.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验第一阶段数据全样检验不合格,则第二阶段()。A、质检员继续对标注员标注的数据进行全样检验B、质检员只需对标注员标注数据的25%进行检验C、质检员只需对标注员标注数据的50%进行检验D、质检员将不再对标注员标注的数据进行检验答案:A71.以下不属于自然语言处理技术中中文分词切分歧义类型的选项是()。A、嵌套型歧义B、交集型歧义C、混合型歧义D、组合型歧义答案:A72.下列不属于文本标注需要注意的事项是()。A、严格的审核制度B、只能使用单一语言进行相关标注C、充分了解语言学D、迭代式标注答案:B73.以下关于Windows10网络基本设置方法的说法正确的是()。A、一般情况下设置电脑的IP只需要设置IPv4协议版本的地址B、Windows10可以通过【时钟与区域】功能设置IP地址与DNS地址C、Windows10只能手动设置IP地址D、Windows10只能手动设置DNS地址答案:A74.下列不属于常见的图像数据标注类型的是()。A、多边形拉框B、OCR文本识别C、语义分割D、语音转写标注答案:D75.SQL(结构化查询语言)具有(),用于对表和关系、索引、查询的定义与维护。A、数据定义功能B、数据控制功能C、数据操作功能D、数据建模功能答案:A76.下列不属于数据库系统三级模式的是()。A、虚拟模式B、内模式C、外模式D、模式答案:A77.在数据预处理步骤中,数据归约的作用是()。A、得到数据集的规约表示以减少数据量并且使规约前后结果几乎相同B、将数据转换为适用于数据挖掘的形式C、使数据格式标准化、清除异常数据、清除重复数据、错误纠正D、将多个数据源中的数据结合起来并统一存储答案:A78.如图所示的统计图的可以用于()。A、展示数据的聚类分析结果B、展示公司年度各项支出额度C、比较多组数据随时间变化的趋势D、展示两组数据之间的变化关系答案:B79.在数据预处理中,去除数据中的噪声并将连续数据离散化的过程被称为()。A、数据规范化B、属性构造C、数据聚集D、数据平滑答案:D80.在数据标注质量检验方法中,多重抽样检验方法辅助全样检验第一轮数据抽样检验全部合格,则第二轮()。A、抽样检验的标注数据量较第一轮减少50%B、抽样检验的标注数据量较第一轮减少30%C、抽样检验的标注数据量较第一轮增加50%D、抽样检验的标注数据量较第一轮增加30%答案:A81.在Excel中,TRIMMEAN函数的作用是()。A、按单个条件计算平均值B、计算算术平均值C、按多个条件计算平均值D、计算内部平均值(修剪平均值)答案:D82.下列不属于数据仓库的数据质量评价指标的是_____。A、差异性B、适用性C、完整性D、准确性答案:A83.非结构化数据可以使用()进行存储。A、结构化数据库B、多结构化数据库C、非结构化数据库D、半结构化数据库答案:C84.()不是数据标注质量实时检验方法的优点。A、及时发现问题并解决问题B、有效减少标注过程中重复错误的重复出现C、提高数据质检员的工作效率D、提高数据质检员的工作效率答案:D85.以下不属于云存储模式组织框架的是()。A、数据通信层B、基础管理层C、存储层D、应用接口层答案:A86.在Excel中,()可以完成多区间的判断。A、COUNT函数B、RANK函数C、IFS函数D、MATCH函数答案:C87.以下对于微软edge浏览器的历史记录功能的说法正确的是()。A、微软edge浏览器无法删除对某个网站的所有访问记录B、微软edge浏览器只能删除最近30分钟的历史浏览记录C、微软edge浏览器没有按键可以快速清除历史访问记录D、微软edge浏览器可以一次删除多条历史访问记录答案:D88.下列关于因子分析的作用描述错误的是()。A、因子分析常用于因子降维B、因子分析可以用于描述同一变量各个类别之间的差异C、因子分析可以找出隐藏且具有代表性的因子D、因子分析可以按照权重计算出综合得分再进行回归或聚类分析答案:B解析:因子分析是指研究从变量群中提取共性因子的统计技术。89.下列关于Excel2019数据透视表自定义计算功能描述不恰当的选项是()。A、百分比选项的功能是值区域显示为基本字段和基本项的百分比B、差异选项的功能是值区域字段显示为与基本字段项的差异百分比C、无计算选项的功能是值区域字段显示为数据透视表中的原始数据D、父行汇总的百分比是值区域字段显示每个数据项占该列父级项总和的百分比答案:B90.下列不属于常用的数据清洗转换方法的是()。A、多数据源的合并B、复杂数据的转换C、数据粒度的转换D、数据的商务规则计算答案:B91.()是在Windows10系统下常用的即时通讯软件。A、Excel表格编辑软件B、MicrosoftEdge浏览器C、Xmind思维导图工具D、钉钉答案:D92.在数据采集渠道中组织与组织之间的合作,交换或购买数据来整合行业资源的渠道被称为()。A、网络数据采集B、自行采集C、共享行业数据D、第三方合作答案:D93.以下对于数据质量问题的分类说法错误的是()。A、数据仓库中基于清洗方式的“脏”数据质量问题可分为规律型“脏”数据和随机型“脏”数据B、数据质量的问题可以分为基于数据源的“脏”数据质量问题与基于清洗方式的“脏”数据质量问题C、基于数据源的“脏”数据质量问题可分为单数据源问题和多数据源问题D、在基于数据源的“脏”数据质量问题中,单数据源情况下出现的问题在多数据源情况下会变得更严重答案:A94.()情况下,用人单位不得解除劳动合同。A、劳动者在试用期间被证明不符合录用条件的B、劳动者不能胜任工作,经过培训或者调整工作岗位,仍不能胜任工作的C、劳动者严重违反用人单位的规章制度D、女职工在孕期、产期、哺乳期的答案:D95.以下不属于大数据的五大特征的选项是()。A、多样B、大量C、低速D、低价值密度答案:C96.以下不属于常见的数据质量问题的是()。A、缺失值B、重复值C、错误值D、重叠值答案:D97.对于空缺值、异常值与重复值的处理方法,以下说法错误的是()。A、孤立点分析属于数据清洗中的异常值处理方法B、重复数据检测主要分为基于字段和基于记录的重复检测C、回归是数据清洗中的空缺值处理方法之一D、合并或消除是处理重复数据的基本方法答案:C98.以下关于客服机器人的评价维度中推荐结果点击率的说法正确的是()。A、推荐结果点击率衡量了客服机器人的产品设计友好度B、推荐结果点击率是使用了客服机器人产品的用户数占用户总数或者曝光用户数的比例C、推荐结果点击率衡量了客服机器人的对话流程健康度D、推荐结果点击率是推荐答案或内容的点击(或采纳)次数占推荐次数的比例答案:D99.以下不属于商业智能(BI)核心作用的选项是()。A、数据的上钻和下钻B、获取数据的多维度分析C、数据的切片D、取代传统的数据报表分析答案:D100.以下属于数据清洗中常见的异常值处理方法的选项是()。A、随机森林B、排序与合并C、回归D、平均值填充答案:C101.对于在Windows10应用商店安装、更新与卸载软件的操作,下列说法正确的是()。A、可以通过【下载与更新】选项卸载应用B、通过Windows10应用商店安装的应用无法更新C、Windows10应用商店无法查看已经获得的应用D、Windows10应用商店可以通过关键字快速搜索相关应用答案:D102.下列关于停用词表的构成相关描述恰当的选项是()A、停用词表中含有需要使用的关键词B、停用词表中含有已经在书面与口语中不再使用的词语C、停用词表内容可自行定义D、停用词表一般使用DOC格式文件存储答案:C103.下列关于数据标注质量全样检验方法的描述错误的是()。A、全样检验不合格的数据需要标注员进行返工改正B、数据标注质量全样检验方法需要耗费大量的人力精力集中进行C、完成全样检验后,质检员需要将标注有问题的数据移交给标注员D、数据标注质量全样检验在数据标注任务完成交付前可以不做答案:D104.下列关于数据仓库管理层的功能描述错误的是()。A、完成数据库的定义B、完成数据的归档、备份、维护、恢复C、完成数据的抽取、转换、装载D、元数据的管理答案:A105.职业道德的特点不包括()。A、持久不变的永恒性B、适用范围的有限性C、发展的历史继承性D、纪律性答案:A106.在Excel2019中,()可以用来生成随机数且需要输入参数。A、RAND函数B、MATCH函数C、RANDBETWEEN函数D、RANK函数答案:C107.道德的功能不包括()。A、认识功能B、进化功能C、调节功能D、评价功能答案:B108.对于自然语言处理中停用词的分类说法正确的是()。A、停用词一般可分为功能词和判定词B、搜索的短语中包含功能词不会使搜索结果出现问题C、词汇词的使用十分广泛,不会降低搜索的效率D、功能词不具有实际含义答案:D109.下列关于回归分析的描述不正确的是()。A、回归分析研究的是因变量(目标)和自变量(预测器)之间的关系B、回归分析是研究确定两种或两种以上变量间相互依赖的定量关系的统计分析方法C、回归分析通过分析由定性变量构成的交互汇总表来揭示变量之间的联系D、回归分析可以用于研究人的身高与体重之间的相关关系答案:C110.以下对于PowerPoint2019基本操作的说法错误的是()。A、在PowerPoint中,通过“SmartArt图形”功能插入的形状不能设置文字B、在PPT模板中大多含有占位符,可以通过占位符导入多种可显示对象C、可以通过直接粘贴的方式在幻灯片中插入图表D、在PowerPoint中,不可以通过“SmartArt图形”功能插入表格答案:A111.关于PowerBI(商业智能)中的查询编辑器,下列说法正确的是()。A、查询编辑器只能查询并显示原始数据的全部列B、数据源的隐私级别设置错误会影响查询的性能C、自定义列一般不需要定义数据类型D、查询编辑器的默认联接种类是右外部连接答案:B112.关系模型中最重要的概念是关系,下列关于关系的特点描述正确的是()。A、关系中元组是有先后顺序的B、关系中属性是有先后顺序的C、关系中的每个属性可以再分D、关系中的每个属性是同质的答案:D113.在Excel中,下列日期函数相关功能描述不正确的是()。A、EDATE函数用于返回指定日期之前或之后指定月份数的日期B、DAYS360函数按每年360天返回两个日期间相差的天数(每月30天)C、DATEDIF函数用于返回日期中的月份D、WORKDAY函数返回指定工作日之前或之后的日期答案:C114.以下关于申请专利权力归属方的规定的说法不正确的是()。A、两个以上单位所完成的发明创造,除另有协议的以外,申请专利的权利属于完成或者共同完成的单位B、对发明人或者设计人的非职务发明创造专利申请,任何单位或者个人不得压制C、非职务发明创造,申请专利的权利属于单位D、职务发明创造申请专利的权利属于单位,申请被批准后,单位为专利权人答案:C115.下列对于数据库与数据仓库的区别描述正确的是()。A、数据仓库相比数据库可以更直观地对数据源中的数据进行操作B、数据库中的数据是经过整理并按分析主题重新组织起来的C、数据仓库和数据库两者之间无任何关联D、数据仓库的基本目标是减少数据冗余和增加数据的独立性答案:A116.以下关于客服机器人的评价维度中业务覆盖率的说法正确的是()。A、业务覆盖率越高则客服机器人可以理解更多的用户意图B、业务覆盖率衡量了客服机器人的接待能力C、业务覆盖率衡量了客服机器人回复问题的准确程度D、业务覆盖率衡量了客服机器人产品推荐的精准度答案:A117.在数据质量的评价指标中,()的评价标准要求尽量选择数据重要的本质属性并消除冗余。A、适用性B、简洁性C、完整性D、准确性答案:B118.数据清洗的基本流程中纠正发现的错误的操作不包括()。A、确认并改B、属性分离C、定义数据清洗策略D、标准化答案:C119.早期数据标注工作是由()完成。A、研究数据标注的工程师B、研究数据统计的工程师C、研究人工智能算法的工程师D、进行数据采集的工程师答案:C120.下列数据库实体联系(Entity-Relationship,E-R)模型向关系模型的转化叙述正确的是()。A、1:n的联系必须与联系的任意一端实体所对应的关系模式合并B、1:1的联系可以单独成为一个关系模式C、m:n的连续可以与任何一方实体合并D、实体联系模型中的联系可以直接被DBMS(数据库管理系统)支持和执行答案:B121.以下关于Windows10“照片”应用的操作的说法错误的是()。A、“照片”应用无法将图片合成视频B、“照片”应用可以通过文件夹导入图片C、“照片”应用可以对图片进行编辑美化D、“照片”应用可以根据关键词搜索图片答案:A122.以下不属于电话机器人的优势的选项是()。A、相比电销人员可以快速学习营销话术B、可以通过表情监测识别情绪变化并改变沟通方式C、提高拨打电话效率D、可以快速采集大量数据用于数据分析答案:B123.数据标注可以根据标注者类型进行分类,下列属于该分类的是()。A、拼音标注B、结构化标注C、文本标注D、机器标注答案:D124.下列属于数据标注图像处理工具的是()。A、EditPlus处理软件B、GoldWave处理软件C、BitEdit处理软件D、Protools处理软件答案:C125.数据集市可分为()。A、独立数据集市和从属数据集市B、串行数据集市和独立数据集市C、并行数据集市和虚拟数据集市D、虚拟数据集市和嵌入数据集市答案:A126.下列属于SQL(结构化查询语言)常用查询的是()。A、操作查询B、视图查询C、定义查询D、嵌套子查询答案:D解析:SQL是一种数据库查询和程序设计语言。127.以下对于云存储模式的概念与整体架构说法错误的是()。A、云存储模式组织框架自底向上依次是存储层、基础管理层应用接口层以及访问层B、云存储的概念和云计算的概念是两种不同的概念C、云.存储就是将存储资源放到云上为人们服务的一种新兴方案D、云存储通常由具有完备数据中心设施的第三方提供答案:B128.以下对于微软edge浏览器的收藏夹功能的说法正确的是()。A、微软edge浏览器的收藏夹功能默认是处于隐藏状态的B、微软edge浏览器无法导入IE浏览器中收藏的网页C、微软edge浏览器不能调整收藏夹栏的按钮次序D、添加到收藏夹的网页无法重命名答案:A129.以下不属于Python数值分析常用软件库的选项是()。A、Websockets库B、NumPy库C、Matplotlib库D、Pandas库答案:A130.()规则限定了子关系中外键的取值。A、实体完整性B、参照完整性C、域完整性D、用户自定义完整性答案:B131.()的数据直接来自中央数据仓库。A、整合数据集市B、虚拟数据集市C、独立数据集市D、从属数据集市答案:D132.()规则分别限定了在关系中每一列属性都有确定的取值范围与关系中主键的唯一性。A、参照完整性与域完整性B、用户自定义完整性与实体完整性C、域完整性与实体完整性D、实体完整性与参照完整性答案:C133.数据标注的工作特点是由()所决定的。A、数据标注员的标注习惯B、数据标注项目的特点C、数据标注项目的周期D、数据标注项目的进度答案:B134.下列属于数据标注质量检验方法的是()。A、随机检验B、定时检验C、相互检验D、实时检验答案:D135.在数据标注基本概念中,数据标注工具按照自动化程度不同可分为()。A、语音标注工具、文本标注工具、图像标注工具B、客户端标注工具、网页端标注工具C、手动标注工具、半自动标注工具、自动标注工具D、区域标注工具、拉框标注工具、分类标注工具答案:C解析:自动化程度136.在自然语言处理中,下列关于分词标准描述恰当的是()。A、分词可按照操作员习惯进行分词B、分词标准中粗粒度切分最常应用的领域是搜索引擎C、中文分词比英文分词更简单D、分词标准可分为粗粒度和细粒度答案:D137.以下关于Windows10常用输入法基本设置操作的说法错误的是()。A、Windows10可以安装第三方输入法B、Windows10默认系统自带输入法没有微软五笔C、Windows10可以对输入法进行外观设置D、Windows10可以设置启用模糊拼音答案:B138.以下关于授予专利权的相关条件规定的说法不正确的是()。A、在申请专利前六个月内,在国家出现紧急状态或者非常情况时,为公共利益目的首次公开的发明不丧失新颖性B、授予专利权的发明和实用新型,应当具备新颖性、创造性和实用性C、授予专利权的外观设计不得与他人在申请日以前已经取得的合法权利相冲突D、疾病的诊断和治疗方法可以授予专利权答案:D139.在Windows10输入法中,v模式的作用是()。A、方便输入中文数字、罗马数字与年份B、进行笔画筛选C、方便输入时间日期D、拆分不认识的汉字答案:A140.数据仓库的管理部分由()、数据管理部件和元数据管理部件4部分组成。A、数据集市定义部件、数据获取部件B、数据集市定义部件、数据库定义部件C、数据仓库定义部件、数据资源部件D、数据仓库定义部件、数据获取部件答案:D141.以下对于Word中段落缩进方式的说法正确的是()。A、左缩进是指段落所有行均向左移动一定的距离B、右缩进是指段落所有行均向右移动一定的距离C、悬挂缩进是指除段落第一行外其余各行缩进一定的距离D、首行缩进是指段落中第一行文字从右向左缩进一定的距离答案:C142.在商用数据标注平台中,预识别引擎识别的结果最适合使用()格式存储。A、JSONB、TXTC、XLSD、RAR答案:A解析:哈哈哈,其他3个我都知道是啥143.下列关于聚类和分类相关内容描述错误的是()。A、分类要求划分的类别是已知的B、聚类的结果是确定的C、分类是有监督的学习D、聚类是无监督的学习答案:B144.()是数据采集的主要来源之一。A、数据填充B、机器生成C、模拟仿真D、页面表单数据答案:B145.在Excel中,使用()可以直接计算众数并且只返回一个结果。A、MODB、SNGL函数C、MATCH函数D、MULT函数E、ROUND函数答案:A146.()不属于数据清洗的基本流程中搜寻并确定错误实例的检测方法。A、基于统计的方法B、均值填充方法C、聚类方法D、关联规则方法答案:B147.数据仓库系统通常被分为()、分析工具层3个部分。A、存储层、操作层B、管理层、存储层C、表现层、管理层D、处理层、管理层答案:B148.下列关于Access数据库中常见的数据类型描述正确的是()。A、货币型用来存储货币值,在计算中可以四舍五入B、长文本用于注释与说明,最长为16384个字符C、长整型数字占用4个字节的存储空间D、短文本用于处理文本字符信息,最长为128个字符答案:C149.以下关于客服机器人的评价维度中拦截率的说法错误的是()。A、用户与机器人的一次交互算作一次会话B、拦截率衡量了客服机器人的接待能力C、拦截率的计算必须基于有效会话数D、由于业务特点或者用户习惯产生的转人工会话不属于有效的转人工会话答案:A150.以下关于Word的审阅功能的说法错误的是()。A、在Word中可以通过【视图】选项卡在文档中添加脚注B、批注内容在打印的文件中不会显示C、在Word中可以通过更改组中的“接受”与“拒绝”功能来确认接受或者拒绝修订D、在Word中使用修订功能的情况下,修订过的文字会被突出显示答案:A151.数据仓库的数据质量评价指标主要包括数据的准确性、()、适用性。A、多样性、完整性B、完整性、简洁性C、特殊性、简洁性D、复杂性、唯一性A答案:B152.一般认为语音标注的质量标准是标注与发音时间轴误差在()语音帧以内。A、1个B、3个C、5个D、7个答案:A153.在Excel中,不能直接计算极值或条件极值的函数是()。A、MAXIFS函数B、MIN函数C、OUNT函数D、LARGE函数答案:C154.下列属于数据标注质量检验方法的是()。A、定时检验B、抽样检验C、定量检验D、间接检验答案:B155.在Office快捷键操作中,Ctrl+B的功能是()。A、字符变为粗体B、段落居中C、左对齐D、打印文档答案:A156.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法正确的是()。A、在使用“导入”模式时总能看到最新的数据B、PowerBI在使用“导入”模式时需要保持与数据库连接C、“DirectQuery”不适用于数据经常更新的情况D、在使用“DirectQuery”选项时,在每次查看数据时需要手动刷新数据答案:C157.对于在Windows10应用商店安装、更新与卸载软件的操作,下列说法错误的是()。A、可以通过【设置】窗口下的【应用】选项卸载应用B、在【我的资料库】中可以查看已经获得的应用C、通过Windows10应用商店安装的应用无法更新D、可以通过Windows10应用商店中的【集锦】选项按照类别快速查找并安装应用答案:C158.关于PowerBI(商业智能)中查询编辑器的默认联接种类是()。A、左外部连接B、整合连接C、右外部连接D、内连接答案:A159.在Excel中,TREND函数与FORECAST函数的主要作用是()。A、计算方差B、计算中位数C、计算样本标准差D、利用线性回归进行插值计算答案:D160.以下对于数据库实体联系(Entity-Relationship,E-R)模型基本概念描述正确的是()。A、每个实体的属性构成可以是不相同的B、属性的取值范围的限定被称为实体C、用于唯一确定或区分实体集中每一个实体的属性或属性组合称为实体码D、将同类实体的属性构成加以抽象可以得到属性型的概念答案:C161.以下对于Word中表格的边框与底纹设置的说法正确的是()。A、可以通过选中表格并在【插入】选项卡中进行边框样式选择B、在表格属性中可以设置表格边框显示的位置C、在表格属性中不能设置表格线的粗细D、在表格属性中可以设置边框与底纹答案:D162.在统计学中,以下关于中心极限定理相关内容描述正确的选项是()。A、中心极限定理指出了随着样本数的增大,样本均值分布曲线越来越接近均匀分布B、中心极限定理能否发挥作用,主要看样本量的大小C、中心极限定理指出了大量随机变量近似服从泊松分布的条件D、一般认为中心极限定理的标准定义的样本量n≥15时,样本量足够大答案:B163.关于自然语言处理技术中词频统计,以下描述错误的是()。A、词频统计是对某一些给定的词语在某文件中出现的次数进行统计B、词频统计是指将一个汉字序列切分成一个个单独的词的过程C、词频统计是文本分析的重要方法之一D、词频统计是文本挖掘的重要手段答案:B164.以下关于PowerBI(商业智能)自然语言查询,描述不正确的是()。A、PowerBI支持使用英文实现自然语言查询B、PowerBI不支持使用中文实现自然语言查询C、PowerBI支持使用日语实现自然语言查询D、PowerBI的在线版支持自然语言查询答案:C165.关于大数据处理面临的难题,下列描述错误的是()。A、数据体量过大B、维护成本昂贵C、响应速度慢D、并发读写量小答案:D166.以下关于客服机器人业务的目标说法错误的是()。A、了解用户的问题需要客服机器人准确知道用户问题的意图,若意图缺失,还需要与用户确认B、了解问题的解法需要客服机器人知道大部分业务问题的答案,能够在识别到用户意图之后给出解法C、解答用户的问题需要客服机器人提高回答客户问题的效率D、客服机器人的业务目标是了解用户的问题、了解问题的解法与解答用户的问题答案:C167.以下属于云存储优点的是()。A、易丢失B、分类存储C、易访问D、存储空间小答案:C168.下列不属于数据标注公共服务领域应用场景的是()。A、机器审核B、欺诈检测C、视频审核D、文本审核答案:B169.以下关于Windows10系统还原功能的操作描述错误的是()。A、不能使用U盘启动盘还原系统B、Ghost备份还原是以硬盘的扇区为单位进行的C、开启系统还原后,系统会定期自动创建还原点D、用户可以使用系统映像备份来还原系统答案:A170.在数据标注质量检验方法中,多重抽样检验方法辅助全样检验第一轮数据抽样检验存在不合格数据,则第二轮()。A、抽样检验中检验的标注数据量与第一轮相同B、抽样检验中检验的标注数据量较第一轮减少50%C、抽样检验中检验的标注数据量较第一轮增加75%D、抽样检验中检验的标注数据量较第一轮增加100%答案:D171.以下对道德的定义说法不正确的是()。A、人类的道德观念是受到宣传教育及社会舆论的长期影响而逐渐形成的B、道德是一种社会意识形态,它是人们共同生活及其行为的准则和规范C、道德观念是永恒不变的D、道德不是人类先天具备的答案:C172.下列属于数据标注常用的语音标注工具是()。A、Nuendo软件B、Labelbox软件C、Praat软件D、BRAT软件答案:C173.对于数据库备份的一般做法描述错误的是()。A、数据库备份一般备份在与数据库同一磁盘或同一文件夹目录下B、数据经常变化的数据库需要经常进行备份C、数据库可以在安全的情况下上传到云端备份D、数据库备份的重命名一般需要在文件名中添加日期答案:A174.下列属于数据标注常用的文本标注工具是()。A、BRAT软件B、NotePad软件C、LogViewer软件D、EmEditor软件答案:A175.下列关于数据标注质量全样检验方法的优缺点描述错误的是()。A、需要耗费大量人力精力集中进行B、能够对数据集做到无遗漏检验C、能够有效减少标注过程中重复错误的重复出现D、可以对数据集进行准确率评估答案:C176.对于业务数据采集流程以下说法正确的是()。A、Hive数据仓库工具属于实时数据采集流程步骤之一B、Tensorflow机器学习框架属于实时数据采集流程步骤之一C、日志文件属于离线数据采集流程步骤之一D、Ajax异步更新网页技术离线数据采集流程步骤之一答案:C177.在数据标注质量检验方法中,一般安排在数据标注任务完成交付前实施的质量检验方法是()。A、实时检验B、全样检验C、相互检验D、抽样检验答案:B178.数据预处理中的()是指构造新属性并添加到属性集的过程。A、数据规范化B、数据泛化C、属性构造D、数据平滑答案:C179.以下属于数据清洗中常见的重复数据处理方法的选项是()。A、孤立点分析B、消除C、数据补齐D、分箱答案:B180.以下关于客服机器人的评价维度中满意度和差评数的说法错误的是()。A、满意度衡量了客服机器人的服务满意度B、由于影响用户使用体验的因素很多,满意度无法直接指明问题所在C、多数客户只会在不满意时给出反馈,所以关注差评率更加客观D、满意度只能实施于会话维度答案:D181.一般认为上下左右边框与标注物最边缘像素点误差均要在()是图像标框标注的合格标准。A、0像素以内B、1像素以内C、2像素以内D、3像素以内答案:B182.下列关于多音字标注的质量标准相关内容描述正确的是()。A、多音字标注只要标注常用的几个读音,对于不常用的可以不标注B、多音字标注的审核不需要借助字典等专业性工具进行检验C、多音字标注需要标注一个字的全部读音,方言发音过多、复杂不考虑D、多音字标注需要标注一个字的全部读音,有时包括方言发音答案:D183.以下关于SQL(结构化查询语言)的相关操作,描述错误的选项是()。A、定义SQL索引的时候关键词DESC表示升序B、SQL的追加数据操作要遵守创建表格时的完整性约束C、使用SQL进行数据表更改与删除操作时务必小心谨慎D、SQL的更新操作不增加、减少表中的记录,而是更改记录的字段值答案:A184.在Windows10系统下常用的即时通讯软件不包括()。A、微信B、腾讯文档C、钉钉D、QQ答案:B185.诚实守信的具体要求不包括()。A、遵守合同与契约B、有意或无意地欺骗他人C、信守诺言和保守秘密D、遵守法律和法规答案:B186.在Excel中,以下不可以用来计数或条件计数的函数是()。A、COUNT函数B、RANK函数C、OUNTA函数D、COUNTIF函数答案:B解析:RANK是排名函数187.斯坦福大学教授李飞飞于2007年启动的()项目,加深了人们对人工智能领域的认知,数据对人工智能的重要性,从而推进了数据标注的发展。A、CityScapesB、COCOC、ImageNetD、ADE20K答案:C188.职业道德的作用不包括()。A、有助于提高全社会道德水平B、有助于企业形成行业领导地位C、规范约束职业内部人员的行为D、促进本行业发展答案:B189.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验第一阶段数据全样检验合格,则第二阶段()。A、质检员继续对标注员标注的数据进行全样检验B、质检员对数据进行抽样检验C、质检员对标注员标注数据的25%进行检验D、质检员对标注员标注数据的50%进行检验答案:B190.下列关于图像区域标注的质量检验标准相关内容描述错误的是()。A、图像中转折拐角的边缘像素点噪声最容易产生标注误差B、区域标注的难点在于对标注物的每一个边缘像素点都要进行检验C、图像中转折拐角的边缘像素点噪声最大,需要仔细进行检查D、区域标注像素点与标注物像素点误差要在4个像素以内答案:D解析:1给像素以内191.对于数据标注的基本流程说法不正确的是()。A、通过数据质检环节才算是真正完成了数据标注工作B、数据采集是整个数据标注基本流程的首要环节C、完成数据采集后,每一条数据都能够直接使用D、完成数据清洗后即可进入数据标注环节答案:C192.下列属于语义标注的检验方式的选项是()。A、针对语音数据中的音量进行检验B、针对语音数据中的语速进行检验C、针对上下文的情景环境进行检验D、针对语音数据中的声音频率进行检验答案:C193.下列关于数据库与数据仓库的区别描述错误的是()。A、数据仓库中的数据是企业一段时间的历史数据B、数据库中的数据与当前业务相关C、数据库就是数据仓库,数据仓库就是数据库,只是两者称呼不同D、数据库中的数据是经过整理并按分析主题重新组织起来的答案:C194.在数据仓库的组织方式中,()存储了过去的详细数据,反映真实的历史情况,老化的数据将进入该级别。A、当前细节级B、早期细节级C、高度综合级D、轻度综合级答案:B195.以下无法在典型的实时数据采集流程环节得到应用的是()。A、HDFS分布式文件系统B、Pytorch机器学习框架C、Socket通信技术和Ajax网页更新技术D、Flume分布式日志收集系统答案:B196.以下不属于数据预处理步骤的是()。A、数据归约B、数据标注C、数据清理D、数据变换答案:B197.下列处理方法中最适合处理词云图中干扰词的方法是()。A、进行命名实体标注B、手动去除干扰词C、进行词性分析D、使用停用词表过滤干扰词答案:D198.文本数据处理中,关于词性分析应用描述正确的选项是()。A、词性标注可应用在语音识别预处理B、词性分析可应用在分词结果筛选和过滤C、词性分析对英语文本和中文文本的分析分类结果是一致的D、词性分析只适合于英语,不适合中文领域答案:B199.以下关于微软edge浏览器操作的说法错误的是()。A、在搜索栏输入搜索文字可以弹出搜索建议B、在【高级设置】中可以更换默认搜索引擎C、使用InPrivate窗口可以无痕浏览网页D、微软edge浏览器不能创建超过4个标签页答案:D200.下列不属于文本标注需要注意的事项是()。A、严格的审核制度B、只能使用单一语言进行相关标注C、制定文本标注规则D、明确文本用途答案:B201.数据采集又称(),是指从各类数据库、机器设备、传感器等自动采集信息的过程。A、数据生成B、数据获取C、数据填充D、数据模拟答案:B202.以下关于语音智能客服机器人的说法正确的是()。A、语音智能客服机器人一般不支持随时打断的功能B、语音智能客服机器人只能替代客服回答专业性较高的提问C、语音智能客服机器人可以帮助企业提高服务效率D、语音智能客服机器人可以通过表情监测识别情绪变化答案:C203.数据仓库中基于清洗方式的“脏”数据质量问题可分为两类,即()。A、模式型“脏”数据与实例型“脏”数据B、规律型“脏”数据和随机型“脏”数据C、单峰型“脏”数据和长尾型“脏”数据D、独立型“脏”数据和依赖型“脏”数据答案:D204.以下关于Access数据库中数字类型的存储空间大小的说法错误的是()。A、单精度数字占用4个字节的存储空间B、双精度数字占用4个字节的存储空间C、长整型数字占用4个字节的存储空间D、整型数字占用2个字节的存储空间答案:B解析:单精度4字节,双精度8字节205.采集数据的质量可以从()、范围、可信性4个指标来衡量数据质量。A、及时性、关联度B、关联度、时效性C、唯一性、及时性D、时效性、完整性答案:B206.广义的数据资源涉及产生、()的整个过程。A、处理、传播、交换B、处理、传播、决策C、管理、传播、交换D、处理、存储、决策答案:A207.以下文件的扩展名与文件类型相匹配的是()。A、pdf便携式文件B、datCD音频文件C、xml可执行文件D、ra压缩文件答案:A208.数据仓库的特征不包括()。A、面向主题的B、随时间不断变化的C、集成的D、可以修改的答案:D209.在统计学中,对于正态分布曲线特征描述正确的是()。A、正态分布的众数小于中位数B、正态分布曲线被称为双峰曲线C、正态分布的众数等于均值D、正态分布的均值大于中位数答案:C210.以下不属于数据清洗中常见的异常值处理方法的选项是()。A、回归B、分箱C、孤立点分析D、特殊值填充答案:D解析:回归常见,特殊应该不常见吧211.下列不属于数据标注常用的语音处理工具的选项是()。A、GoldWave编辑软件B、Nuendo编辑软件C、Protools处理软件D、PalEdit编辑器答案:D212.以下不属于数据标注文本处理工具的是()。A、PilotEdit编辑器B、EmEditor编辑器C、JSONViewer编辑器D、Protools编辑器答案:D213.下列关于数据库的备份与恢复描述正确的是()。A、一般来说备份的数据库文件可以和当前数据库文件在同一磁盘上B、数据库备份是一次性的工作C、不能利用操作系统的文件复制功能将数据库文件复制到另一个位置存储D、数据库备份和恢复可以用于保护数据库中的关键数据答案:D214.在数据分析方法中,用于两个及两个以上样本均数差别的显著性检验的分析方法是()。A、方差分析B、回归分析C、关联分析D、因子分析答案:A解析:差别215.ETL(数据仓库技术)数据增量抽取方式包含全表比对方式、()、时间戳方式。A、触发器方式、日志表方式B、全量抽取方式、日志表方式C、全量抽取方式、全表比对方式D、日志表方式、数据迁移方式答案:A216.下列不属于数据标注应用领域的是()。A、金融领域B、公共服务领域C、建筑领域D、电子商务领域答案:C217.在Excel2019中制作Z值百分位表可使用()函数。A、NORMSDISTB、NORC、DISTD、AVERAGE函数E、MODE函数答案:A解析:EXCEL中的NORMDIST是指返回指定平均值和标准偏差的正态分布函数。218.下列关于数据仓库中ETL(数据仓库技术)的概念描述不正确的是()。A、ETL是实现商务智能(BI)的核心B、ETL用来描述将数据从源端经过抽取、转换、加载至目的端的过程C、ETL只能对单个源数据进行抽取D、ETL可以对多种结构的源数据进行抽取答案:C219.根据人工智能训练师国家职业标准,五级工不需要掌握()。A、对原始数据进行清洗和标注的方法B、数据分类与统计工具的使用C、数据采集工具的使用方法D、对标注后的数据进行审核的方法答案:D220.下列关于语音标注的质量标准描述正确的是()。A、标注与语音数据发音的时间轴尽量保持一致,控制误差值在4个语音帧内B、标注与发音速度需要控制在每秒小于或等于3个字C、标注与发音时间轴误差在1个语音帧以内D、标注与语音发音分贝数据控制在60分贝以内答案:C221.早期数据标注工作是由()完成。A、研究人工智能算法的工程师B、研究数据分析的工程师C、研究数据标注的工程师D、研究数据清洗的工程师答案:A222.在数据清洗转换方法中,()主要是将不同业务系统中的相同类型的数据进行统一。A、多数据源的合并B、数据粒度的转换C、不一致数据转换D、数据的商务规则计算答案:C223.在中文分词技术中,关于全模式分词的描述正确的选项是()。A、Jieba分词工厂的标记模式参数默认是全模式分词B、全模式分词不能解决歧义问题C、对于同一段文本,全模式分词处理比精确模式分词要慢D、全模式分词把文本中所有可能的词语都扫描处理且不存在冗余答案:B224.下列不属于自然语言处理技术在语音方面应用的选项是()。A、语法校对B、机器同声传译C、聊天机器人D、多媒体信息提取与文本转化答案:A225.以下不属于常用的数据分析方法是()。A、聚类分析B、相关分析C、方差分析D、实体关系分析答案:D226.在自然语言处理技术中,()的准确率已经成为评价一个分词系统好坏的重要标志之一。A、分词B、词性分析C、新词识别D、词频统计答案:C227.以下对于Word图片布局的说法正确的是()。A、浮于文字上方是将图片浮在文字上方但不会遮盖其他对象B、环绕型是将文字或其他对象环绕在图片周围C、嵌入型是将图片作为一个对象嵌入在一列中D、上下环绕型是将图片独占一列或多列,其他对象位于图片的左右侧答案:B228.下列不属于关联分析应用场景的是()。A、流量定量分析B、促销设计C、产品定位D、地质研究答案:A229.下列关于SQL(结构化查询语言)特点描述错误的是()。A、运算的对象和结果都是表B、高度过程化C、表达简单,使用词汇少D、具有较好移植性答案:B230.在数据库管理系统的基本功能中,数据的安全性和完整性检验、故障恢复和并发操作体现了数据库管理系统的()功能。A、数据库操作B、数据库运行控制C、数据库定义D、数据库维护答案:B231.数据库实体联系(Entity-Relationship,E-R)模型的构成要素是()。A、实体、属性、联系B、实体、操作、连接C、对象、控制、连接D、对象、实体、联系答案:A232.下列关于数据标注质量实时检验过程相关描述不恰当的是()。A、当标注员对标注存在疑问时可以由质检员进行现场沟通和指导B、质检员会对自己所在小组的标注员的标注习惯、标注速度、准确度进行现场实时检验C、标注员对分段数据开始标注时,质检员就可以对标注员进行实时检验D、需要标注的数据除了按照小组进行划分之外还要将每组需要标注的数据按照阶段进行划分答案:B233.下列关于回归分析和相关分析的区别描述不正确的是()。A、相关分析中所有的变量都必须是随机变量,回归分析中自变量必须是确定的B、回归分析侧重于研究随机变量间的依赖关系,相关分析侧重于发现随机变量间的种种相关特性C、相关分析中相关系数是确定的,回归分析中可以存在多个回归方程D、相关分析中需要对变量进行自变量与因变量划分,而回归分析中的变量关系是对等的答案:D234.在Excel2019中,下列不属于查找引用类函数的选项是()。A、MIN函数B、VLOOKUP函数C、INDIRECT函数D、OFFSET函数答案:A235.以下关于客服机器人的评价维度中解决率的说法错误的是()。A、解决率是由客服机器人解决问题的会话数占总有效会话数的比例B、解决率衡量了客服机器人接待能力C、解决率衡量了客服机器人的数据分析能力D、解决率=解决问题的会话数/总有效会话数答案:C236.当WHERE子句中的查询条件也含有查询语句时,该SQL语句属于()。A、基于单数据源的简单查询B、基于多数据源的连接查询C、嵌套子查询D、派生表查询答案:C237.如图所示的统计图的不适合在可视化()时使用。A、某商品在2023年销售总额的占比B、某商场各门店2023年的每个月营业额C、某商场各部门2023年每个月的业绩D、某商品2023年不同地区的销售额答案:A238.以下对于ETL(数据仓库技术)数据增量抽取方式描述正确的是()。A、触发器方式在增量抽取时逐条比对源表和目标表的记录,将新增或修改等变化的记录过滤读取出来B、全表比对方式在增量抽取时通过比较指定抽取时间与抽取源表的时间戳字段值决定要抽取的数据C、时间戳方式根据抽取要求在数据源表上建立插入、修改、删除3种触发器D、ETL的增量抽取是从增量日志中抽取,而不是直接在源表中抽取数据答案:D239.下列关于回归分析分类描述不正确的是()。A、按照涉及的变量多少,回归分析可分为一元回归分析和多元回归分析B、按照自变量的取值,回归分析可分为实数回归分析和虚数回归分析C、按照自变量和因变量之间的关系类型,回归分析可分为线性回归分析和非线性回归分析D、按照因变量的多少,回归分析可分为简单回归分析和多重回归分析答案:B240.以下关于Word的多级编号功能的说法正确的是()。A、普通文本在加上多级编号后不再是普通文本B、多级编号列表被定义后可以非常简便地固化样式C、文档中的各个级别的段落在复制到新文档,多级编号标题样式不会被带进新文档中D、在新建文档的样式中,即便是标题段落也不具备编号答案:B241.以下关于客服机器人的评价维度中最终结果触达率的说法正确的是()。A、最终结果触达率是反馈给用户的正确的结果数占反馈结果总数的比例B、最终结果触达率衡量了对话流程的流畅度C、最终结果触达率设计的目的是分析用户对于产品的感兴趣度D、最终结果触达率的指标含义是某一类任务的对话轮次的平均数答案:B242.下列关于数据库系统三级模式之间关系描述正确的是()。A、内模式是模式的部分抽取,模式表示物理级数据库B、模式表示物理级数据库,内模式表示概念级数据库C、模式表示概念级数据库,外模式是模式的部分抽取D、模式是内模式的物理实现,外模式是内模式的部分抽取答案:C243.下列属于需要了解语音标注相关概念分类正确的是()。A、振幅属于语音的基础概念B、声速属于语音的基础概念C、分贝属于声学的基础概念D、信噪比属于声学的基础概念答案:C244.在数据库设计过程中,最主要的工作是进行()。A、逻辑设计B、物理设计C、系统需求的调查与分析D、概念设计答案:C245.商用数据标注平台一般分为标注任务平台和系统管理平台两部分,()不属于系统管理平台。A、绩效管理B、标注任务列表C、流程管理D、资产管理答案:B246.图像区域标注的质量标准是根据()判定的。A、物体尺寸大小B、颜色饱和度C、像素点D、图像对比度答案:C247.在Excel2019中,离散趋势分析可使用()进行数据组的四分位数计算。A、MEDIAN函数B、QUARTILC、EXC函数D、STDEE、P函数F、STDEG、S函数答案:B248.在ETL(数据仓库技术)中,数据需要从源端经过()至目的端。A、抽取、转换、加载B、转换、抽取、加载C、加载、转换、抽取D、转换、加载、抽取答案:A249.以下不属于数据标注质量检验方法的是()。A、实时检验B、间接检验C、抽样检验D、全样检验答案:B250.下列关于大规模结构化数据存储的描述不正确的是____。A、可实现对PB量级的存储和管理B、ERP(企业资源计划)和HIS(医院信息系统)数据库都是结构化数据存储C、MPP可以用来管理计算高质量的结构化数据D、设计时尤其要注意存储特性和规模,一旦设计完成很难进一步扩展答案:D251.图像区域标注质量检验中需要特别注意的是()。A、检验标框贴合程度B、检验转折拐角C、检验图片像素D、检验尺寸大小答案:B252.下列属于常用视频基本属性术语的选项是()。A、时基B、信噪比C、信息熵D、保真度答案:A解析:时基,时间显示的基本单位253.在Kettle(数据仓库技术)软件中,获取文本数据可采用的数据抽取方法是()。A、CSV文件抽取B、HTML网页抽取C、XML文件抽取D、JSON文件抽取答案:A254.一般的数据清洗策略分类中,通过人工直接修改“脏”数据的策略是()。A、自动清洗策略B、特定应用领域的清洗策略C、与特定应用领域无关的清洗策略D、手工清洗策略答案:D255.以下关于专利的申请程序相关规定的说法错误的是()。A、国务院专利行政部门收到专利申请文件之日为申请日,如果申请文件是邮寄的,以寄出的邮戳日为申请日B、申请人申请发明、实用新型专利优先权的,应当在第一次提出申请之日起三个月内,提交第一次提出的专利申请文件的副本C、申请外观设计专利的,应当提交请求书、该外观设计的图片或者照片以及对该外观设计的简要说明等文件D、申请发明专利的请求书应当写明发明或者实用新型的名称,发明人的姓名,申请人姓名或者名称、地址,以及其他事项答案:B解析:B十二个月内256.下列不属于商业智能(BI)操作步骤的是()。A、Dashboard整合B、数据标注C、数据关联D、数据清洗答案:B257.数据转换是数据清洗过程的重要步骤之一,它的主要任务是进行不一致数据转换、()及一些商务规则的计算。A、缺失数据的转换B、异常数据的转换C、复杂数据的转换D、数据粒度的转换答案:D258.下列关于语音合成描述错误的是()。A、语音合成是从文本转换为语音的过程B、语音合成的英文简拼为ASRC、语音合成广泛应用在电话机器人上D、语音合成最主要的指标是自然度答案:B解析:语音合成的英文简拼为TTS259.下列属于数据标注常用的图像标注工具是()。A、PalEdit软件B、LabelImg软件C、YEDDA软件D、Photoshop软件答案:B260.在数据集的划分中,()是用来测试模型的实际学习能力的,测试集用来查看训练效果的。A、验证集B、训练集C、分析集D、测试集答案:D261.以下不属于数据清洗中的空缺值处理方法的选项是()。A、回归B、数据补齐C、不处理D、忽略元组答案:A262.在数据分析方法中,可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系的分析方法是()。A、方差分析B、回归分析C、关联分析D、因子分析答案:C263.数据仓库工具集主要由一些分析工具组成,包括()。A、OLTP联机事务处理工具、智能分析工具、检索查询工具B、检索查询工具、仿真软件、多维数据的OLAP联机分析处理工具C、OLTP联机事务处理工具、检索查询工具、统计分析及数据挖掘工具D、多维数据的OLAP联机分析处理工具、检索查询工具、统计分析及数据挖掘工具答案:D264.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验的操作方法错误的是()。A、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验不合格,第三阶段继续为抽样检验B、标注员第一阶段数据全样检验不合格,第二阶段转换为全样检验合格,第三阶段继续为抽样检验C、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验合格,第三阶段继续为抽样检验D、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验不合格,第三阶段继续为全样检验答案:A265.在统计学中,如果分布曲线的峰值低于标准的正态分布,我们称之为()。A、单峰分布B、高峰分布C、双峰分布D、平峰分布答案:D266.以下对于Excel基本操作的说法正确的是()。A、Excel单元格的缺省字体中文为“黑体”,英文为“Arial等线体”B、Excel可以通过数据分列设置单元格的数字格式C、可以右键单元格区域选择【设置单元格格式】通过【对齐】选项卡设置合并单元格D、可以右键单元格区域通过【字体】选项卡设置单元格自动换行答案:C267.描述两个变量关系的散点图有时可以做出近似直线,当该直线从左下向右上方倾斜时,则称两个变量()。A、弱相关B、不相关C、正相关D、负相关答案:C268.在Excel2019中,返回某个数值在一个数据集中的百分比排位并且百分比值范围不包括0和1的函数是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论