五级人工智能训练师(初级)职业技能等级认定考试题库(含答案)_第1页
五级人工智能训练师(初级)职业技能等级认定考试题库(含答案)_第2页
五级人工智能训练师(初级)职业技能等级认定考试题库(含答案)_第3页
五级人工智能训练师(初级)职业技能等级认定考试题库(含答案)_第4页
五级人工智能训练师(初级)职业技能等级认定考试题库(含答案)_第5页
已阅读5页,还剩131页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE1五级人工智能训练师(初级)职业技能等级认定考试题库(含答案)一、单选题1.下列关于大规模结构化数据存储的描述不正确的是()。A、可实现对PB量级的存储和管理B、ERP(企业资源计划)和HIS(医院信息系统)数据库都是结构化数据存储C、MPP可以用来管理计算高质量的结构化数据D、设计时尤其要注意存储特性和规模,一旦设计完成很难进一步扩展答案:D2.以下关于自然语言处理相关描述不正确的选项是()。A、自然语言处理的研究目的是实现自然语言通信的计算机系统B、自然语言处理是计算机科学领域与人工智能领域中的一个重要方向C、自然语言处理是一门机械工程学、计算机科学、数学于一体的科学D、自然语言处理研究的是人与计算机之间用自然语言进行有效沟通的各种理论和方法答案:C3.下列关于数据库的备份与恢复描述正确的是()。A、一般来说备份的数据库文件可以和当前数据库文件在同一磁盘上B、数据库备份是一次性的工作C、不能利用操作系统的文件复制功能将数据库文件复制到另一个位置存储D、数据库备份和恢复可以用于保护数据库中的关键数据答案:D4.以下对于Windows10常用系统维护工具使用的说法正确的是()。A、【事件查看器】可以查看当前系统正在运行的应用、进程与服务B、【资源监视器】可以查看系统稳定性变化趋势C、【任务管理器】可以管理开机启动项D、【任务管理器】可以浏览与管理系统日志答案:C5.数据仓库中的数据通常采用分级的方式进行组织,一般包括()、轻度综合级、高度综合级、元数据5个部分。A、中度综合级、当前细节级B、早期细节级、低度综合级C、低度综合级、高度细节级D、早期细节级、当前细节级答案:D6.下列关于自然语言处理中的停用词相关内容描述恰当的选项是()。A、一个明确的停用词表适用于所有工具B、停用词指的是目前已经不再使用的词语C、停用词都是机器智能输入、自动化生成的D、通常意义上,停用词可分为功能词和词汇词两类答案:D7.道德的功能不包括()。A、认识功能B、进化功能C、调节功能D、评价功能答案:B8.当WHERE子句中的查询条件也含有查询语句时,该SQL语句属于()。A、基于单数据源的简单查询B、基于多数据源的连接查询C、嵌套子查询D、派生表查询答案:C9.如图所示的统计图的可以用于()。A、展示数据的聚类分析结果B、展示公司年度各项支出额度C、比较多组数据随时间变化的趋势D、展示两组数据之间的变化关系答案:B10.对于空缺值、异常值与重复值的处理方法,以下说法错误的是()。A、孤立点分析属于数据清洗中的异常值处理方法B、重复数据检测主要分为基于字段和基于记录的重复检测C、回归是数据清洗中的空缺值处理方法之一D、合并或消除是处理重复数据的基本方法答案:C11.在数据仓库的组织方式中,()存储了过去的详细数据,反映真实的历史情况,老化的数据将进入该级别。A、当前细节级B、早期细节级C、高度综合级D、轻度综合级答案:B12.下列关于大数据处理面临的难题描述正确的是()。A、传统的结构化存储模式可以满足种类各异的多源异构数据的存储需求B、所有的数据挖掘计划都能得到理想的结果C、集中式数据存储与处理需要使用配置相当高的硬件保障数据处理性能导致投入及运维成本很高D、传统的信息管理系统面对不断增长的数据量和动态数据使用场景在速度响应方面可以满足要求答案:C13.文本数据处理中,关于词性分析应用描述正确的选项是()。A、词性标注可应用在语音识别预处理B、词性分析可应用在分词结果筛选和过滤C、词性分析对英语文本和中文文本的分析分类结果是一致的D、词性分析只适合于英语,不适合中文领域答案:B14.数据采集时,应当注意的事项包含:()、采集质量。A、深度理解、及时沟通B、深度理解、建立采集规范C、建立规范、及时去重D、及时沟通、及时去重答案:A15.下列关于语音标注的质量标准描述正确的是()。A、标注与语音数据发音的时间轴尽量保持一致,控制误差值在4个语音帧内B、标注与发音速度需要控制在每秒小于或等于3个字C、标注与发音时间轴误差在1个语音帧以内D、标注与语音发音分贝数据控制在60分贝以内答案:C16.以下文件的扩展名与文件类型不匹配的是()。A、mpeg运动图像格式文件B、flvFlash视频文件C、exe可执行文件D、cmAutoCAD格式文件答案:D17.以下关于Windows10文件管理器的基本操作描述错误的是()。A、文件资源管理器可以对文件搜索结果进行保存B、文件资源管理器可以对文件按照名称进行分组C、在文件资源管理器窗口按Ctrl+A可以删除文件或文件夹D、在文件资源管理器窗口按Ctrl+Shift+N键可以快速创建新文件夹答案:C18.以下不属于常用的数据分析方法是()。A、聚类分析B、相关分析C、方差分析D、实体关系分析答案:D19.以下关于Windows10常用输入法基本设置操作的说法错误的是()。A、Windows10可以安装第三方输入法B、Windows10默认系统自带输入法没有微软五笔C、Windows10可以对输入法进行外观设置D、Windows10可以设置启用模糊拼音答案:B20.爱岗敬业的具体要求不包括()。A、树立职业理想B、积极进行创新C、消极怠工D、强化职业责任答案:C21.下列属于常用视频基本属性术语的选项是()。A、时基B、信噪比C、信息熵D、保真度答案:A解析:时基,时间显示的基本单位22.数据仓库中基于清洗方式的“脏”数据质量问题可分为两类,即()。A、模式型“脏”数据与实例型“脏”数据B、规律型“脏”数据和随机型“脏”数据C、单峰型“脏”数据和长尾型“脏”数据D、独立型“脏”数据和依赖型“脏”数据答案:D23.下列有关字符编码和二进制编码的描述正确的是()。A、字符编码的可读性相比二进制编码更强B、二进制编码文件可以使用记事本浏览C、二进制编码在不同应用程序中有不同的编码方式D、二进制编码文件译码相比字符编码更容易答案:A24.下列不属于ETL(数据仓库技术)常用的数据加载方法是()。A、旁路加载B、全量加载C、增量加载D、批量加载答案:A25.以下关于客服机器人业务的目标说法错误的是()。A、了解用户的问题需要客服机器人准确知道用户问题的意图,若意图缺失,还需要与用户确认B、了解问题的解法需要客服机器人知道大部分业务问题的答案,能够在识别到用户意图之后给出解法C、解答用户的问题需要客服机器人提高回答客户问题的效率D、客服机器人的业务目标是了解用户的问题、了解问题的解法与解答用户的问题答案:C26.以下不属于电话机器人的优势的选项是()。A、相比电销人员可以快速学习营销话术B、可以通过表情监测识别情绪变化并改变沟通方式C、提高拨打电话效率D、可以快速采集大量数据用于数据分析答案:B27.在Windows10系统下常用的即时通讯软件不包括()。A、微信B、腾讯文档C、钉钉D、QQ答案:B28.以下对于各类数据分析方法描述错误的是()。A、相关分析可以分析多个随机变量之间的相关关系,关联分析可以分析同一变量的各个类别之间的差异B、回归分析可以确定多个变量的定量关系C、聚类分析是将数据分到不同的簇过程,同簇中对象有很高相异性,不同簇对象有很大相似性D、方差分析可以根据试验结果找出具有显著作用的因素,因子分析可以查找出隐藏且具有代表性的因子答案:C解析:聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。29.下列不属于数据标注常用的语音处理工具的选项是()。A、GoldWave编辑软件B、Nuendo编辑软件C、Protools处理软件D、PalEdit编辑器答案:D30.对于数据库备份的一般做法描述错误的是()。A、数据库备份一般备份在与数据库同一磁盘或同一文件夹目录下B、数据经常变化的数据库需要经常进行备份C、数据库可以在安全的情况下上传到云端备份D、数据库备份的重命名一般需要在文件名中添加日期答案:A31.以下对Windows10文件资源管理器文件夹选项操作描述正确的是()。A、默认情况下文件资源管理器左侧有【用户文件夹】项目B、默认情况下文件资源管理器左侧有【回收站】项目C、在Windows10中,文件资源管理器默认打开【快速访问】窗口D、可以通过访问【文件夹选项】选项下的【搜索】选项卡设置“显示所有文件夹”答案:C32.下列关于回归分析分类描述不正确的是()。A、按照涉及的变量多少,回归分析可分为一元回归分析和多元回归分析B、按照自变量的取值,回归分析可分为实数回归分析和虚数回归分析C、按照自变量和因变量之间的关系类型,回归分析可分为线性回归分析和非线性回归分析D、按照因变量的多少,回归分析可分为简单回归分析和多重回归分析答案:B33.以下属于数据清洗中常见的重复数据处理方法的选项是()。A、孤立点分析B、消除C、数据补齐D、分箱答案:B34.在Excel中,TRIMMEAN函数的作用是()。A、按单个条件计算平均值B、计算算术平均值C、按多个条件计算平均值D、计算内部平均值(修剪平均值)答案:D35.在Excel2019中,()可以用来生成随机数且需要输入参数。A、RAND函数B、MATCH函数C、RANDBETWEEN函数D、RANK函数答案:C36.下列属于数据标注质量检验方法的是()。A、随机检验B、定时检验C、相互检验D、实时检验答案:D37.数据仓库工具集主要由一些分析工具组成,包括()。A、OLTP联机事务处理工具、智能分析工具、检索查询工具B、检索查询工具、仿真软件、多维数据的OLAP联机分析处理工具C、OLTP联机事务处理工具、检索查询工具、统计分析及数据挖掘工具D、多维数据的OLAP联机分析处理工具、检索查询工具、统计分析及数据挖掘工具答案:D38.以下关于Windows10“计算器”应用的操作的说法正确的是()。A、Windows10“计算器”应用无法查看计算的历史记录B、Windows10“计算器”应用只有“标准”和“科学”两种模式C、Windows10“计算器”应用不能进行时间与速度的换算D、单击C按钮可以清除当前运算答案:D39.下列属于常见的位图图像格式的是()。A、XML格式B、SVG格式C、JPG格式D、MP4格式答案:C40.下列不属于数据标注公共服务领域应用场景的是()。A、机器审核B、欺诈检测C、视频审核D、文本审核答案:B41.下列属于常见的数据标注结果文件格式的是()。A、xls格式B、doc格式C、ra格式D、XML格式答案:D42.数据清洗的基本流程中纠正发现的错误的操作不包括()。A、确认并改B、属性分离C、定义数据清洗策略D、标准化答案:C43.关系模型中最重要的概念是关系,下列关于关系的特点描述错误的是()。A、关系中的每一列属性都是同质的,即每个元组的该属性的取值都来自同一个域B、关系中的一列称为关系的一个属性,一行称为关系的一个元组C、一个关系中存放的另一个关系的主键称为外键D、元组的个数称为关系的度数或目数答案:D44.以下关于SQL(结构化查询语言)的相关操作,描述错误的选项是()。A、定义SQL索引的时候关键词DESC表示升序B、SQL的追加数据操作要遵守创建表格时的完整性约束C、使用SQL进行数据表更改与删除操作时务必小心谨慎D、SQL的更新操作不增加、减少表中的记录,而是更改记录的字段值答案:A45.在Excel中,()可以完成多区间的判断。A、COUNT函数B、RANK函数C、IFS函数D、MATCH函数答案:C46.对于常用的Excel函数,以下说法正确的是()。A、MOD函数用于获取最大值B、ROUND函数用于将数字四舍五入到指定位数C、SNGL函数可以直接计算众数并且当存在多个众数时可以返回多个结果D、TREND函数用于计算相关系数答案:B47.下列属于数据标注质量检验方法的是()。A、定时检验B、抽样检验C、定量检验D、间接检验答案:B48.()不属于数据清洗的基本流程中搜寻并确定错误实例的检测方法。A、基于统计的方法B、均值填充方法C、聚类方法D、关联规则方法答案:B49.ETL(数据仓库技术)数据增量抽取方式包含全表比对方式、()、时间戳方式。A、触发器方式、日志表方式B、全量抽取方式、日志表方式C、全量抽取方式、全表比对方式D、日志表方式、数据迁移方式答案:A50.以下对于系统蓝屏可能的原因与解决方法说法错误的是()。A、一些计算机病毒会导致系统蓝屏,可以使用杀毒软件进行杀毒B、在硬件问题上可以检查硬件是否插牢与是否出现氧化现象C、系统蓝屏可以基本排除BIOS的问题D、某些硬件驱动不兼容也会发生蓝屏错误,此时应进入安全模式将其禁用并安装兼容的硬件驱动答案:C51.以下对于Word中表格的边框与底纹设置的说法正确的是()。A、可以通过选中表格并在【插入】选项卡中进行边框样式选择B、在表格属性中可以设置表格边框显示的位置C、在表格属性中不能设置表格线的粗细D、在表格属性中可以设置边框与底纹答案:D52.采集到的数据要进行质量检查,同时也要注意数据采集的()和数据质量。A、可解释度B、价值密度C、完整性D、时效性答案:D53.以下不属于数据清洗中常见的异常值处理方法的选项是()。A、回归B、分箱C、孤立点分析D、特殊值填充答案:D解析:回归常见,特殊应该不常见吧54.以下关于Windows10文件管理器的基本操作描述正确的是()。A、在文件资源管理器中选择【共享】选项卡可以在布局组中选择所需的视图B、使用Windows+E键可以快速打开文件资源管理器C、在打开文件资源管理器时默认打开【此电脑】窗口D、Ctrl+Y快捷键可以用于删除文件答案:B55.以下关于客服机器人的评价维度中解决率的说法错误的是()。A、解决率是由客服机器人解决问题的会话数占总有效会话数的比例B、解决率衡量了客服机器人接待能力C、解决率衡量了客服机器人的数据分析能力D、解决率=解决问题的会话数/总有效会话数答案:C56.()的道德准则强调避免伤害或侵犯他人权利。A、诚实与诚信B、肩负个人责任C、保证公共利益D、自由和尊重个人权利答案:D57.描述两个变量关系的散点图有时可以做出近似直线,当该直线从左下向右上方倾斜时,则称两个变量()。A、弱相关B、不相关C、正相关D、负相关答案:C58.图像区域标注质量检验中需要特别注意的是()。A、检验标框贴合程度B、检验转折拐角C、检验图片像素D、检验尺寸大小答案:B59.下列数据库实体联系(Entity-Relationship,E-R)模型向关系模型的转化叙述正确的是()。A、1:n的联系必须与联系的任意一端实体所对应的关系模式合并B、1:1的联系可以单独成为一个关系模式C、m:n的连续可以与任何一方实体合并D、实体联系模型中的联系可以直接被DBMS(数据库管理系统)支持和执行答案:B60.非结构化数据可以使用()进行存储。A、结构化数据库B、多结构化数据库C、非结构化数据库D、半结构化数据库答案:C61.以下不属于自然语言处理技术中中文分词切分歧义类型的选项是()。A、嵌套型歧义B、交集型歧义C、混合型歧义D、组合型歧义答案:A62.以下对于网络运营者办理入网手续时的要求的说法错误的是()。A、网络运营者为用户提供即时通讯服务不需要用户提供身份信息B、网络运营需要对用户身份信息进行审核C、用户不提供真实身份信息的,网络运营者不得为其提供相关服务D、网络运营者办理入网手续时需要用户提供真实身份信息答案:A63.一般的数据清洗策略分类中,通过人工直接修改“脏”数据的策略是()。A、自动清洗策略B、特定应用领域的清洗策略C、与特定应用领域无关的清洗策略D、手工清洗策略答案:D64.数据清洗的基本流程一共分为5个步骤,下列不属于数据清洗步骤的是()。A、数据分析B、数据合并C、干净数据回流D、定义数据清洗策略与规则答案:B65.在统计学中,如果分布曲线的峰值低于标准的正态分布,我们称之为()。A、单峰分布B、高峰分布C、双峰分布D、平峰分布答案:D66.下列关于词云图的优点描述不正确的是()。A、用途范围单一B、突出文本主旨C、过滤低频文本信息D、提炼关键信息答案:A67.根据人工智能训练师国家职业标准,五级工不需要掌握()。A、对原始数据进行清洗和标注的方法B、数据分类与统计工具的使用C、数据采集工具的使用方法D、对标注后的数据进行审核的方法答案:D68.数据标注的工作特点是由()所决定的。A、数据标注员的标注习惯B、数据标注项目的特点C、数据标注项目的周期D、数据标注项目的进度答案:B69.在Excel2019中,离散趋势分析可使用()进行数据组的四分位数计算。A、MEDIAN函数B、QUARTILC、EXC函数D、STDEE、P函数F、STDEG、S函数答案:B70.下列属于数据标注图像处理工具的是()。A、EditPlus处理软件B、GoldWave处理软件C、BitEdit处理软件D、Protools处理软件答案:C71.下列不属于商业智能(BI)操作步骤的是()。A、Dashboard整合B、数据标注C、数据关联D、数据清洗答案:B72.诚实守信的具体要求不包括()。A、遵守合同与契约B、有意或无意地欺骗他人C、信守诺言和保守秘密D、遵守法律和法规答案:B73.在Office快捷键操作中,撤销上一步操作的快捷键是()。A、Ctrl+空格B、Ctrl+QC、trl+ZD、Ctrl+X答案:C74.下列关于SQL(结构化查询语言)特点描述错误的是()。A、运算的对象和结果都是表B、高度过程化C、表达简单,使用词汇少D、具有较好移植性答案:B75.以下过程不属于数据资源生命周期管理的是()。A、数据获取B、数据利用C、数据加工D、数据决策答案:D76.对于常用的Excel函数,以下说法错误的是()。A、SUMIF函数用于多条件求和B、COUNTIFS用于多条件计数C、AVERAGEIFS用于多条件计算平均值D、LARGE函数用于计算第K个最大值答案:A解析:A范围内求和77.以下关于Windows10网络基本设置方法的说法正确的是()。A、一般情况下设置电脑的IP只需要设置IPv4协议版本的地址B、Windows10可以通过【时钟与区域】功能设置IP地址与DNS地址C、Windows10只能手动设置IP地址D、Windows10只能手动设置DNS地址答案:A78.以下关于Windows10网络基本设置方法的说法错误的是()。A、Windows10可以通过桌面任务栏右下角的wifi图标连接无线网络B、Windows10可以通过【更改适配器选项】按钮设置IP地址与DNS地址C、在连接无线网络后可在浏览器登录路由器管理界面修改连接无线网络的密码D、Windows10必须要手动为电脑分配IP地址答案:D79.在Excel中,使用()可以直接计算众数并且只返回一个结果。A、MODB、SNGL函数C、MATCH函数D、MULT函数E、ROUND函数答案:A80.一般的数据清洗策略分类中,根据概率统计学原理检测并修改数值异常的记录的数据清洗策略是()。A、与特定应用领域无关的清洗策略B、手工清洗策略C、特定应用领域的清洗策略D、自动清洗策略答案:C81.下列不属于文本标注需要注意的事项是()。A、严格的审核制度B、只能使用单一语言进行相关标注C、充分了解语言学D、迭代式标注答案:B82.在数据标注基本概念中,数据标注工具按照自动化程度不同可分为()。A、语音标注工具、文本标注工具、图像标注工具B、客户端标注工具、网页端标注工具C、手动标注工具、半自动标注工具、自动标注工具D、区域标注工具、拉框标注工具、分类标注工具答案:C解析:自动化程度83.下列关于数据标注质量全样检验方法的描述错误的是()。A、全样检验不合格的数据需要标注员进行返工改正B、数据标注质量全样检验方法需要耗费大量的人力精力集中进行C、完成全样检验后,质检员需要将标注有问题的数据移交给标注员D、数据标注质量全样检验在数据标注任务完成交付前可以不做答案:D84.以下关于PowerBI(商业智能)自然语言查询,描述不正确的是()。A、PowerBI支持使用英文实现自然语言查询B、PowerBI不支持使用中文实现自然语言查询C、PowerBI支持使用日语实现自然语言查询D、PowerBI的在线版支持自然语言查询答案:C85.作为管理资源的数据资源不仅限于数据本身,还包括用以()、存储和使用数据的资源。A、输出、决策B、处理、加工C、加工、决策D、产生、加工答案:D86.下列关于数据库系统三级模式之间关系描述正确的是()。A、内模式是模式的部分抽取,模式表示物理级数据库B、模式表示物理级数据库,内模式表示概念级数据库C、模式表示概念级数据库,外模式是模式的部分抽取D、模式是内模式的物理实现,外模式是内模式的部分抽取答案:C87.在统计学中,集中趋势最常见的三种形式是()。A、均值、中位数和众数B、方差、中位数和四分位数C、均值、标准差和方差D、众数、极差和四分位数答案:A88.以下关于Access数据库中数字类型的存储空间大小的说法错误的是()。A、单精度数字占用4个字节的存储空间B、双精度数字占用4个字节的存储空间C、长整型数字占用4个字节的存储空间D、整型数字占用2个字节的存储空间答案:B解析:单精度4字节,双精度8字节89.下列关于数据库与数据仓库的区别描述错误的是()。A、数据仓库中的数据是企业一段时间的历史数据B、数据库中的数据与当前业务相关C、数据库就是数据仓库,数据仓库就是数据库,只是两者称呼不同D、数据库中的数据是经过整理并按分析主题重新组织起来的答案:C90.以下关于SQL(结构化查询语言)的相关操作,描述正确的选项是()。A、UPDATEXXXSETXXX的SQL操作可以实现数据库字段的追加功能B、在SQL中,DELETE关键字被用在删除表中的数据记录的语句中C、定义SQL索引的时候关键词ASC表示降序D、INSERTINTOXXXVALUESXXX操作是用来实现数据库字段的更新功能答案:B91.关于劳动合同无效的条件与情况,以下说法错误的是()。A、违反法律与行政法规订立的劳动合同无效B、劳动合同的无效应由劳动争议仲裁委员会或者人民法院确认C、全部无效的劳动合同,从订立的时候起仍具有部分法律约束力D、采取欺诈威胁等手段订立的劳动合同无效答案:C92.在ETL(数据仓库技术)中,数据需要从源端经过()至目的端。A、抽取、转换、加载B、转换、抽取、加载C、加载、转换、抽取D、转换、加载、抽取答案:A93.数据库实体联系(Entity-Relationship,E-R)模型需要转化为()才能被数据库管理系统所支持。A、物理结构B、逻辑模型C、外模式D、关系模型答案:D94.以下属于传统桌面数据库系统的选项是()。A、Objectstore数据库系统B、FoxPro数据库系统C、SQLServer数据库系统D、B2数据库系统答案:B95.获取数据、有效地利用数据、在适当的时候废弃过时数据的整个活动过程称之为()。A、数据资源决策B、数据资源管理C、数据资源传播D、数据资源输出答案:B96.下列关于聚类和分类相关内容描述错误的是()。A、分类要求划分的类别是已知的B、聚类的结果是确定的C、分类是有监督的学习D、聚类是无监督的学习答案:B97.在关系数据模型三要素中,()表明了该模型中的数据的组织和表示方式。A、数据通信B、数据约束C、数据结构D、数据操作答案:C98.在数据清洗转换方法中,()主要是将不同业务系统中的相同类型的数据进行统一。A、多数据源的合并B、数据粒度的转换C、不一致数据转换D、数据的商务规则计算答案:C99.以下关于Windows10“照片”应用的操作的说法错误的是()。A、“照片”应用无法将图片合成视频B、“照片”应用可以通过文件夹导入图片C、“照片”应用可以对图片进行编辑美化D、“照片”应用可以根据关键词搜索图片答案:A100.面向主题的、集成的、不可更改的、随时间不断变换的数据集合我们称之为()。A、数据库B、数据仓库C、数据资源D、数据中心答案:B101.下列不属于常见的图像数据标注类型的是()。A、多边形拉框B、OCR文本识别C、语义分割D、语音转写标注答案:D102.在Excel2019中制作Z值百分位表可使用()函数。A、NORMSDISTB、NORC、DISTD、AVERAGE函数E、MODE函数答案:A解析:EXCEL中的NORMDIST是指返回指定平均值和标准偏差的正态分布函数。103.在Excel中生成直方图,如果一组数据的最小值是20,最大值是500,组距为16,组数就是()。A、5B、10C、20D、30答案:D104.下列关于数据仓库管理层的功能描述错误的是()。A、完成数据库的定义B、完成数据的归档、备份、维护、恢复C、完成数据的抽取、转换、装载D、元数据的管理答案:A105.以下对于ETL(数据仓库技术)增量加载与全量加载区别说法正确的是()。A、全量加载能够将业务系统中的变化数据按一定的频率准确地捕获并加载到目标表中B、全量加载不会对业务系统造成太大的压力C、增量加载相比全量加载技术实现更简单D、增量加载不会影响现有业务答案:D106.下列属于数据仓库的主要分析工具的是()。A、检索查询工具B、数据仿真工具C、OLAP脱机分析处理工具D、数据清洗工具答案:A107.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法正确的是()。A、在使用“导入”模式时总能看到最新的数据B、PowerBI在使用“导入”模式时需要保持与数据库连接C、“DirectQuery”不适用于数据经常更新的情况D、在使用“DirectQuery”选项时,在每次查看数据时需要手动刷新数据答案:C108.DB2数据库系统属于()。A、传统的桌面数据库系统B、面向对象数据库系统C、流行的关系数据库系统D、其他数据源答案:C109.在数据分析方法中,可以揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系的分析方法是()。A、方差分析B、回归分析C、关联分析D、因子分析答案:C110.斯坦福大学教授李飞飞于2007年启动的()项目,加深了人们对人工智能领域的认知,数据对人工智能的重要性,从而推进了数据标注的发展。A、CityScapesB、COCOC、ImageNetD、ADE20K答案:C111.以下对于Excel基本操作的说法正确的是()。A、Excel单元格的缺省字体中文为“黑体”,英文为“Arial等线体”B、Excel可以通过数据分列设置单元格的数字格式C、可以右键单元格区域选择【设置单元格格式】通过【对齐】选项卡设置合并单元格D、可以右键单元格区域通过【字体】选项卡设置单元格自动换行答案:C112.在数据集的划分中,()是用来测试模型的实际学习能力的,测试集用来查看训练效果的。A、验证集B、训练集C、分析集D、测试集答案:D113.关于PowerBI(商业智能)中查询编辑器的默认联接种类是()。A、左外部连接B、整合连接C、右外部连接D、内连接答案:A114.以下关于Word的操作的说法错误的是()。A、Word可以通过【段落】选项进行字体设置B、Ctrl+E可以将段落进行中间对齐C、Word可以通过水平标尺的调整调节段落文字的缩进D、Word可以通过【插入】选项卡下的【符号】选项插入特殊符号答案:A115.下列属于数据标注常用的图像标注工具是()。A、PalEdit软件B、LabelImg软件C、YEDDA软件D、Photoshop软件答案:B116.()不是数据标注的正确流程中数据质检的常用方法。A、随机验证B、多人验证C、埋题验证D、标注人员状态验证答案:A117.数据仓库的数据质量评价指标主要包括数据的准确性、()、适用性。A、多样性、完整性B、完整性、简洁性C、特殊性、简洁性D、复杂性、唯一性A答案:B118.下列关于多音字标注的质量标准相关内容描述正确的是()。A、多音字标注只要标注常用的几个读音,对于不常用的可以不标注B、多音字标注的审核不需要借助字典等专业性工具进行检验C、多音字标注需要标注一个字的全部读音,方言发音过多、复杂不考虑D、多音字标注需要标注一个字的全部读音,有时包括方言发音答案:D119.以下关于微软edge浏览器操作的说法错误的是()。A、在搜索栏输入搜索文字可以弹出搜索建议B、在【高级设置】中可以更换默认搜索引擎C、使用InPrivate窗口可以无痕浏览网页D、微软edge浏览器不能创建超过4个标签页答案:D120.()是数据采集的主要来源之一。A、数据填充B、机器生成C、模拟仿真D、页面表单数据答案:B121.下列不属于自然语言处理技术在语音方面应用的选项是()。A、语法校对B、机器同声传译C、聊天机器人D、多媒体信息提取与文本转化答案:A122.在统计学中,以下关于中心极限定理相关内容描述正确的选项是()。A、中心极限定理指出了随着样本数的增大,样本均值分布曲线越来越接近均匀分布B、中心极限定理能否发挥作用,主要看样本量的大小C、中心极限定理指出了大量随机变量近似服从泊松分布的条件D、一般认为中心极限定理的标准定义的样本量n≥15时,样本量足够大答案:B123.下列属于需要了解语音标注相关概念分类正确的是()。A、振幅属于语音的基础概念B、声速属于语音的基础概念C、分贝属于声学的基础概念D、信噪比属于声学的基础概念答案:C124.下列关于回归分析和相关分析的区别描述不正确的是()。A、相关分析中所有的变量都必须是随机变量,回归分析中自变量必须是确定的B、回归分析侧重于研究随机变量间的依赖关系,相关分析侧重于发现随机变量间的种种相关特性C、相关分析中相关系数是确定的,回归分析中可以存在多个回归方程D、相关分析中需要对变量进行自变量与因变量划分,而回归分析中的变量关系是对等的答案:D125.数据仓库中基于数据源的“脏”数据质量问题可分为两类,即()。A、单因素数据源和多因素数据源问题B、单构数据源与异构数据源问题C、单数据源问题和多数据源问题D、单阶数据源问题和多阶数据源问题答案:C126.在Excel中,TREND函数与FORECAST函数的主要作用是()。A、计算方差B、计算中位数C、计算样本标准差D、利用线性回归进行插值计算答案:D127.以下不属于云存储模式组织框架的是()。A、数据通信层B、基础管理层C、存储层D、应用接口层答案:A128.下列关于大规模结构非结构化混合数据的存储方式,描述不正确的是()。A、使用MPP并行数据库集群和Hadoop集群的混合模式将是大数据存储和管理未来发展的趋势B、更适合于部署于公有云上C、采用MPP并行数据库集群与Hadoop集群的混合来实现对PB量级、EB量级数据的存储和管理D、可使用Hadoop实现对非结构化数据的处理答案:B129.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验第一阶段数据全样检验合格,则第二阶段()。A、质检员继续对标注员标注的数据进行全样检验B、质检员对数据进行抽样检验C、质检员对标注员标注数据的25%进行检验D、质检员对标注员标注数据的50%进行检验答案:B130.对于业务数据采集流程以下说法正确的是()。A、Hive数据仓库工具属于实时数据采集流程步骤之一B、Tensorflow机器学习框架属于实时数据采集流程步骤之一C、日志文件属于离线数据采集流程步骤之一D、Ajax异步更新网页技术离线数据采集流程步骤之一答案:C131.下列不属于关联分析应用场景的是()。A、流量定量分析B、促销设计C、产品定位D、地质研究答案:A132.以下对于Excel基本操作的说法正确的是()。A、Excel单元格的缺省字体中文为“宋体”,英文为“TimeNewRoman”B、Excel无法设置单元格边框线的粗细C、在Excel中文字数值类型的水平对齐方式默认为右对齐D、在Excel中字符类型的水平对齐方式默认为右对齐答案:D133.采集数据的质量可以从()、范围、可信性4个指标来衡量数据质量。A、及时性、关联度B、关联度、时效性C、唯一性、及时性D、时效性、完整性答案:B134.以下不属于常见的数据质量问题的是()。A、缺失值B、重复值C、错误值D、重叠值答案:D135.数据集市可分为()。A、独立数据集市和从属数据集市B、串行数据集市和独立数据集市C、并行数据集市和虚拟数据集市D、虚拟数据集市和嵌入数据集市答案:A136.在Excel中,以下不可以用来计数或条件计数的函数是()。A、COUNT函数B、RANK函数C、OUNTA函数D、COUNTIF函数答案:B解析:RANK是排名函数137.商业智能(BI)工具主要有两种用途,分别是()。A、进行数据采集和进行联机事务处理B、进行数据抽样和进行可视化分析C、进行自动化报表的制作和进行可视化分析D、进行联机事务处理和进行自动化报表的制作答案:C138.以下对于云存储模式的概念与整体架构说法错误的是()。A、云存储模式组织框架自底向上依次是存储层、基础管理层应用接口层以及访问层B、云存储的概念和云计算的概念是两种不同的概念C、云.存储就是将存储资源放到云上为人们服务的一种新兴方案D、云存储通常由具有完备数据中心设施的第三方提供答案:B139.以下关于客服机器人的评价维度中最终结果触达率的说法正确的是()。A、最终结果触达率是反馈给用户的正确的结果数占反馈结果总数的比例B、最终结果触达率衡量了对话流程的流畅度C、最终结果触达率设计的目的是分析用户对于产品的感兴趣度D、最终结果触达率的指标含义是某一类任务的对话轮次的平均数答案:B140.在Excel中,不能直接计算极值或条件极值的函数是()。A、MAXIFS函数B、MIN函数C、OUNT函数D、LARGE函数答案:C141.在人工智能领域,()是评价数据质量的首要指标。A、可信性B、范围C、关联度D、时效性答案:C142.()规则限定了子关系中外键的取值。A、实体完整性B、参照完整性C、域完整性D、用户自定义完整性答案:B143.早期数据标注工作是由()完成。A、研究数据标注的工程师B、研究数据统计的工程师C、研究人工智能算法的工程师D、进行数据采集的工程师答案:C144.下列关于SQL(结构化查询语言)特点描述不正确的是()。A、所有关系数据库系统都支持SQLB、SQL运算的对象与结果都是表C、SQL既可以自主式的方式进行使用也可以嵌入在程序中进行使用D、SQL是一种面向过程的描述性语言答案:D145.图像区域标注的质量标准是根据()判定的。A、物体尺寸大小B、颜色饱和度C、像素点D、图像对比度答案:C146.对于在Windows10应用商店安装、更新与卸载软件的操作,下列说法正确的是()。A、可以通过【下载与更新】选项卸载应用B、通过Windows10应用商店安装的应用无法更新C、Windows10应用商店无法查看已经获得的应用D、Windows10应用商店可以通过关键字快速搜索相关应用答案:D147.以下对于数据库实体联系(Entity-Relationship,E-R)模型基本概念描述正确的是()。A、每个实体的属性构成可以是不相同的B、属性的取值范围的限定被称为实体C、用于唯一确定或区分实体集中每一个实体的属性或属性组合称为实体码D、将同类实体的属性构成加以抽象可以得到属性型的概念答案:C148.以下关于客服机器人的评价维度中业务覆盖率的说法正确的是()。A、业务覆盖率越高则客服机器人可以理解更多的用户意图B、业务覆盖率衡量了客服机器人的接待能力C、业务覆盖率衡量了客服机器人回复问题的准确程度D、业务覆盖率衡量了客服机器人产品推荐的精准度答案:A149.以下关于客服机器人的评价维度中满意度和差评数的说法错误的是()。A、满意度衡量了客服机器人的服务满意度B、由于影响用户使用体验的因素很多,满意度无法直接指明问题所在C、多数客户只会在不满意时给出反馈,所以关注差评率更加客观D、满意度只能实施于会话维度答案:D150.以下不属于数据标注质量检验方法的是()。A、实时检验B、间接检验C、抽样检验D、全样检验答案:B151.对于数据清洗方法,以下说法错误的是()。A、使用排序与合并是错误值的清洗方法之一B、数据缺失值的清洗方法主要分为忽略缺失值数据和填充缺失值数据C、使用简单规则库是错误值的清洗方法之一D、清洗重复值的方法主要有相似度计算和基于基本近邻排序算法等方法答案:A152.下列不属于数据标注应用领域的是()。A、金融领域B、公共服务领域C、建筑领域D、电子商务领域答案:C153.以下关于客服机器人的评价维度中平均对话轮次的说法正确的是()。A、平均对话轮次是某类任务的对话中断数占某类任务的对话总数的比例B、平均对话轮次衡量了产品推荐的精准度C、平均对话轮次衡量了客服机器人的对话流程健康度D、平均对话轮次是反馈给用户的正确结果数占反馈结果总数的比例答案:C154.数据抽取的数据源不包含()。A、Web数据B、文本数据C、图层数据D、数据库数据答案:C155.以下关于Windows10“截图工具”应用的操作的说法正确的是()。A、Windows10“截图工具”应用不能设置延迟时间B、Windows10“截图工具”应用可以对截图区域进行荧光笔标注C、Windows10“截图工具”应用只能进行矩形形状区域的截图D、使用Home键可以快速启动“截图工具”应用进行截图答案:B156.在Windows10输入法中,u模式的作用是()。A、快速输入词汇B、快速输入网址C、拆分不认识的汉字D、方便输入中文数字、罗马数字与年份答案:C157.在自然语言处理技术中,()的准确率已经成为评价一个分词系统好坏的重要标志之一。A、分词B、词性分析C、新词识别D、词频统计答案:C158.数据仓库的管理部分由()、数据管理部件和元数据管理部件4部分组成。A、数据集市定义部件、数据获取部件B、数据集市定义部件、数据库定义部件C、数据仓库定义部件、数据资源部件D、数据仓库定义部件、数据获取部件答案:D159.广义的数据资源涉及产生、()的整个过程。A、处理、传播、交换B、处理、传播、决策C、管理、传播、交换D、处理、存储、决策答案:A160.()的数据直接来自中央数据仓库。A、整合数据集市B、虚拟数据集市C、独立数据集市D、从属数据集市答案:D161.对于在Windows10应用商店安装、更新与卸载软件的操作,下列说法错误的是()。A、可以通过【设置】窗口下的【应用】选项卸载应用B、在【我的资料库】中可以查看已经获得的应用C、通过Windows10应用商店安装的应用无法更新D、可以通过Windows10应用商店中的【集锦】选项按照类别快速查找并安装应用答案:C162.以下对于PowerPoint2019基本操作的说法错误的是()。A、在PowerPoint中,通过“SmartArt图形”功能插入的形状不能设置文字B、在PPT模板中大多含有占位符,可以通过占位符导入多种可显示对象C、可以通过直接粘贴的方式在幻灯片中插入图表D、在PowerPoint中,不可以通过“SmartArt图形”功能插入表格答案:A163.在数据采集渠道中组织与组织之间的合作,交换或购买数据来整合行业资源的渠道被称为()。A、网络数据采集B、自行采集C、共享行业数据D、第三方合作答案:D164.以下关于客服机器人的评价维度中推荐结果点击率的说法正确的是()。A、推荐结果点击率衡量了客服机器人的产品设计友好度B、推荐结果点击率是使用了客服机器人产品的用户数占用户总数或者曝光用户数的比例C、推荐结果点击率衡量了客服机器人的对话流程健康度D、推荐结果点击率是推荐答案或内容的点击(或采纳)次数占推荐次数的比例答案:D165.在自然语言处理中,下列关于分词标准描述恰当的是()。A、分词可按照操作员习惯进行分词B、分词标准中粗粒度切分最常应用的领域是搜索引擎C、中文分词比英文分词更简单D、分词标准可分为粗粒度和细粒度答案:D166.()不是网络运营者需要履行的网络安全义务。A、制定内部安全管理制度和操作规程B、监测、记录网络运行状态C、促进网络安全人才交流D、采取数据分类、重要数据备份和加密等措施以保证网络安全答案:C167.图像标框标注的质量标准是根据()判定的。A、像素点B、尺寸大小C、数量规模D、图像格式答案:A168.在数据预处理步骤中,数据归约的作用是()。A、得到数据集的规约表示以减少数据量并且使规约前后结果几乎相同B、将数据转换为适用于数据挖掘的形式C、使数据格式标准化、清除异常数据、清除重复数据、错误纠正D、将多个数据源中的数据结合起来并统一存储答案:A169.()的字符编码方式不支持汉字字符。A、GB2312编码B、UTF-8编码C、ASCII编码D、Unicode编码答案:C170.如图所示的统计图的使用场景是()。A、比较多组数据的大小B、比较多组数据随时间变化的趋势C、展示总体中各类别数据所占的比例D、描述数据在平面或空间中的分布答案:C171.下列属于语义标注的检验方式的选项是()。A、针对语音数据中的音量进行检验B、针对语音数据中的语速进行检验C、针对上下文的情景环境进行检验D、针对语音数据中的声音频率进行检验答案:C172.如图所示的统计图的不适合在可视化()时使用。A、某商品在2023年销售总额的占比B、某商场各门店2023年的每个月营业额C、某商场各部门2023年每个月的业绩D、某商品2023年不同地区的销售额答案:A173.在数据标注质量检验方法中,一般安排在数据标注任务完成交付前实施的质量检验方法是()。A、实时检验B、全样检验C、相互检验D、抽样检验答案:B174.()不是商用数据标注平台中语音类标注工具支持的功能。A、语义分割B、语音波形缩放C、语谱图切换D、单段落与多段落语音标注答案:A175.数据采集又称(),是指从各类数据库、机器设备、传感器等自动采集信息的过程。A、数据生成B、数据获取C、数据填充D、数据模拟答案:B176.以下关于Windows10系统还原功能的操作描述错误的是()。A、不能使用U盘启动盘还原系统B、Ghost备份还原是以硬盘的扇区为单位进行的C、开启系统还原后,系统会定期自动创建还原点D、用户可以使用系统映像备份来还原系统答案:A177.以下关于Windows10“邮件”应用的操作的说法正确的是()。A、“邮件”应用无法设置个性化界面颜色B、“邮件”应用不可以自定义账户在应用中的名称C、“邮件”应用可以通过【管理账户】选项添加邮件账户D、“邮件”应用发送邮件无法插入图片、文件等附件答案:C178.数据标注是对文本、图像、语音、视频等待标注数据进行()、纠错、标注和批注等加工操作。A、加载、整理、编辑B、整理、分析、编辑C、归类、分析、整理D、归类、整理、编辑答案:D179.以下不属于Python数据可视化或数值分析常用软件库的选项是()。A、NumPy库B、Matplotlib库C、Pandas库D、Urllib库答案:D解析:urllib库是Python编写爬虫程序操作URL的常用内置库180.职业道德的作用不包括()。A、有助于提高全社会道德水平B、有助于企业形成行业领导地位C、规范约束职业内部人员的行为D、促进本行业发展答案:B181.以下对于Windows10常用系统维护工具使用的说法正确的是()。A、【可靠性监视程序】只能用于监测系统中的软件问题B、在命令行输入eventvwr命令可以打开【事件查看器】C、使用Ctrl+Shift+Esc可以打开【资源查看器】D、在命令行输入resmon命令可以打开【任务管理器】答案:B182.在关系数据模型三要素中,()对数据进行限制约束以保证存储数据的正确性和一致性。A、数据约束B、数据操作C、数据通信D、数据结构答案:A183.从事数据标注需要了解其基本概念,下列关于其基本概念描述不正确的是()。A、标签主要就是标识数据特征、类别和属性等B、标注任务是指按个人对任务的理解对数据集进行标注的过程C、数据标注员负责对文本、图像、语音、视频等待标注数据进行归类、整理、编辑、纠错、标注和批注D、标注标注员负责对文本、图像、语音、视频等数据进行标注答案:B184.数据预处理中的()是指构造新属性并添加到属性集的过程。A、数据规范化B、数据泛化C、属性构造D、数据平滑答案:C185.关于大数据处理面临的难题,下列描述错误的是()。A、数据体量过大B、维护成本昂贵C、响应速度慢D、并发读写量小答案:D186.下列关于语音合成描述错误的是()。A、语音合成是从文本转换为语音的过程B、语音合成的英文简拼为ASRC、语音合成广泛应用在电话机器人上D、语音合成最主要的指标是自然度答案:B解析:语音合成的英文简拼为TTS187.数据仓库的()特征体现在数据仓库随时间变化不断增加新的数据内容,删去旧的无用的数据内容。A、面向主题B、集成C、随时间不断变化D、不可更改答案:C188.以下关于客服机器人的评价维度的说法正确的是()。A、差评数是客服机器人的应答能力的评价指标之一B、客服机器人的接待能力的评价指标包括拦截率和满意度C、客服机器人的能力模型通常由接待能力和应答能力两个方面组成D、客服机器人的应答能力的评价指标包括业务识别率和满意度答案:C189.以下关于数据清洗中重复数据的处理方法,描述不正确的选项是()。A、在数据库中,对于属性值相同的记录,可以将其看作是重复记录数据,相等的记录可以合并为一条记录B、合并或消除是处理重复数据的基本方法C、重复数据检测主要分为基于字段和基于记录的重复检测D、对于属性值相同的记录一般是将它们的记录时间进行修改以进一步区分答案:D190.数据标注可以根据标注者类型进行分类,下列属于该分类的是()。A、拼音标注B、结构化标注C、文本标注D、机器标注答案:D191.对于自然语言处理中停用词的分类说法正确的是()。A、停用词一般可分为功能词和判定词B、搜索的短语中包含功能词不会使搜索结果出现问题C、词汇词的使用十分广泛,不会降低搜索的效率D、功能词不具有实际含义答案:D192.下列关于图像标框标注的质量标准相关内容描述正确的是()。A、标框的四周要与标注物最边缘像素点误差在3个像素以内B、标框标注的四周边框需要覆盖住标注物并且标注框需要贴合目标C、标框的四周要与标注物最边缘像素点大于4个像素,图片即为不合格D、标注物最边缘像素点不需要进行判定答案:B193.下列关于语音标注注意事项描述错误的是()。A、背景噪音过大的,需标为无效B、语音标注过程最好使用降噪耳机C、确定标注文件中是否包含有效语音D、带有口音的内容,需标为无效答案:D194.在Excel2019中,下列不属于查找引用类函数的选项是()。A、MIN函数B、VLOOKUP函数C、INDIRECT函数D、OFFSET函数答案:A195.()情况下,用人单位不得解除劳动合同。A、劳动者在试用期间被证明不符合录用条件的B、劳动者不能胜任工作,经过培训或者调整工作岗位,仍不能胜任工作的C、劳动者严重违反用人单位的规章制度D、女职工在孕期、产期、哺乳期的答案:D196.关于PowerBI(商业智能)连接数据库并导入数据库数据的过程,下列说法不正确的是()。A、在使用“DirectQuery”选项时,在每次查看数据时不需要每次手动刷新数据B、在使用“导入”选项时,PowerBI获取最新数据后会断开与数据库连接C、在使用“DirectQuery”时,PowerBI不会将数据装载到内部数据库D、“DirectQuery”适用于数据经常更新的情况答案:D197.以下对于微软edge浏览器的历史记录功能的说法正确的是()。A、微软edge浏览器无法删除对某个网站的所有访问记录B、微软edge浏览器只能删除最近30分钟的历史浏览记录C、微软edge浏览器没有按键可以快速清除历史访问记录D、微软edge浏览器可以一次删除多条历史访问记录答案:D198.下列关于数据标注质量全样检验方法的优缺点描述错误的是()。A、需要耗费大量人力精力集中进行B、能够对数据集做到无遗漏检验C、能够有效减少标注过程中重复错误的重复出现D、可以对数据集进行准确率评估答案:C199.以下对于微软edge浏览器的收藏夹功能的说法正确的是()。A、微软edge浏览器的收藏夹功能默认是处于隐藏状态的B、微软edge浏览器无法导入IE浏览器中收藏的网页C、微软edge浏览器不能调整收藏夹栏的按钮次序D、添加到收藏夹的网页无法重命名答案:A200.下列不属于数据仓库的数据质量评价指标的是_____。A、差异性B、适用性C、完整性D、准确性答案:A201.在数据标注质量检验方法中,多重抽样检验方法辅助全样检验第一轮数据抽样检验存在不合格数据,则第二轮()。A、抽样检验中检验的标注数据量与第一轮相同B、抽样检验中检验的标注数据量较第一轮减少50%C、抽样检验中检验的标注数据量较第一轮增加75%D、抽样检验中检验的标注数据量较第一轮增加100%答案:D202.下列属于数据标注常用的文本标注工具是()。A、BRAT软件B、NotePad软件C、LogViewer软件D、EmEditor软件答案:A203.以下关于申请专利权力归属方的规定的说法不正确的是()。A、两个以上单位所完成的发明创造,除另有协议的以外,申请专利的权利属于完成或者共同完成的单位B、对发明人或者设计人的非职务发明创造专利申请,任何单位或者个人不得压制C、非职务发明创造,申请专利的权利属于单位D、职务发明创造申请专利的权利属于单位,申请被批准后,单位为专利权人答案:C204.下列关于Excel2019数据透视表自定义计算功能描述不恰当的选项是()。A、百分比选项的功能是值区域显示为基本字段和基本项的百分比B、差异选项的功能是值区域字段显示为与基本字段项的差异百分比C、无计算选项的功能是值区域字段显示为数据透视表中的原始数据D、父行汇总的百分比是值区域字段显示每个数据项占该列父级项总和的百分比答案:B205.在数据清洗中,错误值的清洗方法不包括()。A、使用统计分析B、使用排序与合并C、使用简单规则库D、使用不同属性间约束答案:B206.从信息系统的发展过程来看,信息系统进入成熟阶段的重要标志是()。A、数据资源有效管理B、数据采集技术的成熟C、由人工处理数据转向计算机处理数据D、数据采集渠道的增加答案:A207.以下对于Word图片布局的说法正确的是()。A、浮于文字上方是将图片浮在文字上方但不会遮盖其他对象B、环绕型是将文字或其他对象环绕在图片周围C、嵌入型是将图片作为一个对象嵌入在一列中D、上下环绕型是将图片独占一列或多列,其他对象位于图片的左右侧答案:B208.以下属于数据清洗中常见的异常值处理方法的选项是()。A、随机森林B、排序与合并C、回归D、平均值填充答案:C209.以下关于微软edge浏览器操作的说法正确的是()。A、微软edge浏览器的阅读视图无法调节页面主题B、微软edge浏览器的网页笔记无法使用荧光笔C、微软edge浏览器的标签页无法显示网页预览D、微软edge浏览器无法将网页固定到【开始】菜单答案:C210.数据标注最常见的分类方法是根据待标注数据类型进行分类,下列不属于其分类的是()。A、标注框标注B、文本标注C、视频标注D、图像标注答案:A211.如图所示的统计图不适用于()。A、描述数据在平面或空间中的分布B、观察聚类算法的选择和参数设置对聚类效果的影响C、帮助分析数据之间的关联D、比较多组数据之间的大小答案:D212.以下无法在典型的实时数据采集流程环节得到应用的是()。A、HDFS分布式文件系统B、Pytorch机器学习框架C、Socket通信技术和Ajax网页更新技术D、Flume分布式日志收集系统答案:B213.()不是数据仓库系统组成部分之一,但是在数据仓库系统开发与应用中是出发点。A、存储层B、分析工具层C、数据源D、定义层答案:C214.以下对于Word中段落缩进方式的说法正确的是()。A、左缩进是指段落所有行均向左移动一定的距离B、右缩进是指段落所有行均向右移动一定的距离C、悬挂缩进是指除段落第一行外其余各行缩进一定的距离D、首行缩进是指段落中第一行文字从右向左缩进一定的距离答案:C215.根据预防系统蓝屏的方法,以下做法不恰当的是()。A、系统能正常运行无需升级驱动、BIOS等软件B、不需要定期对电脑进行病毒扫描C、定期对重要的注册表文件进行备份D、在关机时要尽量通过系统的关机按钮进行关机答案:B216.在Excel中,当复制公式到其他单元格时,从属单元格与引用单元格的相对位置保持不变的引用方式称为()。A、绝对引用B、相对引用C、复合引用D、混合引用答案:B217.下列处理方法中最适合处理词云图中干扰词的方法是()。A、进行命名实体标注B、手动去除干扰词C、进行词性分析D、使用停用词表过滤干扰词答案:D218.一般认为语音标注的质量标准是标注与发音时间轴误差在()语音帧以内。A、1个B、3个C、5个D、7个答案:A219.数据清洗的基本流程中纠正发现的错误的操作不包括()。A、确认并改正B、属性分离C、定义数据清洗策略D、标准化答案:C220.以下对于PowerPoint2019基本操作的说法正确的是()。A、可以通过【插入】选项卡调整幻灯片的纵横比B、可以通过“Ctrl+鼠标拖拉”的方式快速复制形状C、PowerPoint2019无法导入Excel工作簿D、在PowerPoint中,可以通过“SmartArt图形”功能插入表格答案:B221.以下关于客服机器人的评价维度中跳出率和异常率的说法错误的是()A、异常率衡量了客服机器人找出关键问题快速修复的能力B、跳出率=某类任务的对话中断数/某类任务的对话总数C、跳出率衡量了对话流程的健康度D、异常率=异常报错数/会话数答案:C222.SQL(结构化查询语言)具有(),用于对表和关系、索引、查询的定义与维护。A、数据定义功能B、数据控制功能C、数据操作功能D、数据建模功能答案:A223.下列不属于DBMS(数据库管理系统)主要功能的选项是()。A、数据库操作功能B、数据库定义功能C、数据库内模式设计功能D、数据库维护功能答案:C224.下列不属于常用的数据清洗转换方法的是()。A、多数据源的合并B、复杂数据的转换C、数据粒度的转换D、数据的商务规则计算答案:B225.以下不属于数据清洗中的空缺值处理方法的选项是()。A、回归B、数据补齐C、不处理D、忽略元组答案:A226.关系模型中最重要的概念是关系,下列关于关系的特点描述正确的是()。A、关系中元组是有先后顺序的B、关系中属性是有先后顺序的C、关系中的每个属性可以再分D、关系中的每个属性是同质的答案:D227.数据采集的渠道包括()、第三方合作、自行采集。A、线上沟通、网络数据采集B、直接购买或共享行业数据、网络数据采集C、他人口述、直接购买或共享行业数据D、线上沟通、他人口述答案:B228.下列关于数据标注质量实时检验过程相关描述不恰当的是()。A、当标注员对标注存在疑问时可以由质检员进行现场沟通和指导B、质检员会对自己所在小组的标注员的标注习惯、标注速度、准确度进行现场实时检验C、标注员对分段数据开始标注时,质检员就可以对标注员进行实时检验D、需要标注的数据除了按照小组进行划分之外还要将每组需要标注的数据按照阶段进行划分答案:B229.关于自然语言处理技术中词频统计,以下描述错误的是()。A、词频统计是对某一些给定的词语在某文件中出现的次数进行统计B、词频统计是指将一个汉字序列切分成一个个单独的词的过程C、词频统计是文本分析的重要方法之一D、词频统计是文本挖掘的重要手段答案:B230.商用数据标注平台一般分为标注任务平台和系统管理平台两部分,()不属于系统管理平台。A、绩效管理B、标注任务列表C、流程管理D、资产管理答案:B231.数据仓库的特征不包括()。A、面向主题的B、随时间不断变化的C、集成的D、可以修改的答案:D232.在统计学中,用()去估计总体参数的过程称为参数估计。A、样本均值B、样本中位数C、总体均值D、样本统计量答案:D233.以下关于客服机器人的评价维度中拦截率的说法错误的是()。A、用户与机器人的一次交互算作一次会话B、拦截率衡量了客服机器人的接待能力C、拦截率的计算必须基于有效会话数D、由于业务特点或者用户习惯产生的转人工会话不属于有效的转人工会话答案:A234.数据标注的正确流程为()、数据质检。A、数据清洗、数据标注、数据采集B、数据标注、数据采集、数据清洗C、数据采集、数据标注、数据清洗D、数据采集、数据清洗、数据标注答案:D235.以下对Windows10文件资源管理器文件夹选项操作描述错误的是()。A、在Windows10中,文件资源管理器默认打开【此电脑】窗口B、可以通过访问【文件夹选项】选项下的【常规】选项卡设置文件资源管理器默认打开位置C、默认情况下文件资源管理器左侧没有【控制面板】项目D、可通过【查看】选项卡设置是否显示左侧的导航窗格答案:A解析:默认打开【快捷访问】236.下列属于数据标注常用的语音标注工具是()。A、Nuendo软件B、Labelbox软件C、Praat软件D、BRAT软件答案:C237.下列对于数据标注应用领域说法错误的是()。A、建立用户画像属于数据标注在电子商务领域的应用B、文本审核属于数据标注在公共领域的应用C、风险管理属于数据标注在金融领域应用场景D、人脸标注不属于数据标注在安防领域的应用答案:D238.一般的数据清洗策略分类中,根据相关算法检测并删除重复记录的数据清洗策略是()。A、手工清洗策略B、自动清洗策略C、特定应用领域的清洗策略D、与特定应用领域无关的清洗策略答案:D239.下列不属于Excel2019常用文本处理的函数是()。A、SUBSTITUTE函数B、TEXT函数C、MID函数D、MEDIAN函数答案:D解析:D返回中值240.以下不属于大数据的五大特征的选项是()。A、多样B、大量C、低速D、低价值密度答案:C241.商用数据标注平台对人脸标注建立可配置模板一般不需要考虑()。A、性别B、年龄类别C、人脸肤色D、说话声音答案:D242.以下不属于数据标注文本处理工具的是()。A、PilotEdit编辑器B、EmEditor编辑器C、JSONViewer编辑器D、Protools编辑器答案:D243.数据库实体联系(Entity-Relationship,E-R)模型的构成要素是()。A、实体、属性、联系B、实体、操作、连接C、对象、控制、连接D、对象、实体、联系答案:A244.关于PowerBI(商业智能)中的查询编辑器,下列说法正确的是()。A、查询编辑器只能查询并显示原始数据的全部列B、数据源的隐私级别设置错误会影响查询的性能C、自定义列一般不需要定义数据类型D、查询编辑器的默认联接种类是右外部连接答案:B245.在Excel2019中,下列属于随机抽样的操作步骤是()。A、在【抽样】对话框中设置相关参数B、单击【数据】选择【数据验证】设置验证条件,之后选择【数据验证】并选择【圈释无效数据】C、单击【插入】选项卡,选择【数据透视表】D、单击【数据】选择【数据分析】按钮,打开【数据分析】对话框并选择【协方差】答案:A246.以下关于授予专利权的相关条件规定的说法不正确的是()。A、在申请专利前六个月内,在国家出现紧急状态或者非常情况时,为公共利益目的首次公开的发明不丧失新颖性B、授予专利权的发明和实用新型,应当具备新颖性、创造性和实用性C、授予专利权的外观设计不得与他人在申请日以前已经取得的合法权利相冲突D、疾病的诊断和治疗方法可以授予专利权答案:D247.以下关于语音智能客服机器人的说法正确的是()。A、语音智能客服机器人一般不支持随时打断的功能B、语音智能客服机器人只能替代客服回答专业性较高的提问C、语音智能客服机器人可以帮助企业提高服务效率D、语音智能客服机器人可以通过表情监测识别情绪变化答案:C248.以下属于商业智能(BI)核心作用的选项是()。A、数据的钻取分析B、数据的自动标注C、取代传统的数据报表分析D、滤除不符合要求的数据答案:A249.以下对于数据资源管理的意义描述不正确的是()。A、企业取得竞争优势的关键B、解决企业内部数据不一致问题的根本途径C、是帮助企业降本增效的唯一途径D、是信息系统进入成熟阶段的重要标志答案:C250.()是劳动合同不可以约定的条款。A、限制女职工合法权益的条款违反劳动合同的责任B、违反劳动合同的责任C、劳动保护和劳动条件D、工作内容答案:A251.下列关于数据仓库中ETL(数据仓库技术)的概念描述不正确的是()。A、ETL是实现商务智能(BI)的核心B、ETL用来描述将数据从源端经过抽取、转换、加载至目的端的过程C、ETL只能对单个源数据进行抽取D、ETL可以对多种结构的源数据进行抽取答案:C252.下列关于回归分析的描述不正确的是()。A、回归分析研究的是因变量(目标)和自变量(预测器)之间的关系B、回归分析是研究确定两种或两种以上变量间相互依赖的定量关系的统计分析方法C、回归分析通过分析由定性变量构成的交互汇总表来揭示变量之间的联系D、回归分析可以用于研究人的身高与体重之间的相关关系答案:C253.数据标注质量实时检验过程中,质检员会对自己所在小组的标注员的()进行现场实时检验。A、标注方法、熟练度、准确度B、标注习惯、标注速度、准确度C、标注方法、熟练度、不确定度D、标注习惯、标注速度、不确定度答案:A254.在数据标注质量检验方法中,多重抽样检验方法辅助实时检验的操作方法错误的是()。A、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验不合格,第三阶段继续为抽样检验B、标注员第一阶段数据全样检验不合格,第二阶段转换为全样检验合格,第三阶段继续为抽样检验C、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验合格,第三阶段继续为抽样检验D、标注员第一阶段数据全样检验合格,第二阶段转换为抽样检验不合格,第三阶段继续为全样检验答案:A255.下列关于因子分析的作用描述错误的是()。A、因子分析常用于因子降维B、因子分析可以用于描述同一变量各个类别之间的差异C、因子分析可以找出隐藏且具有代表性的因子D、因子分析可以按照权重计算出综合得分再进行回归或聚类分析答案:B解析:因子分析是指研究从变量群中提取共性因子的统计技术。256.对于各种数据结构的存储方式,以下说法错误的是()。A、财务系统的数据属于大规模非结构化数据B、非结构化数据没有预定义的模型C、MPP可以用来管理计算高质量的结构化数据D、采用MPP并行数据库集群与Hadoop集群的混合可以实现对PB量级、EB量级数据的存储和管理答案:A257.()是商用数据标注平台不需要支持管理的数据来源。A、来自本地的文本数据集B、预训练模型的结构与参数C、来自共享存储的语音数据集D、来自云存储的图像数据集答案:B解析:二、判断题258.在SQL(结构化查询语言)的基本功能中,对数据库安全性和可用性的控制管理体现了SQL的()功能。A、数据操作B、数据定义C、数据控制D、数据建模答案:C259.()不是进行系统备份的合适时机。A、安装了重要软件后B、对系统优化后C、进行可能损坏系统的操作前D、当系统感染计算机病毒后答案:D260.在中文分词技术中,关于全模式分词的描述正确的选项是()。A、Jieba分词工厂的标记模式参数默认是全模式分词B、全模式分词不能解决歧义问题C、对于同一段文本,全模式分词处理比精确模式分词要慢D、全模式分词把文本中所有可能的词语都扫描处理且不存在冗余答案:B261.数据仓库就是面向主题的、()、随时间不断变换的数据集合。A、去中心化的、不可更改的B、集成的、不可以更改的C、集成的、可以更改的D、去中心化的、可以更改的答案:B262.以下关于专利的申请程序相关规定的说法错误的是()。A、国务院专利行政部门收到专利申请文件之日为申请日,如果申请文件是邮寄的,以寄出的邮戳日为申请日B、申请人申请发明、实用新型专利优先权的,应当在第一次提出申请之日起三个月内,提交第一次提出的专利申请文件的副本C、申请外观设计专利的,应当提交请求书、该外观设计的图片或者照片以及对该外观设计的简要说明等文件D、申请发明专利的请求书应当写明发明或者实用新型的名称,发明人的姓名,申请人姓名或者名称、地址,以及其他事项答案:B解析:B十二个月内263.下列关于停用词表的构成相关描述恰当的选项是()A、停用词表中含有需要使用的关键词B、停用词表中含有已经在书面与口语中不再使用的词语C、停用词表内容可自行定义D、停用词表一般使用DOC格式文件存储答案:C264.以下关于客服机器人的评价维度中产品使用率的说法错误的是()。A、产品使用率可以按照每日进行统计B、产品使用率=产品使用用户数/总用户数C、产品使用率可以按照每周、每月进行统计D、设置产品使用率评价指标的目的是分析对话流程的流畅度答案:D265.以下关于关键信息基础设施的运行安全相关规定的说法错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论