数据标注员A复习测试卷_第1页
数据标注员A复习测试卷_第2页
数据标注员A复习测试卷_第3页
数据标注员A复习测试卷_第4页
数据标注员A复习测试卷_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第页数据标注员A复习测试卷1.数据标注质量的衡量尺是()。A、数据标注规则B、数据标注C、数据采集D、数据分类【正确答案】:A2.下列哪一项不是数据标注的流程?A、数据清洗B、数据标注C、数据预处理D、数据分类【正确答案】:C3.下列哪一项不是数据采集的常用方式?A、传感器采集B、

网络爬虫采集C、数据库查询采集D、问卷调查采集【正确答案】:C4.你收到一份竞争对手的标注数据,其中包含可能的商业机密,你应该:(

)A、利用这些数据提升自己的项目B、立即销毁这些数据并告知来源不合法C、审查这些数据以查找自己的不足D、与竞争对手协商共享数据【正确答案】:B5.下面是数据质量的特性的是A、准确性B、感染性C、破坏性D、不可解释性【正确答案】:A6.语义标注检验中不包括以下哪种场景()A、针对单独词语或语句进行检验B、针对上下文的情景环境进行检验C、针对语音数据中的语音语调进行检验D、针对文本出现的地方进行检验【正确答案】:D7.特征不对会导致()。A、归类精度提高B、词义信息的丢失C、归类效率提高D、文本信息表达完整【正确答案】:B8.在智能系统发展早期,比较典型的综合性应用成果之一()。A、专家系统B、苹果系统C、安卓系统D、鸿蒙系统【正确答案】:A9.神经网络的训练和推理受到()、内存带宽和延迟的限制。A、计算带宽B、

苹果带宽C、华为带宽D、小米带宽【正确答案】:A10.当你在项目中遇到道德上的困境时,你应该:(

)A、自行决定行动方案B、寻求上级或伦理顾问的指导C、忽略困境,继续工作D、立即辞职以避免责任【正确答案】:B11.在数据标注过程中,数据预处理环节包括哪两个方面?A、数据清洗和数据分类B、数据清洗和数据标注C、数据清洗和数据转化D、数据清洗和数据压缩【正确答案】:A12.若想要获得图片的某个位置,可以对图片进行()。A、调色B、裁剪C、合成D、拼接【正确答案】:B13.()要检验每个字的标注是否与语音数据发音的时间轴保持一致。A、图像标注B、文本标注C、语音标注D、视频标注【正确答案】:D14.()是一个极为庞大的学科,在各行各业各领域都会大量的应用。A、数据分析B、苹果电脑C、华为电脑D、联想电脑【正确答案】:A15.数据的格式不包括()。A、图片B、声音C、视频D、光纤【正确答案】:D16.下面是python的数据类型的是()。A、整型B、表格C、指针D、文档【正确答案】:A17.()是一种结构和处理功能都分散的多处理机或多计算机系统。A、集群系统B、分布式系统C、独立系统D、离线系统【正确答案】:B18.()是对自然语言文本中的实体事先打好标签。A、实体命名B、文本分类C、文本分析D、文本理解【正确答案】:A19.数据采集和()行业治理原则是离不开问责机制。A、标注B、删除C、清洗D、收集【正确答案】:D20.下列不属于智能模型所拥有的工具的是()。A、数据处理B、报表生成C、自动保存D、代码生成【正确答案】:C21.下列哪一项不是数据标注的作用?A、提高模型泛化能力B、提高模型鲁棒性C、帮助机器学习算法更好地理解数据D、帮助人类更好地理解数据【正确答案】:D22.对于不准确或欺骗性的标注数据,你应该如何处理?A、忽略它们,因为这不是你的责任B、修改它们以使数据看起来更准确C、记录并报告这些不准确或欺骗性的数据D、与同事讨论,看看他们是否注意到这些问题【正确答案】:C23.在团队中,有人提出为了项目进度而忽略某些道德准则,你应该:A、为了团队和谐而妥协B、坚持自己的道德标准并说服团队C、离开团队以避免冲突D、向上级报告团队的道德问题【正确答案】:B24.在数据标注过程中,你意识到客户的要求可能导致歧视或不公平结果,你应该:(

)A、按照客户要求进行标注B、拒绝执行并向客户解释道德关切C、修改数据以抵消不公平结果D、与团队讨论并寻找折中方案【正确答案】:B25.准确的()定义是通过观察和判断,适时结合测量、试验进行符合性评价。A、检验B、查找C、搜索D、查询【正确答案】:A26.智能系统的硬件的安装应该()。A、选取价格最贵的硬件B、选取最便宜的硬件C、选取最便宜的硬件D、根据实际情况选取最合适的【正确答案】:D27.以下哪项是文本关系()A、运算关系B、主谓语关系C、劳动关系D、长短关系【正确答案】:B28.智能系统运维的主要任务不包括哪一项?A、硬件维护B、软件维护C、数据处理和分析D、安全管理【正确答案】:C29.在网络中使用流式传输技术的基媒体称为()。A、多视图B、流媒体C、多模态D、流水账【正确答案】:B30.()关键点对于描述人体姿态、预测人体行为至关重要。A、人体骨骼B、动物骨骼C、手部关节D、脚部关节【正确答案】:A31.()是帮助程序进行快速查找的。A、索引B、文本C、表格D、字典【正确答案】:A32.并行计算可以分为()的并行计算和空间上的并行计算。A、时间上B、数据上C、马力上D、动力上【正确答案】:A33.数据标注的精度对于模型效果有何影响?A、提高模型泛化能力B、提高模型鲁棒性C、对模型效果没有影响D、降低模型效果【正确答案】:A34.数据标注的类型不包括哪一项?A、图像标注B、图像标注C、三维标注D、多模态标注【正确答案】:C35.视频的语义单元是()。A、场景B、声音C、时间D、标签【正确答案】:A36.下面属于数据预处理过程的是()。A、数据挖掘B、模型构建C、数据清理D、回归预测【正确答案】:C37.数据规约指在尽可能保持元数据原貌的前提下,最大限度地()数据量A、精简B、增加C、保持不变D、保留【正确答案】:A38.系统性分析问题通常能够()。A、预测问题的发生B、找到问题的根源C、提高员工的效率D、防止系统的崩溃【正确答案】:B39.自然语言处理任务主要包括建模、标注、()、测试等步骤。A、采集B、训练C、更改D、画图【正确答案】:B40.下面不属于问题管理流程的是()。A、问题解决B、错误控制C、提供信息D、主动问题管理【正确答案】:A1.下面是计算机病毒的生物特征的是?A、感染性B、危害性C、变异性D、一致性E、数据清洗【正确答案】:ABC2.机器视觉的核心要素包括?A、数据B、算法C、操作人员D、算力E、逻辑运算符【正确答案】:ABD3.常见的数据标注工具的数据标注结果导出格式包括?A、CSVB、XMLC、JSOND、MP4E、内存带宽【正确答案】:ABC4.以下不属于精益求精的表现是?A、工作认真负责,踏实肯干B、工作做的很好,但还想做得更好C、工作效率高,快速完成任务D、热于助人,和同事打成一片E、数据变换【正确答案】:ACD5.语音识别技术,按词汇量大小进行分类,可以分为?A、中词汇量B、超大词汇量C、小词汇量D、大词汇量【正确答案】:ACD6.下面不是数据质量的特性的是?A、准确性B、感染性C、破坏性D、不可解释性E、网页,客户端【正确答案】:BCD7.下列关于自然语言的说法,正确的是?A、自然语言处理可以让机器去理解人类的语言B、自然语言处理需要MFCC来提取特征C、自然语言处理主要依赖于卷积神经网络D、自然语言处理是一门融语言学、计算机科学、数学于一体的科学E、从图像中检测物体【正确答案】:AD8.下列哪项是质检员的要求?A、粗心大意B、认真细致C、责任心强D、温度E、思维敏捷【正确答案】:BCE9.语音信号数字化之前,必须先进行预处理,包括?A、短时分析B、防工频干扰滤波C、录音D、防混叠滤波E、机械计算【正确答案】:BD10.下面哪些适合通过强化学习来实现?A、物流运输路线指定,根据天气,高速封停情况,是否堵车等情况判断能否准时到达B、个性化音乐平台,给用户推送喜欢的歌,和广告C、根据客户购买商品的情况,给指定客户发送营销推广信息D、以上都不是E、提高系统性能,增强系统的稳定性【正确答案】:BC11.下列关于自然语言的说法,正确的是?A、自然语言处理可以让机器去理解人类的语言B、自然语言处理是一门融语言学、计算机科学、数学于一体的科学C、自然语言处理主要依赖于卷积神经网络D、自然语言处理需要MFCC来提取特征E、自然语言是大自然的产物,人还未能理解【正确答案】:AB12.下面不属于图片处理的是?A、视频剪辑B、动画制作C、声音合成D、裁剪电子照片E、空间分配【正确答案】:ABC13.以下哪种场景应用了计算机视觉?A、人脸识别B、物体检测C、辅助驾驶D、行为识别E、不识别【正确答案】:ABCD14.调查的时候遗漏了某些观察值,不会造成数据的?A、完整B、缺失C、归一化D、分布式系统E、标准化【正确答案】:ACE15.下面哪些运算符是逻辑运算符?A、//B、orC、andD、butE、not【正确答案】:BCE16.下面哪些用循环神经网络处理效果比较好?A、自然语言处理B、语音识别C、图像识别D、人脸识别E、指纹识别【正确答案】:AB17.下面哪几个关键字用于跳出循环?A、breakB、forC、whileD、continueE、帧【正确答案】:AD18.定序等级的数据不可以进行?A、类别区分B、分类操作C、自然排序D、类别定义E、断定软件系统性能表现,预见系统负载压力承受力【正确答案】:ABD19.关于感知机的描述正确的是?A、感知机容易受个别特例影响B、感知机模拟了大脑的运作方式C、感知机有一定的容错性D、感知机不能对未知的事物分类E、感知机稳定性不高,很容易收到影响【正确答案】:BC20.对于婴儿辨认图片培养过程与机器学习训练的对应关系,以下说法正确的有?A、婴儿看图卡片->数据集B、婴儿反复观看不同卡片->迭代C、家长反馈->损失函数D、婴儿反复观看较少数量的图片->优化拟合E、婴儿反复观看视频->强化学习【正确答案】:ABC1.特征选择技术主要有两种类型:包装器和过滤器方法。A、正确B、错误【正确答案】:B2.文件数量越大,yield生成器读取文件的效率越明显。A、正确B、错误【正确答案】:A3.每个神经元只能有一个输入和一个输出。A、正确B、错误【正确答案】:B4.知识工程工具可以用来检测不一致数据。A、正确B、错误【正确答案】:A5.视频数据是随时间变化的语音流,含有更为丰富的其他媒体所无法表达的信息和内容。A、正确B、错误【正确答案】:B6.在现代汉语中,词是最小能够独立运用的语言单位。A、正确B、错误【正确答案】:A7.一个文件只能一个人下载,不能共享。A、正确B、错误【正确答案】:B8.自动学习帮助人们更简便的完成模型的训练和部署。A、正确B、错误【正确答案】:A9.一个高效的数据预料没有具有经济价值。A、正确B、错误【正确答案】:B10.数据清洗是数据预处理中重要的任务。A、正确B、错误【正确答案】:A11.机房或数据中心的设备须安排专业人员进行维护的管理。A、正确B、错误【正确答案】:A12.可以对图片进行合成、裁剪、拼接等操作A、正确B、错误【正确答案】:A13.除数据泄露风险外,从业者还需对数据标注质量严格把控。A、正确B、错误【正确答案】:A14.质检员的作用主要是提高数据标注的质量和合格率。A、正确B、错误【正确答案】:A15.对系统进行存储管理能够提高硬件资源的利用率。A、正确B、错误【正确答案】:A16.智能模型也称为基于知识的软件开发模型,它将瀑布系统与专家系统结合在一起。A、正确B、错误【正确答案】:A17.应用性能指标达不到预期通常表现为响应时间长、应用调用异常或CPU满负荷A、正确B、错误【正确答案】:A18.计算机专业人员可以歧视代表性不强的群体,可以不保证所有人的公平参与。A、正确B、错误【正确答案】:B19.常用文本文件格式有ASCll、MIME、*.txt、jpg等等A、正确B、错误【正确答案】:B20.多音字标注的质量标准只需要标注出一个字的某个读音A、正确B、错误【正确答案】:B21.语音类型的数据输出文件硬包含详细的标签信息。A、正确B、错误【正确答案】:A22.生活中骨骼关键点的应用主要集中在短视频的手部特效、智能家电的手势操控等方面。A、正确B、错误【正确答案】:A23.检查中出现异常情况时,可以继续检测。A、正确B、错误【正确答案】:B24.数据分析可帮助人们做出判断,以便采取适当行动。A、正确B、错误【正确答案】:A25.按照智力活动成果的不同,知识产权可以分为著作权、商标权、专利权、发明权、发现权等。A、正确B、错误【正确答案】:A26.数据清洗能够提升数据质量,避免对数据使用过程产生负面影响。A、正确B、错误【正确答案】:A27.操作系统是“能方便用户编程的程序”A、正确B、错误【正确答案】:B28.在进行软件版权贸易时,软件著作权登记证书作为权利证明,有利于交易的顺利完成。A、正确B、错误【正确答案】:A29.语音类型的数据输出格式为JSON或者其他通用输出格式。A、正确B、错误【正确答案】:B30.定距等级的数据值之间的差异是没有意义的。A、正确B、错误【正确答案】:B31.文本数据不能可视化。A、正确B、错误【正确答案】:B32.一人所属照片清洗工具应用场景非常单一A、正确B、错误【正确答案】:B33.智能系统的配置管理流程不仅负责核实IT基础设施中实施的变更,还负责监控IT组件的运行状态。A、正确B、错误【正确答案】:A34.低质量的数据可以产生

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论