数据标注工程-概念、方法、工具与案例-线上实验_第1页
数据标注工程-概念、方法、工具与案例-线上实验_第2页
数据标注工程-概念、方法、工具与案例-线上实验_第3页
数据标注工程-概念、方法、工具与案例-线上实验_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

STYLEREF"标题1"STYLEREF"标题1字"《数据标注工程》免费线上实验V1.0《数据标注工程》免费线上实验V1.0数加加众包培训学院是基于“数加加众包”平台(/)的在线培训系统,可针对已经注册的新手用户开展数加加新手课堂、数据标注基础培训(含人体拉框、OCR、车道线、普通对话等);同步针对平台的公会组织(数据标注服务商)负责人员,针对实际的项目工作内容开展专项培训。1.简介数加加众包培训学院根据不同的任务类型上线了多种培训课程,包括新手小课堂、道路线标注、OCR标注、人体拉框、人脸关键点标注等。课程一般包含视频、课程、问答题、标注练习、标注实战等内容。2.新手小课堂(1)数加加众包数加加众包平台是数据堂旗下的数据众包任务平台。数加加平台网站端主要提供任务展示、任务管理、工会管理、培训、社区、个人信息维护、结算记录与金额提现等功能,数加加APP端,主要用于用户执行数据采集、数据快判类任务,以及接收数加加众包平台推送的任务上新、任务指派、数据返修提醒等信息。数加加众包平台流程图如图-1所示。图1数加加众包平台流程图(2)任务及公会数加加众包任务是由项目经理根据业务需要,在平台网站端、APP等渠道发布具体的任务,如标注类、快判类、采集类、采标类、客户端类、招募类等。用户可选择感兴趣的任务信息,评估是否领取任务,成功领取任务并执行后,系统会根据任务执行情况进行费用结算。按照任务领取人的不同,数加加众包任务分为个人任务和公会任务。个人用户只能领取个人标注任务和个人质检任务,无法领取公会任务。公会会员可执行公会的标注、自检任务(即公会或项目组的自行质检工作)。公会是数加加众包平台为了满足精准化数据执行,高效率任务执行,便捷化团队沟通管理等需求建立的项目团队组织。公会分为个人公会和企业公会,两种公会在创建时需要提供的认证信息不同,但均可在平台领取公会任务。公会成员可以获得更多的任务执行机会、更丰厚的收入和有经验的导师指点。自检任务是系统对应标注任务自动生成的任务,在公会内部由会长指派自检人,自检人按标注人分批次抽检。一个自检人会对一个标注人进行一批数据检查。(3)标注工具数加加众包平台支持图像、语音、文本、视频、3D点云的标注,具体的标注工具如下:1)目标检测-拉框:拉框是图片标注的一种常见类型,是指用矩形框将图片中符合标注要求的目标框选出来。2)目标分割-图像分割:图像分割是一种复杂的2D图形标注,需要将图片中的物体按照要求使用多边形图形绘制出来,常见的有道路、发丝、全景分割。3)关键点标注-骨骼/手势:关键点标注是需要在物体的规定位置标注关键点,常见的有人体骨骼、手势关键点,复杂的还有人脸108点等。4)单人语音转写:单人语音转写是将一段时长较短的音频内容转写成文字,并标记是否合格。5)中英混合TTS校验:中英混合TTS校验是对已经转写的内容进行中文、英文、拼音、音标校验,将错误的内容改正过来。6)多段落语音标注:多段落语音标注是将一段时长较长的音频内容转写成数段文字,并填写相应的标签和属性7)实体关系标注:实体标注是将文本内容中的实体抽取并标记实体标签,然后对有关系的实体进行关系连接。8)交互意图标注:交互意图标注是对一句话进行拆分理解,对文本中涉及的领域、意图、槽位、槽值标记出来。9)阅读理解标注:阅读理解顾名思义就是对一篇文章进行理解分析,阅读文章内容并进行自问自答。10)视频事件标注:视频事件标注是对视频进行切分打点,并将切分出来的段落标记发生的事件及属性。11)视频追踪标注:视频追踪标注是对从视频中抽帧出来的图片进行拉框标注,并保持不同视频帧图像中的同一个物体为同一个ID。12)3D点云标注:对雷达点云文件中的物体,如车、人绘制3D图形并标记属性标签,同时对映射的2D图片进行微调,保证框的贴合。(4)勋章数加加平台培训学院根据课程类型配置相应的勋章,随着课程的完善,会增加不同的勋章与之对应。用户通过课程学习可获得勋章,部分任务要求用户必须拥有勋章才能领取。不同的课程获得勋章的方式也不一样,用户需完成课程中所有小节内容,方可获得勋章。每个小节完成的标准不一样:若当前小节有标注实战,用户需完成标注实战才算完成小节;否则,用户只需阅读培训材料即可。当所有小节课程完成后,系统会自动发放并点亮课程对应的勋章!图-2为课程勋章,其中左图彩色勋章图标表示已获得当前勋章,右图灰色勋章图标表示尚未获得当前勋章。图-2课程勋章3.数据标注基础培训示例数据标注基础培训包括道路线标注、OCR标注、人体拉框、人脸关键点标注、普通话对话标注、英文朗读标注等课程,本节以道路线标注、普通话对话标注为例进行介绍。(1)道路线标注课程道路线标注课程包含视频、课程、问答题、考试实战。其中,课程内容包括什么是道路线标注、道路线的类别及属性、道路线的标注方法规则、常见问题、平台标注方法等内容。图3左图为道路线标注课程,图-3右图为课程问答题,图-4为道路线标注课程的标注练习示意图。用户通过视频、课程、问答题的学习对道路线标注课程有一定了解,通过标注练习、标注实战掌握道路线标注技能。图-3道路线标注课程图-4道路线标注课程-标注练习示意图(2)普通话对话标注课程普通话对话标注课程包括视频、课程、问答题、标注练习、标注实战等内容,其中课程包括什么是普通话对话标注、普通话对话标注的要点、数加加平台语音标注使用方法、常见问题等内容。图-5左图为普通话对话标注课程,图-5右图为课程问答题

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论