DB14-T 2464-2022 人工智能 数据标注一般技术要求_第1页
DB14-T 2464-2022 人工智能 数据标注一般技术要求_第2页
DB14-T 2464-2022 人工智能 数据标注一般技术要求_第3页
DB14-T 2464-2022 人工智能 数据标注一般技术要求_第4页
DB14-T 2464-2022 人工智能 数据标注一般技术要求_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS33.160.40CCSA9114IDB14/T2464—2022前言 2规范性引用文件 3术语和定义 4技术分类 5技术要求 参考文献 DB14/T2464—2022本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草。本文件由山西省工业和信息化厅提出、组织实施和监督检查。山西省市场监督管理局对标准的组织实施情况进行监督检查。本文件由山西省物联网和人工智能标准化技术委员会归口。本文件起草单位:百度云计算技术(山西)有限公司、山西省大众科技评估中心、山西集智数据服务有限公司、山西物联网行业技术中心(有限公司)、山西灵波微步科技有限公司、山西省科技评估学会。本文件主要起草人:高海峰、李昱霖、李兴华、闵楠、胡驰、尉赤、张辰妹、吴泽衔、查晓丹、李先军、郭瑞鹏、赵波、李鹏、李鹏飞。1DB14/T2464—2022人工智能数据标注一般技术要求本文件规定了人工智能机器学习中数据标注通用技术要求的术语和定义、通用技术分类和通用技术要求。本文件适用于人工智能机器学习中数据标注的企业、高校、研究机构、政府机关。其他行业和机构可参照执行。2规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。DB14/T2463人工智能数据标注总体框架3术语和定义DB14/T2463界定的以及下列术语和定义适用于本文件。3.1数据标注预处理技术dataannotationpreprocessingtechnology在正式开始标注作业前,通过人工或技术的方式对待标注数据做筛选或预备标注,以实现提高后续标注效率的技术手段。4技术分类4.1数据标注通用技术包括数据标注预处理技术和数据标注技术。4.2数据标注预处理技术包括对数据清洗、预标注。4.3数据标注技术包括对数据的转写、切割、评分、提取、选择、富集标注、点标注、线标注、框标注、区域标注。5技术要求5.1预处理技术要求5.1.1清洗2DB14/T2464—2022清洗是对数据进行结构化标注前做的预处理技术。应通过人工判断方式剔除不符合标注标准的无效数据,筛选出可标注数据。5.1.2预标注预标注技术要求应用机器学习算法对待标注数据做识别和预先标注处理。5.2数据标注技术要求5.2.1转写应按照标注规则要求将数据转换为相应文本。5.2.2切割应按照标注规则将数据分割并标注为要求的片段。5.2.3评分应按照标注规则对数据进行主观判断并打分。5.2.4提取应按照标注规则将主题内容提炼,描述为相应文本。5.2.5选择应按照标注规则,对数据在给定选项中选择标签及属性。5.2.6富集标注应根据标注规则给定的场景、主题及描述,编写出与主题相关联文本。5.2.7点标注应按照标注规则,对图像中的指定位置进行标点。5.2.8线标注应按照标注规则,对图像中的指定区域用线条进行标注。5.2.9框标注应按照标注规则,对图像中的指定对象,用物体的最小外接框进行框选(框选范围允许包含指定对象外的部分区域)。5.2.10区域标注应按照标注规则,对图像中的指定对象进行多边形贴合标注。3DB14/T246

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论