数据标注工程-概念、方法、工具与案例 课件 第12章 数据标注的发展趋势_第1页
数据标注工程-概念、方法、工具与案例 课件 第12章 数据标注的发展趋势_第2页
数据标注工程-概念、方法、工具与案例 课件 第12章 数据标注的发展趋势_第3页
数据标注工程-概念、方法、工具与案例 课件 第12章 数据标注的发展趋势_第4页
数据标注工程-概念、方法、工具与案例 课件 第12章 数据标注的发展趋势_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能技术应用核心课程系列教材数据标注工程——概念、方法、工具与案例第12章数据标注的发展趋势12.2人工智能数据发展趋势人工智能技术应用核心课程系列教材12.1人工智能总体发展趋势12.4本章小结12.5作业与练习12.3数据标注发展趋势12.1

人工智能总体发展趋势

第12章数据标注的发展趋势美国早在2013年设立了“推进创新神经技术脑研究计划”,计划未来12年投入45亿美元支持研发;欧盟提出人脑计划,共有15个国家参与;我国也出台了《国务院关于印发新一代人工智能发展规划的通知》(国发〔2017〕35号)、《促进新一代人工智能产业发展三年行动计划(2018-2020年)》(工信部科[2017]315号)等系列政策。12.1.1主要国家和地区高度重视AI发展12.1

人工智能总体发展趋势

第12章数据标注的发展趋势人工智能技术的生态链,可以划分为基础层、数据层、技术层和应用层。在数据层面,我国采集场景丰富,加上人工成本相对较低,能够低成本获得海量标准化训练数据,较其他国家具有绝对优势。12.1.1主要国家和地区高度重视AI发展12.1

人工智能总体发展趋势

第12章数据标注的发展趋势数据、算法、算力是人工智能的三要素。目前人工智能商业化在算力、算法方面基本达到阶段性成熟,想要更加落地,解决行业具体痛点,需要大量经过标注处理的相关数据做算法训练支撑,可以说数据决定了人工智能的落地程度。机器学习特别是深度学习是现阶段实现人工智能的主要手段。深度学习算法多采用有监督学习模式,即需要标注数据对学习结果进行反馈,在大量数据训练下,算法错误率能大大降低。12.1.2有监督学习仍是人工智能的主流12.1

人工智能总体发展趋势

第12章数据标注的发展趋势数据越多,效果越好。业界的共识是“大量数据+普通模型”往往会比“普通数据+高级模型”的效果要好。12.1.2有监督学习仍是人工智能的主流第12章数据标注的发展趋势12.2人工智能数据发展趋势人工智能技术应用核心课程系列教材12.1人工智能总体发展趋势12.4本章小结12.5作业与练习12.3数据标注发展趋势12.2人工智能数据发展趋势

第12章数据标注的发展趋势自动驾驶应用中的数据需求12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势语音识别应用中的数据需求语音识别设备的开发,需要在覆盖全国各大方言区域,采集各地主要语种语料,需要从多种生活化语音录制场景中筛选出高标准语音数据。包括重口音、普通话,方言、少数民族语言、主流外文等语种,采集设备需涵盖主流设备(安卓、IOS、高麦)。语音识别数据可用于同步翻译、机器人语言训练、手机助手、车载智能交互、智能客服等应用场景。12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势人脸识别应用中的数据需求人脸识别技术的发展需要提供多种类型的人脸图像数据:一人多照图像数据、各类表情姿态图像数据、覆盖全年龄段人脸图像及视频数据和监控视频类人脸图像数据等。此外还需要定制专属人脸图像数据。人种分布于黄种人、白种人、黑种人,具有多角度、多光照、多姿态、跨年龄等多采集方式,采集设备涵盖高倍相机、相机阵列、3D照相机等多种设备,标注内容包括关键点、脸廓、发髻、情绪等。人脸识别数据可应用于银行身份认证、高铁进站核验、智能安防等场景。12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势智能家居应用中的数据需求智能家居系列数据包含儿童语音识别、多语种混合识别、老人语音识别、远场语音识别和方言语音识别等系列数据。主要应用于智能音箱、智能家电、儿童故事机、陪伴机器人等产品研究领域。12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势智能安防应用中的数据需求12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势智能制造应用中的数据需求12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势智能交通应用中的数据需求随着交通卡口的大规模联网,汇集了海量车辆通行记录信息,利用人工智能技术,可实时分析城市交通流量,调整红绿灯间隔,缩短车辆等待时间等举措,提升城市道路的通行效率。12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势人工智能对数据资源服务的需求趋势12.2.1人工智能数据需求12.2人工智能数据发展趋势

第12章数据标注的发展趋势12.2.2人工智能数据市场规模12.2人工智能数据发展趋势

第12章数据标注的发展趋势在新一代人工智能发展的角度上看,人工智能数据呈现以下特点:(1)数据量大:为了建模的准确性,需要一定规模的数据量。当数据量越大,覆盖的问题范围增大,依据数据创立的模型也就越准确。在可能的情况下,数据量尽可能地增大,因此产生大量的数据需要进行标注。(2)数据类型繁杂:随着传感器的精度和类型的变化,采集的数据类型也是增加的。例如在自动驾驶中使用的激光雷达数据,就是近期出现的新的数据类型。12.2.3人工智能数据需求特点12.2人工智能数据发展趋势

第12章数据标注的发展趋势在新一代人工智能发展的角度上看,人工智能数据呈现以下特点:(3)多模数据组合标注:在同一个时空限定范围内,不只有一种类型的数据,而是需要对多种类型的数据同时进行标注。例如,相同时空条件下,语音、视频、文字同时进行标注。(4)数据安全性不断提升:人们对数据安全的意识不断增强,在进行数据产品生产和标注的同时,数据涉及个人隐私或存在个人隐私泄露的可能时,都需要谨慎处理,规避未知风险和社会问题。12.2.3人工智能数据需求特点第12章数据标注的发展趋势12.2人工智能数据发展趋势人工智能技术应用核心课程系列教材12.1人工智能总体发展趋势12.4本章小结12.5作业与练习12.3数据标注发展趋势12.3数据标注发展趋势

第12章数据标注的发展趋势当前人工智能发展出现了细分化、多模态以及专业化特征。自动驾驶:需要雷达+摄像头才能跑的更稳安防行业:需要摄像头+雷达红外射频才能感知得更精准、更真实智能医疗:需要专业的医师才能标注医疗影像智能制造:需要业内有经验的工人师傅才能标注工业缺陷12.3.1定制化精细化发展12.3数据标注发展趋势

第12章数据标注的发展趋势随着人工智能技术的发展,数据标注工具需要从只支持人工标注逐渐转化为人工标注+智能辅助标注的方法。通过使用计算机视觉和语音识别技术对数据进行初步识别,可以在短时间内达到90%以上的校验正确率,实现几倍于人力的工作效率。12.3.2高度自动化发展12.3数据标注发展趋势

第12章数据标注的发展趋势2019年,华为云发布ModelArts2.0,只需人工标注一小部分数据,它就可以帮你标注剩下数据。人工智能软件公司Neurala在视频数据标注自动化上,当标注员标了视频第一帧图像中的目标(人或车)后,可以自动标注后续帧里的目标。标注成本从每小时13500美元降到6750美元。12.3.2高度自动化发展12.3数据标注发展趋势

第12章数据标注的发展趋势人工智能对数据的依赖已经从小规模、低质量逐渐过渡到大批量、高效率、低成本的阶段,个体化、小作坊式的数据产品生产方式已经不能满足现有数据需求,迫切需要通过工业化、流程化、规模化数据产品生产提升数据标注的效率。需要拥有一套自主研发贯通数据库设计、数据采集、数据处理、质量检测、质量控制和数据安全管理等各环节于一体,并且能对图像、文本、语音、视频以及点云数据做到一站式加工处理的管理和执行一体化平台。12.3.3智能化流程化发展12.3数据标注发展趋势

第12章数据标注的发展趋势国家出台了各种政策,加强个人隐私保护。未经用户授权不得泄露。一些金融机构和政府部门格外关注外包标注数据的安全性。为了保证数据标注平台中数据的安全性和隐私不被泄露,可以考虑采取数据治理、数据分割、数据安全传输和区块链等技术。12.3.3重视安全与隐私保护第12章数据标注的发展趋势12.2人工智能数据发展趋势人工智能技术应用核心课程系列教材12.1人工智能总体发展趋势12.4本章小结12.5作业与练习12.3数据标注发展趋势12.3数据标注发展趋势

第12章数据标注的发展趋势目前人工智能发展依旧火热,并且仍以有监督学习的模型训练方式为主。随着AI商业化进程的演进,数据规模和市场越来越庞大,更具有前瞻性的数据集产品和高定制化服务成为AI基础数据服务行业的主要服务形式。数据标注的发展趋势:数据标注越来越朝着高质量、精细化、定制化的方向发展;数据标注受人工智能的影响,自动化程度越来越高;数据标注中越来越重视安全性与隐私保护。第12章数据标注的发展趋势12.2人工智能数据发展趋势人工智能技术应用核心课程系列教材12.1人工智能总体发展趋势12.4本章小结12.5作业与练习12.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论