数据集特征标签_第1页
数据集特征标签_第2页
数据集特征标签_第3页
数据集特征标签_第4页
数据集特征标签_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

主讲:张驰0102目录打标签工具常见的数据集打标签的工具1(1)Labelimg/Labelme这两款工具简便易行,前者主要用于对目标进行大致的标定,用于常见的框选标定,后者主要用于较为细致的轮廓标定,多用于maskrcnn等。安装也是很方便的,直接在终端下用pipinstalllabelimg即可(至于labelme,需要先安装pyqt,所以先pipinstallpython-qt5,然后再pipinstalllabelme)。其使用界面如下:(2)NLP标注工具BRATBRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的标注结果能够把无结构化的原始文本结构化,供计算机处理。利用该工具可以方便的获得各项NLP任务需要的标注语料。其使用教程可参考/tcx1992/article/details/80580089。标注结果示例如下:(3)视频标注工具CDVA(compactdescriptorforvideoanalysis),主要是基于CDVS中的紧凑视觉描述子来做视频分析,之前是紧凑视觉描述子主要应用在图像检索领域。需要制作新的数据集,对视频帧进行标注,所以根据网上一个博主的标注工具进行了一定的修改,实现的功能是在每一帧中将需要标注的区域用鼠标选取4个点,顺序是顺时针。因为四边形的范围更广,之前的一些人直接标注了矩形,但是在一些仿射变换中,往往矩形的定位效果不好,矩形定位应该比较适合于人脸定位和行人定位之中。其参考教程:/louyihang-loves-baiyan/p/4457462.html。Vatic源自MIT的一个研究项目(VideoAnnotationToolfromIrvine,California)。输入一段视频,支持自动抽取成粒度合适的标注任务并在流程上支持接入亚马逊的众包平台MechanicalTurk。除此之外,其还有很多实用的特性:1.简洁使用的GUI界面,支持多种快捷键操作2.基于opencv的tracking,这样就可以抽样的标注,减少工作量具体使用时,可以设定要标注的物体label,比如:水果,人,车,等等。然后指派任务给到众包平台(也可是自己的数据工程师)。现阶段支持的标注样式是框(box)。一个示例,下图标注了NBA直播比赛中的运动员.参考链接:/vondrick/vatic/常见的数据集21、目标检测、分类、分割(1)mnist

手写字体识别是深度学习入门级数据样本集,总共有70000张28*28的手写字体黑白图片,可在/exdb/mnist/获取(2)PASCALVOCPASCALVOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCALVOC图片集常见的有voc2005、voc2007、voc2012等,其包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCALVOC挑战赛在2012年后便不再举办,但其数据集图像质量好,标注完备,非常适合用来测试算法性能。数据集大小为2GB左右下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/index.html1、目标检测、分类、分割(3)COCO数据集

COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。Google开源的开源了图说生成模型showandtell就是在此数据集上测试的,想玩的可以下下来试试哈。数据集大小约为40GB

下载地址:/,COCO(CommonObjectsinContext)是一个新的图像识别、分割和图像语义数据集,它有如下特点:ObjectsegmentationRecognitioninContextMultipleobjectsperimageMorethan300,000imagesMorethan2Millioninstances80objectcategories5captionsperimageKeypointson100,000people(4)

Imagenet数据集

业界标杆Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注,具体信息如下:Totalnumberofnon-emptysynsets:21841Totalnumberofimages:14,197,122Numberofimageswithboundingboxannotations:1,034,908NumberofsynsetswithSIFTfeatures:1000NumberofimageswithSIFTfeatures:1.2million

Imagenet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。由李飞飞教授及其团队创立,数据集大小:~1TB(ILSVRC2016比赛全部数据),下载地址:/about-stats.2、行人检测、人脸检测识别(1)Caltech行人

数据库:/Image_Datasets/CaltechPedestrians/该数据库是目前规模较大的行人数据库,采用车载摄像头拍摄,约10个小时左右,视频的分辨率为640×480,30帧/秒。标注了约250,000帧(约137分钟),350000个矩形框,2300个行人,另外还对矩形框之间的时间对应关系及其遮挡的情况进行标注。数据集分为set00~set10,其中set00~set05为训练集,set06~set10为测试集(标注信息尚未公开)。其他数据集可参考:行人检测:/17004.html(2)人脸检测:UMDFaces(http://www.umdfaces.io/

)不仅有人脸的目标检测数据,还有关键点的数据,非常适合做训练。

就是比较大,总共有三个文件,一共8000+个类别,总共36W张人脸图片,全都是经过标注的样本,标注信息保存在csv文件中,除了人脸的box,还有人脸特征点的方位信息,强力推荐!(3)人脸识别数据库

2010年非约束环境人脸检测数据库FDDB,总共2845张图像,5171张,人脸非约束环境,人脸的难度较大,有面部表情,双下巴,光照变化,穿戴,夸张发型,遮挡等难点,是目标最常用的数据库。2016年提出的,目前难度最大的WIDERFACE,共32203图像,393703标注人脸,目前难度最大,各种难点比较全面:尺度,姿态,遮挡,表情,化妆,光照等。李子青组的CASIA-WebFace(50万,1万个人).需申请.CenterforBiometricsandSecurityResearch

华盛顿大学百万人脸MegaFace数据集.邮件申请,是一个60G的压缩文件.MegaFace

南洋理工WLFDB.(70万+,6,025).需申请.WLFDB:WeaklyLabeledFacesDatabase

微软的MSRA-CFW(202792张,1583人).可以直接通过OneDrive下载.MSRA-CFW:DataSetofCelebrityFacesontheWeb

汤晓欧实验室的CelebA(20万+),标注信息丰富.FaceScrub.提供图片下载链接(100,100张,530人).vintage–resources(4)人体姿态识别(/qq_38522972/article/details/82953477)2D数据:LSP

FLIC

MPII

MSCOCO

AIChallenge3D数据:Human3.6M数据集

CMUPanopticdataset

MPI-INF-3DHP3、自动驾驶(/p/61023298(1)H3D-HRI-US

-本田研究所于2019年3月发布其无人驾驶方向数据集,使用3DLiDAR扫描仪收集的大型全环绕3D多目标检测和跟踪数据集。其包含160个拥挤且高度互动的交通场景,在27,721帧中共有100万个标记实例。凭借独特的数据集大小,丰富的注释和复杂的场景,H3D聚集在一起,以激发对全环绕3D多目标检测和跟踪的研究。(2)nuScenes

-安波福于2019年3月正式公开了其数据集,拥有从波士顿和新加坡收集的1000个“场景”的信息,包含每个城市环境中都有的最复杂的一些驾驶场景。该数据集由140万张图像、39万次激光雷达扫描和140万个3D人工注释边界框组成,是迄今为止公布的最大的多模态3D无人驾驶数据集。(3)ApolloCar3D-该数据集包含5,277个驾驶图像和超过60K的汽车实例,其中每辆汽车都配备了具有绝对模型尺寸和语义标记关键点的行业级3DCAD模型。该数据集比PASCA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论