




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、汽车测试漫谈之四:汽车数据采集与分析汽车数据采集可以分为两大类,一类是驾驶者行为数 据采集,另一类是深度学习视觉训练数据采集。数据采集 必然是有选择性的,最简单也最普遍的一类机器学习算法 就是分类(classification)。对于分类,输入的训练数据有特 征(feature),有标签(label)。所谓的学习,其本质就是 找到特征和标签间的关系(mapping)o这样当有特征而无 标签的未知数据输入时,我们就可以通过已有的关系得到 未知数据标签。如果所有训练数据都有标签,则为有监督 学习(supervised learning)。如果数据没有标签,显然就是 无监督学习(unsupervis
2、edlearning) 了,也即聚类(clustering)。聚类学习目前处于起步阶段,与分类学习比 简直是天壤之别,即便不需要标注,但是也需要特征,某 种意义上也可以说不是绝对意义的无监督学习。驾驶者行 为数据,这是评价ADAS系统最客观的方法,根据此数据 分析可以得出ADAS系统是否对驾驶安全有提升,是否有 价值。最知名的则是由美国策略性公路研究计划(The second StrategicHighway Research Program, SHRP 2) 中的 自然驾驶研究计划(Naturalistic Driving Study,NDS)。行驶 于弗吉尼亚州北部(NorthernVir
3、ginia)及华盛顿哥伦比亚特 区(Washington, D.C.)中之100辆被选定的机动车辆为记 录对象,且为了能够记录驾驶人实际的驾驶情况,其计划 执行单位并没有针对被选驾驶人举办关于此研究计划的说 明会。这些实验是在无干扰,无实验人员出现,日常驾驶 状态下进行的。此计划总共为期两年,其总共搜集2000000车行里程(vehicle miles)及43000小时的行驶数 据。其中,总共记录828笔事故及几近事故资料,其中包 含68件碰撞(crash)及760件几近碰撞(near-crash)。2012年NDS项目扩展到中国,上海同济大学、通用汽车和 弗吉尼亚理工大学三方合作,在2012
4、年12月开始,于 2015年12月结束,按计划采集90名中国驾驶员的日常驾 驶行为数据,每辆车均配备Mobileye的C2-270(FCW)和 SHRP2 NextGen数据采集系统。总共5辆车,分别是2辆 君越,2辆科鲁兹,1辆卡迪拉克DTS。每位实验者驾驶实 验车辆2个月,第一个月开启Mobileye,第二个月关闭。 SHRP2 NextGen数据采集系统包括车辆数据总线接口,三 轴加速度计,可跟踪9个目标的毫米波雷达,温度与湿度 传感器,GPS定位系统,四路摄像头,这四路分别是驾驶 者面部,车辆前方,车辆后方,驾驶员手部。采集频率从 10-100HZ不等。需要指出,没有厂家开放CAN总线
5、,OBD根本拿不到什么有价值的数据。据说SHRP2 NextGen 由日本富士通设计并制造,使用了高性能FPGA。上图为装载了 SHARP2 NextGen的车辆后备箱,需要指出 这是2008年的设计,换到今日,体积可以大幅度缩小。 截至到2015年7月,上海的NDS研究共采集了55名驾驶 员,大约13万公里的驾驶数据。选择19名典型驾驶员数 据分析,共4573次出行,累计公里数为60689公里。其中 32797采集自Mobileye关闭阶段,27892公里采集自 Mobileye开启阶段。驾驶员年龄分布在28-61岁之间,平 均年龄40.9岁,驾龄在1-16年之间,平均驾龄6.6年。研 究结
6、论表明FCW对驾驶员行为并未有明显改变,只是略微 降低了驾驶员跟车的反应时间。光线晴好的情况下,略微 降低了130毫秒,反应时间变短,只是稍微加速了交通流 的速度。欧洲也有类似的项目,名字为EuroFOT,主要在 西班牙和德国开展,包括商用车。德国车队有200辆车, 包括60辆MAN卡车,100辆福特轿车和40辆大众轿车。 福特车辆均配备了 FCW和ACC。MAN则配备了 CSW(Curve Speed Warning)和 LDW。大众则配备了 ACC 和 LDW。主要研究ACC、LDW、CSW、FCW对驾驶员的影 响。西班牙由 CTAG (Centre Technologique de lA
7、utomobile deGalice)主导,共40辆车,主要研究巡航 控制和速度控制对驾驶员的影响。CTAG自己开发了 Can数 据采集器。西班牙的40辆车中35辆装配低级采集设备,5辆装配高级 采集设备。上图为高级采集设备,包括1个红外摄像头、4个摄像头和 1个天合的AC20毫米波雷达。红外摄像头是个眼球轨迹跟 踪器。4个摄像头,分别对应脚下、脸部、前方和手部。至 于研究成果,目前还未透露。再有一类驾驶者行为数据采 集是为了深度学习训练数据用的,试图让机器学习人类的 驾驶技能,最早美国波音公司曾对其研究,论文为A Survey of Robot Learning from Demonstra
8、tion,提出 LFD。后来美国陆军实验室资助CMU开发,主要研究者是 David Silver, J. Andrew Bagnell 和 AnthonyStentz,这篇论 文的名字为Learning Autonomous Driving Styles and Maneuversfrom Expert Demonstration进一步发展 LFD, 最后就是英伟达的端到端深度学习。训练数据包括从视频中采样得到的单帧视频,以及对应的 方向控制命令(1/r)。只用驾驶员操作的数据训练远远不 够;网络模型还需要学习如何纠正错误的操作,否则汽车 就会慢慢偏离公路了。于是,训练数据额外补充了大量图 像
9、,包括汽车从车道中心的各种偏移和转弯。两个特定的 偏离中心的图像可以从左和右两台相机得到。摄像机之间 的其它偏离以及所有的旋转都靠临近摄像机的视角变换来 仿真。精确的视角转换需要具备3D场景的知识,而这套系 统却不具备这些知识,因此假设所有低于地平线的点都在 地平面上,所有地平线以上的点都在无限远处,以此来近 似地估计视角变换。在平坦的地区这种方法没问题,但是 对于更完整的渲染,会造成地面上物体的扭曲,比如汽 车、树木和建筑等。英伟达认为这些扭曲对网络模型训练 并无大碍。方向控制会根据变换后的图像迅速得到修正, 使得汽车能在两秒之内回到正确的位置和方向。图像输入到CNN网络计算方向控制命令。预
10、测的方向控制 命令与理想的控制命令相比较,然后调整CNN模型的权值 使得预测值尽可能接近理想值。权值调整是由机器学习库 Torch 7的后向传播算法完成。日本人将这个系统扩展,单 靠摄像头根本不可靠,激光雷达是少不了的。日本自动驾 驶联盟SIP-AURAS将开发驾驶者行为数据库的任务交给了 日本JARI,日本汽车研究院。这套系统也可以用来研究驾驶者行为,也可以用来做训练 数据。日本汽车研究院与名古屋大学合作,计划使用30辆车在日 本全国采集数据。日本的数据采集系统不仅有激光雷达,还有眼球与面部轨 迹,还有心跳次数。上图为数据采集车。激光雷达原始数据庞大,每秒大约300MB,转换为JPEG 格式
11、的图像后每秒大约3MB。搜集深度学习训练数据做图 形识别最典型的莫过KITTI。德国卡尔斯鲁厄理工学院和芝 加哥丰田技术研究所联合建立的一个算法评测平台KITTI, 成为目前国际上公开的最大的自动驾驶场景下的计算机视 觉算法评测数据集。有2012和2015两个版本。其他比较 知名的还有,Cityscapes,奔驰联合德国老牌工科大学达姆 施塔特工业大学、普朗克研究院、德累斯顿工业大学做 的;剑桥大学的CamVid,牛津大学的Oxford RobotCar, 斯坦福大学的ImageNet,英国利兹大学、苏黎世工学院、 爱丁堡大学、微软剑桥研究院、牛津大学联合推出的Pascal VOC, Leuv
12、en 大学的 Leuven,美国 Middlebury 大学的 Middlebury。KITTY采集车配置:-2 xPointGray Flea2灰度摄像头(FL2- 14S3M-C),140 万像素,1/2” Sony ICX267 CCD, - 2 xPointGray Flea2 彩色摄像头(FL2-14S3C-C), 140 万像素, 1/2” Sony ICX267 CCD 4 x EdmundOptics lenses, 4mm, opening angle 90?,vertical opening angle of region of interest(ROI) 35? 1 x
13、Velodyne HDL-64E rotating 3D laser scanner,10 Hz,64 beams, 0.09 degree angular resolution, 2 cm distance accuracy,collecting 1.3 million points/second, field ofview: 360? horizontal, 26.8? vertical, range: 120 m 1 x OXTS RT3003 inertial andGPS navigation system,6 axis, 100 Hz, L1/L2 RTK, resolution:
14、 0.02m / 0.1?上 图为传感器布局采集车的双目摄像头基线长54厘米,车载 电脑为英特尔至强的X5650 Cpu, RAID 5 4TB硬盘。采集 时间是2011年的9月底和10月初,总共大约5天,总数 据集大约180GB (要做大规模商业化应用至少要有PB级的 训练数据),2015年做了扩展。主要内容如下,分训练和测 试数据。上图为Kitti数据格式。To generate 3D object ground-truth we hired a set of annotators, andasked them to assign tracklets in the form of 3D b
15、ounding boxes to objects suchas cars, vans, trucks,trams, pedestrians and cyclists. Unlike most existingbenchmarks, we do not rely on online crowd-sourcing to perform the labeling.Towards this goal, we create a special purpose labeling tool, which displays 3Dlaser points as well as the camera images
16、 to increase the quality of theannotations .与大多数数据集不 同,Kitti没有采用众包的形式来手工标注,而是自己基于激 光雷达开发了自动标注工具。Cityscape没有公布其采集车 的照片,其采集车没有采用激光雷达,只用了一个基线为 22厘米的200万像素级的双目摄像头,使用安森美的 AR0331传感器,拥有HDR高动态范围,且是在车内部, 而不是在车外面。输出16比特的线性色彩。没有使用 IMU,只有一个GPS。总共25000张图像,其中人工选择了 5000张前景突出,视差明显的图像做精细标注。20000张 前景不突出,驾驶者20米内图像,采用7
17、LabelMe的自动 标注软件,做了简易标注。搜集训练数据再做标注,需要 耗费巨大的人力,例如在自然语言处理(NLP)中,Penn Chinese Treebank在2年里只完成了 4000句话的标签。要 知道玩深度学习计算机视觉的人可都是热门人才,月薪动 辄好几万。即便做最没技术含量的手工标注,也是人工费 用不低。牛津大学搞了一套基于弱监督的学习系统。在实 际应用中的学习问题往往以混合形式出现如多标记多示 例、半监督多标记、弱标记多标记等,像光线对图像质量 影响很大,人工标注也不可能每帧图像都标得非常好。针 对监督信息不完整或不明确对象的学习问题统称为弱监督 学习,弱监督学习可以看作是有多个标记的数据集合,次 集合可以是空集,单个元素,或是多个元素的。这套系统输入图像,输出的是语义化分割的图像,提供驾 驶路径建议,也就是Free Space。这套系统在一辆日产聆风 上安装了一个Point GreyBumblebee XB3双目摄像头,输入 精度为640*256,车两侧各装一个Si
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年硅湖职业技术学院单招职业技能测试题库及答案一套
- 2025年福建省龙岩单招职业倾向性测试题库a4版
- 2025年广州体育职业技术学院单招职业倾向性测试题库完整版
- 2025年甘肃省金昌市单招职业倾向性测试题库完整
- 2025年福建水利电力职业技术学院单招职业倾向性测试题库一套
- 2025年广东岭南职业技术学院单招综合素质考试题库含答案
- 2025年广东省佛山市单招职业倾向性考试题库有答案
- 2025年广东省韶关市单招职业倾向性测试题库一套
- 2025年甘肃钢铁职业技术学院单招综合素质考试题库带答案
- 2025年大庆医学高等专科学校单招职业技能测试题库附答案
- 16防冲工题库题库(238道)
- 2023年常州工业职业技术学院高职单招(语文)试题库含答案解析
- GB/T 3452.2-2007液压气动用O形橡胶密封圈第2部分:外观质量检验规范
- GB/T 30797-2014食品用洗涤剂试验方法总砷的测定
- GB/T 20057-2012滚动轴承圆柱滚子轴承平挡圈和套圈无挡边端倒角尺寸
- GB/T 19808-2005塑料管材和管件公称外径大于或等于90mm的聚乙烯电熔组件的拉伸剥离试验
- GB/T 10051.1-2010起重吊钩第1部分:力学性能、起重量、应力及材料
- 2022年人民交通出版社股份有限公司招聘笔试试题及答案解析
- 班组建设工作体系课件
- 第章交通调查与数据分析课件
- 穆斯林太巴热咳庆念词文
评论
0/150
提交评论