


版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、反思深度学习与传统计算机视觉的关系反思深度学习与传统计算机视觉的关系如今,深度学习在众多领域都有一席之地,尤其是在计算机视觉领域。尽管很多人都为之深深着迷,然而,深网就相当于一个黑盒子,我们大多数人,甚至是该领域接受过培训的科学家,都不知道它们到底是如何运作的。大量有关深度学习的成功或失败事例给我们上了贵重的一课,教会我们正确处理数据。在这篇文章中,我们将深化剖析深度学习的潜力,深度学习与经典计算机视觉的关系,以及深度学习用于关键应用程序的潜在危急。视觉问题的简洁与简单首先,我们需要就视觉/计算机视觉问题提出一些看法。原则上它可以这样理解,人们给定一幅由摄像机拍摄的图像,并允许计算机回答关于与
2、该图像内容的相关问题。问题的范围可以从“图像中是否存在三角形”,“图像中是否有人脸” 等简洁问题到更为简单的问题,例如“图像中是否有狗在追赶猫”。尽管这类的问题看起来很相像,对于人类来说甚至有点微不足道,但事实证明,这些问题所隐蔽的简单性存在巨大差异。虽然回答诸如“图像中是否有红圈”或“图像中有多少亮点”之类的问题相对简洁,但其他看似简洁的问题如“图像中是否有一只猫”,则要简单得多。“简洁”视觉问题和“简单”视觉问题之间的区分难以界限。这一点值得留意,由于对于人类这种高度视觉化的动物来说,上述全部问题都是不足以成犯难题,即便是对孩子们来说,回答上述视觉问题也并不困难。然而,处在变革时期的深度学
3、习却无法回答这些问题。1 / 7传统计算机视觉v.s.深度学习传统计算机视觉是广泛算法的集合,允许计算机从图像中提取信息(通常表示为像素值数组)。目前,传统计算机视觉已有多种用途,例如对不同的对象进行去噪,增加和检测。一些用途旨在查找简洁的几何原语,如边缘检测,形态分析,霍夫变换, 斑点检测,角点检测,各种图像阈值化技术等。还有一些特征代表技术,如方向梯度直方图可以作为机器学习分类器的前端,来构建更简单的检测器。与普遍的看法相反,上面争辩的工具结合在一起可以造出针对特定对象的检测器,这种检测器性能强,效率高。除此之外,人们还可以构建面部检测器,汽车检测器,路标检测器,在精准度和计算简单性等方面
4、,这些检测器很可能优于深度学习。但问题是,每个检测器都需要由有力量的人从头开头构建,这一行为低效又昂贵。因此,从历史上看,表现优良的探测器只适用于那些必需经常被检测,并且能够证明前期投资是明智的对象。这些探测器中有很多是专有的,不向公众开放,比如人脸检测器,车牌识别器等等。但是,没有一个心智正常的人会花钱编写狗探测器或分类器, 以便从图像中对狗的品种进行分类。于是,深度学习就派上了用场。尖子生的启迪假设你正在教授计算机视觉课程,在课程的前半部分,你要带领同学们复习大量的专业学问,然后留时间给同学完成任务,也就是收集图像内容并提问。任务一开头很简洁,例如通过询问图像中是否有圆形或正方形,再到更简
5、单的任务,例如区分猫和狗。2 / 7同学每周都要编写计算机程序来完成任务,而你负责查看同学编写的代码,并运行查看它们的效果如何。这个学期,一名新生加入了你的班级。他不爱说话,不爱社交,也没有提过什么问题。但是,当他提交自己的第一个任务方案时,你感到有点意外。这名新生编写的代码让人难以理解,你从来都没见过这样的代码。看起来他像是用随机的过滤器对每幅图像进行卷积,然后再用格外惊异的规律来得到最终的答案。你运行了这段代码,效果格外好。你心想,虽然这个解决方案非同寻常, 但只要它有效就足够了。几周过去了,同学们需要完成的任务难度越来越高, 你也从这名新生那里得到了越来越简单的代码。他的代码精彩地完成了
6、难度日益增大的任务,但你无法真正理解其中的内容。期末的时候,你给同学们布置了一项作业,用一组真实的图片来区分猫和狗。结果,没有同学能够在这项任务上达到超过 65%的精确率,但是新生编写的代码精确率高达 95%,你大吃一惊。你开头在接下来的几天中深化分析这些高深莫测的代码。你给它新的示例,然后进行修改,试着找出影响程序决策的因素,对其进行反向工程。最终你得出一个格外令人惊异的结论:代码会检测出狗的标签。假如它能检测到标签,那么它就可以推断对象的下部是否为棕色。假如是,则返回“cat”,否则返回“dog”。假如不能检测到标签,那么它将检查对象的左侧是否比右侧更黄。假如是,则返回“dog”,否则返回
7、“cat”。你邀请这名新生到办公室,并把争辩结果呈给他。你向他询问,是否认为自己真的解决了问题?在长时间的缄默之后,他最终喃喃自语道,他解决了3 / 7数据集显示的任务,但他并不知道狗长什么样,也不知道狗和猫之间有什么不同.很明显,他作弊了,由于他解决任务目的和你想要的目的无关。不过, 他又没有作弊,由于他的解决方案的确是有效的。然而,其他同学的表现都不怎么样。他们试图通过问题来解决任务,而不是通过原始数据集。虽然, 他们的程序运行得并不好,倒也没有犯惊异的错误。深度学习的祝福和诅咒深度学习是一种技术,它使用一种称为梯度反向传播的优化技术来生成“程序”(也称为“神经网络”),就像上面故事中学者
8、同学编写的那些程序一样。这些“程序”和优化技术对世界一无所知,它所关怀的只是构建一组转换和条件,将正确的标签安排给数据集中的正确图像。通过向训练集添加更多的数据,可以消退虚假的偏差,但是,伴随着数百万个参数和数千个条件检查,反向传播生成的“程序”会格外大,格外简单,因此它们可以锁定更微小偏差的组合。任何通过安排正确标签,来统计优化目标函数的方法都可以使用,不管是否与任务的“语义精神”有关。这些网络最终能锁定“语义正确”的先验吗?固然可以。但是现在有大量的证据表明,这并不是这些网络分内之事。相反的例子表明,对图像进行格外微小的、无法察觉的修改就可以转变检测结果。争辩人员对训练过的数据集的新示例进
9、行了争辩,结果表明,原始数据集之外的泛化要比数据集内的泛化弱得多,因此说明,网络所依靠的给定数据集具有特定的低层特性。在某些状况下,修改单个像素就足以产生一个新的深度网络分类器。4 / 7在某种程度上,深度学习最大的优势就是自动创建没有人会想到的特性力量,这同时也是它最大的弱点,由于大多数这些功能至少在语义上看起来, 可以说是“可疑的”。什么时候有意义,什么时候没有意义?深度学习对于计算机视觉系统来说无疑是一个好玩的补充。我们现在可以相对简洁地“训练”探测器来探测那些昂贵且不切实际的物体。我们还可以在肯定程度上扩展这些检测器,以使用更多的计算力量。但我们为这种铺张付出的代价是昂扬的:我们不知道
10、深度学习是如何做出推断,而且我们的确知道,分类的依据很可能与任务的“语义精神”无关。而且,只要输入数据违反训练集中的低水平偏差,检测器就会消灭失效。这些失效条件目前尚且不为人知。因此,在实践中,深度学习对于那些错误不是很严峻,并且保证输入不会与训练数据集有很大差异的应用程序格外有用,这些应用能够承受5%以内的错误率就没问题,包括图像搜寻、监视、自动化零售,以及几乎全部不是“关键任务”的东西。具有讽刺意味的是,大多数人认为深度学习是应用领域的一次革命,由于深度学习的决策具有实时性,错误具有重大性,甚至会导致致命的结果, 如自动驾驶汽车,自主机器人(例如,最近的争辩表明,基于深层神经网络的自主驾驶
11、的确简洁受到现实生活中的对抗性攻击)。我只能将这种信念描述为对“不幸”的误会。一些人对深度学习在医学和诊断中的应用寄予厚望。然而,在这方面也有一些令人担忧的发觉,例如,针对一个机构数据的模型未能很好地检测另5 / 7一个机构数据。这再次印证了一种观点:这些模型猎取的数据要比很多争辩人员所期望的更浅。数据比我们想象的要浅出人意料的是,深度学习教会了我们一些关于视觉数据(通常是高维数据) 的东西,这个观点格外好玩:在某种程度上,数据比我们过去认为的要“浅” 得多。好像有更多的方法来统计地分别标有高级人类类别的可视化数据集,然后有更多的方法来分别这些“语义正确”的数据集。换句话说,这组低水平的图像特
12、征比我们想象的更具“统计意义”。这是深度学习的宏大发觉。如何生成“语义上合理”的方法来分别可视数据集模型的问题仍旧存在, 事实上,这个问题现在好像比以前更难回答。结论深度学习已经成为计算机视觉系统的重要组成部分。但是传统的计算机视觉并没有走到那一步,而且,它仍旧可以用来建筑格外强大的探测器。这些人工制作的检测器在某些特定的数据集度量上可能无法实现深度学习的高性能,但是可以保证依靠于输入的“语义相关”特性集。深度学习供应了统计性能强大的检测器,而且不需要牺牲特征工程,不过仍旧需要有大量的标记数据、大量 gpu,以及深度学习专家。然而,这些强大的检测器也会患病意外的失败,由于它们的适用范围无法轻易地描述(或者更精确地说,根本无法描述)。需要留意的是,上面的争辩都与“人工智能”中的 ai 无关。我不认为像
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东省广州市华南师范附属中学2024-2025学年高二下学期3月月考物理试卷(原卷版+解析版)
- 教育咨询居间协议样本
- 汽车车身电子控制技术指南
- 中医护理学(第5版)课件 第三节 中药煎服法与护理
- 雨水收集再利用系统
- 物流仓储业自动化仓储与分拣技术方案
- 项目可行性分析研究报告
- 技术创新可行性报告
- 新能源汽车产业政策与市场分析报告
- 护理-儿护练习试题及答案
- JBT 11699-2013 高处作业吊篮安装、拆卸、使用技术规程
- JJG 257-2007浮子流量计行业标准
- 2023年 新版评审准则质量记录手册表格汇编
- 2024年全国版图知识竞赛(小学组)考试题库大全(含答案)
- 博物馆保安服务投标方案(技术方案)
- (高清版)TDT 1047-2016 土地整治重大项目实施方案编制规程
- 2024年新疆维吾尔自治区中考一模综合道德与法治试题
- 医药代表专业化拜访技巧培训
- 今年夏天二部合唱谱
- 小米公司招聘测试题目
- 2024年北京控股集团有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论