(交通信息工程及控制专业论文)基于视频的公交车辆检测算法研究及应用.pdf_第1页
(交通信息工程及控制专业论文)基于视频的公交车辆检测算法研究及应用.pdf_第2页
(交通信息工程及控制专业论文)基于视频的公交车辆检测算法研究及应用.pdf_第3页
(交通信息工程及控制专业论文)基于视频的公交车辆检测算法研究及应用.pdf_第4页
(交通信息工程及控制专业论文)基于视频的公交车辆检测算法研究及应用.pdf_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 公交车是城市交通运输中最主要的客运工具,公交站场的监控管理是城市交 通管理的重要组成部分。要实现公交站场自动化监控管理,首先要实现公交车辆 的检测。近年来,基于视频的车辆检测技术逐渐成为车辆检测技术领域的研究热 点,然而,国内外学者对适合公交站场公交车的车辆视频检测算法研究得比较少, 以往还没有一种基于视频的车辆检测算法是专门用于公交站场这种复杂背景下, 且能取得良好检测效果的。 本论文的主要工作就是寻找适合公交站场公交车的车辆视频检测算法,包括 白天光照充足和夜间光照不充足的两种情况。对于白天光照充足的情况,通过提 取公交车车体宽度的几何特征和公交车车牌的颜色特征,本论文提出了基于几何 与颜色特征的检测算法;对于夜间光照不充足的情况,通过提取表征夜间公交车 车灯特征的白色颜色连通域,本论文还提出了基于颜色连通域的检测算法。这两 个算法在广州市中山八路公交站场智能化监控系统中得到应用,应用表明:基于 几何与颜色特征的检测算法具有实时性好、检测率高和鲁棒性强的特点,是一种 有效的适合白天光照充足环境的公交车辆视频检测算法:基于颜色连通域的检测 算法具有低复杂度、高实时性、高检测率和低冗余率的特点,是一种实用高效的 适合夜间光照不充足环境的公交车辆视频检测算法。此外,本文所提出的两个算 法经过修改和检测参数调整后,同样适用于高速公路和城市干道等环境下的车辆 视频检测。 关键字:公交车,智能运输系统,车辆视频检测 a b s t r a c t b u sp l a y sak e yr o l ei np a s s e n g e rt r a n s p o r ti nc i t yt r a n s i t t h em o n i t o r i n g m a n a g e m e n to fb u ss t a t i o ni st h ei m p o r t a n tp a r to ft h et r a f f i cm a n a g e m e n to f t h ec i t y t oa c h i e v ei n t e l l i g e n tm o n i t o r i n gm a n a g e m e n to ft h eb u ss t a t i o n ,t h ed e t e c t i o no fb u s i sn e e d e df i r s t l y t h ev i d e o - b a s e dv e h i c l ed e t e c t i o nh a sb e c o m eah o t s p o ti nt h ef i e l d o fv e h i c l ed e t e c t i o ni nr e c e n ty e a r s h o w e v e r , t h ev i d e o - b a s e dv e h i c l ed e t e c t i o n a l g o r i t h mf o rb u sr u n n i n gi ns t a t i o ni sr a r e l ys t u d i e d ,a n dt h e r ea r en ov i d e o b a s e d v e h i c l ed e t e c t i o na l g o r i t h m st h a ta r es p e c i a la n de f f e c t i v ef o rb u sr u n n i n gi ns t a t i o n t h eg o a lo ft h i st h e s i si st of i n ds o m es u i t a b l ev i d e o - b a s e dv e h i c l ed e t e c t i o n a l g o r i t h m sf o rb u sr u n n i n gi n s t a t i o nu n d e rt w ok i n d so fc o n d i t i o n s :a d e q u a t e l u m i n a n c ei nt h ed a y t i m ea n di n a d e q u a t el u m i n a n c ei nt h en i g h t t i m e f o rt h e c o n d i t i o no fa d e q u a t el u m i n a n c ei nt h ed a y t i m e ,b ya b s t r a c t i n gt h eg e o m e t r yc h a r a c t e r w h i c hd e n o t e st h ew i d t ho ft h eb u sa n dt h ec o l o rc h a r a c t e rw h i c hd e n o t e st h ec o l o to f t h eb u sl i c e n s ep l a t e ,t h i st h e s i sp r e s e n t sad e t e c t i o na l g o r i t h mb a s e do ng e o m e t r ya n d c o l o rc h a r a c t e r ;f o rt h ec o n d i t i o no fi n a d e q u a t el u m i n a n c ei nt h en i g h t t i m e ,b y a b s t r a c t i n gt h ew h i t ec o l o r - c o n n e c t e dd o m a i nw h i c hd e n o t e st h eh e a d l i g h to ft h eb u s , t h i st h e s i sp r e s e n t sad e t e c t i o na l g o r i t h mb a s e do nc o l o r - c o n n e c t e dd o m a i n t h e s et w o a l g o r i t h m sa r ea p p l i e di ni n t e l l i g e n tm o n i t o r i n gs y s t e mo fz h o n g s h a nb a l ub u ss t a t i o n i ng u a n g z h o u t h ea p p l i c a t i o ns h o w st h a t :i nt h ec o n d i t i o no fa d e q u a t el u m i n a n c ei n t h ed a y t i m e ,t h ed e t e c t i o na l g o r i t h mb a s e do ng e o m e t r ya n dc o l o rc h a r a c t e ri s e f f e c t i v ef o rb u sd e t e c t i o n ,a n di t sc h a r a c t e r i z e db yg o o dr e a l - t i m e ,h i g hd e t e c t i o n r a t ea n ds t r o n gr o b u s t n e s s ;i nt h ec o n d i t i o no fi n a d e q u a t el u m i n a n c ei nt h en i g h t t i m e , t h ed e t e c t i o na l g o r i t h mb a s e do nc o l o r - c o n n e c t e dd o m a i ni sp r a c t i c a la n de f f i c i e n tf o r b u sd e t e c t i o n ,a n di t sc h a r a c t e r i z e db yl o wc o m p l e xd e g r e e ,g o o dr e a l t i m e ,h i g h d e t e c t i o nr a t ea n dl o wr e d u n d a n c yr a t e i na d d i t i o n ,a f t e rm o d i f y i n gt h ea l g o r i t h m s a n da d j u s t i n gt h ed e t e c t i o np a r a m e t e r so ft h ea l g o r i t h m s ,t h et w oa l g o r i t h m sc a na l s o b eu s e dt od e t e c tv e h i c l eo nf r e e w a y , m a i nr o a di nc i t ya n ds oo n k e y w o r d :b u s ,i n t e l l i g e n tt r a n s p o r ts y s t e m ,v i d e o b a s e dv e h i c l ed e t e c t i o n 第一章引言 随着社会经济的发展,交通运输业也迅速发展。交通运输业的发展促进了物 资和人员的往来,大大地提高了社会的发展进程。然而,随着交通业的发展,也 带来了很多弊端,尤其是地面汽车交通运输,不论是发达国家还是发展中国家都 存在着不同程度的问题。近半个世纪以来,交通拥挤、道路阻塞。交通事故频繁、 空气污染等问题正威胁着人们的生活和社会的进步,如何有效地解决交通运输问 题已成为迫切的课题n 修建道路是解决交通问题的一个最直接途径。为了解决交通拥挤、道路阻塞 问题,人们首先想到的是增加交通基础设施,企图通过修建足够多的道路来缓解 交通问题,但是受地理空间的影响,人们不可能通过无休止地修建道路来满足不 断增长的交通量的需求,而且过多地修建道路将导致道路拥挤,车辆尾气排放剧 增,最终给环境带来恶劣影响。随着科学技术的发展,为了从根本上解决交通问 题,人们将各种先进的技术综合应用于地面交通管理体系,智能运输系统随之诞 生了。智能运输系统( i n t e l l i g e n tt r a n s p o r t a t i o ns y s t e m s ,简称i t s ) 就是通过对关 键基础理论模型的研究,从而将信息技术、通信技术、电子控制技术和系统集成 技术等有效地应用于交通运输系统,从而建立起大范围内发挥作用的实时、准确、 高效的交通运输管理系统【2 】o 智能运输系统是一个综合多种先进技术的系统,其中包括交通流诱导系统、 先进的公共交通管理系统、高速公路交通事件管理系统、电子收费系统等等,而 这些子系统的实现都离不开车辆检测。车辆检测是智能运输各子系统的重要组成 部分,它工作于系统的前端,为系统提供必要的交通参数,如:交通流量、平均 车速、交通密度、车头间距和排队长度等各种参数。因此,做好车辆检测对智能 运输系统的建设和完善具有重要意义。 车辆检测方法按检测器的类型可分为:环形线圈检测法、超声检测法、红外 检测法、微波检测法和视频检测法等等。其中,基于视频的车辆检测法以其功能 强大、多道检测、使用方便等优点在近年来得到了广泛的应用1 3 j 。 基于视频的车辆检测法是一种结合视频图像处理和计算机图形识别的技术, 其核心任务是设计适合实际工程需要的检测算法。它通过视频摄像机和计算机模 仿人眼的功能,将连续的模拟图像转换成离散的数字图像后,在成熟的物理模型 和数学模型的基础上编制软件进行分析处理,模拟各种其他形式的车辆检测器获 取各种所需的交通信息,为交通领域的多种实际应用提供了工作平台。这种检测 方式可以提供交通流量、平均速度和车道占有率等数据。目前车辆视频检测技术 做得比较好的有美国1 s s 公司的a u t o s c o p e 系统、比利时路畅通公司的 t r a f i c o n 系统等。 公交车是城市交通运输中最主要的客运工具之一,公交站场的监控管理是城 市交通管理的重要组成部分。然而,国内外学者对适合公交站场公交车的车辆视 频检测算法研究得比较少,目前还没有一种视频检测算法能够在公交站场公交车 的视频检测中取得良好的效果。困难主要来自两方面。一是白天光照充足的情况。 因为公交站场的环境比较特殊:站场背景复杂、变化大,公交车相对固定、车辆 类型相对单一等,所以已有的适合光照充足环境下一般车辆的视频检测算法在公 交站场的公交车视频检测中并不能取得良好的效果。二是夜间光照不充足的情 况。国内外学者对光照不充足环境下的车辆视频检测算法研究得比较少,传统的 方法是通过补光或改善摄像机的性能来提高视频照度和对比度,从而达到检测目 的,但这种通过改变硬件设施来进行视频检测的方法,不仅检测率较难达到白天 光照充足环境下的检测水平,而且还增加了硬件安装和维护方面的困难。 本论文的主要研究内容就是尝试寻找适合公交站场公交车的车辆视频检测 算法。对于白天光照充足的情况,本论文提出了基于几何与颜色特征的检测算法: 对于夜间光照不充足的情况,本论文还提出了基于颜色连通域的检测算法。 1 1 车辆检测方法概述 车辆检测是智能运输系统中各子系统的重要组成部分。交通监控系统得以良 好运行所必须的各种交通参数,如:交通流量、平均车速、交通密度、车头间距 和排队长度等都必须通过车辆检测来获得。因此,车辆检测子系统是交通监控系 统不可分割的一部分。图1 - 1 是交通监控系统中常用的车牌自动识别系统框图, 这是车辆检测的一个典型应用。 2 图卜1 车牌自动识别系统框图 车辆检测方法多种多样,按检测器的类型可分为:环形线圈检测法、超声检 测法、红外检测法、微波检测法和视频检测法等等1 3 f 。 环形线圈检测法是目前国内外使用最为广泛的车辆检测方法,这种检测器由 埋在路面下的线圈和能够测量该线圈电感变化的电子设备组成。当含有铁金属的 车体进入线圈磁场范围时,线圈的磁通量将发生变化,从而导致线圈电感的变化。 这种电感变化由电子设备测得,即可发出车辆通过或存在的信号。环形线圈检测 法的优点是:检测精度高,抗干扰能力强:缺点是:维修和更换较麻烦,需封闭 车道,影响交通。 超声检测法是波束检测的一种。超声检测器由超声波发射器、接收器和时控 电路三部分组成。超声发射器发射超声脉冲,无车时路面反射声波,由安装在同 一个探头内的接收器接收,时控电路对发射至接收这段时间计时,作为基础时距; 有车通过或存在时,由车辆上界面对声波反射。显然,有车时,发射和反射距离 缩短,时距减少,与基础时距的差异即为车辆出现信号。超声检测法的优点是: 安装方便,维修容易,使用寿命长,可以移动,更换检测地点;缺点是:检测精 度不高,抗干扰能力不强。 红外检测法也是波束检测的一种,有主动和被动两种模式。主动式红外检测 器的原理为:检测器发射红外光,在相同红外光辐射下,反射物的大小、材料和 结构不同,反射的能量就不一样。车体表面反射能量大于路面,接收器接收不同 的反射能量成为区分车辆和道路的标志。被动式红外检测器的原理为:在路面相 隔一定距离的地方,以特种涂料画出两个明显的区域,使它们辐射出比较稳定的 能量,红外接收器分别对准这两个区域。无车时,接收器分别感受路面两个特定 区域的辐射能量;有车通过时,又先后感受车辆的辐射能量。能量的差异成为判 断车辆存在的标志。红外检测法的优点是:安装方便,维修容易,检测精度较高, 功率消耗低;缺点是:受天气影响大,浓雾、大雪和大雨等天气条件将影响检测 效果。 微波检测法跟超声检测法和主动式红外检测法类似,由发射装置、接收装置 和控制装置组成,都是通过判断波束的差异来触发检测信号。但相比较起来,微 波检测法有个明显的优势:穿透云雾、雨滴和雪花的能力很强,气象条件差的环 境中都可使用。 视频检测法是近年来兴起的一种车辆检测方法。视频检测属非接触式的检测 方法,是一种结合视频图像和计算机模式识别的数字图像处理技术。它通过在视 频流窗口上设置虚拟检测器,当车辆通过任何一个虚拟检测器时,就会产生一个 检测信号,从而判断出当前视频是否存在车辆。图1 2 至图1 7 是视频流中截得的 简要系列图,如果该视频流输入到前面所述的车牌自动识别系统中,那么车辆视 频检测就是要利用设计好的算法抓拍到车牌较好的图片( 图1 4 ) 。 图卜2 视频流系列帧1图1 3 视频流系列帧2图卜4 视频流系列帧3 图卜5 视频流系列帧4图l 一6 视频流系列帧5图卜7 视频流系列帧6 4 视频检测器由摄像机、光缆、计算机和软件等组成,它的优点突出:功能强 大,图像直观,软件控制,便于升级,易于增添检测项目;使用方便,安装维修 不破坏路面,不封闭车道,可重新设定,以满足不同要求。缺点是:抗干扰能力 差,受天气和光照影响大。 1 2 国内外研究概况回顾 随着数字图像处理技术和计算机硬件技术的发展,基于视频的车辆检测技术 在智能运输系统中的应用越来越受到重视,逐渐成为近年来车辆检测技术领域的 研究热点,国内外学者对基于视频的车辆检测算法作了比较多的研究,提出了基 于灰度的、基于直方图的、基于边缘的、矢量虚拟线圈和车辆牌照等检测算法。 本章首先列举了国外比较有代表性的算法,介绍了算法原理并总结了各个算法的 优缺点;再列举了国内比较有代表性的算法,介绍了算法原理并总结了各个算法 的优缺点。 1 2 1 国外研究概况 ( 1 ) 基于灰度的检测法 a 日本的k i k u k a w at 和k a w a f u c h is 1 4 】于1 9 9 2 年提出直接灰度差方法,该 方法直接计算两帧灰度差: f a = j 0 ,y ) 一,2 ,y ) i ( 1 - 1 ) 其中,1 0 ,y ) ,2 0 ,y ) 分别代表第1 帧和第2 帧像素( x ,y ) 的灰度,则平均帧差: 肌志;莩f a ( x ( 1 - 2 ) 其中m - n 为图像的尺寸。如果平均帧差尉大于某个阈值,则存在镜头突变, 可进行车辆抓拍。此算法适合背景变化不剧烈的情况。 b 由于直接灰度差方法对摄像机和物体运动敏感,新加坡的k a n k a n h a l l i a l 5 】 于1 9 9 3 年提出改进的灰度差方法,该方法先用3 x 3 的模板进行平滑滤波,然后 再计算帧差。此算法抗抖动方面有很好的改进效果。 ( 2 ) 基于边缘的检测法 美国的m a ik 、m i l l e rj 和z a b i hr 【6 i - ? 1 9 9 5 年提出边缘检测法,该方法先计 算帧差,帧差由边缘变化的百分比表示,即边缘从一帧到另一帧移进和移出的比 例。该方法对于视频剧烈变化是稳健的,但帧差计算比较复杂。之后,基于此法 还衍生出了很多快速简单实用的边缘检测算法。 ( 3 ) 基于直方图的检测法 a z 2 检验直方图帧差法 日本的n a g a s a k a 和t a n a k a 7 1 于1 9 9 2 年提出x 2 检验直方图帧差法,用啊,h 2 表示两帧图像的直方图,归一化后的直方图帧差: f d = 嘉;学或f d = i嘉;警h 弘s ,2 争危( ) 2 争,“) 、 其中是图像像素总数。如果直方图帧差尉大于某个阈值,则存在镜头突变, 可进行车辆抓拍 b 。直方图最小帧差法 美国的s w a i nmj 和b a l l a ddh 1 8 1 于1 9 9 3 年提出直方图最小帧差法,该方法 利用下式计算帧差: 埘n 眠( f ) ,h :( f ) ) f d = 1 一。一 ( 1 - 4 ) v 、7 其中是图像像素总数。如果直方图帧差剐大于某个阈值,则存在镜头突变, 可进行车辆抓拍 c 平均彩色法 i b ma l m a d e n 研究中心机器视觉小组的h a f n e rjl 和s a w h n e yhs t 9 】于1 9 9 5 年提出平均彩色法。先令3 1 维向量吃。: h ( ,) = h o ) c ( j ,f ) ,= o ,1 , 2 ( 1 - 5 ) 其中,代表彩色坐标轴( 例如r g b ) ,c ( j ,f ) 是直方图中第i 个像素的第,维彩 色分量。则帧差表示为: f d = i 红。一。l ( 1 6 ) 即取向量差的模,如果帧差f d 大于某个阈值,则存在镜头突变,可进行车辆抓 拍 根据文献 1 0 】分析,这三种基于直方图的检测法中,直方图最小帧差法性能 最好,x 2 检验直方图帧差法性能最差。 ( 4 ) b 一样条拟合检测法 美国明尼苏达大学的n a mj 和t e w f i k ah 【1 1 1 于2 0 0 1 年提出b 样条拟合法, 进行视频渐变检测,取得较好的效果。该方法首先设置一个滑动的时段窗口,该 窗口沿时间轴滑动,计算每个像素在窗口时段内沿时间轴的标准方差,然后对图 像尺寸内所有像素计算总方差。统计表明,在视频渐变时,拟合误差小,因为在 视频渐变的区域灰度曲线呈现类似线性增加或减少的单调特征,这种单调特征曲 线很好拟合,因而拟合误差小。相反,当视频出现突变时,灰度曲线很难拟合, 造成拟合误差大。因此,根据拟合误差便可以把视频渐变和视频突变分开,从而 达到检测的效果。因为曲线拟合的时间复杂度比较高,所以本算法的实时性方面 有所欠缺。 1 2 2 国内研究概况 ( 1 ) 华中理工大学的谈新权等于1 9 9 7 年提出了大背景噪声下动目标实时 检测方法。该算法用帧间方块编码差值法和邻域综合法提取运动目标。与普通 帧差法相比,此法提高了抗嗓度,改善了运动目标的边缘特性。 ( 2 ) 公安大学的蔡平等”】于1 9 9 8 年提出复杂场景中基于统计模型的检测 法。通过对帧间图像的灰度、纹理、运动三个不同特征信息的数据进行统计分 析,实现对自然场景中运动物体的检测。该算法有效地克服了摄像机噪声、光 照变化、摄像机的轻微移动等干扰。 ( 3 ) 宁波大学的郁梅等【1 4 】于2 0 0 2 年提出基于路面标记的车辆检测法。该算 法用于检测车辆并排除阴影干扰,此法简单快捷,适合背景单调的情况。 ( 4 ) 华中理工大学的叶斌等f ”1 于2 0 0 2 年提出基于形态学t o p - - h a t 算子的小 目标检测方法。该方法优于高通滤波法,它能够快速、可靠检测出低信噪比的运 动小目标,但是抗噪声方面有所欠缺。 ( 5 ) 浙江大学的张丽等1 1 6 l 于2 0 0 3 年提出基于阴影检测的h s v 空间自适应 背景模型的车辆追踪检测。该方法采用h s v 色彩模型代替传统的r g b 色彩模 型,提高了即检测率,但该算法的复杂度偏商,整个算法流程大约需要9 0 1 2 0 毫秒。 ( 6 ) 香港大学智能交通实验室的n h c y u n g 等【1 7 1 于1 9 9 9 年提出矢量虚拟 线圈法。该方法先在图像上设置虚拟线圈,然后对系列图像帧进行虚拟线圈匹 配。从而获得了虚拟线圈的运动矢量信愚b 口虚拟线圈运动的位移和方向么 v i ,通过判断这些矢量可以检测运动目标。研究表明这个方法通用性比较好,可 以适合不同环境。目前,主要有华中科技大学的张绍满、盛翊智、谢寒生和广 东京安通讯交通设旌有限公司的李炳基等在研究矢量虚拟线圈检测法。 ( 7 ) 近年来,四川大学计算机学院图像图形研究所研发出车牌识别系统,并 投入使用,该系统的车辆检测部分算法采用车牌检测的方法。该算法提高检测 率的同时还使抓拍时机得到改善,但是,该算法的时间复杂度偏高,实时性方 面做得不够好,而且对于夜间光照不充足的情况检测效果不理想。 随着数字图像处理技术的不断发展,近年来,国内外学者相继使用遗传算法、 人工神经网络、小波分析、形态学等工具进行图像处理研究,使得车辆视频检测 的算法日益丰富,算法的实时性和鲁棒性不断提高。 1 3 本文主要研究内容 本论文的主要研究内容就是尝试寻找适合公交站场公交车的车辆视频检测 算法,包括白天光照充足和夜间光照不充足的两种情况。针对白天光照充足环境 下公交站场背景复杂、视频易受干扰、车辆类型单一等实际情况,通过提取公交 车车体宽度的几何特征和公交车车牌的颜色特征,本论文提出了基于几何与颜色 特征的检测算法;针对夜间光照不充足环境下视频对比度低、噪声大等实际情况, 通过提取表征夜间公交车车灯特征的白色颜色连通域,本论文还提出了基于颜色 连通域的检测算法。作者把提出的这两个算法应用于广州市中山八路公交站场智 能化监控管理系统中的车辆检测抓拍子系统中,通过实际工程应用验证了算法的 可靠性。 此外,作者还对基于几何与颜色特征的检测算法进行改进及检测参数重置、 对基于颜色连通域的检测算法进行检测参数重置。多次测试表明:改进和重置检 测参数后的算法同样适合高速公路和城市干道等道路环境下的车辆视频检测。 1 4 本文内容大纲 文章内容大纲安排组织如下: 第一章首先介绍了按检测器分类的各种车辆检测方法,其中对视频检测法作 了较为详细的介绍,包括:视频检测的概念、视频检测法的典型应用实例和视频 检测的优缺点;接着是对已有视频检测算法的回顾,本节选取了国内外一些具有 代表性的算法,介绍了算法原理并对算法进行了评价;本章最后介绍了本论文的 主要研究内容。 第二章主要介绍本论文算法所涉及的数字图像处理的相关内容,包括数字图 像处理的基本概念、b m p 位图基础知识、边缘强度、大滓迭代法和霍夫变换等。 第三章是本论文的算法设计部分,详细阐述基于几何与颜色特征的检测算法 和基于颜色连通域的检测算法,包括算法原理和算法具体实现步骤。 第四章是本论文的算法应用部分,首先详细介绍了中山八路公交站场智能化 监控管理系统的结构和工作原理,接着介绍了公交车辆视频检测子系统的软件界 面,然后给出算法的测试结果;最后在小结部分对算法进行了小结。 第五章是两个算法的扩展应用。介绍了为扩展应用对算法进行的改进,接着 给出了城市干道和高速公路等其它道路环境下的初步测试结果,并对算法的改进 和扩展应用进行小结。 第六章介绍了论文的主要创新点及贡献;总结了本论文的总体结论;最后结 合本文算法的不足,对车辆视频检测研究课题进行了展望。 第二章数字图像处理相关内容介绍 近年来,随着计算机硬件技术的迅速发展,数字图像处理技术也得到长足的 发展,图像处理技术广泛应用于众多的科学与工程领域,如:交通监控、遥感、 工业检测、医学、气象、侦察、通信、智能机器人等。 人们用各种技术方式和手段对图像进行加工以获得重要信息。图像处理技术 从广义上可看作是各种图像加工技术的总和,它包括利用计算机和其它电子设备 进行加工和完成的一系列工作,例如图像采集、获取、编码、存储和传输,图像 的合成和产生,图像的显示、绘制和输出,图像变换、增强、恢复和重建,特征 的提取和测量,目标的检测,图像的表示与描述等等。 2 1 数字图像的基本概念 幅图像可以定义为一个二维函数f ( x ,y ) ,这里x 和y 是空间坐标,而在任 何一对空问坐标( x ,y ) 上的幅值,成为该点的强度或灰度。当t y 和幅值,为有 限的、离散的数值时,称该图像为数字图像。 数字图像处理是指借用数字计算机处理数字图像,数字图像是由有限的元素 组成的,每一个元素都有一个特定的位置和幅值,这些元素称为图像元素或像素。 像素是数字图像的基本元素。 由于计算机仅能处理离散的数据,所以如要用计算机来处理图像,则连续的 图像函数必须转换为离散的数据集,离散过程可用图2 - 1 和图2 2 来描述。其中 图2 1 是离散前的连续图像,图2 2 是离散后的数字图像。 1 0 图2 - 1 离散前的连续图像图2 - 2 离散后的数字图像 从上图可以看出,离散后的数字图像的质量很大程度上是取决于离散网格的 稠密程度和灰度级数。 计算机处理图像实际上是计算机对表示图像的离散矩阵进行处理。一个的 mx n 数字图像用矩阵表示为: f ( x ,y ) = f ( o ,0 ) ,( 1 ,0 ) f ( 0 ,1 ) ,( l 1 ) f ( 0 ,n 一1 ) ,( l 一1 ) f ( m 一1 ,0 ) f ( m - 1 ,1 ) 厂( m 一1 ,n - 1 ) 其中,矩阵中的每个元素表示对应位置的图像像素值。 2 2b m p 位图基础知识 ( 2 1 ) 位图图像可以在不同的机器或系统中显示其所固有的图像属性。它用记录屏 幕上图像的每一个黑白或彩色的像素来反映图像,每一个像素有特定的位置和颜 色值,所有像素构成表示位图图像的数字阵列。位图适用于具有复杂色彩、明度 多变、虚实丰富的图像,例如照片、绘画等,用位图显示的图像,其大量的细节 f 如明暗变化、场景复杂和多种颜色等) 可以直接快速地从屏幕上显示出来。常见 位图格式有p c x 、b m p 、d l b 、p i c 、g i f 、t g a 和t i f f 等,其中b m p 格式是 最常用的一种,本论文处理的图像就是b m p 格式的2 4 位位图。 2 2 1b m p 位图文件结构 一个b m p 文件包括位图文件头结构b i t m a p f i l e h e a d e r 、位图信息头结 构b i t m a p i n f o h e a d e r 、调色板p a l e t f e 和位图像素数据四个部分,如表 2 1 所示。 表2 1 位图文件结构 位图文件结构表 位位图文件头 图位图信息头 文彩色表( 调色板) 件位图数据 下面对位图文件的各个部分进行详细描述。 1 4 字节 4 0 字节 4 n 字节 x 字节 位图文件头 位图文件头包含文件类型、文件大小、存放位置等信息。结构定义如下 t y p e d e f s t r u c tt a g b i t m a p f i l e h e a d e r u n i t b f f y p e ; d w o r d b f s i z e ; u i n tb f r e s e r v e d l : u i n t b f r e s e r v e d 2 ; d w o r d b f 0 鳢b i t s ; b i t m a p f i l e h e a d e r ; 其中: b f t y p e 说明文件类型,在w i n d o w s 系统中为b m 。 b f s i z e 说明文件大小。 b f r e s e r v e d l 、b f r e s e r v e d 2 保留,设置为0 。 b f o f f b i t s 说明实际图形数据的偏移量。 位图信息头 位图信息头包含位图的大小、压缩类型、和颜色格式,结构定义如下 t y p e d e fs t r u c tt a g b i t m a p i n f o h e a d e r d w o r d b i s i z e ; l o n gb i w i d t h ; l o n gb i h e i 曲t : w o r db i p l a n e s ; w o r db i b i t c o u n t ; d w o r d b i c o m p r e s s i o n ; d w o r d b i s i z e l m a g e ; l o n gb i x p e l s p e r m e r e r ; l o n gb i y p e l s p e r m e r e r ; d w o r db i c l r u s e d ; d w o r d b i c l r l m p o r t a n t ; b i t m a p i n f o h e a d e r ; 其中: b i s i z e说明b i t m a p i n f o h e a d e r 结构所需字节数,在w i n d o w s 系统中 为2 8 b i w i d t h 说明图像宽度 b i h e i g h t 说明图像高度 b i p l a n e s 为目标设备说明位面数,其值设为l b i b i t c o u n t 每个像素的位数,单色位图为1 ,256 色为8 ,24b i t 为24 b i c o m p r e s s i o n 压缩说明,b ir g b :无压缩,b ir l e 8 :8 位r l e 压缩, b ir l e 4 :4 位r l e 压缩 b i s i z e l r n a g e 说明图像大小,如无压缩,可设为0 b i x p e l s p e r m e t e r 水平分辨率 b i y p e l s p e r m e t e r 垂直分辨率 b i c l r u s e d 位图使用的颜色数 b i l m p o r t a n t 重要颜色数目 彩色表 彩色表包含的元素与位图所具有的颜色数目相同,像素颜色用结构 r g b q u a d 来表示: t y p e d e fs t r u c tt a g r g b q u a d b y t e r 曲b l u e ; b y t er g b g r e e n ; b y t e r g b r e d ; b y t e r g b r e s e r v e d ; r g b q u a d ; 其中: r g b b l u e 指定蓝色强度 r g b g r e e n 指定绿色强度 r g b r e d 指定红色强度 r g b r e s e r v e d 保留,设为0 位图数据 紧跟在彩色表后的是图像数据震裂,图像每一扫描行有连续的字节组成,扫 描行由底向上存储,阵列中第一字节为左下角像素,最后一字节为右上角像素。 要想处理图像文件就必须知道这些图像文件的构成方式。在常用的图像格式 中,以2 4 位真彩色的b m p 位图格式比较常用,而且构成比较简单,所以这里 就以2 4 位真彩色的b m p 位图作为讲解的对象。首先找一幅2 4 位真彩色的位 图用1 6 进制编辑器将其打开,查看方式切换到以h e x 方式查看的话,就可以 看到类似下表列出的数据了。这其实就是b m p 文件中的图像数据,这些数据就 代表着我们平常看到的图像。 表2 2 位图数据 4 24 d9 66 10 20 0 0 0 0 00 00 03 60 0 0 00 02 8 0 0 0 0 0 0 0 4 0 1 0 0 0 0c 80 0 0 0 0 00 10 01 80 0 0 00 0 0 00 00 0 0 00 0o o0 0 0 00 00 00 0 0 0 0 00 0 0 0 0 0 0 0 0 0 o o 0 0 0 0 0 00 a0 a0 a0 b0 b0 b1 01 01 01 7 1 71 71 c 1 c1 c1 1 3 。1 b1 b1 41 41 40 d0 d 0 d0 f 0 f 0 f0 eo e0 eo e0 e ;o eo e0 e o e1 01 01 01 31 31 3 1 61 6 1 61 81 8 ,1 81 51 51 51 91 91 91 71 7 1 70 f 0 f 0 fo b o b0 b 。0 e0 e o e1 11 11 11 0 1 0 1 00 b 0 b 0 b1 4 1 41 41 71 71 71 1 1 11 1o f 0 fo f :1 41 4 1 4 1 41 41 40 do f o f0 50 a0 d0 9 1 01 31 01 51 80 f 2 4 位真彩色的b m p 图文件是由三个部分组成的:位图文件头、位图信息 头、位图阵列三个部分组成的。下面结合表2 2 列出的数据进行分析。 位图文件头 位图文件头就是用来标志这个位图文件一些信息比如:大小、类型等等。共 有1 4 个字节的信息。下面分别对这1 4 个字节的信息分别说明一下它们所代表 的意义。 4 24 d 为位图的标志。如果转换成a s c i i 码的话就是b m 。 9 66 10 2o o 这个双字信息代表着位图文件的总字节数,如果把它转换面十进 制的话就是( 0 0 0 2 6 1 9 6 ) h = ( 1 5 6 0 5 4 ) d ,也就是这位图文件的大小是 1 5 6 0 5 4 个字节。 0 00 0 为保留字1 。 0 0 0 0 为保留字2 。 3 6o o0 00 0 表示位图阵列的起始位置,( 0 0 0 0 0 0 3 6 ) h = ( 5 4 ) d , 也就是从第5 4 个字节起就是这幅图的位图阵列了。 位图信息头 位图信息头记录着一些关于这幅图的一些基本信息,比如:高度、宽度、分 辨率等信息。共占4 0 个字节。下面分别对这4 0 个字节的信息分别说明一下它 们所代表的意义。 2 80 00 00 0 表示着位图信息头的长度,( 0 0 0 0 0 0 2 8 ) h = ( 4 0 ) d , 即位图信息头的长度占4 0 个字节。 0 40 10 0 0 0 表示位图的宽度,( 0 0 0 0 0 1 0 4 ) h = ( 2 6 0 ) d 表示位图的 宽度为2 6 0 个像素。 c 80 00 00 0 表示位图的高度,( 0 0 0 0 0 0 c 8 ) h = ( 2 0 0 ) d 表示位图 的高度为2 0 0 个像素。 0 10 0 表示位图设备级别。 1 80 0 位图的色彩级别,( 0 0 1 8 ) h = ( 2 4 ) d ,即表示2 4 位真彩色。 0 00 00 00 0 表示压缩类型,零表示不压缩。 0 0 0 0 0 00 0 位图阵列表字节数,不压缩时可用0 表示图像像素数据字节数。 0 0 0 0 0 0o o 表示水平分辨率。 0 00 00 00 0 表示垂直分辨率。 0 0 0 00 00 0 表示位图实际使用的颜色表中的颜色变址。 o o0 0 o o0 0 表示位图显示过程中被认为重要颜色变址数。 位图阵列 这部分就是图像的主体部分。其实每幅图像都是由一个一个的点组成的。在 位图阵列里就存放着每一个点的颜色信息。每个像素点是由3 个字节的数据组 成的。也就是我们常用到的r g b 色彩空间每种颜色占一个字节。每个点的颜色 都是由蓝色、绿色、红色这个顺序存储的。点的存储顺序是从左到右从下到上, 也就是说第一个点是这幅图的第一列的最后一个点( 左下角的那个点) ,之后是 它上面的那个点,就这样由下至上直到第一列的第一个点( 左上角的那个点) , 然后是第二列也是从下至上的顺序。直到写完所有的点。 2 2 2 常用彩色模型 彩色模型( 也称为彩色空间或彩色系统) 的用途是在某些标准下用通常可接受 的方式简化彩色规范。本质上,彩色模型是坐标系统和子空间的规范。位于系统 中的每种颜色都由单个点来表示。 b m p 位图常用的彩色模型有r g b 模型、h s i 模型、c m y 模型和c m y k 模 型。下面对r g b 模型和h s i 模型进行介绍。 r g b 模型 基于色彩的三刺激理论,人类眼睛的视网膜中假设存在三种锥体视觉细胞, 它们分别对红( r e d ) 、绿( g r e e n ) 、蓝( b l u e ) 三种色光最敏感。根据人眼光谱灵敏 度实验曲线证明,这些光在波长为6 3 0 n m ( 红色) 、5 3 0 n m ( 绿色) 和4 5 0 n m ( 蓝 色) 时的刺激达到高峰。通过光源中的强度比较,我们感受到光的颜色。这种视 觉理论是使用三种颜色基色:红( r ) 绿( g ) 蓝( b ) 在视频监视器上显示颜色 的基础,称之为r g b 彩色模型。在r g b 模型中,每种颜色可由红、绿、蓝三 原色按不同的比例相加混合而产生。计算机彩色显示器是典型的r g b 彩色模型。 r g b 彩色模型用一个三维笛卡儿直角坐标系中的立方体来描述,如图2 3 所示。 深红 一。白 黑。墨警一堕1 生 7 绿 黄 图2 3 归一后的r g b 彩色立方示意图 本论文提出的基于几何与颜色特征的检测算法,其中的颜色特征其实是黄颜 色像素特征,根据图2 3 可以得到:标准的黄色像素r g b 值为( 2 5 5 ,2 5 5 ,0 ) ,黄色 像素具有r 、g 分量接近,r 、g 分量与b 分量相差较大的特点。 本论文算法处理的对象是2 4 位的r g b 彩色图和8 位灰度图,两者之间的转 换关系由式2 2 表示。 g r a y = 0 2 9 9 r + 0 5 8 7 g + 0 1 1 4 b ( 2 - 2 ) h s i 模型 r g b 等彩色模型是硬件设备使用的彩色模型,对于从事艺术设计的人员来 说,它们抽象而较难理解。h s i 彩色模型使用了用户直观的颜色描述方法,用色 调( h ) 、色饱和度( s ) 和亮度( i ) 这些易于理解和直观的参数,来建立与艺 术家使用颜色习惯相近似的彩色模型。因此h s i 彩色模型也称为艺术家彩色模 型,它适合消除数字色彩与传统颜料色彩之间的沟通障碍。 r g b 彩色模型与h s i 彩色模型有如下的转换关系: 旧bs g h = (23)3600bg一 、 7 其中0 ;a r c c o s 去 似一g ) + c r 一丑) ( r g ) 2 + ( 月一曰) ( g 一日) “2 _ ;】:月 一 0 仉 监 皿红 仉 2 3 边缘强度 s = 1 一面五3 g 面 m i n ( 尺,g ,b ) 俾+ + 口) 。 、“ ,= :( 尺+ g + 口) ( 2 - 4 ) ( 2 - 5 ) 雕雕习 三i ;1f 1 1 享; 季1雌引 2 4 大津迭代法 对于图像的边缘强度,通常情况必须分为两部分,一部分为边缘强度较小, 另外一部分是边缘强度较大。较小和较大两部分的划分就涉及到临界门限的问 题,也就是闽值问题。利用阈值可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论