版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于图像处理的机器人视觉相关技术研究一、引言 视觉是人类获取信息最丰富的手段,通常人类75%以上的信息来自眼睛,而对于驾驶员来说,超过90%的信息来自于视觉。同样,视觉系统是机器人系统的重要组成部分之一,视觉传感器也是机器人获得周围信息的感知器件。当机器人在特定环境下作业,且区域面积较大时,单目视觉不能满足机器人导航需求,需要将多幅图像拼接起来形成一幅大视场图像,以便机器人能够在相应环境下进行快速和准确作业。随着图像拼接技术的发展,图像拼接技术开始逐渐在机器人行业得到广泛应用。在移动机器人领域,利用视觉系统采集的具有重叠区域图像进行拼接形成大视角的图像,可以更加准确的分析现场情况,为机器人作业
2、提供帮助。本文将对机器视觉中应用到的图像格式转换与图像拼接技术进行阐述。二 图像格式转换 机器人的视觉系统是由摄像头或者CMOS/CCD等图像感应器组成,图像传感器能将捕捉到的光源信号转化为数字信号,存储为RAW格式文件, RAW文件是一种记录了数码相机传感器的原始信息,同时记录了由相机拍摄所产生的一些原数据(Metadata,如ISO的设置、快门速度、光圈值、白平衡等)的文件。RAW是未经处理、也未经压缩的格式,可以把RAW概念化为“原始图像编码数据”。对RAW文件的处理不方便看到相应具体效果,本文处理方式是将原始数据文件格式转换成方便处理的图像格式再处理。目前比较流行的有多种图像文件格式,
3、典型的有BMP、GIF、TIFF、JPEG等,图像的文件格式在图像处理中有着重要的作用,其中BMP图像格式应用最广泛,本节将简要介绍BMP图像文件格式。BMP(Bitmap File)是一种Windows采用的点阵式图像文件格式,主要由位图文件头、位图信息头、位图调色板以及位图数据四个部组成。结构如表1所示:表1 BMP位图文件组成位图文件组成标示名称作用与用途头文件BITMAPFILEHEADER文件类型与数据启示位置等信息头BITMAPINFORMATION位图大小与长、宽、高等信息调色板RGBQUAD由颜色格式确定调色板数组位图数据BYTE位图数据,确定压缩格式等BMP位图文件的第四部分
4、是实际的图像数据。对于具有调色板的位图,图像数据就是该像素在调色板中的索引值。对于2色黑白图像,每个字节可以表示8个像素,对于16色像素,每个字节可以表示两个像素,对于256色像素,每个字节可以表示一个像素。其中,图像的位图数据是按行存储的,每一行的字节数按照4B边界对其,也即每一行的字节数是4的倍数,不足的字节用0来补齐。图像的位图数据是按行从下到上、从左到右来排列的。也就是说,从图像的位图数据中最先读到的是图像最下面一行最左边的像素,然后读到该行左边的第二个像素,接着读到倒数第二行最左边的像素,紧接着倒数第二行第二个像素,以此类推,最后读到图像上第一行最右边的像素。这也是图像在显示器中显示
5、的顺序。将原始RAW格式文件按照一定规则添加相应的头文件以及相应的信息头等,能将原始RAW文件转换成BMP格式位图文件。转换前后文件如图1所示。 图1 图像数据采集与转化结果三、图像拼接 通过图像拼接技术,可以扩展图像的分辨率,得到宽视角的图像。在平时的日常生活中,使用普通相机来获取宽视野的场景时,必须通过调节相机的焦距,才能拍摄到完整的场景,但是获得的全景照片分辨率相对降低。另外,由于距离原因是限制,一些大尺寸物体是无法用一张照片拍摄下来的。为了确保图像分辨率的条件下获取大视野范围的场景图片,人们提出图像拼接技术,将图像进行无缝拼接。例如,在微小型履带式移动机器人导航系统中,单目视觉不能满足
6、机器人是视觉导航需要,利用图像处理技术,将机器人双目采集的图像进行拼接,可以增大机器人的视野,给机器人的视觉导航提供方便。其中,图像拼接是一个多步骤的过程,大体上看,可以分为图像获取、图像预处理、图像配准、图像融合等步骤。由于采取的方法各不相同,不同方法间步骤也有较大的不同,但总体过程相差无几。图像拼接的流程图如图2所示。图2 图像拼接基本流程 3.1 图像预处理 由于图像采集过程中环境光线和摄像机本身成像质量以及格式转换等因素的影响,有外界的噪声加入到图像中,使图像会发生不同程度的失真。因此对所采集到的图像进行处理前,需要先对图像噪声进行平滑除噪操作。由于我们只要求选择有突出感兴趣的特征,衰
7、减不需要的特征,故预处理后的图像并不需要去逼近原图像,预处理后的图像并不考虑图像的降质,目前预处理方法主要是去噪,高斯去噪算法比较常用。高斯滤波器是根据高斯函数的形状来选择权值的线性平滑滤波器。高斯平滑滤波器对去除服从正态分布的噪声有很好的效果。一维高斯函数为 其中的决定了高斯滤波器的宽度。对图像来说,常用二维零均值离散高斯函数做平滑滤波器,函数表达式如下:使用高斯滤波的理由有如下几条:1、高斯函数具有高斯函数是单值函数。因为高斯函数对谁都不偏袒图像的边缘在哪里,高斯函数在各个方向的平滑程度是相同的。2、高斯函数具有旋转不变的特性,主要是因为它在工作的时候是用用像素邻域的加权均值来代替该点的像
8、素值。3、高斯函数的付立叶变换频谱是单瓣的,它能够去除高频信号同时又保留有用的信号!4、高斯函数说了它的参数决定了你要的平滑程度越大,平滑的就越厉害5、最后一点就是二维高斯函数卷积可以分两步来进行,首先将图像与一维高斯函数进行卷积,然后将卷积结果与方向垂直的相同一维高斯函数卷积。因此,二维高斯滤波的计算量随滤波模板宽度成线性增长而不是成平方增长。3.2 图像配准 对图像进行harris角点算法的进行图像角点的提取,利用harris算法找出一幅图像中像素数据比较突出的点,即为特征点,或角点。它的具体算法是通过分析像素周围区域自相关函数的自相关矩阵特征值来判断某一点是否为角点。Harris角点检测
9、算子定义了任意方向上的自相关值E(u,v)为一组方形区域中图像灰度误差的总和,即:u,v为x,y方向上的微小偏移量。I(x,y)为(x,y)像素点的灰度值,I(x+u,y+v)为(x,y)有微小偏移后的灰度值:(x,y)为高斯滤波器,用来过滤噪声。它的泰勒展开式为 M为2x2的对称矩阵 式中I I为像素点沿着x,y方向的一阶导数。 M是局部自相关函数,其特征值可以表示局部自相关函数的曲率。由于Harris具有各向同性,故M也可以保持其旋转的不变性。实际应用中用来计算角点的响应函数如下:其中1,2为M矩阵的两个特征值,可以表示局部自相关函数的曲率,Det(M)代表求矩阵行列式,Trace(M)代
10、表求矩阵的迹,k取经验值0.04-0.06。通过对两个特征值进行分析,可得到以下三个情况:(1) 如果两个特征值都比较小,说明窗口所处区域灰度值变化比较平坦,即沿着任意方向移动,函数E(u,v)的变化不明显。(2) 如果两个特征值一大一小,说明这是一条边缘线。当沿着边缘方向移动时,函数E(u,v)出现轻微变化,而当垂直于边缘移动时,函数值(u,v)则变化剧烈。(3) 若两个特征值都比较大,则表明该区域呈现尖峰状。当沿着任意方向移动时,函数E(u,v)变化剧烈,这意味着该像素点是一个焦点。提取的角点流程如图3 所示 图3 角点提取流程图 判断角点时,先对R进行非极大窗口抑制,并设定一个阀值T,本
11、例中T值为0.01倍最大R值,当计算出来的R值大于阀值T,即可以表示找到一个角点,否则就不是。特征点一般来说是局域范围内的极大兴趣值对应像素点。图4所示为经过高斯去噪后所提取的特征点,图中点状标记符号即为特征点,为了增加图像中的特征点,添加了两个标注性符号,为了方便图像在之后的拼接中配准。 图4 高斯去噪提取的特征点Harris算法性能分析:(1) 该算法中只用到灰度的一阶方差以及高斯滤波,计算量相对较小。(2) Harris算法具有缩放不变性,图像经过缩放前后角点检测基本一致,这是因为该算法利用了图像的一阶导数,可见Harris算法能较好的适应缩放变换。(3) Harris算法在纹理信息较为
12、丰富的区域可以提取出大量的角点,而在纹理吸塑的区域图区的角点数较少,比较真实的反映了图像角点的位置。但是Harris角点也存在着不足之处,主要是对噪声比较敏感,这就要求在选取高斯平滑函数的窗口大小难以设定,而且对旋转也比较敏感,因为对自相关矩阵M利用的是水平和垂直梯度来计算的,也即角点量是由水平和垂直方向的梯度决定。并且角点提取的效果依赖于阀值的设定,而阀值的选取又依赖于经验值,所有也有一定的不确定性。确定角点之后,要对两幅图像行进角点匹配,角点匹配常用的方法为相似测度NNC(normalized cross correlation 归一化互相关)方法。NNC的计算公式如下:式中,W1和W2是
13、分别以I1的角点P1和I2的角点P2为中心点两个大小相同窗口,u1,u2为灰度均值,(xi,yi)为取值范围的窗口大小。NCC算法通过计算模版图像和搜索图像互相关值来确定匹配程度,互相关值最大时位置决定模版图像在搜索图像中的位置,进行角点匹配时,先对图像I1中的任一角点,寻找到图像I2当中和它的相关性最大的角点,当双向搜索到最大相关性角点彼此都对应并且相关性最大时候,我们就认为找到了一对候选匹配点。具体实施中,将两幅图像进行Harris角点检测后,分别得到角点对应与该图像的坐标位置,以该坐标位置为中心,分别取其附近的8个像素值,然后进行与另一幅图像进行匹配,找出距离最小的点作为匹配点。接着,将
14、图像一中的角点1与图像二中的所有角点进行相减,得到一个最小误差值,并记录下该位置,这样依次将图像一中的角点2,角点3一直到最后的角点都进行相减,即可得到两幅图像之间的最佳匹配点。3.3 图像融合确定了待配准两幅图像的对应点后,利用这些对应的点对,以一幅图像为参考,将另外一幅图像归一化到以参考图像为标准的坐标系中,将所得的图像最后需要对图像进行融合,即对图像的缝合,以对缝合的边界进行平滑处理,以使得图像看起来自然。常用的图像融合方法为加权平均法。加权平均法对图像的融合的原理为对重合区域的像素值先进行加权,之后再叠加平均。如下式所示:这里w1和w2分别是第一幅图像和第二幅图像中重合区域所对应的像素
15、的权值,并且满足w1+w2=1,而且0<w1<1,0<w2<1,选择适当的权值,可以使重叠的区域实现平滑的过渡,并且能够消除拼接的痕迹。其中,权值的选择使用的是Szeliski提出的渐入渐出的方法:其中,w1和w2与重叠区域的宽度有关,一般取其中,width表示重叠区域宽度,并且w1+w2=1,0<w1<1,0<w2<1,。在重叠区域中,w1由1逐渐变到0,w2由0逐渐变到1,由此即可以实现重叠区域的f1慢慢平滑过渡到f2。如图5所示:图5 加权平均融合过程3.4 图像拼接实验在实验过程中,首先为了验证拼接的可靠性以及算法的准确度,先将一幅BMP图像分割成两幅具有交叉部分的子图,利用这两幅图像进行拼接,将拼接后的图像与原图进行比较,结果如下:图6分割前原图像 图7 分割后图像 图8 角点提取图9 拼接后图像从以上拼接过程中以及拼接后的图像与原图像进行比较后可以看出,图像经过角点提取然后拼接融合等过程,可以很好的拼接两幅具有交叉部分的图像。四、总结本文主
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电子房屋买卖合同格式范本编写示例
- 投标安全承诺函
- 八年级生物下册 7.1.1 植物的生殖教案 (新版)新人教版
- 河北省安平县八年级地理上册 1.1 辽阔的疆域教学设计 新人教版
- 八年级物理上册 第二章 声现象 第2节 声音的特性第2课时声音的特性综合应用教案 (新版)新人教版
- 2023六年级英语上册 Review Module Unit 2教案 外研版(三起)
- 2024-2025学年新教材高中化学 第1章 原子结构 元素周期表 第2节 元素周期律和元素周期表 微专题二 元素“位-构-性”之间的关系教案 鲁科版必修第二册
- 2024-2025年高中语文 第3单元 单元导读教案 粤教版必修1
- 2024-2025学年高中历史 第四单元 工业文明冲击下的改革 第15课 戊戌变法(2)教学教案 岳麓版选修1
- 雨污管道劳务包工细分合同(2篇)
- 大学生职业生涯发展规划智慧树知到期末考试答案2024年
- b方太营销组织岗位角色与职责设计
- 送教上门教师培训课件
- 湖北省武汉市洪山区武珞路小学2023-2024学年四年级上学期期中测试数学试题
- 慢病防控知识培训
- 维护祖国统一和民族团结
- 中小学教师违反职业道德行为处理办法
- 关键岗位廉洁从业培训课件
- 麦肯锡商业计划书
- 农业旅游商业计划书
- 《神话原型批评》课件
评论
0/150
提交评论