《AI硬件与Pyhthon编程实践》04基于计算机视觉的物体形状检测写字字帖_第1页
《AI硬件与Pyhthon编程实践》04基于计算机视觉的物体形状检测写字字帖_第2页
《AI硬件与Pyhthon编程实践》04基于计算机视觉的物体形状检测写字字帖_第3页
《AI硬件与Pyhthon编程实践》04基于计算机视觉的物体形状检测写字字帖_第4页
《AI硬件与Pyhthon编程实践》04基于计算机视觉的物体形状检测写字字帖_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于计算机视觉的

物体形状检测人工智能开源硬件与python编程实践情境导入视觉分拣机器人,利用视觉系统采集图像,计算机系统进行图像处理,先完成特征点检测、轮廓检测等过程,再进行图像匹配或形状识别。生活中经常遇到需要对物体形状进行判断的情形,自动拣球机可以发现视野内的乒乓球、高尔夫球、足球等圆形物体,餐盘识别系统可以发现矩形、圆形等指定形状的餐盘。学习物体形状检测方法,了解相关应用技术,具有实际意义。任务与目标了解图像处理及图形识别技术的基本原理、相关算法和应用框架;掌握运用人工智能开源硬件设计智能应用系统的方法,掌握Python语言的编程方法;应用人工智能开源硬件和Python相关算法模块设计物体形状检测功能;针对生活应用场景,进一步开展创意设计,设计具有实用价值的物体形状检测应用系统。知识拓展:图像预处理方法灰度化二值化图像增强图像去噪边缘检测知识拓展:灰度化灰度化是一种常用的图像预处理方法,它将彩色图像转化为灰度图像,应用在图像分析与识别等应用中;在RGB空间中,空间的原点对应的是黑色,距离原点最远的那个顶点对应的是白色。原点和白色顶点的连线段上对应了从黑色到白色的灰度值,也称亮度值;灰度图像只含有亮度信息,不含色彩信息,其亮度是连续变化的,要表示灰度图像就需要把亮度值进行量化,通常把灰度划分为256个灰度级,从0到255。知识拓展:二值化值化也是图像预处理的一种技术,又称图像黑白化。通过二值化的处理,可以凸显出图像的轮廓。它将像素点的灰度值设置为0或者255,不采用其它灰度值,目的是使整个图像都呈现出黑白效果。通过选取合适的阈值,将256个不同等级的灰度图像进行划分,划分结果仍然可以描绘图像的整体或局部特征,这样就实现了图像的二值化。知识拓展:霍夫变换

图像中的形状检测主要是侦测诸如直线、圆形、椭圆形、矩形等几何形状,常用的算法是霍夫变换。霍夫变换是通过直角坐标系和极坐标系之间的变换将图像空间中具有相同特征的直线或者曲线映射到参数空间中的一个点上,然后在参数空间中对点进行描述,使结果更易识别和检测,最后用累加器进行累加,从而把检测图形的问题转化为寻找最大累加值的问题。

知识拓展:霍夫变换的步骤用canny算子进行边缘轮廓提取。在做霍夫变换时,如果将所有的像素点都做映射处理,会导致计算量太大,一般都是先用canny算子对边缘轮廓做提取,尽可能的去掉平滑区域的点,减少计算量;利用二值化的方法以及开闭等形态学操作提取轮廓,去掉噪声等扰动,求得在拟合线性方程时尽可能准确;利用霍夫变换完成空间映射;用计数器统计出现次数最高的未知系数组合,如(ρ,θ)等。知识拓展:直线检测

根据提取出的很多特征点(X0,Y0),(X1,Y1),...,(Xn,Yn)求待拟合直线Y=kX+b中的斜率k和偏移b。通过任意两点得到若干组(k,b),选取出现次数最多的一组(k,b)就是要求的参数。把图像平面上的特征像素点映射到参数平面上,通过累计可能会出现几组参数峰值点,可以检测出图像中的多条直线。

知识拓展:圆检测

对圆的检测本质上就是求三个参数(x0,y0,r),所以就可以通过任意三点求解三个未知数,然后对(x0,y0,r)这个集合投票,最终出现次数最多的一组参数就是决定圆方程的参数。利用霍夫变换进行圆检测,就是将图像空间中的边缘特征像素点映射到参数空间,然后把参数空间中的坐标点元素对应的累加值进行累加,最后根据累加值确定圆心和半径。知识拓展:矩形检测

基于窗口霍夫变换与阈值分割自动识别图像中的矩形策略:通过图像窗口霍夫变换,提取霍夫图像的峰值(对应原始图像的线段),当四个峰值满足某些几何条件时,则检测出矩形。设计与实践形状检测Python编程接口圆形检测编程矩形检测编程调试、验证及完善形状检测编程接口人工智能开源控制板上集成的Python视觉库中提供利用霍夫变换检测直线、圆形、矩形的算法;提供find_lines方法进行直线检测;提供find_circles方法进行圆形检测;提供find_rects方法进行矩形检测。圆形检测find_circles方法image.find_circles()方法,使用霍夫变换在图像中查找圆,返回一个image.circle对象列表;x_stride是霍夫变换时需要跳过的x像素的数量。若已知圆较大,可增加x_stride。y_stride是霍夫变换时需要跳过的y像素的数量。若已知圆较大,可增加y_stride。threshold控制从霍夫变换中监测到的圆。只返回大于或等于threshold的圆。应用程序的正确的threshold值取决于图像。注意:一个圆的大小(magnitude)是组成圆所有索贝尔滤波像素大小的总和。圆形检测例程while(True):img=sensor.snapshot().lens_corr(1.3)#进行镜头畸变校正,去除图像中的鱼眼效应;forcinimg.find_circles(threshold=2500,x_margin=10,y_margin=10,r_margin=10,r_min=2,r_max=100,r_step=2): #以圆心(c.x(),c.y())和半径c.r(),用黄色画圆;

img.draw_circle(c.x(),c.y(),c.r(),color=(255,255,0))经验及调试方法image.circle对象有四个值:x,y,r(半径)和magnitude。magnitude是检测圆的强度,值越高越好roi是一个用以搜索的矩形区域(x,y,w,h),图像操作范围仅限于roi区域内的像素。如果未指定,默认的roi即整幅图像。x_stride是霍夫变换时需要跳过的x像素的数量。若已知圆较大,可增加x_stride。y_stride是霍夫变换时需要跳过的y像素的数量。若已知直线段较长,可增加y_stride。threshold控制从霍夫变换中监测到的圆。只返回大于或等于阈值的圆。一个圆的大小是组成圆的所有索贝尔滤波像素大小的总和。margin的分量x_margin、y_margin和r_margin用来控制所检测的圆的合并。r_min,r_max和r_step用来控制测试圆的半径。缩小测试圆半径的数值可以提升搜索性能。阈值threshold=3500比较合适。如果视野中检测到的圆过多,需要增大阈值;相反,如果视野中检测到的圆过少,需要减少阈值。矩形检测find_rects方法image.find_rects()方法用于查找图像中的矩形,返回一个image.rect对象的列表。该方法适用于检测与背景形成鲜明对比的矩形。Threshold参数的取值要根据应用场景的情况进行调节。在矩形边缘处所有像素上滑动索贝尔算子并进行累加,边界值小于threshold的矩形会进入返回列表。矩形检测例程while(True):clock.tick()img=sensor.snapshot()#find_rects中threshold应设置为足够高的值,以滤除在图像中检测到的具有低边缘幅度的噪声矩形。最适用与背景形成鲜明对比的矩形。

forrinimg.find_rects(threshold=25000):#查找矩形,阈值=10000img.draw_rectangle(r.rect(),color=(255,0,0)) #画出矩形,颜色为红色

forpinr.corners():#找出矩形的四个角

img.draw_circle(p[0],p[1],5,color=(0,255,0))#四个角顺时针画出绿色的半径为5像素的圆形分析与思考find_rects方法可以快速实现矩形的检测与追踪。生活中经常会遇到三角形、菱形等其它几何形状的物体(如图),利用霍夫变换检测直线的方法有助于这些形状的检测吗?利用网络查阅相关技术方法,给出解决方案。利用find_circles函数可以实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论