工程图纸矢量化发展现状报告_第1页
工程图纸矢量化发展现状报告_第2页
工程图纸矢量化发展现状报告_第3页
工程图纸矢量化发展现状报告_第4页
工程图纸矢量化发展现状报告_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

工程图纸识别技术研讨

开展情况汇报

1报告内容研讨意义开展现状根本技术问题现有技术手段未来能够的着力点2研讨意义工程图是工程技术人员描画设计的对象、表达设计思想的主要工具。现有的工程图纸是长期以来人类智慧和劳动成果的结晶,据国际数据与文档管理杂志估计,在全世界现有的80亿张工程图纸中,超越85%以上是人工绘制的。但是,如今工程图纸绘制的技术主要是运用计算机来进展绘制,运用CAD技术。3在大多数领域,胜利运用过的工程图纸就是一种珍贵的技术贮藏资源,除了运用于当时工程的指点,也是以后对产品进展再设计、维护,以及对于提高产品设计质量、降低设计本钱及缩短产品设计周期具有不可估量的作用。CAD技术可以极大地提高图纸的消费和运用效率,当我们想像运用CAD技术那样来高效地利用以前的手绘图纸时,这中间需求一个转化技术,以及一些更加智能的协助[1]。4开展现状从80年代中期起,很多工业兴隆国家就开场着手图纸输入这一任务。起初方法是运用某种CAD系统经过人机交互重画一遍一切的蓝图,这样可以使得图面美观一致,尺寸比例准确。但是这种方法效率很低,绘制价钱昂贵,任务既繁琐又枯燥无味,呵斥人力物力资源的浪费。5近假设干年来,CAD技术在工程设计领域得到普及性运用,从而使工程图纸矢量化技术的研讨进入高潮。目前国外己经出现了一些商品化的矢量化软件,比较著名的有德国Softelec公司的VPStudio/VPRasterPro,Able公司的R2V,挪威Rasterex公司的RxAutolmagePro2000,,华中科技大学的EDIS软件、清华大学的ANNO等。这些软件在一定程度上可以进展图纸的矢量化,但是它们通常都是针对某种专业图纸,如机械图纸、电子图纸或地图等,而且矢量化的准确率也不是很高,例如对于交叉点多而复杂的图纸,软件自动跟踪时能够会出现错误走向。6根本问题图像获取与处置图纸图像的矢量化根本图元和文字符号的识别工程图形的2D了解面向工程图形的二维重建7工程图纸识别的根本过程预处理矢量化图文分离图形识别图形重建8图像的获取与预处置由于工程图纸普通较大,所以大多数情况下运用扫描仪扫描工程图纸,最后将位图格式的文件保管到计算机中。图像预处置的质量直接影响到后续任务,但在这个领域,技术相对成熟,根据工程图纸的特性主要用到的图像处置技术是消蓝处置〔滤色〕、图像去噪,边缘提取。9由于工程图纸在存放的过程中容易产生褶皱等损坏,图纸上难免会出现一些非绘制的图像元素,运用高斯滤波,中值滤波,以及数学形状学的方法都可以在一定程度上消除噪声,改善图像质量。由于工程图纸的特性,在矢量化之前,经过边缘提取处置的图像最接近于矢量图,也最容易进展矢量化处置。这里适用的方法主要有Canny、Sobel、数学形状学、频域变换〔傅里叶、小波等〕等方法进展处置[2]。10图纸图像的矢量化[3]基于细化的矢量化方法基于轮廓匹配的矢量化方法基于邻接图的矢量化方法正交方向搜索法11智能算法在控制工程领域中有比较胜利的运用如模糊控制、遗传算法、人工神经网络等,表现出非常好的鲁棒性、自顺应性以及灵敏的可扩展性。在矢量化的过程中可以处置较复杂的情况。模拟人工读图的的方式来进展矢量化的过程可以使机器具备一些“常识〞,先从整体上把握图纸的宏观特征然后由粗到细由拓扑构造到详细线型准确有效地把握图纸中各类线型之间的相互关系直接从图像中提取出各类图元[4]。12图文分别技术图形虽然是工程图纸中最为重要的信息,但是假设短少了一些必要的文字描画,工程图也将变成不可了解的图像,也无法用于工程指点。这其中主要有图源,图纸类型标注,作者,尺寸标注,资料标注等。这些文字描画,对于快速运用工程图纸进展消费、修正、产品维护、查询等起着至关重要的作用。工程图纸自动化识别中有必要运用OCT技术将工程图标的信息提取出来[5]。13工程图形2D重建图形经矢量化处置后,图素的尺寸和图素间的拓扑关系都会产生一定误差,为了使识别结果与各种CAD软件绘制图形的效果相近,提出对矢量图实施“二维重构〞。包括两部分[6]:

图形结构拓扑校正图形轮廓的精确尺寸校正14工程图纸二维重建的前提是根本图形元素的识别,根本可以分为两大类[7][8][9][10]:基于统计的方法和基于知识表示的方法。大多数基于统计的识别方法,图形对象的特性是被事先定义的,然后设计一个运用边境断定的分类器来进展空间特性的决策。最典型的是模版匹配方法。基于知识的识别方法,是将图形对象表示为一些知识,比如规那么或语法,依此来对图形对象识别。对具代表性的是知识构造表示与推理和知识语法的方法。15图素的拓扑类型直线图素与其他类型的拓扑关系圆弧图素与其他类型的拓扑关系 根据现有的两大类识别方法,以及工程图纸本身拓扑关系约束的特点。统计类识别方法较适宜用于数目多,构造简单的工程图识别。知识表示方法,由于知识推理方便,易于表达拓扑约束关系,在图形对象多而复杂的情况下较适宜。16 图形拓扑关系表示的中不乏有各种新意的表示方法,但是运用最多也是最有效的表示方式就是运用图。 工程图纸本身就是一张图,而且图纸当中很多的图形基元或整体相对于根本图元〔直线、圆弧、圆、工程标注符号〕就类似于一张有着很强拓扑关系的图。所以用图来表示工程图纸中的根本图元是目前最流行的表示方法。而且在CAD绘图中,根本的绘制操作〔除了图元的修正〕都非常类似于对图这种数据构造的操作。17将工程图中的每个图素作为“图〞的顶点,两个顶点之间的关系可用弧来表示,屠苏见的拓扑关系用权值来表示,将其数值化。根据事先定义的图素间关系来选择有向图或无向图。图的储存普通运用邻接表[6]。

18图素的拓扑关系表示模型是一种动态表示模型,普通对该模型进展如下操作[6]:添加结点:图素添加,添加结点,并添加该节点所对应的关系。删除结点:图素被删除,减少结点,并在与其有拓扑关系的表中删除该结点。查询:在带权图的中找到该图素对应的结点,并提取该节点对应的邻接表。结点拓扑关系修正:当拓扑关系变动时,对图素结点的邻接表重写,及向与改图素有拓扑关系的其他图素的邻接表中添加该图素结点。19拓扑校正处置有了前面拓扑关系的正确表示,根据识别结果,对图形对象进展矫正[6]。主要方法有:

剪切和延伸平移和扩展归并20尺寸校正处置[6] 这一阶段的前提也是正确识别尺寸标注线。在工程图纸中的尺寸有各种类型,如程度尺寸,斜向尺寸,直径尺寸,角度尺寸。尺寸标注的构造相对简单,都是矢量箭头和表示尺寸的字符组成,同时很多情况下,尺寸标注,尤其是长度的表示,有很强的层次关系。所以可以采用树类数据构造来保管。每个方向的尺寸可以构成一颗树,一切方向的树可以构成森林。从而处理不同视图间尺寸表达一致的的问题21树的根节点为与根节点相连的叶子节点的尺寸基准,树的每个节点都以他的父节点的一个尺寸界限作为它的基准。校正时,都是以基准所在的一段为固定端,而一零一段为活动端,坚持固定端不动,校正活动端到相应的位置。其中主要过程有生成尺寸树,确定约束域,定义约束属关系,图形元素及尺寸标注的准确位置校正。22相关任务1[11]来自印度的学者SekharMandal采用了比较系统的图像处置方法来进展工程图纸的重建,详细流程如下:1.运用OCR类软件将图中一切字符探测出,进展图文分别任务。2.运用Canny边缘提取算法,将光栅图中一切的轮廓表示出来,二值化处置之后就将整幅图的骨架细化出来。233.采用数学形状学中的开启运算来提取特定方向的的图形元素;采用1×4的构造元素来提取程度线段,4×1的构造元素来提取垂直线段用原图将提取出来的两幅图减掉,就可以得到其他恣意方向上的线段和弧线。4.采用链式码〔行程编码〕的方式将图中的一切点阵图表示出来,运用和弦特性将图中一切的直线判别出而且一切的弧线被当成是多个小线段组成,记录线段的拐点。提取后的程度线段提取后的垂直线段245.利用链式码信息来构建矢量格式图。然后,根据两线段之间相间间隔的关系来判别两条直线能否属于原来同不断线的两条边缘,设定阈值进展判别

假设两条直线满足阈值限定,就将两条线段间的部分进展填充,从而进展矢量图的重建。重构图形的阈值化断定过程以及重构线宽信息25相关任务2.1[7][8][9]识别领域比较有代表性的任务就是香港城市大学——刘文印运用基于知识表示的识别方法。首先,在预处置阶段,运用开源软件Res2Vec进展矢量化,然后运用阈值去噪的方法去除被判别为噪声的小短线。其次,定义了四种拓扑关系,分别为直线的相交、平行、垂直〔不相交〕以及弧线与直线;分别都有准确量化了的参数来表示。26再次,提出了一种属性树的知识表示方法;同时,提出了KAA(KnowledgeAcquisitionAlgorithm)——用于知识提取与表示和KGRA(KnowledgeGraphRecognitionAlgorithm)用于知识推理与识别。KAA的根本流程如下:27KAA算法描画:输入:组成图形对象的向量集(用户提供的例如)。输出:图形化知识〔一颗储存着每两个结点间的几何约束关系和访问顺序的树〕流程:1.提取一切的相交几何约束关系同时构造属性树G(V,E);2.假设G是连通的,转到第6步;3.将G分割成G1,G2,G3……Gn颗连通的子树;4.搜索节点间可以将字数衔接起来的平行和垂直关系;5.假设上述关系找到了就将它们参与G,同时转到第2步,否那么停顿〔F〕。6.参与弧线和圆的拓扑关系到图中;7.在G的根底上构造生成树ST,用广度优先的原那么遍历ST,获取约束顺序K(c1,c2……cn);8.停顿(S),同时将G和K作为这种对象的知识储存到知识库中。28由于在识别过程中不能够将向量和已有的知识表示100%的匹配,所以定义了关于直线和直线,弧线和弧线以及由直线构成的类弧线之间的类似因子的定义。KGRA算法描画如下:输入:SV:向量集〔构成待识别对象的向量集〕KD:知识库TL:阈值集,其中包含了长度和数量的容忍范围变量:CT:识别过程中暂时构造的的树SM:标识集〔用来标识识别过程中被运用过的向量〕输出:RR:识别结果——用SV来表示的图形对象的类型。29算法过程:1.从KD当中选择知识树K,假设一切的知识都曾经实验过就停顿〔F〕2.清空CT,初始化SM3.从SV中选择下一个向量V,要求这个V真实没有在SM中被标注的。参与V到CT中作为根;同时,将V在SM中标注,表示V曾经在识别过程中运用过了。4.从遍历顺序K中选择下一条边E。假设一切的边曾经被访问过了,而且冗余向量的个数没有超越容忍限制,就停顿〔S〕,同时将RR标示为由当前K来指示的对象类型5.否那么,将V标志为以E为边的父节点,运用V和E来计算V’6.搜索V〞,在空间上沿着两个方向搜索,运用TL中的容忍限制来检测在SV中与V’类似的向量。7.假设V〞找到了,就将它设为CT中V的子节点,在SM中将V〞标志为已运用过,同时转到第4步8.假设没有找到V〞,而且向量的缺损数量超越了容忍的范围,就转到第1步,否那么转到第4步30由于目前完全由计算机进展识别还不能到达较高的精度和理想的了解结果,往往在经过一些几何变换〔尺寸、方向、图层交叠等〕之后,就不能得出很好地识别结果。这时需求用户交互的来审查正确、错误、脱漏这样的识别结果。给出新的指点来引导知识库的更新;知识库的更新,最直接的表达就是对其中阈值库〔或容忍库〕中关于长度、角度、向量个数的阈值范围进展动态的调整。在用户给与反响之后系统将根据,正确识别坚持原有阈值,脱漏识别更新阈值,错误识别被忽略掉的原那么进展阈值调整。这样就是整个系统构成一个闭环反响来提高系统性能。31相关任务2.2[10]清华大学的——郭田田,在刘文印任务的根底上进展了进一步的开展[16]。主要创新点如下:1.把注释作为一种新的根本图素,由此主要图素分为三大类:直线、弧线和文本;并且由此定义了五种拓扑关系:直线相交、直线平行、直线与圆弧、直线与文本、圆弧与文本。2.在知识提取和识别的阶段都设置了优先级,优先级概念的引入提高了知识提取和识别的效率。在知识提取阶段,按照统计数据显示,按照直线相交-直线平行-直线与圆弧-直线与文本-圆弧与文本这样由高到低的优先级来提取拓扑关系,这样可以节约大量的计算时间。知识提取过程与刘文印类似。32识别的过程中,根本思绪和刘文印非常类似,但是运用了优先级的概念,可以提高识别效率。作者以为,一个图形对象假设特征越明显,由于其差别大,所以在统计上的特性就是分布的比较少,所以在识别阶段,搜索根本图素的优先级就由统计分布特性少到多,优先级由高到低。这样,首先开场搜索特征明显的部分,假设在没有用到优先级最低的一级就可以将目的识别出来,就可以节省大量的计算时间,同时也在一定程度上降低了搜索目的时的复杂度。在本文中识别过程的优先级正好和知识提取阶段相反:文本与圆弧-文本与直线-弧线与直线-直线平行-直线相交的顺序又高到低进展探测。333.反复方式的预处置在工程师绘图的过程中,在规范允许的范围内,不用的绘图工程师能够会有不同的绘制风格,一样的事物在人看来被归为一类,而对于对一切认知事物都准确表示的机器来说就被归到不同的分类,例如:以上两幅图都代表楼梯,但是由于在楼梯的表示中平行的线条树木不一样,在机器看来就是分为两类,由此我们可以想到,反复方式的表示虽然符合规范,但是会导致大量识别结果的冗余分类。所以作者将反复方式处置为实践关系块:在实践关系块的处置中,只保管第一个和最后一个图素的拓扑关系,来代表所包含的块中的表现方式。从而使识别过程具有一定的智能性。34相关任务3[12][13]南京大学——路通,运用约束网络来进展识别。其主要特征有:1.运用了更加准确地特征表示方法,初步的有定义了CGF(CommonGraphicsFeature),其中有根本图素、属性、关系、优先级、阈值范围这5个属性来描画一个图形对象。为了提高识别效果和表达出大类与小类的层次关系,在CGF的根底之上定义了定义了静态特性,其中包括:积极特性、消极特性、辅助特性和关系。前三个特性都是CGF集,关系描画的就是这三个集中两两之间的关系。作者同样采用了优先级战略来对识别匹配过程中的候选特性进展排序,表示为文本-圆-弧-直线这样由高到低的优先级。2.用户初始化系统阶段对将要识别的工程图设定领域知识背景。在作者看来,由于规范不同没有一种规那么是一切工程图纸之间共有的,所以指定领域知识可以将识别率提高。353.表述拓扑关系时,作者运用字符号表示,其间可以运用+、!、>、&、|、〔等计算机运算符号进展衔接,这样,规那么都是以字符串的型式表现的。到了识别的时候,就会转化称约束网络,进展逐渐的测试

约束网络中每个节点都是根据约束条件建立的测试函数,每个节点得到的测试结果是一个布尔值。4.建立一个指明领域的规那么库,规那么库在识别的过程中动态的调整规那么构成、规那么候选排序、自动阈值调理;而且,将人机互动的调整,和机器自动识别结果的调整分别对待。5.将文字的语义了解结果和图形对象的识别过程交融起来,使之成为同时进展的互动指点过程,而不是简单地进展图文分别和图形识别这样顺序且分别的过程。36现存问题[3][4]缺乏对工程图建立完好意义的信息表示方法,表达才干不是足够的强。工程图进展了解的针对性强的领域知识还不能给予准确地表示。对工程图进展了解的实施表达方法才干还不是非常强。缺乏对工程图进展深层次了解的有效的实现方法。只能处置单张图纸内容。37未来展望提高图像预处置质量,采用更加有效的去噪、重建和图像分割算法;从而提高矢量化的结果,减少重建时的难度。运用一种评价机制,减少误校正发生。提高知识表示才干,开展公用性更强的图形了解知识系统。加强专业领域知识指点知识表示和推理,提高机器学习才干和图形对象的识别才干。图像重建时,可以将同一系列不同张图纸之间建立联络,从而进展成套产品重建。38参考文献1.工程图纸矢量化的研讨与实现〔上海海运学院硕士论文〕,2004。2.数字图像的边缘检测,陈启祥,2006。3.工程图纸矢量化方法研讨,丁伟东,2006。4.工程图纸识别与了解的研讨现状分析,董玉德,2006。5.AStudyonInformationExtractionMethodofEngineeringDrawingTables,RizaSulaiman(Malaysia),20216.基于质量评价的矢量化工程图后处置技术研讨〔西北工业大学博士学位论文〕,2004。7.EngineeringDrawingsRecognitionUsingaCase-basedApproach,WenyinLiu,2003。8.InteractiveRecognitionofGraphicObjectsi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论