




已阅读5页,还剩119页未读, 继续免费阅读
(通信与信息系统专业论文)基于k元特征图像序列的视频目标分割与识别技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
电子科技大学博上论文: 基于k儿特征图像序列的视频目 标分割勺识别技术研究 摘要 在信息技术各应用领域中, 信息数据的特征描述、 特征保持和基于特 征的搜索,识别与分割技术对于信息数据采集,发送,交换与接收各系统 设计与应用优化都是十分重要的。用 x 元特征序列来描述信息数据,建立 识别与分割技术具有重要的理论意义和应用价值。该技术不仅能高效分割 和识别目标, 而且能高效表征和压缩多媒体信息, 可广泛应用在遥感, 医学, 气象,金融,公安,交通,文件处理,自动检测,机器人视觉,军事等众 多领域,己成为研究热点之一。 k元非均匀进制特征图像序列是指目标具有 k位特征图像且每位上特 征图像的可能状态数为有限, 不同位上的特征图像的可能状态数不一定相 同,同时特征图像互相之间具有时间,空间或映射关联,且k元特征图像 序列能唯一表征目标,即只要识别出目标的 k元非均匀进制特征图像序 列,就等同于识别出目标. 基于 k元特征图像序列的视频 目标分割与识别技术属于模式识别, 计 算机图像处理以及机器视觉等学科的交叉领域, 是k参数估计与检测的推 广,即从 k参数推广到 k特征图像,是一种多维特征识别,显然识别复 杂性大大增加。 论文研究了基于 k元特征图像序列的视频目标分割与识别技术。 在视频目标 x元特征识别模型与识别系统框架中,本文首先建立了基 于k元特征图像序列的识别模型和识别定理, 从空间关系, 信息嫡和状态 空间等角度分析了k元非均匀进制特征图像序列的特性: 然后讨论了图像 目标与其观察数据空间的关系,从信息数据传输的角度分析了形成观察数 据的信道特性,数据成像模型,影响成像质量的噪声模型:接着研究了保 持特征的图像复原,去噪和除畸变的基本技术模型;最后建立了图像目标 k元特征图像的识别基本技术框架。 在特征图像的分割技术中,本文提出了两种 k元特征图像序列分割技 术。一种是基于特征图像序列的特征色学习的分割技术,该技术首先对特 征图像彩色样本动态聚类, 形成标准色的参考类; 然后将参考类模糊扩展; 最后根据参考类识别出视频目标特征图像序列的特征色或图案, 从而分割 出特征图像.另一种是基于预识别指导的特征图像序列分割技术,该技术 先利用彩色滤波器抑制非特征图像区域杂波; 然后利用颜色信息来进行特 摘要 征图像区域粗定位,接着利用特征图像区域的灰度分布特性与其非特征图 像区域有较大差异而实现特征图像粗分割, 再接着利用特征图像序列的先 验知识如宏特征作为判决准则,通过多次反复,分割特征图像区域。 在特征图像序列组成基元一可视宏特征描述与提取技术中,研究了二值 化基元特征图像的宏块状层 目标特征描述及提取技术,同时提出了二值化 字符特征图像的骨架笔划和骨架笔划结构识别特征描述和提取技术。 在基于 k元特征图像序列的目标模糊识别技术中,将模糊识别基本理 论同基于 k 元特征图像的目标识别相结合, 运用模糊识别的思想来识别基 元图像序列,从而识别图像 目标。主要讨论基于 k 元特征图像的目标模糊 识别基本理论,包括基于 k元特征图像的目标模糊识别系统简介,基于k 元特征图像的目标模糊识别相关的模糊集基本理论和模糊识别基本方法。 重点研究了二值化字符特征图像的可视特征模糊化技术及基于该特征空 间的特征图像的模糊识别技术。 在图像目标识别特征多层模型与神经网络群识别技术中,建立了图像 目标的 k元特征图像序列识别特征多层模型, 然后提出一种基于特征图像 视觉识别特征分层模型的视频目标神经网络群识别技术, 该技术基于日标 可视层目标特征空间,将大的 b p网络系统按目标的可视特性分为若干子 b p网络, 各子网的输出经神经网络融合后输出识别结果. 当目标变化时,网 络群只训练新增的子b p网络, 从而简化系统结构的调整过程, 缩短重新 训练网络所需要的时间, 从而有效地提高网络的训练效率, 大大提高了网络 的可扩展性和重复利用性, 从而提高网络的适用性和速度. 在目标特征图像序列的多分类器自适应融合识别中,针对当序列图像 受到严重千扰时,单个分类器对目标特征图像序列识别率低, 多分类器的 常系数线性融合分类系统存在的问题,提出一种多分类器 自适应融合技 术,该技术依据输入特征图像的后验置信度,分类器的分类结果一致度等 因素自适应调整多分类器的融合系数。建立了融合识别系统,分析了其原 理与性能,取得了好的结果。 在基于信源状态被访问概率的多级自适应识别系统中,研究基于信源 状态被访问概率多级识别系统原理和提出基于特征图像状态被访问概率 的动态多级识别技术,该技术依据信源动态统计特性,根据各分类器的分 类特性,动态地调整多分类器序列,获得了高识别率和识别速度. 根据上面的理论和技术实现,对大量实际特征图像序列进行了测试与 p c仿真,取得了很好的结果。 电子 科技人学博 1 论文:基于k儿特征图像序列的视频目 标分割 j 识别技术研究 关键词 :视频 目标 模糊识别 特征图像 b p网络群 色彩学习特征提取 自适应融合多级识别 a bs t r ac t a b s t r a c t i n a l l i n f o r m a t i o n t e c h n o l o g y a p p l i c a t i o n f i e l d s , t h e f e a t u r e d e s c r i p t i o n , f e a t u r e h o l d i n g , s e a r c h i n g , r e c o g n i t i o n a n d s e g m e n t a t i o n b a s e d o n t h e f e a t u r e s o f t h e i n f o r m a t i o n d a t a a r e v e r y i m p o r t a n t t o t h e d e s i g n a n d o p t i m i z a t i o n o f t h e i n f o r m a t i o n d a t a c o l l e c t i o n , t r a n s m i t t i n g , e x c h a n g e , r e c e i v e r s y s t e m . t h e d e s c r i p t i o n o f i n f o r m a t i o n d a t a b a s e d o n k f e a t u r e s e q u e n c e s a n d t h e s e g m e n t a t i o n a n d r e c o g n i t i o n o f v i d e o o b j e c t ( s r v o ) b a s e d o n k f e a t u r e i m a g e s e q u e n c e s ( k - f i s ) h a v e g r e a t s i g n i f i c a n c e n o t o n l y o n t h e o r y , b u t a l s o o n p r a c t i c a l a p p l i c a t i o n s , s u c h a s r e m o t e s e n s i n g , m e d i c i n e , w e a t h e r , f i n a n c e, p u b l i c s e c u r i t y,t r a f f i c, f i l e p r o c e s s i n g , d e t e c t i o n , m a c h i n e v i s i o n, m i l i t a r y a f f a i r s a n d s o o n t h e s r v o b a s e d o n k - f i s n o t o n l y c a n b e u s e d t o s e g m e n t a n d r e c o g n i z e t h e v i d e o o b j e c t , b u t a l s o t o c h a r a c t e r i z e a n d c o m p r e s s t h e v i d e o s e q u e n c e s i n h i g h e f f i c i e n c y , w h i c h i s v e r y i m p o r t a n t f o r m u l t i m e d i a i n f o r m a t i o n t r a n s m i t t i n g a n d s e a r c h i n g . k f e a t u r e i m a g e s m e a n s t h a t t h e v i d e o o b j e c t h a s k f e a t u r e i m a g e s , t h e s t a t u s n u m b e r o f e a c h f e a t u r e i m a g e s i s l i m i t e d , a n d t h e s t a t u s n u m b e r o f e a c h f e a t u r e i m a g e s i s p r o b a b l e d i f f e r e n t f r o m t h e o t h e r s . t h e f e a t u r e i m a g e i s c o r r e l a t e d o n t i m e o r s p a c e . k f e a t u r e i m a g e s a n d t h e r e l a t e d v i d e o o b j e c t h a v e o n e 一 t o 一 o n e c o r r e s p o n d e n c e . t h e s r v o b a s e d o n k - f i s b e l o n g s t o t h e c r o s s - f i e l d s o f p a t t e r n r e c o g n i t i o n a n d c o m p u t e r v i s i o n , a n d s o o n , a n d i s e x t e n d e d f r o m t h e e s t i m a t i o n a n d d e t e c t i o n o f k p a r a m e t e r s t o t h e s e g m e n t a t i o n a n d r e c o g n i t i o n o f k f e a t u r e i m a g e s . i n t h i s p a p e r , t h e o r e t i c m o d e l o f t h e s r v o b a s e d o n k - f i s i s d e v e l o p e d . t h i s p a p e r a l s o a n a l y z e s t h e c h a r a c t e r i s t i c s o f k - f i s i n s p a c e r e l a t i o n , i n f o r m a t i o n s o u r c e e n t r o p y , s t a t u s s p a c e s a n d t h e r e l a t i o n b e t w e e n t h e v i d e o o b j e c t a n d i t s o b s e r v e d d a t a . t h i s p a p e r a l s o e s t a b l i s h e s t h e t e c h n i c a l f r a m e o f t h e s r v o b a s e d o n k - f 工 5 i v 电子科技大学博士论文: 基于k元特征图 像序列的视频目 标分割与识别技术研究 o n t h e s e g m e n t a t i o n o f f e a t u r e i m a g e s e q u e n c e s , t w o s e g m e n t a t i o n m e t h o d s a r e p r o p o s e d i n t h i s p a p e r . o n e i s b a s e d o n t h e l e a r n i n g o f e x t e n d e d c h a r a c t e r i s t i c c o l o r o f t h e f e a t u r e i m a g e s s e q u e n c e s . a f t e r c a l c u l a t i n g t h e r e f e r e n c e c l u s t e r s o f t h e c h a r a c t e r i s t i c c o l o r , t h e r e f e r e n c e c l u s t e r s a r e f u z z i l y e x t e n d e d . a c c o r d i n g t o t h e c h a r a c t e r i s t i c c o l o r p a t t e r n , t h e o b j e c t f e a t u r e i m a g e s a r e s e g m e n t e d b a s e d o n t h e e x t e n d e d r e f e r e n c e c l u s t e r s . t h e o t h e r m e t h o d i s b a s e d o n t h e r e c o g n i t i o n o f t h e m a c r o f e a t u r e i m a g e s a c c o r d i n g t o t h e p r i o r y k n o w l e d g e o f t h e f e a t u r e s . f i s t , r e d u c e t h e n o i s e s w i t h c o l o r f i l t e r s , t h e n l o c a t e t h e p o s s i b l e f e a t u r e i m a g e s w i t h t h e c h a r a c t e r i s t i c c o l o r a n d t h e g r a y t e x t u r e o f t h e f e a t u r e i m a g e s , a n d t h e n d e c i d e i f t h e s e g m e n t a t i o n i s s u c c e s s f u l a c c o r d i n g t o t h e p r i o r y k n o w l e d g e o f t h e f e a t u r e s i m a g e s . i f t h e s e g m e n t a t i o n f a i l e d , t h e n s e g m e n t t h e f e a t u r e i m a g e s a g a i n b a s e d o n t h e o t h e r p a r a m e t e r s o r m e t h o d s o n t h e d e s c r i p t i o n a n d e x t r a c t i o n o f t h e v i s u a l m a c r o f e a t u r e s o f t h e f e a t u r e i m a g e s e q u e n c e s , t h i s p a p e r d e s c r i b e s e s p e c i a l l y t h e l a y e r o b j e c t i d e n t i f i e r o f t h e b i n a r y f e a t u r e i m a g e s , a n d p r o p o s e s a t e c h n i q u e o f t h e e x t r a c t i o n o f l a y e r o b j e c t i d e n t i f i e r t h e d e s c r i p t i o n a n d t h e e x t r a c t i o n m e t h o d o f t h e m a c r o s t r o k e s a n d t h e m a c r o s t r o k e s t r u c t u r e s o f t h e c h a r a c t e r f e a t u r e i m a g e s a l s o a r e g i v e n i n t h i s p a p e r . o n t h e f u z z y r e c o g n i t i o n o f t h e v i d e o o b j e c t b a s e d o n k - f i s , t h i s p a p e r m a i n l y d i s c u s s e s t h e b a s i c t h e o r y o f t h e f u z z y r e c o g n i t i o n o f t h e v i d e o o b j e c t b a s e d o n k - f i s i n c l u d i n g t h e s y s t e m , f u z z y s e t , a n d f u z z y r e c o g n i t i o n m e t h o d . e s p e c i a l l y d i s c u s s e s t h e f u z z y r e c o g n i t i o n o f t h e v i d e o o b j e c t b a s e d o n t h e v i s u a l m a c r o s t r o k e s a n d s t r o k e s t r u c t u r e s f e a t u r e s p a c e o f t h e c h a r a c t e r i m a g e s . o n n e t ( n n ) t h e r e c o g n i t i o n o f t h e f e a t u r e i m a g e s b p n e u r o n g r o u p, m u l t i l e v e l m o d e l t h i s o f p a p e r d i s c u s s e s t h e b a s e d o n t h e r e c o g n i t i o n t h e k i m a g e s c a n b e l a y e r e d i n t o f e a t u r e i m a g e s s e q u e n c e s . s e v e r a l l a y e r o b j e c t s t h a t t h e f e a t u r e f e a t u r e a r e d e s c r i b e d b y t h e i r s t y l e , l o c a t i o n a n d s i z e a f t e r t h e o b j e c t i m a g e s a r e s c a n n e d v abs t r act a n e w b p - n n g r o u p p r e s e n t e d i n t h i s p a p e r , w h i c h h a s a l o t o f s u b - b p - n n b a s e d o n t h e f e a t u r e s o f t h e i m a g e s , c a n i m p r o v e t h e e x p a n d a b i l i t y , a d a p t a b i l i t y a n d w o r k i n g s p e e d o f t h e b p - n n . o n t h e r e c o g n i t i o n o f t h e v i d e o o b j e c t b a s e d . o n t h e a d a p t i v e c o m b i n a t i o n o f m u l t i p l e c l a s s i f i e r s , t h i s p a p e r d i s c u s s e s t h e m e t h o d o f t h e a d a p t i v e c o m b i n a t i o n o f m u l t i p l e c l a s s i f i e r s . w h e n t h e i m a g e s e q u e n c e s a r e s e r i o u s l y d i s r u p t e d b y n o i s e s , t h e r e c o g n i t i o n r a t i o s o f t h e s i n g l e c l a s s i f i e r o r t h e c o m b i n a t i o n c l a s s i f i e r w i t h c o n s t a n t w e i g h t s d e c r e a s e d s h a r p l y . p r o p o s e d i n t h i s p a p e r , a n a d a p t i v e c o m b i n a t i o n c l a s s i f i e r o f t h e c o e f f i c i e n t s v a r i e d w i t h t h e i n p u t p a t t e r n c a n i m p r o v e t h e a d a p t a b i l i t y a n d p e r f o r m a n c e o f c l a s s i f i e r s v e r y m u c h . o n t h e r e c o g n i t i o n o f f e a t u r e i m a g e s b a s e d o n t h e m u l t i l e v e l c l a s s i f i e r s , t h i s p a p e r d i s c u s s e s a n e w s e r i e s o f c l a s s i f i e r s o f t h e o r d e r d y n a m i c a l l y a d j u s t e d b y t h e r e a l t i m e m e s s a g e s t a t u s p r o b a b i l i t y . t h e m e t h o d c a n i m p r o v e t h e e x p a n d a b i l i t y , a d a p t a b i l i t y a n d w o r k i n g e f f i c i e n c y o f t h e r e c o g n i t i o n . c o m p u t e r e x p e r i m e n t s a n d s i m u l a t i o n s w i t h g o o d r e s u l t s t e s t a l l t h e t e c h n o l o g i e s d i s c u s s e d i n t h i s p a p e r k e y w o r d : v i d e o o b j e c t : f e a t u r e i m a g e s ; c h a r a c t e r s c o l o r l e a r n i n g ; f e a t u r e e x t r a c t i o n ; f u z z y r e c o g n i t i o n ; b p g r o u p ; a d a p t i v e c o m b i n a t i o n ; m u l t i 一 l e v e l r e c o g n i t i o n vi 独 创 性 声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。 据我所知, 除了 文中特别加以标注和致谢的地 方外, 论文中不包含其他人己经发表或撰写过的研究成果, 也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签 名 : 落i日 期 : 30 d 年 。 月 、 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、 使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘, 允许论文被查阅和借阅。 本人授权电子科技大学可以将学位论文 的全部或部分内 容编入有关数据库进行检索, 可以采用影印、 缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名: 工卜 导师签名 日 期:列 年 iv 月 鑫 含 日 电子科技人学博 论文:基于k g 特征图像序列的视领目标分割i , 识别技术研究 第一章 绪论 1 . 1研究背景及意义 人类传递信息主要有三个渠道j n门 是语台 , 文字, 和图 像。 洲 言 息论的角度来看, 图像所包含的信息量很大, 不仅有灰度, 还有色彩; 不仅有平面, 还有立体等, 其内 容极为广泛。 人撰 洞 干 得到的外部信息大约有7 0 % 来自 6 r 睛所摄取的图像, 在许多时候, 没有任何其他形式比图像所传递的信息更丰富和真切。 图像是用各种观测系统以不同形式和手段观测客观世界而获得的, 是可以 直接或 间接作用于人眼并进而产生视知觉的实体.根据抽象程度和研究方法等的不同可分为 三个 层次 : 图 像处理、 图 像分 析 和图 像理 解, 图 像处 理指比 较低层的 操作,着 重强 调在图 像之间 进行的变换; 图 像分析则进入了中 层, 主要是对图 像中感兴 趣的目 标进行检测和 测 量, 以 获得 它们的 客 观 信息 ,从 而 建 立对图 像的 描述; 图 像 理 解主 要是高 层 操作对从描 述抽 象出 来的 符号 进l 彩 算 ,通过 研究目 标的 性质和 它 们之间的 相互联系,得到 对图 像 内 容含义的理 解以 及对原来客 观场景的 解释, 从而指导和规划行动 5 2 , 图 像处理和识别技术是信息技术中的一门 跨学科的前沿高科技。 从它的 研究方法 来看,它与数学、 物理学、 生 理学、 心理学、电 子学、 计算机 科学等许多学科可以 相互 借鉴 ; 从 它的 研究 范围 来看 , 它与 模 式识别、 计算 初 视 觉、 计 算 机图 形 学等多 个 专业又 互 相 交叉 另外, 图 像的 研究 进展 与 人工 智能、 神经网 络、 遗传 算 法、 模 糊逻辑 等 理论 和 技 术 都有密切的联系,它的 发展 应用与医学、 遥感、 通信、 文 档处 理和工业自 动化等许多 领域也是不可分割的. 基于k元非均匀进制特征图 像序列的图 像目 标分割与识别属于图像处理与识别技 术范畴。 k元非均匀进 制特征图 像序列是指目 标具 有k个 特征图 像且每位匕 特征图 像 的 可能 状态数为有限 元, 不同 位上的 特征图 像的 可能状态数不一定相同, 文中定义 各 位 特征图 像具 有不同 的 进 制。 同 时 特征 图 像互 相 之间 具 有时间 和空间 关 联 且k元 特 征图像序列能唯一表征目 标, 换句话说,只要识别出目 标的k元非均匀进希 惜征图 像序 列,就等同识别出目 标, 进而可检索目 标. 在现实生活中视频目 标常有各自 的 特征图像序列, 而 且通常目 标特征图 像序列与 其邻 域 在 色彩, 灰 度或 纹 理 等 特征 上 有较大的 差 别。 如 手 写 体 签名 4 1 , 视 频 流11_i i - 辆的 牌照, 火车车厢的 编号, 体育比 赛中 运动员背上的号 码,邮 政自 动分 拣系统中 信 封中 的 邮 政 编码, 人 脸识 另 ii 中由 人 脸待 征 部分 ( 额, 眼睛, 鼻 子, 嘴唇, 下巴) 组成 的 特征图像序列等。 这些特征图像序列的各种组合通常代表着目 标的特殊含义. 因此 第一章:结论 通过分割和识别这些 特征图 像序列不仅能识别出图 像目 标,而且根据特征图像序列的 色彩, 灰度以及其他组合信息,还能识别出目 标的 其他属性,为进一步对目 标分类提 供了分类依据。 例如汽车车牌颜色就有特殊规定. 如车牌蓝底白 字是小型民用车, 黄底 黑字是民 用大型车, 军车的前二位是红色后五位黑色白 底等, 因此根据车牌颜色组合信 息就能快速的分割出 车牌区 域, 并能判定车的大小, 归属类别( 民用车, 军用车, 武警车, 外交车等) . k 元非均匀进制特征图像序列的分割与识别在现实社会生活具有非常重要的意 义。 k元非均匀进制特征图像序列的分割与识别如同图 像处理和识别技术一样己 经渗 透到各行各业, 并对人类的生活和发展的影响越来越大。 从2 0 世纪8 0 年代中期到9 0 年代取得了突飞猛进的发展, 现已 广泛的应用在遥感, 文件处理,工业检钡 1 , 机器人 视觉, 军事, 生物, 医学, 地质海洋, 气象, 农 艺, 灾 害治 理, 货物检测, 邮 政编码, 金融, 公安, 银行, 工矿企业, 冶金, 渔业, 机械, 交 通,电 子商务, 体育, 多 媒体 网络通信,多媒体检索 ( 包括宽带可视图 文、高分辨率图 像检索,文栩数据检索等 应用于远程教学、 远程诊断、 远程购物及娱乐) 等 领域。同时k元非均匀进制特征图 像序列的分 割与识别能高 效表征和压缩多媒体信 息, 基于视频图 像内 容的目 标索引, 对于多媒体信息的 传输也是有意的。 1 . 2 系统及其相关技术 k元非均匀进伟 峙征图 像序列的分割与识别过程包括以 下几个方面的研究工作: 视频 流中 特征图 像 序列的 检a 9 ( d e t e c ti o n ) 与 分 割( s e g m e n t a ti o n ) ; 特征图 像 特 征 描 述 与提取, 特征图像序列的识别三个主要阶段组成。 第一个阶段 称为图 像分割或 特征图 像序列 分离阶段。 在该阶段中分割出 特征图 像 序列图 像, 若特征图 像序列图 像是由 若干各 子图 像序列组成的, 则进一步按一定 规则 切分特征图 像序列图 像。 第二 个阶段称为 特征描述与提取阶段。 在该阶 段中 对图 像进行度量。 一 个度量是 指一个物体某个可度量性质的度量值, 而特征是一个或多个度量的函数。计算特征是 为了对图 像的一些重要特征进t 于 定量估计。 特征抽取过程产生了一组特征, 把它们组 合在一起, 就形成了特征向 量。同时按一定 准则压缩和优化特征向量。 模式识别的第三个阶段是分类器设计,分类器训练,性能评估等。 2 . 1 k 元非均匀进制特征图像序列的分割 1 1 0 1 1 5 4 3 图像分割是图 像分析的关键步骤,是一种低层次的计算机视觉技术。图 像分割通 电了 科技大学博 r : 论文:从十k儿特征图像序列的视频目 标分割 a 识别技术研究 过分离目 标、 提取参数和测量参数物原始图 像转化成更抽象的形式, 便于图 像的分析 和理解。 用于图 像分割的场景图 像特征信息有亮度、色彩、 纹理、 结构、 温度、 iv 运动、形状、 位置、 梯度和模型等。图 像分割的主要方法有:基于区域的方法, 基于 边界的方法等 8 0 基于区 域的分割方法是通过图 像划分为内部点集和外部点集来实现分割的。 在图 像的分割处理中,可以根据实际情况选 择全局阂值化、自 适应 值。 全局9 值是最简 单的 方法, 在整个图像中将灰度闭值的 值设置为常数。 自 适应闭值是把灰度阑 值取成 一个随图 像中 位置缓漫 变化的函 数 值。阖 值的 选择会对图 像的分割产生很大的 影响 通常的阑 值选择是基于直方图技术的, 从理论上讲, 将闺值设在直方图的谷, 能够最 小化分割错误率。 基于边界的图 像分割方 法是利 用边界 具有高梯 度值的性质直接把边缘找出 来, 常 用的 有三种方法: 边界跟踪, 梯度图 像闲 值化, 拉普拉斯边缘检测。 1 ) 边界跟踪。 边界跟踪是假定从一个梯度幅值图 像着手 进行处理,灰度级最高的点 ( 即原图 像 中 梯度值最高的点) 必然在边界上, 所以 可以 把这一 点作为边界跟踪过程的起始点。 搜索以 边界起始点为中心的3 x 3 邻域, 找出 具有最大灰度级的领域点作为第2 个边界 点。 如此迭代下去, 在一个无噪声的单调点状物图 像中, 该算法将描画出最大梯度边 界。 但是, 即 使少 量的 噪声 也 可能 使 足 影 综 暂 时 或 月 ilt 偏离 边界。 噪声 对 跟踪 的 影 响, 可以 通业r 踪前 对 梯度图 像 进行 平 滑或采 用 ,1 9 踪 虫 ” ( tr a c k in g b u g ) 来降 低 。 跟 踪 虫 是 在一个更大的空间 执行先前 描述过的 边界 跟踪过 程, 大尺寸的 跟踪虫可以 完 成梯度 图 像的 平滑, 从而降低了 它对噪声的 敏感性。 但是, 它也限制了 边界方向的急 剧改 变。 2 ) 梯 度图 像阐 值化。 如果用 适中的阐 值对一幅 梯度图 像 进行阐 值化, 将发现物体和背景内 部的点 低于 闭 值, 而大多数边缘点高于它。 k ir s c h的分割 算法采用的是一种分水岭算法来实现。 尽管计算开销大,但可以产生最大梯度边界, 并且避免了使用只有梯度跟踪虫时存在 的 许多 麻 烦。 拉普拉斯边缘检测拉普拉斯 算子是刘二维函数进行运算的 二阶导 数标量 算 子。 拉 普 拉 斯算 子是一 个二 阶导 数, 它 将 在 边缘 处 产生一 个陡 峭的 零 交 叉。 拉 普拉 斯 算 子是 一 个线 性的、 移不 变算 子, 它的 传递函 数 在 频域空间的 原点 为 零, 因 此 一 个 经 拉 普 拉 斯 滤波 过的 图 像具 有零 平 均灰 度。 如果 一 个无 噪声图 像具 有陡 峭的 边缘, 对 经 拉普 拉斯算子 滤波后的图 像用零灰 度值进行二 值化会产生闭 合的、 连通的 轮廓 并 消除了 所 有的内 部点。由 于噪声的 存在, 一般需要 在滤波之前进t 剥氏 通滤波, 常用的 是高斯低通滤波器。 第一章:结论 3 ) 边 缘检测和连接确定 图 像边界的方法是先检测每个像素和其直接邻域的 状态,以 决定该 像素是否处于 一个物体的边界上。具有所需特性的像素被标为 边缘点。当图像中各个像素的灰度级 用来反映各象素符合边缘像素要求的 程度时, 这种图像被称为边缘图像或边缘图( e d g e m a p ) 。 对 边缘 方向 而不是幅 度 进 行 编 码的图 像叫 做含方向 边缘图 。一 幅边 缘图 通常 用 边缘点 勾画出 各个物体的轮廓, 恻 r 少能形成闭合且连通的边界。 需要边缘点连按刁 - 能完成物体的检测过程。 边缘检测在物体的边界上, 像素的邻域是一个灰度级变化带, 其两个重要特征是灰度的变化率和方向。边缘检测算子检查每个像素的邻域并对灰度 变化率进行量化, 通常也包括方向的确定口 边缘检测算子大多是基于方向导数掩模求 卷积的方 法, 常用的有:r o b e r ts 边缘算子,s o b e r 边缘算子, p re r v it t 边缘算子, k ir s c h 边缘算子。 r o b e r ts 算子是2 x 2 算子, 对具有陡峭的 低噪声图 像响 应最好; 其他三 个 算 子都 是3 x 3 算子, 对灰度渐变和噪声 较多的图 像处理得较好。 k i r s c h 边缘算子可以 获得边缘方向图。对于使用两个掩模板组成的 边缘检测器时, 通常是取较大的幅度值 作为输出, 这使得它们对边缘的走向 有些敏感,取平方和的开方可以获得性能更一般 的 全 方位响 应。 边缘连接在非 理想的 情况下, 边缘图 像会出 现间隙, 需要 加以 填充 通过 搜索一 个以 某端点为中 心的5 x 5 或更大的 邻域, 在邻域中找出 其 他端点并 填充上 必要的 边界像素,实现边缘连接。 在复 杂的 场景中, 规定两个端点 只 有在边 缘强度和 走向 相近的 情7r ,下刁 连接能够避免过度分割。 在更坏的情况下, 需要利用启发式搜索、 曲 线 拟 合或者h o u g h 变换来实 现边 缘 连 接。 一般视频或图像中文本特征图像区域的定位方法可以分为两类 【 5 :基于部件 ( c o m p o n e n t b a s e d ) 的 方 法与 基 于 纹 理 的( te x t u r e b a s e d ) 方 法。 在 基 于 部 件的 方 法中 , 通过分析图 像场景中 边全 豹 或 者属于 字符具有相同 色彩与灰度的部件的 几何排列 情况来 检测图 像中的文本特征图像区域的 位置。一种方法是通过分析具有相同 色彩的 连通部 件的 水 平排 列 特征并 根 据固 定的 尺 寸 约 束 引牛 来 提取 文 本区 域。 l i e n h a rt与s t u b b i e r 除了 认为字符是具有相同 色彩的 连通 件, 并且具有一定的尺寸上的约束以 外, 还假设 字符 部件在连续的 前后视频图 像 帧中 具有 相应的匹 配部 件。 s h i m假设视频 流中 文本信 息是静态的, 基于这一假设采用链码来完成又 d 文本区域的分割,井目 利用空域信息进 一 步改善效果。 而j o i n与y u 将图像在不同的颜色通道上将图像分割为若干子图 像, 并利用子图像中,字符部件的分布特征实现对文本区域的检测。 而 在 基于纹 理的文 本特征 区 域 提 取 技术中, 则 认为由 于 文 本中 字 符的水 平排列 情 况,图 像中的文本区域在水平方向的灰度变化呈现出 近似周期性的特征,而且 字符在 组成 文本行时, 在字符之间的 空间 是州以 于相同的,因 此可以 利用图 像中的纹理分而 特征来实 现文本区域的 检测。 j o i n 与z h o n g 在将扫描灰 度文献图 像分 割为文本、 图片 电子科技大学博 论文: 基于k儿特征图像序列的视频rh 标分割, 、 识别技术研介 以 及半 色调 ( h a l ft o n e ) 图 像区 域的 处 理中, 利用了 这 些区 域的 不同 纹理 特征。 z h o n g 利用图 像中 文本行的纹理特 性来提取具有复杂背景的 灰度图 像中的文本区 域。 其原 理 是,首 先对每一个像素而言, 定义 其文本能量为以其为中心的一个1 x i : 的窗中的水平 方同的空间频率,而一个具有高的文本能量的矩形区域就会被认为属于文本区域。 z h o n g 针 对压 缩后 视 频与 图 像 数据, 提出了 一 种 基于 纹理的, 直 接 在d c 丁 域 进行处 理 的 快 速 文本区 域定 位方 法, 在z h o n g 的 方 法中, 加 入了 形 态 滤 波的 后向 处理以 改 善 效 果。基于纹理的文本区域检测技术目 前广泛应用于静止图 像中 文本内 容的处理中并且 取得了可观的效果。 文 本区域中字符目 标串的提取方法可以 分为两类:基于字符提取的方法与基于串 提 取的 方 法。 基于串 提取的 方 法八 通 常 可 采用 游长 平 滑( r u n - le n g th s m o o t h in g ) 算 法或 连通部件分析 c o n n e c t e d c o m p o n e n t a n a ly s i s ) . 用作图 像分割的度量准则不是唯一的, 它与应用场景图 像及应用目 的有关。虽然 图 像分割已 经有了 很长的 研究历史,针对各种具体要求建立了 许多算法, 然而至今!、勺 无 统 一的 理论。 利用算法分割出 的区 域图 与正 确存在的 分割 之间可能出 现误差。 误差有 3种类型, 一是分割后的图 像增添了 新的区 域; 二是 应有的区 域未被分割出; 三是 所用的 分割算法没有正确给出边界定位。 图像的描述是对图 像各组成部分的性质和彼此之间关系的描述。区域描述是在图 像中 感兴趣的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 机电安装工程质量通病防治措施1
- 2025阀门组件生产供应合同
- 2025年幼儿园教学器材采购合同
- 2025合同协议范本
- 2025租房子的合同范本
- 《设定起点:课件制作基础》
- 工作场所职业病危害警示标识培训
- 《智能扫描仪》课件
- 湖北省九师联考2025届高三下学期二轮核心模拟卷地理试题 含解析
- 工园区工业污水处理厂新建项目可行性研究报告-立项备案
- 育儿真经知到课后答案智慧树章节测试答案2025年春浙江中医药大学
- 2025合同模板个人车位转让合同 范本
- 2025-2030动力电池回收产业市场深度调研及发展趋势与投资战略研究报告
- 2025《中国建设银行房产抵押合同》
- 企业集团文件与档案管理制度
- 2024福建漳州市九龙江集团有限公司招聘10人笔试参考题库附带答案详解
- 建筑行业劳动保护制度与措施
- 中国少数民族文化知到课后答案智慧树章节测试答案2025年春云南大学
- 初级车工(五级)技能认定理论考试题(附答案)
- 2025年监理工程师考试《建设工程监理案例分析(水利工程)》综合案例题
- DB61T 5113-2024 建筑施工全钢附着式升降脚手架安全技术规程
评论
0/150
提交评论