(农业电气化与自动化专业论文)基于遗传算法的血液细胞图像分割方法研究.pdf_第1页
(农业电气化与自动化专业论文)基于遗传算法的血液细胞图像分割方法研究.pdf_第2页
(农业电气化与自动化专业论文)基于遗传算法的血液细胞图像分割方法研究.pdf_第3页
(农业电气化与自动化专业论文)基于遗传算法的血液细胞图像分割方法研究.pdf_第4页
(农业电气化与自动化专业论文)基于遗传算法的血液细胞图像分割方法研究.pdf_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 在医学上很多临床病症表现为白细胞数目的增多、肿大或者白细胞中细胞核的形 状发生变化,所以对白细胞数目和形状的研究有及其重要的意义;只有在对白细胞进 行正确分割的前提下,才可识别出目标的各类特征。图像分割是进行正确分类和识别 的基础,是图像处理领域中的关键问题之一。 遗传算法是一种高效并行的全局搜索方法,具有鲁棒性、并行性和自适应性的特 点,已广泛应用到许多学科及工程领域;在图像分割领域,遗传算法常用来确定分割 阈值。 在研究图像分割方法,遗传算法的原理及其在图像分割领域的应用的基础上,针 对血液细胞图像自身的特殊性,以提高全局搜索能力和收敛速度为目的,提出了一种 改进遗传算法的分割方法。算法采用二进制编码机制;为保持种群的多样性,随机产 生初始种群;以最大类间方差法作适应度函数;在更新种群方面,引入了新个体。 分析了图像分割的质量评价方法,以区域一致性、区域对比度、运行时间为评价 准则,对改进遗传算法的分割方法与传统的几种全局阈值分割方法进行了对比研究。 实验结果表明,提出的基于遗传算法的图像的分割方法,得到的图像目标清晰, 分割速度较快、分割效果较好,有一定的应用前景。 关键宇:图像分割;遗传算法;阈值;遗传算子 s m a y o ns e g m e n t a t i o nm e t h o d sf o rb l o o dc e l l i m a g eb a s e do ng e n e t i ca l g o r i t h m b s t r a c t m a n yd i s e a s e sc l i n i c a ls y m p t o mi sl e u k o c y t o s i s ,i n t u m e s c e n c eo fw h i t eb l o o dc e l lo r k a r y o n sc h a n g eo ff i g u r ea n dq u a n t i t y s oi ti si m p o r t a n tt os t u d yt h ew h i t eb l o o dc e l l f i g u r ea n dq u a n t i t y c o r r e c ts e g m e n t a t i o no nw h i t eb l o o dc e l l i st h ep r e c o n d i t i o nt o r e c o g n i z ea l lk i n d so ft h ef e a t u r eo fw h i t eb l o o dc e l l s e g m e n t a t i o ni s o n eo ft h ek e y p r o c e d u r e si nd i g i t a li m a g ep r o c e s s i n gf i e l da n dt h eb a s i so fe o n e e tc l a s s i f i c a t i o na n d r e c o g n i t i o n g e n e t i ca l g o r i t h m ( g a ) i sas o r to fe f f i c i e n t ,p a r a l l e l ,f u l ls e a r c hm e t h o dw i t hi t s i n h e r e n tv i r t u e so f r o b u s t n e s s ,p a r a l l e la n ds e l fa d a p t i v ec h a r a c t e r s n o wi th a sb e e na p p l i e d w i d e l ya n dp e r f e c t l yi nm a n ys t u d y f i e l d sa n de n g i n e e r i n ga r e a s ,i nt h ei m a g es e g m e n t a t i o n f i e l d ,g ai su s u a l l yu s e dt og e tt h et h r e s h o l do f i m a g es e g m e n t a t i o n t h em e t h o db a s e di m a g es e g m e n t a t i o n ,g e n e t i ca l g o r i t h m sp r i n c i p l ea n da p p l i c a t i o ni n t h ei m a g ed i v i s i o nd o m a i n i nv i e wo fp a r t i c u l a r i t ya b o u ti m a g ed a t a ,t a k es h a r p e n st h e o v e r a l ls i t u a t i o ns e a r c ha b i l i t ya n dt h ec o n v e r g e n c er a t ea st h eg o a l ,a ni m p r o v e dg e n e t i c a l g o r i t h mi ni m a g es e g m e n t a t i o n i s p r o p o s e d i nt h en e wa l g o r i t h m s :c o d i n g w i t h 2 - d i m e n t i o nc h r o m o s o m ei s a d o p t e d ;i n i t i a l i z a t i o no fp o p u l a t i o nw i t hs t o c h a s t i c a n d s y m m e t r i c a lm e t h o d si sp r o d u c e dt ok e e pt h ev a r i f yo ft h ep o p u l a t i o n ;o t s ui su s e da s f i t n e s sf u n c t i o n s ;i nu p d a t e dp o p u l a t i o na s p e c t ,an e wi n d i v i d u a li si n t r o d u c e d t h et h e o r ya n a l y s e sq u a l i t ye v a l u m i o no fi m a g es e g m e n t a t i o n t h ei m p r o v e dg e n e t i c a l g o r i t h mi sc o m p a r e dw i t ht h et r a d i t i o n a lm e t h o d sb yr e g i o nc o n s i s t e n c y , r e g i o nc o n t r a s t a n dr u n n i n gt i m e t h ee x p e r i m e n tr e s u l ts h o w st h a tt h em e t h o d o ft h ei m a g es e g m e n t a t i o nb a s e do n g e n e t i ca l g o r i t h mi sm u c hb e t t e r t h em e t h o dw h i 【c hm a k e st h ei m a g eg o a lc l e a r , t h e d i v i s i o ns p e e dq u i c k ,a n dt h ed i v i s i o ne f f e c tg o o d ,h a sc e r t a i na p p l i c a t i o np r o s p e c t k e yw o r d s :l m a g es e g m e n t a t i o n ;g e n e t i ca l g o r i t h m ;t h r e s h o l d ;g ao p e r a t o r d ir e c t e db y :p r o f p e ix i c h u n a p p l ic a n tf o rm a s t e rd e g r e e :c h e nliyin g a g r i c u l t u r a le l e c t r i f i c a t i o na n da u t o m a t i o n ) ( c o l l e g e o f m a c h i n e r ya n de l e c t r i c a le n g i n e e r i n g ,i n n e r m o n g o l i a a g r i c u l t u r a l u n i v e r s i t y , h o h h o t 0 1 0 0 1 8 ,c h i n a ) 插图和附表清单 图l 多尺度的阈值分割算法的分割结果图3 图2 最大熵遗传算法的分割效果3 图3 图像分割在图像工程中的位置8 图4 系统流程图1 0 图5 标准遗传算法流程图1 3 图6 血液细胞涂片图像采用中值滤波的效果:2 3 图7 另外一张血液细胞涂片图像采用中值滤波的效果2 3 图8 改进遗传算法的流程图2 9 图9 血液细胞切片图像利用不同算法所获得的分割效果3 0 图1 0 另一张血液细胞切片图像利用不同算法所获得的分割效果3 1 图1 1 血液细胞图像分割结果3 5 图1 2 另一张血液细胞切片图像利用不同算法所获得的分割效果3 6 表l 交叉操作示例1 7 表2 变异操作示例1 8 表3d i b ( d e v i c ei n d e p e n d e n tb i t m a p ) a p i 函数库2 l 表4 血液细胞图像性能评价结果3 5 表5 另一张血液细胞图像性能评价结果3 6 内蒙古农业大学 研究生学位论文独创声明 本人申明所呈交的学位论文是我本人在导师指导下进行的研究 工作及取得的研究成果据我所知,除了文中特别加以标注和致谢婀 地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包 含为获得我校或其他教育机构的学位或证书而使用过的材料,与我一 同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示谢意 申请学位论文与资料若有不实之处,本人承担一切相关责任 论文作者签名: 聋瓠业燕。日期:艘墨:垂:冱 内蒙古农业大学研究生学位论文版权使用授权书 本人完全了解内蒙古农业大学有关保护知识产权的规定印:研 究生在攻读学位期间论文工作的知识产权单位属内蒙古农业大学。本 人保证毕业离校后,发表论文或使用论文工作成果时署名单位为内蒙 古农业大学,且导师为通讯作者,通讯作者单位亦署名为内蒙古农业 大学学校有权保留并向国家有关部门或机构送交论文的复印停和电 子文档,允许论文被查阅和借阅学校可以公布学位论文的全部或部 分内容。( 保密内容除外) ,采用影印、缩印或其他手段保存论文 论文作者签名:强兽袭一 指导教师签名:;驺l 日 期:。垒芝:笪:圣二 僚古农业大学硕士学位论文 1 习硐言 在生物医学领域,显微图像是疾病诊断的重要依据。随着计算机技术和数字图像 处理技术的蓬勃发展,显微图像处理技术极大的提高了医学诊断的质量和效率。目前, 在动物疾病诊疗方面,涌现出一些新的研究方向,如动物血液图像处理、动物骨髓细 胞图像处理、乳液细菌图像处理等。 血液细胞图像的分割,就是将血液中的白细胞自动检出,并在去除图像中各种噪 声干扰的基础上,将单个白细胞图像划分成背景、细胞浆、细胞核三个区域。白细胞 图像的分割包括两方面的任务n 幻:( 1 ) 将有核细胞( 白细胞) 与背景及其它无核细胞( 如 红细胞) 区分开来;( 2 ) 将有核细胞( 白细胞) 的细胞核和细胞浆区分开来。 1 1 血液细胞图像分割国内外研究现状 血液踊由血浆、红细胞、白细胞和血小板等组成,其中自细胞的数目较少,但有 非常重要的作用,可以吞噬和清除侵入体内的细菌和异物。很多临床病症表现为白细 胞数目增多、肿大或者白细胞中细胞核的形状与数目发生变化,所以对白细胞数目和 形状的研究有极其重要的意义。 血液细胞图像的分割一般利用血液细胞图像特有的颜色信息、亮度信息、边缘梯 度信息、纹理信息、形态特征和统计特性d 1 等进行分割,主要的分割方法有:多尺 度下的阈值分割法嘲、边缘检测法、基于数学形态学的颗粒分析法哺刀、基于梯度图像、 基于多信息梯度图像抽1 和基于小波变换的流域分割等算法伽。 2 0 0 2 年,b j o mn i l s s o n 和a n d e r sh e y d e n n 田提出了s n a k e 模型和活动边缘轮廓相 结合的血液细胞图像分割方法。 2 0 0 3 年,l i u t , , j 等使用r u b 阈值法对血液细胞图像进行分割,由于在r g b 彩色空 间中表示同一颜色时,目标色彩的r 、g 、b 对白细胞和红细胞而言,其颜色值分界 不明显,而且在r g b 彩色空间中表示同一个颜色时,尺、g 、曰变化不大,不易控 制,使得彩色分割阈值的确定网难,从而造成彩色目标分割不理想: 文献d 羽提出了一种运用在线训练的神经网络快速白细胞分割方法。预选择根据均 值漂移算法和一致的样本,利用初值可以大大减少样本集而且保证了大量有用的信 息,采用粒子群优化算法训练神经网络可以快速收敛、避免局部最优。实验证明该方 法比传统的分割算法更准确。 文献3 1 提出了一种基于粒子群优化的遗传算法,粒子群优化是在双阈值中选择最 佳阈值的图像分割方法,遗传算法用于检测直方图中的谷值和峰值。 2 0 0 6 年,fb o r a yt e k 町提出基于数学形态学的预处理的改进分水岭算法分割显微 镜下的血液细胞。其基本思想是首先通过自适应加权的多尺度滤波对图像进行平滑, 再将求得浮点活动图像作为分水岭算法的输入。结果表明,该方法能有效地改善过分 2 基于遗传算法的血液细胞图像分割方法研究 分割及减小区域合并带来的计算负担。 2 0 0 6 年,w a n gs h i t o n g n5 1 提出了一种基于逐步分析的数学形态学和阈值相结合的 血液细胞图像分割方法。 2 0 0 6 年,f a b i os c o t t i “町提出一种结合三口幸6 彩色空间和灰度阈值的彩色血液细 胞图像分割方法,该方法鲁棒性较好。 2 0 0 6 年,w a n gw o x i n g d7 1 提出了一种分水岭和区域增长相结合的方法用于血液 细胞的图像分割,克服了过分分割和其它的梯度不规则的缺点。 文献n 田提出了一种基于图像的边界特点来确定模糊k o h o n e n 聚类网络输出类别 的方法。该方法首先构建图像的一个边界模型,然后利用z e m i k e 矩阵求出边界模型 的参数,最后根据参数的特点自动确定模糊k o h o n e n 聚类网络输出数目,实现图像 的自动分割。 文献n 蚰提出了一种细胞图像的自适应分割方法。首先将r g b 图像变换到h s v 空 间,清除图像中具有不饱和度信息的杂质;然后利用形态学重建滤波器做滤波,在保 持边缘性质的同时滤掉脉冲干扰,并清除图像照度不均匀的影响;最后用w a t e r s h e d 变换实现图像的自适应分割。 文献踟提出了一种细胞图像的快速阑值分割算法。采用r g b 3 彩色图像特征作 为图像的特征信息,对直方图数据进行高斯平滑并根据爬山聚类法计算直方图的近似 位置、连接两相邻峰值构成一凸多边形进行凹性分析,计算出的凹残差最大处就是所 求的最佳阈值,进行图像分割。 2 6 0 3 年,王浩军心等介绍应用多尺度的阈值分割方法,首先对原始图像直方图 进行多尺度滤波,根据它的尺度空间特性,确定合理的阈值,完成对细胞核的分割和 白细胞的检出。其次,利用局部颜色特性及全局形态特性控制种子点增长,完成对细 胞浆区域的分割。该方法对白细胞的检出率为9 8 ,分割效果主观评价为好的占 9 3 ,能有效地分割白细胞区域。 内蒙古农业大学硕士学位论文 3 :誉;,篱擎客;擎擎 图1多尺度的阈值分割算法的分割结果图 f i g 1 e f f e c ts e g m e n t a t i o no fm u l t i s c a l et h r e s h o l d 侯振杰心2 1 提出了一种基于熵的遗传算法对骨髓细胞图像进行分割,已取得了一定 的效果,将聚类数定为3 ,即将图像分成背景、细胞浆及细胞核3 类时,分割效果较 好,但是当聚类数增大时,时间丌销增加并出现过度分割的现象。 2 0 0 4 年,练玉来幢3 1 将改进遗传算法与二维最大熵结合起来对图像进行分割。二维 熵阈值分割法的目的就是要得到最佳分割阂值,使得图像的熵最大,可以直接对二维 阈值矢量进行编码。二维熵的判别函数作适应度函数,函数值越大,则该染色体的适 应度就越高,分割效果就越好。 图2 最大熵遗传算法的分割效果 f i g 2 g a sl l l i l x i l l l u i l le n t r o p yc t t i :c to f s e g m e n t a t i o n 谣萨稳 铲器 瀵 v o 冷,k矿一。 ,一 寸。 ,参翟键t、礓t争,羹鞋。p、0。 一 葶 。葶l一 、 一二寸|一 j一鼍一 一t 1 一 4基于遗传算法的血液细胞图像分割方法研究 从实验结果的可以看出,二维最大熵遗传算法的分割方法的性能与处理的图像有 关。该方法对分割二维直方图沿对角线分布且分布区域较窄的b a c t e r i a c - 和b l o o d 像分 割的区域均匀且目标形状好。对分布区域较宽的人脸图像的分割效果不理想。 2 0 0 5 年,王传永乜叼等研究了卯神经网络对血液白细胞彩色图像进行有效的分割, 为提高工作效率和降低人为误差提供了条件。首先从血液细胞图像中提出大量的白细 胞、红细胞和背景的颜色作为神经网络的训练样本数据:然后建立凹神经网络模型, 使用所收集的样本数据对神经网络进行学习训练,得到合适的网络权重值。实验表明, 即神经网络有较强的鲁棒性,对不同载片色彩差异有容错能力,可以达到正确分割 白细胞的目的,但是存在一些噪声的影响。 2 0 0 5 年,袁军嘲、郭宁宁嘲等利用多光谱波段理论分割血液细胞图像。 2 0 0 6 年,王彬鲫等介绍了一种基于f c m 算法的彩色血液细胞图像分割的方法。 1 ,2 图像分割 图像分割是依据图像的灰度、颜色或几何性质将图像中具有特殊含义的不同区域 分开,这些区域是互不相交的,且每个区域都满足特定区域的一致性啪曲1 。 假设一幅图像中所有像素的集合为f ,一个区域中的所有像素点都满足某种相似 性准则p ( ) ,把,划分为若干个子集慨,s :,s 。 ,分割出来的区域应满足: ( 1 ) u s ,= f ; j = l ( 2 ) s ,n s ,= 啦( 1 ) ( 3 ) w ,p ( s i ) = t r u e ; ( 4 ) 尸( su s ,) = f a l s e ,f j 式中,为空集。 从分割的方法来看,有灰度图像和彩色图像的区别,主要表现在每个像素的描 述上,前者足在维亮度空间上,后者足在三维颜色空问上。从分割的原理上看,彩 色图像和灰度图像的分割是一样的,都是基于像素值的相似性和空问的接近性,只是 对像素属性的考察以及特征提取等技术由一维空间转换到多维空间侧。 关于图像分割技术,己经有相当多的研究结果和方法,但是没有一种方法适合于 所有类型的图像,即使是某一类图像,各种算法的分割效果也不一样。因此只能根据 图像,结合相关的知识构造其适合特定图像的分割算法口。 图像分割的研究多年来一直受到人们的高度重视,至今已提出了上千种分割方法 协对;而且近年来每年都有上百篇研究论文的发表。 内蒙吉农业大学硕士学位论文 5 j 1 2 1 阈值分割方法 阈值法哪是常见的检测区域的分割方法,通过设置阈值把像素点按灰度级分为内 部点集和外部点集,实现图像的分割。主要有全局阈值法、双阈值法、自适应阈值分 割法、多尺度阈值法等。所谓全局阂值分割是利用整幅图像的灰度信息,从整个图像 中得到分割的阈值,并且根据该阈值对整个图像进行分割。自适应阈值通过对图像分 成块,对每一块选局部阈值进行分割,对既有背景又有目标的块直接设置阈值进行分 割:对只有目标或只有背景的块,根据领域各块定出的局部阈值,通过内插求出阈值, 对此进行分割。 1 2 2 区域分割方法 基于区域的方法主要有区域分裂合并和区域生长两种。 区域分裂合并方法泔1 先按四等分递归分裂整个图像,直到每等分都满足颜色一致 性为止;然后递归合并空间邻接的颜色一致的区域。区域分裂合并方法仅通过平均颜 色来判定区域颜色一致性,颜色不均匀的细胞核并不满足这一要求,会造成过分分割 或欠分割。 区域生长方法先设定一个像素或区域为种子域,然后对其邻接像素与种子域进 行颜色比较,如果差值小于设定的阈值则进行种子域生长。由于细胞核颜色的不均匀 性,基于单个像素的种子域生长也容易导致过分割和欠分割。 基于区域生长的分割方法抗嗓性能优于边缘分害1 j 和闽值分割,另外相比其它算法 其计算丌销较大,而且在计算过程中引入的预定误差值选取不当,还会引入误判,易 受分析目标内部组织之间的重叠干扰影响。因此,基于区域生长的分割方法一般适合 于边缘光滑、无重叠的细胞图像的分割伽1 。 1 2 3 边缘检测分割方法 边缘检测的基本思想是边界一般出细胞图像中像素狄度的反差或不连续产生,于 是利用边界的梯度变化性质直接提取边界。常见的方法主要有: ( 1 ) 边界跟踪法 它从原始细胞图像的梯度幅值中的一个边缘点出发,依次搜索并连接相邻边缘 点,从而逐步检测出边界的方法。 ( 2 ) 梯度算子边缘检测算法 常见的有r o b e r t s 算子、s o b e l 算子、l a p l a c e 差分算子、p r w i t t 算子、m a r r 算法 ( g u a s s - - l a p l a s e 算子) 等。 ( 3 ) 拟合算予( 即参数模型匹配算法) 用边缘的参数模型对图像的局部灰度值进行拟合,再在拟合的参数模型上进行边 6 基于遗传算法的血液细胞图像分割方法研究 缘检测。此类算子在检测边缘的同时,还平滑了噪声,对有较大噪声和高纹理细胞图 像处理效果较好,但由于参数模型记录着更多的边缘结构信息,计算开销很大,算法 复杂,而且对边缘类型要求较高。 1 2 4 纹理分割方法 基于纹理的分割方法是图像分割中一个活跃的邻域。在纹理图像中区域的均匀性 由区域内纹理的某些特征的一致性来表示,其分割的实现就是基于这些特征的。纹理 特征的提取大体可以分为基于模型和结构的两大类。在基于模型的方法中,认为纹理 可以表示成具有某些参数的模型形式,进而由纹理图像来对参数进行估计,用参数作 为特征来进行分割问题的求解。而基于结构的方法则认为纹理图像是由按照一定排列 规则的基元构成的,用基元和排列规则进行分割。 1 2 5 基于神经网络的分割方法 这种方法的出发点是将图像分割问题转化为诸如能量最小化、分类等问题,从而 借助神经网络技术来解决问题。文献使用多层网络并且用反向传播方法对网络进行 训练,图像的灰度直方图作为输入,输出为分割的阈值,这种方法的实质是利用神经 网络技术来获取用于图像分割的阈值。此方法需要收集大量的训练样本集,但收集这 些样本是比较困难。 1 2 6 基于小波变换的分割方法 对细胞图像进行多分辨率小波变换,一般用二进制小波变换在低频段采用长时问 窗,在高频段采用短时问窗,将原始信号分解为一系歹l j 具有不同空间分辨率、不羁频 率特性和方向特性的子带信号,这些子带信号具有良好的时域、频域等局部特征,这 些特征可用来表示原始信号的局部特征,用以克服傅罩叶分析在处理非平稳复杂图像 时所存在的局限性。进而在不同的分辨率层次上对图像进行分前。在低分辨率上分解 的变化结果会反映原图中些较明显和较大尺寸的结构特征,因而在低分瓣率上对图 像进行粗分割,由于计算量小,适于寻找目标的大致轮廓:而在高分辨率上分解的变 化结果反映原图的较细致的细节特征,因而在高分辨率上对图像进行细分割,且粗分 割的结果对精细分割具有一定的指导作用,故可大大减少计算量和提高目标的定位精 度。虽然小波变换有很多优良属性,但如果直接用于边界提取可能出现孤立像素点和 不连续,还会检测到多余的伪边缘点。而且由于小波变换离散化过程中,只能以一定 精度记录和处理各分辨率一卜的分析结果,不可避免地引入了频率分量的截断误差,造 成部分边缘信息的丢失。另外若图像巾存在噪声也会对准确识) :i j 边缘位置产生很大影 响。幽而常常将小波变换方法和其他办法结合起来应片j ,义献7 提 i :小波变换与数学 内蒙古农业大学硕士学位论文 7 形态学结合算法,先用多分辨率小波变换对图像进行分解,提取原图在不同尺度、不 同方向上的模糊分量和细节分量,接着用数学形态学的算子对小波分解后的细节图像 进行一系列的膨胀、腐蚀等形态学运算。其中膨胀运算可填补小波分解后目标区内部 空洞,增强目标的连通性:腐蚀运算则可消除噪声和其他无用细节信号。此算法分割、 定位效果较好,但是数学形态结构元素的尺寸和形态对分割结果影响较大。 1 2 7 基于模糊集理论的分割方法 主要有广义模糊算子与模糊阈值法两种分割算法。 ( 1 ) 广义模糊算子认为灰度的变化是光照不均造成的,边缘是高频成分,但图像 边缘包括了图像其他部分的灰度信息,由于量化影响,灰度值在边缘处产生突变。此 算子在广义模糊集合的范围内对图像处理时,使真正的边缘处于较低灰度级,但还存 在一些不是边缘的像素点的灰度在较低灰度级中,虽然算法的计算简明,且边缘细腻, 但得到的边缘会出现断线问题。 ( 2 ) 模糊阈值法引入灰度图像的模糊数学描述嘲,通过计算图像的模糊率或模糊 熵来选取图像的分割阈值,最后用阈值法分割图像得到边界。此算法中窗宽的设置对 分割好坏起决定作用,窗宽取值小,可能在直方图的谷点出现震荡,造成假阈值的出 现;反之,窗宽取值过大,则可能会平滑直方图的谷点,造成阈值丢失。另外所用的 隶属函数满足边界条件和对称性时,模糊阈值法才能使用。此法对大场景的图像处理 效果很好,对小场景图像效果不明显,而且它受隶属函数窗口大小的影响较大。使它 的应用范围受限。 1 2 8 基于数学形态学的分割方法 基于数学形态学的分割法基本思想是用一定的结构元素对图像进行基本操作之 后,再与原图相减,它利用图像的拓扑特性进行操作,利用集合论对图像进行非线性 变换:它最基本的操作是膨胀和腐蚀,通过它们的不同组合形成开、闭运算:对狄度 数字图像按照一定的结构元取最大值和最小值,进而实现图像的分割。 文献啪删提出了一种新的方法,将数学形态学的方法分别应用于r g 、r r 和g b3 个2 维彩色空| 日j 的图像分割,再利用信息融合技术得到最终的图像分割结果。该方法 主要由两部分构成:在3 个2 维空间的分割及融合。 1 2 9 图像分割的其它方法 除了以上这些纯数学原理的分割方法外,也有一些结合细胞本身属性的细胞图像 分割方法研究p ”;w u 等利用椭圆形参数模型法对人颈部和胸部细胞图像进行了自 适应分割,对予椭圆形的重叠和非重叠细胞的分割取得了较好的效果;p a l 等“以研究 8 基于遗传算法的血液细胞图像分割方法研究 了利用细胞主要轮廓点的自动分割;还有用可变形模板进行基于内容的图像分割、基 于规则图像分割方法m 1 等等。 1 3 存在问题 通过对国内外血液细胞图像分割方法现状的研究,发现还存在下列问题: ( 1 ) 以上这些算法各有其优缺点,都或多或少需要用户的交互控制才能使分割的 准确率达到较高要求;另外血液细胞各自的复杂性、多样性,很难得到一个统一的全 自动分割方法。 ( 2 ) 彩色血液细胞图像分割是基于多维颜色向量的聚类过程,计算量大、运行速 度慢是制约实时应用的一个突出问题,如何利用现代图像处理理论的方法来提高图像 分割的运行效率一直是研究的热点问题句。 ( 3 ) 由于光照、染色条件的变化,造成同一图像中各种目标间的颜色差异不显著, 非同类图像中同类目标颜色变化较大。 ( 4 ) 细胞的粘连与重叠问题未得到有效的解决;某些细胞胞浆中存在颗粒的干扰, 降低了胞浆的识别率。 ( 5 ) 目前细胞图像分割方法主要是针对某一类图像的分割,缺少通用性及对已有 方法的分割效果作定量分析。 由于血液细胞图像分割存在以上一些不足,并且图像分割是图像分析的第一步, 直接影响后面的结果,因此有必要寻找更适合于血液细胞图像的分割方法n 阳。 1 4 本课题研究的目的及意义 图像分割m ,是图像处理中的基本问题,也是一个学术难题,分割的好坏直接影响 到图像处理和识别咖;图像分割在图像工程中的位置如图3 所示。 操 作 对 像 符吁 日标 像索 图3 图像分割在图像工程中的位置 内蒙古农业大学硕士学位论文 9 f i g 3 s t a t i o no f i m a g es e g m e n t a t i o ni ni m a g ce n g i n e e r i n g 从图中可以看出图像分割是图像处理进行到图像分析的关键步骤。一方面,它是 目标表达的基础,对特征测量有着重要的影响。另一方面,图像分割将原始图像转换 成更有效的形式,使得更高层的图像分析和理解成为可能。 在研究细胞图像分割的过程中,已经产生了相当多的经典方法,如:阈值分割算 法:基于边缘检测的图像分割方法;统计学分割方法;结合区域与边界信息的分割法; 以及近几年发展起来的区域增长法、分裂合并法、等级分类法、松弛标号算法等眦嘲。 但是,迄今为止,将遗传算法用于血液细胞图像的分割这方面少有报道,因此这一方 面的工作,还有待于进行更深入的研究。 通常遗传算法不是直接处理问题空间的的参数,而是将各种实际问题转化为与问 题相关的串个体。对染色体串的遗传操作只与遗传算法的理论、技术有关,而与具体 实际问题无关,这一特性增大了遗传算法的适应性。当实际问题变化时,可只改变适 应度函数,而无需改变其它操作,增强了代码的通用性。 怎样利用遗传算法良好的全局搜索能力克服早熟,并且克服遗传算法自身收敛速 度较慢仍然是现今研究的重点。 本课题将遗传算法进行改进并用于血液细胞图像的分割,不仅为各类白细胞的识 别提高准确、快速方法,而且极大地提高血液形态检查的效率。 1 5 研究内容 根据选题的意义及目的确定研究的主要内容如下: 、( 1 ) 分析评价已有的血液细胞图像分割方法的有效性、准确度及适应性。 ( 2 ) 分析研究血液细胞图像的特点及白细胞自身的特征。 ( 3 ) 由于血液细胞涂片中存在不同种类的细胞,如何采用最有效的算法将白细胞 从复杂背景中提取出来是一个关键性问题。论文在消化、吸收前人提出的遗传算法用 于细胞图像分割中的方法的基础上,将基本遗传算法进行改进使其更适合血液细胞图 像的分割,力求确保细胞分割准确率较高的同时,研究运行速度快、占用内存少的分 割方法。 ( 4 ) 分析研究图像分割的评价方法,对改进遗传算法的分割结果作定量评价。 本研究通过对血液细胞涂片中自细胞进行数字图像处理,最终达到能从血液细胞 图像中准确、快速分割出白细胞的目的。 根据研究的内容及拟达到的目标,采用的研究方案是对现存遗传算法的认识与分 析的基础上展丌的,通过编程的方法对已有理论及算法进行验证,最终总结出一种适 1 0 基于遗传算法的血液细胞图像分割方法研究 合于血液细胞图像分割的改进遗传算法。 课题在w i n d o w sx p 操作系统下,用v i s u a lc + + 6 0 编程,在主界面模块调入一 幅血液细胞图像,可以对图像进行预处理、保存、血液细胞图像中白细胞的分割、分 割的评价。系统流程图如图4 。 r 开始、 读入图像 土 图像乘处理 t 图像分割 上 保存处理结果 图像分割评价 上 ( 结束) 图4 系统流程图 f i g 4 f l o wc h a r to fs y s t e m 1 6 小结 结合图像分割理论阐述了国内外细胞图像分割方法及应用现状,论述了基于阈值 分割法、基于边缘检测的分割技术、基于区域的分割方法、纹理分割算法、基于神经 网络分割算法、基于小波变换的分割算法、基于模糊理论的分割算法等。分析了现有 细胞图像分割存在的一些问题,在此基础上提出了本文研究的目的及内容。 内蒙古农业大学硕士学位论文 2 遗传算法的概述 2 1遗传算法基本概念 遗传算法( g a g e n e t i ca l g o r i t h m s ) 是模拟达尔文的遗传选择和自然淘汰的生物 进化过程的计算模型,f l q m i c h i g a n 大学的j h o l l a n d 教授t 1 9 7 5 年首先提出嗍。它将“适 者生存的进化理论引入串结构,并且在串之间进行有组织但又随机的信息交换。通 过遗传操作,使优良品质被不断保留、组合,从而不断产生出更佳的个体。子代个体 中包含父代个体的大量信息,并在总体上胜过父代个体,从而使种群向前进化发展, 即不断接近最优解。 由于遗传算法是自然遗传学和计算机科学相互结合渗透的产物,因此借用了许多 自然进化的基础术语。 群体:又称种群、染色体群,是个体的集合,代表问题的解空间子集。 群体规模:种群中个体的数目称为群体的大小或群体规模。 适应度函数:各个个体对环境的适应程度叫做适应度。对于优化问题,适应度函 数就是目标函数。遗传算法对适应度函数并不要求可导等条件,只要求适应度函数为 可加以比较的非负函数。 选择:根据染色体对应的适应度值的要求,筛选种群中的染色体,染色体的适应 度越高,保存下来的概率越大,反之则越小,甚至被淘汰。 交叉:指在一定条件下两条染色体上的一个或几个基因相互交换位置。 交叉概率:判断是否满足交叉条件的一个小于l 的阂值。 变异:指在一定条件下随机改变一条染色体上的一个或几个基冈值。 变异概率:判断是否满足变异条件的一个小于1 的阈值。 后代:染色体经过交换或变异后形成的新的个体。 2 2 遗传算法的基本原理 遗传算法作为一种智能搜索算法,采用五大要素控制算法的搜索方向。h o l l a n d 的模式定理作为描述遗传算法动力机理的基本定理,奠定了遗传算法的数学基础。 ( 1 ) 模式定理 定义1 :基于三值字符集 0 ,1 ,木) 所产生的能描述具有某些结构相似性的o 、l 字符串集的字符串称作模式。 12 基于遗传算法的血液细胞图像分割方法研究 例如:当染色体长度为4 时,模式o 幸l 事描述了在位置1 为“0 ”,位置3 为“1 ” 的所有字符串: 0 0 1 0 、 0 0 1 1 ) 、 0 1 1 0 ) 、 0 1 1 1 。 定义2 :模式h 中确定位置的个数称作该模式的模式阶,记为d ( 胃) 。 定义3 :模式中第一个确定位置和最后一个确定位置之间的距离称作该模式的定 义距,记作艿( 胃) 。 如模式0 1 1 1 阶数为4 ,定义距为4 ,模式l 宰的阶数为1 ,定义距为0 。显然阶 数越高,样本数越少,确定性越高。 模式定理:在遗传算子选择、交叉和变异的作用下,具有阶数低、长度短、平均 适应度高于群体平均适应度的模式在子代中将以指数级增长。 模式定理是遗传算法的理论基础。根据模式定理,那些低阶、短定义距、高平均 适应度的模式越来越多,最后得到这些模式的组合,性能得到改善,最终趋向全局的 最优解。 ( 2 ) 积木块假设 定义1 :阶数低、长度短和适应度高的模式称为积木块。 积木块假设:阶数低、长度短、适应度高的模式( 积木) 在遗传算子作用下,相互 结合,能生成阶数高、长度长、适应度高的模式,可最终生成全局最优解。 模式定理保证了较优的模式,即较优解的样本呈指数增长,从而满足了寻找最优 解的必要条件,即存在寻找到全局最优解的可能性。积木块假设则指出,遗传算法具 备寻找到全局最优解的能力。虽然积木块假设还未被理论证明,只是称为假设,但大 量的实践都支持这一假说,文献拈卜列等都从理论、实际应用领域表明其成功之处, 如平滑多峰问题,带干扰多峰问题,组合优化等问题。可见,大量的实践都证明了遗 传算法的适应性。 2 3 遗传算法的基本步骤 遗传算法的描述:算法开始于一个用染色体形式表达的初始解集,总是用i ; 一 代解集的解来生成后一代解集的解,整个过程有一个进化思想,那就是新的一代总是 要比旧的一代要好。因此在选择产生新一代个体的父体时总是参照他们的适应度的 值,适应度的值越大,再生的机会就越大。进化过程不断进行,直到满足终止条件, 比如进化的代数或者适应度值的改进趋势惮1 。 遗传算法的基本步骡: 标准遗传算法( s g a ) 的基本流程如图5 所示,算法主要步骤如下: ( 1 ) 随机产生初始种群,作为第一代。个体长度、种群规模、交叉概率、变异概 率为固定值; ( 2 ) 计算父代币| 一群的适应度: 内蒙古农业大学硕士学位论文 1 3 ( 3 ) 判断是否满足终止条件,是,则执行步骤( 4 ) ;否则,进行选择、交叉、变异 操作形成子代种群,并将子代种群作为下一次迭代的父代种群,转入执行步骤( 2 ) ; ( 4 ) 输出最佳个体j 退出。 从图中可以看出s g a 是一种群体型操作,该操作主要以群体中的所有个体为对 象。选择、交叉、变异是g a 的3 个主要操作算子,它们也就构成了所谓的遗传操作。 确定实际问髦的参数集 土 对参数进行编码 上 i。:。,。、i l 初始化种群3 膏 l 群警i 1 1 ) 位串解码得参数 群体p ( t ) i 2 ) 计算日标函数值 ,6 。1 评价- 种群 i l 3 ) 函数值向适应值映射 - 4 ) 适应值调整 i 念 y 啦 弋删? 三个基本遗传算了 、丫一, 1 ) 选择 圭竺i i l 痞束l l iii 2 ) 交叉 确定实际参数集i 。 3 ) 变异 ) 他高级算予 图5 标准遗传算法流程图 f i g 5 f l o wc h a r to fs t a n d a r dg e n e t i ca l g o r i t h m 2 4 遗传算法的构成 遗传算法的五个基本要素:编码、确定初始群体、适应度函数、遗传操作、控制 参数的设定。这五个要素构成了遗传算法的核心内容。 1 编码 在遗传算法中,编码方法是把问题的搜索空间中每个可能的点表示为确定长度的 特征串。编码方法的确定需要选择串长和字母表规模。在染色体串问题的搜索空问中 的点之间选择映射有时容易实现,有时又非常困难。选择一个便于遗传算法求解问题 的编码方法经常需要对问题有深入的了解。 编码是应用遗传算法时要解决的首要问题,也是设计遗传算法时的一个关键步 骤。编码是把一个问题的可行解从解空间转换到遗传算法所能处量的搜索空间的转换 方法。编码方法除了决定个体的染色体排列形式之外,它还决定了个体从搜索空问的 基因型交换到解空f b j 的表现型时的解码方法,编码方法也影响到交叉算予、变异算子 1 4 基于遗传算法的血液细胞图像分割方法研究 等遗传算子的方法。由此可见,编码方法在很大程度上决定了如何进行群体的遗传进 化运算以及进化运算的效率。一个好的编码方法,有可能使交叉运算、变异运算等遗 传操作可以简单地实现和执行;而一个差的编码方法却有可能会使交叉运算、变异运 算等遗传操作难以实现,也有可能会产生更多在可行解集合内无对应可行解的个体, 这些个体经解码处理后所表示的解称为无效解。 二进制编码方法是遗传算法中最常用的一种编码方法,它使用的编码符号集是由 二进制符号0 和1 所组成的二值符号集 0 ,1 ) ,它所构成的个体基因型是一个二进制 编码符号串。二进制编码符号串的长度与问题所要求的求解精度有关。 二进制编码不便于反映所求问题的结构特征,对于一些连续函数的优化问题,也 由于遗传算法的随机特性而使得其局部搜索能力较差。为改进这个特性,人们提出了 格雷码( g r a yc o d e ) 来对个体进行编码。格雷码是其连续的两个整数所对应的编码值 之间仅仅只有一个码位不相同,其余的码位都完全相同。 其它的一些编码方法:浮点数编码方法、符号编码方法、多参数级联编码方法、 多参数交叉编码方法等。 评估编码策略的3 个规范: 完备性:问题空间中的所有点( 候选解) 都能作为遗传空间中的点( 染色体) 表现。 健全性:遗传算法空间中的染色体能对应所有问题空问中的候选解。 非冗余性:染色体和候选解一一对应。 上述的3 个评估规范是独立于问题领域的普遍准则。因此,对于某个具体的应用 领域而言,应该客观地比较和评估该问题领域中所用的编码( 加上交叉) 的方法,从而 得到好的方法或策略。 2 确定初始群体 初始群体由多个染色体组成具有一定群体规模的染色体集合。遗传算法将基于这 个集合进行遗传操作,每一轮操作( 包括选择、交叉、变异) 后生存下来的染色体组成 新的种群,形成j 以繁衍f 一代的群体。确定初始群体的规模( 群体中包括个体的数 目) 须考虑两点:1 ) 初始群体的设定;2 ) 进化过程中各代的规模如何维持。 1 ) 初始群体的设定 遗传算法的初始群体中的个体是随机产生的,可采用下面的策略: ( 1 ) 根据问题固有知识,设法把最优解所占空间在整个问题空问中的分布范围,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论