(生物医学工程专业论文)基于神经网络方法的血液白细胞图像自动分类研究.pdf_第1页
(生物医学工程专业论文)基于神经网络方法的血液白细胞图像自动分类研究.pdf_第2页
(生物医学工程专业论文)基于神经网络方法的血液白细胞图像自动分类研究.pdf_第3页
(生物医学工程专业论文)基于神经网络方法的血液白细胞图像自动分类研究.pdf_第4页
(生物医学工程专业论文)基于神经网络方法的血液白细胞图像自动分类研究.pdf_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

东南大学硕士学位论文 a b s t r a c t t i t l e :n 时p h e r mw h i t eb l o o dc e l lc l u d l i c a t i o r , 黜船b r c hb a s e do nn e u r a ln e t w o r km e t h o d s g r a d u a t es t u d e n t :c a ot l o l l g a d v i s o r :b a ox u - d o n l g s c h o o l :s o u t l a e u ti j n l v e r s i t y i d e n t i f i c a t i o na n dc l a s s i f i c a t i o no fm a j o rw h i t eb l o o dc e l lt y p 髓n a m e dm o n o e y t c s ,l y m p i i o c y t e s , t l e u t r o p h i l s ,e 0 6 i n o p h i l s ,a n db a s o p h i l sa 砧i m p o r t a n tf o rc l i n i c a ld i a g n o s i s a u t o m a t i cb l o o d uc l a s s i f i c a t i o na n dr e c o g n i t i o nk 1 5 。do nm i e r 0 6 e o p i ei m a g e s 伽b ea s s i g n e dt o t h em o r p h o l o g i c a ld e t e c t i o nc a t e g o r y i ti so n eo ft h ec o m l m t e ri m a g e 讲o c 嘲i n gl i n dp a t t e r nr e c o g n i t i o n a p p l i c a t i o n si nc l i n i c a lm e d i c i n e t h e 伽e 白o q u 朋d yu t i l i z e dc l a s s i f i c a t i o nt h e o r yi i s t a t i s t i c sa n d a r t i f i c i a ln e u r a ln e t w o r k b l e m ln e t w o r k , e s p e c i a l l yf 1 1 z 科n e u r a ln e t w o r ki sp 1 即t e dt oc h 8 s i 母t h ew h i t e b l o o dc e l l s a na d c c l t l a t cc o l l e c t i o no fa i g i t a lc o l o rb l o o dc e l li m a g e 8i s 傩科舡y o nt h cb 柚i so ft l a cf o r a h r e s e a r c h ,c o m b i n e dw i t hm a m l a lt a e t h o d s c e l l s 触ts c g m e n t c df r o mt h eb a e l q 驴o u n d n i cn u c l e u s a n dp l a s m s1 1 1 eo x t r a e t c dr p 础v c l c o l o re l l a z a c t e r i s t i c s ,g e o m c t r i e n lc h a r a c t 醯t i e sa n dt c 】t t u r ec h a r a c t e r i s t i e s 岫p i e k o au pf i - o me v e r y s i n g l el e u k o c y t ei m a g e a n ds 加l e di nac e r t a i nf o r m a f t e r 1 1s e s m e n t a t i o n 1 c t t k o e y 峨f e a t a t r ea e x l m ta n ds e l e c t i o n , ab p 删删n m w o r kc l u s i f i e r i se o m t r u e t e dt od e t e r m i n e 恤w h i t eb l o o dc e l l s t y p 稍p e e i a u y , - c l u s i f i e a t i o nm 甜1 0 db a s e d 伽 $ u g e n o - m o d c lf u z z y i l 嘲n e t w o r ki sd 。 1 0 p e 正t h c3 - t y p c ie l a u i f i c a t i o aa n d5 - t y p c ic l a u i f i e n t i o n e x p e r i m e n tr e s u l t s 矗b o wt l u i tt h ef u r yi 圮u l l ln o t w o r ka l g o r i t h mi s 嬲e a c , c u l a t et b fw h i 协b l o o dc e l l c l a s s i f i e a t i o m f i l t l 盯n 眦,t t a cr c l a t i o m h i pb | 舸y 嘲f e a t u r e 印| i i 翻n 嘲lo rl e l t i o oi n dw h i t eb l o o dc e l l c l a s s i f i c a t i o ni sd i s e u 8 8 e 正p a n c i t d 鑫lc o m 硼咀l y 出回c a ) hu 耐t o 触l 由o 缸n 鹏a r r l y a f t e rt h e1 c a , e l a u i f i c a t i o , ahw l a e d a g 曩i n i r c y w o r d s :w h i t eb l o o dc e l lc l a u i t i e a t i o n ;c o l o ri m a t p ;n 4 m r a ln 嘲v o r k ;删:$ u l g e n o ;p e a ; m 东南大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我 一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。 研究生签名: 日期:冱k :6 1 东南大学学位论文使用授权声明 东南大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印 件和电子文档,可以采用影印、缩印或其他复制手段保存论文本人电子文档的内容和纸质 论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布( 包括 刊登) 论文的全部或部分内容论文的公布( 包括刊登) 授权东南大学研究生院办理 飘渺6 5 伊 第一章前言 1 1 研究背景和意义 第一章前言 血常规检验是临床医学检验最常用、最基本和最重要的手段之一,白细胞分类计数是其 中的一项重要内容。人体在某些生理情况下,或发生疾病时,常可导致血细胞发生数量或质 量的变化。血液中各类自细胞的数量和百分比是医生判断有无疾病,疾病的种类和严重程度 的重要基础数据。有着重要的意义。 早期的外周血白细胞分类记数是用人工方法将血液制成涂片,经染色后,在油镜下进行 分类计数,求得各类白细胞的比值当前医院中对白细胞的分类计数主要借助于自动血球计 数仪结合血涂片人工显微镜下检查。自动血球计数仪是利用溶血混悬液,在细胞的流动过程 中获取信息来进行白细胞分类的原理大致为激光型和电阻型u 。这种自动化血球计数仪的 临床应用减轻了临床检验人员的劳动量,促进了血液学实验室诊断和治疗监铡水平的提高。 但仍存在分类精度不够高的问题由于许多检验人员害怕手工镜检的巨大工作量而疏于结合 显微镜下检查。导致误报误诊的现象还屡屡出现检验学专家普遍呼吁不能轻视形态学的检 铡啪 细胞显徽图像自动识别系统则是以细胞显徽图像为基础应用图像分析和模式识别技术, 借助微机来实现细胞的分类和计数,属于形态学检测范畴细胞显徽图像具有可保存于计算 机系统,便于随时诊新回顾和教学,交流等优点,且利用计算机技术可以从图像中获得更为 丰富的信息,以便对自细胞进行更深入的研究又由于各类细胞显微图像自动分析技术上的 相似性,可以将这种白细胞自动识别系统的功能进行扩展。从而应用于骨髓细胞、病理切片、 豫沉渣、痰脱落细胞等各类图像分析若这种自动识别系统能真正用于临床并与自动血球计 数仪结合互补使用,将会带动临床检验学,尤其是细胞检验学的发展而近来血液自动涂片, 染色设备的陆续推出和使用口j ,使得在细胞显锨图像自动化获取方面的瓶颈得以消除如果 能进一步解决自细胞自动识别、分类算法的准确率和稳定性问题,基于形态学的自细胞自动 识别系统将能真正应用于i 瞄床 1 2 国内外研究现状 血涂片自动图像分析系统的研制活跃于上世纪六、七十年代六十年代末。第一个血涂 片自动分析系统。c i k j s c a n g i o p r ”系统诞生七十年代。又有s m r i i k i n e 公司的 h e m a t r a k ,a b b o t r 实验室a d c - - 5 0 0 ,日本c y b 蛹产品闯世这类分析仅运用光密 度直方图体视学分析边界和轮廓跟踪,形状分析纹理分析和空问频率分析簪方面的技 来。实现自细胞分类自动化但因为备方面技术不够成熟,识别的稳定性不高,运行速度慢 价格昂贵所以未能在冁床普及以后绝大部分厂家把精力投入到了流动式的自动血细胞分 析仪的研制和开发上,并在i i 缶床得到广泛应用 流动式的自动血细胞分析仪的历史起始于二十世纪五十年代初,w a l l a c e c o u l t e r 提出了利 用通过小孔的颗粒引起电路中电阻变化的原理,实现血细胞计数自动化的设想,制造出第一 台血细胞分析仪并应用于临床,血细胞自动化分析得到了飞速发展最初的血细胞计数仪 ( c c u c o u n t e r ) 仅能计数红细胞和自细胞后来增加了测量参数,发展成为血细胞分析仪 ( h e m a t o l o g ya n a l y z e r ) 8 0 年代,开发了白细胞分类各种血细胞分析仪进行白细胞分类的方 东南大学硕士学位论文 法包括,容量、电导、光散射法( v c s 法) 、阻抗与射频技术联合法,激光与细胞化学技术等。 血细胞分析仪不断改进,对白细胞分类来说,从单分类到三分类、五分类甚至九分类血细 胞的测定和分析方法已经不仅仅局限于某一单一的方法,已发展到利用多种物理化学方法处 理白细胞,用先进的电脑技术区分、辨别经上述方法处理后的各细胞问的细微差别,综合分 析实验数据,得出较为准确的白细胞分群结果。联合检测法代表了血细胞分析仪的最新发展 趋势如库尔特公司的s t k s 和g e n s 采用电阻抗、激光及电磁波技术。拜尔公司的a 】) v i a 系 列采用化学反应与激光技术结合原理进行白细胞五分类测定,雅培公司的a d 3 5 0 0 用电阻抗与 光散射结合技术,希森美康公司的 2 l o q ,s b 9 5 0 0 用硫化氨基酸和特殊溶血剂及电阻抗与射 频技术检测幼稚细胞等,这些仪器的问世大大提高了自动化仪器进行白细胞分类的准确性, 使仪器的发展进入了新阶段【1 4 1 尽管如此,这类仪器在鉴别血细胞的形态和结构等方面还不 够完善,目前仅可作为全血细胞分析的一种过筛手段1 5 , - 8 1 。 本实验室1 9 9 2 届硕士杨晓敏曾研究过一套基于灰度图像处理的白细胞自动分类系统。但 由于当时软硬件条件的限制,该系统的所有图像处理算法都基于灰度图像处理技术,而对于 细胞图像的彩色信息和特征,则未加以考虑,这给系统细胞识别的成功率带来一定的影响, 最终未能应用于临床。1 9 9 8 届硕士程杰、2 0 0 1 届硕士高永进先后针对彩色白细胞图像的图像 处理和分割算法傲了大量工作,但对于自细胞的自动分类方法未进行深入探讨。 对白细胞的自动形态学分类,一般是在细胞显微图像分割、白细胞特征提取、白细胞特 征选择后,用一定的分类算法( 分类器) 将白细胞分成具有临床意义的若干类。常见的分类 算法有统计学方法和神经网络方法1 9 1 ,神经网络方法中又有b p 网络、自组织特征映射网络 ( s o l d ) 、径向基函数网络( r b f ) 方法等“”l ,但到目前为止在分类的准确率和稳定性方 面都还不甚理想。 1 3 课题主要目标及工作 本课题的主要工作在于设计外周血白细胞自动分类器。课题将模糊神经网络理论应用于 白细胞分类,设计了基于s u g e n o 模糊模型的模糊神经网络分类器。并将模糊神经网络分类器 与常规神经网络分类器对于白细胞分类的效果进行了对比课题还包括了以下几个方面的工 作: ( 1 ) 彩色细胞图像的数字化采集和监视,生成外周血白细胞库 ( 2 ) 在前人工作的基础上,有效提取单个白细胞图像的可供识别的特征 ( 3 )对比模糊神经网络分类器与常规神经网络分类器的不同表现 ( 4 ) 探讨特征的提取、选择和处理对白细胞分类的影响 课题研究遵循以下漉程。 图1 1 设计循环流程 2 第一章前言 本课题在提出的算法的基础上,设计了一个细胞显微图像的自动识别分类系统,并对文 中提出的算法进行了一定的验证对特征的提取、选择和处理对分类的影响进行了一些探讨 本系统运行的硬件平台采用目前较为主流的微型计算机,软件平台则采用微软公司的 w m d o w s 操作系统。软件的开发环境在特征提取部分选择为v m u a lc + + 6 0 ,分类算法部分选 择为m a t l a b6 5 1 4 论文的组织 第一章前言介绍课题研究的背景及意义,并给出论文的框架 第二章血细胞图像的获取介绍血细胞样本制备过程白细胞分类计数的临床意义,各类白 细胞显微镜下形态特征及数字化显微图像的获取。 第三章白细胞图像特征提取和选择介绍提取细胞图像特征前的准备工作及白细胞图像特 征的提取和选择。 第四章分类器设计介绍分类器概念;介绍神经网络的基本知识和用b p 神经网络进行白细 胞分类;介绍模糊逻辑系统、模糊神经网络的基本知识和用基于s u g e n o 模型的模糊 神经网络进行白细胞分类。 第五章特征选择对分类结果影响的探讨对白细胞特征的提取和选择与分类之间的关系进 行了一些探讨;介绍运用主成分分析方法对特征空间矢量进行分析后再进行的白细胞 分类研究。 第六章总结与晨蔓总结自己的工作并提出需要改进和继续努力的地方 3 东南大学萌士学位论文 2 1 样本制备 第二章血细胞图像的获取 样本在江苏省人民医院实地采集。外周血涂片制作依然采取医院常规制作方法,用w r i g h t 染色 血涂片的制备; 取末捎血一滴置于玻片的一端,左手持载玻片。右手用边缘平滑推片的一端从血滴前方后移接 触血滴,血滴即沿推片散开。然后使推片与载玻片夹角保持3 0 - 4 5 度平稳地向前移动,载玻片上保 留下一薄层血膜血涂片制成后可手持玻片在空气中挥动,使血膜迅速干燥,以免血细胞皱缩血 膜干燥后可用铅笔在载玻片上书写病人姓名或编号一张良好的血片,要求厚薄适宜,头体尾分明, 分布均匀,边缘整齐,两侧留有空隙。血片制好后最好立即固定染色,以免细胞溶解和发生退行性 变 瑞氏染色法原理: 珊氏染料是由酸性染料伊红和碱性染料美蓝组成的复合染辩 美蓝( 又名亚甲蓝m e h y l e n eb l u e ) 为四甲基硫堇染料,美蓝容易氧化为一。二三甲基硫堇等次级染 料( 即天青) 市售美蓝中部份已被氧化为天青。伊红( 又名曙红s i n ) 通常为钠盐即伊红化钠。荚蓝和 伊红水溶液混合后产生一种伊红化美蓝中性沉淀,即琦氏染料瑁氏染料涪于甲醇后又重新解高 为带正电的美蓝和带负电的伊红离子 细胞的染色既有物理的吸附作用又有化学的亲和作用各种细胞和细胞的各种成份化学性质不 同,对各种染色科的亲和力也不一样。因此用染色液染色后,在同一血片上可以看到各种不同的色 彩t 例如血红蛋白嗜酸性颗粒为碱性蛋白质与酸性染辩伊红结合,染粉红色称为酸性物质;细胞核 蛋白和淋巴细胞浆为酸性,与碱性染料美蓝或天青结合,染蓝色或紫色称为嗜碱性物质:中性颗粒 成等电状态与伊红和美蓝均可结合,染紫红色称中性物质 p h 对细胞染色的影响: 细胞各种成份均为蛋白质构成,由于蛋白质系两性电解质所带电荷随溶液p h 而定,在偏酸 性环境中正电荷增多易与伊红结合染色偏红;在偏碱性环境中负电荷增多,易与美蓝或天青结合, 染色偏蓝,因此细胞染色对氢离子浓度十分敏感在染色过程中玻片必须化学清洁。配制瑞氏染液必 须用优质甲醇稀释染液必须用缓冲液,冲洗用水应近中性,否则各种细胞染色反应异常致使细 胞的识别困难甚至造成错误 染色步骤: 1 用蜡笔在血膜两侧划线,以防染液溢出,然后将血膜平放在染色架上 2 加瑚氏染液2 - 5 漓便覆盖整个血胰周定0 5 - 1 0 分钟 3 漕加等量或稍多的缓冲液与染料混匀染色5 - 1 0 分钟 4 用清水冲去染液,待自然于燥后藏用吸水纸吸于即可镜检 2 2 自细胞在光镜下的形态特征及分类计数的临床意义1 6 1 2 上l 自细胞形杏特征 常规w r i g h t 染色法制造的血涂片标本在油镜下观察,视野中遍布红细胞,其星红色。中心浅 染。白细胞散在可见。此外。尚可见呈淡蓝色不规则的血小板 第二章血细胞图像的获取 根据白细胞胞浆内有无特殊颗粒。可将它分为两大类:一类胞浆内含特殊颗粒,称粒细胞又 因所含特殊颗粒对染料着色的性质不同。分为中性粒细胞,嗜酸粒细胞和嗜碱粒细胞。另一类胞浆 中不含特殊颗粒,称无粒细胞,又按其形态和功能分为单核细胞和淋巴细胞。五类白细胞在光镜下 形态特征示于表2 i 。 粒细胞 单核淋巴 中性嗜酸 嗜碱 大小( u m ) l m l 2l o _ 1 51 0 - i i1 2 1 85 8 1 5 2 0 胞浆染色粉红淡蓝污秽的淡蓝淡灰蓝色淡蓝色 核染色 深紫红色紫红色淡紫红 紫红色深紫红色 分叶( 2 - 5 ,3 叶 分叶多呈肾圆。核浆 核形常见) ,或杆 分2 叶 或s 形形,偏位比大 状 淡紫红 桔红深紫蓝紫红 颗粒无 细小粗大大小不等细小 表2 i 白细胞在光镜f 形态特征 图2 1 示各类白细胞在光镜下的典型形态 图2 1 各类白细胞在光镜f 典型形态 2 2 2 白细胞分类计数的临床意义 人体在某些生理情况下,或发生疾病时,常可导致血细胞发生数量或质量的变化。血液中各类 白细胞的数量和百分比增多或减少常常可以帮助医生判断有无疾病疾病的种类和严重程度 增多; 1 中性粒细胞:急性化脓感染,粒细胞白血病,急性出血,溶血。手术后,尿毒症,酸中毒,急性 5 东南大学硕士学位论文 汞、铅中毒等。 2 嗜酸性粒细胞:变态反应,寄生虫病,某些皮肤病,某些血液病,手术后,烧伤等。 3 脂碱性粒细胞:慢性粒细胞性白血病,何杰金氏病,癌转移。铅、铋中毒等 4 淋巴细胞:百日咳,传染性单核细胞增多症,慢性淋巴细胞性白血病,麻疹,腮腺炎,结核,传 染性肝炎等。 5 单核细胞:结核,伤寒,亚急性感染性心内膜炎,疟疾,黑热病,单核细胞性白血病,急性传染 病恢复期等。 减少: 1 中性粒细胞:伤寒,付伤寒,疟疾,流感,化学药物中毒,x 线镭照射,抗癌药物,化疗。极度 严重感染,再障,粒细胞缺乏症等 2 酸性粒细胞:伤寒、付伤寒及应用肾上腺皮质激素后等。 3 淋巴细胞:多见于传染急性期,放射病,细胞免疫缺陷等 2 3 数字化细胞显微图像的获取 血涂片样本制作完成后,在三目显微镜下,用1 0 0 倍油镜放大,再经数字彩色摄像头摄取图像, 并存储到微机系统中。采集到的数字图像为2 4 位真彩色图像,大小为6 4 0 x 4 8 0 。数字化采集过程 中要尽量保持显微镜和摄像头的参数一致性,避免给细胞的识别造成困难。本研究过程中共采集4 0 0 余幅数字化血细胞图像,含白细胞约6 0 0 余个 图2 2 血细胞显微图像示例 6 第三章白细胞图像特征提取和选择 第三章白细胞图像特征提取和选择 主要介绍三方面内容:一是图像的基本知识:二是提取细胞图像特征前的准备工作;三是白细 胞图像特征的提取和选择。 3 1 图像的基本知识 本文中,对于白细胞的自动识别分类是基于彩色的细胞图像,彩色图像有不同于灰度图像的一 些重要的特征,在研究白细胞的自动识别分类前,有必要先了解这方面的知识 灰度图像也称单色图像( m o n o c h r o m ei m a g e ) ,通常每个象豪由从0 ( 黑色) 到2 5 5 ( 白色) 的亮度 值来表现,其中间的值来表现不同程度的灰度级 彩色空间有多种不同的表示形式,常用的有红、绿,蓝( r g b ) 三基色模型,色调、饱和度、 亮度( h s i ) 模型,( p a l 制式) 模型,y i q ( 1 c i s c 制式) 模型,a 岫瓜模型等等不同的 彩色模型之阃一般可以进行相互转换。 r g b 彩色模型可以由一个彩色立方体来表示,每个坐标轴量化为0 2 5 5 。每种颜色根据彩色 加色原理,由r ( r e d ) 、g ( g r e e n ) 、b ( b l 嘲三种基本色混合而成 r g b 变换为h s i 坐标i f :r + o + b 日= 击如一一( f ,万) + 甜8 0 , g ( 曰】舯f = 等兰产。m s :t m i n ( r , o , b ) c m y 坐标可以从r g b 模型中得到。 f c = l r j 肘;l g 【y 眷l 一曰 ( 3 2 ) 啪0篓596萋28774黜032202 1 1 - 0 5 2 203 1 1 i ,i = 1 一0 一i gi ( 3 3 ) l q ii 上口j r g b 与y u v ( y c b c r ) l 7 东南大学硕士学位论文 l , u y 0 2 9 9 0 5 8 7 = l o 1 6 7 8 一o 3 3 1 3 【0 5 0 4 1 8 7 3 2 自细胞图像特征提取前的准备工作 ( 3 4 ) 对血细胞显微图像中的白细胞进行特征提取和识别分类前,先要对彩色细胞图像进行分割。提 取出单个白细胞。 图像分割1 就是指把图像分成各具特性的区域并提取出感兴趣目标的技术和过程,这里的特性 可以是灰度、颜色、纹理等 图像分割可采用三种不同的原理来实现在利用区域的方法时,把各像素划归到各个物体或区 域中;在边界方法中,只需确定存在于区域间的边界;在边缘方法中,则先确定边缘像素并把它们 连接在一起以构成所需的边界。这三种方法使要解决的问题更加具体n 9 1 对图像分割算法的研究已有几十年的历史,借助各种理论至今已提出了上千种各种类型的分割 算法i 嘲,而且这方面的研究仍在积极进行现已提出的图像分割方法包括:基于梯度的方法、阙 值化方法、边缘检铡方法,区域增长法、数学形态学方法、统汁模式识别理论、人工神经网络技术、 信息论理论和小波变换技术等尽管人们在图像分割方面做了许多研究工作,由于尚无通用的分割 理论,因此现已提出的分割算法大都是针对具体问题的,并没有一种适合于所有图像的通用的分割 算法1 2 “ 白细胞图像的分割就是将血液图像中的白细胞检出,并在除去图像中各种噪声千扰的基础上, 将单个白细胞图像划分成背景、细胞浆、细胞核三个区域。图像分割质量将直接影响到特征参数抽 取的准确性和后续的分类识别工作 鉴于本课题的重点在于白细胞的分类研究,故图像分割是运用本实验室的研究成果z $ l t , 1 8 j 结合 手工方法进行从每幅图像中分割出单独的白细胞图像,并将白细胞进行细胞核和细胞浆的分割。 然后对每一个白细胞分别提取其特征对于细胞及细胞核,我们要提取出边缘轮廓用以计算细胞或 细胞核的周长和圆形度,它也是求取纹理特征的信息潭 3 3 白细胞图像特征的提取和选择 3 & 1 白细囊圈像特征的提取 特征的提取和选择强烈地影响到分类器的设计及其性能假使对不同类别,这些特征的差别很 大,那就比较容易设计出具有较好性能的分类器因此特征提取是细胞识别的一个关键问题 通过对对象进行测量,可以得到对象的一种描述,即用测量空间中的一个点来代表这个对霉” 我们通过摄像头把血涂片转换为显微图像就是这种情况显然在大多数情况下,不能直接在测量空 阃中进行分类器设计这是因为测量空间的维数很高( 一个2 5 6 2 5 6 阵列图像相当于2 5 6 2 5 6 维 测量空间中的一个点) ,包含大量冗余信息,且图像随摄像头的位置、照度等因素的变化而变化,并 不能直接反映对象的本质。因此为了进行分类器设计,需要把样本显微图像通过映射( 或变换) 的 s 尺g 口 t。上 尝一 第三章白细胞图像特征提取和选择 方法用低维空间来表示,这个过程叫特征提取。而从一组特征中挑选出一些最有效的特征以达到降 低特征空间维数的目的,这个过程叫特征选择。 考虑到维数增高对计算量的影响,针对血细胞显微图像的特点,结合前人的经验“5 n 蜘1 ,本 文共提取了包括彩色特征、几何特征和纹理特征在内的2 8 个特征。分述如下: 3 3 1 i 几何特征 ( 1 ) 细胞核面积 ,t = 细胞核内象素总数目 ( 3 5 ) ( 2 ) 细胞核周长 - j 2 = f ( n 1 ) ; ( 3 6 ) 1 = i = 渊戮。 其中m 是细胞核边界象素点的数目;m 是对细胞核轮廓进行f r e c m a n 跟踪时第i 个点到其下 一点的f r e e m a n 链码子 ( 3 ) 细胞核圆形度 j 3 = j ;i ( 4 7 r x j l ) ( 3 7 ) ( 4 ) 细胞体面积 j 4 = 细胞内象素总数耳; ( 3 8 ) ( 5 ) 细胞核细胞体面积比 , 5 = ,i 1 4 ( 3 9 ) ( 6 ) 细胞图像几何矩 矩的计算适于二值图象和灰度图象对二值图象。矩严格量化分割区域;对灰度图象,除形状 外,矩还包括灰度分布信息。 一个大小为m x n 的图像月i 力,它的二维p + q 阶矩定义为: 一i 一l m p _ = f 9 ,4 ,( f ,mp q = o , 1 2 j 玑 ( 3 1 0 ) i 舢 中心矩: - i - i p ,。;“一习( j y - ) 。,“。j ) ( 3 i i ) i - 0 其中,重心坐标t 一 f i o 一 f o i 肛露2 瓦 我们对细胞体的灰度图像提取二阶中心矩fi i 3 3 1 2 彩色特征 ( 1 ) 平均色度 9 东南大学硕士学位论文 c l = 专嵋 ( 3 j 1 2 ) 1 e 月 其中。 j z 为细胞核区域,n c , 为细胞核内某个点的彩色,v 为区域内点的数目。 r g b 空间的向量加法定义为:设两个向量( n ,g ,幻) 和( 您,譬2 ,b 2 ) ,相加结果为( 如,勘, b j ) ,则有: l 弓= + 吒 g ,2 9 i + 9 2 ( 3 1 3 ) 【岛= 岛+ 6 2 色度方差岛: c 2 - - 0 2 = n - 一1 k y , v z ( c l 一肋2 ; ( 3 1 4 ) 其中g 、 l z 、的定义同上 色度变化a t c ,= 厄奴 ( 3 1 5 ) 细胞浆,细胞核色度比 q = 专铲 瓴 c g p ) 和g f m 分别为细胞浆和细胞核的乎均色度。 ( 5 )细胞浆,细胞核色度差 c j = i c l ( p ) 一c i ( h ( 3 1 7 ) ( 6 ) 红蓝色度比巳; g = 器 瓴m 其中c g x ) 和c j 但肪别为c j 的红色分量和蓝色分量 3 3 1 j 绞理特鬣 纹理的精确定义迄今仍没有一个统一的认识。但它直观地提供了图像的平滑度,租糙度及规律 性等的量度在图像处理中用于描述区域纹理特征的三种基本方法是统计方法结构方法和谱方法 1 1 4 1 统计方法中常用的有直方图统计矩。共生矩阵笱蚓 ( 1 )二阶中心矩 如果一个图象区域有j r 个灰度等级。灰度均值是_ ,直方图 k - - - - o , l , ,尽一。该直方图 均值的n 阶矩定义为: i f i _ 2 亩荟( 七一脚 ( 的 ( 3 j ” 二阶中心矩n 电。又称方差,是较常用的纹理测度 第三章白细胞图像特征提取和选择 ( 2 ) 灰度共生矩阵 灰度共生矩阵又称灰度共现矩阵。假定我们在一副图像中规定了一个方向口( 水平的,垂直的 等等) 和一个距离d ( 一个像素,两个像素等等) ,灰度共生矩阵的第) 个元素 似i 叠印描述灰 度级i 和j 在图像内沿口方向相距d 个象素距离的两个像素上同时出现的概率( 频数) 。 一旦形成了共生矩阵,就可由此计算纹理特征。许多基于共生矩阵的特征已被定义并验证过 我们利用以下六个特征量表示纹理特征: ( 1 ) 能量t e l = a s m = 【而,- ,d ,卯 ( 3 2 0 ) 细胞图像的灰度分布较均匀时能量较大,反之则较小。 ( 2 ) 惯量t e 2 = c o n = h ( i ,j ,d ,8 ) ( f d 2 ( 3 2 1 ) 对于粗纹理,元素较集中于矩阵的对角线附近,因此r f 卅的值较小相应的惯量也较小; 相反,对于细纹理,则具有较大的惯量。 ( 3 ) 熵磁= e n t = 一石( f ,- ,d ,0 ) l o g h ( i ,d ,d ) ( 3 2 2 ) 当矩阵中的数值均相等时,熵最大;反之,数值之间的差别很大时,熵较小。 均匀度c 逆差矩,r e , = d m = 军莩箸等等暑 c , 僦t e $ - - c o r = 军季盟警业 2 4 式中以= f 她工d ,口 肛,= _ ,砸,工d ,9 ) d ,2 = “一p ,) 2 h ( i ,j ,d ,日 口,2 = ( j 一p ,) 2 石( f ,_ ,d ,9 l ( 6 ) 极大概率t = m p ; 舻 ( j d ,口) 3 ” 实际计算中我 f i l l 以4 5 5 9 0 。, 1 3 5 。四个方向共生矩阵,即m ( 1 d ) ,柳n ,m ( 1 。j j ,m ( 1 ,- - i ) , 然后分别计算四个共生矩阵的上述6 个纹理参数我们认为,细胞图像分析不需考虑纹理方向。所 以最后取各参数的均值即,“w ,衄m 一肌,肌m ,p c 豫,胁p 作为纹理特征向量中的各个分量对 于细胞图像。在实际计算中要注意距离d 的选取 拍2 白细魏圈像特征的选择 大的特征向量集合有很多的不便。量明显的就是计算方面会有很大负担所以在模式识别问 题中通常的任务就是进行特征的选择在最初的模式识别工程中。这种选择有两个目标t 或者丢 弃一些对分类贡献不大的特征;或者达到一定程度降维的目的i 捌 来自同一类别的不同样本的特征值应该非常接近,而来自不同类别的样本的特征值应该有很大 的差异最有。鉴别”( d i s t i n g u i s h i n g ) 能力的特征对与类别信息不相关的变换应具有不变性 ( i n v a t i a n t ) 根据特征选择的一般性原则和临床进行白细胞分类的经验知识,本文主要选择了以下7 个量作 为识别特征进入分类器:细胞核的周长,细胞核的圆度、细胞核,细胞的面积比、细胞浆,细胞核红色 东南大学硕士学位论文 色度比、细胞浆,细胞核红色色度差、细胞体的面积、及细胞纹理特征舅值。之后还讨论了特征提 取和选择对分类结果的影响、用主成份分析方法进行特征选择对分类结果的影响等我们会在相关 章节进行具体描述 1 2 第四章分类器设计 第四章分类器设计 分类器设计是课题的重点本章主要介绍三个方面的内容,一是分类器概念;二是神经网络的 基本知识和用b p 神经网络进行白细胞分类;三是模糊逻辑系统、模糊神经网络的基本知识和用基 于s u g e n o 模型的模糊神经两络进行自细胞分类。 4 1 分类器概念 分类器的作用是把模式空间肘划分为c 个互不相交的子空问。每个子空间为一类,记为类j 俨j , 类2 r 岛工二类c f p 小在每一类里的模式都是以某种等价关系而等价,分类器则表述了这种等价关 系。 分类器设计也就是构造一个分类函数或分类模型,该函数或模型能够把数据库中的数据记录映 射到给定类别中的某一个这里的分类指的是有训练样本,且训练样本类别已知的情况下的监督分 类,在没有训练样本的情况下的分类则为无监督分类 常用的分类算法有统计学方法和神经网络方法其中统计学方法以贝叶斯决策理论为基础,依 据它设计的分类器理论上讲具有最优的性能但是统计学方法除了要求类别数目已知外。还要以先 验概率及类条件概率密度已知为前提,而问题的困难在于这些条件通常是不满足的 神经网络方法是从要解决的问题和训练样本出发,具有以下优点网: ( 1 ) 具有较强的容错性。能够识别带有噪声或变形的输入模式i ( 2 ) 具有很强的自适应学习能力; ( 3 ) 并行分布式信息存储与处理,识别速度快; ( 4 ) 能把识别处理和若干预处理融为一体进行 4 2 人工神经网络分类器 4 2 1 人工神经网络基础拍脚】 人工神经网络( a r t i f i c i a ln e u r a ll q e t w o f h a n n 简称神经网络) ,是借鉴人脑的结构和特点, 通过大量简单处理单元( 神经元或节点) 互连组成的大规模并行分布式信息处理和非线性动力学系 统它具有巨量并行性、结构可变性,高度非线性,真学习性和自组织性等特点鲫 人工神经网络的最基本的组成单位是人工神经元个简化的人工神经元结构如图4 1 东南大学硕士学位论文 而一l 图4 1 人工神经元 该人工神经元( 以下简称为神经元) 是一个多输入单输出的非线性系统,其输入输出关系可以 描述为 2 吝_ q ( 4 1 ) ) ,;= f ( 1 。) j 式中_ 是从其他细胞传来的输入信号;e 是阈值:m 0 表示从细胞_ ,到细胞珀q 连接权;f ( 。) 为 传递函数。常用的传递函数有阶跃函数、$ i g m o i d 函数、双曲正切函数等 ( i ) 阶跃函数 如图4 2 ( a ) 所示 y 讥) = 加) ;百1 歹 傩4 ) ( 4 ) 正切s 形函数 如图4 2 ( d ) 所示 川= 扣吒甜 ! 垲= 争口 = 声百广一。 - 1l ( 4 5 ) 圈4 2 神经元状态转移函数 目前的神经网络模型不下十种,根据连接方式的不同,神经网络的神经元之间的连接有如下几 种形式m i :前向神经网络;有反馈的前向网络;层内有相互结合的前向网络和相互结合型网络( 包括 1 4 二 一牒一 滁 第四章分类器设计 全互连和部分互连类型) 。常见的前向神经网络有b p 神经网络和r b f 径向基神经网络,常见的反馈 神经网络是h o p f i e l d 网络,b o l t z m a n n 机则是属于相互结合型网络。 应用神经网络进行分类及模式识别,实质上是利用神经网络在时空数据统计描述的自组织以及 一些相互关联的活动中,自动获取知识功能的非线性映射和聚类特性,它将输入数据通过神经网络 的非线性结构映射到输出空间。它能从提供的数据中挖掘数据之间的内在联系,寻找系统的内在规 律,利用优化计算方法,进行自组织分类或按某种导师要求分类,分类是模式识别的基础,一旦分 类完成了,机器就可以根据分类进行自动识别了圈 一般利用神经网络进行有导师学习的分类及模式识别要考虑以下闯题: ( 1 ) 对数据进行预处理。预处理包括以下步骤:数据取样。数据输人空问的划分对于不 同的分类和识别要求。数据输人空间的划分要求也不样。数据输人空间的划分大小直接决定者数 据特征提取的计算工作量。数据特征提取的计算。一般网络处理的数据不是原始数据,而是特征 数据,它将n 维原始数据空间转换为m 维特征数据空间,由于计算得到的数据特征值很分散。必须 对特征值进行归化处理 ( 2 ) 建立训练数据集和测试数据集:对于有导师学习,首先定义一组输人要求的模式;网络输 入空间取决于m 维特征数据空间。网络输出空间取决于要求的分类或识别的模式数目这种模式也 叫导师每一个输入对应有输出要求的模式,当然可以不同的输入矢量对应相同的结果模式这样 构成的训练输入、输出敷据对应,满足分类数据的随机性、遍历性,充分性然后随机选取一部分 作为训练集数据,一部分作为测试集数据 ( 3 ) 选择一个神经网络,建立网络实际输出与要求的输出之问的误差函数e ( 或者将数据优化 问题的约束磊件及目标函数表达威标准的二次( 或高次) 的能量函数i 功。根据网络的误差函数e 表达 确定网络的学习算法。按照学习算法求网络的连接权与偏置( 一般通过计算机编程计算) ( 4 ) 用训练集对网络进行训练多层前向网络通过有导师的误差反向传输学习算法,针对箍个 训练集的每一个输人和对应的输出要求,每学习一条规则,瓤对隐含层和输出层的神经元进行一次 连接权的调整,这样一轮又一轮不断自动地调整网络神经元的连接权,通过反复修改连接权,直到 整个网络达到所有的要求的响应为止 ( 5 ) 利用测试集的数据进行测试随机选取测试集的特征矢量数据作为输人信息矢量测量网 络的输出结果该结果也就是网络的分类和识别结果在模式识别阶段,对测试数据加人噪声后, 同样进行数据的预处理,然后将选取加入唆声后的数据的特征矢量作为输入信息矢量,测量同络的 输出结果该结果也就是罔络的分类和识别能力,以及容错能力的考察 4 2 2 b p 神经同络 4 工z lb p 神经罔络基础堋 1 9 8 6 年r u m e l h a r t ,h i n u m 和w i l l i a m s 完整而简明地提出一种a n n 的误差反向传播训练算法( 简 称b p 算法) ,系统地解决了多层网络中隐含单元连接权的学习问题还对其能力和潜力进行了探讨 b p 网络( b a d 印f o p a g 嘶n n ) 是在导师指导下,适合于多层神经网络时种学习,它是建立在梯度 东南大学硕士学位论文 下降法的基础上的 目前,在人工神经网络的实际应用中,绝大部分的神经网络模型是采用b p 网络和它的变化形 式- 它也是前向网络的核心部分。并体现了人工神经网络最精华的部分。其结构如图4 3 所示 蠢鲁层 信 号 图4 3 b p 神经网络的结构 精量出 向量专席信号) 网络除输入输出节点外,还有一层或多层的隐节点,同层节点中没有任何耦合输入信号从输 入层节点依次传过各隐层节点,然后传到输出节点网络的学习过程由正向和反向传播两部分组成 在正向传播过程中,每一层神经元的状态只影响到下一层神经元网络如果输出层不能得到期望输 出,就是实际输出值与期望输出值之间有误差,那么转入反向传播过程,将误差信号沿原来的连接 通路返回通过修改各层神经元的权值,逐次地向输入层传播去进行计算,再经过正向传播过程, 这两个过程的反复运用,使得误差信号最小实际上误差达到人们所希望的要求时,冈络的学习 过程就结柬。 4 2 2 2b p 神经同络的教学描述 设含有共l 层和n 个节点的一个任意网络,每层单元只接受前一层的输出信息并输出给下一层 备单元简单起见。认为网络只有一个输出) ,设给定个样本( 强) ( b j ,2 柳,任一节点l 的输出为仍,对某一个输入为如网络输出y i ,节点f 的输出为a b 研究第z 层的第j 个单元,当 输入第k 个样本时,节点,的输入为l 肥r k = 叼甜 ( 4 6 ) o ;f 如f kj ( 4 7 ) d 盖衰示f 层输入第k 个样本时,第j 个单元节点的输出 误差函数使用二乘误差函数: 瓦= 三军( ) ,辟一致) 2 甄是单元j 的实际输出总误差为; 1 6 第四章分类器设计 e = 西l 荟n 最 定义: 耻蔫 于是: i 当j 为输出单元时:d 盖;箩业 ( 4 9 ) ( 4 1 0 ) ( 4 儿) 耻嚣= 薏爵锄啪似刁 2 若j 不是输出单元时,有: 耻嚣鸯鲁案,c 蚴 , 式中d 二i 是送到下一层“+ j ) 的输入,计算鲁要从“+ d 层算回来 在( “d 层第m 个单元时: 鲁。o e k 警= z 墨i + 1 吖蔻蹬咐( 4 1 4 ) a d -嘲ia d k拿妇i _ 。_ 拿。_ ”叫 由式( 4 1 3 ) 和式( 4 1 4 ) 可以得到, 歌= 踞吲f ( n e t l j k ) ( 4 t s ) 因而对权值的修正为: 啡玛罐鲁州叫姜 现在,反向传播

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论