基于信息熵的CT图像目标自动提取实验研究以恐龙蛋壳化石切片CT图像为例_第1页
基于信息熵的CT图像目标自动提取实验研究以恐龙蛋壳化石切片CT图像为例_第2页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于信息熵的CT图像目标自动提取实验研究以恐龙蛋壳化石切片CT图像为例CT(Computed Tomography)技术应用范围十分广泛,主要应用于医学诊断领域,其次应用于工业无损检测、工程检测、安全检查以及探测地球内部结构等方面1。近年来,随着图像技术的发展以及各种功能软件的开发,其应用范围还在不断拓宽。传统的图像分割方法依赖于人工处理,需要花费大量时间和精力。由于图像的多变性和各种突发情况的发生(设备、人工、环境等),从图像中自动分离目标与背景非常具有挑战性,因此这一难题引起国内外学者的广泛研究。目前图像分割方法包括基于阈值分割2-3、基于像素值分割4以及基于神经网络分割5-6的方法等。在

2、医学领域,翟伟明等7提出了一个动态自适应的体素生长的算法,对肺部CT图像进行三维分割,解决了肺部分割时左右肺难以区分的问题;宋红等8提出一种基于动态自适应区域生长的算法进行肿瘤分割,成功提取出人体肝脏CT图像中的肿瘤区域;张丽娟等9也提出区域生长与全卷积神经网络相结合的方法对肝脏CT图像进行交互式分割。近年来,一些学者也开始对CT图像的自动分割方法进行一些探索。Reboucas等10提出了专门用于分割复杂物体的三维自适应清晰主动轮廓法,它是一种在胸部CT扫描中自动分割肺部的新技术。Men等11基于深度反卷积神经网络算法对鼻咽癌CT图像进行目标自动分割,但需要仔细的人工审查和大量的编辑;Athe

3、rtya等12提出了一种基于模糊特征点的轮廓自动初始化方法,该方法在脊柱CT图像医学图像分割中有较大的适用性,在模拟高斯噪声的情况下具有良好的鲁棒性;Vania等13将卷积神经网络和全卷积网络结合,利用类冗余作为软约束从CT图像中分割脊柱,显著提高了分割结果的准确性和系统处理时间。而在古生物恐龙蛋壳化石的显微结构研究领域,CT图像智能处理技术尚处在探索阶段。古生物学家处理的数据量随着各种技术的进步也在迅速增加,但海量古生物方面的数据依然需要依赖人进行手动处理,并且虽然在古生物学的研究中使用了众多数字化手段,如CT扫描等,但如何在这些数据中找到所需要的信息依然是一项充满挑战的工作14。由于在处理

4、大量恐龙蛋壳化石CT图像方面可借鉴的经验过于稀少,而手动分割导致分离工作难度较大、效率较低,为了达到自动分离恐龙蛋壳化石CT图像目标与背景的目的,本文提出了一种基于信息熵的CT图像目标与背景自动分离提取方法。实验结果表明,使用该方法取得了理想的分离效果,目标提取有效率高达98.89%,并且处理时间也大幅缩短,提高了古生物恐龙蛋壳化石CT图像处理效率。该方法能精确地提取出恐龙蛋壳气孔与边界,为后续重建恐龙蛋三维立体结构提供了可靠的基础,也为其他目标为方解石的古生物CT图像自动分离提取提供了新的技术解决方案。2 数据与方法2.1图像数据集本文选取广东河源晚白垩世地层发现的一类蜂窝蛋类(恐龙蛋的一种

5、类型)进行了蛋壳结构的计算机断层扫描,采用的设备为GEphoenix vtomex m 180 kV/300 kV,测试电压为70 kV,测试电流为130 A,得到了3 329张16位的恐龙蛋壳原始切片CT图像样品数据,空间分辨率为3.896 m/像素,图像保存为tif格式。由于样品数据头部和尾部CT图像的目标区域太小(目标区域像元比率小于3%),为提高处理速度,仅选取切片样号4832 599作为样本数据集。图1展示了样本数据集里随机选取的前、中、后3段的原始图像,分别为切片样号704,1 668,2 595,每个切片目标范围大小不一,其中亮度值高且呈现较明亮的区域为目标区域,其余为背景区域。

6、图1原始图像示例。(a)切片704;(b)切片1 668;(c)切片2 595。Fig.1Raw images.(a) Slice 704;(b) Slice 1 668;(c) Slice 2 595.2.2信息熵信息熵(Imformation Entropy)最早是由Shannon借鉴热力学中熵的概念在1948年提出的,它描述了信息来源的不确定性,本质上是对不确定信息的数学化度量,其大小描述了信息的有序程度及包含的信息量。将信息熵引入到图像中可以度量图像信息量,评判图像信息有序与丰富程度15-16。CT图像由大量不同灰度级的像素构成,在CT图像处理过程中,熵一般度量图像像素亮度值的均匀程度

7、,CT图像的信息熵清晰地反映了其信息量的多少,它与图像灰度变化的不确定性程度密切相关15。假设一张CT图像的灰度级分布范围为0,n,t0,n,t代表灰度级,p(t)代表概率;各灰度级像素出现的概率为p0,p1pn,各灰度级像素具有的信息量则分别为-log2p0,-log2p1,-log2pn。其中H(t)值越高,图像所含信息量越大,图像灰度变化的不确定性程度越大,图像也就越混乱16-18。图像的信息熵计算公式如式(1)所示:H(t)=i=0np(t)log2p(t)(1)2.3信息熵参数提取由于CT图像是16位的,所以需要将其转换为8位,以便进行后续图像处理。首先从训练数据集里的前、中、后三段

8、中随机选取3张CT图像切片,分别为切片编号704,1 668,2 595,通过 Adobe Photoshop软件进行人工手动分离CT图像目标与背景,获得分离后的图像(图2);然后计算所选分离后图像各自的信息熵,分别是0.65,0.54,0.43(表1)。从图2可以看到,图2(b)所含信息量相较而言更大,更具代表性,因此最后选取中间图像切片(样号1 668)的信息熵0.54作为本文方法的信息熵参数初始经验值。最后计算切片样号704和样号2 595的信息熵值与样号1 668的信息熵值0.54的误差都为20%,因此,后续进行CT图像的自动分离时,设置信息熵的误差范围为20%。图2手动分离后的图像。

9、(a)切片704;(b)切片1 668;(c)切片2 595。Fig.2Images after manual separation.(a) Slice 704;(b)Slice 1 668;(c)Slice 2 595.表1信息熵参数训练结果Tab.1Training results of information entropy parameters样号分割阈值信息熵7041520.651 668900.542 5951400.432.4分割算法步骤本文主要针对CT图像来分离目标与背景从而提取目标,通过信息熵的方法使分离得到的目标在完整性和边缘细节保留方面都得到了较好的效果。具体分割算法步骤

10、和流程如图3所示。图3目标智能提取技术流程示意图Fig.3Schematic diagram of intelligent target extraction technology步骤1:将转换后的8位图像进行信息熵计算,再训练信息熵参数。步骤2:统计灰度图像的亮度直方图。用lambda函数根据亮度值进行排序,输出hisR1(根据像素亮度值从小到大排序)、hisR2(根据像素亮度值统计个数从大到小排序)两个列表。步骤3:把hisR2统计结果中像素亮度值统计个数最多时的亮度值作为分割阈值,根据该阈值分离原始灰度图像的目标与背景,输出分割阈值。步骤4:分割单个图像目标与背景。创建一个大小与原图像一

11、样的空白图像矩阵,根据输入的阈值对原图像进行分离,若像素亮度值大于阈值,则认为是图像的目标,则将该像素对应的位置输出到新图像并将亮度值赋值为255,遍历原灰度图像的所有像素值,输出新图像。步骤5:计算分离后图像的信息熵值。将信息熵0.54这个样本参数值作为处理训练数据集中第一张CT图像的输入值,得到一个新的信息熵值,然后将新信息熵值作为下一个图像运算的参考值,由此循环运算直到最后一张图像运行结束。步骤6:设置信息熵误差范围为20%,判断误差是否不大于20%,若是说明分离的结果是可靠的,则结束分离并输出当前信息熵;若不是则回到步骤5,直到误差在20%以下。步骤7:对训练数据集里所有图像遍历进行自

12、动分割,最后输出分割后的图像文件以及表格文件。3 实验结果与分析本文实验环境为Windows10系统下安装的PyCharm开发环境,通过Python编程语言实现自动分离实验,分割对象为数量较多的恐龙蛋壳化石切片CT图像。上述算法运行后最终的结果包括两部分:分割后的图像和输出的表格。其中图像内容可以明显提取出目标和边缘,而表格内容包括CT图像的样号、分割阈值以及信息熵值。3.1分离效果定量分析本研究为了符合恐龙蛋壳化石CT图像数据的特点,将样本数据集样号4832 599的切片CT图像作为测试集。鉴于信息熵已用于CT图像目标与背景的自动分离与提取中,本文也给出了该方法对恐龙蛋壳化石切片CT图像的自

13、动分离结果,包括训练集和测试集中2 117张切片CT图像的分割阈值和信息熵。由于通过以上方法获得的从4832 599的每个样号都有一个分割阈值和信息熵值,导致数据量很大。通过观察输出的结果表格,发现信息熵的范围和分割阈值的范围都并不宽泛,因此将其分拆成两个部分,即信息熵结果的频次统计(表2)和分割阈值的频次统计(表3)。从表2和表3中发现,样本数据集中CT图像的信息熵值范围在0.430.65之间,最大信息熵值为0.6,出现频次有236次;分割阈值范围是66188,最大分割阈值为97,出现频次有98次。其中分割阈值范围即为CT图像目标的亮度值范围,由于恐龙蛋壳是由方解石构成的,故所提取的目标即为

14、方解石。表2信息熵结果频次分布Tab.2Frequency distribution of information entropy results信息熵频次信息熵频次信息熵频次0.4330.51260.592170.44140.52540.62360.45290.53450.612230.46200.54990.621860.47260.551290.631240.48180.561560.64760.49170.571760.65150.5260.58202总计2 117表3分割阈值结果频次分布Tab.3Frequency distribution of segmentation thres

15、hold results分割阈值频次分割阈值频次分割阈值频次分割阈值频次662944812115148316729577122161493268196851231315020702979812416151177169873125815211723998812613153157311005912720224117441014412819155167521025712912156107651035613017157117791044113151581378310525132231591079310626133151601280410743134111611481610832135161621082

16、11091913610163583611029137101644845111161382516558510112231392516638681131714030169387121142022128170188161152314226174289141161814326175290171172214440178191202282114536186292291191314631188193361202214734总计2 117根据表2、表3进行的信息熵与分割阈值统计,获得图4、图5两个直方图。如图4所示,样本数据集CT图像的信息熵分布范围在0.430.65之间,只有一个峰,其中信息熵峰值为0.6;

17、同时信息熵在0.430.51之间分布比较均匀但很少且起伏不大,而其他主要集中分布在0.510.65之间且大致呈正态分布,说明样本数据集分割后CT图像的信息熵主要集中在0.6左右。而在图5中,CT图像分割阈值范围在66188之间,且有两个峰,一个是94104,另一个是138150,但主要集中在前一个峰,其中分割阈值最高峰值为97,说明样本数据集中CT图像的分割阈值大部分都集中在97左右。图4信息熵统计直方图Fig.4Information entropy statistical histogram图5分割阈值统计直方图Fig.5Segmentation threshold statistical

18、 histogram3.2分离效果定性分析由于进行自动分离的CT图像数量较多,因此本文仅从样本数据集原始图像与自动分离后图像的前、中、后3段各自随机选取3张进行分离效果分析。前段选取的是切片520,668,770;中段选取的是切片1 526,1 655,1 731;后段选取的是切片2 322,2 481,2 576。图6、7、8给出了CT图像样本数据集中前、中、后段选取切片各自的原始图像及自动分离图像。图中左边列(a)、(b)、(c)为原始图像,右边列(d)、(e)、(f)为自动分离目标与背景后提取的目标图像,即去除了背景后的参考标准图像。图6前段原始图像与分离后图像。(a)、(b)、(c)原

19、图像;(d)、(e)、(f)分离后图像。Fig.6The first segment of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f)Separated image.图7中段原始图像与分离后图像。(a)、(b)、(c)原图像;(d)、(e)、(f)分离后图像。Fig.7The middle part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f)

20、Separated image.图8后段原始图像与分离后图像。(a)、(b)、(c)原图像;(d)、(e)、(f)分离后图像。Fig.8The last part of the original images and the separated images.(a),(b),(c)Original image; (d),(e),(f) Separated image.原始图像仅以肉眼无法对目标进行有效提取,且存在很大的主观性,导致误差过大;而且从原始图像中并不能清晰辨认目标边缘轮廓,也不能分辨哪些是气孔哪些是目标,这对我们的目标分离提取工作带来了很大的困难(图6、7、8的左边列原始图像)。从图

21、6、7、8的右边列分离后的图像可以看出,自动分离提取目标的结果与手动分离的结果(图2)相差并不大。本文方法用于自动分离提取目标时获得了较好的效果,在将目标从背景中正确提取出来的同时保留了完整的目标轮廓,边缘也十分清晰,并且还可以从图中分辨出气孔,为构建恐龙蛋壳三维立体结构提供了基础。根据信息熵理论可知,图像所含内容越多就越混乱,信息熵值就越高。由表2可知,样本数据集分割后CT图像的最大信息熵为0.60,而在表4中也可以看出,前、中、后3段信息熵均较高,但中段信息熵均值为0.60,是前、中、后3段图像里最高的,这与最大信息熵值相同,这说明在样本数据集中段位置的CT图像相较其他位置的信息熵更高一些

22、,其内容相对来说也更多。而从图6、7、8也可看出,中段图像相较于前、后两段而言,它所含信息量更多。上述方法用于CT图像的目标与背景自动分离和提取目标时均获得了较好的效果,这证明了信息熵用于恐龙蛋壳化石切片CT图像目标与背景分离提取是可行且有效的。表4不同位置分离后图像结果Tab.4Image results after different positions separation位置样号分割阈值信息熵信息熵均值前段5202210.560.596681470.617701010.60中段1 5261040.600.601 655950.591 7311250.60后段2 3221080.530.

23、512 4811400.532 5761440.474 讨论关于CT图像分割处理的研究多集中在医学领域上,如研究内脏器官和其他病变位置7-8,10-11,以及研究脊柱12-13,19等,这些方法中有些方法相对而言更复杂并且不能处理大量的样本。如宋红等8提出的基于动态自适应区域生长分割肿瘤的算法,需要对图像先预分割而获得感兴趣区域,然后再提取肿瘤区域。此外,Chu等19提出了一个基于学习的统一随机森林回归和分类方法,解决了从CT图像中全自动定位和分割脊柱三维椎体的问题,该方法可以完全自动化,但也需要先用随机森林回归方法定义脊柱感兴趣区域。两者在进行提取目标之前都有先获得感兴趣区域这一步,而本研究并不需要如此,直接就可以通过信息熵与分割阈值进行自动分离并提取目标,方法更加简便快速。与目前广泛使用的医学CT图像分割方法相比,在恐龙蛋壳化石的CT图像研究上可借鉴的对象和参考的实例较少。由于恐龙蛋壳化石不同于人体组织或者动物组织,其成分属于不同的物质类型,两者的CT图像信号特征差异较大,因此不能完全照搬前人在医学领域的CT图像分割方法,并且医学图像中物体或结构的分割通常比其他类型的图像更为复杂。所以针对恐龙蛋壳化石CT图像,需要选择一种针对性强且运算效率更高的方法。本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论