LIDC中肺结节注释信息的提取及数据库的建立_第1页
LIDC中肺结节注释信息的提取及数据库的建立_第2页
LIDC中肺结节注释信息的提取及数据库的建立_第3页
LIDC中肺结节注释信息的提取及数据库的建立_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、LIDC中肺结节注释信息的提取及数据库的建立【摘要】目的:对LID数据库的注释文件中有关肺结节的相关数据进展提娶整合、汇总,并导入到Aess数据库表中。方法:通过对LID数据库XL格式的注释文件的分析、解读,利用VisualBasi语言编程提取数据,并导入到Aess数据库表中。结果:数据提取和显示程序将LID中的68个病例的相关数据如病例号、专家号、结节号、结节的各种T征象、结节的X坐标和Y坐标等加以提取和显示,并保存到数据库中。结论:将LID数据库中包含的每个病例T图像的XL格式注释文件导入到Aess数据库中,较之纯文本格式的数据组织更加构造化,进而可以借助数据库强有力的数据管理和查询功能对

2、T图像上肺结节形态、位置、T征象等进展查询和比拟。【关键词】LID;XL文件;Aess数据库;T图像1引言随着科学技术的不断开展、更新,现如今医生进展医学诊断的方法与形式已经发生了宏大的转变。与过去仅凭经历、惯例等不同的是,现今的医学诊断更多的倾向于科学的、数字化的精细诊断形式,其中最为突出的例如就是计算机辅助诊断及计算机辅助检测的飞速开展。T的计算机辅助肺癌诊断的研究证实,AD技术可以为病变部位的探测提供有效的帮助,甚至可以在连续的T检查中辅助确定病变部位是否稳定或是否发生了大小的改变。为了为各种图像处理或AD技术的互相比拟和测评提供一个参考数据库,美国国家癌症研究会NI于2001年4月起陆

3、续公布了肺部图像数据库联盟LungIageDatabasensrtiu,LID。该影像数据库可以通过互联网访问和下载1。目前LID包括68个病例的约10000张全肺T扫描图像扫描层厚1.253,512512像素,总容量超过6GB。每个病例对应一个文件夹,包括完好的肺部T扫描图像DI格式100300张,以及一个注释文件XL格式。在注释文件中给出了4名放射学专家对每张T片中出现的结节的定义,包括结节的主要T征象,如毛刺征Spiulatin、分叶征Lbulatin、钙化alifiatin等以及结节的恶性度alignany。由于LID数据库中病例的注释文件是采用XL格式编写的纯文本文件,所有注释内容均

4、以标识符加以区分,不具备数据的查找、统计等功能。本研究将LID数据库所提供的原始XL注释文件信息加以提取,建立相应的Aess数据库进展存储,方便其他研究人员的使用。2方法与实验2.1XL注释文件2.1.1XL文件XL文档是由元素组成的,每个元素都包含一个“起始标记如、一个“完毕标记如,以及两个标记之间的信息即元素的内容。元素可以使用属性进展注解,属性包含了关于元素及其内容的元数据。XL信息集主要用作各种XL技术使用的定义集,以正式描绘需要技术处理的XL文档局部。XL信息集是XL文档的树状层次表示。一个XL文档的信息集包含许多信息项,这些信息项是XL文档组件的抽象表示,其中包括表示文档、文档的元

5、素、属性、处理指令、注释、字符、表示法、命名空间、未分析的实体、未扩展的实体引用和文档类型声明的信息项。2.1.2LID提供的XL格式数据例如在每个病例的所有T图像后面都有一个注释文件,其中给出了4名放射学专家对每张T片中出现的结节的定义,包括结节的主要T征象,如毛刺征Spiulatin、分叶征Lbulatin、钙化alifiatin等以及结节的恶性度alignany。对于大结节直径3的结节,给出了轮廓点的坐标,小结节直径3的结节给出了中心点的坐标。所有信息的含义定义在一对标签中。一个典型的XL文件片段如图1所示。2.2存储LID中肺结节数据的数据库从每个病例的原始注释文件中提取如表1所示的根

6、本信息,并写入相应数据库表的字段中。表1存储LID中肺结节数据的数据库表的构造注:如T图像上某一构造为小结节直径小于3或非结节,那么上述字段412的取值均为0。2.3提取LID中肺结节数据Step1提取患者号,以作为患者号的标识符。Step2提取专家号。注释中未给出放射学专家编号,但是通过对文件的大体框架的分析可以看出,每一对中包含一位专家对这个病例做出的诊断。所以通过挑选,可以将专家号分别定义为A、B、和D。Step3判别是否为结节、非结节或是另一名专家的诊断。同时搜索3个标识符、:Step3.1假如搜索到,那么继续搜索是否有、或标识符;Step3.1.1假如指针搜寻的结果为,那么表示此结节

7、分类为大结节,继而提取大结节的结节号、T号,并根据要求继续提取大结节的相关征象值和所有坐标。因为所提供的原始注释文件中小结节和非结节都只有一对坐标,指针在查找到起始坐标的标识符后直接提取即可。但是对于大结节来说,由于每个大结节都含有多个坐标,所以在这里只提取第一对坐标作为起始坐标,其余的坐标统一提取后存在txt格式的文件中,在最后整合的数据表中指保存文件的文件名,以做提示。Step3.1.2假如指针搜寻的结果为,那么表示此结节的分类为小结节,只需提取结节号、T号及X、Y坐标即可,其余的结节征象参量标识符对应的值为0。Step3.1.3假如指针搜索结果为,即说明该结节数据读取完毕,须将所有已读信

8、息保存至实现定义的数组中,等所有数据读取完以后一起输出显示。Step3.2假如挑选结果为,那么指针所指的构造为非结节,根据非结节所需信息要求,挑选出数据即可。Step3.3假如挑选结果为,说明已读取完一个专家的所有数据,可以开场继续读下一个专家,直至整篇文档读取完毕。3结果3.1提取注释文件的程序在如图2所示的程序窗口,“文件菜单用于翻开病例数据,在显示的对话框中选择病例文件。程序将自动提取文件中肺结节的信息,并将它们显示在一个文本框控件中。“显示菜单用于以报表形式显示保存到数据库中的数据,如图3所示。3.2建立的数据库在LID数据库的68个病例中,4名放射学专家共标注大结节331个累及T层数1589张、小结节920个累及T层数920张、非结节病变2370个累及T层数2370张。对每张T上的大小结节及非结节病变,用一条记录保存其相应信息,所以整个数据库共68张表、4879条记录。此外还有保存大结节轮廓点坐标的文本文件1589个。4结论LID数据库是在整合了多位放射学专家对多份病例的T扫描图像的意见的根底上建立起来的,为肺部图像数据的搜集制定了一个指导方针,为今后的科学研究打下坚实的基矗LID数据库的建立为早期肺癌诊断提供了强有力的辅助手段,灵敏的应用LI

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论