CESA -2020-4-021 人工智能芯片应用 面向病理图像分析辅助诊断系统的技术要求 征求意见稿_第1页
CESA -2020-4-021 人工智能芯片应用 面向病理图像分析辅助诊断系统的技术要求 征求意见稿_第2页
CESA -2020-4-021 人工智能芯片应用 面向病理图像分析辅助诊断系统的技术要求 征求意见稿_第3页
CESA -2020-4-021 人工智能芯片应用 面向病理图像分析辅助诊断系统的技术要求 征求意见稿_第4页
CESA -2020-4-021 人工智能芯片应用 面向病理图像分析辅助诊断系统的技术要求 征求意见稿_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

ICS35.240

CCSL70

团体标准

T/CESAXXXX—2020

人工智能芯片应用面向病理图像分析辅助诊

断系统的技术要求

Applicationofartificialintelligencechip-Technicalrequirementstotheauxiliary

diagnosticsystemofpathologicalimageanalysis

征求意见稿

在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。

已授权的专利证明材料为专利证书复印件或扉页,已公开但尚未授权的专利申

请证明材料为专利公开通知书复印件或扉页,未公开的专利申请的证明材料为专利

申请号和申请日期。

202X-XX-XX发布202X-XX-XX实施

中国电子工业标准化技术协会发布

T/CESAXXXX—202X

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

本文件由中国科学院计算技术研究所提出。

本文件由中国电子工业标准化技术协会归口。

本文件起草单位:中国科学院计算技术研究所,中科寒武纪科技股份有限公司,中南大学湘雅医院

等。

本文件主要起草人:。

III

T/CESAXXXX—202X

人工智能芯片应用面向病理图像分析辅助诊断系统的技术

要求

1范围

本文件规定了在智能芯片上进行病理图像分析辅助诊断的系统技术组成、功能要求和测试方法等内

容,主要涉及到病理图像分析系统在智能芯片上的推理及应用,不涉及在智能芯片上的训练环节。

本文件适用于在智能芯片上进行病理图像分析辅助诊断系统的部署、检验及应用。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

3.1

机器学习Machinelearning

一种程序或系统,用于根据输入数据构建(训练)预测模型。这种系统会利用学到的模型根据从分

布(训练该模型时使用的同一分布)中提取的新数据(以前从未见过的数据)进行实用的预测。机器学

习还指与这些程序或系统相关的研究领域。

3.2

深度学习DeepLearning

机器学习中一种基于对数据进行表征学习的方法,通过组合低层特征形成更加抽象的高层表示属性

类别或特征,以发现数据的分布式特征表示。

3.3

训练Training

确定构成模型的理想参数的过程。

3.4

预测Prediction

模型在收到输入样本后的输出。

1

T/CESAXXXX—202X

3.5

推断Inference

在机器学习中,推断通常指将训练过的模型应用于无标签样本,进而来做出预测的过程。

3.6

训练集trainingset

数据集的子集,用于训练模型。

3.7

验证集validationset

数据集的一个子集,从训练集分离而来,用于调整超参数。

3.8

测试集testset

数据集的子集,用于在模型经由验证集的初步验证之后测试模型。

3.9

病理切片Histopathologicalslide

在病理诊断过程中,病理医生首先从病变区域中提取组织样本,将提取的样本放在能够防止其腐化

的定影剂玻片上制作成病理切片。为了能够在病理切片中更清晰地观察出各种组织以及癌细胞,切片通

常会用不同的染色剂进行染色,一般采用苏木精-伊红染色,又称H&E(Hematoxylin&Eosin)染色,随

后病理医生在高倍显微镜下观察切片并进行病理诊断。

3.10

病理切片图像WSIHistopathologicalWhole-slideImages

利用病理切片扫描仪将病理切片,扫描制作成全视野数字化切片(Whole-SlideImage,WSI),该数

字化切片往往以多层金字塔结构存储不同分辨率下的病理图像,可在计算机上呈现如同在显微镜下一样

查看组织和细胞结构的效果。

3.11

多层金字塔结构Multi-layeredpyramidstructure

病理切片图像WSI一般采用多层金字塔的结构进行存储,最高分辨率为40X,然后是20X,10X,5X,

1.25X等,每张数字化病理切片图像具有5~9层不等,其中40X下的病理图像尺寸大小将近百亿像素

级别。医生可以在电脑上模拟显微镜下的图像,在不同的图像分辨率上观察不同的病理信息,比如40X

可以观察细胞级别,20X及10X分辨率下观察组织结构等。病理诊断往往需要在高倍率下进行检测和判

别。

2

T/CESAXXXX—202X

3.12

小图片Patch

由于病理切片图像WSI尺寸过大,现有机器学习或者深度学习方法大多采用将高倍率下的病理图像

切分为若干个patch的方式,即小图片的方式,以解决整张切片过大无法训练和测试的问题。

3.13

病理分析结果的大图拼接wholeslidesplicingbasedonpathologicalanalysisresult

将基于patch小图的分析结果,进一步根据patch在原始全视野WSI上的位置信息拼接成WSI图像

的过程,从而可以得到整张全视野大图上的病理分析结果,比如癌区域分割结果,或者癌区域检测结果,

用于结果的展示和后续分析。

3.14

病理图像分析辅助诊断auxiliarydiagnosisofpathologicalimageanalysis

利用病理图像分析技术进行病理辅助诊断,比如在病理切片图像上进行癌区域的检测和分割,并结

合检测和分割结果进行整张切片是否是癌变切片进行判别,从而辅助医生进行诊断。

3.15

病理切片图像癌区域检测cancerregiondetectioninpathologicalimage

在病理图像上进行癌区域位置检测和定位的过程。通常方法为基于patch进行癌区域分类,然后将

区域分类结果融合到病理切片大图上,得到较为粗略的癌区域检测结果。

3.16

病理切片图像癌区域分割cancerregionsegmentationinpathologicalimage

在病理切片图像上对癌区域进行像素级分割的过程。通常方法为基于patch进行逐像素的癌像素分

类,从而得到patch级别的癌区域分割结果,然后将patch拼接为病理切片大图,从而得到切片级别较

为精细的癌区域分割信息,可以进一步得到癌区域的边缘信息。

3.17

病理切片图像癌变分类cancerclassificationofpathologicalimage

基于以上癌区域检测和癌区域分割步骤,进一步对病理切片图像进行是否发生了癌变进行判别。

3

T/CESAXXXX—202X

4系统技术架构

4.1系统技术架构

智能芯片病理图像分析辅助诊断系统技术架构如图1所示:

病理图像分析模块

病理图像病理图像癌区域检测模块病理图像

预处理模块癌变判别模块

病理图像癌区域分割模块

图1智能芯片病理图像分析辅助诊断系统框架

智能芯片病理图像分析系统包括但不限于以下模块:

1)病理图像预处理模块:对病理图像进行读取,格式转化,patch切分,颜色归一化等处理。

2)病理图像癌区域检测模块:对病理图像中出现的癌区域进行位置检测。

3)病理图像癌区域分割模块:对病理图像中出现的癌区域进行像素级分类和癌区域分割。

4)病理图像癌变判别模块:对病理图像是否有癌变进行判别。

4.2硬件及模型要求

智能芯片(卡):指以芯片卡形态进行使用的人工智能芯片,如GPU、FPGA以及ASIC等人

工智能芯片(卡),可通过PCIE等接口与测试主机连接。

控制主机处理器架构:X86架构或ARM架构。

支持主流的机器学习框架:TensorFlow、Caffe、MindSpore等。

模型精度:FP32、FP16、INT8或混合精度。

5功能要求

5.1病理图像预处理功能要求

病理图像预处理指病理图像分析系统对病理图像进行预处理,以得到适合深度学习模型处理

的数据,包括并不限于以下步骤:

1)读取输入的病理图像

2)转化成国际上通用的多层金字塔结构图像tif格式

4

T/CESAXXXX—202X

3)根据深度网络推理模型的要求,提取其中某一层分辨率的病理图像,比如40X,20X,10X

等。

4)根据模型需要,可对病理WSI图像进行patch的切分和提取,并记录patch在大图上的位

置信息。

5)根据模型需要,可对patch小图像进行颜色归一化。

5.2智能芯片推理功能要求

5.2.1病理图像癌区域检测功能要求

将切分得到的patch小图输入训练好的基于深度学习的癌区域分类模型,对patch进行是否是

包含癌区域的分类判别,即每个patch得到一个统一的分类概率,概率值大表示该patch包含癌区

域的概率大,概率值小表示该patch可能是正常组织或者背景区域。

5.2.2病理图像癌区域分割功能要求

将切分得到的patch小图输入训练好的基于深度学习的癌区域分割模型,对patch小图中的每

个像素进行是否是癌像素的分类判别,从而每个patch得到一个精细化的像素级分类结果,patch

中的每个像素对应一个概率,该概率值大表示对应的像素可能是癌像素,概率值小表示该像素可能

来自正常组织或者背景。

5.2.3病理图像大图拼接(不是必须的)

根据模型要求,将以上得到的每个patch的分类或者分割结果,根据patch位置信息拼接成病

理大图,从而得到整个病理切片图像上癌区域检测结果,或者癌区域分割结果。为了方便分析检测

和分割结果,可以以热图形式可视化显示。

5.2.4病理图像癌变判别功能要求

根据以上癌区域检测或者癌区域分割结果,进行整张病理切片是否有癌变的判别。

6推理测试指标

6.1测试数据集

可以选择以下两个公开数据集进行测试:

1)2016年国际生物医学图像学会(ISBI)组织了一次针对整张乳腺癌WSI切片进行腋窝淋巴

结是否被乳腺癌浸润的诊断竞赛Camelyon16。该竞赛为参赛者提供400张病理切片WSI的数据集

进行训练和测试,每张WSI都带有癌区域的多边形标注信息。可以选择一部分数据用于模型训练,

验证,以及芯片的测试。

2)肠镜病理切片分割竞赛DigestPath2019数据集,包含来自不同医学中心,共450例患者的

750病理WSI图像,每张图像提供了癌区域的像素级标注信息。可以选择一部分数据用于模型训

5

T/CESAXXXX—202X

练,验证,以及芯片的测试。

6.2病理图像癌区域检测测试指标

任务为癌区域的检测任务,为输入的每个patch赋予预先设定的类别,可以选取模型:

CNN,InceptionV3等。

病理图像中癌区域级别的评估,采用FROC(FreeResponseOperatingCharacteristic)指标。FROC,

FROC曲线横坐标为平均每张切片假阳性样本数,纵坐标为真阳性率。最终FROC的值为6个预定

义好假阳性样本数上的灵敏度的平均,分别为1/4,1/2,1,2,4和8个假阳性样本数。

6.3病理图像癌区域分割测试指标

任务为逐像素的标注任务,即为输入图像中每一个像素赋予预先设定的类别,选取模型为

Deeplabv3+,SegNet,U-Net和FCN等。

衡量图像语义分割任务的性能评价指标为:

平均交并比(MeanIntersectionoverUnion,mIoU):所有类别的交并比IoU的平均值。计算

真实值(groundtruth)和预测值(predictedsegmentation)两个集合的交集和并集之比,即为每个

类别的交并比IoU。

F分数:综合权衡精确率和召回率的指标。

F=2*Pre*Rec/(Pre+Rec)

注:精确率(Pre):识别正确的结果在所识别出的结果中所占的比率;

召回率(Rec):识别正确的结果占数据集中所有要识别出的总数的比率。

6.4病理图像癌变判别测试指标

病理切片级别癌变评估,将切片分类为癌切片或非癌切片,采用ROC(Receiveroperating

characteristic)曲线下的面积AUC(AreaundertheROCcurve)作为评价指标,其中ROC曲线的横坐标

做假阳性率,纵坐标为真阳性率。AUC的值在0~1之间,越接近1表示该模型的病理切片癌变判别

效果越好。

6

T/CESAXXXX—202X

参考文献

[1]GB/T5271.31-2006信息技术词汇第31部分:人工智能机器学习

[2]GB/T5271.34-2006信息技术词汇第34部分:人工智能神经网络

[3]20190851-T-469信息技术人工智能术语

[4]T/CESA1026-2018人工智能深度学习算法评估规范

7

T/CESAXXXX—202X

目  次

前  言...............................................................................................................................................................II

1范围...................................................................................................................................................................1

2规范性引用文件...............................................................................................................................................1

3术语和定义.......................................................................................................................................................1

4系统技术架构...................................................................................................................................................3

5功能要求...........................................................................................................................................................4

6推理测试指标...................................................................................................................................................5

_

II

T/CESAXXXX—202X

人工智能芯片应用面向病理图像分析辅助诊断系统的技术

要求

1范围

本文件规定了在智能芯片上进行病理图像分析辅助诊断的系统技术组成、功能要求和测试方法等内

容,主要涉及到病理图像分析系统在智能芯片上的推理及应用,不涉及在智能芯片上的训练环节。

本文件适用于在智能芯片上进行病理图像分析辅助诊断系统的部署、检验及应用。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

3.1

机器学习Machinelearning

一种程序或系统,用于根据输入数据构建(训练)预测模型。这种系统会利用学到的模型根据从分

布(训练该模型时使用的同一分布)中提取的新数据(以前从未见过的数据)进行实用的预测。机器学

习还指与这些程序或系统相关的研究领域。

3.2

深度学习DeepLearning

机器学习中一种基于对数据进行表征学习的方法,通过组合低层特征形成更加抽象的高层表示属性

类别或特征,以发现数据的分布式特征表示。

3.3

训练Training

确定构成模型的理想参数的过程。

3.4

预测Prediction

模型在收到输入样本后的输出。

1

T/CESAXXXX—202X

3.5

推断Inference

在机器学习中,推断通常指将训练过的模型应用于无标签样本,进而来做出预测的过程。

3.6

训练集trainingset

数据集的子集,用于训练模型。

3.7

验证集validationset

数据集的一个子集,从训练集分离而来,用于调整超参数。

3.8

测试集testset

数据集的子集,用于在模型经由验证集的初步验证之后测试模型。

3.9

病理切片Histopathologicalslide

在病理诊断过程中,病理医生首先从病变区域中提取组织样本,将提取的样本放在能够防止其腐化

的定影剂玻片上制作成病理切片。为了能够在病理切片中更清晰地观察出各种组织以及癌细胞,切片通

常会用不同的染色剂进行染色,一般采用苏木精-伊红染色,又称H&E(Hematoxylin&Eosin)染色,随

后病理医生在高倍显微镜下观察切片并进行病理诊断。

3.10

病理切片图像WSIHistopathologicalWhole-slideImages

利用病理切片扫描仪将病理切片,扫描制作成全视野数字化切片(Whole-SlideImage,WSI),该数

字化切片往往以多层金字塔结构存储不同分辨率下的病理图像,可在计算机上呈现如同在显微镜下一样

查看组织和细胞结构的效果。

3.11

多层金字塔结构Multi-layeredpyramidstructure

病理切片图像WSI一般采用多层金字塔的结构进行存储,最高分辨率为40X,然后是20X,10X,5X,

1.25X等,每张数字化病理切片图像具有5~9层不等,其中40X下的病理图像尺寸大小将近百亿像素

级别。医生可以在电脑上模拟显微镜下的图像,在不同的图像分辨率上观察不同的病理信息,比如40X

可以观察细胞级别,20X及10X分辨率下观察组织结构等。病理诊断往往需要在高倍率下进行检测和判

别。

2

T/CESAXXXX—202X

3.12

小图片Patch

由于病理切片图像WSI尺寸过大,现有机器学习或者深度学习方法大多采用将高倍率下的病理图像

切分为若干个patch的方式,即小图片的方式,以解决整张切片过大无法训练和测试的问题。

3.13

病理分析结果的大图拼接wholeslidesplicingbasedonpathologicalanalysisresult

将基于patch小图的分析结果,进一步根据patch在原始全视野WSI上的位置信息拼接成WSI图像

的过程,从而可以得到整张全视野大图上的病理分析结果,比如癌区域分割结果,或者癌区域检测结果,

用于结果的展示和后续分析。

3.14

病理图像分析辅助诊断auxiliarydiagnosisofpathologicalimageanalysis

利用病理图像分析技术进行病理辅助诊断,比如在病理切片图像上进行癌区域的检测和分割,并结

合检测和分割结果进行整张切片是否是癌变切片进行判别,从而辅助医生进行诊断。

3.15

病理切片图像癌区域检测cancerregiondetectioninpathologicalimage

在病理图像上进行癌区域位置检测和定位的过程。通常方法为基于patch进行癌区域分类,然后将

区域分类结果融合到病理切片大图上,得到较为粗略的癌区域检测结果。

3.16

病理切片图像癌区域分割cancerregionsegmentationinpathologicalimage

在病理切片图像上对癌区域进行像素级分割的过程。通常方法为基于

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论