第1章 生物细胞图像处理
1.1 深度学习方法概述
生物细胞图像是在数字显微镜下捕获,用于观察生物组织结构形态变化的一类图像。医学细胞图像是其中较为常见且被研究较多的一种图像。医学细胞图像分析作为计算机辅助诊断(computer aided diagnosis,CAD)系统中不可或缺的一部分,被广泛应用于细胞形态、组织结构评估等研究中。
医学细胞图像,又称病理细胞图像,是经过染色、制片等步骤制成的人体组织样本图像。一般来说,细胞图像通常被分为苏木素 -伊红(hematoxylin and eosin,HE)染色图像和特殊染色图像两类。其中,HE染色是一类历史悠久且应用广泛的**染色手段;特殊染色则是一系列以免疫组化染色为代表的新型染色方式的统称。除免疫组化染色外,常见的特殊染色还有银染色、淀粉染色、Masson三色染色等。如果从制片角度分类,细胞图像还常被分为切片图像、涂片图像和印片图像等;如果从制作手段分类,细胞图像还可分为石蜡制片和冰冻制片等,这里不再赘述。
数字病理细胞图像在病理疾病诊断决策过程中起着非常重要的作用,可以以更高的效率实现病理图像的定量分析。近年来,随着数字图像处理与分析技术的不断进步,特别是深度学习方法的逐步完善,病理图像处理领域也迎来了井喷式发展。自2012年卷积神经网络(convolutional neural network,CNN)模型AlexNet在ImageNet图像识别竞赛中斩获冠军之后,深度学习方法在图像处理领域掀起了一股新的应用热潮。众多医学图像的研究者也开始尝试在医学图像分析处理中引入这一新兴技术。
1.1.1 深度学习方法在细胞图像处理中的新进展
Ehteshami等[1]提出了一种在完整切片图像中分割乳腺原位癌的方法,*先采用超像素的分类方法在完整切片上搜索腺上皮区域;其次使用基于图的聚类方法对超像素进行处理找到可能的感兴趣区域;昀后判断找到的感兴趣区域是否为原位癌。Wan等[2]使用特征级联与多尺度图像结合的方法对乳腺癌病理图像进行诊断评级。该方法采用传统的特征提取加支持向量机(support vector machine,SVM)的方式对图像进行分类,其中的亮点是引入了卷积神经网络的输出作为SVM输入特征的一部分,提高了评级的准确率。Bejnordi等[3]提出了根据组织的基质特性区别乳腺癌与正常乳腺组织的方法。这个方法使用了两个卷积神经网络:**个网络用于分类图像中的上皮、基质和脂肪区域;第二个网络则是在像素水平上判断组织的正常与否及良恶性。
Pan等[4]*先利用稀疏重构方法对图像进行去噪处理,然后使用一种无下采样的多层卷积神经网络实现对细胞核的分割。Xu等[5]将 HE染色图像划分为若干子图后使用卷积神经网络对各个子图分别进行处理并生成图像的分割结果。Xing等[6]提出了一种结合卷积神经网络与字典学习的细胞核分割方法,其中卷积神经网络生成细胞核的初始化形状,字典学习则用于预测细胞核的形状轮廓。
基于卷积神经网络模型,Ling等[7]提出了一种用于宫颈细胞良恶性分类的框架,同时迁移学习的引入进一步提升了该框架的分类性能。Zheng等[8]采用一种由细胞核位置信息作为先验知识的卷积神经网络来判断乳腺组织是否具有损伤。Naylor等[9]采用深度学习的语义分割网络结合分水岭算法分割细胞核,并取得了良好的结果。Beevi等[10]基于多分类器系统深度信念网络来识别分裂期细胞。
1.1.2 深度学习方法的局限性
深度学习方法的引入的确为医学图像处理技术的发展注入了强大的活力,但就目前深度学习方法的发展水平而言,单纯使用深度学习方法具有诸多缺陷,如大量的样本数据采集,高昂的训练、使用成本,黑箱特性(模型原理不可解释性)等,无法满足稳健、严谨、保守的医学应用需求。
在这些缺陷中,黑箱特性是对深度学习方法在医学领域应用的昀大限制。深度学习网络的黑箱特性,又被称为模型原理不可解释性。到目前为止,学术界尚未对网络各层的具体作用给出明确、统一的解释[11],故完全基于深度学习方法的医学辅助诊断系统,会存在不可解释、不可追溯和不可干预的特性。也就是说,基于深度学习方法的医学辅助诊断系统具体的工作流程无法被理解和完全掌握,并且无法得出相关辅助诊断结果的依据;如果机器给出的诊断结果出现了误差,也无法明确解释误差出现的原因。
此外,黑箱特性还为深度学习系统带来了危险的“脆弱性”。例如,日本九州大学研究团队的研究表明,改动图像上的一个像素,就能让神经网络识别出现错误[12];纽约大学研究团队发现了一种攻击和干扰操纵基于深度学习方法的自动驾驶系统的方法[13];伯克利大学研究团队则在其博客[14]上详细引用[15]和解释了神经网络容易被对抗样本攻击的原因,并在商业性人工智能分类系统中发起了一次成功的攻击[16]。
尽管如此,相比于传统的模式识别技术,深度学习方法已成为目前工业界使用昀为普遍的人工智能(artificial intelligence,AI)技术之一,这是因为在有效和充足数据量的支持下,深度学习方法的准确率远远胜于其他神经网络模型。例如,在CityScape场景分割、COCO目标检测、ImageNet图像分类任务中,深度学习方法都有很明显的优势。
受深度学习方法局限性的限制,基于深度学习方法的医学应用还需要更多的探索实践。事实上,采用传统数字图像处理和深度学习的复合方法,是目前解决医学图像问题的主要思路之一。因此,成本低廉、具有较高可解释性的传统图像处理方法,在医学图像处理的研究领域内依然是不可或缺的。
在本章中,1.2节将对生物医学细胞图像的几种常见传统分割方法进行简要介绍;1.3节以血细胞涂片为例,介绍一种**的细胞图像分割、计数的处理方法;
1.4节介绍一种基于同步可调点火脉冲耦合神经网络的细胞核分割方法;1.5节介绍一种较新的基于距离估计的细胞核标定方法;1.6节以乳腺癌为例,简单地对细胞形态特征参数与癌症诊断之间关系进行讨论。
1.2 生物医学细胞图像分割的常用方法
在生物细胞结构解析和形态变化的研究中,细胞形态的识别和分割是比较重要且实现困难的任务。对各细胞器结构变化、大分子分布变化进行量化分析与处理,以及对细胞之间信号传输机制、能量交换、信息处理原理的探讨都是基于细胞图像的分割,已逐步由定性描述走向定量研究。
细胞图像通常利用生物细胞图像特有的统计特性,图像中细胞及细胞器的轮廓、边缘和纹理等视觉特性进行分割。本节将简要介绍一些较为常见的传统细胞图像分割算法[17],如基于灰度特征的阈值分割方法、基于边界提取的分割方法、基于边缘检测和边缘连接的分割方法、基于区域生长的分割方法、基于小波变换的分割方法、基于数学形态学的分割方法、基于模糊数学的分割方法及基于遗传算法的分割方法和基于人工神经网络的分割方法等。
1. 基于灰度特征的阈值分割方法
基于灰度特征的阈值分割方法主要根据细胞图像灰度分布直方图,通过设置阈值把像素点按灰度级分为内部点集和外部点集,实现细胞图像分割。常见的主要有单阈值法、双阈值法及自适应阈值法等。一般基于灰度特征的阈值分割方法都比较简单、计算量小,算法上容易实现。对目标和背景对比反差较大的图像,这种分割方法很有效,而且总能用封闭、连通的边界定义不交叠的区域。
由于阈值确定主要依赖于灰度直方图,很少考虑图像中像素的空间位置关系,因此当背景复杂,特别是在同一背景上重叠出现若干个研究目标时,容易丧失部分边界信息,造成分割不完整。
2. 基于边界提取的分割方法
基于边界提取的分割方法的基本思想是,利用由边界细胞像素灰度的反差或不连续造成的边界梯度变化的特性来提取边界。较为常见的方法有边界跟踪法和 Kirch算法等。边界跟踪法从原始细胞图像的梯度幅值图像着手处理、跟踪、提取边界;Kirch算法则是利用目标和背景像素的差异,阈值化处理梯度图像,并采用分水岭算法作为昀终的分割手段。基于边界提取的分割方法对噪声较为敏感,易受边界断层和伪轮廓等干扰,难以保证边界的完整性。
3. 基于边缘检测和边缘连接的分割方法
基于边缘检测和边缘连接的分割方法认为图像中细胞边界由灰度的不连续性引起,边缘像素点为分割图像灰度的突变点。其思路是先通过邻域像素之间的运算求取边缘点,再把边缘点连接起来得到一条闭合的连通边界。在这类边缘检测方法中,常见的有梯度算子边缘检测方法、拟合算子边缘检测算法(参数模型匹配算法)等。
梯度算子边缘检测方法对于灰度变化复杂且细节较丰富的图像,处理的结果并不理想。不同的算子提取的边缘具有不同的特性,并且对噪声较为敏感,结果易受干扰。拟合算子的参数模型,记录着很多边缘结构信息,计算开销很大,并且算法复杂度较高,对边缘类型的特异性有较高的要求。
4. 基于区域生长的分割方法
基于区域生长的分割方法是早期计算机视觉研究中较为常用的图像分割方法之一,常见的有区域增长分割方法和区域分裂、聚合分割算法等。该算法对有复杂物体定义的复杂场景、自然景物,先验知识不足图像的分割效果均较理想。例如,Wu等[18]利用肺部癌细胞图像的均值、标准偏差构成的矢量作为细胞分割的特征,提出的区域生长分割算法分割肺部癌细胞纹理图像,取得较好结果。
基于区域生长的分割方法抗噪性能优于基于边缘检测的分割方法,但相比其他算法,其计算开销较大,且当计算过程中引入的预定误差e值选取不当时,还会引入误判,分析目标内部组织之间的重叠也会干扰到昀终的结果。因此,基于区域生长的分割方法一般适合于边缘光滑、无重叠的非丛聚细胞图像的分割。
5. 基于小波变换的分割方法
基于小波变换的分割方法可将原始细胞图像分解为一系列具有不同空间分辨率、不同频率特性和不同方向特性的子带信号分量。这些子带信号分量具有良好的时域、频域等局部特征。这些特征可用来表示原始信号的局部特征,用于不同分辨率层次上的图像分割。在分解过程中,一般在低频段采用长时间窗,在高频段采用短时间窗,以克服傅里叶分析在处理非平稳复杂图像时所存在的局限性。
图像分解后,低分辨率分量会反映原图中一些较明显和较大尺寸的结构特征,高分辨率分量会反映原图中快速变化的细节。因此,通常会在低分辨率分量上对图像进行粗分割,寻找目标的大致轮廓,并在高分辨率分量上进行精细分割,优化分割结果。
小波变换具有很多优秀的特性,但如果直接用于边界提取可能出现孤立像素点和不连续,还会检测到伪边缘点。同时,离散小波变换只能以一定精度记录和处理各分辨率上的分析结果,不可避免地引入了频率分量的截断误差,造成部分边缘信息的丢失。同时,图像噪声也会对准确识别边缘位置产生很大影响。
因此,小波变换方法常会和其他方法结合使用。例如,戴青云等[19]提出小波变换与数学形态学结合算法,此算法分割、定位效果较好,但数学形态结构元素的尺寸和形态对分割结果影响很大;王浩军等[20]把小波变换与大津(Otsu)阈值方法结合提出了一种改进的快速 Otsu阈值分割方法,此方法在速度和精度上都有优势,只适合对细小目标的分割,对大目标的分割效果不明显;另外,耿伯英等[21]提出了将小波变换与超图模型结合的小波分割算法,此处不再赘述。
6. 基于数学形态学的分割方法
基于数学形态学的分割方法的基本思路是先对图像进行某种结构元素的卷积操作,再与原图像进行比较。它利用图像的拓扑特性,并结合数学集合理论对图像进行非线性变换。其昀基本的变换操作有腐蚀和膨胀两种,通过两种基础操作的不同组合,可以完成形态闭、形态开、顶帽和底帽等高阶变换。例如,Wu等[18]提出了数学形态学膨胀、腐蚀运算在建议代价函数昀小前提下的迭代自动分割算法,实现了胸腺细胞纹理图像的分割。
展开