CytoBrain:基于深度学习技术的宫颈癌筛查系统

doi:10.1007/s11390-021-0849-3

CytoBrain:基于深度学习技术的宫颈癌筛查系统

CytoBrain: Cervical Cancer Screening System Based on Deep Learning Technology

摘要

摘要: 1、研究背景（context）
宫颈癌是女性发病率和死亡率最高的恶性肿瘤之一。宫颈癌的早发现早治疗能显著降低死亡率。基于宫颈涂片的细胞学检查是临床上最常采用的宫颈癌检测方法之一。但传统的通过专业的细胞病理学医师在显微镜下观察涂片的诊断方式存在人工成本高、主观性强、效率低下等缺陷，不适用于对普通人群的大规模体检筛查。
2、目的（Objective）
本研究旨在利用计算机技术开发诊断效率高、人工成本低、结果客观且能适用于大规模应用场景的宫颈癌自动筛查系统。
3、方法（Method）
本文基于图像处理和深度学习等技术开发了一个高效的，可用于大规模人群的宫颈癌细胞学自动筛查系统CytoBrain，并已经部署在云端。该系统主要包含三个功能模块：（1）宫颈涂片全景图（WSI）中的细胞自动定位和分割模块；（2）细胞自动分类模块；（3）基于细胞分类结果的宫颈涂片WSI自动诊断与可视化交互模块。
宫颈细胞自动定位与分割模块主要完成从WSI中宫颈细胞图像的快速定位与提取。由于单幅WSI中一般包含上万个细胞图像，为了提高CytoBrain的整体性能，本文提出了一种简单高效的细胞自动定位与提取方法。虽然不同细胞的细胞核在大小和形状上相对一致，但不同宫颈细胞在大小和形态上差异很大，因此对包含细胞质在内的细胞整体进行分割不仅耗时长，且分割精度不高，很难应用于实际应用系统。基于细胞癌变特征主要体现在细胞核上这一生物医学共识，本文提出基于细胞核定位和分割的快速细胞提取方法。该方法首先基于SURF特征点检测算法的进行细胞核的快速定位，然后OTSU算法和形态学操作获得完整的细胞核区域；最后根据对图像放大倍数与细胞核大小关系的统计先验，直接以细胞核的关键特征点为中心，切割特定大小的矩形区域作为细胞图像。该方法得到的单个细胞图像能确保包含完整的细胞核但不一定会保留完整的细胞。尽管如此，该方法相比其他复杂的细胞分割算法更高效且基本不影响细胞的分类结果，因此更适用于实际的应用需求。
细胞自动分类模块是CytoBrain的关键部分，主要利用分类模型对每个宫颈细胞进行自动分类。深度学习算法在分类器构建过程中能自动学习数据的表示特征，因此本文采用深度学习宫颈细胞分类模型。由于分类模型的准确性和执行效率对于大规模宫颈癌筛查的应用至关重要，本文基于效率和精度都具有优势的VGG网络结构，提出了一种紧凑型VGG网络，CompactVGG。该模型主要由10个卷积层，4个最大池化层和2个全连接层构成。同其他的VGG模型相比，CompactVGG模型具有更小的宽度和深度，因此能降低模型的计算开销。模型训练的本质是学习训练数据的分布，并最终获得同输入相对应的输出。显然，如果模型不同层的数据分布之间存在较大差异，往往需要更多轮的训练才能使模型达到同样的精度。为了提高模型训练的收敛速度，本文在每层卷积后引入批量标准化操作，减少不同层卷积结果之间的分布差异，从而提供模型的训练收敛速度。同时，为了防止训练过程过拟合，本文除了保留早停策略外，还在损失函数中引入L2-正则化项，进一步降低模型的过拟合风险，从而提高模型的分类精度和模型的鲁棒性，是其更适用于大规模宫颈癌筛查的实际应用场景。
WSI辅助诊断和可视化交互模块首先基于WSI中所有细胞的分类结果，并结合临床经验知识，进行WSI的自动诊断；然后提供可视化交互界面让用户对结果进行复核，必要时可进行修改。该模块主要偏向于软件开发，因此本文并不探讨其具体实现细节。大体上，该模块提供细胞显示和WSI显示两种模式。用户可以查看细胞或WSI的放大图像，复核分类结果，并可进行结果的修正。
鉴于目前公开的宫颈细胞图片数据集很少，且数据集规模不大，本文在遵循医学伦理要求的前提下，通过回顾性研究，收集了来自2312个受检者的宫颈细胞学WSI图像，并通过本文提出的细胞自动定位与提取算法，获得细胞图像，构建自有宫颈细胞数据集。数据集中每张细胞图像由三位资深医师背靠背人工标注为positive，negative或者junk，多数专家一致的结果作为该细胞图像的最终标签。
4、结果（Result&Findings）
构建了来自2312个受检者的宫颈细胞图像数据集，总共包含198 952个细胞图像，其中60238个为positive；25001个为negative，113713个为junk。该数据集是迄今为止我们知道的最大规模数据集。
本文在自有数据集及在Herlev和SIPaKMeD两个公开数据集上，对CompactVGG模型的时间性能和分类精度进行对比评估实验。同VGG系列模型中时间效率最高的VGG11网络在三个数据集上运行效率的对比实验结果表明，CompactVGG在训练速度和样本测试速度上均优于VGG11。在相同的实验环境和实验设置下，CompactVGG平均每轮训练时间大约为VGG11的58.62%（自有数据），73.63%（Herlev）和72.15%（SIPaKMeD）；训练好的CompactVGG模型对每个细胞的平均分类时间也均少于VGG11。同时，将CompactVGG和其他三个代表性的深度学习模型在三个数据集上进行分类性能的对比实验结果表明，CompactVGG均具有明显优势。在自有数据集和Herlev数据集上，CompactVGG在5个性能指标上均取得最高值。在SIPaKMeD数据集上，所有方法均取达到不错的总体性能分数，F1分数值均超过0.98，但在该数据集中5类细胞的各自分类精度上，其他方法性能波动较大，而CompactVGG的分类精度稳定在前两位（3类细胞的分类精度最高，另2类细胞分类精度第二高），CompacVGG模型比其他模型更鲁棒。上述实验结果表明，基于CompactVGG的宫颈细胞分类模型更适用于大规模宫颈癌筛查的实际应用场景。
5、结论（Conclusions）
本文构建的宫颈癌大规模数据集一方面有助于构建泛化能力更强、可实用的宫颈细胞分类模型，同时对作为标准数据集供相关领域研究者实用；本文的细胞定位和提取方法简单高效，实用性强；本文提出的CompactVGG模型具有执行效率高、分类性能好的优点。集成细胞快速提取方法和CompactVGG模型的CytoBrain系统可以快速、有效、低成本地为细胞病理学家提供宫颈癌的辅助诊断，满足大规模宫颈癌筛查的应用需求。由于目前本文收集的数据集中细胞分为positive，negative，junk三类，因此CytoBrain目前尚不能对positive的诊断结果进行更为精细的分类，未来将进一步在精细化分类方面对系统及数据集进行优化，使其能满足更多临床应用的需求。

Abstract: Identification of abnormal cervical cells is a significant problem in computer-aided diagnosis of cervical cancer. In this study, we develop an artificial intelligence (AI) system, named CytoBrain, to automatically screen abnormal cervical cells to help facilitate the subsequent clinical diagnosis of the subjects. The system consists of three main modules: 1) the cervical cell segmentation module which is responsible for efficiently extracting cell images in a whole slide image (WSI); 2) the cell classification module based on a compact visual geometry group (VGG) network called CompactVGG which is the key part of the system and is used for building the cell classifier; 3) the visualized human-aided diagnosis module which can automatically diagnose a WSI based on the classification results of cells in it, and provide two visual display modes for users to review and modify. For model construction and validation, we have developed a dataset containing 198 952 cervical cell images (60 238 positive, 25 001 negative, and 113 713 junk) from samples of 2 312 adult women. Since CompactVGG is the key part of CytoBrain, we conduct comparison experiments to evaluate its time and classification performance on our developed dataset and two public datasets separately. The comparison results with VGG11, the most efficient one in the family of VGG networks, show that CompactVGG takes less time for either model training or sample testing. Compared with three sophisticated deep learning models, CompactVGG consistently achieves the best classification performance. The results illustrate that the system based on CompactVGG is efficient and effective and can support for large-scale cervical cancer screening.

HTML全文

参考文献()

施引文献

资源附件()