面向半监督颅内动脉瘤CTA图像分割的权重感知自洽模型
Semi-Supervised Intracranial Aneurysm Segmentation from CTA Images via Weight-Perceptual Self-Ensembling Model
-
摘要:研究背景 颅内动脉瘤(IA)是由血管壁无力引起的动脉血管局部扩张,在血液动力学作用下导致的血管疾病。人群中IA的总体发生率为3%,IA破裂是自发性蛛网膜下腔出血的最常见原因,其发病率高,病死率高。计算机断层扫描血管造影术(CTA)对IA的定量评估和进一步手术治疗非常重要。然而从CTA中手动分割IA非常耗时且费力,因此临床实践中迫切需要自动进行IA分割。然而IA作为动脉血管的局部扩张,其HU值在CTA中与正常血管没有区别,因此无论对于分割算法还是数据标注工作,都面临较大挑战。对于深度学习等数据驱动算法,通常需要足够的标记数据才能获得更好的性能,但是,标记大规模的CTA数据集将大大增加医生的负担。目的 本文旨在研究从CTA图像中自动分割IA的半监督方法,能够在使用较少标记数据的情况下,利用大量无标注数据实现分割IA的目的,以此降低对标注数据的依赖。方法 我们提出了一种权重感知的半监督IA分割模型,该模型基于包含一个教师模型和一个学生模型的自洽框架,在此框架中,学生模型接受有标注数据的监督训练,教师模型通过对学生模型的指数滑动平均得到,在训练中对输入数据施加噪声,然后分别输入学生模型和教师模型,并通过一致性损失约束两者输出结果的一致性。此外,我们提出一种样本权重感知模块,该模块通过对无标注数据的预测结果进行评分,进而在训练过程中依据评分自动地对样本进行加权,以缓解无标注数据中分割结果较差的样本对训练过程产生的消极影响,使模型更加关注那些预测质量较好的样本。结果 我们首先将提出的模型与基线模型在20%、40%、60%、80%等四种标注数据比例下进行测试,继而在20%的标注数据下将本文模型与其它state-if-the-art半监督医学图像分割模型进行对比,最后我们对模型进行了消融实验。实验结果显示我们的模型在20%的标注数据与基线模型有超过3%的优势,与其它所有半监督医学图像分割模型对比,至少有1.7%的优势,在与无权重感知模块的meat teacher模型对比后,我们发现权重感知模块无论在任何标注数据比例下,都能有较大的提升,并且随着标注数据比例的增大,提升的性能幅度更大。结论 利用对无标注数据预测质量的预估,我们提出的权重感知模块可以有效提高半监督模型的学习水平,在训练过程中对每个无标注样本对损失函数的贡献程度进行动态调整,能够缓解预测结果较差的样本对模型训练产生的负影响。基于权重感知策略,我们的方法能够超越其它的半监督医学图像分割方法,更有效的利用无标注数据。不过,考虑到当前我们使用的数据集规模有限,而颅内动脉瘤的形态变化多样,我们将继续收集更多的数据进一步探索我们的方法在更大规模数据上的性能,此外,我们将进一步研究提升我们的方法在较小的颅内动脉瘤上的分割性能。Abstract: Segmentation of intracranial aneurysm (IA) from computed tomography angiography (CTA) images is of significant importance for quantitative assessment of IA and further surgical treatment. Manual segmentation of IA is a labor-intensive, time-consuming job and suffers from inter- and intra-observer variabilities. Training deep neural networks usually requires a large amount of labeled data, while annotating data is very time-consuming for the IA segmentation task. This paper presents a novel weight-perceptual self-ensembling model for semi-supervised IA segmentation, which employs unlabeled data by encouraging the predictions of given perturbed input samples to be consistent. Considering that the quality of consistency targets is not comparable to each other, we introduce a novel sample weight perception module to quantify the quality of different consistency targets. Our proposed module can be used to evaluate the contributions of unlabeled samples during training to force the network to focus on those well-predicted samples. We have conducted both horizontal and vertical comparisons on the clinical intracranial aneurysm CTA image dataset. Experimental results show that our proposed method can improve at least 3% Dice coefficient over the fully-supervised baseline, and at least 1.7% over other state-of-the-art semi-supervised methods.