前沿分享 | MRSN:提高全视野乳腺X线图像分类准确性

分享者导读

近日, Medical Image Analysis 杂志以AOP的形式发表了题为“Multi-scale region selection network in deep features for full-field mammogram classification”的文章。该研究提出了一种创新的多尺度区域选择网络(MRSN),进行端到端深度特征训练,旨在提高全视野乳腺X线的分类准确性,以辅助乳腺癌(BC)的早期诊断。MRSN通过在深度特征中筛选出与肿瘤相关的区域,减少了对传统感兴趣区域(ROI)标注的依赖,从而降低了模型训练的成本。该网络首先在不同维度对区域进行评分,以确定肿瘤区域的位置信息,然后选择得分高的区域作为整个图像的特征表示,使模型能够集中注意力于肿瘤区域。研究者们在2个公共数据集和1个私有数据集上进行了实验,结果表明,MRSN在不依赖ROI或分割注释的情况下,实现了最先进的性能。这项研究不仅推动了计算机辅助诊断系统(CAD)的发展,也为未来的BC筛查技术提供了新的方向。

1

研究背景和目的

BC在女性中的发病率和死亡率均较高,而乳房恶性肿瘤的早期筛查和及时干预能够显著降低患者的死亡率。乳房X线检查具有辐射小、分辨率高等优点,在医院得到广泛应用,逐渐成为早期筛查和诊断的首选方案。乳腺X线图像分类是CAD系统的核心任务。随着深度学习技术的发展,深度卷积神经网络(CNN)在肿瘤区域分类上展现出了巨大潜力,但大多数基于CNN的全视野乳腺X线图像分类方法依赖于ROI或分割注释,这限制了CAD系统的发展,因为获取大量可靠的ROI标注既昂贵又困难。此外,一些不依赖ROI的算法通过多阶段训练或多特征提取器来排除对ROI的依赖,然而这增加了模型的计算量和特征冗余。该研究提出的MRSN通过在深度特征中筛选肿瘤区域的特征信息,减少对ROI或分割注释依赖,以降低模型训练成本,并充分利用CNN的特征提取能力,实现无需ROI或分割注释的全视野乳腺X线图像的端到端训练和分类,以期提高分类性能并减少计算量。

2

研究方法和数据集

1)研究方法(见图1):
MRSN首先使用背景裁剪模块去除图像中的黑色背景和其他可能引起混淆的信息,仅保留乳腺区域,并将大小调整为600 x 600;使用预训练的Densenet-169作为特征提取器,将预处理后的图像输入其中,得到特征映射,输出最后卷积层的特征图;对特征图进行空间区域和通道区域选择,选择恶性概率高的区域的特征;最后,将选择的特征在两个维度下进行整合,进入全连接层以计算最终的恶性概率。

图1  MRSN总体架构图

2)数据集:

该研究共在3个数据集上进行实验,包括2个公开数据集和1个私有数据集: 斯坦福大学收集的CBIS-DDSM数据集,包含753个钙化病例和891个肿块病例,共3,071张全视野数字乳腺X线图像; 来自在葡萄牙波尔图的CHSJ乳腺中心的INbreast数据集,包含115例多视图图像,共410张全视野数字乳房X线图像; 来自山东省肿瘤医院的私有数据集,该私有数据集由214例病例的多视图乳房X线图像组成,共406张图像,其中良性肿瘤113张,恶性肿瘤293张。 所有图像被随机分为80%的训练集和20%的测试集,并确保测试集和训练集之间没有重叠。

3

研究结果与结论

1)该研究将5次训练的平均结果作为最终结果,并将其与之前最先进的乳房X线图像分类模型进行比较。基于2个公共数据集和1个私有数据集的实验结果,MRSN在不使用ROI的情况下获得了更高的AUC和Acc( 见表1 );

表1  MRSN与既往最先进的模型在不同数据集上的性能比较

2)在私有数据集上进行MRSN和放射科医生诊断性能的比较,MRSN的平均AUC为0.923,优于放射科医生的平均值0.871( 见图2 );为了进一步MRSN进行比较,该研究纳入了准确性、敏感性和特异性作为额外的评估指标,MRSN独立诊断准确性低于放射科医生,但敏感性和特异性更高。值得注意的是,使用MRSN作为辅助诊断在所有指标上都取得了更好的结果,证明了MRSN作为辅助诊断系统的潜在价值( 见表2 );

图2  在私有数据集上MRSN与放射科医生ROC曲线的比较

表2  在私有数据集上MRSN与放射科医生的诊断性能比较

3)通过区域的选择,MRSN限制了大部分与病变无关的区域进入逻辑回归层,使得训练损失仅依赖于模型肿瘤区域的诊断,排除了混杂信息。这表明MRSN可以在不依赖于分割注释和ROI的情况下,对全视野乳腺X线图像中的肿瘤进行选择和粗略定位( 见图3 ),展示了MRSN在CAD中消除数据依赖、辅助信息评估、获得高属性注释材料的能力;

图3  MRSN在肿瘤区域的定位性能,其中(a)、(b)为恶性钙化病例,(c)、(d)、(e)为恶性肿块病例,(f)为良性病例

4)通道区域选择和空间区域选择通过两轮筛选过滤混淆信息,模型的AUC和Acc分别提高了0.4和0.22以上。此外,两个区域选择的融合表明了整合策略的优势,导致AUC和Acc分别增加了0.26和0.24( 见表3 )。最后,通过进行可视化实验和消融实验,证明所提方法的有效性。

表3  在私有数据集上的消融和模块配置实验结果

4

研究启发

1)MRSN能够在无需依赖ROI或分割注释的情况下,通过在深度特征中筛选出与肿瘤区域相关的特征信息,提高全视野乳腺X线图像的分类准确性,从而减少对大量精确标注数据的需求,并降低模型训练的成本,并且在计算量几乎没有增加的情况下达到了最佳性能;
2)混淆信息和肿瘤信息往往是耦合的,不能通过简单的区域选择来解耦,并且筛选的特征大小也会对计算速度产生影响。在未来的研究中,可侧重于探索解耦特征选择的方法。

文献来源:

Sun,L. , Han,B. , Jiang,W. , Liu,W. , Liu,B. , Tao,D. , Yu,Z. ,& Li , C.(2025).Multi-scale region selection network in deep features for full-field mammogram classification.Medical Image Analysis,100(),103399. https://doi.org/10.1016/j.media.2024.103399

原文链接: https://www.sciencedirect.com/science/article/pii/S1361841524003244?via%3Dihub

分享者简介

魏梦姣

本硕就读于山东大学齐鲁医学院—临床医学5+3一体化专业(研究方向为甲状腺乳腺疾病的临床及基础研究); 博士在读于重庆大学智能肿瘤学教育部医药基础研究创新中心(研究方向为乳腺肿瘤学)。 曾参与省重点研发项目,目前已发表文章2篇,以第一作者身份发表文章1篇。


编辑|曾海蓉 李劲

THE END