Nature | 哈佛医学院、腾讯AI实验室联合开发癌症诊断和预后预测的病理学基础模型CHIEF
在癌症诊断和癌症亚型分类中,组织病理学图像信息是不可或缺的参考依据。近年来,人工智能(AI)技术的 发展 突飞猛进,其在临床医学中的应用也更加深入。例如,已经 有 专门的深度神经网络用于癌细胞鉴定、组织学和分子亚型分类、预后评估以及预测治疗反应。此外,最先进的计算病理学分析还揭示了临床重要分子标记物的定量形态学信号。这些前期的研究证明了AI方法在识别人眼难以察觉的细胞特征方面的潜力。
但现有方法主要集中于单独解决每个特定的诊断任务,难以获得涵盖不同组织微环境异质性的全面病理表征;此外,由单一来源图像训练的AI模型在应用于不同病理实验室处理的图像时,往往会过度拟合训练数据分布,从而导致性能大幅下降。因此,这些限制阻碍了最先进的AI模型在基于组织病理学图像的评估中的有效应用。
近日,哈佛医学院、腾讯AI实验室等单位的研究人员合作在 Nature 发表了题为“A pathology foundation model for cancer diagnosis and prognosis prediction”的文章, 报道了新建立的CHIEF模型(Clinical Histopathology Imaging Evaluation Foundation,临床组织病理影像评估基础),这是一个通用的机器学习框架,为各种病理诊断和预测任务提供了基础。CHIEF在癌症检测、肿瘤起源表征、基因组突变鉴定和生存预测方面的能力也得到了验证。 总之,CHIEF能够进行系统的显微特征识别,并为可靠的病理评估奠定基础。
文章发表在 Nature
据介绍,CHIEF模型是一个用于弱监督组织病理学图像分析的通用机器学习框架。与常用的自监督特征提取器不同,CHIEF利用了两种类型的预训练过程:首先对1500万张未标记的图像进行无监督预训练;随后对超过6万张高精度全切片图像(Whole-slide images,WSIs)进行弱监督预训练。其中,无监督预训练建立了一个通用的特征提取器,可以从不同的公开数据库中收集HE染色的组织病理学图像,这些图像捕获了微观细胞形态的不同表现;WSIs水平弱监督预训练则通过表征癌症类型之间的相似性和差异性构建了一个通用模型。随后,研究评估了CHIEF在癌症检测、肿瘤起源预测、基因组谱鉴定和生存预测中的表现。
基于病理图像检测恶性细胞对癌症诊断至关重要。目前,用于癌细胞检测的最先进AI方法主要集中在特定癌症类型的训练模型上,忽略了癌症中恶性细胞形态的共性特征,导致得到的模型不容易扩展到其他癌症类别。为了解决这一难题,研究人员使用CHIEF建立了一个弱监督的癌症检测平台,并评估了其在癌症中的普遍性。研究共使用15个独立数据集13661个WSIs进行了广泛的外部验证,并将其与三种弱监督WSIs分类方法进行了比较。
分析结果表明 ,CHIEF在使用活检或术中切片的各种癌症识别任务中始终表现卓越。 具体来说,基于代表11种癌症类型的15个数据集,CHIEF的AUROC为0.9397,比其它三种WSIs分类方法分别高出约10%、12%和14%。以上结果证明, CHIEF在不同来源的不同癌症组织和样本中的普遍适用性 。此外,研究还使用CHIEF成功地预测了癌症的组织起源,并使用外部独立测试集验证了该结果。
图2. CHIEF癌细胞检测方面优于其它深度学习方法
癌症样本的基因组图谱能够指示患者的治疗反应,因此对于制定精准的治疗方案至关重要。考虑到分析费用,对癌症患者进行全基因组分析在临床上并不常用。从常规的HE染色载玻片中基于定量形态模式指示基因组图谱提供了一种即时且具有成本效益的替代方法。因此,研究人员进一步测试了CHIEF系统预测癌症样本分子谱的能力。
首先,研究团队将常见的基因突变与组织病理学图像相关联进行系统分析,共涉及30种癌症类型的13432个WSIs和53个常见基因。总的来说, CHIEF预测了9个AUROC大于0.8的基因的突变状态。 与先前的研究一致,基于病理图像在19种癌症类型中检测到与TP53突变相关的强信号。此外,CHIEF还发现了GTF2I突变,其可发生在43.4%的胸腺上皮肿瘤患者中,AUROC为0.9111。与基于组织病理学的最先进的基因组突变预测方法,即泛癌症计算组织病理学(PC-CHiP)方法相比, CHIEF表现出显著更高的性能,平均AUROC为0.7043 ,PC-CHiP方法的平均AUROC为0.6523。
研究进一步使用CHIEF预测了与靶向治疗相关的基因突变。 基于FDA批准的OncoKB( www.oncokb.org )中15种癌症类型的18个相关基因,CHIEF预测了所有18个AUROC大于0.6的基因的突变状态 ,包括NTRK1在胃腺癌中的表达(AUROC = 0.8192)、前列腺癌中的BRCA2(AUROC = 0.8938)和甲状腺癌中的BRAF(AUROC = 0.8889)。此外,在异柠檬酸脱氢酶(IDH)状态的预测、MSI状态的预测方面,CHIEF同样表现出优良的性能。
图3. CHIEF利用组织病理学图像成功预测不同癌症类型的基因突变
目前,虽然已经发现了许多临床和基因组生物标志物,但它们并不能完全预测每个患者的预后。为了应对这一挑战,该团队扩展了CHIEF框架,使其能够为所研究的每种癌症类型建立分期,并对患者的生存进行预测。研究在17个数据集中共使用了9404个WSIs,并在独立队列中重点研究了7种具有可靠预后信息的癌症类型。
结果发现,CHIEF利用初始诊断时获得的组织病理学图像成功预测了患者的生存结果。 在所有癌症类型和所有研究队列中,CHIEF能够将长期生存患者与短期生存患者显著区分开来,且优于其它先进的深度学习方法。 概括来说,CHIEF在不同癌症类型间的平均一致性指数为0.74。此外,CHIEF衍生的风险评分是独立于已知生存结果指标的重要预后因素。
图4. CHIEF可预测癌症患者的生存结局
综上所述,研究团队联合开发了CHIEF这一通用的、泛癌症分析的深度学习框架,用于定量病理评估。分析结果显示,CHIEF能够成功地表征肿瘤起源、患者基因组图谱,并可将患者分为长期生存组和短期生存组。此外,对来自多个中心通过不同的扫描仪进行数字化处理,并从不同的临床程序(包括活检和手术切除)中获得的不同病理样本,CHIEF具有很强的适应性。CHIEF提供的准确、可靠、快速的病理样本评估将有助于癌症个性化治疗的发展。
文章通讯作者、哈佛医学院生物医学信息学系助理教授Kun-Hsing Yu 表示: “我们的目标是创建一个灵活、多功能、类似 ChatGPT的AI大模型,以进行全方位的癌症评估。 我们的模型在多种癌症的检测、预后和治疗反应评估等多项任务中表现出色。 ”
Wang, X., Zhao, J., Marostica, E. et al. A pathology foundation model for cancer diagnosis and prognosis prediction. Nature (2024). https://doi.org/10.1038/s41586-024-07894-z.
·END·
版权声明:本文为“乐问号”作者或机构在乐问医学上传并发布,仅代表该作者或机构观点,不代表乐问医学的观点或立场,不能作为个体诊疗依据,如有不适,请结合自身情况寻求医生的针对性治疗。
链接:http://www.lewenyixue.com/2024/09/19/Nature%20%7C%20%E5%93%88%E4%BD%9B%E5%8C%BB%E5%AD%A6%E9%99%A2%E3%80%81%E8%85%BE%E8%AE%AFAI%E5%AE%9E/
THE END