智能护眼:上海市第一人民医院许迅团队推出儿童近视预测与干预效果评估的AI系统

【导读】全世界近视患病率的不断上升,对公共卫生构成了重大挑战。对抗近视的一个关键策略,是对儿童进行早期发现和预测,因为这种检查允许使用易于获取的成像技术进行有效干预。为此,团队引入了DeepMyopia,这是一种由人工智能(AI)提供支持的决策支持系统,用于检测和预测近视的发病,并使用常规视网膜眼底图像,为有风险的儿童提供有针对性的干预。研究结果表明,DeepMyopia是一种可靠且高效的基于人工智能的决策支持系统,可用于儿童近视的干预和指导。

2024年8月7日,上海市第一人民医院许迅团队在期刊《npj Digital Medicine》上发表了题为“A deep learning system for myopia onset prediction and intervention effectiveness evaluation in children”的研究论文。本研究为稳健有效的近视预测和管理,提供了一个可行的模型。基于眼底图像分析和非睫状肌麻痹眼部参数的DeepMyopia,在预测近视发病方面表现出优异的性能,为普通人群儿童的早期发现和干预指导提供了可靠、高效的工具。

https://www.nature.com/articles/s41392-024-01914-0

研究介绍

01

近视已成为一个全球性的公共卫生问题,它影响儿童和青少年的视力甚至心理健康,同时给个人、家庭和社会带来经济负担。随着近视的进展,它会增加眼部并发症、视力障碍,甚至不可逆转的失明的风险。根据世界卫生组织2022年的一份报告,全球有超过20亿人因检测较晚而导致的未矫正屈光不正,最终进展成为视力受损。需要及早发现和预测近视发病和发展的高风险儿童,以便采取有效的干预措施,防止视力丧失和随后的并发症。

在近视发病预测中,眼科测量,包括基线球面当量(SE)、轴长(AL)和生活方式参数,例如,在户外度过的时间,已被使用。其中,使用睫状肌麻痹SE作为预测因子的模型最准确,受试者工作特征曲线下面积(AUC)为 0.93。基于睫状肌麻痹SE的方法,在大规模筛查中具有局限性,因为需要更长的时间和更大的努力;特别是在农村地区,缺乏睫状肌麻痹滴剂,配镜师和验光师。用于干预指导的预测模型,对于个性化近视控制具有重要意义,但目前尚不可用。因此,使用非睫状肌麻痹变量,来估计近视进展风险的预测模型,可以潜在地为儿童的干预策略提供指导。

基于深度学习的人工智能(AI)算法最近在眼科研究的视网膜眼底图像分析中,取得了巨大成功。特别是对于眼底图像,深度学习已被应用于提取新信息,例如屈光不正,其具有极高的准确性。最近,新加坡的两项研究使用深度学习来检测高度近视,预测儿童5年高视风险。虽然这些研究证明了使用视网膜眼底图像预测近视的可行性,但它们也有一定的局限性。与短期预测相比,5年预测范围在临床上,可能不太实用。对高度近视的关注,可能会限制它们对普通人群的适用性。重要的是,以前的研究主要涉及近视检测和高近视风险预测,而没有考虑干预措施。

除了人工智能的进步外,相机硬件的改进(例如现代智能手机内置的相机)能够以经济高效、便携和方便的方式获取图像。据报道,已经有关于各种基于智能手机的眼底成像应用程序的研究,这些应用程序已经可用。这种技术的进步,可能会提高近视筛查的可行性,而不需要睫状肌麻痹。

在本研究中,团队开发了一种深度学习算法,称为DeepMyopia,用于儿童和青少年的视网膜眼底图像分析,以及近视预测。DeepMyopia作为一种决策支持系统,能够:(1)使用非睫状肌麻痹眼科参数预测近视的发生;(2)准确识别近视高危个体,从而指导下游干预;(3)减轻近视负担。本研究通过对近视儿童的大规模筛查和干预指导,为建立稳健有效的近视预测和管理方案,提供了概念验证。

研究进展

02

近视发病的预测


近视检测结果显示,内部测试集的AUC为0.995,外部测试集的AUC范围为0.885至0.951。根据检测到的结果,团队开发了4个模型来预测未来近视发作的风险,使用:(i)以视网膜眼底图像为输入的眼底模型;(ii)Cyc-元数据模型,包括来自睫状肌麻痹检查的年龄、性别和SE等元数据;(iii)NonCyc-metadata模型,包括来自非睫状肌麻痹检查的年龄、性别和AL;(iv)深近视——(i)和(iii)的组合, 包括视网膜眼底图像、年龄、性别和AL。

眼底模型内部检验的第1年、第2年和第3年的AUC,分别为0.870(95%CI:0.808-0.923)、0.801(95%CI:0.751-0.850)和0.794(95%CI:0.741-0.843)。DeepMyopia在第1年、第2年和第3年的AUC,分别为0.908(95%CI:0.871-0.943)、0.813(95%CI:0.763-0.864)和0.810(95%CI:0.757-0.859)。Cyc元数据模型的第1-3年的AUC,分别为0.947、0.843和0.845,而NonCyc元数据模型的AUC分别为0.672、0.605和0.594。DeepMyopia和Cyc元数据模型之间没有观察到显著差异,而DeepMyopia优于NonCyc元数据模型,AUCs显著更高。

在外部测试集(香港儿童眼科研究,HKCES)中获得了一致的结果,其中眼底模型的AUC为0.767、0.761和0.758;DeepMyopia的AUC为0.796、0.808和0.767;Cyc元数据模型的AUC为0.952、0.839和0.778;NonCyc元数据模型的AUC为0.728、0.627和0.568。这些模型在高度近视预测方面,也取得了竞争性表现。

4种模型在不同时间点预测近视发病的性能。

近视发病的风险分层


对于1年风险分层,DeepMyopia表现出0.82的高C指数 (95% CI:0.77–0.87),与NonCyc元数据模型相比,近视发病风险分层显著改善(C 指数:0.57, 95% CI:0.46, 0.66)。对于2年和3年的预测,DeepMyopia的C指数也高达0.81和0.75,而NonCyc元数据模型的C指数为0.60和0.59。

团队根据发育数据集中的风险评分,将非近视儿童分为低风险组和高风险组。Kaplan-Meier曲线在内部测试集中,实现了两组之间的高度分离(p < 0.001)。DeepMyopia在区分低风险和高风险人群发展近视的能力方面,也表现出显著的分离性(p < 0.001)。

DeepMyopia在减轻近视疾病负担方面的有效性


团队采用马尔可夫模型模拟了儿童近视的终生经历,从而评估了DeepMyopia辅助干预在减轻近视疾病负担方面的有效性。在基线时,所有儿童均为非近视,然后逐渐发展为近视和其他相关疾病。与NonCyc元数据辅助的一般干预相比,在DeepMyopia辅助干预下,该模型预测每100万人每人增加0.33(95%CI:0.11,0.62)质量调整生命年(QALY),避免失明年数为5.90(95%CI:1.92,11.19)。与没有积极干预的自然生活方式相比,DeepMyopia辅助干预使每人增加0.75(95%CI:0.53,1.04)QALY,避免失明年数为13.54(95%CI:9.57,18.83)。

Kaplan-Meier图根据风险分层预测近视的发病。

研究结论

03

本研究的结果表明,创新的深度学习模型DeepMyopia能够准确预测近视的发病。DeepMyopia在近视发病的风险分层方面表现良好,低风险组和高风险组之间有显著的分离。通过将视网膜眼底图像与人口统计学和眼科数据相结合,与元数据或眼底模型相比,DeepMyopia表现出更出色的性能。

眼底模型的近视检测性能,从获得的AUCs中可以看出。通过设置不同的操作阈值,团队可以根据环境,微调模型的行为。在高特异性操作点上,该模型是保守的,最大限度地降低了对没有近视的个体,进行误诊的风险。如果超过这个阈值,就需要立即就诊,并转诊给眼科医生。这将有助于减少对儿童不必要的睫状肌麻痹检查。相反,在高灵敏度工作点,模型不那么保守。超过这一阈值的儿童可能会促使医生提高警惕,并尽早为有风险的儿童安排下一次筛查。

即使在非睫状肌麻痹眼部参数上,DeepMyopia也能实现高预测准确性。它提供了可靠的1年近视发病预测,AUC为0.908,并在3年后保持一致的准确性。纳入视网膜眼底图像显著提高了预测的准确性,优于NonCyc元数据模型。与使用最优预测因子构建的Cyc元数据模型相比,DeepMyopia表现出竞争性,没有统计学上的显著差异。 这一特征有利于儿童的大规模筛查, 在常规体检中提供快速、简单、无创和可靠的近视评估。

准确识别有近视风险的儿童,对于有效的近视管理至关重要,因为它可以推荐适当的近视预防策略。鼓励户外活动,已被公认为预防儿童近视的一种有前途的方法。然而,为学龄儿童实施更多的户外活动,可能会带来重大的实际挑战,特别是在竞争激烈的教育系统中。虽然临床试验的主要好处源于干预本身,但值得注意的是,人工智能模型,如DeepMyopia,可能会在理论效益和实际实施之间架起桥梁。eRCT证明了DeepMyopia帮助和推进近视管理的能力,如近视发病率的显著降低(ARR 为-17.8%)所证明的那样。与其他专注于模拟临床试验的研究不同,本研究深入探讨了儿童近视预防和控制的实际应用。

DeepMyopia的干预指导是可调整的, 可能包括阿托品或红光疗法等措施,具体取决于个人风险状况和临床医生的评估。这种灵活性可以优化资源分配,并确保个人将获得针对其特定风险状况,量身定制的干预措施。

该模型的新颖性,是能够帮助医生找到适合早期近视干预的候选者。结合非睫状肌麻痹验光数据, DeepMyopia在公共卫生筛查中具有很大的潜力。 虽然它没有直接促进干预措施的有效性,但由于团队已经确定了合适的候选人,因此,其有可能提高干预措施的成本效益。虽然预防失明和改善QALY,主要来自干预本身的好处,但人工智能模型也发挥着重要作用。例如,最近的一项研究表明,中国每年的人工智能远程医疗筛查在农村和城市地区,都具有很高的成本效益。本研究进一步支持了这些发现,表明与无干预或一般干预策略相比,DeepMyopia可以改善健康结果。

DeepMyopia有4个具有临床意义的优势:(1) DeepMyopia利用了长达3年的随访数据的纵向队列,从而为模型开发和验证提供了坚实的基础;(2)采用客观数据,包括基线时的眼底图像和非睫状肌麻痹眼部参数,避免了主观回忆偏倚,消除了重复纵向随访的需要;(3) 本研究使用由从不同地点获取的图像组成的大型队列数据集进行评估;(4)团队还证明了DeepMyopia的辅助干预在预测、风险分层和促进无睫状肌麻痹屈光的定向干预方面的综合性能。

参考资料:

1.World Health Organization. Vision impairment and blindness. https://www.who.int/news-room/fact-sheets/detail/blindness-and-visual-impairment (2023).

THE END