Cell | 斯坦福大学揭秘人工智能虚拟细胞的突破与未来
撰文:克里斯
IF :45
推荐度:
亮点:
提出了一个创新的人工智能虚拟细胞(AIVC)概念,这是一个基于大型神经网络模型的多尺度、多模态模型,能够模拟分子、细胞和组织在不同状态下的行为。AIVC的提出为生物医学研究提供了一个高保真模拟的新纪元,有望加速发现过程、指导实验研究,并促进跨学科的开放科学合作。
近日, 美国斯坦福大学计算机科学系 Charlotte Bunne 教授团队 在 国际知名期刊 《 Cell 》 发表了题为: How to build the virtual cell with artificialintelligence: Priorities and opportunities 的研究文章。
文章首先介绍了细胞作为生命的基本单位,其复杂性对物理和计算建模的挑战。接着讨论了现有细胞模型的局限性,并提出了AIVC的概念。文章详细描述了AIVC的设计愿景,包括其在不同生物尺度上的能力、评估框架、自洽性、可解释性与生物学效用之间的平衡,以及促进合作建模和确保伦理责任的框架。最后,文章强调了AIVC在生物工程、癌症治疗和精准医学中的潜在应用,并呼吁进行跨学科合作。
1、前言
研究背景
传统的细胞模型在模拟和预测细胞功能和行为方面存在局限,无法充分捕捉细胞在时间和空间上的多尺度操作以及复杂的生物分子相互作用。随着人工智能(AI)和组学技术的进步,现在有机会构建直接从数据中学习的细胞模型,这些技术革命为构建AIVC提供了前所未有的机会。
研究设计
文章AIVC实验设计思路涉及构建一个全面的AI框架,包括多个互联的基础模型,代表从分子到细胞、组织乃至更高层次的动态生物系统。实验设计思路包括创建一个通用的多模态多尺度生物状态表示,以及一套虚拟仪器(VIs),这些仪器是操作或解码这些表示的神经网络。文章还讨论了如何从分子层面开始,逐步构建每个物理尺度的AIVC,并强调了数据生成、模型评估和解释、以及开放合作的重要性。
图1.科学研究中产生假设的框架
2、AVICs(人工智能虚拟细胞)
人工智能虚拟细胞(AIVC)是一个多尺度、多模态的大型神经网络模型,它能够模拟分子、细胞和组织在不同状态下的行为。AIVC旨在整合广泛的细胞生物学知识,预测细胞功能和行为,以及动态变化,并能够执行虚拟实验以生成和测试新的科学假设。该模型致力于创建一个通用的生物状态表示,跨越不同物种、数据模态、数据集和环境条件,包括多样的细胞类型、发育阶段和外部条件。通过这种通用表示,AIVC有助于揭示细胞状态的共同特征,并作为一个全面的参考框架,使研究人员能够利用现有的生物学知识来连接不同数据之间的联系。
图2.AVIC功能简介
3、建立 AVIC
AIVC被构想为一个全面的人工智能框架,由多个相互连接的基础模型组成,这些模型能够在复杂的生物系统中代表动态变化,从分子层面到细胞、组织乃至更高层次。这个框架的核心包括一个通用的多模态多尺度生物状态表示,以及一套虚拟仪器(VIs),这些仪器是能够操作或解码这些表示的神经网络。
从分子层面开始,逐步构建每个物理尺度的AIVC的重要性,并讨论了设计原则和可用于构建AIVC每个物理尺度的数据类型。这包括从个体分子到整个组织的模型,每个尺度都通过独特的表示连接,从而在生物尺度间提供一致性。通过这种多层次的表示,AIVC能够无缝地整合新数据,并适应新的生物学知识,为生物医学研究提供一个强大的工具。
图3.AIVC概述
4、模型升级
对于人工智能虚拟细胞(AIVC)模型的评估需要一个全面且可适应的基准框架。AIVC必须展示其在众多生物学环境和下游任务中的泛化能力,同时考虑到由于环境变化、感染、遗传变异等因素引起的动态分布变化。评估不仅要衡量模型在未见过的情境中的表现,如新的细胞类型和遗传背景,还要评估其发现新生物学的能力。
AIVC模型的评估应优先考虑其在生物学相关性上的表现,包括生成有价值的可测试假设,以及是否能够通过模型性能的统计度量或需要解释性和生物学因果关系来充分评估。最终,AIVC模型的评价将基于其扩展我们对生物学的理解的能力,无论是提供新的生物学见解还是加速科学过程。
5、可解释性与交互性
在构建人工智能虚拟细胞(AIVC)时,如何平衡模型的可解释性和生物学效用。随着深度学习在生物学中的应用,模型性能的提升往往伴随着模型变得更加难以解释,即所谓的“黑箱”问题。尽管如此,提高AIVC模型的可解释性仍然是一个重要目标,因为它有助于科学家理解模型预测背后的生物学机制,从而更好地信任和使用这些模型。构建直观的用户界面十分重要,以便不同专业水平的研究人员能够有效地理解和利用AIVC的预测结果。
此外,研究指出利用大型语言模型(LLMs)作为虚拟研究助理,为非专家提供直观的交互界面,帮助他们深入理解AIVC的预测,并在生物学上进行进一步的探索。
6、开放协作方法
构建人工智能虚拟细胞(AIVC)需要采取开放和协作的方法。由于创建AIVC需要巨大的投资、多样化的背景知识和多次迭代,因此需要整个科学界的共同努力。研究提倡开放数据资源、数据标准、协作平台以及共享的基准数据集和验证策略,以确保AIVC模型的生物学保真度和实际应用价值。这种协作方式有助于加速个体努力的进展,并将全球规模的科学研究统一起来。
作者呼吁不同领域的利益相关者,包括学术界、生物制药和人工智能行业,进行预竞争性合作,以加速AIVC的开发,并与监管机构和生物伦理专家合作,建立新的规范,以促进AIVC的部署,同时遵守法律要求并为虚拟细胞的负责任使用设定伦理标准。
7、未来前景
AIVC有潜力彻底改变生物医学研究的方式,引领我们在个性化医疗、药物发现、细胞工程和可编程生物学等领域取得突破。AIVC作为虚拟实验室,它能够促进从计算机系统、现代生成性AI和生物学之间无缝的界面,使科学家能够将细胞视为信息处理系统,并构建生命的虚拟表现。
随着AIVC对细胞和分子系统理解的深入,科学家将越来越多地能够对它们进行编程和设计新的合成系统。AI模型已经被用来设计新的CRISPR酶、功能性蛋白甚至整个原核生物基因组。所有领域的利益相关者应当参与这一宏大的科学事业,相信通过大规模的科学合作、共享目标、洞察力的开放共享,以及安全、伦理和可靠的AI的力量,我们正步入一个科学探索和理解的新时代。AI与生物学的融合,特别是通过AIVC,标志着生物学领域的范式转变,并为解开细胞的多重谜团提供了乐观的希望。
教授介绍
CharlotteBunne 教授, 瑞士洛桑联邦理工学院计算机与通信科学学院和生命科学学院的助理教授,同时也是瑞士实验癌症研究所的成员。曾在 Genentech 和斯坦福大学与 Aviv Regev 和 Jure Leskovec 一起做博士后研究,并在苏黎世联邦理工学院与 Andreas Krause 和 Marco Cuturi 合作完成了计算机科学博士学位,主要研究目标是利用机器学习和大规模生物医学数据推进个性化医疗。 Charlotte Bunne 的跨学科研究已经赢得了多个奖项。
参考文献
Bunne C, Roohani Y, Rosen Y, Gupta A, Zhang X,Roed M, Alexandrov T, AlQuraishi M, Brennan P, Burkhardt DB, Califano A, CoolJ, Dernburg AF, Ewing K, Fox EB, Haury M, Herr AE, Horvitz E, Hsu PD, Jain V,Johnson GR, Kalil T, Kelley DR, Kelley SO, Kreshuk A, Mitchison T, Otte S,Shendure J, Sofroniew NJ, Theis F, Theodoris CV, Upadhyayula S, Valer M, WangB, Xing E, Yeung-Levy S, Zitnik M, Karaletsos T, Regev A, Lundberg E, LeskovecJ, Quake SR. How to build the virtual cell with artificial intelligence:Priorities and opportunities. Cell. 2024 Dec 12;187(25):7045-7063. doi:10.1016/j.cell.2024.11.015. PMID: 39672099.
链接:http://www.lewenyixue.com/2024/12/25/Cell%20%EF%BD%9C%20%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E6%8F%AD%E7%A7%98%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E8%99%9A%E6%8B%9F/



赶快来坐沙发