近些年来,突飞猛进的生物学研究产生和积累了大量细胞数据。在人工智能(AI)的帮助下,科学家正借助这些丰富数据来预测细胞的微观细节。2024年,诺贝尔化学奖就授予了蛋白质结构预测、计算蛋白设计研究领域的先驱者。
“拥有准确预测细胞活动的能力将改变我们对基础生物过程的理解,”来自哥伦比亚大学的Raul Rabadan教授表示,“ 这可以将生物学研究从随机转变成可预测、控制的科学。 ”目前,预测细胞内部基因、蛋白之间的活动仍存在巨大挑战。传统方法只能在干预发生后揭示细胞有哪些变化,但无法预测细胞内部是如何工作或者对条件变化会做出哪些反应。
如今,这一方向终于迎来了全新突破。据发表在《自然》杂志的一篇论文,Rabadan教授和同事研发的AI方法 可以准确地预测任何人类细胞类型中的基因活动 ,包括预测基因表达和调控活性、推断和识别调控元件以及转录因子间的相互作用。这对于揭示细胞的内在基因网络有重要意义。
在过去,类似的研究通常会以某一特定细胞的数据为基础来训练AI,但新研究的数据来源要更广、更大。AI的训练数据来自于人类健康组织的数百万个细胞的基因表达数据样本,这些数据集充分展示了基因组中哪一段基因参与了表达,或者具有基因可及性。
这种训练方式与当下热门的ChatGPT有一定相似性。ChatGPT会根据用户输入的大量语法、表达习惯来进行训练,并理解语言的表达规则。它也会将学习到的这些规则应用到新的场景中,用于回复用户的提问、生产文本等。
新研究展示的AI也是如此,它会学习细胞水平的不同基因表达状态,然后反过来根据不同条件下的基因表达模式判断细胞是疾病还是健康类型。在完成训练后,AI可以在全新的细胞类型中预测特定基因的表达模式,预测结果与真实实验检测的水平非常接近。
当然,AI的这种预测能力不只是预测基因活动,更有望帮助科学家破解各种疾病的谜团。以一类特殊的儿童白血病为例,过去研究知道特定的基因突变与该类白血病发生有关,但并不清楚突变是如何促进疾病发生的。但AI在分析了疾病细胞的基因数据后,给出了清晰的答案: 这些突变会破坏两种转录因子的相互作用,推动健康细胞向白血病状态发展。
除此之外,基因上还存在许多不参与编码的片段,这些基因区域的作用绝大多数都是未知数。“许多与癌症相关的突变会出现在这片基因‘暗物质‘区域,它们的突变不会影响蛋白的功能,这些突变与癌症的发生有何关系是不清楚的。” Rabadan教授表示,但全新的AI模型可以让我们开始探索这片未知的基因区域。
目前,Rabadan教授正与其他团队合作开展进一步的研究,比如借助AI来解析健康细胞的基因调控模式,以及哪些变化导致了癌症的发展。这将为癌症治疗带来全新的治疗靶点和方向。
[1] New AI predicts inner workings of cells. Retrieved January 9, 2025 from https://www.eurekalert.org/news-releases/1069602
[2] Fu, X., Mo, S., Buendia, A. et al. A foundation model of transcription across human cell types. Nature (2025). https://doi.org/10.1038/s41586-024-08391-z
版权声明:本文为“乐问号”作者或机构在乐问医学上传并发布,仅代表该作者或机构观点,不代表乐问医学的观点或立场,不能作为个体诊疗依据,如有不适,请结合自身情况寻求医生的针对性治疗。
链接:http://www.lewenyixue.com/2025/01/10/%E3%80%8A%E8%87%AA%E7%84%B6%E3%80%8B%EF%BC%9A%E5%85%A8%E9%9D%A2%E9%A2%84%E6%B5%8B%E5%9F%BA%E5%9B%A0%E6%B4%BB%E5%8A%A8%E7%9A%84AI%E8%AF%9E%E7%94%9F%E4%BA%86%EF%BC%81/