前沿分享 | 突破传统局限:深度学习模型ChromaFold引领3D染色质接触图预测新趋势

文献概述

在基因组学领域,三维染色质结构的研究对于理解基因调控和解释疾病相关非编码变异至关重要。然而,现有的3D基因组技术往往因为细胞数量有限而难以实现高分辨率。为了解决这一问题,Vianne R. Gao等人提出了ChromaFold这一深度学习模型,该模型能够仅从单细胞染色质可及性测序(scATAC-seq)数据中预测3D接触图,包括调控相互作用。

研究背景及目的

尽管3D基因组学技术如Hi-C为研究细胞特异性的调控相互作用提供了强大支撑,但这些技术常因成本高、操作复杂和对样本数量要求高而难以被广泛应用。ChromaFold模型的开发旨在克服这些限制,通过深度学习从单细胞数据中预测3D染色质结构,以促进对基因调控机制的深入理解。

研究方法

ChromaFold模型( 见图1a及图1b)以伪批量染色质可及性、跨metacell的共可及性以及CTCF基序轨迹作为输入特征,并使用轻量级架构在标准GPU上进行训练。该模型在人类样本的配对scATAC-seq和Hi-C数据上进行训练,并在多种人类和小鼠的测试细胞类型上进行了验证。

图1  ChromaFold模型(a.输入数据处理框架的示意图;b.模型架构)

主要发现

1. 通过对人类样本的配对scATAC-seq和Hi-C数据进行训练,ChromaFold准确预测了不同人类和小鼠测试细胞类型的3D接触图和峰值水平的交互作用。
2. 与现有的基于ATAC-seq和CTCF ChIP-seq的模型相比,ChromaFold在预测性能上达到了最先进的水平。
3. 在复杂组织中,通过配对scATAC-seq和Hi-C对ChromaFold数据进行微调,可以实现跨细胞亚群的染色质相互作用的去卷积化。

研究结论

ChromaFold作为一种新的深度学习模型,仅使用scATAC-seq数据就能实现对3D接触图的准确预测,包括调控相互作用预测,为3D基因组学研究提供了一种新的工具。该模型的轻量级架构使其能够在标准GPU上运行,有助于推动3D基因组技术在临床应用和科研中的普及。

研究意义

ChromaFold的开发不仅展示了深度学习在3D基因组学中的应用潜力,还强调了单细胞染色质可及性数据在预测染色质相互作用中的重要性。通过提高预测的准确性和可及性,ChromaFold有助于加速基因组结构和功能研究的进展,并可能对理解复杂疾病的分子机制产生重要影响。

文献来源:

Gao, V. R., Yang, R., Das, A., Luo, R., Luo, H., McNally, D. R., Karagiannidis, I., Rivas, M. A., Wang, Z. M., Barisic, D., Karbalayghareh, A., Wong, W., Zhan, Y. A., Chin, C. R., Noble, W. S., Bilmes, J. A., Apostolou, E., Kharas, M. G., Béguelin, W., Viny, A. D., … Leslie, C. S. (2024). ChromaFold predicts the 3D contact map from single-cell chromatin accessibility. Nature communications, 15(1), 9432. https://doi.org/10.1038/s41467-024-53628-0.

原文链接:

https://www.nature.com/articles/s41467-024-53628-0

分享者简介

邓佳荣
重庆大学智能肿瘤学教育部医药基础研究创新中心博士研究生。 曾参与2项国家自然科学基金面上项目,目前已发表文章4篇,以第一作者身份发表文章2篇,总影响因子>20。

编辑|曾海蓉 李劲

THE END